Boxuan Li 6f235937cf Evaluation time travel: allow evaluation on a specific version (#2356) há 1 ano atrás
..
docker a6ba6c5277 Add SWEBench-docker eval (#2085) há 1 ano atrás
eval a6ba6c5277 Add SWEBench-docker eval (#2085) há 1 ano atrás
setup 2406b901df feat(SWE-Bench environment) integrate SWE-Bench sandbox (#1468) há 1 ano atrás
eval_infer.sh a6ba6c5277 Add SWEBench-docker eval (#2085) há 1 ano atrás
run_infer.sh 6f235937cf Evaluation time travel: allow evaluation on a specific version (#2356) há 1 ano atrás
summarise_results.py a6ba6c5277 Add SWEBench-docker eval (#2085) há 1 ano atrás