Xingyao Wang
|
50c13aad98
[Eval] Improve SWE-Bench Eval harness: multi-run support & entry script simplification (#4396)
|
1 an în urmă |
Xingyao Wang
|
01ae54a69d
fix swebench repo/version being string (#4241)
|
1 an în urmă |
Xingyao Wang
|
98081b9b1b
(eval) EOF fixes for SWE-Bench evaluation (#3623)
|
1 an în urmă |
Robert Brennan
|
01ae22ef57
Rename OpenDevin to OpenHands (#3472)
|
1 an în urmă |
Xingyao Wang
|
31b244f95e
[Refactor, Evaluation] Refactor and clean up evaluation harness to remove global config and use EventStreamRuntime (#3230)
|
1 an în urmă |
Jiayi Pan
|
7111e8ee14
Support Instance Level Images for SWE-Bench Evaluation (#2874)
|
1 an în urmă |