Xingyao Wang 9908e1b285 [Evaluation]: Log openhands version in eval output folder, instead of agent version (#5394) hace 1 año
..
docker 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
eval 990f277132 misc: Support folder-level exp analysis for SWE-Bench `summarize_outputs.py`; Handle CrashLoopBackoff for RemoteRuntime (#5385) hace 1 año
setup 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
cleanup_remote_runtime.sh 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
eval_infer.sh 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
eval_infer_remote.sh 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
run_infer.sh 9908e1b285 [Evaluation]: Log openhands version in eval output folder, instead of agent version (#5394) hace 1 año