Xingyao Wang 990f277132 misc: Support folder-level exp analysis for SWE-Bench `summarize_outputs.py`; Handle CrashLoopBackoff for RemoteRuntime (#5385) hace 1 año
..
compare_outputs.py 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
convert_oh_folder_to_swebench_submission.sh 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
convert_oh_output_to_md.py 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
convert_oh_output_to_swe_json.py 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
download_gold_patch.py 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año
summarize_outputs.py 990f277132 misc: Support folder-level exp analysis for SWE-Bench `summarize_outputs.py`; Handle CrashLoopBackoff for RemoteRuntime (#5385) hace 1 año
update_output_with_eval.py 678436da30 Fix issue #5222: [Refactor]: Refactor the evaluation directory (#5223) hace 1 año