コミット履歴

作者 SHA1 メッセージ 日付
  Engel Nyst eeb2342509 Refactor history/event stream (#3808) 1 年間 前
  Xingyao Wang 1f23dc89b6 fix(eval): add runtime.connect to all eval harness (#4565) 1 年間 前
  Xingyao Wang 2d5b360505 refactor: re-organize different runtime implementations into an impl folder (#4346) 1 年間 前
  Abhijeetsingh Meena 173018eb58 fix: Resolves HumanEval Inference by replacing task_id with instance_id (#4364) 1 年間 前
  Xingyao Wang b23c7aab5a [eval] stop set sid in eval (#4311) 1 年間 前
  Aditya Bharat Soni 0809d26f4d fix: Allow evaluation benchmarks to pass image urls in run_controller() instead of simply passing strings (#4100) 1 年間 前
  tofarr 152f99c64f Chore Bump python version (#3545) 1 年間 前
  Xingyao Wang 090c911a50 (refactor) Make `Runtime` class synchronous (#3661) 1 年間 前
  Graham Neubig f9088766e8 Allow setting of runtime container image (#3573) 1 年間 前
  Robert Brennan 01ae22ef57 Rename OpenDevin to OpenHands (#3472) 1 年間 前
  Xingyao Wang bdf6df12c3 fix: pip not available in runtime (#3306) 1 年間 前
  Xingyao Wang b30a2dd87a completely remove update_source_code (#3280) 1 年間 前
  Xingyao Wang 31b244f95e [Refactor, Evaluation] Refactor and clean up evaluation harness to remove global config and use EventStreamRuntime (#3230) 1 年間 前
  Xingyao Wang 001195a3ea reduce the duplication in run_controller (#3217) 1 年間 前
  Xingyao Wang 4f0a454ed6 [Arch] Support integration tests using EventStream Runtime (#3184) 1 年間 前
  Graham Neubig 275ea706cf Remove remaining global config (#3099) 1 年間 前
  Xingyao Wang da17665cab fix: make max_budget_per_task optional in `run_agent_controller` (#3071) 1 年間 前
  Graham Neubig 3a21198424 Remove monologue agent (#3036) 1 年間 前
  Xingyao Wang cf910dfa9d fix eval api_key leak in metadata; fix llm config in run infer (#2998) 1 年間 前
  Anush Kumar V 8f76587e5c docs: updated docstrings using ruff's autofix feature (#2923) 1 年間 前
  Engel Nyst d37b2973b2 Refactoring: event stream based agent history (#2709) 1 年間 前
  Graham Neubig d0384cafdd Two fixes to swe bench eval (#2831) 1 年間 前
  Xingyao Wang f6dc89b41a [Evaluation] Simplify eval & and multi-processing related fixes (#2810) 1 年間 前
  Graham Neubig a081935fd8 Simplify eval code (#2775) 1 年間 前
  Graham Neubig ffd3c7144c Remove global args (#2760) 1 年間 前
  Engel Nyst 2d9bb56763 Add ability to restore the cli session (optional) (#2699) 1 年間 前
  Engel Nyst 874b4c9075 CLI concurrency (#2695) 1 年間 前
  finaltrip 05b84df9cb chore: fix some comments (#2234) 1 年間 前
  Boxuan Li 538d1d85a2 evaluation: Reset configs in finally block (#2214) 1 年間 前
  Ryan H. Tran 22e8fb39b1 add cost metrics to evaluation outputs for all benchmarks (#2199) 1 年間 前