Graham Neubig
|
ce2430180f
Update README.md to fix miniwob name (#4534)
|
hace 1 año |
Xingyao Wang
|
797f02ff6f
rename huggingface evaluation benchmark (#3845)
|
hace 1 año |
tobitege
|
9c39f07430
(enh) Aider-Bench: make resumable with skip_num arg (#3626)
|
hace 1 año |
Robert Brennan
|
01ae22ef57
Rename OpenDevin to OpenHands (#3472)
|
hace 1 año |
Xingyao Wang
|
31b244f95e
[Refactor, Evaluation] Refactor and clean up evaluation harness to remove global config and use EventStreamRuntime (#3230)
|
hace 1 año |
Boxuan Li
|
c68478f470
Customize LLM config per agent (#2756)
|
hace 1 año |
மனோஜ்குமார் பழனிச்சாமி
|
143f38d25a
Refactored sandbox config and added fast boot (#2455)
|
hace 1 año |
மனோஜ்குமார் பழனிச்சாமி
|
41564c2eac
Use :main instead of :latest (#2539)
|
hace 1 año |
Frank Xu
|
48151bdbb0
[feat] WebArena benchmark, MiniWoB++ benchmark and related arch changes (#2170)
|
hace 1 año |