Yizhe Zhang
|
8d79c3edbc
modify the exiting logic and reward calculation, delete unused function (#2198)
|
пре 1 година |
tobitege
|
b0478d2880
fix: Fix husky install deprecated message (since v9 of husky) (#2190) (#2191)
|
пре 1 година |
RainRat
|
ed6dcc8381
fix typos (#2187)
|
пре 1 година |
Leo
|
2c231c57c9
Add supported benchmarks to evaluation README (AgentBench, BIRD, LogicReasoning) (#2183)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
4ece6fb3cc
Auto started persistent container (#2151)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
f9c7c3a520
Refactored logging (#2159)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
aee3d506e6
Restricted persistent sandbox to opendevin user only (#2177)
|
пре 1 година |
Graham Neubig
|
3b8a649b3d
Update slack invite link to make it valid (#2182)
|
пре 1 година |
Binyuan Hui
|
46dcf4bb3e
Support BIRD benchmark (#2117)
|
пре 1 година |
Leo
|
78e003caf6
Fix: Avoid bash backtick eval in runtime commands. (#2180)
|
пре 1 година |
Leo
|
be251b11de
Add AgentBench. (#2012)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
04d7354501
Detailed logs for ssh_box (#2173)
|
пре 1 година |
Boxuan Li
|
06e45afc75
Fix ssh box hung issue (#2172)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
3a4dc5c68c
Initialized plugins only once for persistent sandboxes (#2162)
|
пре 1 година |
Boxuan Li
|
feaae0b7ac
Fix persist_sandbox in Makefile (#2171)
|
пре 1 година |
Rahul Anand
|
6e76f9a02f
Fix: Codebase font fixed, and other fixes for #2138 PR (#2154)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
bf24a0b5c0
Fixed makefile (#2168)
|
пре 1 година |
Aaron Xia
|
42c6b506b5
Lazy launching BrowseEnv / making BrowseEnv optional (#2155)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
8413f147c9
Added logs (#2153)
|
пре 1 година |
Ryan H. Tran
|
01296ff79d
Add remaining subsets for MINT benchmark (#2142)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
f3f5768b4f
Install chromium only once (#2100)
|
пре 1 година |
dependabot[bot]
|
9a441ea8f7
Bump boto3 from 1.34.115 to 1.34.116 (#2164)
|
пре 1 година |
Graham Neubig
|
6596d5c799
Fix: Feedback should be sent through the backend to avoid CORS issues (#2046)
|
пре 1 година |
dependabot[bot]
|
6aec3d789e
Bump litellm from 1.39.3 to 1.39.5 (#2163)
|
пре 1 година |
Graham Neubig
|
7a2122ebc2
Default to gpt-4o (#2158)
|
пре 1 година |
dependabot[bot]
|
a7b19a0048
Bump @nextui-org/react from 2.4.0 to 2.4.1 in /frontend (#2161)
|
пре 1 година |
dependabot[bot]
|
e6c8e1c9d2
Bump framer-motion from 11.2.9 to 11.2.10 in /frontend (#2160)
|
пре 1 година |
Boxuan Li
|
4d14b44a9a
SWE-bench: Add summarise utility script to view passed/failed task IDs (#2137)
|
пре 1 година |
Boxuan Li
|
f188abd7a3
Delete evaluation outputs files (#2152)
|
пре 1 година |
மனோஜ்குமார் பழனிச்சாமி
|
961c96a2a1
Added ssh_password to config setup (#2139)
|
пре 1 година |