Selaa lähdekoodia

Add supported benchmarks to evaluation README (AgentBench, BIRD, LogicReasoning) (#2183)

Signed-off-by: ifuryst <ifuryst@gmail.com>
Leo 1 vuosi sitten
vanhempi
sitoutus
2c231c57c9
1 muutettua tiedostoa jossa 3 lisäystä ja 0 poistoa
  1. 3 0
      evaluation/README.md

+ 3 - 0
evaluation/README.md

@@ -17,6 +17,9 @@ all the preprocessing/evaluation/analysis scripts.
 - GAIA: [`evaluation/gaia`](./gaia)
 - Entity deduction Arena (EDA): [`evaluation/EDA`](./EDA)
 - MINT: [`evaluation/mint`](./mint)
+- AgentBench: [`evaluation/agent_bench`](./agent_bench)
+- BIRD: [`evaluation/bird`](./bird)
+- LogicReasoning: [`evaluation/logic_reasoning`](./logic_reasoning)
 
 ### Result Visualization