F
B
x
i
e
.
c
o
m
加载中,请稍候
风暴蟹 AI 工具导航
首页
新闻归档
关于我们
清华发布“AgentBench 2.0”,评测100+主流Agent能力
2026-03-03 12:16
评测体系升级:更全面评估Agent在真实环境中的规划、执行与反思能力
原文链接:
https://arxiv.org/abs/2603.01234