F B x i e . c o m
加载中,请稍候

风暴蟹 AI 工具导航

清华发布“AgentBench 2.0”,评测100+主流Agent能力

2026-03-03 12:16
评测体系升级:更全面评估Agent在真实环境中的规划、执行与反思能力