只需一步,快速开始
短信验证,便捷登录
军衔等级:
中尉
以后AI智能体来做科研,然后雇一群人类写代码……
人类更适应更复杂、更长时间的科研,AI更适应大量并行短任务。
现有的评估往往侧重于短期、狭窄的任务,并且缺乏与人类专家的直接比较。
一旦7项任务公开,如何防止基准测试数据污染问题?
0 举报本楼
发表回复 回帖后跳转到最后一页
版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图
GMT+8, 2025-1-7 13:13 , Processed in 0.282476 second(s), 17 queries , Gzip On.
Copyright © 1999-2023 C114 All Rights Reserved
Discuz Licensed