据业内最新消息,中科曙光在乌镇世界互联网大会发布scaleX640超节点产品,单机柜集成卡数首次突破640卡,大幅领先领先“昇腾384”刷新全球超节点...
2025-11-08 2
周四,Laude研究所宣布了其首批"弹弓"(Slingshots)资助计划的获奖项目,旨在"推进人工智能的科学研究和实践应用"。
"弹弓"项目被设计为研究人员的加速器,意在提供大多数学术机构无法获得的资源,无论是资金支持、计算能力,还是产品和工程技术支持。作为回报,获奖者承诺产出某种最终成果,可以是初创公司、开源代码库或其他类型的研究成果。
首批入选队列包含十五个项目,特别关注AI评估这一难题。其中一些项目对TechCrunch读者来说并不陌生,包括命令行编程基准测试Terminal Bench和长期运行的ARC-AGI项目的最新版本。
其他项目则对长期存在的评估问题采取了全新方法。由加州理工学院和德州大学奥斯汀分校研究人员构建的Formula Code项目,旨在评估智能体优化现有代码的能力,而哥伦比亚大学的BizBench项目则提出了针对"白领智能体"的综合基准测试。其他资助项目还探索了强化学习或模型压缩的新结构。
SWE-Bench联合创始人John Boda Yang也是入选队列的一员,他领导着新的CodeClash项目。受到SWE-Bench成功的启发,CodeClash将通过动态竞赛框架来评估代码质量。
Yang告诉TechCrunch:"我确实认为人们继续在核心第三方基准测试上进行评估会推动进步。我有点担心未来基准测试会变得只针对特定公司。"
Q&A
Q1:Laude研究所的"弹弓"资助计划是什么?
A:"弹弓"项目是Laude研究所推出的研究人员加速器,旨在推进人工智能的科学研究和实践应用。该项目为研究人员提供大多数学术机构无法获得的资源,包括资金支持、计算能力以及产品和工程技术支持。
Q2:首批"弹弓"资助计划有多少个项目?主要关注什么领域?
A:首批入选队列包含十五个项目,特别关注AI评估这一难题。项目包括Terminal Bench、ARC-AGI项目最新版本、Formula Code以及BizBench等,涵盖了代码优化评估、白领智能体基准测试等多个方向。
Q3:CodeClash项目有什么特色?
A:CodeClash项目由SWE-Bench联合创始人John Boda Yang领导,受到SWE-Bench成功启发。该项目将通过动态竞赛框架来评估代码质量,采用了全新的代码评估方法。
相关文章
据业内最新消息,中科曙光在乌镇世界互联网大会发布scaleX640超节点产品,单机柜集成卡数首次突破640卡,大幅领先领先“昇腾384”刷新全球超节点...
2025-11-08 2
周四,Laude研究所宣布了其首批"弹弓"(Slingshots 资助计划的获奖项目,旨在"推进人工智能的科学研究和实践应用"。"弹弓"项目被设计为研...
2025-11-08 2
证券之星消息,扬杰科技(300373 11月08日在投资者关系平台上答复投资者关心的问题。投资者提问:公司有12英寸晶圆技术储备吗扬杰科技回复:您好,...
2025-11-08 2
2018年中美贸易战一开打,美国就盯上了中国的高科技,接二连三出台半导体限制政策,就怕咱们技术赶上来。到了2023年,它还拉上荷兰、日本一起,三国高层...
2025-11-08 2
来源:券商中国美国科技巨头,迎来一则利好消息!最新报道显示,在大型科技公司和美国政府的巨大压力下,欧盟委员会正考虑暂停执行《人工智能法案》部分条款。此...
2025-11-08 2
红星资本局11月8日消息 今日,在世界互联网大会前沿人工智能模型论坛上,360集团副总裁、360数字安全集团总裁胡振泉分享了AI安全治理的创新方案,并...
2025-11-08 2
这个画面足以颠覆所有人的想象。以上图片来源于央视新闻 航天员的手指轻轻按下一个特制设备的启动键。28分钟后,伴随着设备上的按键灯闪烁,他取出的不是常见...
2025-11-08 2
发表评论