星河动力成功完成智神星一号可重复使用液体运载火箭一子级动力系统试车。记者从民营商业航天企业星河动力获悉,11月4日,星河动力在山东海阳东方航天港一号半...
2025-11-04 3
界面新闻记者 | 宋佳楠
11月4日,界面新闻获悉,全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里千问Qwen以超20%的收益率夺冠,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。
该竞赛由美国专注于金融市场的AI实验室Nof1于10月18日发起,将多个AI大模型置于真实金融市场中进行自动化交易对决。首季竞赛邀请了包括GPT-5、Gemini 2.5 Pro、Grok 4、Claude 4.5 Sonnet、Qwen3 Max和DeepSeek V3.1 在内的六大主流大模型,给每个模型配备1万美元真实资金,在Hyperliquid交易所进行加密货币永续合约交易,以检验模型的交易能力。
竞赛采用统一输入方式,所有模型接收相同的市场数据和提示词,交易记录、持仓和账户价值实时公开,以保证比赛的公平性和透明度。此外,Nof1还允许AI模型“聊天互动”,让它们在模拟对话中辩论市场走势,展示决策逻辑,最终根据盈亏情况决出冠军。
比赛初期,六大模型相对谨慎,大约5天后,参赛模型大致分为三大阵营:阿里千问和DeepSeek处于领先态势,屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok 4在相近策略驱动下,维持在第二阵营,略有盈利,整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。
截至北京时间11月4日早上比赛结束,阿里千问最后超越DeepSeek,Qwen以超20%的胜率获胜;DeepSeek实现盈利,位列第二;Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均亏损,Gemini 2.5 Pro和GPT-5亏损尤为明显,截至最终持仓总市值仅为初始资金的三四成。
有行业人士指出,阿里千问和DeepSeek在实战中的表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。
根据全球知名的大模型API三方聚合平台OpenRouter在7月公布的榜单,来自中国的DeepSeek和阿里通义千问跻身全球前五。其中,通义千问以10.4%的市场份额,超越OpenAI的4.7%,位列第四。
OpenRouter推文显示,当下成长最快前10大模型中有9个是开源的。其中,Qwen3-Coder调用量以近500亿Tokens高居第一,通义千问包揽前三,并在前十中占据五席。
而在今年9月,零一万物CEO李开复在长江CEO 20周年返校日庆典上表示,DeepSeek对中国AI发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾DeepSeek怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。”
李开复提到,自DeepSeek开源以来,国内多家企业相继开源大模型,形成了“既开源、又比拼速度”的良性竞争局面。他认为,开源模式高度契合中国企业的学习特性,有望助力中国在AI领域缩小与美国的差距。
相关文章
                            
                            星河动力成功完成智神星一号可重复使用液体运载火箭一子级动力系统试车。记者从民营商业航天企业星河动力获悉,11月4日,星河动力在山东海阳东方航天港一号半...
2025-11-04 3
                            
                            界面新闻记者 | 宋佳楠11月4日,界面新闻获悉,全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里千问Qwen以超2...
2025-11-04 3
证券日报网讯 中公教育11月4日在互动平台回答投资者提问时表示,公司与阿里巴巴等企业合作开展的人才培养项目,目前项目按规划推进中。主要围绕数字人才培养...
2025-11-04 3
                            
                            当全球气温持续创下历史新高,传统减排措施进展缓慢之际,埃隆·马斯克近日在社交媒体上提出的一个大胆构想再次将太阳辐射管理技术推向公众视野。这位Space...
2025-11-04 3
                            
                            IT之家 11 月 4 日消息,苹果首席执行官蒂姆・库克于当地时间 11 月 1 日年满 65 岁,再度引发外界对其卸任时间及潜在继任者的猜测。截至目...
2025-11-04 3
                            
                            前言可能很多人没注意到,我们平时用的手机、电脑里,有个叫 “存储芯片” 的关键零件,过去二三十年基本都被韩国三星、SK 海力士和美国美光这三家攥在手里...
2025-11-04 4
                            
                            海外“双十一”及“黑色星期五”销售旺季来临前夕,一批长期占据亚马逊平台头部位置的中国品牌正显著提升在阿里巴巴旗下速卖通(AliExpress)平台的备...
2025-11-04 3
近日,上海民为生物将自主研发的GLP-1/GIP/FGF21受体三重激动剂MWN105注射液有偿许可给丹麦Sidera Bio Aps,后者获除大中华...
2025-11-04 3
发表评论