首页 今日新闻文章正文

清华教授扬言:AI梯队只有美国,第二梯队是英德,中国只能往后排

今日新闻 2025年09月17日 21:30 0 aa
清华教授扬言:AI梯队只有美国,第二梯队是英德,中国只能往后排

说起AI这事儿,最近几年总让人觉得像坐过山车,一会儿美国牛得不行,一会儿中国又冒出个黑马把人惊着。尤其是2024年底那会儿,清华大学的一个教授刘嘉在采访里直截了当地把全球AI实力分了梯队:美国独占第一,英国德国排第二梯队前列,中国呢,只能挤在第二梯队的最末尾。这话一出口,网上就炸锅了,好多人觉得这教授太保守了,或者说太低估自家实力了。

结果呢,没过几个月,DeepSeek这个中国团队就甩出R1模型,直接在性能上跟OpenAI的o1掰手腕,还开源了全套技术报告。这不光是打脸那么简单,它让大家重新审视中国AI的底子到底有多厚实。话说回来,刘嘉的观点也不是空穴来风,他是圈里响当当的人物,背景硬,研究深,但也反映出国内一些专家对本土进展的认知盲区。

刘嘉对AI梯队的看法,不是2024年底才冒出来的,早几年就有苗头。最早能追溯到2023年11月,他在一次访谈里就说,美国在AI科研、基础理论和商业应用上“一骑绝尘”,第一梯队就它一家。第二梯队呢,英国和德国领头,中国勉强挤进去,但排在靠后位置。为什么这么分?他说,美国有硅谷生态,资金、人才、算力全链条领先,企业像OpenAI、Google主导创新,学术界Princeton、MIT输出核心算法。

清华教授扬言:AI梯队只有美国,第二梯队是英德,中国只能往后排

中国呢,虽然政府砸钱多,高校人才足,但原创突破少,很多人依赖进口芯片,研究氛围也跟美国比有差距。2024年6月,他又在头条上重申,美国AI老大,中国第二梯队后段,落后于英德,差距还在拉大。12月12日那次采访,更直白:美国独占第一,英德第二梯队前列,中国第二梯队末尾。依据是基准测试数据,美国模型在数学、编码、常识推理上碾压,欧洲注重伦理和隐私,中国市场大但基础弱。

这观点一出,争议就来了。有人觉得刘嘉太悲观,低估了中国企业的执行力;也有人赞同,说他数据实诚,不搞爱国粉饰。毕竟,2024年那会儿,中国AI确实面临卡脖子问题:高端GPU靠NVIDIA,软件框架多是TensorFlow或PyTorch的变种,本土算法优化跟不上。英德呢,英国有DeepMind的遗产,德国工业AI强,汽车、制造领域应用落地快。刘嘉强调,中国留学生多留在美国,国内算力不足,自主架构少,这些短板不是一朝一夕能补的。他的话接地气,不像有些专家高高在上,就事论事,但也戳中了痛点:中国AI投资巨大,却在核心技术上追赶。

转折来得快,2025年1月20日,DeepSeek团队发布了R1模型,这玩意儿直接把刘嘉的梯队论扇了个耳光。DeepSeek是杭州一家AI初创,2023年才起步,创始人梁文锋背景是清华计算机博士,团队多是海归。R1是他们的推理模型,开源全套,参数规模大,训练用国产芯片,性能直追OpenAI的o1。在数学基准GSM8K上,R1得分96.3%,o1是96.8%;编码HumanEval上,R1 90.2%,o1 90.5%。更牛的是,它支持长上下文,幻觉少,成本低,一次推理只要几分钱。发布当天,GitHub仓库星标破万,Hugging Face下载量爆棚。西方媒体像Reuters、VentureBeat都报道了,说中国AI开源突围,DeepSeek用MoE架构优化效率,37B活跃参数跑出671B效果。

清华教授扬言:AI梯队只有美国,第二梯队是英德,中国只能往后排

这不光是技术活儿,DeepSeek的策略也聪明。他们从V2开始就开源,积累社区反馈,R1直接迭代上。1月21日,硅谷开发者测试,承认R1在多步推理上稳,集成到Agent框架无缝。国内呢,华为、OPPO马上接入,手机App用R1做本地推理,响应快,隐私好。舆论上,微博、X平台热搜,刘嘉采访截图被扒,网友说“教授眼光太窄,保密工作做得好”。清华大学内部,据说有些学者私下讨论,这暴露了高校对企业进展的脱节。刘嘉没公开回应,继续他的脑科学项目,但这事儿让他观点的说服力打折。

DeepSeek的势头没停,5月28日,他们推R1-0528升级版,基准再提升,HumanEval到92.1%,支持JSON输出和函数调用,幻觉率降20%。这版针对前端优化,开发者友好,Reddit的LocalLLaMA子版块讨论热烈,说性价比吊打Claude。6月,刘嘉在清华做客“作者面对面”活动,聊AGI区别,没提R1,但强调人类智能的独特性。7月,全球AI榜单更新,中国专家占比升,DeepSeek贡献大。8月21日,V3.1来了,这是个混合模型,671B参数,37B活跃,支持思考模式和非思考模式。定价调整,API更便宜,国产芯片优化,上下文128K。Reuters报道,它挑战Anthropic,Agent时代第一步。Hugging Face上,模型卡显示,V3.1在MMLU上88.7%,GPQA 65.2%,领先Llama3.1。

V3.1的发布,让中国AI从追赶者变搅局者。企业接入加速,政务系统用它做智能问答,效率翻倍。DeepSeek的成功,靠的是开源生态和本土适配,不是砸钱堆参数。相比刘嘉的梯队论,这证明中国在应用落地和成本控制上,有独特优势。英德强在规范,美国牛在创新,但中国市场大,迭代快。话说回来,刘嘉的观点有道理的部分还在:基础理论,美国领先,原创算法少不了海归回流。但DeepSeek告诉我们,差距在缩小,保密和企业活力是关键。

这事儿也暴露国内AI生态的痛点。高校教授像刘嘉,多看国外论文,少接触企业一线。智源研究院虽好,但跟DeepSeek这种初创比,节奏慢。政府推动算力中心,2025年新增集群,但芯片自主化还得加码。国际上,DeepSeek R1让西方警醒,欧盟报告修正中国排名,从第二梯队末尾提到中游。

展望未来,中国AI要冲第一,得补短板:加大基础研究投入,鼓励开源,吸引人才回流。刘嘉这类学者,继续发声推动讨论也好。DeepSeek的路子值得学:从小模型练手,到大模型突围。总的,AI不是零和游戏,但竞争激烈。中国有底气,14亿市场加工程师红利,梯队位置会往前挪。话说,这波操作,让人觉得科技自立不是空话,实打实的进步,就在这些模型参数里藏着。

清华教授扬言:AI梯队只有美国,第二梯队是英德,中国只能往后排

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap