Linux Mint团队计划加快发布周期,并在未来几个月内推出两个新版本。最新的Linux Mint月度新闻博客草拟了该项目2025年第四季度的计划。...
2025-09-20 0
就在大家争论那个人工智能比较厉害的时候,DeepSeek却再度创造历史!
DeepSeekR1不仅登上了全球顶级期刊《自然》的封面,还首次公开惊人的训练成本,仅仅只需要29.4万美元。
比一个高管的年薪都低,却能够训练出能与OpenAI o1相提并论的推理模型。
而创造历史的竟然只是一位17岁的高中生!
DeepSeekR1是全球首个通过权威期刊同行评审的主流大语言模型。
你可能不知道这意味着什么?
简单来说现在大家常见的OpenAI、Google、Anthropic的人工智能模型,虽然称得上是行业巨头但也只发布了技术报告,从未接受过学术界的严格检验。
左边是 OpenAI 的 CEO Sam Altman,右边是微软 CEO 纳德拉
而DeepSeekR1是第一个在经过同行评审后发表的主流LLM,这也让人工智能核心朝着透明化迈出惊喜的一步。
现在大部分科技巨头出于商业竞争考虑,都选择在把自己的核心技术藏着掖着,而DeepSeek却选择了完全开放的路线。
从今年2月12日投稿到7月17日接收,DeepSeek团队经历了整整5个月的严格评审过程。
8位专家从原创性、方法论和鲁棒性等维度进行了全方位评估,论文还同步公开了审稿意见和作者回复。这种透明度在AI行业内绝对是史无前例的。
而核心技术的透明也影响到了行业内的发展,Nature还专门发表了一篇社论《提交LLMs成果:为何同行评议对AI模型有益》,明确呼吁更多AI公司接受学术出版审查。
如果说学术成就让人敬佩,那么成本数据则让人震惊。
DeepSeeK首次公开透露了,R1-Zero加上SFT数据生成再加上R1的整个训练过程,总共只花了29.4万美元。
整个训练过程使用了648张H800GPU,其中R1-Zero训练耗时198小时,R1训练约80小时,构建SFT数据集消耗约5000 GPU小时。
即便加上此前V3基础模型约600万美元的投入,总成本仍远低于业界普遍认为的数千万美元标准。
要知道OpenAI训练o1系列模型耗资数千万美元。相比之下,DeepSeek的成本效益简直是天文数字级的差异。
可以说是成本直接打了五折,省下来钱的钱堪比美国人工智能研究所管理层几年的工资。
更重要的不是成本本身而是它背后代表的技术路径。
DeepSeek证明了,通过巧妙的算法设计和训练策略,完全可以用更少的资源达到相同甚至更好的效果。
这种"少而美"的理念可能会彻底改变AI行业的发展模式。
这篇划时代的论文作者名单中,有一个特殊的名字那就是涂津豪。
作为上海建平中学高二年级的学生,他既要平衡数理化等学科的日常学业,又要挤出课后、周末的时间深耕 AI 领域。
这种 “双线并行” 的状态,反而成了他独特的优势:校园里的数学课堂为他打下了逻辑基础,而自主探索的AI实践则让他学会将理论转化为解决问题的工具。
真正让他在 AI 圈崭露头角的,是去年开源的 “Thinking-Claude” 项目。
这套专为增强Claude推理能力的提示词方法论,并非停留在 “纸上谈兵” 的理论层面:当时市面上的大模型虽能输出答案,却常因 “推理步骤模糊” 导致结论不可靠,涂津豪便瞄准这一痛点,设计出 “结构化提示词体系”。
通过 “目标拆解加场景引导加逻辑校验” 三层设计,让Claude在处理数学证明、复杂决策类问题时,能清晰输出每一步推理链。
项目在GitHub开源后,短短5个月就收获了 15.6k 星标,不仅有来自斯坦福、MIT 的研究者在论文中引用这套方法,甚至有电商平台将其优化后,用于智能客服的 “售后纠纷逻辑梳理”,让 AI 的回复从 “模糊安抚” 变成 “有理有据的解决方案”。
2024年阿里巴巴全球数学竞赛中,AI赛道的竞争堪称 “神仙打架”:全球23个国家的527支队伍参赛,选手既有高校 AI 实验室的团队,也有科技公司的算法工程师,核心考核目标是 “用 AI 解决高阶数学优化问题”。
既要攻克 “多变量非线性规划” 这类纯数学难题,又要通过 AI 算法实现高效求解。
涂津豪没有组建团队,仅凭个人之力,设计出融合 “强化学习 + 蒙特卡洛树搜索” 的解决方案:他先通过数学建模将问题转化为 “AI 可理解的状态空间”,再用强化学习训练 AI 在 “试错” 中找到最优解题路径。
最终他的方案不仅在准确率上以 92% 远超第二名的 78%,更将求解时间从平均40分钟压缩到 28 分钟,以绝对优势拿下全球第一。
有赞赏就有争议,OpenAI等公司此前曾指责DeepSeek"可能使用了ChatGPT的输出来训练R1",但在Nature的严格审查过程中,DeepSeek团队正面回应了这些质疑,提供了充分的证据证明其技术路线的独立性和原创性。
DeepSeek R1登上Nature封面这一事件,可能标志着AI发展进入了一个新阶段。
AI模型的门槛不断降低,当开源成为可能,当学术界重新获得话语权,我们可能会看到AI领域出现真正的百花齐放。
不再是几家巨头垄断核心技术,而是更多的创新者、研究者、甚至是像涂津豪这样的高中生都能参与到前沿技术的开发中来。
编辑:木
信息来源:“界面新闻”——(DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型)
相关文章
Linux Mint团队计划加快发布周期,并在未来几个月内推出两个新版本。最新的Linux Mint月度新闻博客草拟了该项目2025年第四季度的计划。...
2025-09-20 0
就在大家争论那个人工智能比较厉害的时候,DeepSeek却再度创造历史!DeepSeekR1不仅登上了全球顶级期刊《自然》的封面,还首次公开惊人的训练...
2025-09-20 0
9月19日,专业咨询机构DBC德本咨询公布了“2025新科技100强金i奖”名单,蘑菇车联凭借首个深度理解物理世界的AI大模型MogoMind,斩...
2025-09-20 0
[中国,上海,2025年9月18日]在华为全联接大会2025期间,以“与时代,共昇腾”为主题的昇腾AI人工智能产业峰会在上海成功举行。峰会现场,昇腾M...
2025-09-20 0
证券日报网讯 诺瓦星云9月19日在互动平台回答投资者提问时表示,公司PWM+PAM混合驱动芯片目前已经量产,并在相关厂家有所应用。关于公司产品应用的具...
2025-09-20 0
本报讯 (记者向炎涛)9月16日至17日,2025金砖国家新工业革命伙伴关系论坛在厦门举办,本次论坛紧扣“释放大金砖合作潜力,实现包容可持续工业化”这...
2025-09-20 0
“人工智能+”在文旅行业的深度应用,不仅深刻改变了行业发展,也重塑了游客的旅游体验。2024年以来,陕文投集团坚定推进“人工智能+文旅”战略,加速科技...
2025-09-20 0
进入2025年,随着生成式AI快速普及,企业在流量获取和品牌传播上的竞争全面进入“AI时代”。CTR《2025中国广告主营销趋势调查报告》显示,31%...
2025-09-20 0
发表评论