首页 十大品牌文章正文

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

十大品牌 2025年09月20日 03:12 0 aa

就在大家争论那个人工智能比较厉害的时候,DeepSeek却再度创造历史!

DeepSeekR1不仅登上了全球顶级期刊《自然》的封面,还首次公开惊人的训练成本,仅仅只需要29.4万美元。

比一个高管的年薪都低,却能够训练出能与OpenAI o1相提并论的推理模型。

而创造历史的竟然只是一位17岁的高中生!

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

首个通过同行评审的大模型

DeepSeekR1是全球首个通过权威期刊同行评审的主流大语言模型。

你可能不知道这意味着什么?

简单来说现在大家常见的OpenAI、Google、Anthropic的人工智能模型,虽然称得上是行业巨头但也只发布了技术报告,从未接受过学术界的严格检验。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

左边是 OpenAI 的 CEO Sam Altman,右边是微软 CEO 纳德拉

而DeepSeekR1是第一个在经过同行评审后发表的主流LLM,这也让人工智能核心朝着透明化迈出惊喜的一步。

现在大部分科技巨头出于商业竞争考虑,都选择在把自己的核心技术藏着掖着,而DeepSeek却选择了完全开放的路线。

从今年2月12日投稿到7月17日接收,DeepSeek团队经历了整整5个月的严格评审过程。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

8位专家从原创性、方法论和鲁棒性等维度进行了全方位评估,论文还同步公开了审稿意见和作者回复。这种透明度在AI行业内绝对是史无前例的。

而核心技术的透明也影响到了行业内的发展,Nature还专门发表了一篇社论《提交LLMs成果:为何同行评议对AI模型有益》,明确呼吁更多AI公司接受学术出版审查。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

29.4万美元的成本神话

如果说学术成就让人敬佩,那么成本数据则让人震惊。

DeepSeeK首次公开透露了,R1-Zero加上SFT数据生成再加上R1的整个训练过程,总共只花了29.4万美元。

整个训练过程使用了648张H800GPU,其中R1-Zero训练耗时198小时,R1训练约80小时,构建SFT数据集消耗约5000 GPU小时。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

即便加上此前V3基础模型约600万美元的投入,总成本仍远低于业界普遍认为的数千万美元标准。

要知道OpenAI训练o1系列模型耗资数千万美元。相比之下,DeepSeek的成本效益简直是天文数字级的差异。

可以说是成本直接打了五折,省下来钱的钱堪比美国人工智能研究所管理层几年的工资。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

更重要的不是成本本身而是它背后代表的技术路径。

DeepSeek证明了,通过巧妙的算法设计和训练策略,完全可以用更少的资源达到相同甚至更好的效果。

这种"少而美"的理念可能会彻底改变AI行业的发展模式。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

17岁年轻力量

这篇划时代的论文作者名单中,有一个特殊的名字那就是涂津豪。

作为上海建平中学高二年级的学生,他既要平衡数理化等学科的日常学业,又要挤出课后、周末的时间深耕 AI 领域。

这种 “双线并行” 的状态,反而成了他独特的优势:校园里的数学课堂为他打下了逻辑基础,而自主探索的AI实践则让他学会将理论转化为解决问题的工具。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

真正让他在 AI 圈崭露头角的,是去年开源的 “Thinking-Claude” 项目。

这套专为增强Claude推理能力的提示词方法论,并非停留在 “纸上谈兵” 的理论层面:当时市面上的大模型虽能输出答案,却常因 “推理步骤模糊” 导致结论不可靠,涂津豪便瞄准这一痛点,设计出 “结构化提示词体系”。

通过 “目标拆解加场景引导加逻辑校验” 三层设计,让Claude在处理数学证明、复杂决策类问题时,能清晰输出每一步推理链。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

项目在GitHub开源后,短短5个月就收获了 15.6k 星标,不仅有来自斯坦福、MIT 的研究者在论文中引用这套方法,甚至有电商平台将其优化后,用于智能客服的 “售后纠纷逻辑梳理”,让 AI 的回复从 “模糊安抚” 变成 “有理有据的解决方案”。

2024年阿里巴巴全球数学竞赛中,AI赛道的竞争堪称 “神仙打架”:全球23个国家的527支队伍参赛,选手既有高校 AI 实验室的团队,也有科技公司的算法工程师,核心考核目标是 “用 AI 解决高阶数学优化问题”。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

既要攻克 “多变量非线性规划” 这类纯数学难题,又要通过 AI 算法实现高效求解。

涂津豪没有组建团队,仅凭个人之力,设计出融合 “强化学习 + 蒙特卡洛树搜索” 的解决方案:他先通过数学建模将问题转化为 “AI 可理解的状态空间”,再用强化学习训练 AI 在 “试错” 中找到最优解题路径。

最终他的方案不仅在准确率上以 92% 远超第二名的 78%,更将求解时间从平均40分钟压缩到 28 分钟,以绝对优势拿下全球第一。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

重新定义AI竞争格局

有赞赏就有争议,OpenAI等公司此前曾指责DeepSeek"可能使用了ChatGPT的输出来训练R1",但在Nature的严格审查过程中,DeepSeek团队正面回应了这些质疑,提供了充分的证据证明其技术路线的独立性和原创性。

DeepSeek R1登上Nature封面这一事件,可能标志着AI发展进入了一个新阶段。

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

AI模型的门槛不断降低,当开源成为可能,当学术界重新获得话语权,我们可能会看到AI领域出现真正的百花齐放。

不再是几家巨头垄断核心技术,而是更多的创新者、研究者、甚至是像涂津豪这样的高中生都能参与到前沿技术的开发中来。


编辑:木

信息来源:“界面新闻”——(DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型)

全球首发!高中生论文创造历史,美国公司发出质疑“抄袭”

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap