11月6日-9日,在2025年世界互联网大会“互联网之光”博览会上,拓数派首次展出智能体工厂全新上架产品——“涵思”元智能体。涵思以大模型数据计算系统...
2025-11-07 2
AI圈子里,蒸馏技术这事儿说白了就是从大模型里榨取精华,做出更轻快的版本。DeepSeek这么干,还直接开源,闹得沸沸扬扬。
Anthropic的CEO达里奥·阿莫迪直言,这路子没毛病,不违法,还省资源。
DeepSeek的R1模型在2025年1月15日上线,北京团队用MoE架构,参数1280亿,但激活只有210亿,推理成本低到几分钱一百万token。关键是他们用蒸馏技术,从Llama 3等开源基底提炼知识,再融合自家数据训出新版。
结果呢?性能超GPT-4 Turbo,还全开源,权重扔Hugging Face上,下载量一周破千万。这事儿在美国闹大,有人喊“抄袭闭源模型”,国会科技委员会在2月就开审。1月31日阿莫迪在旧金山播客上直接回应:蒸馏后开源,没违法。
蒸馏技术早1980年代就有了,Hinton那帮人发明知识蒸馏,用老师模型教学生模型,压缩参数不丢精度。Meta的Llama系列本身开源,许可协议MIT式,允许修改再发,只要标明来源。
阿莫迪点明痛点:训大模型烧钱,新公司一年几百块GPU卡,够呛追上OpenAI的万卡集群。全球芯片短缺,NVIDIA H100一卡黄牛价3万刀,能源还得算碳排。
DeepSeek蒸馏省了七年训时,碳足迹低,开发者社区乐见其成。GitHub上 fork 项目上千,欧洲初创拿它建聊天机器人,亚洲手机App优化推理,全靠这开源buff。
争议焦点在知识产权,有人说蒸馏等于“洗白”闭源数据。
2024年美国专利局报告,AI算法难专利,蒸馏更算工程实践。DeepSeek没碰红线,没用GPT-4o的私有权重,全从合法源头来。
2024年AI碳排超航空业,开源蒸馏能降10-20%。DeepSeek R1在GLUE基准超90分,GSM8K数学题准到95%,性价比碾压付费API。
阿莫迪还聊公平:硅谷巨头垄断算力,新兴市场玩家靠蒸馏翻身。中国团队DeepSeek月活跃用户破亿,带动本地芯片设计。反观闭源路线,OpenAI Claude收费每月20刀,门槛高。
开源让AI民主化,小公司用R1建医疗诊断,非洲开发者搞本地翻译。
DeepSeek R1上线后,美国国会在2月10日首轮听证,焦点技术转移风险。委员会邀Meta、OpenAI高管,DeepSeek远程提交报告。审查拖到4月二轮,无违法结论:蒸馏合规,开源益大于弊。联邦贸易委员会跟进,2025年5月出指导意见,鼓励下游创新,但要求标注来源。
Anthropic这边,阿莫迪借势推Claude 3.5 Sonnet,集成蒸馏模块,推理速提25%。6月公司估值飙到180亿,亚马逊追加投资。DeepSeek生态爆棚,7月R1.1版上线,融合多模态,图像理解准85%。全球分支项目多,印度团队用它训农业AI,预测作物病害;巴西开发者建环境监测,碳排计算实时跑。
行业报告显示,2025年开源模型市占超60%,蒸馏贡献大。8月斯坦福HAI中心调研,蒸馏降门槛,新创公司存活率升15%。阿莫迪在巴黎AI峰会演讲,数据摆事实:全球训模型能源省20%,芯片利用率高30%。峰会后,欧盟跟进,9月修AI法案,蒸馏列为“高风险低害”。
DeepSeek影响供应链,北京团队开源权重,NVIDIA销量增,华为昇腾芯片适配R1,算力国产化加速。国际上,9月中美AI对话重启,蒸馏成合作点,美方认可技术普适。
到11月,DeepSeek用户日活2亿,衍生App超500。Anthropic Claude下载量翻番,阿莫迪团队扩招200人,重点安全对齐。行业格局变多元,开源成主流,资源不白费。蒸馏开源解锁潜力,小玩家有戏,大厂得反思垄断。
蒸馏开源不只技术活儿,更是资源博弈。阿莫迪早说过,AI像电力,得人人用得上。DeepSeek R1成本低,跑在消费级GPU上,开发者在家训分支,门槛没了。2025年,全球AI初创融资中,40%提蒸馏计划,VC追着投。
安全隐患有:开源模型易改,坏人搞深假。但Anthropic的Constitutional AI模板,DeepSeek直接借,内置过滤,风险降。阿莫迪团队开源安全工具包,11月下载50万,帮社区自查偏见。
2025年中美芯片协议续签,蒸馏技术列例外,不限出口。欧盟GDPR更新,蒸馏数据须匿名,DeepSeek早合规。行业从争议到共识,蒸馏成标配。未来,资源有限,谁高效谁赢。
相关文章
11月6日-9日,在2025年世界互联网大会“互联网之光”博览会上,拓数派首次展出智能体工厂全新上架产品——“涵思”元智能体。涵思以大模型数据计算系统...
2025-11-07 2
苹果自周二开始,这几天每天都在推出新系统更新,周二是 26.1 正式版,周三是 26.2 测试版,周四是 18.7.2 正式版。而就在今天,苹果又推送...
2025-11-07 2
AI圈子里,蒸馏技术这事儿说白了就是从大模型里榨取精华,做出更轻快的版本。DeepSeek这么干,还直接开源,闹得沸沸扬扬。Anthropic的CEO...
2025-11-07 2
十年前,3D 打印还只是科研室里的 “高冷玩意儿”,一台机器动辄几十万,普通人连碰都不敢碰。今天,在夜市上、在学校门口、甚至在地铁口的小摊上,印着龙头...
2025-11-07 3
Vietnam Energy Week 2025开幕 | 新风光携新能源综合解决方案亮相越南国际电力展###FGI Showcases Cutting...
2025-11-07 3
荷兰政府这一次,当真是搬起石头砸自己的脚。荷兰政府本以为通过强行霸占安世半导体总部的方式,就能够强行接管这个全球最大的半导体生产中心,进而再用半导体产...
2025-11-07 3
别笑,X20 的直闪比你手机强多了今年最火的小相机是谁?没跑,富士 X Half。复古外观一上架就被年轻人抢到脱销,朋友圈随便刷一下,全是它的街拍照。...
2025-11-07 3
无需打开直接搜索微信:本司针对手游进行,选择我们的四大理由: 1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信: 2、自动连接,用户只要开启...
2025-11-07 18
发表评论