由福州市商务局牵头组织的“惠聚榕城”跨境电商走进产业带(福州站)活动于10月17日在福州数字中国会展中心与“2025闽商跨境力量行业发展大会”同期成功...
2025-10-17 0
9月刚过半,AI圈就炸出个大新闻。
蚂蚁集团在14号深夜突然官宣,正式发布全球首个开源的万亿参数思考模型Ring-1T。
这消息一出来,不少AI从业者连夜爬起来看测评。
有人直言“这模型的表现,怕是要让GPT-5都得绷紧神经”。
要知道两周前,大家还在围着Ring-1T的预览版讨论数学题解法。
没想到短短十几天,正式版不仅在国际数学奥林匹克(IMO)2025赛题里拿到银牌水平。
还在好几个权威基准测试中追上了DeepSeek V3.2。
这哪儿是单纯的模型发布,更像是给开源AI赛道投了颗“深水炸弹”,原本的竞争格局直接被搅活了。
先说说大家最关心的性能表现,尤其是在数学和代码这两个硬核领域。
在IMO 2025赛题测试里,Ring-1T的表现让不少人大吃一惊。
它借助多智能体框架AWorld,用纯自然语言推理。
一次性解出了第1、3、4、5题,这个成绩已经达到了IMO银牌水平。
除了数学,代码生成也是Ring-1T的强项。
在LiveCodeBench和CodeForces这两个权威代码测评平台上。
它的得分都冲进了开源模型的前列。
既然提到了开源模型,就不得不提DeepSeek V3.2,它也是目前赛道里的“热门选手”。
这款模型采用MoE架构,稀疏注意力机制让它在效率和泛化能力上表现突出。
就在上个月,DeepSeek还发布了V3.2-Exp版本。
新引入的DSA稀疏注意力机制,直接让长上下文计算成本下降了约75%。
为了更直观地看出两款模型的差距,不少开发者还做了实测对比。
涵盖SVG绘图、物理模拟、UI前端复刻和3D可交互界面这四类贴近实际应用的任务。
在SVG绘图任务里,大家给出的prompt是“骑自行车的鹈鹕”。
Ring-1T画出来的作品,车架、鸟身、轮子这些关键要素都很清晰,比例也比较协调。
而DeepSeek V3.2画的鹈鹕,出现了脚和身体分离、车把消失的问题,看起来有点“抽象”。
物理模拟任务更考验模型的细节处理能力。
要求建模小球在旋转六边形内受重力、摩擦、弹跳作用的物理行为。
两款模型都支持参数调节,但Ring-1T多了弹跳力度和墙面摩擦系数的细分设定。
UI前端复刻任务则贴近互联网行业的需求,要求做一个简版Word文档前端。
包含文本加粗、斜体、对齐方式、字体调整等功能。
Ring-1T做出来的界面,布局和常用的Word界面很像。
点击加粗、斜体按钮,文本样式能即时切换。
而DeepSeek V3.2做的界面,不仅少了“字体颜色调整”的开关。
点击“居中对齐”按钮时,还会出现文本错位的情况。
最有意思的是3D可交互界面任务,目标是实现一个贪吃蛇游戏。
Ring-1T用JavaScript写出的代码,不仅能实现基本的蛇身移动、吃食物加分功能。
还加入了多关卡、加速、磁力吸附、双倍积分和护盾这些进阶机制。
玩起来和市面上的小游戏没什么差别。
而DeepSeek V3.2虽然能画出贪吃蛇的色块,但点击“开始游戏”按钮后。
蛇身根本不会动,相当于只做了个“静态海报”。
再说说Ring-1T的底层架构,它基于Ling 2.0架构,在Ling-1T-base的基础上训练而成。
值得一提的是,它支持最高128K的上下文窗口,这意味着它能处理更长的文本内容。
除此之外,蚂蚁还自研了一个叫Icepop(棒冰)的算法。
这个算法的作用是控制训练和推理阶段的算子精度差异,防止模型在训练过程中出现崩溃。
另外大规模万亿参数训练能稳定落地,还离不开强化学习系统ASystem的支撑。
现在Ring-1T的权重和训练框架,已经同步开源到了Hugging Face和魔搭社区。
开发者不管是想下载下来本地测试,还是通过Ling Chat、ZenMux接入API在线体验,都很方便。
而且蚂蚁的开源布局不止Ring-1T这一个点。
他们的大模型矩阵已经覆盖了从百亿到万亿级别的不同规模。
除了Ring-1T这样的通用模型,还有Ling-1T、多模态模型Ming等。
同时,多智能体框架AWorld和Agent平台生态也在逐步完善。
有行业分析师指出,蚂蚁这样的布局,不仅能让开发者有更多选择。
还能推动整个开源AI生态的发展,毕竟更多人参与进来。
才能发现问题、解决问题,让模型变得更好。
Ring-1T的开源,无疑让中国在万亿参数开源思考模型领域有了更多话语权,也给AI行业注入了新的活力。
虽然现在Ring-1T和DeepSeek V3.2各有优势,短期里还会继续“较劲”,但最终受益的还是开发者和整个行业。
未来不管是模型性能的提升,还是生态的完善。
都值得大家期待,毕竟AI的发展。
就是在这样一次次的突破和竞争中不断前进的。
相关文章
由福州市商务局牵头组织的“惠聚榕城”跨境电商走进产业带(福州站)活动于10月17日在福州数字中国会展中心与“2025闽商跨境力量行业发展大会”同期成功...
2025-10-17 0
前言9月刚过半,AI圈就炸出个大新闻。蚂蚁集团在14号深夜突然官宣,正式发布全球首个开源的万亿参数思考模型Ring-1T。这消息一出来,不少AI从业者...
2025-10-17 0
华为手机的智慧语音功能叫小艺,可以通过语音唤醒之后,说出指令就可以自动进行操作。随着华为手机系统版本升级到HarmonyOS5.1版本之后,这个功能发...
2025-10-17 0
京东数据显示,10月9日京东11.11启动后,iPhone Air创下1秒成交额破亿的纪录。据了解,京东已率先启动Apple全线产品促销,iPhone...
2025-10-17 0
这项由上海人工智能实验室的刘子羽、臧雨航等研究人员领导的研究发表于2025年1月,论文标题为《SPARK:协同策略与奖励共同进化框架》,有兴趣深入了解...
2025-10-17 0
当影石Insta360开始在影像及无人机赛道上对大疆发起挑战时,这场竞争本应是国产科技企业以技术为矛、彼此激发的典范,是推动行业突破性能天花板、让消费...
2025-10-17 0
在科学研究史上,2025年10月15日注定是一个值得铭记的日子。这一天,国际顶尖学术期刊《自然》杂志共刊登22篇研究论文,其中11篇来自华人学者的杰出...
2025-10-17 0
匠心科技赋能奢护新境,卓越品质诠释历久弥新。百年奢华家电品牌德国美诺Miele,携手专业羊绒品牌鄂尔多斯1980,共同演绎羊绒洗护新境界。美诺全新W2...
2025-10-17 0
发表评论