刚刚，DeepSeek发了“终极版”！

今日快讯 2025年09月23日 00:28 0 aa

智东西

作者 | 陈骏达

编辑 | 李水青

DeepSeek又更新了！

智东西9月22日报道，今天晚间，DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型（Terminus拉丁语意为终点、界限），并在不久后宣布模型开源。

官方文档中称，DeepSeek-V3.1-Terminus在保持模型原有能力的情况下，改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug，还进一步优化了编程和搜索智能体的表现。

DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到，在非Agent类的基准测试中，DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升，不过也有些测试成绩出现小幅度下滑。

DeepSeek-V3.1-Terminus在HLE（人类终极测试）上的性能提升最为明显，这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。

而在Agent测评中，DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。

DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验，尝试复现此前的多个Bug，并体验模型的最新性能。

开源地址：

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

一、两大神秘Bug消失，DeepSeek-V3.1终于不犯糊涂了

今年8月，DeepSeek-V3.1上线后，有用户反馈在用API调用模型时，会偶尔出现一个严重Bug：模型会不受控地随机输出“极”、“極”、“extreme”等字样，严重影响日常使用，如果未经仔细检查就使用含有这一Bug的代码，很可能导致编译失败。

DeepSeek-V3.1的“极”字Bug（图源：知乎@Fun10165）

智东西调用了最新的DeepSeek-V3.1-Terminus API，尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。

不过，DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug，也就是说，这一问题应该已经被修复了。

DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug

也有海外用户反映，此前的DeepSeek-V3.1存在多语言的问题，尤其是在翻译小语种时。这位Reddit网友分享，DeepSeek会把中、英、俄三种语言混用，问题文本的比例有时能达到5%。

网友分享DeepSeek-V3.1多语言混用问题（图源：Reddit @Kitano_o）

智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种：“人工智能正在改变我们的世界，它带来了巨大的机遇，也需要我们认真思考其挑战。”

DeepSeek-V3-Terminus的回答没有出现语言混杂问题，看来这一Bug也被修复了。

除了Bug的修复之外，DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。

编程任务上，智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳，结果如下。模型输出的网页采用了简约风格，不过，模拟的重力、摩擦力效果十分逼真。要打造这样的效果，模型不仅需要有很强的编程能力，也需拥有对物理学的理解能力。

这一模型打造的动画效果也不错，轨迹和碰撞都比较自然：

在搜索智能体能力方面，我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外，模型也要交叉验证信息的可靠性，并进行整合提炼和风险提示。

可以看到，DeepSeek-V3.1-Terminus给出的答案考虑十分周全，经人工核查事实无误，可读性也不错。

DeepSeek-V3.1-Terminus中的“Terminus”，在拉丁语里是“终点”或“界限”的意思，我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称，这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本，代表了当前技术路径的成熟和完善。

也有网友认为，Terminus可能意味着模型在编程终端里的表现更好了。不过，正如DeepSeek所言，具体的命名寓意最好还是官方来解释更为准确。

此前，外网有媒体报道称，DeepSeek今年年底即将推出Agent模型。或许，DeepSeek的下一次重大更新，已经不远了。

发表评论