首页 今日快讯文章正文

DeepSeek,最新进展

今日快讯 2025年09月30日 00:14 0 admin

9月29日,DeepSeek-V3.2-Exp模型正式发布,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

当日更早时候,有AI业内人士发现,DeepSeek于开源社区平台Huggingface上架了DeepSeep V3.2-base的页面,但很快删除。另据记者了解,智谱新模型GLM-4.6也将于近日发布,目前已可通过API接口调用。

9月29日晚,寒武纪在官方公众号同步称,公司已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。

近日,DeepSeek“小步快跑”,推进模型迭代。9月22日晚,DeepSeek小助手在官方社群中称,DeepSeek线上模型已升级,当前版本号DeepSeek-V3.1-Terminus。

8月21日,DeepSeek宣布发布DeepSeek-V3.1。据介绍,DeepSeek-V3.1的升级包含以下主要变化。一是实现混合推理架构,一个模型同时支持思考模式与非思考模式;二是更高的思考效率;三是更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。

值得一提是,此前,DeepSeek宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。消息一出,当日DeepSeek概念板块火热,不少国产芯片产业链企业股价大涨。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap