IT之家 6 月 30 日消息,据博主 / 用户分享,铁路 12306 鸿蒙版 App 现开启 5.9.4.2 版本升级,更新至该版本后,12306...
2025-06-30 0
今日上午,华为在官方微信公众号正式官宣开源盘古7B、72B两款大模型,以及为华为昇腾NPU芯片优化的推理代码,目前均已在国内代码托管平台GitCode正式上线。其中盘古7B(盘古 Embedded)拥有70亿参数量,盘古72B(盘古 Pro MoE)则拥有720亿参数量。
根据华为官方的介绍,盘古7B模型为双系统框架,具备“快思慢想”功能,能够根据任务复杂度自动选择合适的模式,即在常规请求下使用“快思考”模式,在复杂推理任务下使用“慢思考”模式,从而在延迟和推理深度之间实现平衡。在多款复杂推理测试中,盘古7B的性能要强于阿里巴巴旗下的Qwen3-8B、智谱旗下的GLM4-9B,
盘古72B则为MoE混合专家模型,与一般的MoE模型不同,华为提出了一种新型的分组混合专家模型MoGE,其优点在于可以在专家选择阶段对专家进行分组,约束token在每个组内激活等量专家,进而实现负载均衡。
性能方面,华为声称该模型针对昇腾300I Duo、800I A2平台进行优化,在后者上可以实现单卡1148 token/s的推理速度。
根据SuperCLUE中文大模型基准测评5月的数据,盘古72B在开源排行榜中位列第五,总分为58.75分,超越Qwen3-14B、Qwen3-8B,仅次于DeepSeek-R1满血版、DeepSeek-V3满血版以及Qwen3-32B和235B。
值得一提的是,盘古72B的文本理解与创作得分位居榜单之首,为80.48分,但在科学推理能力上仅有39.6分,明显弱于位居榜单前列的其余模型。
此外,在推理模型榜单中,盘古72B的推理能力得分为60.3,并未有明显领先优势。一定程度上说明盘古系列开源模型的推理性能还有待进步。
相关文章
IT之家 6 月 30 日消息,据博主 / 用户分享,铁路 12306 鸿蒙版 App 现开启 5.9.4.2 版本升级,更新至该版本后,12306...
2025-06-30 0
据科技媒体9to5Mac爆料,苹果大概率将于今年秋季,八成会是9月的iPhone 17系列发布会上同步推出第二代AirTag蓝牙追踪器。苹果原计划是在...
2025-06-30 0
今日上午,华为在官方微信公众号正式官宣开源盘古7B、72B两款大模型,以及为华为昇腾NPU芯片优化的推理代码,目前均已在国内代码托管平台GitCode...
2025-06-30 0
关于有线电视机顶盒升级的问题一直以来都是让广大用户抓狂的问题,因为每一次的升级特别是硬件升级都需要用户被迫从口袋里掏出“真金白银”。然而“被迫”升级的...
2025-06-30 0
本篇文章给大家谈谈手机打麻将万能开挂神器,以及打手机麻将开挂下载对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 wepoker开挂教程 1、获...
2025-06-30 1
本篇文章给大家谈谈互动麻将怎么开挂,以及麻将游戏开挂怎么开对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 怎么才能在微信上开挂? 在“设置DD...
2025-06-30 1
手机绑定银行卡,这个设置一定要打开,不然钱没了都不知道。现在很多朋友使用的都是智能手机,手机里边也会有零钱,甚至绑定银行卡。而且现在很多银行卡都开通了...
2025-06-30 3
今天给各位分享蝴蝶大厅拼三张透视挂的知识,其中也会对蝴蝶3d立体拼图进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!形容古代街市...
2025-06-30 1
发表评论