首页 今日快讯文章正文

AI行业迎来大变!Anthropic甩出 "王炸",新产品性能突破巨大

今日快讯 2026年06月23日 08:37 16 admin

前言:

如今的AI发展已经趋于成熟,那么未来这个行业的发展又会朝着什么趋势发展?

或许就是我们使用中的体验,在将来会迎来重大的改变。而其中最重要的,也就是我们在使用中的花销。

通过很少的花费,能够获得更好的体验,那么未来对于我们的生活、工作有会引来什么样子的改变。

AI行业迎来大变!Anthropic甩出 "王炸",新产品性能突破巨大

巨变出现!

AI圈又出大新闻了!10月16日凌晨,Anthropic悄悄上线了新款推理模型ClaudeHaiku4.5。

别以为这只是一次普通的模型更新,这次Anthropic直接把"性价比"三个字焊死在新模型上,性能能跟自家中端旗舰Sonnet4掰手腕,成本却只要三分之一,速度还翻了两倍多。

要知道,之前AI模型要么是性能强但价格贵得吓人,要么是便宜却满足不了复杂需求。

这次ClaudeHaiku4.5一出来,直接打破了这个僵局。不管是普通用户想用AI辅助日常,还是开发者要搭建低成本AI应用,这下都有了新选择。

而且更让人意外的是,在计算机使用这类特定任务里,它甚至比Sonnet4表现还好,这波操作直接让不少人喊Anthropic是"AI性价比屠夫"。

评判AI模型好不好,数据最有说服力。在衡量软件编程能力的SWE-benchVerified测试里,ClaudeHaiku4.5拿到了73.3%的成绩。这个数字有多厉害?看看同行就知道。

Anthropic自家的Sonnet4是72.7%,OpenAI的GPT-5也才72.8%,三者几乎站在同一水平线上。

要知道,Sonnet4之前一直是Anthropic中端模型里的主力,这次Haiku4.5作为定位更低的型号,能追平这个成绩,已经超出很多人的预期。

再看其他任务表现,Agenticterminalcoding(终端编程)测试里,Haiku4.5拿到41.0%,虽然比Sonnet4.5的50.0%低一些,但比Sonnet4的36.4%还高。

OSWorld(计算机使用)测试中,它的成绩是50.7%,远超Sonnet4的42.2%。

高中数学竞赛AIME2025的测试里,用Python工具辅助时,Haiku4.5正确率能到96.3%,就算不用工具也有80.7%,而Sonnet4不用工具的成绩只有70.5%。

多语言问答MMMLU测试里,Haiku4.5拿到83.0%,虽然比Sonnet4.5的89.1%和GPT-5的89.4%差一点,但作为低成本模型,能有这个表现已经很能打。

毕竟大多数用户日常用AI,不需要追求顶级的多语言能力,83%的正确率完全能满足写文案、查资料这类需求。

性能能打还不够,Anthropic这次把价格直接拉到了"平民级"。

现在ClaudeHaiku4.5的定价是每百万输入token1美元(约合人民币7元),每百万输出token5美元(约合人民币35元)。

对比一下Sonnet系列就知道有多划算,Sonnet4每百万输入token要3美元,输出要15美元,Haiku4.5的输入成本是Sonnet的三分之一,输出成本也是三分之一。

更良心的是,这款模型现在免费用户就能用,不用花一分钱就能体验到接近中端旗舰的性能。

开发者也能通过ClaudeAPI调用,对于需要控制成本的小团队或者个人开发者来说,这简直是福音。

AI行业迎来大变!Anthropic甩出 "王炸",新产品性能突破巨大

行业门槛迎来改变

之前很多开发者想做AI应用,都因为高token成本望而却步,现在Haiku4.5来了,相当于把入门门槛直接拉低。

Anthropic的首席产品官MikeKrieger在采访里也说了,Haiku系列的成本本来就比Sonnet低不少,Sonnet又只是Opus(Anthropic高端旗舰)成本的五分之一。

这么算下来,Haiku4.5的成本大概只有Opus的十五分之一,但性能却不是十五分之一的水平,这种性价比在之前的AI市场里几乎找不到第二家。

除了性能和价格,ClaudeHaiku4.5还有两个很实用的新功能。一个是"扩展思维模式",之前老款的Haiku3.5没有这个功能。

平时用AI的时候,它会快速给出答案,但遇到复杂问题,你可以手动切换到这个模式,让它多花点时间梳理思路,得出的答案会更全面。

而且它还有上下文感知能力,能告诉你当前用了多少上下文窗口。快到窗口上限的时候,它会自动总结答案,避免信息溢出;离上限还远的时候,就会更细致地推理。

这样一来,就不用担心AI会"偷懒",比如过早结束回答,或者漏了关键信息,之前很多用户吐槽的AI"敷衍回答"问题,在这里得到了缓解。

另一个亮点是支持多模型协同。简单说就是,你可以让Sonnet4.5和Haiku4.5一起干活。

Sonnet4.5擅长做复杂规划,比如拆解一个多步骤的项目,它能把每个环节都列清楚;然后Haiku4.5来执行具体的子任务,比如写代码片段、整理数据。

这样搭配下来,既保证了规划的专业性,又控制了执行的成本,不管是处理工作项目,还是完成学习任务,效率都能提一大截。

很多人担心,价格降了、性能升了,安全性会不会缩水?从测试数据来看,完全不用慌。

在单轮违规请求评估里,ClaudeHaiku4.5的无害响应率达到99.38%,这个数字和Sonnet4.5的99.29%、高端的Opus4.1的98.76%比起来,一点都不逊色。

而且它在处理敏感话题的良性请求时,表现比老款Haiku3.5好太多。

之前Haiku3.5对无害请求的拒绝率有4.26%,有时候用户只是正常问一些敏感领域的知识,也会被拒绝。

但Haiku4.5的总体拒绝率只有0.02%,默认模式下0.04%,扩展思维模式下更是低到0.01%。这意味着你正常提问的时候,几乎不会遇到"该请求无法回答"的情况,用起来更顺畅。

在AgentRedTeaming(AI代理红队测试)里,Haiku4.5也交出了好成绩。

这个测试主要看模型会不会泄露敏感数据、违反安全准则、生成恶意代码,或者被诱导做未经授权的操作。

在25个测试的模型变体里,Haiku4.5多次拿到最好成绩,面对各种"诱导陷阱",它的抵抗力相当强。这次Haiku4.5的发布,也能看出Anthropic的研发节奏有多快。

AI行业迎来大变!Anthropic甩出 "王炸",新产品性能突破巨大

市场前景广泛

今年8月,他们刚推出Opus4.1,几周前又上线了Sonnet4.5,现在Haiku4.5紧接着就来。MikeKrieger透露,其实在训练Sonnet4.5的时候,Haiku4.5的相关工作就已经启动了。

这种"无缝衔接"的研发节奏,背后是Anthropic不想在AI竞争中掉队。现在AI行业里,谷歌有Gemini系列,OpenAI有GPT-5,都是实力强劲的对手。

Anthropic能在短短几个月里连续更新三款模型,而且每款都有明确的定位和提升,也能看出他们的技术储备很足。

从市场表现来看,Anthropic也有底气。现在公司估值已经达到1830亿美元,服务的企业客户超过30万家,今年10月的年收入运行率接近70亿美元。

有了资金和客户的支持,他们才能更快地推进研发,推出像Haiku4.5这样高性价比的模型。ClaudeHaiku4.5的出现,可能会给整个AI行业带来连锁反应。

之前很多行业想用AI,但都卡在成本上,比如中小电商想做智能客服,教育机构想开发AI辅导工具,都因为高端模型太贵、低端模型不好用而犹豫。

现在Haiku4.5把性能和价格的平衡点找好了,这些行业的AI落地速度可能会加快。对普通用户来说,选择也更多了。

之前免费AI工具要么功能简单,要么有使用限制,Haiku4.5免费开放给用户,还能提供接近中端旗舰的性能,不管是写代码、做数据分析,还是整理学习资料,都能派上用场。

而且它速度快,不用等太久就能拿到结果,用起来体验也更好。接下来,其他AI公司很可能会跟着调整策略。

要么也推出高性价比的模型,要么在现有模型上降价,毕竟用户只会用脚投票,谁能提供更划算的服务,谁就能占据更多市场。

长远来看,这种竞争对整个行业是好事,最终受益的还是普通用户和企业。

现在ClaudeHaiku4.5已经开放使用,免费用户直接就能体验,开发者也能通过API调用。

AI行业迎来大变!Anthropic甩出 "王炸",新产品性能突破巨大

结语:

如果你之前觉得AI工具太贵,或者性能不够用,不妨去试试这款新模型,说不定能给你带来惊喜。

毕竟在AI行业里,这种性能和价格都能打的模型,可不多见。

AI行业迎来大变!Anthropic甩出 "王炸",新产品性能突破巨大

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap