首页 AI科技文章正文

“百度不做”,仅仅一年,李彦宏反悔了

AI科技 2025年10月20日 17:12 0 admin
“百度不做”,仅仅一年,李彦宏反悔了


唯物的中国芯片产业深度观察


百度创始人李彦宏在一次内部讲话中说,Sora这种AI视频大模型投入周期太长,10年、20年都可能拿不到业务收益,无论多火爆,百度都不会去做。


那是2024年10月,创造了ChatGPT的公司Open AI推出文生视频应用Sora已经有7个月。


今年大不相同。


9月30日,Sora 2正式发布。仅仅过了14天,百度便高调推广“百度蒸汽机”AI视频模型,和急于“秀肌肉”的谷歌Veo 3.1撞个满怀。


Sora问世时一片寂静,而Sora 2诞生后,各个竞争对手都急着与Sora 2一争高下,唯恐少出了风头。


中国AI视频应用从沉寂到火热、李彦宏的“反悔”都有“打脸”之嫌。这些前后转变到底隐藏着大厂的哪些秘密?


一片沉寂

虽然李彦宏说“百度不会去做”的几个月后,百度就开始加大力度投入AI视频,但李彦宏的说法也确实指出了行业里的普遍焦虑。


这种焦虑直接导致了中国大厂在Sora推出时“一片沉寂”。


话要说回2024年2月。Sora一问世就成了Open AI手里的一张王牌应用。和其他应用“模拟现实”不同,Sora达到了“建构现实”的高度:二者的区别是,前者只能模仿现实世界的表象,而后者在数字世界里依照现实规则重新建构了“现实”。


比如,在现实中,我们咬下一口苹果,苹果上会留下牙齿的痕迹。Sora生成的视频能够再现这一细节,是因为它遵循了施力、受力这一基本物理规则。细节是真实感的基础,视频和图像最需要细节的真实。


“百度不做”,仅仅一年,李彦宏反悔了


那时,其他文生视频应用都做不到这一点。


Sora之前,国内大厂也布局了文生视频领域。2023年底,百度发布过文生视频工具“度加剪辑”,可以一键获取最新热点、AI生成文案、一键生成视频。字节跳动推出过同类模型Pixel Dance,阿里也曾上线Animate Anyone模型。


然而,Sora一出,中国大厂避之不及,有公司甚至坚决否认自家产品等于“中文版Sora”。


当时,国内大厂布局的重点并不在文生视频领域,他们的当务之急可不是做出中国版Sora,而是努力赶上GPT-4。


“百度不做”,仅仅一年,李彦宏反悔了

图源:pexels


由于当时中国AI大模型和GPT相去甚远,自然搞“基础建设”而不是“上层建筑”是更紧迫的事情。就像某大厂模型业务负责人曾无奈表示,“ChatGPT之前大家也都有聊天机器人啊……关键是能不能达到那个水准。”


中国大厂的焦虑,根本原因在于自家大模型与Open AI、谷歌的世界顶级大模型之间的巨大差距。如果大模型能力有限,谈什么文生视频模型实在奢侈。


不过,中国大厂的焦虑,已经随着2025年初深度求索推出“物美价廉”的DeepSeek模型而大大减轻。


家家都有

今年,基础大模型竞争迭代速度极快,甚至连“价格战”都打完了。谁家还没有视频模型,肯定会被质疑大模型实力不够。


截至2025年10月,中国市场上已经有20多款视频大模型产品,阿里、腾讯、字节、百度均参与其中。海外市场,除了Open AI,谷歌、Meta等巨头以及Runway、Luma AI、Midjourney等创业公司都在同台竞技。


一位大模型从业者告诉南风窗,大模型基础信息处理能力的提升与成本的下降,让豆包、通义、文心等几款大模型获得了快速增长。深度推理能力、视觉推理能力以及Agent相关技术将成为未来几年基础大模型竞争的关键。


因此,依照当下的局面,李彦宏对“不做AI视频应用”的反悔、积极布局多模态大模型就不难理解了。从文心大模型4.5到4.5 Turbo,从文心大模型X1到X1 Turbo,百度模型性能提升的同时,多模态能力也在进一步增强,推出“百度蒸汽机”也顺理成章。


“百度不做”,仅仅一年,李彦宏反悔了

4月25日百度创始人李彦宏在Create2025百度AI开发者大会上发表了题为《模型的世界 应用的天下》的演讲/新华网


从技术的角度看,各家大模型之视频分模型,比如Sora 2和Veo3.1,正在沿着两大方向演进,一方面是视频质量持续提升——画面更真实、提示词理解更准确;另一方面是用户编辑能力的强化——从整体生成到局部修改、对象增删,操作更加精细,交互感更强。


更关键的是,音频即时生成,极大填补了此前AI视频工具只能做“默片”的短板。


对于“顶流”AI视频生成应用的测试,也已经和考验聊天机器人的测试差不多了。近几天,多位网友以“同题考试”的办法,测试了Sora 2和Veo3.1的能力,最后发现两家公司的训练模式和逻辑的不同:谷歌强调物理世界的规则,而Open AI更注重娱乐性。


这也意味着,各家公司依靠自身的特色和禀赋来创造“风格化”的AI应用。AI视频应用正在从“大帮哄”走向精细化、特色化时代。


争做大平台

一旦大模型的能力跟上了,“李彦宏的反悔”就成了更加“现实”的问题:如何降低AI视频应用的成本,找到商业化前景?


而Sora 2的玩法,恰恰让业界看到了变现的希望。


首先是成本降低,可用性增强。


Open AI发布的样片中,有花样滑冰运动员顶着猫咪完成转体三周半动作,有业余爱好者跌倒在冲浪板上的水花四溅,有宫崎骏动画风格的男孩和小狗在风中奔跑……


“百度不做”,仅仅一年,李彦宏反悔了

Open AI官网发布的样片,一名花样滑冰选手在头上戴着一只猫做三轴动作


“百度不做”,仅仅一年,李彦宏反悔了

Open AI官网发布的样片,业余爱好者跌倒在冲浪板上的水花四溅


“百度不做”,仅仅一年,李彦宏反悔了

Open AI官网发布的样片,宫崎骏动画风格的男孩和小狗在风中奔跑


虽然用户真正生成的视频和这些精美的样片之间还是有一定的差距,但是观众也从中看到了用AI讲出好故事的可能。对于用户来说,过去辛辛苦苦写提示词、生成一段5秒的视频,最后只有0.5秒能用,现在可以直接生成一个复杂镜头构成的电影片段,几乎不用大改。


同时,AI演员也跃跃欲试,准备替代真人演员。9月底苏黎世电影节爆红的AI演员蒂利·诺伍德,据悉已经有好莱坞经纪公司邀约在身,气得一众影星纷纷发帖保卫自己的饭碗。


AI场景与AI演员的结合,可能让垄断性的电影“短视频化”,成为大众田间地头的随手创作,摆脱过去的行业垄断。


“百度不做”,仅仅一年,李彦宏反悔了

蒂利·诺伍德


其次,“创作者成功,则平台成功”,互联网大厂无不以“平台化”而发家,而近日Sora 2的最大动作,就是让免费用户“一键创作视频”,把用户从网页端转移到APP移动端,实现“战略下沉”。


Sora 2的用户设计非常友好。与Meta忙三火四地推出Vibes相比,OpenAI展现了产品化方面的优势。这款应用允许用户创建10秒以内的短视频,还可以把自己或朋友的形象插入其中。这种高度个性化和社交化的设计,被认为是比简单的社交标签页更聪明的策略,也是它迅速引爆社交网络的原因之一。


Open AI的CEO山姆·奥特曼在Sora更新信息之中明确提到“为创作者提供变现机制”。很快,随着邀请制测试结束,Sora将迅速补齐编辑功能、增加用户激励机制,向“大平台”发起冲击。


“百度不做”,仅仅一年,李彦宏反悔了

Open AI的CEO山姆·奥特曼


这意味着,只要90%以上的免费用户找到了变现途径、看到了变现的希望,Sora就有机会成为TikTok一样用户生产、用户消费的闭环平台巨头。


客观地看,Sora 2可能会引领AI视频的生产和传播方式,也正在引发新一轮的全球生成式AI视频的竞争大战。


而TikTok的成功表明,同一类型的“平台”数量不会太多,所以,在大模型差距逐渐缩小的时候,所有AI视频厂商都想早日做成那个最大的平台:最血腥的厮杀才刚刚开始。



作者 | 荣智慧

编辑 | 向现

值班主编 | 张来

排版 | 八斤

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap