“百度不做”，仅仅一年，李彦宏反悔了

AI科技 2025年10月20日 17:12 0 admin

唯物的中国芯片产业深度观察

百度创始人李彦宏在一次内部讲话中说，Sora这种AI视频大模型投入周期太长，10年、20年都可能拿不到业务收益，无论多火爆，百度都不会去做。

那是2024年10月，创造了ChatGPT的公司Open AI推出文生视频应用Sora已经有7个月。

今年大不相同。

9月30日，Sora 2正式发布。仅仅过了14天，百度便高调推广“百度蒸汽机”AI视频模型，和急于“秀肌肉”的谷歌Veo 3.1撞个满怀。

Sora问世时一片寂静，而Sora 2诞生后，各个竞争对手都急着与Sora 2一争高下，唯恐少出了风头。

中国AI视频应用从沉寂到火热、李彦宏的“反悔”都有“打脸”之嫌。这些前后转变到底隐藏着大厂的哪些秘密？

一片沉寂

虽然李彦宏说“百度不会去做”的几个月后，百度就开始加大力度投入AI视频，但李彦宏的说法也确实指出了行业里的普遍焦虑。

这种焦虑直接导致了中国大厂在Sora推出时“一片沉寂”。

话要说回2024年2月。Sora一问世就成了Open AI手里的一张王牌应用。和其他应用“模拟现实”不同，Sora达到了“建构现实”的高度：二者的区别是，前者只能模仿现实世界的表象，而后者在数字世界里依照现实规则重新建构了“现实”。

比如，在现实中，我们咬下一口苹果，苹果上会留下牙齿的痕迹。Sora生成的视频能够再现这一细节，是因为它遵循了施力、受力这一基本物理规则。细节是真实感的基础，视频和图像最需要细节的真实。

那时，其他文生视频应用都做不到这一点。

Sora之前，国内大厂也布局了文生视频领域。2023年底，百度发布过文生视频工具“度加剪辑”，可以一键获取最新热点、AI生成文案、一键生成视频。字节跳动推出过同类模型Pixel Dance，阿里也曾上线Animate Anyone模型。

然而，Sora一出，中国大厂避之不及，有公司甚至坚决否认自家产品等于“中文版Sora”。

当时，国内大厂布局的重点并不在文生视频领域，他们的当务之急可不是做出中国版Sora，而是努力赶上GPT-4。

图源：pexels

由于当时中国AI大模型和GPT相去甚远，自然搞“基础建设”而不是“上层建筑”是更紧迫的事情。就像某大厂模型业务负责人曾无奈表示，“ChatGPT之前大家也都有聊天机器人啊……关键是能不能达到那个水准。”

中国大厂的焦虑，根本原因在于自家大模型与Open AI、谷歌的世界顶级大模型之间的巨大差距。如果大模型能力有限，谈什么文生视频模型实在奢侈。

不过，中国大厂的焦虑，已经随着2025年初深度求索推出“物美价廉”的DeepSeek模型而大大减轻。

家家都有

今年，基础大模型竞争迭代速度极快，甚至连“价格战”都打完了。谁家还没有视频模型，肯定会被质疑大模型实力不够。

截至2025年10月，中国市场上已经有20多款视频大模型产品，阿里、腾讯、字节、百度均参与其中。海外市场，除了Open AI，谷歌、Meta等巨头以及Runway、Luma AI、Midjourney等创业公司都在同台竞技。

一位大模型从业者告诉南风窗，大模型基础信息处理能力的提升与成本的下降，让豆包、通义、文心等几款大模型获得了快速增长。深度推理能力、视觉推理能力以及Agent相关技术将成为未来几年基础大模型竞争的关键。

因此，依照当下的局面，李彦宏对“不做AI视频应用”的反悔、积极布局多模态大模型就不难理解了。从文心大模型4.5到4.5 Turbo，从文心大模型X1到X1 Turbo，百度模型性能提升的同时，多模态能力也在进一步增强，推出“百度蒸汽机”也顺理成章。

4月25日百度创始人李彦宏在Create2025百度AI开发者大会上发表了题为《模型的世界应用的天下》的演讲/新华网

从技术的角度看，各家大模型之视频分模型，比如Sora 2和Veo3.1，正在沿着两大方向演进，一方面是视频质量持续提升——画面更真实、提示词理解更准确；另一方面是用户编辑能力的强化——从整体生成到局部修改、对象增删，操作更加精细，交互感更强。

更关键的是，音频即时生成，极大填补了此前AI视频工具只能做“默片”的短板。

对于“顶流”AI视频生成应用的测试，也已经和考验聊天机器人的测试差不多了。近几天，多位网友以“同题考试”的办法，测试了Sora 2和Veo3.1的能力，最后发现两家公司的训练模式和逻辑的不同：谷歌强调物理世界的规则，而Open AI更注重娱乐性。

这也意味着，各家公司依靠自身的特色和禀赋来创造“风格化”的AI应用。AI视频应用正在从“大帮哄”走向精细化、特色化时代。

争做大平台

一旦大模型的能力跟上了，“李彦宏的反悔”就成了更加“现实”的问题：如何降低AI视频应用的成本，找到商业化前景？

而Sora 2的玩法，恰恰让业界看到了变现的希望。

首先是成本降低，可用性增强。

Open AI发布的样片中，有花样滑冰运动员顶着猫咪完成转体三周半动作，有业余爱好者跌倒在冲浪板上的水花四溅，有宫崎骏动画风格的男孩和小狗在风中奔跑……

Open AI官网发布的样片，一名花样滑冰选手在头上戴着一只猫做三轴动作

Open AI官网发布的样片，业余爱好者跌倒在冲浪板上的水花四溅

Open AI官网发布的样片，宫崎骏动画风格的男孩和小狗在风中奔跑

虽然用户真正生成的视频和这些精美的样片之间还是有一定的差距，但是观众也从中看到了用AI讲出好故事的可能。对于用户来说，过去辛辛苦苦写提示词、生成一段5秒的视频，最后只有0.5秒能用，现在可以直接生成一个复杂镜头构成的电影片段，几乎不用大改。

同时，AI演员也跃跃欲试，准备替代真人演员。9月底苏黎世电影节爆红的AI演员蒂利·诺伍德，据悉已经有好莱坞经纪公司邀约在身，气得一众影星纷纷发帖保卫自己的饭碗。

AI场景与AI演员的结合，可能让垄断性的电影“短视频化”，成为大众田间地头的随手创作，摆脱过去的行业垄断。

蒂利·诺伍德

其次，“创作者成功，则平台成功”，互联网大厂无不以“平台化”而发家，而近日Sora 2的最大动作，就是让免费用户“一键创作视频”，把用户从网页端转移到APP移动端，实现“战略下沉”。

Sora 2的用户设计非常友好。与Meta忙三火四地推出Vibes相比，OpenAI展现了产品化方面的优势。这款应用允许用户创建10秒以内的短视频，还可以把自己或朋友的形象插入其中。这种高度个性化和社交化的设计，被认为是比简单的社交标签页更聪明的策略，也是它迅速引爆社交网络的原因之一。

Open AI的CEO山姆·奥特曼在Sora更新信息之中明确提到“为创作者提供变现机制”。很快，随着邀请制测试结束，Sora将迅速补齐编辑功能、增加用户激励机制，向“大平台”发起冲击。

Open AI的CEO山姆·奥特曼

这意味着，只要90%以上的免费用户找到了变现途径、看到了变现的希望，Sora就有机会成为TikTok一样用户生产、用户消费的闭环平台巨头。

客观地看，Sora 2可能会引领AI视频的生产和传播方式，也正在引发新一轮的全球生成式AI视频的竞争大战。

而TikTok的成功表明，同一类型的“平台”数量不会太多，所以，在大模型差距逐渐缩小的时候，所有AI视频厂商都想早日做成那个最大的平台：最血腥的厮杀才刚刚开始。

作者 | 荣智慧

编辑 | 向现

值班主编 | 张来

排版 | 八斤

抖音支付绑卡立省，安全有保障

2025深圳翻译公司推荐十强综合排行榜

发表评论