10月27日,第五届中国(瑞昌)市政疏浚设备博览会暨2025中国国际管网展览会-瑞昌站在“中国疏浚之乡”江西省瑞昌市开幕。本届博览会以“科技赋能,疏通...
2025-10-27 0
10月27日消息,美团LongCat团队今日发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平)。
不同于以往针对单一任务训练的模型,LongCat-Video通过多任务联合训练机制,在同一框架内即可处理零帧、单帧及多帧条件输入。
此外,LongCat-Video重点突破了长视频生成难题,原生支持输出5分钟级别的视频。相比常见模型在长时序生成中易出现的画面漂移、色彩偏移等问题,该模型通过在视频续写任务上的原生预训练,保持了较高的时间一致性与视觉稳定性。
近年来,“世界模型”被业界认为是通往下一代人工智能的核心方向。它能在时空维度上建模物理规律与场景逻辑,使AI具备理解、预测甚至重构现实世界的能力。
在这一背景下,视频生成模型被视为构建“世界模型”的关键路径。通过视频生成任务压缩几何、语义与物理知识,AI可以在数字空间中模拟真实世界的运行过程。
美团LongCat团队表示,LongCat-Video的推出是公司迈向这一目标的关键一步。未来,该模型将与自动驾驶、具身智能等业务相结合,为美团在连接“原子世界”和“比特世界”方面提供技术支撑。
文生视频任务中,LongCat-Video可以根据提示词准确还原不少脑洞大开的画面
据介绍,LongCat-Video可生成720p分辨率、30帧率的高清视频,其突出特点在于能够原生生成长达5分钟的连贯视频内容。模型通过视频续写预训练、块稀疏注意力等机制,旨在解决长视频生成中常见的画面断裂、质量下降等问题,保持时序一致性与运动合理性。
在效率方面,针对高分辨率、高帧率视频生成的计算瓶颈,LongCat-Video通过“二阶段粗到精生成(C2F)+ 块稀疏注意力(BSA)+ 模型蒸馏”三重优化,视频推理速度提升至10.1倍,实现效率与质量的最优平衡。
LongCat-Video视频生成模型视频推理速度提升至10.1倍
在内部评测体系中,美团构建了一套覆盖文本生成视频与图像生成视频两大核心任务的基准,评估维度包括文本对齐、视觉质量、运动质量与总体表现,并在图生视频任务中额外增加了图像一致性指标。
为确保评测的科学性,团队采用人工与自动双轨评估机制,其中人工评价分为绝对打分与相对偏好两种方式,所有样本均由多名标注员独立评分,最终通过加权平均得出结果。
自动评测部分则由内部训练的多模态“判官模型”完成,与人工结果的相关性高达0.92,保证了客观性。
据发布的评测结果显示,LongCat-Video在文生视频任务的四个核心指标中,视觉质量得分几乎与谷歌的Veo3持平,整体质量超越了PixVerse-V5和国内领先的开源模型Wan2.2。
在运动质量方面,LongCat-Video生成的视频动作流畅、镜头移动自然,展现出较强的物理合理性。在文本对齐度上,LongCat-Video表现略差于Veo3。
在图生视频任务中,LongCat-Video画面细节丰富、风格真实,但在图像一致性和动作连贯性上仍有改进空间。技术报告认为,模型在处理高精度参考帧时对细节的保持较为谨慎,这在视觉质量上带来加分,却略微影响了动态平滑度。
LongCat-Video视频生成模型在文生、图生视频基础任务上达到开源SOTA
在公开评测平台VBench 2.0上,LongCat-Video在“常识理解”一项中以70.94%的得分位居所有开源模型第一,总分达到62.11%,仅次于谷歌Veo 3与生数Vidu Q1等商用闭源模型。
作为构建"世界模型"的技术尝试,LongCat-Video未来或可应用于自动驾驶模拟、具身智能等需要长时序建模的场景。该模型的发布标志着美团在视频生成与物理世界模拟领域迈出重要一步。
本文系观察者网独家稿件,未经授权,不得转载。
相关文章
10月27日,第五届中国(瑞昌)市政疏浚设备博览会暨2025中国国际管网展览会-瑞昌站在“中国疏浚之乡”江西省瑞昌市开幕。本届博览会以“科技赋能,疏通...
2025-10-27 0
10月27日消息,美团LongCat团队今日发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最...
2025-10-27 0
10月22日下午,CNCC 2025“视觉智能邂逅多模态:从感知到理解”论坛在哈尔滨华旗饭店3层308顺利举行。本次论坛聚焦视觉智能与多模态的协同发展...
2025-10-27 0
10月27日星期一全球首款类脑智算体智者一号亮相工信部:我国将大力推进“5G+工业互联网”512工程升级版实施方案上海打造全国首个脑机接口产业集聚区山...
2025-10-27 0
2019年至2025年,柳州市不动产档案管理中心在全区率先引入RFID智能档案管理技术,解决了长期以来困扰纸质档案管理工作的诸多难题,成功实现了海量纸...
2025-10-27 0
【67岁“彩电大王”长虹借AI实现数智新生,业绩与转型成果显著】67岁的长虹迎来数智新生,它从传统家电制造商转型为技术驱动的产业集团。2024年,四川...
2025-10-27 0
OpenAI 最近真的是忙飞了,一会做电商,一会做社交,现在又推出了浏览器,emmmm…..七姐妹已经树敌了一半。三天一个热搜,海豚君简直跟不过来。在...
2025-10-27 0
新眸原创·作者 | 棠宁过去几个月,支付宝以其意想不到的方式,一次次闯入公众视野。2025年的它,从在江苏卫视跨年演唱会上跟着周深喊“碰一下”支付,到...
2025-10-27 0
发表评论