首页 景点排名文章正文

西湖大学放大招!免训练“AI导演”出世,让单图秒变360°环绕世界

景点排名 2025年09月24日 19:47 0 admin

你有没有想过,只靠一张照片,就能拍出一部360度环绕视角的视频,还能像专业导演一样控制镜头怎么动、从哪拍、拍多远?

这不是在做梦,也不是哪家视频特效公司搞的黑科技,是西湖大学 AGI 实验室搞出来的真东西,名字叫——WorldForge。

该模型的厉害之处在于:不给模型“洗脑”,也不需要重训,只靠在推理阶段加点“导演指令”,就能让 AI 拍出你想要的电影级效果。

西湖大学放大招!免训练“AI导演”出世,让单图秒变360°环绕世界

这几年 AI 视频是越来越猛了,尤其是 OpenAI 的 Sora 一出,整个圈子都炸了。但冷静下来一看,问题也很明显:这些 AI 模型就像有艺术气质的摄影师,画面确实惊艳,但你想让它“听导演的话”?那是不可能的。

你说来个环绕镜头,它偏要给你来个转圈圈,你说从左往右平移,它偏要飘上天,像是在玩游戏时开了自由视角一样。

但西湖大学 AGI 实验室这次给的解法,不光解决了“AI不听话”的问题,还完全不需要重新训练模型。这套框架叫 WorldForge,直译是“世界锻造厂”,听起来就像是魔兽世界里的装备副本。

但它干的事却是真实的,它可以让视频模型在自由发挥的同时,乖乖听指挥,做到“镜头轨迹精准控制 + 画质不崩”。

这是一种“即插即用”的推理时控制方法,你理解成“视频生成外挂”也没错。模型完全不用改,只是在推理时加入一些控制模块,就能让 AI 视频像导演拍的那样走镜头。

西湖大学放大招!免训练“AI导演”出世,让单图秒变360°环绕世界

项目由宋晨曦博士后主导,研究方向的是3D/4D场景重建与可控生成,指导老师是助理教授张驰,研究团队隶属于西湖大学 AGI 实验室。

他们的目标很简单:让AI成为一个可以理解导演意图的执行者。

WorldForge 之所以能做到这一点,靠的是三个非常实用的模块,你可以理解为“技能树”:

第一个技能叫 IRR,全称是“步内递归修正”。它让AI在每一步推理时先自由预测,然后我们再用已知的真实内容纠正它。

第二个技能是 FLF(流门控潜在融合),它会聪明地只给“运动通道”发指令,不去打扰那些负责画面质量的部分,避免把画面搞花。

第三个技能是 DSG(双路径自校正引导),他可以一边让模型自由发挥,一边让它照着你的轨迹来。等两条路径出来后再对比,把自由发挥那一条的高画质优势“拉”到轨迹执行的这边来,最终兼顾精度和质量。

这三个技能组合起来,AI 就像是一个可以听得懂你话的摄影导演,既能拍得美、又不乱晃。

西湖大学放大招!免训练“AI导演”出世,让单图秒变360°环绕世界

只要一张普通照片,就能生成一个清晰、稳定、几何一致的360°环绕视频。传统方案的步骤又多又麻烦,但WorldForge 直接一步到位,连中间件都省了。

而且它不光能生成,还能“重拍”已有的视频、直接编辑视频。你想把视频里的人换个衣服?没问题;想去掉背景里的路人甲?也行。

而且这些都不需要训练模型,不需要你在服务器上烧显卡搞微调,直接用现成模型就能干活,落地成本极低。

这就是 WorldForge 的最大优势:免训练、强泛化、低成本、即插即用。它不是那种“论文里跑得飞起,现实中落不了地”的技术,是真的可以直接塞进现有的视频生成模型里用。

西湖大学放大招!免训练“AI导演”出世,让单图秒变360°环绕世界

对影视、游戏、数字孪生这些行业来说,这相当于直接降低了高质量内容创作的门槛,把原本只有大厂能干的活,变成了中小团队也能玩得起的工具。

它让我们看到,AI可以不只是一个“内容生成器”, WorldForge打开了一条新的道路。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap