人工智能本应成为提升企业生产力的革命性工具,但最新研究揭示了一个令人意外的现实:AI正在制造更多问题而非解决方案。斯坦福大学与BetterUp Lab...
2025-09-24 0
你有没有想过,只靠一张照片,就能拍出一部360度环绕视角的视频,还能像专业导演一样控制镜头怎么动、从哪拍、拍多远?
这不是在做梦,也不是哪家视频特效公司搞的黑科技,是西湖大学 AGI 实验室搞出来的真东西,名字叫——WorldForge。
该模型的厉害之处在于:不给模型“洗脑”,也不需要重训,只靠在推理阶段加点“导演指令”,就能让 AI 拍出你想要的电影级效果。
这几年 AI 视频是越来越猛了,尤其是 OpenAI 的 Sora 一出,整个圈子都炸了。但冷静下来一看,问题也很明显:这些 AI 模型就像有艺术气质的摄影师,画面确实惊艳,但你想让它“听导演的话”?那是不可能的。
你说来个环绕镜头,它偏要给你来个转圈圈,你说从左往右平移,它偏要飘上天,像是在玩游戏时开了自由视角一样。
但西湖大学 AGI 实验室这次给的解法,不光解决了“AI不听话”的问题,还完全不需要重新训练模型。这套框架叫 WorldForge,直译是“世界锻造厂”,听起来就像是魔兽世界里的装备副本。
但它干的事却是真实的,它可以让视频模型在自由发挥的同时,乖乖听指挥,做到“镜头轨迹精准控制 + 画质不崩”。
这是一种“即插即用”的推理时控制方法,你理解成“视频生成外挂”也没错。模型完全不用改,只是在推理时加入一些控制模块,就能让 AI 视频像导演拍的那样走镜头。
项目由宋晨曦博士后主导,研究方向的是3D/4D场景重建与可控生成,指导老师是助理教授张驰,研究团队隶属于西湖大学 AGI 实验室。
他们的目标很简单:让AI成为一个可以理解导演意图的执行者。
WorldForge 之所以能做到这一点,靠的是三个非常实用的模块,你可以理解为“技能树”:
第一个技能叫 IRR,全称是“步内递归修正”。它让AI在每一步推理时先自由预测,然后我们再用已知的真实内容纠正它。
第二个技能是 FLF(流门控潜在融合),它会聪明地只给“运动通道”发指令,不去打扰那些负责画面质量的部分,避免把画面搞花。
第三个技能是 DSG(双路径自校正引导),他可以一边让模型自由发挥,一边让它照着你的轨迹来。等两条路径出来后再对比,把自由发挥那一条的高画质优势“拉”到轨迹执行的这边来,最终兼顾精度和质量。
这三个技能组合起来,AI 就像是一个可以听得懂你话的摄影导演,既能拍得美、又不乱晃。
只要一张普通照片,就能生成一个清晰、稳定、几何一致的360°环绕视频。传统方案的步骤又多又麻烦,但WorldForge 直接一步到位,连中间件都省了。
而且它不光能生成,还能“重拍”已有的视频、直接编辑视频。你想把视频里的人换个衣服?没问题;想去掉背景里的路人甲?也行。
而且这些都不需要训练模型,不需要你在服务器上烧显卡搞微调,直接用现成模型就能干活,落地成本极低。
这就是 WorldForge 的最大优势:免训练、强泛化、低成本、即插即用。它不是那种“论文里跑得飞起,现实中落不了地”的技术,是真的可以直接塞进现有的视频生成模型里用。
对影视、游戏、数字孪生这些行业来说,这相当于直接降低了高质量内容创作的门槛,把原本只有大厂能干的活,变成了中小团队也能玩得起的工具。
它让我们看到,AI可以不只是一个“内容生成器”, WorldForge打开了一条新的道路。
相关文章
人工智能本应成为提升企业生产力的革命性工具,但最新研究揭示了一个令人意外的现实:AI正在制造更多问题而非解决方案。斯坦福大学与BetterUp Lab...
2025-09-24 0
【亿邦原创】9月24日消息,亿邦动力获悉,拼多多将调整售后服务规则,新规将于9月30日正式生效。最重要的变化是,拼多多将进一步压缩商家对于用户售后换货...
2025-09-24 0
你有没有想过,只靠一张照片,就能拍出一部360度环绕视角的视频,还能像专业导演一样控制镜头怎么动、从哪拍、拍多远?这不是在做梦,也不是哪家视频特效公司...
2025-09-24 0
9月24日,在第25届中国国际工业博览会(简称“工博会”)举办期间,美的集团(000333 旗下库卡中国(KUKA)全球首次发布多场景自动化解决方案,...
2025-09-24 0
前言2025年9月22日,立讯精密早盘一字涨停的走势引发市场高度关注,超46亿元的最大封单与4420亿元的最新市值,直观反映出资本对其与Open AI...
2025-09-24 0
前言AI 掉队有多惨?曾垄断全球 90% PC 芯片的英特尔,如今市值仅千亿美元,不及英伟达 4.28 万亿的零头。为求生存,它一年裁员超 2 万人,...
2025-09-24 0
市调机构Counterpoint Research发布了《2025年第二季度越南智能手机市场报告》。数据显示,5G智能手机份额首次达到 50%,出货量...
2025-09-24 1
过去谈“AI有意识”,大多是哲学辩论。但现在,这个话题开始变得真实、甚至危险——因为连深度学习教父、图灵奖得主 Yoshua Bengio 都出手发声...
2025-09-24 1
发表评论