可通过文字生成连贯动作视频,谷歌推出 AI 扩散模型 Lumiere
IT之家
2024-01-29 11:19:20

原标题:可通过文字生成连贯动作视频,谷歌推出 AI 扩散模型 Lumiere

IT之家 1 月 29 日消息,谷歌研究院日前推出了一款名为 Lumiere 的“文生视频”扩散模型,主打采用自家最新开发的“Space-Time U-Net”基础架构,号称能够一次生成“完整、真实、动作连贯”的视频。

▲ 图源 谷歌官方新闻稿(下同)

谷歌表示,业界绝大多数“文生视频”模型无法生成时间长、质量佳、动作连贯逼真的内容,这是因为此类模型通常“分段生成视频”,首先产生几张关键帧,接着用“时间超级分辨率(Temporal Super-Resolution)”技术,生成关键帧之间的视频文件,这种方法虽然能够节省 RAM,但难以生成“连贯逼真”的视频

谷歌提到,他们的新模型 Lumiere 相对于业界模型最大的不同是采用了全新“Space-Time U-Net”基础架构,该架构能够在空间和时间上同时“降采样(Downsample)”信号,从而在“更紧凑的时空中进行更多运算”,令 Lumiere 生成持续时间更长、动作更连贯的视频。

IT之家注意到,Lumiere 一次可以生成 80 帧视频(16FPS 下 5 秒视频 / 24FPS 下约 3.34 秒视频),虽然这一数据看起来很短,不过研究人员提到,5 秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。

除了应用“Space-Time U-Net”基础架构外,谷歌还介绍了 Lumiere 的基础特性,该 AI 建立在一个经过预先训练的“文生图”模型基础上,研究人员首先让基础模型生成视频分帧的基本像素草稿,接着通过空间超分辨率(SSR)模型,逐步提升分帧分辨率及细节,并利用“Multidiffusion”通用生成框架提升模型稳定性,从而保证了最终输出的视频一致性和连续性。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

蜻蜓订购app贵金属交易输的钱... 蜻蜓订购app贵金属交易输的钱可以要回亏的钱!输的钱可以追回!已成功退款流程公开!蜻蜓订购app亏损...
华擎顶级GPU!RX 9070... 快科技12月21日消息,近日,华擎推出了其RX 9000系列中的顶级旗舰产品RX 9070 XT T...
量子淘金APP输了了20万元可... 量子淘金APP输了了20万元可以要回亏的钱!有办法追回来!已成功退款流程公开!量子淘金app亏损是能...
鹏程荟直播间认购新股山东谊友商... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"在投资市场的灰...
领航商学院私董会周聪直播间联合... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"近期,一种“买...
磊石成山袁磊直播间上课推荐迎宾... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"如果您近期接触...
股票群大峰老师刘宇峰战略认购抽... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。在股票投资领域,“...
华兴健康商学院股票群刘宇峰老师... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"在投资市场的灰...
广东酱王企业咨询有限公司买酱王... “本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。"“买酒就能拿股...
刺梨工坊(贵州)科技有限公司“... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。在股票投资领域,“...