百度自研视频模型MuseSteamer:中文音视频一体化,一图生成电影级有声视频
创始人
2025-07-03 08:21:36

百度商业研发团队近期宣布了一项重要创新,于7月2日正式推出了名为“MuseSteamer”的自研视频生成模型及其配套的创作平台“绘想”。这一突破性技术被标榜为全球首个能够实现中文音视频一体化生成的视频模型,标志着视频创作流程的一次重大革新。

传统AIGC视频制作往往遵循“先画面后配音”的模式,而MuseSteamer则打破了这一常规,实现了画面、音效与人声台词的协同创作。这一技术的问世,无疑为视频创作者提供了更为便捷和高效的创作工具。

据百度商业研发团队介绍,MuseSteamer在技术上实现了多项突破。它能够根据一张图片,快速生成长达10秒、分辨率为1080p的电影级画质视频。视频中的人物微表情和运镜效果均达到了专业影视水准,这一能力得益于亿级中文多模态数据的清洗、精细化视频结构化描述语言,以及多目标强化学习等技术的优化。

为了满足不同创作者的需求,MuseSteamer模型家族推出了多个版本,包括Turbo、Lite、Pro及全系列有声版。这些版本覆盖了从普通创作者到专业影视机构的广泛需求,为各类用户提供了定制化的解决方案。目前,Turbo版已在绘想平台上开启限时免费公测,而其余版本则计划在8月陆续开放。

MuseSteamer的推出,不仅为视频创作者提供了更为强大的技术支持,也预示着视频创作行业将迎来一次新的变革。随着技术的不断进步和应用场景的不断拓展,MuseSteamer有望成为未来视频创作领域的重要推手。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

基地启用 机器人有了国家级职业... 5月16日,国家人工智能应用中试基地(具身智能)在浙江杭州挂牌启用,机器人有了国家级职业技能训练场。...
CERN的奠基之路和日本团队的... 缪子作为第二代轻子,是1936年美国物理学家卡尔·安德森(Carl D. Anderson,因发现正...
“爱达·花城号”开启试航 为何... 5月16日,第二艘国产大型邮轮“爱达·花城号”从中船集团上海外高桥造船5号码头启航,开始为期12天的...
大疆、影石的“师父”,撑不下去... 一则出售消息,让沉寂已久的 GoPro 股价突然暴涨。 北京时间5月12日一早,这家美国运动相机厂商...
全面升级!广州天河率先落地全国... 加快构建万兆光网区域样板! 全国首个万兆AI商圈 落地广州天河 5月16日,“万兆AI惠商,联通美好...
新华社记者探访机器人国家级“职... 16日,国家人工智能应用中试基地(具身智能)在浙江杭州挂牌启用,机器人有了国家级“职业技能训练场”。...
第十二届知乎新知青年大会:见证... 在AI重塑内容生态、人人皆为创作者的时代,怎样获取更具价值的新知?5月16日,围绕这一议题,第十二届...
众多电池新科技亮相深圳国际电池... 深圳5月16日电 (记者 王坚)以“链动全球·赋能绿色·驱动未来”为主题的第十八届深圳国际电池技术交...
面对称可回收液体火箭完成低空飞... 5月14日下午,由中山大学航空航天学院吴志刚教授团队研制的“逸仙-3号”面对称可重复使用火箭,在广东...
宁波银行业绩说明会,管理层最新... 【导读】宁波银行业绩说明会来了!管理层回应净息差、中收表现及董事会换届等问题 中国基金报记者 马嘉昕...