谷歌发布新AI视频生成模型Veo3 支持同时生成画面和背景音
创始人
2025-05-22 04:41:37

【太平洋科技快讯】5月21日,在 2025 年的 I/O 开发者大会上,谷歌发布了其最新一代视频生成模型 Veo3,该模型的核心功能在于其强大的音效和对话生成能力。它不仅能够生成逼真的视频画面,还能根据场景添加相应的背景音效,例如鸟鸣声、街头交通噪音、人物对话等,使得生成的视频更加生动、真实,极具沉浸感。

此外,Veo3 在物理模拟和口型同步方面也表现出色。它能精准地模拟真实世界的动态变化,并确保生成的人物对话与其唇形变化完美匹配,进一步提升视听体验的真实度。

据悉,Veo3 采用了先进的自然语言处理(NLP)和语音合成技术,实现了视频和音频的同步生成。这一突破性技术极大地提高了创作效率,用户只需提供文本或图像提示,即可快速生成完整的音视频内容。

Veo3 的应用场景十分广泛。在影视制作领域,它可以用于快速生成预告片、场景片段,甚至可以辅助创作完整的影视作品。在虚拟现实领域,Veo3 可用于创建虚拟角色、互动场景或沉浸式体验。此外,Veo3 的多人和多人唇形同步功能,为数字人技术的发展带来了新的可能性,有助于推动虚拟人类与真实人类之间的交互。

目前,Veo3 仅对美国地区的 Gemini Ultra 用户和 Vertex AI 的企业用户开放,并且部分功能(如 Flow)目前仅支持英文提示词,这限制了非英语用户的体验。而随着技术的进一步发展,Veo3 有望扩展到更多地区和语言,为全球用户提供更广泛的支持。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

OpenAI悄悄出手!买下AI... 【本报讯】 近日,有知情人士透露,人工智能巨头OpenAI已收购专注于AI声音克隆技术的初创公司We...
2026海南(三亚)人工智能科... 央广网三亚5月15日消息(记者 蔡文娟)为深化国家“人工智能+”战略落实,服务海南自由贸易港打造全球...
“把修图工作室装进平板”,美图... 5月15日,第二十七届中国国际照相机械影像器材与技术博览会(China PE)在北京展览馆开幕。本届...
神舟二十三号计划近日择机实施发... 中国日报5月16日电 神舟二十三号计划近日择机实施发射,船箭组合体2026年5月16日转运至发射区。...
索尼回应Xperia 1 VI... IT之家 5 月 16 日消息,科技媒体 Android Authority 今天(5 月 16 日...
良信电器申请混合式固态开关装置... 国家知识产权局信息显示,良信电器(海盐)有限公司、上海良信电器股份有限公司申请一项名为“一种混合式固...
医疗小程序开发服务商梳理 场景... 导语:医疗行业数字化转型加速,医疗小程序开发成为医院、药企、健康管理机构等提升服务效率的核心工具。基...
2026年陕西省科学实验展演活... 为广泛普及科学知识、阐释科学原理、传播科学故事、弘扬科学家精神,近日,省科技厅、省教育厅、省科协将联...
涨的是车价,要的是老命 来源:市场资讯 (来源:虎嗅APP) 出品|虎嗅汽车组 作者|邢书博杨杰 题图|视觉中国 2026...
浅谈微博社会榜内容传播 日常浏览微博不难发现,平台内有着各类细分内容榜单,其中社会榜区别于娱乐资讯、数码好物等内容榜单,主要...