金融界2024年6月13日消息,天眼查知识产权信息显示,腾讯科技(深圳)有限公司申请一项名为“语音生成的方法、装置、计算机设备和存储介质“,公开号CN202410580421.X,申请日期为2024年5月。
专利摘要显示,本申请涉及一种语音生成的方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:响应于语音生成请求,获取语音生成请求所包含的目标文本以及参考音频;提取目标文本的文本嵌入特征,对文本嵌入特征进行特征编码处理,得到文本隐层特征;基于参考音频,提取参考音频所属目标对象的声学特征,并将声学特征与文本隐层特征进行特征融合处理,得到融合特征;基于文本嵌入特征、文本隐层特征以及融合特征,生成模拟目标对象以目标文本为语音内容所发出的目标语音。采用本方法能够提升语音生成的准确性。
来源:金融界