金融界2024年2月3日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“视频生成模型的训练方法、装置、设备及存储介质“,公开号CN117499711A,申请日期为2023年11月。
专利摘要显示,本申请公开了一种视频生成模型的训练方法、装置、设备及存储介质,涉及人工智能技术领域。所述方法包括:获取至少一个训练样本,每个训练样本中包括一个样本视频和样本视频对应的描述文本;通过对样本视频进行加噪,得到样本视频对应的隐空间表征;通过至少一个去噪单元根据描述文本对隐空间表征进行去噪后,解码得到第一预测视频;其中,去噪单元中采用至少两种针对隐空间表征的卷积机制;根据样本视频和第一预测视频的差异,对视频生成模型的参数进行调整,得到训练后的视频生成模型。上述方法提升了视频生成模型根据描述文本所生成的视频的效果。
来源:金融界