金融界2024年2月20日消息,据国家知识产权局公告,上海哔哩哔哩科技有限公司申请一项名为“用于识别音频片段的方法、装置及计算机可读介质“,公开号CN117573918A,申请日期为2023年10月。
专利摘要显示,本申请提供了一种用于识别音频片段的方法、装置及计算机可读介质。根据本申请的方法包括:获取用户请求查询的目标音频片段的旋律特征信息;基于所述目标音频片段的旋律特征信息和已存储所有在库音频的旋律特征信息,获取所述目标音频片段与各个在库音频之间的相似度信息;基于所述目标音频片段与各个在库音频之间的相似度信息,选择一个或多个在库音频作为候选音频;通过将所述目标音频片段分别与各个候选音频进行对齐匹配处理,得到相应的匹配结果,所述对齐匹配处理用于在候选音频中查找所述目标音频片段相匹配的时间片段。本申请通过对两首歌曲的相同片段的时序对齐实现了对诸如翻唱、乐器伴奏以及增加噪声等原曲的变形版本进行识别。
来源:金融界