金融界 2024 年 8 月 25 日消息,天眼查知识产权信息显示,易方信息科技股份有限公司取得一项名为“局部特征增强的语音识别方法、系统、设备及介质“,授权公告号 CN116798410B ,申请日期为 2023 年 7 月。
专利摘要显示,本发明提出了一种局部特征增强的语音识别方法、系统、设备及介质,方法包括:对原始音频进行预处理,获得音频特征 x=(x1,…,xT1);基于嵌入层提取局部特征的可变性滑动窗口模块,构建语音识别网络模型;基于语音识别网络模型对音频特征进行识别处理,得到语音识别结果 Y=(Y1,…,YM)。本发明通过可变性滑动窗口技术与 Transformer 网络相结合,对嵌入层特征之间的交互进行限制,提取有效的特征与网络层融合,提升语音识别模型重点关注对象,改善模型性能。
来源:金融界