金融界2024年3月15日消息,据国家知识产权局公告,荣耀终端有限公司申请一项名为“一种神经网络模型处理、推理方法及相关设备“,公开号CN117709399A,申请日期为2022年8月。
专利摘要显示,本申请提供了一种神经网络模型处理、推理方法及相关设备。根据该神经网络模型处理方法,电子设备在对原始模型进行结构化剪枝之前,可以首先对待结构化剪枝的卷积层进行若干次非结构化剪枝,直到原始模型中进行非结构化剪枝后的卷积层的稀疏度达到目标稀疏度,再对非结构化剪枝后的模型进行结构化剪枝。电子设备可以重复执行该非结构化剪枝和结构化剪枝过程,直到原始模型中进行结构化剪枝后的卷积层的已修剪的卷积核数量达到预先设置的卷积核数量。通过上述方法可以得到简化后的模型,使用该模型时的网络推理速度得以提升,并且由于非结构化剪枝和结构化剪枝均分为若干次进行,避免了一次完成剪枝造成的模型效果回退,保证了模型效果不受影响。
来源:金融界