金融界2024年2月10日消息,据国家知识产权局公告,清华大学取得一项名为“一种图像分类模型的数据集扩充方法、训练方法及装置“,授权公告号CN112613575B,申请日期为2020年12月。
专利摘要显示,本申请实施例公开了一种图像分类模型的数据集扩充、训练方法及装置,所述图像分类模型基于卷积神经网络实现,所述数据集扩充方法包括:针对图像分类模型的训练数据集中的至少部分图片样本中的每个图片样本,分别执行如下操作:获取该图片样本对应预设类别的类激活图CAM;采用预设的算法从所述CAM图中获取预设目标所对应的区域,并确定该区域在所述图片样本中的位置坐标;利用所述位置坐标从所述图片样本中得到裁剪后的图片;将该裁剪后的图片标注成与所述图片样本相同的类别后,作为图片样本保存进所述训练数据集。通过本公开的方案,在图像分类模型训练过程中,可以增加有效的训练数据集样本。
来源:金融界