金融界2024年3月11日消息,据国家知识产权局公告,中国农业银行股份有限公司申请一项名为“一种模型的训练方法、图像描述方法、装置、介质及设备“,公开号CN117671424A,申请日期为2023年12月。
专利摘要显示,本发明公开了一种模型的训练方法、图像描述方法、装置、介质及设备。其中方法包括:获取样本图像和样本图像的标签描述文本,提取所述样本图像的图像特征,提取标签描述文本的文本特征;将多个样本图像的标签描述文本进行位置嵌入得到图像特征数据,将多个所述标签描述文本的文本特征进行位置嵌入得到文本特征数据;获取初始图像描述模型,所述初始图像描述模型包括变分编码器和生成器;基于所述图像特征数据和所述文本特征数据对所述初始图像描述模型进行训练,得到训练好的目标图像描述模型。初始图像描述模型训练得到的目标图像描述模型可实现图像到文本的一对多映射,将给定的图像作为条件采样任意个数的隐空间向量实现得到任意数据描述文本。
来源:金融界