金融界2024年12月9日消息,国家知识产权局信息显示,广东弓叶科技有限公司申请一项名为“多模态图像检索方法及系统”的专利,公开号 CN 119088998 A,申请日期为2024年8月。
专利摘要显示,本发明公开了一种多模态图像检索方法,并公开了用于实现该方法的多模态图像检索系统,其中多模态图像检索方法包括:训练文本反转网络和文本编码器;将图像库中的每个图像转换为对应的第一文本特征;将待检索图像转换为对应的第二文本特征;将待检索文字转换为对应的第三文本特征;将所述第二文本特征与所述第三文本特征嵌入融合,得到第四文本特征;计算所述第四文本特征和每个所述第一文本特征的相似度,确定所述图像库中与所述待检索图像匹配的匹配图像简要描述技术效果。通过该方法实现了跨模态的图像检索,允许系统更灵活地处理和理解图像与文本之间的关系,一定程度上可以不依赖图像的某些特定特征,使得检索结果更加全面。
来源:金融界