standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211040568.7 (22)申请日 2022.08.29 (71)申请人 北京达佳互联信息技 术有限公司 地址 100085 北京市海淀区上地西路6号1 幢1层101D1-7 (72)发明人 申世伟 李家宏  (74)专利代理 机构 北京铭硕知识产权代理有限 公司 11286 专利代理师 曾世骁 王兆赓 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01) G06F 16/583(2019.01) G06N 3/08(2006.01) (54)发明名称 图像识别方法、 装置、 电子设备和计算机可 读存储介质 (57)摘要 本公开关于一种图像识别方法、 装置、 电子 设备和计算机可读存储介质, 图像识别方法包 括: 获取待识别图像; 利用图像识别模型的特征 提取网络, 提取待识别图像的图像特征向量, 将 图像特征向量按照预设比例分割为第一特征向 量和第二特征向量; 将第一特征向量输入图像识 别模型的分类网络, 得到候选预估类别及其预估 概率; 在预估概率小于概率阈值的情况下, 获取 多个预先配置的携带有类别标签的检索特征向 量; 根据第二特征向量和检索特征向量, 确定预 估类别。 本公开能够较好地结合图像 分类的基于 大数据统计的归纳推理能力和图像检索 的局部 泛化能力, 提升图像识别模型整体识别效果。 权利要求书2页 说明书11页 附图5页 CN 115331062 A 2022.11.11 CN 115331062 A 1.一种图像识别方法, 其特 征在于, 所述图像识别方法包括: 获取待识别图像; 利用图像识别模型的特征提取网络, 提取所述待识别图像的图像特征向量, 将所述图 像特征向量按照预设比例分割为第一特征向量和第二特征向量, 其中, 所述第一特征向量 用于图像分类, 所述第二特 征向量用于图像 检索; 将所述第一特征向量输入所述图像识别模型的分类网络, 得到候选预估类别及其预估 概率; 在所述预估概率小于概率阈值的情况下, 获取多个预先配置的携带有类别标签的检索 特征向量; 根据所述第二特 征向量和所述检索特 征向量, 确定所述预估类别。 2.如权利要求1所述的图像识别方法, 其特征在于, 所述携带有类别标签的检索特征向 量通过以下步骤得到: 获取携带有所述类别标签的第一样本图像; 利用所述特征提取网络, 提取所述第一样本 图像的所述图像特征向量, 将所述图像特 征向量按照所述预设比例分割为所述第一特 征向量和所述第二特 征向量; 将所述第一样本图像的所述图像特征向量中的所述第 一特征向量输入所述分类网络, 得到所述第一样本图像的所述 候选预估类别及其所述预估概 率; 针对所述第一样本 图像, 在所述预估概率小于所述概率阈值、 且所述候选预估类别与 所述第一样本图像的所述类别标签相符的情况下, 将所述第一样本图像的所述图像特征向 量中的所述第二特征向量作为所述检索特征向量, 并与所述第一样本图像的所述类别标签 相关联, 得到所述携带有类别标签的检索特 征向量。 3.如权利要求1所述的图像识别方法, 其特征在于, 所述根据所述第 二特征向量和所述 检索特征向量, 确定所述预估类别, 包括: 计算所述第二特 征向量与各个所述检索特 征向量的相似度; 根据各个所述相似度, 确定所述预估类别。 4.如权利要求3所述的图像识别方法, 其特征在于, 所述根据各个所述相似度, 确定所 述预估类别, 包括: 确定各个所述相似度中的最大值, 作为 候选相似度; 在所述候选相似度大于或等于相似度阈值的情况下, 将所述候选相似度对应的所述类 别标签的类别, 作为所述预估类别。 5.如权利要求1到4中的任一权利要求所述的图像识别方法, 其特征在于, 所述图像识 别模型通过以下步骤训练得到: 获取第二样本图像; 对所述第二样本图像进行至少两次不同的数据增广处理, 得到所述第 二样本图像对应 的至少两个增广图像; 利用待训练的图像识别模型, 提取每个所述增广图像的所述图像特征向量, 将所述图 像特征向量按照所述预设比例分割为所述第一特征向量和所述第二特征向量, 并获得每个 所述增广图像的所述 候选预估类别; 根据每个所述增广图像的所述候选预估类别和所述第 二样本图像的类别标签, 确定第权 利 要 求 书 1/2 页 2 CN 115331062 A 2一损失值; 对比所述至少两个增广图像的所述图像特征向量中的所述第 二特征向量, 确定第 二损 失值; 根据所述第一损失值和所述第二损失值, 确定总损失值; 基于所述总损失值, 调整所述待训练 的图像识别模型的特征提取网络和分类网络的参 数, 得到所述图像识别模型。 6.如权利要求5所述的图像识别方法, 其特征在于, 所述根据每个所述增广图像的所述 候选预估类别和所述第二样本图像的类别标签, 确定第一损失值, 包括: 在所述第二样本图像未携带所述类别标签的情况下, 将预设损失值作为所述第 一损失 值。 7.如权利要求1到4中的任一权利要求所述的图像识别方法, 其特征在于, 在所述将所 述第一特征向量输入所述图像识别模型的分类网络, 得到候选预估类别及其预估概率之 后, 所述图像识别方法还 包括: 在所述预估概率大于或等于所述概率阈值的情况下, 将所述候选预估类别作为预估类 别。 8.一种图像识别装置, 其特 征在于, 所述图像识别装置包括: 获取单元, 被配置为执 行获取待识别图像; 提取单元, 被配置为执行利用图像识别模型的特征提取网络, 提取所述待识别图像的 图像特征向量, 将所述图像特征向量按照预设比例分割为第一特征向量和第二特征向量, 其中, 所述第一特 征向量用于图像分类, 所述第二特 征向量用于图像 检索; 分类单元, 被配置为执行将所述第一特征向量输入所述图像识别模型的分类网络, 得 到候选预估类别及其预估概 率; 所述获取单元还被配置为执行在所述预估概率小于概率阈值的情况下, 获取多个预先 配置的携带有类别标签的检索特 征向量; 确定单元, 被配置为执行根据所述第二特征向量和所述检索特征向量, 确定所述预估 类别。 9.一种电子设备, 其特 征在于, 包括: 至少一个处 理器; 至少一个存 储计算机可 执行指令的存 储器, 其中, 所述计算机可执行指令在被所述至少一个处理器运行时, 促使所述至少一个处 理器执行如权利要求1到7中的任一权利要求所述的图像识别方法。 10.一种计算机可读存储介质, 其特征在于, 当所述计算机可读存储介质中的指令被至 少一个处理器运行时, 促使所述至少一个处理器执行如权利要求 1到7中的任一权利要求所 述的图像识别方法。权 利 要 求 书 2/2 页 3 CN 115331062 A 3

PDF文档 专利 图像识别方法、装置、电子设备和计算机可读存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像识别方法、装置、电子设备和计算机可读存储介质 第 1 页 专利 图像识别方法、装置、电子设备和计算机可读存储介质 第 2 页 专利 图像识别方法、装置、电子设备和计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:31:27上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。