standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211040568.7 (22)申请日 2022.08.29 (71)申请人 北京达佳互联信息技 术有限公司 地址 100085 北京市海淀区上地西路6号1 幢1层101D1-7 (72)发明人 申世伟 李家宏 (74)专利代理 机构 北京铭硕知识产权代理有限 公司 11286 专利代理师 曾世骁 王兆赓 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01) G06F 16/583(2019.01) G06N 3/08(2006.01) (54)发明名称 图像识别方法、 装置、 电子设备和计算机可 读存储介质 (57)摘要 本公开关于一种图像识别方法、 装置、 电子 设备和计算机可读存储介质, 图像识别方法包 括: 获取待识别图像; 利用图像识别模型的特征 提取网络, 提取待识别图像的图像特征向量, 将 图像特征向量按照预设比例分割为第一特征向 量和第二特征向量; 将第一特征向量输入图像识 别模型的分类网络, 得到候选预估类别及其预估 概率; 在预估概率小于概率阈值的情况下, 获取 多个预先配置的携带有类别标签的检索特征向 量; 根据第二特征向量和检索特征向量, 确定预 估类别。 本公开能够较好地结合图像 分类的基于 大数据统计的归纳推理能力和图像检索 的局部 泛化能力, 提升图像识别模型整体识别效果。 权利要求书2页 说明书11页 附图5页 CN 115331062 A 2022.11.11 CN 115331062 A 1.一种图像识别方法, 其特 征在于, 所述图像识别方法包括: 获取待识别图像; 利用图像识别模型的特征提取网络, 提取所述待识别图像的图像特征向量, 将所述图 像特征向量按照预设比例分割为第一特征向量和第二特征向量, 其中, 所述第一特征向量 用于图像分类, 所述第二特 征向量用于图像 检索; 将所述第一特征向量输入所述图像识别模型的分类网络, 得到候选预估类别及其预估 概率; 在所述预估概率小于概率阈值的情况下, 获取多个预先配置的携带有类别标签的检索 特征向量; 根据所述第二特 征向量和所述检索特 征向量, 确定所述预估类别。 2.如权利要求1所述的图像识别方法, 其特征在于, 所述携带有类别标签的检索特征向 量通过以下步骤得到: 获取携带有所述类别标签的第一样本图像; 利用所述特征提取网络, 提取所述第一样本 图像的所述图像特征向量, 将所述图像特 征向量按照所述预设比例分割为所述第一特 征向量和所述第二特 征向量; 将所述第一样本图像的所述图像特征向量中的所述第 一特征向量输入所述分类网络, 得到所述第一样本图像的所述 候选预估类别及其所述预估概 率; 针对所述第一样本 图像, 在所述预估概率小于所述概率阈值、 且所述候选预估类别与 所述第一样本图像的所述类别标签相符的情况下, 将所述第一样本图像的所述图像特征向 量中的所述第二特征向量作为所述检索特征向量, 并与所述第一样本图像的所述类别标签 相关联, 得到所述携带有类别标签的检索特 征向量。 3.如权利要求1所述的图像识别方法, 其特征在于, 所述根据所述第 二特征向量和所述 检索特征向量, 确定所述预估类别, 包括: 计算所述第二特 征向量与各个所述检索特 征向量的相似度; 根据各个所述相似度, 确定所述预估类别。 4.如权利要求3所述的图像识别方法, 其特征在于, 所述根据各个所述相似度, 确定所 述预估类别, 包括: 确定各个所述相似度中的最大值, 作为 候选相似度; 在所述候选相似度大于或等于相似度阈值的情况下, 将所述候选相似度对应的所述类 别标签的类别, 作为所述预估类别。 5.如权利要求1到4中的任一权利要求所述的图像识别方法, 其特征在于, 所述图像识 别模型通过以下步骤训练得到: 获取第二样本图像; 对所述第二样本图像进行至少两次不同的数据增广处理, 得到所述第 二样本图像对应 的至少两个增广图像; 利用待训练的图像识别模型, 提取每个所述增广图像的所述图像特征向量, 将所述图 像特征向量按照所述预设比例分割为所述第一特征向量和所述第二特征向量, 并获得每个 所述增广图像的所述 候选预估类别; 根据每个所述增广图像的所述候选预估类别和所述第 二样本图像的类别标签, 确定第权 利 要 求 书 1/2 页 2 CN 115331062 A 2一损失值; 对比所述至少两个增广图像的所述图像特征向量中的所述第 二特征向量, 确定第 二损 失值; 根据所述第一损失值和所述第二损失值, 确定总损失值; 基于所述总损失值, 调整所述待训练 的图像识别模型的特征提取网络和分类网络的参 数, 得到所述图像识别模型。 6.如权利要求5所述的图像识别方法, 其特征在于, 所述根据每个所述增广图像的所述 候选预估类别和所述第二样本图像的类别标签, 确定第一损失值, 包括: 在所述第二样本图像未携带所述类别标签的情况下, 将预设损失值作为所述第 一损失 值。 7.如权利要求1到4中的任一权利要求所述的图像识别方法, 其特征在于, 在所述将所 述第一特征向量输入所述图像识别模型的分类网络, 得到候选预估类别及其预估概率之 后, 所述图像识别方法还 包括: 在所述预估概率大于或等于所述概率阈值的情况下, 将所述候选预估类别作为预估类 别。 8.一种图像识别装置, 其特 征在于, 所述图像识别装置包括: 获取单元, 被配置为执 行获取待识别图像; 提取单元, 被配置为执行利用图像识别模型的特征提取网络, 提取所述待识别图像的 图像特征向量, 将所述图像特征向量按照预设比例分割为第一特征向量和第二特征向量, 其中, 所述第一特 征向量用于图像分类, 所述第二特 征向量用于图像 检索; 分类单元, 被配置为执行将所述第一特征向量输入所述图像识别模型的分类网络, 得 到候选预估类别及其预估概 率; 所述获取单元还被配置为执行在所述预估概率小于概率阈值的情况下, 获取多个预先 配置的携带有类别标签的检索特 征向量; 确定单元, 被配置为执行根据所述第二特征向量和所述检索特征向量, 确定所述预估 类别。 9.一种电子设备, 其特 征在于, 包括: 至少一个处 理器; 至少一个存 储计算机可 执行指令的存 储器, 其中, 所述计算机可执行指令在被所述至少一个处理器运行时, 促使所述至少一个处 理器执行如权利要求1到7中的任一权利要求所述的图像识别方法。 10.一种计算机可读存储介质, 其特征在于, 当所述计算机可读存储介质中的指令被至 少一个处理器运行时, 促使所述至少一个处理器执行如权利要求 1到7中的任一权利要求所 述的图像识别方法。权 利 要 求 书 2/2 页 3 CN 115331062 A 3
专利 图像识别方法、装置、电子设备和计算机可读存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:31:27
上传分享
举报
下载
原文档
(832.6 KB)
分享
友情链接
GA 1800.4-2021 电力系统治安反恐防范要求 第4部分:风力发电企业.pdf
JR-T 0137-2017 银行经营管理指标数据元.pdf
GB-T 12538-2023 道路车辆 质心位置的测定.pdf
GM-T 0040-2015 射频识别标签模块密码检测准则.pdf
T-CIITA 117—2021 信息安全技术 零信任参考架构.pdf
奇安信 2018勒索病毒白皮书政企篇.pdf
DB41-T 2214-2022 城市书房建设与服务规范 河南省.pdf
GB-T 37721-2019信息技术大数据分析系统功能要求.pdf
tc260 大数据安全标准化白皮书 2018版.pdf
T-CIECCPA 009—2023 电动汽车退役动力蓄电池回收利用拆解 技术规范.pdf
DB65-T 4529—2022 三相异步电动机节能监测 新疆维吾尔自治区.pdf
GM-T 0021-2012 动态口令密码应用技术规范.pdf
专利 一种具有温控功能的配电箱.PDF
GB-T 37378-2019 交通运输 信息安全规范.pdf
GB-T 36261-2018 建筑用节能玻璃光学及热工参数现场测量技术条件与计算方法.pdf
GB-Z 31478-2015 航空电子过程管理 电子元器件管理计划的制定.pdf
GB-T 11263-2017 热轧H型钢和剖分T型钢.pdf
GB-T 12688.5-2019 工业用苯乙烯试验方法 第5部分:总醛含量的测定 滴定法.pdf
6-28-01-14 变配电运行值班员.pdf
T-ZSA 164—2023 人工智能应用创新 智能云基础设施技术规范.pdf
1
/
19
评价文档
赞助2.5元 点击下载(832.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。