(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210573459.5
(22)申请日 2022.05.24
(71)申请人 北京奇艺世纪科技有限公司
地址 100080 北京市海淀区海淀北一 街2号
鸿城拓展大厦10、 1 1层
(72)发明人 宋祺鹏
(74)专利代理 机构 北京柏杉松知识产权代理事
务所(普通 合伙) 11413
专利代理师 项京 丁芸
(51)Int.Cl.
G06V 20/40(2022.01)
G06V 10/25(2022.01)
G06V 10/26(2022.01)
G06V 10/40(2022.01)
G06V 10/44(2022.01)G06V 10/56(2022.01)
G06V 10/74(2022.01)
G06T 7/11(2017.01)
G06T 7/12(2017.01)
G06T 7/13(2017.01)
G06T 7/136(2017.01)
G06T 7/187(2017.01)
(54)发明名称
一种图像识别方法、 装置、 电子设备及存储
介质
(57)摘要
本发明实施例提供了一种图像识别方法、 装
置、 电子设备及存储介质。 包括: 对待识别图片 进
行颜色空间识别及图像定位, 获取第一目标区
域; 对第一目标区域进行自适应阈值分割, 得到
第二目标区域; 对第一目标区域进行边缘检测,
获取第一目标轮廓; 基于第一目标轮廓对目标图
像进行运动估计, 得到第二目标轮廓; 基于第二
目标轮廓对第二目标区域进行分割, 得到待识别
目标图像; 对目标图像进行识别, 得到识别结果。
应用本发明实施例, 基于自适应阈值的类间方差
分割, 具有更强的针对性, 提高类间方差分割的
准确性, 在确定第一目标轮廓后, 对目标图像进
行运动估计, 可以更好地获取运动目标的轮廓,
提高目标图像获取准确性, 提高图像识别的准确
性。
权利要求书4页 说明书19页 附图9页
CN 114913463 A
2022.08.16
CN 114913463 A
1.一种图像识别方法, 其特 征在于, 包括:
获取待识别图片;
对所述待识别图片进行颜色空间识别以及图像定位, 得到第 一目标区域; 其中, 所述第
一目标区域包括待识别目标图像;
对所述第一目标区域进行基于自适应阈值的类间方差分割, 得到第二目标区域;
对所述第一目标区域进行边 缘检测, 获取第一目标轮廓;
基于所述第一目标轮廓, 对所述目标图像进行运动估计, 得到第二目标轮廓;
基于所述第二目标轮廓, 对所述第二目标区域进行图像分割, 得到待识别目标图像;
对所述待识别目标图像进行图像识别, 得到目标图像识别结果。
2.根据权利要求1所述的方法, 其特征在于, 所述对所述待识别图片进行颜色空间识别
以及图像定位, 得到第一目标区域的步骤, 包括:
对所述待识别图片进行颜色空间识别, 得到多个颜色区域;
对所述各颜色区域进行 特征提取, 得到各颜色区域的特 征;
基于所述各颜色区域的特 征, 对所述各颜色区域进行合并, 得到第一目标区域。
3.根据权利要求2所述的方法, 其特征在于, 所述基于所述各颜色区域的特征, 对所述
各颜色区域进行合并, 得到第一目标区域的步骤之前, 还 包括:
对所述待识别图片进行颜色空间识别, 确定各颜色区域中心点;
针对所述各颜色区域中心点, 计算该中心点到其 他颜色区域中心点的距离;
基于所述各颜色区域中心点到其他颜色区域中心点的距离, 确定各颜色区域中心点
中, 最大距离对应的最大中心点, 以及最小距离对应的最小中心点;
基于所述 最大中心点以及所述 最小中心点, 确定目标图像候选区域;
所述基于所述各颜色区域的特征, 对所述各颜色区域进行合并, 得到第一目标区域的
步骤, 包括:
基于所述目标图像候选区域以及所述各颜色区域的特征, 对所述各颜色区域进行合
并, 得到第一目标区域。
4.根据权利要求1所述的方法, 其特征在于, 所述对所述第 一目标区域进行基于自适应
阈值的类间方差分割, 得到第二目标区域的步骤, 包括:
获取所述第一目标区域的灰度特 征;
基于所述第一目标区域的灰度特征, 获取所述第一目标区域中各像素的灰度概率分
布;
基于所述第 一目标区域中各像素的灰度概率分布, 确定所述第 一目标区域各像素灰度
的隶属度函数;
针对所述第一目标区域中的各像素, 基于划分的多个粒度层空间, 计算该像素与其相
邻像素的相似度;
针对所述第 一目标区域中的各像素, 基于所述隶属度函数以及该像素与其相邻 像素的
相似度, 得到该像素属于前 景图像的隶属度;
基于所述各像素属于前景图像的隶属度, 对所述第一目标区域进行类间方差分割, 得
到第二目标区域。
5.根据权利要求1所述的方法, 其特征在于, 所述基于所述第一目标轮廓, 对所述目标权 利 要 求 书 1/4 页
2
CN 114913463 A
2图像进行运动估计, 得到第二目标轮廓的步骤, 包括:
针对所述第一目标轮廓上的各目标像素点, 计算所述目标像素点, 以及第一预设范围
内的第一预设数量个 像素点的第一均方误差和第一 最小SAD值;
确定第一均方误差最小的像素点所在的方向, 作为第一 最小失真方向;
确定在所述第 一预设范围内, 且在所述第 一最小失真方向上的像素点作为第 二搜索起
始点;
计算所述第 二搜索起始点, 以及第 二预设范围内的第 二预设数量个像素点的第 二均方
误差和第二 最小SAD值;
确定第二均方误差最小的像素点所在的方向, 作为第二 最小失真方向;
确定在所述第 二预设范围内, 且在所述第 二最小失真方向上的像素点作为第 三搜索起
始点;
计算所述第 三搜索起始点, 以及第 三预设范围内的第 三预设数量个像素点中的第 三最
小SAD值;
基于所述第一最小SAD值、 第二最小SAD值以及第三最小SAD值, 确定目标最小SAD值对
应的像素点;
基于所述目标最小SAD值对应的像素点的灰度值, 以及所述待识别图片的平均灰度值,
计算所述目标像素点对应的目标 灰度值;
基于所述第一目标轮廓上 各目标像素点的目标 灰度值, 得到第二目标轮廓。
6.根据权利要求1所述的方法, 其特征在于, 所述对所述第 一目标区域进行基于自适应
阈值的类间方差分割, 得到第二目标区域的步骤之前, 还 包括:
对所述第一目标区域中的各像素进行梯度调节, 得到调节后的第一目标区域;
所述对所述第 一目标区域进行基于自适应 阈值的类间方差分割, 得到第 二目标区域的
步骤, 包括:
对所述调节后的第 一目标区域进行基于自适应阈值的类间方差分割, 得到第 二目标区
域。
7.根据权利要求1所述的方法, 其特 征在于, 还 包括:
基于所述目标图像识别结果, 将针对该识别结果预设的关联信息进行展示。
8.一种图像识别装置, 其特 征在于, 包括:
待识别图片获取模块, 用于获取待识别图片;
第一目标区域获取模块, 用于对所述待识别图片进行颜色空间识别以及图像定位, 得
到第一目标区域; 其中, 所述第一目标区域包括待识别目标图像;
第二目标区域获取模块, 用于对所述第 一目标区域进行基于自适应阈值的类间方差分
割, 得到第二目标区域;
第一目标轮廓获取模块, 用于对所述第一目标区域进行边 缘检测, 获取第一目标轮廓;
第二目标轮廓获取模块, 用于基于所述第一目标轮廓, 对所述目标图像进行运动估计,
得到第二目标轮廓;
待识别目标图像获取模块, 用于基于所述第二目标轮廓, 对所述第二目标区域进行图
像分割, 得到待识别目标图像;
图像识别模块, 用于对所述待识别目标图像进行图像识别, 得到目标图像识别结果。权 利 要 求 书 2/4 页
3
CN 114913463 A
3
专利 一种图像识别方法、装置、电子设备及存储介质
文档预览
中文文档
33 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:31:04上传分享