(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210965775.7
(22)申请日 2022.08.12
(71)申请人 中国工商银行股份有限公司
地址 100140 北京市西城区复兴门内大街
55号
(72)发明人 李思尚 董俊杰
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 童磊 任默闻
(51)Int.Cl.
G06V 40/10(2022.01)
G06V 10/40(2022.01)
G06V 10/74(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种行人识别及业 务推送方法、 装置及设备
(57)摘要
本说明书实施例提供一种行人识别及业务
推送方法、 装置及设备, 可应用于人工智能技术
领域。 所述方法包括: 获取目标对象图像; 基于所
述目标对象图像 分别输出第一特征图、 第二特征
图和第三特征图; 所述第二特征图的图像信息多
于所述第一特征图; 所述第三特征图的图像信息
多于所述第二特征图; 综合所述第一特征图、 第
二特征图和第三特征图获取目标特征向量; 基于
所述目标特征向量与至少一个候选行人特征向
量之间的相似度, 确定所述目标对象图像对应的
行人身份。 上述方法提高了特征图中的信息量,
避免在进行行人识别时由于特征区分度不高影
响识别结果准确性, 从而准确有效地对图像中的
行人身份进行了识别。
权利要求书3页 说明书11页 附图4页
CN 115240228 A
2022.10.25
CN 115240228 A
1.一种行 人识别方法, 其特 征在于, 包括:
获取目标对象图像;
基于所述目标对象图像分别输出第一特征图、 第二特征图和第三特征图; 所述第二特
征图的图像信息多于所述第一特 征图; 所述第三特 征图的图像信息多于所述第二特 征图;
综合所述第一特 征图、 第二特 征图和第三特 征图获取目标 特征向量;
基于所述目标特征向量与至少一个候选行人特征向量之间的相似度, 确定所述目标对
象图像对应的行 人身份。
2.如权利要求1所述的方法, 其特征在于, 所述第 一特征图包括基于第 一神经网络模型
所确定的特 征图; 所述第一神经网络模型中包括至少两个卷积模块;
所述第二特征图包括基于第 二神经网络模型所确定的特征图; 所述第 二神经网络模型
由在第一神经网络模型中去除一个卷积模块的下采样层后获取; 所述下采样层用于减少图
像中的参数 数量;
所述第三特征图包括基于第 三神经网络模型所确定的特征图; 所述第 三神经网络模型
有在第一神经网络模型中去除两个卷积模块的下采样层后获取。
3.如权利要求2所述的方法, 其特征在于, 所述第一神经网络模型中包括五个卷积模
块;
所述第二神经网络模型通过去除第一神经网络模型中第五个卷积模块的下采样层后
获取;
所述第三神经网络模型通过去除第一神经网络模型中第四个和第五个卷积模块的下
采样层后获取。
4.如权利要求2所述的方法, 其特征在于, 所述第一神经网络模型、 第二神经网络模型
和第三神经网络模型通过以下 方式获取:
构建第一初始模型; 所述第一初始模型中包括至少两个卷积模块;
在第一初始模型中去除一个卷积模块的下采样层得到第 二初始模型, 在第 一初始模型
中去除两个卷积模块的下采样层得到第三初始模型;
分别利用所述第 一初始模型、 第 二初始模型和第 三初始模型输出对应于初始样本图像
的第一样本特 征图、 第二样本特 征图和第三样本特 征图;
将所述第一样本特征图、 第二样本特征图和第三样本特征图进行切割和水平拼接, 分
别得到第一样本特征向量、 第二样本特征向量和第三样本特征向量; 所述第二样本特征向
量的维数高于第一样本特 征向量, 所述第三样本特 征向量的维数高于第二样本特 征向量;
利用所述第一样本特 征向量对第一初始模型进行训练得到第一神经网络模型;
利用所述第二样本特 征向量对第二初始模型进行训练得到第二神经网络模型;
利用所述第三样本特 征向量对第三初始模型进行训练得到第三神经网络模型。
5.如权利要求4所述的方法, 其特征在于, 基于分类损 失函数和/或三元组度量损 失函
数对所述第一初始模型、 第二初始模型和第三初始模型进行训练。
6.如权利要求4所述的方法, 其特征在于, 在将所述第一样本特征图、 第二样本特征图
和第三样本特 征图进行切割和水平拼接之前, 还 包括:
对所述第一样本特征图、 第 二样本特征图和第 三样本特征图分别进行池化处理和降维
处理。权 利 要 求 书 1/3 页
2
CN 115240228 A
27.如权利要求1所述的方法, 其特征在于, 所述综合所述第一特征图、 第二特征图和第
三特征图获取目标 特征向量之前, 还 包括:
对所述第一特 征图、 第二特 征图和第三特 征图分别进行池化处 理和降维处 理。
8.如权利要求1所述的方法, 其特征在于, 所述基于所述目标特征向量与至少一个候选
行人特征向量之间的相似度, 确定所述目标对象图像对应的行 人身份, 包括:
计算所述目标 特征向量与候选行 人特征向量之间的欧式距离;
在计算得到的欧式距离小于相似度判断阈值的情况下, 确定所述候选行人特征向量所
对应的行 人身份为所述目标对象图像对应的行 人身份。
9.一种基于行 人识别的业 务推送方法, 其特 征在于, 包括:
获取目标对象图像;
基于所述目标对象图像分别输出第一特征图、 第二特征图和第三特征图; 所述第二特
征图的图像信息多于所述第一特 征图; 所述第三特 征图的图像信息多于所述第二特 征图;
综合所述第一特 征图、 第二特 征图和第三特 征图获取目标 特征向量;
基于所述目标特征向量与至少一个候选行人特征向量之间的相似度, 确定所述目标对
象图像对应目标对象的行 人身份;
获取与所述行 人身份对应的业 务类型;
将所述业务类型的业 务推送至所述目标对象。
10.如权利要求9所述的方法, 其特征在于, 所述获取与 所述行人身份对应的业务类型,
包括:
查找所述行 人身份对应的目标对象的出现频次;
根据所述出现频次确定对应的业 务类型。
11.一种行 人识别装置, 其特 征在于, 包括:
目标对象图像获取模块, 用于获取目标对象图像;
特征图输出模块, 用于基于所述目标对象图像分别输出第一特征图、 第二特征图和第
三特征图; 所述第二特征图的图像信息多于所述第一特征图; 所述第三特征图的图像信息
多于所述第二特 征图;
目标特征向量获取模块, 用于综合所述第一特征图、 第二特征图和第三特征图获取目
标特征向量;
行人身份确定模块, 用于基于所述目标特征向量与至少一个候选行人特征向量之间的
相似度, 确定所述目标对象图像对应的行 人身份。
12.一种基于行 人识别的业 务推送装置, 其特 征在于, 包括:
目标对象图像获取模块, 用于获取目标对象图像;
特征图输出模块, 用于基于所述目标对象图像分别输出第一特征图、 第二特征图和第
三特征图; 所述第二特征图的图像信息多于所述第一特征图; 所述第三特征图的图像信息
多于所述第二特 征图;
目标特征向量获取模块, 用于综合所述第一特征图、 第二特征图和第三特征图获取目
标特征向量;
行人身份确定模块, 用于基于所述目标特征向量与至少一个候选行人特征向量之间的
相似度, 确定所述目标对象图像对应目标对象的行 人身份;权 利 要 求 书 2/3 页
3
CN 115240228 A
3
专利 一种行人识别及业务推送方法、装置及设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:31:41上传分享