(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211260817.3 (22)申请日 2022.10.14 (71)申请人 深圳力维智联技 术有限公司 地址 518000 广东省深圳市南 山区粤海街 道高新区社区科苑南路3156号深圳湾 创新科技中心 2栋A座901 (72)发明人 刘凯 徐明 李杉杉 丁一臣  郭蓉  (74)专利代理 机构 深圳鼎合诚知识产权代理有 限公司 4 4281 专利代理师 郭燕 彭家恩 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种行人多属性分类方法、 装置、 电子设备 和可读存 储介质 (57)摘要 本说明书公开了一种行人多属性分类方法, 包括: 获取行人图像; 将所述行人图像输入到行 人多属性分类模型, 输出得到行人的N个属性的 特征, N为大于或等于1的整数; 其中, 所述行人多 属性分类模型包括第一CBL模块、 池化模块、 残差 模块os block、 第二CBL模块、 N个先验注意力模 块、 N个第一全局池化模块、 第二全局池化模块、 N 个相加模块和N个全连接层; 该行人多属性分类 方法优化了行 人多属性分类 速度和准确度。 权利要求书2页 说明书9页 附图7页 CN 115546836 A 2022.12.30 CN 115546836 A 1.一种行 人多属性分类方法, 其特 征在于, 包括: 获取行人图像; 将所述行人图像输入到行人多属性分类模型, 输出得到行人的N个属性的特征, N为大 于或等于1的整数; 其中, 所述行人多属性分类模型包括第一CBL模块、 池化模块、 残差模块os  block、 第二 CBL模块、 N个先验注 意力模块、 N个第一全局池化模块、 第二全局池化模块、 N个相加模块和N 个全连接层; 所述第一CBL模块的输入为所述行人图像, 所述第一CBL模块指的是依次执行 卷积、 批归一化处理和激活操作的运算过程的模块; 所述第一CBL模块的输出为所述池化模 块的输入, 所述池化模块用于执行池化操作, 所述池化模块的输出作为所述残差模块os   block的输入; 所述残差模块os  block包括多个执行卷积操作的卷积核, 所述残差模块os   block的输出作为所述第二CBL模块的输入; 所述第二CBL模块指的是依次执行卷积、 批归一 化处理和激活操作的运算过程的模块, 所述第二CBL模块的输出分别作为每个先验注意力 模块的输入, 所述第二CBL模块的输出还作为所述第二全局池化模块的输入; 所述N个先验 注意力模块根据行人的先验知识所设置, 所述行人的先验知识包括所述属性的位置, 所述N 个先验注意力模块与所述N个属性对应, 每个先验注意力模块用于注意其中一个属性; 所述 N个先验注意力模块分别与所述N个第一全局池化模块一一对应, 每个先验注 意力模块的输 出作为对应第一全局池化模块的输入; 所述N个第一全局池化模块分别与所述N个相加模块 一一对应, 每个第一全局池化模块的输出作为对应相加模块的输入; 所述第二全局池化模 块的输出分别作为每个相加模块的输入; 所述相加模块用于将对应第一全局池化模块的输 出与所述第二全局池化模块的输出进 行融合; 所述N个相加模块分别与所述N个全连接层一 一对应, 每个相加模块的输出作为对应全连接层的输入, 每个全连接层用于输出一个所述 属性的特 征。 2.如权利要求1所述的行人多属性分类方法, 其特征在于, 所述N至少大于或等于2; 优 选地, 所述 N等于4。 3.如权利要求2所述的行人多属性分类方法, 其特征在于, 所述N个属性包括头发、 上 衣、 裤子和鞋子 。 4.如权利要求3所述的行人多属性分类方法, 其特征在于, 所述N个先验注意力模块的 输出分别为行人图像中头发所在区域的图像、 上衣所在区域的图像, 裤子所在区域的图像 以及鞋子所在区域的图像。 5.如权利要求3所述的行人多属性分类方法, 其特征在于, 所述属性的位置包括: 头发 所在区域的图像为行人图像上部八分之一的图像, 所述上衣所在区域的图像为行人图像上 半部分的图像, 所述裤子所在区域的图像为行人图像下半部分的图像, 所述鞋子所在区域 的图像为行 人图像下部八 分之一的图像。 6.如权利要求3所述的行人多属性分类方法, 其特征在于, 所述N个属性的特征包括头 发的颜色、 上衣的类型、 裤子的类型和鞋子的颜色。 7.如权利要求1所述的行人多属性分类方法, 所述第一全局池化模块为全局平均池化 模块或全局最大池化模块; 所述第二全局池化模块为全局平均池化模块或全局最大池化模 块。 8.一种行 人多属性分类装置, 其特 征在于, 所述装置包括:权 利 要 求 书 1/2 页 2 CN 115546836 A 2获取模块, 用于获取 行人图像; 输出模块, 用于将所述行人图像输入到行人多属性分类模型, 输出得到行人的N个属性 的特征, N为大于或等于1的整数; 其中, 所述行人多属性分类模型包括第一CBL模块、 池化模块、 残差模块os  block、 第二 CBL模块、 N个先验注 意力模块、 N个第一全局池化模块、 第二全局池化模块、 N个相加模块和N 个全连接层; 所述第一CBL模块的输入为所述行人图像, 所述第一CBL模块指的是依次执行 卷积、 批归一化处理和激活操作的运算过程的模块; 所述第一CBL模块的输出为所述池化模 块的输入, 所述池化模块用于执行池化操作, 所述池化模块的输出作为所述残差模块os   block的输入; 所述残差模块os  block包括多个执行卷积操作的卷积核, 所述残差模块os   block的输出作为所述第二CBL模块的输入; 所述第二CBL模块指的是依次执行卷积、 批归一 化处理和激活操作的运算过程的模块, 所述第二CBL模块的输出分别作为每个先验注意力 模块的输入, 所述第二CBL模块的输出还作为所述第二全局池化模块的输入; 所述N个先验 注意力模块根据行人的先验知识所设置, 所述行人的先验知识包括所述属性的位置, 所述N 个先验注意力模块与所述N个属性对应, 每个先验注意力模块用于注意其中一个属性; 所述 N个先验注意力模块分别与所述N个第一全局池化模块一一对应, 每个先验注 意力模块的输 出作为对应第一全局池化模块的输入; 所述N个第一全局池化模块分别与所述N个相加模块 一一对应, 每个第一全局池化模块的输出作为对应相加模块的输入; 所述第二全局池化模 块的输出分别作为每个相加模块的输入; 所述相加模块用于将对应第一全局池化模块的输 出与所述第二全局池化模块的输出进 行融合; 所述N个相加模块分别与所述N个全连接层一 一对应, 每个相加模块的输出作为对应全连接层的输入, 每个全连接层用于输出一个所述 属性的特 征。 9.一种电子设备, 其特征在于, 包括: 存储器; 处理器; 以及计算机程序; 其中, 所述计算 机程序存储在所述存储器中, 并配置为由所述处理器执行以实现如权利要求 1~8任一种所 述的方法。 10.一种可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行时 实现如权利要求1~8任一项所述方法对应的步骤。权 利 要 求 书 2/2 页 3 CN 115546836 A 3

PDF文档 专利 一种行人多属性分类方法、装置、电子设备和可读存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种行人多属性分类方法、装置、电子设备和可读存储介质 第 1 页 专利 一种行人多属性分类方法、装置、电子设备和可读存储介质 第 2 页 专利 一种行人多属性分类方法、装置、电子设备和可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。