standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210645531.0 (22)申请日 2022.06.09 (71)申请人 湖南大学 地址 410082 湖南省长 沙市岳麓区麓山 南 路1号湖南大 学 (72)发明人 林红利 谭小雨 谢康  (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01) G06V 40/10(2022.01) G06V 40/20(2022.01) (54)发明名称 一种基于投票算法的半监督行人重识别方 法 (57)摘要 本发明涉及计算机视觉技术与行人重识别 领域, 具体涉及一种基于投票算法的半监督行人 重识别方法。 具体表现为提出了一种用于半监督 行人重识别伪标签评估的深层模 型。 主要想法是 使用多个相似或相同的子模型对未标记人物 图 片的伪标签进行集成学习, 并逐渐提高伪标签的 可信度, 以迭代该模型。 本发明通过探索一定层 次的视觉特征和未标记目标的伪标签之间的关 系来增进模型的匹配性、 稳定性, 并为了提升伪 标签的可信度而提出了多投票模型指导的的特 征区分算法和身份挖掘算法。 由于大多数目标对 是跨视图对, 因此开发了跨视图一致的投票机 制, 以实现在不同的摄影机视图之间, 使得伪标 签保持良好状态。 为了实现有效稳定的的投票算 法, 本发明引入了新的损失约束, 以通过熵减的 思想得到稳定的伪标签 。 权利要求书3页 说明书7页 附图1页 CN 114998685 A 2022.09.02 CN 114998685 A 1.一种基于投票算法的半监督行人重识别方法,具体包括有监督部分和无监督部分: 有监督部分使用有标签的训练集和其对应的标签对网络进 行训练, 获得初始的特征提取能 力和正确的优化方向。 然后, 无监督部分包括亲和力矩阵、 亲和力矩阵指导的硬样本挖掘、 投票损失约束、 跨域惩罚四个部分, 可以获得人物数据的软伪标签并逐步改善整个训练过 程中的特 征向量的提取效果。 2.根据权利要求1所述的半监督行人重识别方法有监督部分, 其特征在于: 在这一部分 中网络主要由在ImageNet上预训练的ResNet ‑50网络搭建的主干网络和由一层 全连接层构 成的分类网络组成。 在有监督学习部分, 交叉熵损失函数和三元组损失作为 我们使用的损 失函数, 并由此对网络进行优化。 3.根据权利要求2所述的半监督行人重识别方法有监督部分的三元组损 失函数, 其特 征在于: 在训练 时, 我们采用典型的行人重识别数据构成方式, 随机选择一定人物图片对数 据生成三元组。 因此, 在每次训练批次中, 我们随机选择NP个人物, 每个人物选择NK张图片, 即每个训练批次的样本数量 为N=NP×NK。 所以三元组损失可描述 为: 其中 代表i个人的第j个锚点图片的特 征, 对于 来说 其中D(·,·)表示两个特征向量的欧氏距离。 代表最硬的正(负)样 本与锚点样 本 之间的欧氏距离之差 。 4.根据权利要求2所述的半监督行人重识别方法有监督部分的分类网络, 其特征在于: 分类网络由一层全连接(FC)层构成, 生成一个置信分数向量。 本发明使用fθ标记从特征到 置信分数的映射, 即: 然后使用Softmax函数对网络的输出进行 归一化处理, 得到样本属于第c类的置信分数 然后使用典型的交叉熵损失函数进行损失计算 其中yi是有标签图片对的标签, 是网络预测的标签。 5.根据权利要求2所述的半监督行人重识别方法有监督部分, 使用有监督学习部分的 损失函数 是 6.根据权利要求1所述的半监督行人重识别方法无监督部分中亲和力矩阵, 其特征在 于: 为了在不同的行人图片间建立人物ID的相关性, 引入了亲和力矩阵用来描述标签与标 签之间的关系。 具体来说, 根据投票算法的结果V∈RC×d计算亲和力矩阵A∈RC×C, 其中的ai,j 元素代表第i张人物图片与第j张人物图片之间的关系权 利 要 求 书 1/3 页 2 CN 114998685 A 2σ 代表亲和力矩阵的均值。 亲和力矩阵中的第i行表示第j张图片和其他图片之间的相 似性。 7.根据权利要求6所述的半监督行人重识别方法无监督部分中亲和力矩阵的投票算 法, 其特征在于: 先使用有监督部 分训练的模型对混杂之后的图片进 行特征提取, 即针对每 一幅无标签图片ui得到其特征Φ( θ; ui)。 接着将提取到的特征输入到γ个小型网络 中进行 分类学习。 在本发明中使用缓存区V=[v1,v2,…,vC]存储投票结果, 其中vi是第i个人 的分 类向量。 在第t个网络进行投票时, vi被更新为 其中, Nt代表第t个投票网络, Φ( θ; ui)代表特征提取 网络提取的特征。 本 发明将每个网 络进行加和, 确保他们拥有相同的投票权重, 这样获得更加鲁棒和稳定的投票结果。 值得注 意的是大部分身份都是与正确身份无关的, 在计算亲和力 之前应该将其忽略, 否则将引入 过多的噪声 其中vi,j即最后的伪软标签结果, T为投票网络的数目, σ 是投票结果的平均值。 在得到 了投票结果后, 将要 进行亲和力矩阵的计算。 8.根据权利要求1所述的半监督行人重识别方法无监督部分中亲和力矩阵指导的硬样 本挖掘, 其特征在于: 针对某个锚点样本ui来说, 在亲和力 矩阵中分别选择与其最亲和前五 个样本, 即argsort(ai)[:5], 以及最不亲和的五个样本, 即argsort(ai)[length ‑6:]作为其 正样本up与负样本un。 无监督部分的挖掘 损失可以描述 为 其中D(·,·)表示两个特征向量的欧氏距离。 所以, 可以很好的优化最亲和的 样本、 最不亲和样本与锚点样本之间的特征空间, 使得相同身份的特征向量点比不同身份 的特征向量更加接近。 在此基础上同时注重了分类损失, 将会计算投票结果和分类网络之 间的距离, 以此为依据进一 步优化分类效果 其中C代表分类的数目, vi代表投票网络的投票结果, ci代表分类网络的置信分数, 使用 一维范数衡量他们之间的差异。 9.根据权利要求1所述的半监督行人重识别方法无监督部分中投票约束损失, 其特征 在于: 优化γ个投票网络, 得到更加稳定的投票结果。 小型的投票网络给出了一组one ‑hot 向量r∈RI, 其中的每个元素代表人物数据某一类的概率, 那么对于一个判别性问题来说, 希望每个网络都可以输出相同或者相似的结果, 即每个网络都认为人物属于同一个类别。权 利 要 求 书 2/3 页 3 CN 114998685 A 3

PDF文档 专利 一种基于投票算法的半监督行人重识别方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于投票算法的半监督行人重识别方法 第 1 页 专利 一种基于投票算法的半监督行人重识别方法 第 2 页 专利 一种基于投票算法的半监督行人重识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。