(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211261538.9
(22)申请日 2022.10.14
(71)申请人 厦门市美亚柏科信息股份有限公司
地址 361000 福建省厦门市思明区软件园
二期观日路12号102-402单 元
(72)发明人 江艺榕 齐战胜 梁煜麓 赖光冰
施翔飞 阮志忠
(74)专利代理 机构 厦门福贝知识产权代理事务
所(普通合伙) 35235
专利代理师 郭涵炜
(51)Int.Cl.
G06V 40/16(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/74(2022.01)G06V 10/82(2022.01)
(54)发明名称
一种档案合并方法、 装置及 介质
(57)摘要
本申请提出了一种档案合并方法, 包括: 获
取待合并档案, 每个所述待合并档案包括一张封
面图像和多张人脸图像; 根据所述待合并档案检
索档案库, 得到包含多张人脸图像的预合并档
案, 并将所述待合并档案和所述预合并档案构建
成候选档案对; 获取所述待合并档案和所述预合
并档案的多维度特征信息以及所述候选档案对
的交互特征信息; 将所述多维度特征信息和所述
交互特征信息输入到训练好的机器学习模型中,
所述机器学习模型输出所述候选档案对中的两
个档案属于同一目标的置信 度; 根据所述置信度
判断所述候选档案对是否合并成合并档案。 本申
请的档案合并方法融合了更多维度的特征信息,
档案合并的准确性和合并率更高, 同时实现了不
同合并档案间的去重 。
权利要求书2页 说明书7页 附图3页
CN 115457640 A
2022.12.09
CN 115457640 A
1.一种档案合并方法, 其特 征在于, 包括:
获取待合并档案, 每 个所述待合并档案包括 一张封面图像和多张人脸图像;
根据所述待合并档案检索档案库, 得到包含多张人脸图像的预合并档案, 并将所述待
合并档案和所述预合并档案构建成候选档案对;
获取所述待合并档案和所述预合并档案的多维度特征信息以及所述候选档案对的交
互特征信息;
将所述多维度 特征信息和所述交互特征信 息输入到训练好的机器学习 模型中, 所述机
器学习模型输出 所述候选档案对中的两个档案属于同一目标的置信度;
根据所述置信度判断所述 候选档案对是否合并成合并档案 。
2.根据权利要求1所述的方法, 其特征在于, 所述根据所述待合并档案检索档案库, 包
括:
根据所述待合并档案的档案特征检索档案库, 所述待合并档案的档案特征为封面图像
特性或类中心特征, 其中所述类中心特征用于表征所述待合并档案中多张人脸图像特征向
量的平均向量。
3.根据权利要求1所述的方法, 其特征在于, 所述根据所述待合并档案检索档案库, 得
到包含多张人脸图像的预合并档案, 并将所述待合并档案和所述预合并档案构建成候选档
案对, 包括:
根据所述待合并档案检索档案库, 得到对应一个或多个不同相似度的所述预合并档
案;
将检索结果中相似度达到第一预设阈值的所述预合并档案分别与所述待合并档案构
建成所述 候选档案对。
4.根据权利要求3所述的方法, 其特征在于, 所述根据所述待合并档案检索档案库, 得
到包含多张人脸图像的预合并档案, 并将所述待合并档案和所述预合并档案构建成候选档
案对, 还包括:
分析所述检索结果;
判断相似度达到第二预设阈值的所述预合并档案的数量是否大于第三预设阈值, 若
是, 则只选取相似度达到第二预设阈值的所述预合并档案 分别与所述待合并档案构建成所
述候选档案对; 若否, 则只选取所述检索结果中相似度最大 的所述预合并档案与所述待合
并档案构建成所述 候选档案对。
5.根据权利要求3所述的方法, 其特征在于, 所述待合并档案和所述预合并档 案的多维
度特征信息, 包括:
所述待识别档案中的人脸图像的年龄、 性别、 是否佩戴口罩、 平均质量分、 内聚性、 图像
数量, 其中所述内聚性用于表征档案中任意两张人脸图像特 征向量相似度的平均值; 以及
检索到的所述预合并档案的数量、 相似度大于第四预设阈值的所述预合并档案的数
量。
6.根据权利要求5所述的方法, 其特 征在于, 所述 候选档案对的交 互特征信息, 包括:
所述候选档案对中两个档案之间的特征相似度以及两个档案 融合后的内聚性、 内聚性
的减少量、 人脸图像平均质量分。
7.根据权利要求6所述的方法, 其特征在于, 所述候选档 案对中两个档 案融合后的内聚权 利 要 求 书 1/2 页
2
CN 115457640 A
2性的表达式具体为:
其中,
x=(x1,x2,…,xn)为档案中的人脸图像特征向量, sa和sb分别为两个档案的内聚性, na
和nb分别为两个档案中的人脸图像的数量, sim为两个档案的特 征相似度;
所述候选档案对中两个档案融合后内聚性的减少量的表达式具体为:
sab‑0.5×(sa+sb)。
8.根据权利要求3所述的方法, 其特征在于, 所述根据所述置信度判断所述候选档案对
是否合并成合并档案, 包括:
筛选出所述置信度达到第五预设阈值的所有所述候选档 案对, 将该所有候选档案对中
的所述待合并档案和所述预合并档案构成图网络;
将所述图网络中的所有所述待合并档案按照人脸图像的数量从大到小排序构建剪枝
序列;
根据所述剪枝序列依次将所述待合并档案及其关联的所有所述预合并档案合并成所
述合并档案, 并在每次合并后从所述图网络中移除。
9.一种档案合并装置, 其特 征在于, 包括:
获取模块, 配置用于获取待合并档案, 每个所述待合并档案包括一张封面图像和多张
人脸图像;
检索模块, 配置用于根据所述待合并档案检索档案库, 得到包含多张人脸图像的预合
并档案, 并将所述待合并档案和所述预合并档案构建成候选档案对;
特征提取模块, 配置用于获取所述待合并档案和所述预合并档 案的多维度特征信 息以
及所述候选档案对的交 互特征信息;
预测模块, 配置用于将所述多维度 特征信息和所述交互特征信 息输入到训练好的机器
学习模型中, 所述机器学习模型输出所述候选档案对中的两个档案属于同一目标的置信
度;
策略模块, 配置用于根据所述置信度判断所述 候选档案对是否合并成合并档案 。
10.一种计算机可读储存介质, 其储存有计算机程序, 所述计算机程序在被处理器执行
时实施如权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115457640 A
3
专利 一种档案合并方法、装置及介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:36上传分享