standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210963416.8 (22)申请日 2022.08.11 (71)申请人 厦门市美亚柏科信息股份有限公司 地址 361000 福建省厦门市思明区软件园 二期观日路12号102-402单 元 (72)发明人 施翔飞 吴鸿伟 梁煜麓 蓝坤宏  赖光冰 江艺榕  (74)专利代理 机构 厦门福贝知识产权代理事务 所(普通合伙) 35235 专利代理师 郭涵炜 (51)Int.Cl. G06F 16/55(2019.01) G06F 16/583(2019.01) G06F 16/535(2019.01) G06V 10/74(2022.01)G06V 10/762(2022.01) (54)发明名称 一种图像聚档方法和系统 (57)摘要 本发明给出了一种图像聚档方法和系统, 包 括实时获取图片进行特征结构化及属性识别, 过 滤不满足图片质量分的 图片; 对图片按时空信息 进行切分分组, 分批次进行聚类, 先利用密度聚 类进行聚类, 再使用并查集进行批内合并; 对于 批聚类无法聚成的离散点以及批聚类形成的类, 分别与动态底库进行比对归档; 合并同一对象 的 档案, 遍历所有档案与静态底库进行比对, 对未 实名档案进行实名化。 本申请提出一种实时聚 类、 级联合并的图像聚档方法, 根据多合并环节 环环相扣互补形式实现聚档, 保证实时性的同 时, 还能进 一步提高聚档率、 聚档准确率, 并减少 一人多档问题。 权利要求书2页 说明书11页 附图11页 CN 115495606 A 2022.12.20 CN 115495606 A 1.一种图像聚档方法, 其特 征在于, 包括: S1: 实时获取图片进行 特征结构化及属性识别, 过 滤不满足图片质量分的图片; S2: 对所述图片按时空信息进行切分分组, 分批次进行聚类, 先利用密度聚类进行聚 类, 再使用并查 集进行批内合并; S3: 对于批聚类无法聚成的离散点以及批聚类形成的类, 分别与动态底库进行比对归 档; S4: 合并同一对象的档案, 遍历所有档案与静态底库进行比对, 对未实名档案进行实名 化。 2.根据权利要求1所述的图像聚档方法, 其特征在于, 所述S2中分批次进行聚类具体包 括: S21: 采用DBSCAN 算法进行密度聚类; S22: 对聚类结果计算平均向量, 获得簇中心; S23: 找出相似度排名靠前的结果里 大于第一阈值的簇中心, 做并查 集操作。 3.根据权利要求2所述的图像聚档方法, 其特 征在于, 所述S23中并查 集操作包括: S231: 初始化每 个类为集合, 遍历判断所述 集合内的元 素所属的根节点是否是多数类; S232: 响应于元素根节点是多数类, 查找其他未被处理过的元素所属的根节点, 若二者 满足关联阈值, 将两个元 素所在的集 合合并。 4.根据权利要求1所述的图像聚档方法, 其特征在于, 所述S3具体包括: 批聚类无法聚 成的离散点与所述动态底库进 行1: N, 判断是否具有满足搜索阈值的档案, 并根据所述离散 点的属性以及所比对档案的属性选择不同的阈值进行判断是否满足归档; 对于批聚类形成 的类与所述动态底库进 行1: N, 判断是否具有搜索阈值的档案, 并根据所述类的属性以及所 比对档案的属 性选择不同的阈值进行判断是否满足归档, 如不满足且无法确认身份, 则新 增档案。 5.根据权利要求1所述的图像聚档方法, 其特征在于, 所述S4中合并 同一对象的档案具 体包括: 确定预合并档案; 并发1: N查询, 获得每个类满足搜索阈值的结果并将所述结果存 储到预处理数组; 确定最大样本档案, 并合并排序; 阈值剪枝, 得到最终可直接处理的合并 清单。 6.根据权利要求5所述的图像聚档方法, 其特征在于, 所述确定预合并档案包括: 筛选 出档案样本数大于第一样本阈值的档案, 统计筛选结果中无上次合并时间字段的档案数 DN; 判断DN是否超 过第一档案数DNT阈值, 若是, 则取出DNT个满足上述条件的档案; 若否, 取 出DN个满足上述条件的档案, 并筛选出上次合并时间与当前时间点的时差绝对值超过第一 时差阈值的档案, 对 该档案按 上次合并时间升序排序, 取出排序前DNT ‑DN个的档案, 并与DN 个档案合并。 7.根据权利要求6所述的图像聚档方法, 其特征在于, 所述确定最大样本档案具体包 括: 遍历所有 预处理数组, 确定 当前档案及其邻居档案中样本最大的档案, 并判断所述样本 最大的档案是否为当前档案, 若否, 则将所述样本最大的档案更新为key档案, 取出原所有 邻居档案的value并将当前档案作为value, 合并相同key的value结果并去重, 对 结果按key 的样本数降序排列。 8.根据权利要求6所述的图像聚档方法, 其特征在于, 所述阈值剪枝具体包括: 初始化权 利 要 求 书 1/2 页 2 CN 115495606 A 2淘汰清单, 遍历排序后的所述预处理数组, 响应于当前key不存在于所述淘汰清单, 根据所 述key对应的档案属性获取对应阈值并将所述key添加 到所述淘汰清单, 遍历所述key下的 value数组, 响应于当前value不存在于所述淘汰清单, 且满足比对 阈值, 保留所述value并 将其添加到所述淘汰 清单, 输出 预合并清单。 9.根据权利要求1所述的图像聚档方法, 其特征在于, 所述S4中对未实名档案进行实名 化具体包括: 确定预身份落地档案, 遍历所述预身份落地档案并取档案类中心特征与所述 静态底库比对; 响应于比对结果大于第一落地阈值分, 或者所述比对结果小于所述第一落 地阈值分但大于第二落地阈值分, 且与档案照比对相似度最高的为相同证件照且比对结果 大于第三落地阈值分, 取相似度最高的身份进行落地; 响应于存在相同的id  card, 记录预 合并身份档案, 以样本数多的档案为主档案, 将小档案合并至大档案中, 并更新上次档案更 新时间; 触发身份合并, 扫描预合并档案清单进行合并。 10.根据权利要求9所述的图像聚档方法, 其特征在于, 所述确定预身份落地档案具体 包括: 筛选出档案样本数大于第二样本阈值的档案, 统计筛选结果中无上次落地时间字段 的档案数DN ’; 判断DN’是否超过第二档案数DNT ’阈值, 若是, 则取出DNT ’个满足上述条件的 档案; 若否, 取出DN ’个满足上述条件的档案, 并筛选出上次落地时间与当前时间点的时差 绝对值超过第二时差阈值的档案, 对该档案按上次合并时间升序排序, 取出排序前DNT ’ ‑ DN’个的档案, 并与DN ’个档案合并。 11.一种计算机可读存储介质, 其上存储有一或多个计算机程序, 其特征在于, 该一或 多个计算机程序被 计算机处 理器执行时实施权利要求1至10中任一项所述的方法。 12.一种图像聚档系统, 其特 征在于, 所述系统包括: 图片获取单元: 配置用于实时获取图片进行特征结构化及属性识别, 过滤不满足图片 质量分的图片; 图片聚类单元: 配置用于对所述图片按时空信 息进行切分分组, 分批次进行聚类, 先利 用密度聚类进行聚类, 再使用并查 集进行批内合并; 归档单元: 配置用于对于批聚类无法聚成的离散点以及批聚类形成的类, 分别与动态 底库进行比对 归档; 身份落地单元: 配置用于合并 同一对象的档案, 遍历所有档案与静态底库进行比对, 对 未实名档案进行实名化。权 利 要 求 书 2/2 页 3 CN 115495606 A 3

PDF文档 专利 一种图像聚档方法和系统

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种图像聚档方法和系统 第 1 页 专利 一种图像聚档方法和系统 第 2 页 专利 一种图像聚档方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:31:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。