standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210774846.5 (22)申请日 2022.07.01 (71)申请人 上海商汤智能科技有限公司 地址 200233 上海市徐汇区桂平路391号3 号楼1605A室 (72)发明人 秦昊煜  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 专利代理师 许昌莲 (51)Int.Cl. G06V 10/762(2022.01) G06V 10/74(2022.01) G06V 40/16(2022.01) (54)发明名称 聚类方法、 装置及计算机可读存 储介质 (57)摘要 本申请公开了一种聚类方法、 装置及计算机 可读存储介质。 该方法包括: 获取多个待聚类样 本; 按照第一阈值对多个待聚类样 本进行聚类得 到至少一个类, 第一阈值用于表 示最严格的聚类 程度; 针对至少一个类中第一类的第一样本, 从 若干第二类的所有第二样本中确定预设数量的 目标样本; 其中, 第一类为至少一个类中的任意 一个类别, 第一样本为第一类中的任意待聚类样 本, 第二类为至少一个类中除了第一类 之外的类 别, 第二样本为第二类中的任意待聚类样本; 根 据目标样 本对第一样本进行更新; 在至少一个类 中的所有样 本均更新完 之后, 对至少一个类中的 更新后的所有样本进行聚类。 通过上述方式, 能 够提高聚类结果的准确度。 权利要求书2页 说明书10页 附图3页 CN 115063622 A 2022.09.16 CN 115063622 A 1.一种聚类方法, 其特 征在于, 包括: 获取多个待聚类样本; 按照第一阈值对所述多个待聚类样本进行聚类得到至少一个类, 所述第 一阈值用于表 示最严格的聚类程度; 针对所述至少一个类中第 一类的第 一样本, 从若干第 二类的所有第 二样本中确定预设 数量的目标样本; 其中, 所述第一类为所述至少一个类中的任意一个类别, 所述第一样 本为 所述第一类中的任意待聚类样本, 所述第二类为所述至少一个类中除了所述第一类之外的 类别, 所述第二样本为所述第二类中的任意待聚类样本; 根据所述目标样本对所述第一样本进行 更新; 在所述至少一个类中的所有样本均 更新完之后, 对所述至少一个类中的更新后的所有 样本进行聚类。 2.根据权利要求1所述的方法, 其特征在于, 所述至少一个类包括第N1类、 第N2类 …… 第Nn类, 分别将 每一所述类作为第一类, 当所述第一类为所述第N 1类时, 第二类为除所述第 N1类以外的所有类, 当所述第一类为所述第N2类时, 所述第二类为除所述第N2类以外的所 有类, 当所述第一类为所述第N n类时, 所述第二类为除所述第N n类以外的所有类。 3.根据权利要求1或2所述的方法, 其特征在于, 所述针对所述至少一个类中第一类的 第一样本, 从若干第二类的所有第二样本中确定预设数量的目标样本, 包括: 对于每个所述第一样本, 分别计算与各 所述第二类中的第二样本之间的相似度; 分别从各所述第二类中确定与所述第一样本的相似度满足预设相似度条件的若干候 选样本; 从所有候选样本中确定预设数量的样本作为所述目标样本 。 4.根据权利要求3所述的方法, 其特征在于, 所述分别从各所述第 二类中确定与所述第 一样本的相似度满足预设相似度条件的若干候选样本, 包括: 对于每一所述第 二类的候选样本, 从与 所述第一样本之间的相似度大于或等于预设相 似度的第二样本中, 选择相似度最高的第二样本作为所述 候选样本; 所述从所有候选样本中确定预设数量个作为所述目标样本, 包括: 将所有所述 候选样本按照相似度从高到低排序; 选择前预设数量个候选样本作为所述目标样本 。 5.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 所述根据目标样本对第 一样本进 行更新, 获得 更新后的第一样本, 包括: 将所述第一样本与 所述第一样本对应的各目标样本进行加权 融合, 得到更新后的所述 第一样本; 其中, 所述第一样本的加权融合权重为第一预设值, 各所述目标样本的加权融合权重 为第二预设值或各所述目标样本的加权融合权重由各所述目标样本与所述第一样本的相 似度确定 。 6.根据权利要求1 ‑5任一项所述的方法, 其特征在于, 所述对所述至少一个类 中的更新 后的所有样本进行聚类, 包括: 降低所述第 一阈值, 得到第 二阈值, 其中, 所述第 二阈值表示的聚类程度低于所述第一 阈值表示的聚类程度;权 利 要 求 书 1/2 页 2 CN 115063622 A 2按照所述第二阈值对所述至少一个 类中的更新后的所有样本进行聚类, 得到若干类。 7.根据权利要求6所述的方法, 其特征在于, 在所述按照所述第 二阈值对所述至少一个 类中的更新后的所有样本进行聚类, 得到若干类之后, 所述方法还 包括: 响应于所述第二阈值大于或等于目标阈值, 针对所述若干类中第三类的第三样本, 从 若干第四类中的所有第四样本中确定预设数量的目标样本, 并根据所述目标样本对所述第 三样本进行更新, 在所述若干类中的所有样本均更新完之后, 对所述若干类中的更新后的 所有样本进行聚类; 或, 响应于所述第二阈值小于目标阈值, 停止聚类, 并将最后一次聚类得到的聚类结 果, 作为最终的聚类结果。 8.根据权利要求7所述的方法, 其特征在于, 首次聚类使用的所述第一阈值为预先设 定, 所述降低所述第一阈值, 得到第二阈值, 包括: 以预设步长降低所述第一阈值至所述第二阈值或所述第一阈值与所述第二阈值之间 呈预设指数关系。 9.根据权利要求1 ‑8任一项所述的方法, 其特征在于, 所述多个待聚类样本是从若干张 图像中提取 得到的各 人脸的特 征。 10.一种聚类装置, 其特 征在于, 包括: 获取模块, 用于获取多个待聚类样本; 一次聚类模块, 用于按照第一阈值对所述多个待聚类样本进行聚类得到至少一个类, 所述第一阈值用于表示 最严格的聚类程度; 确定模块, 用于针对所述至少一个类中第一类的第一样本, 从若干第二类的所有第二 样本中确定预设数量的目标样本; 其中, 所述第一类为所述至少一个类中的任意一个类别, 所述第一样本为所述第一类中的任意待聚类样本, 所述第二类为所述至少一个类中除了所 述第一类之外的类别, 所述第二样本为所述第二类中的任意待聚类样本; 样本更新模块, 用于根据所述目标样本对所述第一样本进行 更新; 二次聚类模块, 用于在所述至少一个类中的所有样本均更新完之后, 对所述至少一个 类中的更新后的所有样本进行聚类。 11.一种聚类装置, 其特 征在于, 包括处 理器、 与所述处 理器耦接的存 储器, 其中, 所述存储器存储有程序指令; 所述处理器用于执行所述存储器存储的所述程序指令以实现权利要求1 ‑9中任一项所 述的方法。 12.一种计算机可读存储介质, 其特征在于, 所述存储介质存储有程序指令, 所述程序 指令被执 行时实现如权利要求1 ‑9中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115063622 A 3

PDF文档 专利 聚类方法、装置及计算机可读存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 聚类方法、装置及计算机可读存储介质 第 1 页 专利 聚类方法、装置及计算机可读存储介质 第 2 页 专利 聚类方法、装置及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。