(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211014888.5
(22)申请日 2022.08.23
(65)同一申请的已公布的文献号
申请公布号 CN 115100453 A
(43)申请公布日 2022.09.23
(73)专利权人 浙江大华 技术股份有限公司
地址 310051 浙江省杭州市滨江区滨安路
1187号
(72)发明人 庄瑞格 朱树磊 殷俊
(74)专利代理 机构 深圳市威世博知识产权代理
事务所(普通 合伙) 44280
专利代理师 严翠霞
(51)Int.Cl.
G06V 10/762(2022.01)
G06V 10/74(2022.01)G06V 10/77(2022.01)
(56)对比文件
CN 112766299 A,2021.0 5.07
CN 109447186 A,2019.0 3.08
CN 101859326 A,2010.10.13
KR 101414045 B1,2014.07.02
Shibing Zhou等. “A novel internal
validity index based o n the cluster
centre and the nearest neighbour
cluster”. 《Applied Soft Computi ng》 .2018,第
71卷
陈新泉.“混合属性数据集的基 于近邻连接
的两阶段聚类算法 ”. 《计算机 工程与科 学》
.2012,第34卷(第09期),
审查员 刘梦晨
(54)发明名称
一种图像聚类方法、 装置、 终端及计算机可
读存储介质
(57)摘要
本发明提供一种图像聚类方法、 装置、 终端
及计算机 可读存储介质, 图像聚类方法包括获取
待聚类图像集, 待聚类图像集包括多张目标图
像; 基于至少两种聚类方式分别对待聚类图像集
中的目标图像进行初始聚类, 得到至少两种聚类
方式分别对应的第一聚类结果; 基于至少两种聚
类方式分别对应的第一聚类结果, 确定各目标图
像的真实近邻集; 基于各目标图像的真实近邻
集, 对待聚类图像集中的目标图像进行第二次聚
类。 本申请通过多种聚类方法分别对待聚类图像
集中的目标图像进行聚类处理, 得到多个第一聚
类结果; 对多个第一聚类结果进行集成学习确定
各目标图像的真实近邻集, 进而对待聚类图像集
中的目标图像进行第二次聚类, 提高目标图像的
聚类结果的准确率。
权利要求书4页 说明书12页 附图5页
CN 115100453 B
2022.11.18
CN 115100453 B
1.一种图像聚类方法, 其特 征在于, 包括:
获取待聚类图像集, 所述待聚类图像集包括多张目标图像;
基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类, 得到所
述至少两种聚类方式分别对应的第一聚类结果;
遍历所述待聚类图像集中各所述目标图像, 基于选取的所述目标图像与所述待聚类图
像集中其他所述目标图像之间的相似度, 确定所述选取 的目标图像对应的近邻图像集, 所
述近邻图像集包括与所述选取的目标图像的所述相似度最高的预设数量个近邻图像;
基于所述目标图像的近邻图像集和所述至少两种聚类方式分别对应的第 一聚类结果,
确定所述目标图像的真实近邻集, 所述真实近邻集 为所述近邻图像集的子集;
基于各所述目标图像的真实近邻集, 对所述待聚类图像集中的所述目标图像进行第 二
次聚类, 得到最佳聚类结果;
其中, 所述基于所述目标图像的近邻图像集和所述至少两种聚类方式分别对应的第 一
聚类结果, 确定所述目标图像的真实近邻集, 包括:
基于所述目标图像与 所述近邻图像在所述第 一聚类结果中的占比, 确定所述目标图像
与所述近邻图像是否属于同一类簇; 基于所述近邻图像集中与所述目标图像属于同一类簇
的所述近邻图像, 确定所述目标图像的真实近邻集;
其中, 所述第一聚类结果包括所述待聚类图像集中包 含的所述目标图像的聚类 类别;
所述基于所述目标图像与 所述近邻图像在所述第 一聚类结果中的占比, 确定所述目标
图像与所述近邻图像是否属于同一类簇, 包括:
在所述目标图像对应的所述近邻图像集中选取一所述近邻图像;
在所有所述第 一聚类结果中, 统计得到同时包含所述目标图像和所述选取的近邻图像
的所述第一聚类结果的个数为第一数量;
在同时包含所述目标图像和所述选取的近邻图像的所有所述第 一聚类结果中, 统计得
到所述目标图像的聚类类别和所述选取的近邻图像的聚类类别相同的所述第一聚类结果
的个数为第二数量;
基于所述第 二数量在所述第 一数量中的占比, 确定所述目标图像与 所述选取的近邻图
像是否属于同一类簇 。
2.根据权利要求1所述的图像聚类方法, 其特 征在于,
所述基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类, 得
到所述至少两种聚类方式分别对应的第一聚类结果, 包括:
对所述待聚类图像集中的所述目标图像进行放回采样, 得到 至少两个子图像集;
通过所述至少两种聚类方式分别对各所述子图像集中的目标图像进行初始聚类, 得到
各所述聚类方式与各 所述子图像集之间分别对应的所述第一聚类结果。
3.根据权利要求1或2所述的图像聚类方法, 其特 征在于,
所述基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类, 得
到所述至少两种聚类方式分别对应的第一聚类结果, 之前还 包括:
对所述待聚类图像集中的所述目标图像进行特征提取, 得到所述目标图像的第 一特征
图; 将各所述目标图像的第一特 征图分别进行降维, 得到各 所述目标图像的第二特 征图;
所述基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类, 得权 利 要 求 书 1/4 页
2
CN 115100453 B
2到所述至少两种聚类方式分别对应的第一聚类结果, 包括:
采用所述至少两种聚类方式, 基于各所述目标图像的第 二特征图分别对所述待聚类图
像集中的所述目标图像进 行初始聚类, 得到所述至少两种聚类方式分别对应的第一聚类结
果。
4.根据权利要求3所述的图像聚类方法, 其特 征在于,
所述将各所述目标图像的第 一特征图分别进行降维, 得到各所述目标图像的第 二特征
图, 包括:
采用PCA方法分别对各所述目标图像的第一特征图分别进行降维, 得到各所述目标图
像的第二特 征图。
5.根据权利要求1所述的图像聚类方法, 其特 征在于,
所述基于所述第二数量在所述第 一数量中的占比, 确定所述选取的目标图像与所述近
邻图像是否属于同一类簇, 包括:
响应于所述第 二数量在所述第 一数量中的占比大于预设值, 确定所述目标图像与 所述
选取的近邻图像属于同一类簇; 响应于所述第二数量在所述第一数量中的占比小于或等于
所述预设值, 确定所述目标图像与所述选取的近邻图像不属于同一类簇 。
6.根据权利要求1所述的图像聚类方法, 其特 征在于,
所述基于各所述目标图像的真实近邻集, 对所述待聚类图像集中的所述目标图像进行
第二次聚类, 得到最佳聚类结果, 包括:
基于各所述目标图像的真实近邻集, 确定任意两个所述目标图像之间的亲和度;
基于任意两个所述目标图像之间的亲和度, 将所述待聚类图像集中的所述目标图像划
分为至少一个类簇图像集; 所述类簇图像集中包括所述亲和度大于亲和度阈值的至少两个
所述目标图像;
对所述至少一个 类簇图像集进行聚合, 得到所述待聚类图像集的最佳聚类结果。
7.根据权利要求6所述的图像聚类方法, 其特 征在于,
所述任意两个目标图像之间的亲和度通过如下 方式确定, 包括:
在所述多张目标图像中任意选取两张所述目标图像, 一张所述目标图像为第一图像,
另一张所述目标图像为第二图像;
基于所述第 二图像的真实近邻集的补集与 所述第一图像的真实近邻集之间的交集, 确
定第一近邻集; 所述第一近邻集 为所述第一图像的真实近邻集的子集;
基于所述第 一图像的真实近邻集的补集与 所述第二图像的真实近邻集之间的交集, 确
定第二近邻集; 所述第二近邻集 为所述第二图像的真实近邻集的子集;
基于所述第一近邻集和所述第二近邻集分别与所述第一图像的真实近邻集和所述第
二图像的真实近邻集, 确定所述第一图像和所述第二图像之间的亲和度。
8.根据权利要求7 所述的图像聚类方法, 其特 征在于,
所述基于所述第一近邻集和所述第二近邻集分别与所述第一图像的真实近邻集和所
述第二图像的真实近邻集, 确定所述第一图像和所述第二图像之间的亲和度, 包括:
基于所述第一近邻集和所述第二近邻集分别与所述第一图像的真实近邻集和所述第
二图像的真实近邻集, 确定所述第一图像和所述第二图像分别对应的相似差;
在所述第一图像和所述第 二图像分别对应的所述相似差中, 基于数值最大的所述相似权 利 要 求 书 2/4 页
3
CN 115100453 B
3
专利 一种图像聚类方法、装置、终端及计算机可读存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:31:32上传分享