(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210929369.5
(22)申请日 2022.08.03
(71)申请人 山西财经 大学
地址 030006 山西省太原市坞城路140号
(72)发明人 郝瑞 秦亚雪 李智玲 周志钢
周丽娟
(74)专利代理 机构 太原申立德知识产权代理事
务所(特殊普通 合伙) 14115
专利代理师 程园园
(51)Int.Cl.
G06F 16/2455(2019.01)
G06F 16/22(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06T 7/00(2017.01)G06V 10/40(2022.01)
G06V 10/74(2022.01)
G06V 10/77(2022.01)
G06V 10/82(2022.01)
(54)发明名称
基于深度多索引哈希的肺结节图像快速检
索方法
(57)摘要
本发明涉及肺结节图像检索与深度学习技
术领域, 公开了一种基于深度多索引哈希的肺结
节图像快速检索方法。 该方法先利用构建的深度
哈希模型提取肺结节CT图像的哈希特征, 创建图
像哈希特征库; 然后基于主成分分析对哈希特征
进行预处理, 将预处理的哈希编码连续划分为多
个互不相交的子哈希编码并对每一个子哈希编
码都构造相应的哈希表; 最后在检索时, 对每一
个子哈希表都进行检索, 并获取全部的相似图像
候选集, 计算与候选集中所有图像哈希编码的汉
明距离, 获得最终的检索结果。 该方法对肺部医
学图像检索具有重要的研究意义和广阔的应用
前景。
权利要求书2页 说明书9页 附图2页
CN 115357613 A
2022.11.18
CN 115357613 A
1.一种基于深度多索引哈希的肺结节图像快速检索方法, 其特征在于: 所述方法包括
以下步骤:
步骤1, 从病变肺部 CT图像数据库中获取肺结节图像块并构造训练集;
步骤2, 在卷积神经网络模型基础上加入哈希层构建深度哈希算法网络, 使其能够同时
学习输入肺结节图像块的高层语义特 征以及对应的哈希函数表达;
步骤3, 利用步骤2学习得到的哈希函数对待查询的肺结节图像进行编码, 得到待查询
肺结节图像的哈希编码, 创建图像哈希特 征库;
步骤4, 基于主成分分析对步骤3得到的哈希编码进行预处理, 将预处理的哈希编码连
续划分为多个互不相交的子哈希编码;
步骤5, 对步骤4得到的每一个子哈希编码建立相应的索引哈希 表, 构建索引结构;
步骤6, 对步骤5所构建的索引结构设计查询策略, 根据输入的查询信息对每一个哈希
表检索, 并获取全部的相似图像候选集, 然后计算与候选集中所有图像哈希编码的汉明距
离并排序, 得到符合条件的肺结节图像块。
2.根据权利要求1所述的基于深度多索引哈希的肺结节图像快速检索方法, 其特征在
于: 所述步骤中1肺结节图像块获取 的具体过程为, 先利用最大类间方差法、 形态学膨胀腐
蚀、 最大连通区域算法对肺实质进行分割、 提取, 然后再结合数据库中的诊断结果标注信
息, 利用与 肺实质分割、 提取相同的方法获得肺结节图像块; 所述构 造的训练集还包含放射
科医师给出的诊断结果标注信息 。
3.根据权利要求1所述的基于深度多索引哈希的肺结节图像快速检索方法, 其特征在
于: 所述步骤2具体是在传统AlexNet模 型fc7与fc8层之间插入哈希层, 用于将fc7高维的特
征向量压缩为低维紧凑的哈希编码表示并最大化保留图像的语义相似性, 哈希层主要由全
连接层、 激活层和阈值层三部分构成; 为了保证所学习的肺结节哈希特征具有更强的表达
能力, 采用哈希层输出的图像的类别信息作为优化目标, 具体为: 卷积神经网络框架的误差
损失E为:
其中, N为输入样本个数, l og(Pn,label)表示估计的样本n 为真实标签的概 率;
通过随机梯度下降算法和反向传播算法优化损 失函数, 选择最优的参数组合θ来更新
模型训练参数, 得到可以同时学习输入肺结节图像块的高层语义特征以及 对应的哈希函数
表达的卷积神经网络模型。
4.根据权利要求1所述的基于深度多索引哈希的肺结节图像快速检索方法, 其特征在
于: 所述步骤3具体为, 先对哈希层的全连接层设置h个节点用于得到fc7层的线性表达, 然
后采用在哈希层激活层设置sigmoid激活函数完成取值为[ 0, 1]的非线性表达, 最后在哈希
层阈值层设置阈值 函数, 将连续的特 征向量转化为二值哈希编码, 如下 所示:
h=sigmo id(W*FC+b) (2)
其中, W表示权 重, b表示偏置, FC表示全连接层信息, h表示哈希层信息 。
5.根据权利要求1所述的基于深度多索引哈希的肺结节图像快速检索方法, 其特征在权 利 要 求 书 1/2 页
2
CN 115357613 A
2于: 所述步骤4使用主成分分析对原哈希编 码数据进 行变换, 使变换后的数据具有线性不相
关性且尽量保证原有数据之间的关系; 具体操作为, 先用主成分分析对原哈希编码训练生
成投影向量, 然后将原哈希编码与生成的投影向量相乘得到分布均匀的哈希编码, 并将其
连续划分为多个互不相交的子哈希编码, 划分个数与哈希编码长度可以表示 为:
D={d1,d2,...,dnum} (4)
sD=num*sd (5)
其中, num表示子哈希编码的个数, 用D表示提取的哈希特征, sD表示哈希编码的长度, 用
d表示划分的特 征子串, sd表示特征字串的长度。
6.根据权利要求1所述的基于深度多索引哈希的肺结节图像快速检索方法, 其特征在
于, 所述步骤5对每一个子哈希编码
建立相应的索引哈希表, 构建索引结构, 具体
包括以下步骤:
步骤5.1, 初始化 num个子哈希 表
步骤5.2, 设置哈希 表索引键是 大小为d的特 征子块;
步骤5.3, 设置索引值是包 含步骤5.2特 征子块的所有图像ID号的列表集 合。
7.根据权利要求1所述的基于深度多索引哈希的肺结节图像快速检索方法, 其特征在
于, 所述步骤6具体包括以下步骤:
步骤6.1, 查询 搜索半径r的确定, 利用抽屉原理, 即如果两个哈希编码hi和hj之间的汉
明距离小于等于r, 那么划分成m个子块时至少存在一对子块编码之 间的汉明距离小于等于
公式为:
if||hi‑hj||H≤r
其中,
步骤6.2, 先将查询项划分成与哈希表相一致的子哈希编码, 然后对于每一个特征子
块, 采用k ‑NN检索方式计算其与数据集中对应的特征子块的汉明距离并对其进行排序, 然
后按最相似依 次返回候选集, 如果候选集个数未达到给定的返回结果数目, 则扩大汉明距
离, 将新增的结果添加至候选集, 直到满足给定的返回结果数目, 完成肺结节图像的快速检
索。权 利 要 求 书 2/2 页
3
CN 115357613 A
3
专利 基于深度多索引哈希的肺结节图像快速检索方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:31:48上传分享