(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210152249.9
(22)申请日 2022.02.18
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 郭佳昌 梅祥 陈俊 代小亚
黄海峰
(74)专利代理 机构 北京市铸成律师事务所
11313
专利代理师 曹远 段丹辉
(51)Int.Cl.
G16H 50/20(2018.01)
G16H 50/80(2018.01)
G06F 40/216(2020.01)
G06F 40/295(2020.01)G06F 40/30(2020.01)
G06F 16/35(2019.01)
G06F 16/36(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
疾病的确定方法、 装置、 设备以及存 储介质
(57)摘要
本公开提供了疾病的确定方法、 装置、 设备
以及存储介质, 涉及数据处理技术领域, 尤其涉
及人工智能、 深度学习、 AI医疗等领域。 具体实现
方案为: 根据疑似患者的描述信息, 确定医疗实
体信息; 利用医疗实体信息, 在疾病图谱中确定
与疑似患者相关的子图谱, 疾病图谱 是预先构建
的, 疾病图谱中至少包括疾病以及与疾病对应的
多个实体项; 利用疑似患者的描述信息、 医疗实
体和子图谱中的至少一种, 对疑似患者进行指定
类别的疾病确定。 通过上述过程, 可以提高疾病
确定的准确性。
权利要求书3页 说明书11页 附图6页
CN 114530244 A
2022.05.24
CN 114530244 A
1.一种疾病的确定方法, 包括:
根据疑似患者的描述信息, 确定医疗实体信息;
利用所述医疗实体信息, 在疾病图谱中确定与所述疑似患者相关的子 图谱, 所述疾病
图谱是预先构建的, 所述疾病图谱中至少包括疾病以及与所述疾病对应的多个实体项;
利用所述疑似患者的描述信息、 所述医疗实体和所述子 图谱中的至少一种, 对所述疑
似患者进行指定类别的疾病确定 。
2.根据权利要求1所述的方法, 其中, 所述利用所述医疗实体信息, 在疾病图谱中确定
与所述疑似患者相关的子图谱, 包括:
对所述医疗实体信息进行 结构化处 理, 得到至少一个实体项的内容;
利用每个所述实体项的内容, 与所述疾病图谱进行匹配, 得到所述与所述疑似患者相
关的子图谱。
3.根据权利要求2所述的方法, 其中, 所述利用每个所述实体项的内容, 与所述疾病图
谱进行匹配, 得到所述与所述疑似患者相关的子图谱, 包括:
遍历所述疾病图谱中的各所述实体项, 得到遍历结果, 所述遍历结果包括各所述实体
项的内容, 以及每 个实体项的内容对应的权 重, 所述权 重为动态变化的;
将所述医疗实体信息与所述遍历结果进行比对, 在内容相似度高于对应阈值的情况
下, 基于所述权 重确定所述疑似患者相关的子图谱。
4.根据权利要求1至 3任一所述的方法, 其中, 所述疾病图谱的构建方式, 包括:
预先确定n个疾病 种类, 其中, n 为正整数;
对于第i个疾病种类, 对获取到的与所述第i个疾病种类相关的多个诊断信息进行预处
理, 得到实体项, 其中, 1≤i≤n, 且i 为正整数;
利用所述实体项在多个诊断信 息中出现的频率, 以及包含所述实体项的诊断信 息在所
有诊断信息中的占比, 确定所述实体项与所述第i个疾病 种类的关联关系;
利用所述关联关系, 构建所述疾病图谱。
5.根据权利要求1所述的方法, 其中, 在同时利用所述疑似患者的描述信息、 所述医疗
实体和所述子图谱的情况 下, 对所述疑似患者进行指定类别的疾病确定, 包括:
确定所述疑似患 者的描述信 息的第一特征向量, 以及确定所述医疗实体的第 二特征向
量;
基于所述第 一特征向量和所述第 二特征向量的互注意力计算结果, 得到特征向量计算
结果;
将所述特征向量计算结果与确定出的所述子图谱的特征向量进行拼接, 得到向量集
合;
利用所述向量 集合进行指定类别的疾病确定 。
6.根据权利要求1所述的方法, 其中, 所述根据疑似患者的描述信息, 确定医疗实体信
息, 包括:
对所述描述信息进行 预处理, 以提取 所述描述信息的特 征向量;
对所述特 征向量进行识别, 得到医疗实体信息 。
7.根据权利要求1所述的方法, 还 包括:
将所述指定类别的疾病确定结果发送至信息展示端。权 利 要 求 书 1/3 页
2
CN 114530244 A
28.根据权利要求1至7任一所述的方法, 所述指定类别的疾病包括具有传播风险的疾
病。
9.一种疾病的确定装置, 包括:
医疗实体信息确定模块, 用于根据疑似患者的描述信息, 确定医疗实体信息;
子图谱确定模块, 用于利用所述医疗实体信息, 在疾病图谱中确定与所述疑似患者相
关的子图谱, 所述疾病图谱是预先构建的, 所述疾病图谱中至少包括疾病以及与所述疾病
对应的多个实体项;
疾病确定模块, 用于利用所述疑似患者的描述信息、 所述医疗实体和所述子 图谱中的
至少一种, 对所述疑似患者进行指定类别的疾病确定 。
10.根据权利要求9所述的装置, 其中, 所述子图谱确定模块, 包括:
实体项内容确定子模块, 用于对所述医疗实体信息进行结构化处理, 得到至少一个实
体项的内容;
子图谱确定执行子模块, 用于利用每个所述实体项的内容, 与所述疾病图谱进行匹配,
得到所述与所述疑似患者相关的子图谱。
11.根据权利要求10所述的装置, 其中, 所述子图谱确定执 行子模块, 包括:
遍历结果获取单元, 用于遍历所述疾病图谱中的各所述实体项, 得到遍历结果, 所述遍
历结果包括各所述实体项的内容, 以及每个实体项的内容对应的权重, 所述权重为动态变
化的;
子图谱确定执行单元, 用于将所述医疗实体信息与所述遍历结果进行比对, 在内容相
似度高于对应阈值的情况 下, 基于所述权 重确定所述疑似患者相关的子图谱。
12.根据权利要求9至1 1任一所述的装置, 其中, 所述子图谱确定模块, 包括:
疾病种类确定 子模块, 用于预 先确定n个疾病 种类, 其中, n 为正整数;
实体项确定子模块, 用于对于第i个疾病种类, 对获取到的与所述第i个疾病种类相关
的多个诊断信息进行 预处理, 得到实体项, 其中, 1≤i≤n, 且i 为正整数;
关联关系确定子模块, 用于利用所述实体项在多个诊断信息中出现的频率, 以及包含
所述实体项的诊断信息在所有诊断信息中的占比, 确定所述实体项与所述第i个疾病种类
的关联关系;
构建执行子模块, 用于利用所述关联关系, 构建所述疾病图谱。
13.根据权利要求9所述的装置, 其中, 在同时利用所述疑似患 者的描述信 息、 所述医疗
实体和所述子图谱的情况 下, 所述疾病确定模块, 包括:
特征向量确定子模块, 用于确定所述疑似患者的描述信息的第一特征向量, 以及确定
所述医疗实体的第二特 征向量;
互注意力计算子模块, 用于基于所述第 一特征向量和所述第 二特征向量的互注意力计
算结果, 得到特 征向量计算结果;
向量拼接子模块, 用于将所述特征向量计算结果与确定出的所述子图谱的特征向量进
行拼接, 得到向量 集合;
疾病确定执 行子模块, 用于利用所述向量 集合进行指定类别的疾病确定 。
14.根据权利要求9所述的装置, 其中, 所述医疗实体信息确定模块, 包括:
预处理子模块, 用于对所述描述信息进行 预处理, 以提取 所述描述信息的特 征向量;权 利 要 求 书 2/3 页
3
CN 114530244 A
3
专利 疾病的确定方法、装置、设备以及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:31上传分享