standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210006319.X (22)申请日 2022.01.04 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区南 山街道崇文 路2号 (72)发明人 张清华 吴淼 胡峰 高满  肖嘉瑜 刘棋  (74)专利代理 机构 重庆辉腾律师事务所 5 0215 代理人 王海军 (51)Int.Cl. G06N 5/04(2006.01) G16H 10/60(2018.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01)G06F 40/30(2020.01) G06F 40/268(2020.01) (54)发明名称 一种基于电子病历的多粒度因果关系推理 方法 (57)摘要 本发明属于电子病历因果关系抽取与推理 领域, 具体涉及一种基于电子病历的多粒度因果 关系推理方法, 该方法包括: 获取电子病历资源, 获取资料上的文本信息, 提取文本信息的多粒度 语义特征; 将该特征输入到SV M三支决策分类器, 得到第一阶段的因果关系抽取和推理结果; 将 SVM三支决策分类器对训练集中产生的中间域样 本输入到BiLS TM‑CRF分类器中, 得到第二阶段因 果关系抽取和推理结果; 本发明利用相应的数学 知识来对电子病历进行科学的分析与预测, 形成 对电子病历因果关系抽取和推理, 可以提升医生 的服务质量与效率, 与此同时减 轻医生的就诊负 担。 权利要求书2页 说明书6页 附图2页 CN 114298314 A 2022.04.08 CN 114298314 A 1.一种基于电子病历的多粒度因果关系推理方法, 其特 征在于, 包括: S1: 获取电子病历资料; 对获取的电子病历资料进行审核, 若审核不通过, 则重新获取 电子病历资料; 若审核通过, 则执 行下一步; S2: 对通过审核的电子病历资料进行 预处理, 得到文本信息; S3: 提取文本信息的多粒度语义特 征; S4: 将多粒度语义特征输入到SVM三支决策分类器中进行因果关系抽取和推理, 得到拒 绝域样本、 中间域样本以及接受域样本, 并根据接受域样 本得到初始显示因果关系, 根据初 始显示因果关系得到初始隐式因果关系; S5: 将中间域样本输入到BiLSTM ‑CRF分类器中进行因果关系抽 取和推理, 并根据初始 显示因果关系和初始隐式因果关系得到输入样本的因果关系, 该 因果关系包括显示因果关 系和隐式因果关系。 2.根据权利要求1所述的一种基于电子病历的多粒度因果关系推理方法, 其特征在于, 获取的电子病历资料包括首页、 病程记录、 检验结果、 医嘱、 手术记录以及护理记录信息 。 3.根据权利要求1所述的一种基于电子病历的多粒度因果关系推理方法, 其特征在于, 对获取的电子病历资料进行审核的过程包括: 判断医生/患者所填写电子的病历是否满足 要求; 满足的要求包括电子病历的完整性、 权威性、 规范性以及严谨性, 其中规范性指电子 病历是否采用统一的病历模板 。 4.根据权利要求1所述的一种基于电子病历的多粒度因果关系推理方法, 其特征在于, 对通过审核的电子病历资料进行预处理包括对电子病历资源中的文本数据信息进行分词 和词性标注处理; 使用text _to_word_ sequence方法对文本信息进行处理, 并采用字符串匹 配方法对句子进行划分, 得到分词; 采用拓展的 “BIO”方法对分词进行词 性标注, 标注的信 息包括: B ‑C、 I‑C、 B‑E、 I‑E、 B‑Emb、 I‑Emb以及O; 其 中, B‑C表示“the begin of cause, 原因 实体的开始 ”, I‑C表示“the inside of cause, 原因实体的中间 ”, B‑E表示“the begin of  effect, 结果实体的开始 ”, I‑E表示“the inside of effect, 结果实体的中间 ”, B‑Emb表示 “the begin of embedded  entity, 嵌套因果实体的开始 ”, I‑Emb表示“the inside of  embedded entity, 嵌套因果实体的中间 ”, O表示“other, 与因果实体无关的单词 ”。 5.根据权利要求1所述的一种基于电子病历的多粒度因果关系推理方法, 其特征在于, 多粒度语义特 征包括: 单词等级、 字符等级以及字符串等级。 6.根据权利要求1所述的一种基于电子病历的多粒度因果关系推理方法, 其特征在于, 采用SVM三支决策分类 器对多粒度语义特 征进行因果关系抽取和推理的过程包括: S1: 构建概 率函数; S2: 计算SVM三支决策分类 器的第一阈值α 和第二阈值β; S3: 将多粒度语义特征输入到训练好的SVM三支决策分类器 中, 得到第一阶段因果关系 抽取和推理结果; S4: 采用概 率函数计算输入多粒度语义特 征的因果关系抽取 结果概率值; S5: 若概率值大于等于第一阈值α, 则将该分类结果对应的样本加入到接收域样本中, 并进行因果关系推理, 得到第一阶段因果关系抽取和推理结果; 若概率值小于等于第二阈 值β, 则将该样本加入到中间域样本集中; 否则将该样本加入到拒绝 域样本集中。 7.根据权利要求6所述的一种基于电子病历的多粒度因果关系推理方法, 其特征在于,权 利 要 求 书 1/2 页 2 CN 114298314 A 2构建的概 率函数为softmax函数, 概 率函数的表达式为: 其中, z(xi)表示SVM第i个子分类器的判决函数, xi表示SVM第i个子分类器的支持向量, n表示因果关系类别数, k(x,xi)表示SVM核函数, ρi表示拉格朗日乘子, yi表示第i个样本的 类别。 8.根据权利要求6所述的一种基于电子病历的多粒度因果关系推理方法, 其特征在于, 计算SVM三支决策分类 器的阈值的公式为: 其中, 当样本属于因果关系时, λpp、 λnp、 λbp分别为划 分到接受域、 中间域以及拒绝域的 损失函数; 当样本不属于因果关系时, λpn、 λbn、 λnn分别为划分到接受域、 中间域以及拒绝域 的损失函数。 9.根据权利要求1所述的一种基于电子病历的多粒度因果关系推理方法, 其特征在于, 采用BiLSTM ‑CRF分类器对中间域样 本进行因果关系抽取和推理的过程包括: 将中间域样 本 输入到BiLSTM ‑CRF分类器中; 对输入的样本进行词性标注; 在所有经过词性标注的样本中 搜索因果实体对应的下标, 并计算因果实体的出入度; 根据 因果实体出入度将因果实体进 行排列组合, 形成候选因果关系三元 组; 将候选因果关系三元组进 行排列组合, 并计算候选 因果关系三元组组合的出度; 若候选因果关系三元组组合的出入度与 原始因果实体的出入 度一致, 则该候选因果关系三元组组合为因果关系抽取结果; 在因果关系抽取结果中, 将入 度为0的实体作为原因实体, 出度为0的实体作为结果实体, 以此形成推理的因果关系三元 组。权 利 要 求 书 2/2 页 3 CN 114298314 A 3

PDF文档 专利 一种基于电子病历的多粒度因果关系推理方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于电子病历的多粒度因果关系推理方法 第 1 页 专利 一种基于电子病历的多粒度因果关系推理方法 第 2 页 专利 一种基于电子病历的多粒度因果关系推理方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:03上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。