(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211134776.3 (22)申请日 2022.09.19 (71)申请人 安徽工业大学 地址 243002 安徽省马鞍山市湖东路59号 (72)发明人 杭婷婷 吴宣够 黄俊 刘辉  (74)专利代理 机构 安徽知问律师事务所 34134 专利代理师 平静 (51)Int.Cl. G06F 40/211(2020.01) G06F 16/35(2019.01) G06F 40/284(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01) (54)发明名称 一种基于选择性注意力和路径推理的文档 级关系抽取方法 (57)摘要 本发明公开了一种基于选择性注意力和路 径推理的文档级关系抽取方法, 属于信息抽取技 术领域。 本发明包括如下步骤: 将整个文档进行 输入; 分层构建句内关系图和句间关系图, 利用 图神经网络获得实体指称项和句子的向量表示; 聚合上述两个子图形成文档图, 利用循环神经网 络捕获文档中局部和非局部的信息交互; 利用选 择性注意力筛选出与实体对相关的句子, 生成文 档子图并将其作为关系抽取的范围; 在文档子图 中的多个实体 之间显式建模推理链, 预测出给定 关系路径中每个 关系的概率。 本发 明可以自动从 文档中抽取出蕴含其中的关系事实, 以及支撑这 些关系事实存在的支撑证据, 以发现更准确的句 子间关系和支撑 证据。 权利要求书2页 说明书7页 附图2页 CN 115455938 A 2022.12.09 CN 115455938 A 1.一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 包括如下 步骤: S1: 将整个文档进行输入; S2: 分层构建句内关系图和句间关系图, 利用图神经网络获得实体指称项和句子自身 的向量表示; S3: 聚合上述两个子图形成文档图, 利用循环神经网络在文档图中捕获文档局部和非 局部的信息交 互, 并输出每 个句子的最终表示; S4: 利用选择性注意力筛选出与实体对相关的句子, 生成文档子图并将其作为关系抽 取的范围; S5: 在文档子图中的多个实体之间显式建模推理链, 预测出给定关系路径中每个关系 的概率; S6: 从文档中抽取 出蕴含其中的关系事实, 以及支撑这些关系事实存在的支撑证据。 2.根据权利要求1所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述步骤S1中的文档包括文档标题、 句子、 实体指称项、 实体类型、 关系事实和 相应的支撑证据。 3.根据权利要求1或2所述的一种基于选择性注意力和路径推理的文档级关系抽取方 法, 其特征在于: 所述 步骤S2的构建步骤如下: S2‑1: 构建由每个句子的实体指称项组成的句内关系图, 输出所有实体指称项对应的 向量表示; S2‑2: 构建由文档中的句子组成的句间关系图, 输出 所有句子自身的向量表示。 4.根据权利要求3所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S2‑1的步骤如下: S2‑1‑1: 获得句中每个单词相对于指称项对的上下文表示, 该表示是由句中的词、 共 指、 实体类型、 句子编号和词位置嵌入拼接得到; S2‑1‑2: 将单词相对于指称项对的上下文表示序列输入到一个包含双向长短期记忆网 络和多层感知器的编码器中, 用于捕获指称项对的表示; S2‑1‑3: 将指称项对 的边表示输入到多层循环神经网络中, 逐层学习指称项节点的向 量表示。 5.根据权利要求4所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S2‑2的步骤如下: S2‑2‑1: 获得每个句子相对于句子对 的上下文表示, 该表示是由文档中的句子嵌入和 句子相对位置嵌入拼接得到; S2‑2‑2: 将句子相对于句子对的上下文表示序列输入到一个包含双向长短期记忆网络 和多层感知器的编码器中, 用于捕获句子对的表示; S2‑2‑3: 将句子对的边表示输入到多层循环神经网络中, 逐层学习句子节点的向量表 示。 6.根据权利要求5所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S3的构建步骤如下: S3‑1: 通过指称项的所属句子编号, 为每个指称项和句子建立一条连接边, 使得句内关权 利 要 求 书 1/2 页 2 CN 115455938 A 2系图和句间关系图进行聚合 生成文档图; S3‑2: 引入循环神经网络用于建模状态转换过程; 在每个状态转换时, 每个节点同时与 其所有的图邻居交换信息; S3‑3: 文档图的不同层可以表示句子的不同抽象级别的特征, 所有的抽象级别的特征 对于句子的最终表示都是至关重要的; 为了覆盖所有级别的特征, 将句 子的每一层的表示 连接起来, 形成句子l的最终表示Hl。 7.根据权利要求6所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述步骤S3 ‑2所指的信息交互, 在默认情况下句内关系图和句间关系图仅在 邻居节点进行信息交换, 为了加快信息交流, 在每次状态转换中增加邻居窗口的大小, 以允 许更多节点的通信; 对于第k次状态转换, 邻居窗口的大小 可以按顺序扩展k个单词; 随着迭 代的增加, 指称项节点和句子节点 富含越来越多的上 下文信息 。 8.根据权利要求7所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S4中的构建步骤如下: S4‑1: 计算出文档中的每个句子与实体对的相关性, 再根据相关性的结果, 从高到低选 择最相关的m个句子; S4‑2: 将m个句子聚合成文档子图作为关系抽取的范围。 9.根据权利要求8所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S5的构建步骤如下: S5‑1: 构建实体对之间的直接路径和间接路径, 直接路径表示实体对在一个句子中; 间 接路径表示 实体对不在同一个句子中, 可以使用修正后的双线性变换从子图G ′中获得的间 接关系信息; S5‑2: 将直接路径和间接路径进行组合, 形成统一的路径 表示; S5‑3: 利用组合之后的路径 表示, 预测实体对之间存在某种关系的概 率。权 利 要 求 书 2/2 页 3 CN 115455938 A 3

.PDF文档 专利 一种基于选择性注意力和路径推理的文档级关系抽取方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于选择性注意力和路径推理的文档级关系抽取方法 第 1 页 专利 一种基于选择性注意力和路径推理的文档级关系抽取方法 第 2 页 专利 一种基于选择性注意力和路径推理的文档级关系抽取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:11:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。