专利一种基于选择性注意力和路径推理的文档级关系抽取方法 -在线下载 -AI解读-standardlibrary.site

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211134776.3 (22)申请日 2022.09.19 (71)申请人安徽工业大学地址 243002 安徽省马鞍山市湖东路59号 (72)发明人杭婷婷　吴宣够　黄俊　刘辉　 (74)专利代理机构安徽知问律师事务所 34134 专利代理师平静 (51)Int.Cl. G06F 40/211(2020.01) G06F 16/35(2019.01) G06F 40/284(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01) (54)发明名称一种基于选择性注意力和路径推理的文档级关系抽取方法 (57)摘要本发明公开了一种基于选择性注意力和路径推理的文档级关系抽取方法，属于信息抽取技术领域。本发明包括如下步骤：将整个文档进行输入；分层构建句内关系图和句间关系图，利用图神经网络获得实体指称项和句子的向量表示；聚合上述两个子图形成文档图，利用循环神经网络捕获文档中局部和非局部的信息交互；利用选择性注意力筛选出与实体对相关的句子，生成文档子图并将其作为关系抽取的范围；在文档子图中的多个实体之间显式建模推理链，预测出给定关系路径中每个关系的概率。本发明可以自动从文档中抽取出蕴含其中的关系事实，以及支撑这些关系事实存在的支撑证据，以发现更准确的句子间关系和支撑证据。权利要求书2页说明书7页附图2页 CN 115455938 A 2022.12.09 CN 115455938 A 1.一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：包括如下步骤： S1：将整个文档进行输入； S2：分层构建句内关系图和句间关系图，利用图神经网络获得实体指称项和句子自身的向量表示； S3：聚合上述两个子图形成文档图，利用循环神经网络在文档图中捕获文档局部和非局部的信息交互，并输出每个句子的最终表示； S4：利用选择性注意力筛选出与实体对相关的句子，生成文档子图并将其作为关系抽取的范围； S5：在文档子图中的多个实体之间显式建模推理链，预测出给定关系路径中每个关系的概率； S6：从文档中抽取出蕴含其中的关系事实，以及支撑这些关系事实存在的支撑证据。 2.根据权利要求1所述的一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：所述步骤S1中的文档包括文档标题、句子、实体指称项、实体类型、关系事实和相应的支撑证据。 3.根据权利要求1或2所述的一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：所述步骤S2的构建步骤如下： S2‑1：构建由每个句子的实体指称项组成的句内关系图，输出所有实体指称项对应的向量表示； S2‑2：构建由文档中的句子组成的句间关系图，输出所有句子自身的向量表示。 4.根据权利要求3所述的一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：所述步骤S2‑1的步骤如下： S2‑1‑1：获得句中每个单词相对于指称项对的上下文表示，该表示是由句中的词、共指、实体类型、句子编号和词位置嵌入拼接得到； S2‑1‑2：将单词相对于指称项对的上下文表示序列输入到一个包含双向长短期记忆网络和多层感知器的编码器中，用于捕获指称项对的表示； S2‑1‑3：将指称项对的边表示输入到多层循环神经网络中，逐层学习指称项节点的向量表示。 5.根据权利要求4所述的一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：所述步骤S2‑2的步骤如下： S2‑2‑1：获得每个句子相对于句子对的上下文表示，该表示是由文档中的句子嵌入和句子相对位置嵌入拼接得到； S2‑2‑2：将句子相对于句子对的上下文表示序列输入到一个包含双向长短期记忆网络和多层感知器的编码器中，用于捕获句子对的表示； S2‑2‑3：将句子对的边表示输入到多层循环神经网络中，逐层学习句子节点的向量表示。 6.根据权利要求5所述的一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：所述步骤S3的构建步骤如下： S3‑1：通过指称项的所属句子编号，为每个指称项和句子建立一条连接边，使得句内关权　利　要　求　书 1/2 页 2 CN 115455938 A 2系图和句间关系图进行聚合生成文档图； S3‑2：引入循环神经网络用于建模状态转换过程；在每个状态转换时，每个节点同时与其所有的图邻居交换信息； S3‑3：文档图的不同层可以表示句子的不同抽象级别的特征，所有的抽象级别的特征对于句子的最终表示都是至关重要的；为了覆盖所有级别的特征，将句子的每一层的表示连接起来，形成句子l的最终表示Hl。 7.根据权利要求6所述的一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：所述步骤S3 ‑2所指的信息交互，在默认情况下句内关系图和句间关系图仅在邻居节点进行信息交换，为了加快信息交流，在每次状态转换中增加邻居窗口的大小，以允许更多节点的通信；对于第k次状态转换，邻居窗口的大小可以按顺序扩展k个单词；随着迭代的增加，指称项节点和句子节点富含越来越多的上下文信息。 8.根据权利要求7所述的一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：所述步骤S4中的构建步骤如下： S4‑1：计算出文档中的每个句子与实体对的相关性，再根据相关性的结果，从高到低选择最相关的m个句子； S4‑2：将m个句子聚合成文档子图作为关系抽取的范围。 9.根据权利要求8所述的一种基于选择性注意力和路径推理的文档级关系抽取方法，其特征在于：所述步骤S5的构建步骤如下： S5‑1：构建实体对之间的直接路径和间接路径，直接路径表示实体对在一个句子中；间接路径表示实体对不在同一个句子中，可以使用修正后的双线性变换从子图G ′中获得的间接关系信息； S5‑2：将直接路径和间接路径进行组合，形成统一的路径表示； S5‑3：利用组合之后的路径表示，预测实体对之间存在某种关系的概率。权　利　要　求　书 2/2 页 3 CN 115455938 A 3

专利 一种基于选择性注意力和路径推理的文档级关系抽取方法

专利一种基于选择性注意力和路径推理的文档级关系抽取方法