文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211134776.3 (22)申请日 2022.09.19 (71)申请人 安徽工业大学 地址 243002 安徽省马鞍山市湖东路59号 (72)发明人 杭婷婷 吴宣够 黄俊 刘辉 (74)专利代理 机构 安徽知问律师事务所 34134 专利代理师 平静 (51)Int.Cl. G06F 40/211(2020.01) G06F 16/35(2019.01) G06F 40/284(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01) (54)发明名称 一种基于选择性注意力和路径推理的文档 级关系抽取方法 (57)摘要 本发明公开了一种基于选择性注意力和路 径推理的文档级关系抽取方法, 属于信息抽取技 术领域。 本发明包括如下步骤: 将整个文档进行 输入; 分层构建句内关系图和句间关系图, 利用 图神经网络获得实体指称项和句子的向量表示; 聚合上述两个子图形成文档图, 利用循环神经网 络捕获文档中局部和非局部的信息交互; 利用选 择性注意力筛选出与实体对相关的句子, 生成文 档子图并将其作为关系抽取的范围; 在文档子图 中的多个实体 之间显式建模推理链, 预测出给定 关系路径中每个 关系的概率。 本发 明可以自动从 文档中抽取出蕴含其中的关系事实, 以及支撑这 些关系事实存在的支撑证据, 以发现更准确的句 子间关系和支撑 证据。 权利要求书2页 说明书7页 附图2页 CN 115455938 A 2022.12.09 CN 115455938 A 1.一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 包括如下 步骤: S1: 将整个文档进行输入; S2: 分层构建句内关系图和句间关系图, 利用图神经网络获得实体指称项和句子自身 的向量表示; S3: 聚合上述两个子图形成文档图, 利用循环神经网络在文档图中捕获文档局部和非 局部的信息交 互, 并输出每 个句子的最终表示; S4: 利用选择性注意力筛选出与实体对相关的句子, 生成文档子图并将其作为关系抽 取的范围; S5: 在文档子图中的多个实体之间显式建模推理链, 预测出给定关系路径中每个关系 的概率; S6: 从文档中抽取 出蕴含其中的关系事实, 以及支撑这些关系事实存在的支撑证据。 2.根据权利要求1所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述步骤S1中的文档包括文档标题、 句子、 实体指称项、 实体类型、 关系事实和 相应的支撑证据。 3.根据权利要求1或2所述的一种基于选择性注意力和路径推理的文档级关系抽取方 法, 其特征在于: 所述 步骤S2的构建步骤如下: S2‑1: 构建由每个句子的实体指称项组成的句内关系图, 输出所有实体指称项对应的 向量表示; S2‑2: 构建由文档中的句子组成的句间关系图, 输出 所有句子自身的向量表示。 4.根据权利要求3所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S2‑1的步骤如下: S2‑1‑1: 获得句中每个单词相对于指称项对的上下文表示, 该表示是由句中的词、 共 指、 实体类型、 句子编号和词位置嵌入拼接得到; S2‑1‑2: 将单词相对于指称项对的上下文表示序列输入到一个包含双向长短期记忆网 络和多层感知器的编码器中, 用于捕获指称项对的表示; S2‑1‑3: 将指称项对 的边表示输入到多层循环神经网络中, 逐层学习指称项节点的向 量表示。 5.根据权利要求4所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S2‑2的步骤如下: S2‑2‑1: 获得每个句子相对于句子对 的上下文表示, 该表示是由文档中的句子嵌入和 句子相对位置嵌入拼接得到; S2‑2‑2: 将句子相对于句子对的上下文表示序列输入到一个包含双向长短期记忆网络 和多层感知器的编码器中, 用于捕获句子对的表示; S2‑2‑3: 将句子对的边表示输入到多层循环神经网络中, 逐层学习句子节点的向量表 示。 6.根据权利要求5所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S3的构建步骤如下: S3‑1: 通过指称项的所属句子编号, 为每个指称项和句子建立一条连接边, 使得句内关权 利 要 求 书 1/2 页 2 CN 115455938 A 2系图和句间关系图进行聚合 生成文档图; S3‑2: 引入循环神经网络用于建模状态转换过程; 在每个状态转换时, 每个节点同时与 其所有的图邻居交换信息; S3‑3: 文档图的不同层可以表示句子的不同抽象级别的特征, 所有的抽象级别的特征 对于句子的最终表示都是至关重要的; 为了覆盖所有级别的特征, 将句 子的每一层的表示 连接起来, 形成句子l的最终表示Hl。 7.根据权利要求6所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述步骤S3 ‑2所指的信息交互, 在默认情况下句内关系图和句间关系图仅在 邻居节点进行信息交换, 为了加快信息交流, 在每次状态转换中增加邻居窗口的大小, 以允 许更多节点的通信; 对于第k次状态转换, 邻居窗口的大小 可以按顺序扩展k个单词; 随着迭 代的增加, 指称项节点和句子节点 富含越来越多的上 下文信息 。 8.根据权利要求7所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S4中的构建步骤如下: S4‑1: 计算出文档中的每个句子与实体对的相关性, 再根据相关性的结果, 从高到低选 择最相关的m个句子; S4‑2: 将m个句子聚合成文档子图作为关系抽取的范围。 9.根据权利要求8所述的一种基于选择性注意力和路径推理的文档级关系抽取方法, 其特征在于: 所述 步骤S5的构建步骤如下: S5‑1: 构建实体对之间的直接路径和间接路径, 直接路径表示实体对在一个句子中; 间 接路径表示 实体对不在同一个句子中, 可以使用修正后的双线性变换从子图G ′中获得的间 接关系信息; S5‑2: 将直接路径和间接路径进行组合, 形成统一的路径 表示; S5‑3: 利用组合之后的路径 表示, 预测实体对之间存在某种关系的概 率。权 利 要 求 书 2/2 页 3 CN 115455938 A 3
专利 一种基于选择性注意力和路径推理的文档级关系抽取方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 02:11:38
上传分享
举报
下载
原文档
(552.6 KB)
分享
友情链接
JY-T 1004-2012 教育管理信息 普通中小学校管理信息.pdf
T-NIFA 26—2023 移动金融客户端应用软件上架资质指引.pdf
GB-T 479-2016 烟煤胶质层指数测定方法.pdf
GB-T 16264.8-2005 信息技术 开放系统互连 目录 第8部分 公钥和属性证书框架.pdf
奇安信 大中型政企机构网络安全风险分析报告.pdf
DL-T 5175-2021 火力发电厂热工开关量和模拟量控制系统设计规程.pdf
GB-T 32649-2016 光伏用高纯石英砂.pdf
GB-T 3286.11-2022 石灰石及白云石化学分析方法 第11部分:氧化钙、氧化镁、二氧化硅、氧化铝及氧化铁含量的测定 波长色散X射线荧光光谱法(熔铸玻璃片法).pdf
全知科技数据安全治理之数据安全风险评估白皮书.pdf
T-CSAE 79—2018 能量回馈式汽车液压防抱死制动系统 性能要求及试验方法.pdf
DB52-T 945-2015 热力输送管道节能技术规范 贵州省.pdf
GB-T 30057-2013 国际货运代理合同规范.pdf
DB31-T 960-2023 冷却塔节能监测 上海市.pdf
奇安信2023年第二版-电子数据司法鉴定典型案例集.pdf
GB/T 1.2-2020 标准化工作导则 第2部分 以ISO IEC标准化文件为基础的标准化文件起草规则.pdf
DB11-T 1448-2017 城市轨道交通工程资料管理规程 北京市.pdf
绿盟 2013年工业控制系统及其安全性研究报.pdf
思度安全-DSMM-024 监控与审计管理规范V1.0.pdf
深信服 销售技巧之客户公关 2022.pdf
启明星辰 信创的现状及工程建设思路.pdf
1
/
3
12
评价文档
赞助2元 点击下载(552.6 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。