(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210128348.3
(22)申请日 2022.02.11
(71)申请人 杭州网易云音乐科技有限公司
地址 310052 浙江省杭州市萧 山区钱江世
纪城奔竞大道353号杭州国际博览中
心A座1201室
(72)发明人 姚盛楠 朱一飞 冀文杰 裴中率
杨群芳 陈人树 王永亮 金林强
刘源 焦广才 罗琛
(74)专利代理 机构 北京律智知识产权代理有限
公司 11438
专利代理师 王辉 阚梓瑄
(51)Int.Cl.
G06F 40/205(2020.01)
G06F 40/211(2020.01)G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06F 16/33(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
文本关系抽取方法及装置、 计算机存储介
质、 电子设备
(57)摘要
本公开的实施方式涉及计算机技术领域, 更
具体地, 本公开的实施方式涉及 文本关系抽取方
法及装置、 计算机存储介质和电子设备。 所述方
法包括: 获取待处理文本, 将待处理文本输入至
多个句法解析器中, 得到多个解析结果; 将多个
解析结果分别输入至词向量获取模 型中, 得到与
每个解析结果对应的词向量矩阵; 将与每个解析
结果对应的词向量矩 阵输入至包含滑动窗口的
长短期记忆网络中, 得到与每个解析结果对应的
初始隐藏层; 将与每个解析结果对应的初始隐藏
层输入至图卷积模型中, 得到目标卷积特征, 对
目标卷积特征进行池化, 得到目标池化特征, 并
通过目标池化特征, 得到待处理文本中包括的文
本关系三元 组。 本方法提高了文本关系提取的正
确率以及效率。
权利要求书3页 说明书17页 附图6页
CN 114492380 A
2022.05.13
CN 114492380 A
1.一种文本关系抽取 方法, 其特 征在于, 包括:
获取待处理文本, 将所述待处理文本输入至多个句法解析器中, 得到分别与所述多个
句法解析器对应的多个解析 结果, 其中, 每 个解析结果包括至少一个分词;
将所述多个解析结果分别输入至词向量获取模型中, 得到与 所述每个解析结果对应的
词向量矩阵;
将与所述每个解析结果对应的词向量矩阵输入至包含滑动窗口的长短期记忆网络 中,
得到与所述每 个解析结果对应的初始隐藏层;
将与所述每个解析结果对应的初始隐藏层输入至 图卷积模型中, 得到目标卷积特征,
对所述目标卷积特征进 行池化, 得到目标池化特征, 并通过所述目标池化特征, 得到所述待
处理文本中包括的文本关系三元组。
2.根据权利要求1所述的文本关系抽取方法, 其特征在于, 将所述多个解析结果分别 输
入至词向量获取模型中, 得到与所述每 个解析结果对应的词向量矩阵, 包括:
获取所述每个解析结果的长度, 将所述每 个解析结果的长度调整为预设长度;
将调整长度后的每个解析结果中包括的分词分别 输入至所述词向量获取模型中, 得到
与所述每 个解析结果对应的词向量矩阵。
3.根据权利要求1所述的文本关系抽取方法, 其特征在于, 将与 所述每个解析结果对应
的词向量矩阵输入至包含滑动窗口的长 短期记忆网络中, 得到与所述每个解析结果对应的
初始隐藏层, 包括:
获取所述每个解析结果中包括的所有分词, 以及所有分词中每 个分词的上、 下文分词;
根据所述词向量矩阵中每个分词的词向量以及所述每个分词的上、 下文分词的词向
量, 生成所述每 个分词的上 下文词向量;
分别将所述每个分词的词向量以及所述每个分词的上下文词向量, 输入至所述包含滑
动窗口的长短期记 忆网络中, 得到与所述每 个解析结果对应的初始隐藏层。
4.根据权利要求1所述的文本关系抽取方法, 其特征在于, 所述图卷积模型中包括图卷
积神经网络以及自注意力机制; 其中, 将与所述每个解析结果对应的初始隐藏层输入至图
卷积模型中, 得到目标 卷积特征, 包括:
获取与所述每个解析结果对应的句法解析树, 将所述句法解析树转换为邻接矩阵, 并
将所述邻接矩阵以及所述每个解析结果对应的初始隐藏层输入至所述图卷积神经网络中,
得到与所述每 个解析结果对应的目标隐藏层;
获取所述每个解析结果中包括的分词的依赖关系, 根据 所述依赖关系以及所述自注意
力机制, 得到所述每 个解析结果的关系特 征矩阵;
利用所述关系特征矩阵替换所述邻 接矩阵, 将所述关系特征矩阵以及与所述每个解析
结果对应的目标隐藏层, 再次输入至所述图卷积神经网络中, 得到与所述每个解析结果对
应的目标 卷积特征。
5.根据权利要求4所述的文本关系抽取方法, 其特征在于, 获取所述每个解析结果中包
括的分词的依赖关系, 根据所述依赖关系以及所述自注意力机制, 得到所述每个解析结果
的关系特 征矩阵, 包括:
根据所述每个解析结果中包括的分词的依赖关系以及所述自注意力 机制, 生成关系注
意矩阵;权 利 要 求 书 1/3 页
2
CN 114492380 A
2对所述关系注意矩阵以及与 所述每个解析结果对应的目标隐藏层进行矩阵乘法, 得到
相乘结果;
对所述相乘结果以及与所述每个解析结果对应的目标隐藏层进行元素求和, 得到所述
每个解析结果的关系特 征矩阵。
6.根据权利要求5所述的文本关系抽取方法, 其特征在于, 利用所述关系特征矩阵替换
所述邻接矩阵, 将所述关系 特征矩阵以及与所述每个解析结果对应的目标隐藏层, 再次输
入至所述图卷积神经网络中, 得到与所述每 个解析结果对应的目标 卷积特征, 包括:
将所述邻 接矩阵替换为所述关系特征矩阵, 并获取与 所述关系特征矩阵对应的解析结
果的目标隐藏层;
将与所述每个解析结果对应的关系特征矩阵以及所述目标隐藏层, 再次输入至所述图
卷积神经网络中, 得到与所述每 个解析结果对应的增强特 征矩阵;
对与所述多个解析结果对应的多个所述增强特征矩阵进行特征融合, 得到所述目标卷
积特征。
7.根据权利要求1所述的文本关系抽取方法, 其特征在于, 对所述目标卷积特征进行池
化, 得到目标池化特征, 并通过所述目标池化特征, 得到所述待处理文本中包括的文本 关系
三元组, 包括:
获取所述待处理文本中包括的分词的实体位置信息, 通过所述实体位置信息进行池
化, 得到实体特 征信息;
对所述目标卷积特征进行池化, 得到特征池化信息, 对所述实体特征信息与所述特征
池化信息进行级联, 得到与所述待处 理文本对应的所述目标池化特 征;
将与所述待处理文本对应的所述目标池化特征输入至前馈神经网络 中, 得到与所述待
处理文本对应的目标特征, 并将所述 目标特征输入至分类器中, 得到所述待处理文本中包
括的分词的关系概 率分布;
通过所述分词的关系概 率分布, 得到所述待处 理文本中包括的文本关系三元组。
8.一种文本关系抽取装置, 其特 征在于, 包括:
句法解析模块, 用于获取待处理文本, 将所述待处理文本输入至多个句法解析器中, 得
到分别与所述多个句法解析器对应的多个解析结果, 其中, 每个解析结果包括至少一个分
词;
词向量矩阵获取模块, 用于将所述多个解析结果分别输入至词向量获取模型中, 得到
与所述每 个解析结果对应的词向量矩阵;
隐藏层获取模块, 用于将与 所述每个解析结果对应的词向量矩阵输入至包含滑动窗口
的长短期记 忆网络中, 得到与所述每 个解析结果对应的初始隐藏层;
文本关系提取模块, 用于将与所述每个解析结果对应的初始隐藏层输入至图卷积模型
中, 得到目标卷积特征, 对所述 目标卷积特征进行池化, 得到目标池化特征, 并通过所述目
标池化特 征, 得到所述待处 理文本中包括的文本关系三元组。
9.一种存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理器执行
时实现权利要求1~7中任一项所述的文本关系抽取 方法。
10.一种电子设备, 其特 征在于, 包括:
处理器; 以及权 利 要 求 书 2/3 页
3
CN 114492380 A
3
专利 文本关系抽取方法及装置、计算机存储介质、电子设备
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:36上传分享