(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210046579.X
(22)申请日 2022.01.17
(65)同一申请的已公布的文献号
申请公布号 CN 114065770 A
(43)申请公布日 2022.02.18
(73)专利权人 江苏联著实业股份有限公司
地址 210006 江苏省南京市秦淮区中山 南
路501号通服大厦15 02室
(72)发明人 邹华 姚军 王楠 丁原 徐志国
宋永生 李军 郭晓华 周红
(74)专利代理 机构 无锡苏元专利代理事务所
(普通合伙) 32471
代理人 王清伟
(51)Int.Cl.
G06F 40/30(2020.01)G06N 3/08(2006.01)
G06F 16/35(2019.01)
审查员 曾鹏飞
(54)发明名称
一种基于图神经网络构建语义知识库的方
法及系统
(57)摘要
本发明公开了一种基于图神经网络构建语
义知识库的方法及系统, 所述方法包括: 获得第
一大规模语料信息; 基于NLP技术的事物提取器
从所述第一大规模语料信息中进行文本事物识
别和提取, 获得第一文本事物集合; 构建事物层
次网络; 根据所述事物层次网络对 所述第一文本
事物集合中的每个事物进行语义元分析, 构建第
一语义元集合; 利用图神经网络对 所述第一语义
元集合进行组网, 获得第一语义知识网; 通过对
所述第一语义知识网进行强化学习, 获得第二语
义知识网; 将所述第二语义知识网作为语义知识
库的形式进行输出。 解决了 现有技术中存在从大
规模语料库中构建多层次语义知识库的不够完
善, 且自动化水平较弱的技 术问题。
权利要求书3页 说明书12页 附图3页
CN 114065770 B
2022.04.15
CN 114065770 B
1.一种基于图神经网络构建语义知识库的方法, 其特 征在于, 所述方法包括:
获得第一大规模语料信息;
基于NLP技术的事物提取器从所述第一大规模语料信息中进行文本事物识别和提取,
获得第一文本事物集 合;
构建事物层次网络; 其中, 所述构建事物层次网络包括:
构建事物分类规则, 其中, 所述事物分类规则包括第一分类规则和第二分类规则, 其
中, 所述第一分类规则为狭义分类, 所述第二分类为广义分类;
根据所述第一分类规则, 构建事物狭义层次网络; 其中, 狭义层次指的是行为过程之间
的嵌套所 形成的层次;
根据所述第二分类规则, 构建事物广义层次网络; 其中, 广义层次指的是事物性质的抽
象描述与具体实例之间的层次关系;
根据所述事物 狭义层次网络和所述事物广义层次网络, 构建所述事物层次网络;
根据所述事物层次网络对所述第 一文本事物集合中的每个事物进行语义元分析, 构建
第一语义元集 合;
利用图神经网络对所述第一语义元集 合进行组网, 获得第一语义知识网;
通过对所述第一语义知识网进行强化学习, 获得第二语义知识网;
将所述第二语义知识网作为语义知识库的形式进行输出, 并将所述语义知识库输入所
述事物层次网络中形成闭环补偿。
2.如权利要求1所述的方法, 其特征在于, 所述基于NLP技术的事物提取器从所述第一
大规模语料信息中进行文本事物 识别和提取, 获得第一文本事物集 合, 所述方法还 包括:
通过对所述第 一大规模语料信 息进行句子语义标注, 基于所述句子语义标注的信 息和
神经网络深度学习技术, 构建事物提取规则, 其中, 所述事物提取规则包括第一单元和第二
单元, 所述第一单 元为环境识别单 元, 所述第二单 元为要素识别单 元;
根据所述第一单 元, 获得第一环境变量 集;
所述第二单元根据句型逻辑树对所述第一大规模语料进行事物核心要素识别和事件
关键信息识别, 获得第一核心要素集和第一关键信息集;
根据所述第一核心要素集、 所述第一关键信息集和所述第一环境变量集, 生成所述第
一文本事物集 合。
3.如权利要求2所述的方法, 其特 征在于, 所述方法还 包括:
通过对所述第 一核心要素集和所述第 一关键信 息集进行类节点对齐和消歧处理, 确定
第一事件节点;
通过对所述第 一事件节点的事件行为层级关键信 息和所述狭义层次网络进行分析, 获
得第一连接节点组;
通过对所述第 一事件节点的事件性质层级关键信 息和所述广义层次网络进行分析, 获
得第二连接节点组;
以所述第一事件节点为中心, 以所述第一连接节点组和所述第二连接节点组为分支,
构建第一语义元, 其中, 所述第一语义元集 合包含所述第一语义元。
4.如权利要求3所述的方法, 其特 征在于, 所述方法还 包括:
通过对所述第 一事件节点的事物行为顺承关键信 息进行分析, 确定所述第 一连接节点权 利 要 求 书 1/3 页
2
CN 114065770 B
2组的节点 位置, 其中, 所述第一连接节点组包上层名称节点和下层名称节点;
根据所述第一环境变量集的时间序列进行分析, 确定所述第二连接节点组的节点位
置, 其中, 所述第二连接节点组包括前步骤节点和后步骤节点;
根据所述第 一连接节点组的节点位置和所述第 一连接节点组的节点位置, 构建所述第
一语义元。
5.如权利要求1所述的方法, 其特征在于, 所述通过对所述第 一语义知识网进行强化学
习, 获得第二语义知识网, 所述方法还 包括:
获得第一新增节点的第一邻居矩阵, 其中, 所述第一邻居矩阵为所述第一新增节点与
所有连接点 边的权值构成的矩阵;
获得N个新增节点;
根据所述 N个新增节点, 获得N个邻居矩阵;
根据所述N个邻居矩阵对实时输入的N个节点进行序列位置匹配, 获得所述第 二语义知
识网。
6.如权利要求1所述的方法, 其特征在于, 通过构造梯度函数L进行迭代, 获得所述第二
语义知识网, 所述梯度函数L 为:
L= δ(H^(t+1)‑H^t)
其中, t为当前状态; t+1为下一个状态; H^(t+1)表示语义元集合的下一个状态; H^t表
示语义元集 合的当前状态。
7.一种基于图神经网络构建语义知识库的系统, 其特 征在于, 所述系统包括:
第一获得 单元, 所述第一获得 单元用于获得第一大规模语料信息;
第二获得单元, 所述第二获得单元用于基于NLP技术的事物提取器从所述第一大规模
语料信息中进行文本事物 识别和提取, 获得第一文本事物集 合;
第一构建单元, 所述第一构建单元用于构建事物层次网络; 其中, 所述第 一构建单元包
括:
第三构建单元, 所述第三构建单元用于构建事物分类规则, 其中, 所述事物分类规则包
括第一分类规则和 第二分类规则, 其中, 所述第一分类规则为狭义分类, 所述第二分类为广
义分类;
第四构建单元, 所述第 四构建单元用于根据所述第一分类规则, 构建事物狭义层次网
络; 其中, 狭义层次指的是 行为过程之间的嵌套所 形成的层次;
第五构建单元, 所述第五构建单元用于根据所述第二分类规则, 构建事物广义层次网
络; 其中, 广义层次指的是事物性质的抽象描述与具体实例之间的层次关系;
第六构建单元, 所述第六构建单元用于根据 所述事物狭义层次网络和所述事物广义层
次网络, 构建所述事物层次网络;
第二构建单元, 所述第 二构建单元用于根据 所述事物层次网络对所述第 一文本事物集
合中的每 个事物进行语义元分析, 构建第一语义元集 合;
第一组网单元, 所述第 一组网单元用于利用图神经网络对所述第 一语义元集合进行组
网, 获得第一语义知识网;
第一强化单元, 所述第一强化单元用于通过对所述第一语义知识网进行强化学习, 获
得第二语义知识网;权 利 要 求 书 2/3 页
3
CN 114065770 B
3
专利 一种基于图神经网络构建语义知识库的方法及系统
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:53上传分享