(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211383318.3
(22)申请日 2022.11.07
(71)申请人 巢湖学院
地址 238000 安徽省巢湖市巢湖经济开发
区半汤路1号
(72)发明人 吴其林 程军 曹骞 方周
(74)专利代理 机构 合肥市浩智运专利代理事务
所(普通合伙) 34124
专利代理师 朱文振
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 40/30(2020.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于双层异质图的事理知识图谱关系
补全方法及系统
(57)摘要
本发明提供一种基于双层异质图的事理知
识图谱关系补全方法及系统, 方法包括: 将事件
中包含的实体抽取处理, 构建整体的异质图, 结
合每个事件映射的异质子图的图结构信息及其
节点信息可以更好的帮助模型进行事理知识图
谱的关系补全。 在构建的异质图中使用图神经网
络模型GNN进行表示学习, 然后结合多种信息融
合更新事件特征, 进而应用Tran sR模型对事理知
识图谱进行关系补全。 本发明解决了事件关系补
全困难以及 补全准确度较低的技 术问题。
权利要求书3页 说明书8页 附图9页
CN 115438197 A
2022.12.06
CN 115438197 A
1.一种基于双 层异质图的事理知识图谱关系补全方法, 其特 征在于, 所述方法包括:
S1、 从已知的事理知识图谱中, 获取全部事件中的对应关系, 其中, 所述对应关系包
括: 所述全部事 件包含的所有实体构成的异质图;
S2、 对所述异质图进行表示学习, 据以获得每个实体节点的向量表示, 以得到子图结构
嵌入特征表示, 据以获取 预训练模型, 其中, 所述 步骤S2还 包括:
S21、 获取并利用预置 逻辑表示元路径;
S22、 根据所述元路径的节点嵌入聚合得到元路径嵌入表示, 据以构造语义嵌入矩阵,
融合处理一个事件中的不少 于2个的所述元路径, 以得到所述事件在所述异质图上 的子图
语义特征;
S23、 根据原始异质子图的节点特征和语义特征, 分别生成异质子图, 融合所述异质子
图与所述原 始异质子图, 以得到第一融合 新异质子图;
S24、 根据 所述第一融合新异质子图中的每个所述事件映射一个子图, 与该子图的所述
节点特征和所述语义特 征进行融合处 理, 据以得到第二融合 新异质子图;
S25、 将所述第二融合新异质子图输入到图神经网络模型 GNN和预置正则化器中, 以通
过双层异质图联合学习, 优化所述第二融合新异质子图的图结构和 GNN参数, 以得到所述预
训练模型;
S3、 结合所述预训练模型, 提取 所述事理知识图谱中的事 件语义特 征;
S4、 结合所述子 图结构嵌入特征表示以及所述事件语义特征, 据以进行异质图联合学
习, 据以得到事理知识图谱关系预测模型;
S5、 获取并利用新事件实体, 根据所述事理知识图谱关系预测模型, 对基本异质图进行
扩展补全, 以得到更新异质图, 利用所述更新异质图更新所述子图结构嵌入特征表示, 据以
补全所述事理知识图谱, 其中, 所述事理知识图谱关系预测模型包括: TransR模型。
2.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征
在于, 所述 步骤S1包括:
S11、 利用已知的所述事理知识图谱 KG, 与所述事理知识图谱 KG中的所有事件节点包含
的所述实体构成所述异质图 G, 其中, 以下述逻辑表示所述异质图:
G= (V,E,F)
其中,V表示节点 集合,E表示边集合,F表示特征集合;
S12、 获取事件知识图谱中的对应关系, 其中, 所述对应关系包括:事件 Ee与所述事件之
间的关系 Re, 所述事理知识图谱中的所述事件之间的关系类型包括: 因果关系、 条件关系、
反转关系 、 顺承关系 、 上下位关系 、 组成关系和并发关系;
S13、 从所述事件中抽取实体 Eg及实体间关系 Rg,据以构成异质子图, 并利用每个所述事
件与该所述事件的所述异质子图建立映射关系, 其中, 所述 实体的类型包括: 人物、 事物、 地
点, 每个所述事 件包括: 所述实体及所述实体间关系;
S14、 以所述实体为边界, 在所述异质图 G上划分与所述事件对应的异质子图 Gsub, 并在
所述异质图表示学习过程中, 融合所述异质子图 Gsub的子图结构信息 。
3.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征
在于, 所述 步骤S21中, 利用下述逻辑定义所述元路径 P:权 利 要 求 书 1/3 页
2
CN 115438197 A
2据以描述节点 v1和节点vl+1之间的复合关系。
4.根据权利要求3所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征
在于, 以下述逻辑表示所述复合关系:
其中,v表示所述异质图中的所述节点, r表示所述异质图中所述节点之间的关系, 符号
ᵒ表示集合之间的映射。
5.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征
在于, 所述步骤S25中, 利用所述事件映射子图生 成结构信息, 该所述结构信息包括: 所述第
一融合新异质子图以及所述第二融合 新异质子图的影响数据。
6.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征
在于, 所述 步骤S3包括:
S31、 从所述预训练模型中, 获取文本的文本向量表示;
S32、 利用预置的中文预训练模型BERT ‑wwm, 从所述预训练模型中获取中文文本向量表
示;
S33、 根据所述文本的具体文本长度分布情况, 进行补0及截断处理, 以设置适用文本长
度;
S34、 根据所述文本的位置信息, 处 理得到文本嵌入表示, 据以作为所述事 件语义特 征。
7.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征
在于, 所述 步骤S4包括:
S41、 结合处 理所述异质图的所述子图结构嵌入特 征表示以及所述事 件语义特 征;
S42、 结合TransR算 法, 针对所述子图结构特征表示中的三元组< eeh,re,eet>, 以结点 eeh
作为头结点, 结点 eet作为尾结点, 并使得期望头结点向量和关系向量之和逼 近尾结点向量,
以达到所述头节点及所述尾结点 适用状态;
S43、 损失函数利用负采样的max ‑margin函数, 以下述逻辑处 理得到损失函数:
L(y,y’)=max(0,margi n‑y+y’)
其中,y是正样本的得分, y’是负样本的得分;
S44、 对于所述事理知识图谱, 以下述逻辑表示 其知识表示损失函数:
L(eeh,re,eet)=max(0,dpos‑dneg+margin)
其中,d=||eeh+re‑eet||, 表示L1、 L2范数,L是损失函数, re是向量et和eh之间的差, dpos
是正样本特 征距离,dneg是负样本特征距离,margin是惩罚函数;
S45、 利用所述损失函数以及所述知识表示损失函数, 进行异质图联合学习, 以得到所
述事理知识图谱关系预测模型, 据以进行关系补全。
8.根据权利要求7所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征
在于, 所述 步骤S42中, 以下述逻辑表示所述头尾结点 适用状态: eeh+re=eet。
9.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征
在于, 所述 步骤S5包括:权 利 要 求 书 2/3 页
3
CN 115438197 A
3
专利 一种基于双层异质图的事理知识图谱关系补全方法及系统
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:43上传分享