(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211383318.3 (22)申请日 2022.11.07 (71)申请人 巢湖学院 地址 238000 安徽省巢湖市巢湖经济开发 区半汤路1号 (72)发明人 吴其林 程军 曹骞 方周  (74)专利代理 机构 合肥市浩智运专利代理事务 所(普通合伙) 34124 专利代理师 朱文振 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/30(2020.01) G06N 3/08(2006.01) (54)发明名称 一种基于双层异质图的事理知识图谱关系 补全方法及系统 (57)摘要 本发明提供一种基于双层异质图的事理知 识图谱关系补全方法及系统, 方法包括: 将事件 中包含的实体抽取处理, 构建整体的异质图, 结 合每个事件映射的异质子图的图结构信息及其 节点信息可以更好的帮助模型进行事理知识图 谱的关系补全。 在构建的异质图中使用图神经网 络模型GNN进行表示学习, 然后结合多种信息融 合更新事件特征, 进而应用Tran sR模型对事理知 识图谱进行关系补全。 本发明解决了事件关系补 全困难以及 补全准确度较低的技 术问题。 权利要求书3页 说明书8页 附图9页 CN 115438197 A 2022.12.06 CN 115438197 A 1.一种基于双 层异质图的事理知识图谱关系补全方法, 其特 征在于, 所述方法包括:  S1、 从已知的事理知识图谱中, 获取全部事件中的对应关系, 其中, 所述对应关系包 括: 所述全部事 件包含的所有实体构成的异质图; S2、 对所述异质图进行表示学习, 据以获得每个实体节点的向量表示, 以得到子图结构 嵌入特征表示, 据以获取 预训练模型, 其中, 所述 步骤S2还 包括: S21、 获取并利用预置 逻辑表示元路径; S22、 根据所述元路径的节点嵌入聚合得到元路径嵌入表示, 据以构造语义嵌入矩阵, 融合处理一个事件中的不少 于2个的所述元路径, 以得到所述事件在所述异质图上 的子图 语义特征; S23、 根据原始异质子图的节点特征和语义特征, 分别生成异质子图, 融合所述异质子 图与所述原 始异质子图, 以得到第一融合 新异质子图; S24、 根据 所述第一融合新异质子图中的每个所述事件映射一个子图, 与该子图的所述 节点特征和所述语义特 征进行融合处 理, 据以得到第二融合 新异质子图; S25、 将所述第二融合新异质子图输入到图神经网络模型 GNN和预置正则化器中, 以通 过双层异质图联合学习, 优化所述第二融合新异质子图的图结构和 GNN参数, 以得到所述预 训练模型; S3、 结合所述预训练模型, 提取 所述事理知识图谱中的事 件语义特 征; S4、 结合所述子 图结构嵌入特征表示以及所述事件语义特征, 据以进行异质图联合学 习, 据以得到事理知识图谱关系预测模型; S5、 获取并利用新事件实体, 根据所述事理知识图谱关系预测模型, 对基本异质图进行 扩展补全, 以得到更新异质图, 利用所述更新异质图更新所述子图结构嵌入特征表示, 据以 补全所述事理知识图谱, 其中, 所述事理知识图谱关系预测模型包括: TransR模型。 2.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征 在于, 所述 步骤S1包括: S11、 利用已知的所述事理知识图谱 KG, 与所述事理知识图谱 KG中的所有事件节点包含 的所述实体构成所述异质图 G, 其中, 以下述逻辑表示所述异质图: G= (V,E,F) 其中,V表示节点 集合,E表示边集合,F表示特征集合; S12、 获取事件知识图谱中的对应关系, 其中, 所述对应关系包括:事件 Ee与所述事件之 间的关系 Re, 所述事理知识图谱中的所述事件之间的关系类型包括: 因果关系、 条件关系、 反转关系 、 顺承关系 、 上下位关系 、 组成关系和并发关系; S13、 从所述事件中抽取实体 Eg及实体间关系 Rg,据以构成异质子图, 并利用每个所述事 件与该所述事件的所述异质子图建立映射关系, 其中, 所述 实体的类型包括: 人物、 事物、 地 点, 每个所述事 件包括: 所述实体及所述实体间关系; S14、 以所述实体为边界, 在所述异质图 G上划分与所述事件对应的异质子图 Gsub, 并在 所述异质图表示学习过程中, 融合所述异质子图 Gsub的子图结构信息 。 3.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征 在于, 所述 步骤S21中, 利用下述逻辑定义所述元路径 P:权 利 要 求 书 1/3 页 2 CN 115438197 A 2据以描述节点 v1和节点vl+1之间的复合关系。 4.根据权利要求3所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征 在于, 以下述逻辑表示所述复合关系: 其中,v表示所述异质图中的所述节点, r表示所述异质图中所述节点之间的关系, 符号 ᵒ表示集合之间的映射。 5.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征 在于, 所述步骤S25中, 利用所述事件映射子图生 成结构信息, 该所述结构信息包括: 所述第 一融合新异质子图以及所述第二融合 新异质子图的影响数据。 6.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征 在于, 所述 步骤S3包括: S31、 从所述预训练模型中, 获取文本的文本向量表示; S32、 利用预置的中文预训练模型BERT ‑wwm, 从所述预训练模型中获取中文文本向量表 示; S33、 根据所述文本的具体文本长度分布情况, 进行补0及截断处理, 以设置适用文本长 度; S34、 根据所述文本的位置信息, 处 理得到文本嵌入表示, 据以作为所述事 件语义特 征。 7.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征 在于, 所述 步骤S4包括: S41、 结合处 理所述异质图的所述子图结构嵌入特 征表示以及所述事 件语义特 征; S42、 结合TransR算 法, 针对所述子图结构特征表示中的三元组< eeh,re,eet>, 以结点 eeh 作为头结点, 结点 eet作为尾结点, 并使得期望头结点向量和关系向量之和逼 近尾结点向量, 以达到所述头节点及所述尾结点 适用状态; S43、 损失函数利用负采样的max ‑margin函数, 以下述逻辑处 理得到损失函数: L(y,y’)=max(0,margi n‑y+y’) 其中,y是正样本的得分, y’是负样本的得分; S44、 对于所述事理知识图谱, 以下述逻辑表示 其知识表示损失函数: L(eeh,re,eet)=max(0,dpos‑dneg+margin) 其中,d=||eeh+re‑eet||, 表示L1、 L2范数,L是损失函数, re是向量et和eh之间的差, dpos 是正样本特 征距离,dneg是负样本特征距离,margin是惩罚函数; S45、 利用所述损失函数以及所述知识表示损失函数, 进行异质图联合学习, 以得到所 述事理知识图谱关系预测模型, 据以进行关系补全。 8.根据权利要求7所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征 在于, 所述 步骤S42中, 以下述逻辑表示所述头尾结点 适用状态: eeh+re=eet。 9.根据权利要求1所述的一种基于双层异质图的事理知识图谱关系补全方法, 其特征 在于, 所述 步骤S5包括:权 利 要 求 书 2/3 页 3 CN 115438197 A 3

PDF文档 专利 一种基于双层异质图的事理知识图谱关系补全方法及系统

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于双层异质图的事理知识图谱关系补全方法及系统 第 1 页 专利 一种基于双层异质图的事理知识图谱关系补全方法及系统 第 2 页 专利 一种基于双层异质图的事理知识图谱关系补全方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。