standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210022610.6 (22)申请日 2022.01.10 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 徐童 陈恩红 陈力以 李徵  武晗  (74)专利代理 机构 北京凯特来知识产权代理有 限公司 1 1260 代理人 郑立明 韩珂 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/583(2019.01) G06F 40/284(2020.01) G06F 40/30(2020.01)G06V 10/40(2022.01) G06V 10/56(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) (54)发明名称 一种知识图谱实体对齐方法、 系统、 设备与 存储介质 (57)摘要 本发明公开了一种知识图谱实体对齐方法、 系统、 设备与存储介质, 对于不同的两个多模态 知识图谱采用共享参数的多模态孪生网络结构 实现实体的表征, 通过挖掘跨模态的语义关联和 多角度对比正负实体对的特征来利用和实体相 关的多模态信息, 能够有效提升多模态实体对齐 任务的准确性。 权利要求书4页 说明书9页 附图1页 CN 114357193 A 2022.04.15 CN 114357193 A 1.一种知识图谱实体对齐方法, 其特 征在于, 包括: 训练阶段, 通过多模态知识嵌入网络提取实体特征, 其中: 对于每一实体, 从对应 图像 中提取相应的视觉特征, 并基于视觉特征对预训练的BERT模型提取的属性特征进 行视觉自 适应处理, 获得最终的属 性特征, 以及采用针对关系的视觉增强机制对图谱嵌入模型提取 的关系特征进 行视觉增强处理, 获得最终的关系特征, 再将视觉特征、 最 终的关系特征与最 终的属性特征整合为整体的实体表征; 并且, 利用来自不同知识图谱的两个实体的单模态 特征和整体的实体表征进 行相似度对比学习, 所述单模态特征包括: 视觉特征、 最 终的关系 特征与最 终的属性特征; 利用视觉增强处理 时的损失函数与对比学习的损失函数构建总损 失函数进 行训练, 更新多模态知识嵌入网络的参数; 训练完毕后, 利用训练后的多模态知识 嵌入网络获得 更新后的实体的整体的实体表征; 对于两个不同知识图谱中的实体, 通过更新后的整体的实体表征, 两两进行相似度计 算, 选择相似度最高的两个实体作为对齐实体。 2.根据权利要求1所述的一种知识图谱实体对齐方法, 其特征在于, 所述对于每一实 体, 从对应图像中提取相应的视 觉特征包括: 对于实体e, 利用残差网络模型从对应 图像i中提取特征, 并通过线性变换获得投影到 对应空间, 获得相应的视 觉特征, 表示为: ie=ResNet(i) eI=W1·ie+b1 其中, ResNet表示残差网络模型, ie表示残差网络模型从图像i中提取的特征, eI表示相 应的视觉特征, W1与b1表示线性变换的权 重与偏置参数。 3.根据权利要求1所述的一种知识图谱实体对齐方法, 其特征在于, 采用针对关系的视 觉增强机制对图谱嵌入模型提取的关系特征进行视觉增强处理, 获得最终的关系特征包 括: 训练阶段, 利用正负样本, 结合图谱嵌入模型的损 失函数以及视觉增强的损 失函数优 化图谱嵌入模 型; 其中, 正样 本是指三元关系组的关系正确, 即头尾实体满足相应的关系r, 负样本是指三元关系组关系 不正确, 即头尾实体不满足相应的关系r; 正样本表示为(h,r, t), h与t分别为头实体与尾实体; 负 样本表示 为(h′,r,t′), h′与t′分别为头实体与尾实体; 通过图谱嵌入模型提取正负样本 中头实体与尾实体的实体嵌入向量, 以及 关系的嵌入 向量, 并带入图谱嵌入模型的损失函数进 行计算; 计算视觉增强的损失函数时, 先通过残差 网络与线性变换获得正负样本对应图像的视觉特征, 再结合图谱嵌入模型提取的关系嵌入 向量带入视 觉增强的损失函数进行计算; 训练完毕后, 通过图谱嵌入 模型提取实体嵌入向量作为相应实体最终的关系特 征。 4.根据权利要求3所述的一种知识图谱实体对齐方法, 其特 征在于, 图谱嵌入 模型的损失函数 数表示为: 权 利 要 求 书 1/4 页 2 CN 114357193 A 2其中, TR表示正样本集合, T ′R表示负样本集合; (h,r,t)=τ, (h ′,r,t′)=τ′, hR、 h′R各自 表示头实体h、 头实体h ′的实体嵌入向量, tR、 t′R各自表示尾实体t、 尾实体t ′的实体嵌入向 量, hr表示关系r的嵌入向量, 实体嵌入向量与关系r的嵌入向量均为图谱嵌入模型的输出; Υr表示得分间隔, fr(.)表示得分函数。 5.根据权利要求3或4所述的一种知识图谱实体对齐方法, 其特征在于, 视觉增强的损 失函数表示 为: 其中, fi(.)表示得分函数, Υi表示得分间隔, 分别表示头实体h与尾实体t对应 图像的视 觉特征, 分别表示头实体h ′与尾实体t ′对应图像的视 觉特征; 其中, 头实体h与尾实体t对应图像的视 觉特征 提取过程表示 为: 其中, ResNet表示残差网络模型, 分别表示头实体h、 尾实体t对应的图像, ih、 it分 别表示残差网络模型从图像 中提取的特 征, W2与b2表示线性变换的权 重与偏置参数; 视觉特征 以及实体嵌入向量tR, 满足: tR≈hR+hr 6.根据权利要求1所述的一种知识图谱实体对齐方法, 其特征在于, 所述基于视觉特征 对通过预训练的BERT模型提取的属性特 征进行视 觉自适应处 理包括: 通过预训练的BERT模型提取属性特 征, 步骤包括: 对于实体的每一属性, 通过预训练的BERT模型提取属性名称的词向量, 并进行平均后 进行第一次线性变换, 获得属性名称特征; 同时, 将相应属性值做归一化后平铺构成数值向 量, 并与相应的属性名称特征进 行拼接再进 行第二次线性变换, 获得每一属性的特征, 表 示 为: a=W3·Avg(BERT(ω1,ω2,…))+b3 s=W4·a||v+b3 其中, a表示属性名称特征, ω1,ω2,…表示属性名称中的单次, BERT表示预训练的BERT 模型, Avg表示求平均, s表示属性的特征, v表示平铺构成的数值向量, W3与b3、 W4与b4分别为 两次线性变换的权 重与偏置参数; 对于实体 e, 将视觉 特征eI与每一属性的特征进行点乘, 得到对应属性的注意力权重值, 再利用注意力权 重值进行加权求和得到增强后的属性特 征, 表示为:权 利 要 求 书 2/4 页 3 CN 114357193 A 3

PDF文档 专利 一种知识图谱实体对齐方法、系统、设备与存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种知识图谱实体对齐方法、系统、设备与存储介质 第 1 页 专利 一种知识图谱实体对齐方法、系统、设备与存储介质 第 2 页 专利 一种知识图谱实体对齐方法、系统、设备与存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。