(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210022610.6
(22)申请日 2022.01.10
(71)申请人 中国科学技术大学
地址 230026 安徽省合肥市包河区金寨路
96号
(72)发明人 徐童 陈恩红 陈力以 李徵
武晗
(74)专利代理 机构 北京凯特来知识产权代理有
限公司 1 1260
代理人 郑立明 韩珂
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/583(2019.01)
G06F 40/284(2020.01)
G06F 40/30(2020.01)G06V 10/40(2022.01)
G06V 10/56(2022.01)
G06V 10/82(2022.01)
G06N 3/08(2006.01)
(54)发明名称
一种知识图谱实体对齐方法、 系统、 设备与
存储介质
(57)摘要
本发明公开了一种知识图谱实体对齐方法、
系统、 设备与存储介质, 对于不同的两个多模态
知识图谱采用共享参数的多模态孪生网络结构
实现实体的表征, 通过挖掘跨模态的语义关联和
多角度对比正负实体对的特征来利用和实体相
关的多模态信息, 能够有效提升多模态实体对齐
任务的准确性。
权利要求书4页 说明书9页 附图1页
CN 114357193 A
2022.04.15
CN 114357193 A
1.一种知识图谱实体对齐方法, 其特 征在于, 包括:
训练阶段, 通过多模态知识嵌入网络提取实体特征, 其中: 对于每一实体, 从对应 图像
中提取相应的视觉特征, 并基于视觉特征对预训练的BERT模型提取的属性特征进 行视觉自
适应处理, 获得最终的属 性特征, 以及采用针对关系的视觉增强机制对图谱嵌入模型提取
的关系特征进 行视觉增强处理, 获得最终的关系特征, 再将视觉特征、 最 终的关系特征与最
终的属性特征整合为整体的实体表征; 并且, 利用来自不同知识图谱的两个实体的单模态
特征和整体的实体表征进 行相似度对比学习, 所述单模态特征包括: 视觉特征、 最 终的关系
特征与最 终的属性特征; 利用视觉增强处理 时的损失函数与对比学习的损失函数构建总损
失函数进 行训练, 更新多模态知识嵌入网络的参数; 训练完毕后, 利用训练后的多模态知识
嵌入网络获得 更新后的实体的整体的实体表征;
对于两个不同知识图谱中的实体, 通过更新后的整体的实体表征, 两两进行相似度计
算, 选择相似度最高的两个实体作为对齐实体。
2.根据权利要求1所述的一种知识图谱实体对齐方法, 其特征在于, 所述对于每一实
体, 从对应图像中提取相应的视 觉特征包括:
对于实体e, 利用残差网络模型从对应 图像i中提取特征, 并通过线性变换获得投影到
对应空间, 获得相应的视 觉特征, 表示为:
ie=ResNet(i)
eI=W1·ie+b1
其中, ResNet表示残差网络模型, ie表示残差网络模型从图像i中提取的特征, eI表示相
应的视觉特征, W1与b1表示线性变换的权 重与偏置参数。
3.根据权利要求1所述的一种知识图谱实体对齐方法, 其特征在于, 采用针对关系的视
觉增强机制对图谱嵌入模型提取的关系特征进行视觉增强处理, 获得最终的关系特征包
括:
训练阶段, 利用正负样本, 结合图谱嵌入模型的损 失函数以及视觉增强的损 失函数优
化图谱嵌入模 型; 其中, 正样 本是指三元关系组的关系正确, 即头尾实体满足相应的关系r,
负样本是指三元关系组关系 不正确, 即头尾实体不满足相应的关系r; 正样本表示为(h,r,
t), h与t分别为头实体与尾实体; 负 样本表示 为(h′,r,t′), h′与t′分别为头实体与尾实体;
通过图谱嵌入模型提取正负样本 中头实体与尾实体的实体嵌入向量, 以及 关系的嵌入
向量, 并带入图谱嵌入模型的损失函数进 行计算; 计算视觉增强的损失函数时, 先通过残差
网络与线性变换获得正负样本对应图像的视觉特征, 再结合图谱嵌入模型提取的关系嵌入
向量带入视 觉增强的损失函数进行计算;
训练完毕后, 通过图谱嵌入 模型提取实体嵌入向量作为相应实体最终的关系特 征。
4.根据权利要求3所述的一种知识图谱实体对齐方法, 其特 征在于,
图谱嵌入 模型的损失函数 数表示为:
权 利 要 求 书 1/4 页
2
CN 114357193 A
2其中, TR表示正样本集合, T ′R表示负样本集合; (h,r,t)=τ, (h ′,r,t′)=τ′, hR、 h′R各自
表示头实体h、 头实体h ′的实体嵌入向量, tR、 t′R各自表示尾实体t、 尾实体t ′的实体嵌入向
量, hr表示关系r的嵌入向量, 实体嵌入向量与关系r的嵌入向量均为图谱嵌入模型的输出;
Υr表示得分间隔, fr(.)表示得分函数。
5.根据权利要求3或4所述的一种知识图谱实体对齐方法, 其特征在于, 视觉增强的损
失函数表示 为:
其中, fi(.)表示得分函数, Υi表示得分间隔,
分别表示头实体h与尾实体t对应
图像的视 觉特征,
分别表示头实体h ′与尾实体t ′对应图像的视 觉特征;
其中, 头实体h与尾实体t对应图像的视 觉特征
提取过程表示 为:
其中, ResNet表示残差网络模型,
分别表示头实体h、 尾实体t对应的图像, ih、 it分
别表示残差网络模型从图像
中提取的特 征, W2与b2表示线性变换的权 重与偏置参数;
视觉特征
以及实体嵌入向量tR, 满足:
tR≈hR+hr
6.根据权利要求1所述的一种知识图谱实体对齐方法, 其特征在于, 所述基于视觉特征
对通过预训练的BERT模型提取的属性特 征进行视 觉自适应处 理包括:
通过预训练的BERT模型提取属性特 征, 步骤包括:
对于实体的每一属性, 通过预训练的BERT模型提取属性名称的词向量, 并进行平均后
进行第一次线性变换, 获得属性名称特征; 同时, 将相应属性值做归一化后平铺构成数值向
量, 并与相应的属性名称特征进 行拼接再进 行第二次线性变换, 获得每一属性的特征, 表 示
为:
a=W3·Avg(BERT(ω1,ω2,…))+b3
s=W4·a||v+b3
其中, a表示属性名称特征, ω1,ω2,…表示属性名称中的单次, BERT表示预训练的BERT
模型, Avg表示求平均, s表示属性的特征, v表示平铺构成的数值向量, W3与b3、 W4与b4分别为
两次线性变换的权 重与偏置参数;
对于实体 e, 将视觉 特征eI与每一属性的特征进行点乘, 得到对应属性的注意力权重值,
再利用注意力权 重值进行加权求和得到增强后的属性特 征, 表示为:权 利 要 求 书 2/4 页
3
CN 114357193 A
3
专利 一种知识图谱实体对齐方法、系统、设备与存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:59上传分享