(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211151457.3 (22)申请日 2022.09.21 (71)申请人 科大讯飞 (苏州) 科技有限公司 地址 215000 江苏省苏州市工业园区金鸡 湖大道88号E4单元 (72)发明人 袁琳 李直旭 陈志刚 刘加新  何莹  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 专利代理师 柳芳 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/38(2019.01) G06K 9/62(2022.01) (54)发明名称 一种实体对齐方法、 装置、 设备和计算机可 读存储介质 (57)摘要 本申请公开了一种实体对齐方法、 装置、 设 备和计算机可读存储介质, 该方法包括: 基于第 一知识图谱和第二知识 图谱包含的各知识中的 时间, 划分若干时间超平面; 基于实体所在的知 识所关联的时间超平面的平面表示和实体的邻 居实体, 确定实体的实体表示; 基于各实体的实 体表示, 对第一知识图谱和第二知识图谱之间的 实体进行对齐, 上述方式, 通过构建时间超平面 以表示实体关联的时间信息, 并且基于邻居实体 对实体的表 示的影响, 利用时间信息和 邻居实体 的实体表 示来确定实体表示, 使得 实体表示更为 准确, 从而有利于利用实体表 示准确计算实体 之 间的相似度, 进 而提高实体对齐的准确性。 权利要求书3页 说明书14页 附图4页 CN 115238100 A 2022.10.25 CN 115238100 A 1.一种实体对齐方法, 其特 征在于, 所述方法包括: 基于第一知识图谱和第二知识图谱包含的各知识中的时间, 划分若干时间超平面, 每 条所述知识基于所述知识中的时间与所述时间超平面关联; 对于所述第 一知识图谱和第 二知识图谱中的各实体, 基于所述实体所在的知识所关联 的时间超平面的平面表示和所述实体的邻居实体, 确定所述实体的实体表示; 基于各所述实体的实体表示, 对所述第 一知识图谱和第 二知识图谱之间的实体进行对 齐。 2.根据权利要求1所述的方法, 其特征在于, 所述基于第 一知识图谱和第 二知识图谱包 含的各知识中的时间, 划分若干时间超平面包括: 将所述第一知识图谱和所述第二知识图谱中包含的所述时间进行排序, 得到时间序 列; 依据所述时间序列中的时间构建若干所述时间超平面。 3.根据权利要求2所述的方法, 其特征在于, 所述依据所述 时间序列中的时间构建若干 所述时间超平面, 包括: 统计所述第一知识图谱和所述第二知识图谱中各 所述时间出现的频次; 依据所述频次之和满足预设频次要求的每组时间组, 构建对应的一个所述时间超平 面, 其中每组所述时间组包括所述时间序列中连续的至少一个时间, 不同组所述时间组包 括的时间不同。 4.根据权利要求1所述的方法, 其特征在于, 所述基于所述实体所在的知识所关联的时 间超平面的平面表示和所述实体的邻居实体, 确定所述实体的实体表示, 包括: 将所述实体对应关联的至少一个时间超平面作为所述实体的目标时间超平面, 基于所 述实体初始的实体表 示和所述实体的各所述目标时间超平面的平面表示, 得到所述 实体分 别投影至各 所述目标时间超平面的第一投影表示; 基于所述实体及其邻居实体投影至各所述目标时间超平面的第 一投影表示, 得到所述 实体经更新的实体表示。 5.根据权利要求4所述的方法, 其特征在于, 所述实体的目标时间超平面包括所述实体 所在的知识图谱中包 含所述实体的每条 所述知识分别关联的时间超平面; 和/或, 所述基于所述实体及其邻居实体投影至各所述目标时间超平面的第一投影表 示, 得到所述实体经 更新的实体表示, 包括: 综合所述实体投影至各所述目标时间超平面的第 一投影表示, 得到所述实体的时间感 知表示, 以及, 综合所述实体的各所述邻居实体投影至各所述 目标时间超平面的第一投影 表示, 得到各 所述邻居实体的时间感知表示; 对于所述实体的各所述邻居实体, 基于所述实体和所述邻居实体的时间感知表示, 确 定所述邻居实体的注意力系数; 利用所述实体的各邻居实体的注意力系数, 对各所述邻居实体的时间感知表示进行加 权处理, 得到所述实体经 更新的实体表示。 6.根据权利要求5所述的方法, 其特征在于, 所述实体的时间感知表示为所述实体投影 至各所述目标时间超平面的第一投影表示的均值, 所述邻居实体的时间感知表示为所述邻 居实体投影至各 所述目标时间超平面的第一投影表示的均值;权 利 要 求 书 1/3 页 2 CN 115238100 A 2所述基于所述实体和所述邻居实体的时间感知表示, 确定所述邻居实体的注意力系 数, 包括: 基于所述实体和所述邻居实体的时间感知表示, 确定所述实体和所述邻居实体在时域 上的相关系数; 对所述邻居实体对应的所述相关系数进行归一化处理, 得到所述邻居实体的注意力系 数。 7.根据权利要求4所述的方法, 其特征在于, 将所述第 一知识图谱和所述第 二知识图谱 分别作为目标图谱, 所述基于所述实体所在的知识所关联的时间超平面的平面表示和所述 实体的邻居实体, 确定所述实体的实体表示, 还 包括: 利用经更新的所述实体表示, 获取关于若干目标知识的结构损失以及获取关于若干目 标实体对的对齐损失, 所述若干目标知识的结构损失是基于各所述 目标知识中的头实体、 尾实体和关系之间的表示关系确定的, 所述若干目标知识为所述 目标图谱中的知识, 所述 目标实体对所包含的两个实体是预先确定具有对齐关系且分别来自所述第一知识图谱和 第二知识图谱; 基于所述结构损失和对齐损失, 更新所述第 一知识图谱和第 二知识图谱中至少一个所 述实体的实体表示。 8.根据权利要求7所述的方法, 其特征在于, 所述获取关于若干目标知识 的结构损 失, 包括: 对于每条待处理知识, 基于所述待处理知识中的头实体和尾实体经更新的实体表示和 关系的关系表示, 获得所述待处理知识中的头实体、 尾实体和关系分别投影至所述待处理 知识关联的时间超平 面的第二投影表示, 所述待处理知识包括所述目标知识及其对应的负 样本知识; 基于所述待处理知识中的头实体、 尾实体和关系的第二投影表示, 得到所述待处理知 识中头尾实体与关系之间的第一表示距离; 基于各目标知识及其对应的负样本知识的第 一表示距离之间的差异, 得到所述结构损 失; 和/或, 所述获取关于若干目标实体对的对齐损失, 包括: 对于各待处理实体对, 基于所述待处理实体对中两个实体之间的实体表示的差异, 获 得所述待处理实体对的第二表示距离; 所述待处理实体对包括所述目标实体对和对应的负 样本实体对, 所述负样本实体对中的一个实体与对应的所述目标实体对中的一个实体相 同, 所述负样本实体对中的另一个实体与对应所述目标实体对中的另一个实体不同且属于 同一知识图谱; 基于各所述目标实体对和对应的负 样本实体对的第二标识 距离, 得到所述对齐损失。 9.根据权利要求7所述的方法, 其特征在于, 在所述获取关于若干目标知识的结构损失 之前, 还包括: 将所述目标知识中的关系作为目标关系; 利用与所述目标关系相关的至少一个实体的实体表示和与所述目标关系相关的至少 一个时间的时间表 示, 生成所述目标关系的关系表示, 所述与所述目标关系相关的实体、 时 间分别为所述目标图谱中与所述目标关系属于同一知识的实体、 时间。权 利 要 求 书 2/3 页 3 CN 115238100 A 3

.PDF文档 专利 一种实体对齐方法、装置、设备和计算机可读存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种实体对齐方法、装置、设备和计算机可读存储介质 第 1 页 专利 一种实体对齐方法、装置、设备和计算机可读存储介质 第 2 页 专利 一种实体对齐方法、装置、设备和计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:39:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。