standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210161709.4 (22)申请日 2022.02.22 (71)申请人 北京市农林科 学院 地址 100097 北京市海淀区曙光 花园中路9 号 (72)发明人 余军 罗长寿 郑亚明 魏清风  于峰 曹承忠 陆阳 王富荣  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 张睿 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/31(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01)G06F 16/338(2019.01) G06F 16/36(2019.01) (54)发明名称 语义搜索方法、 装置、 电子设备、 存储介质及 产品 (57)摘要 本发明提供一种语义搜索方法、 装置、 电子 设备、 存储介质及产品。 该方法包括: 获取自然语 句; 根据语义结构模型对自然语句进行结构映 射, 获得自然语句的三元组实例; 对三元组实例 进行实体映射, 获得自然语句包含的实体, 对自 然语句包含的实体根据语义结构模型进行数据 关系索引, 获得四元组实例集, 四元组包括三元 组实例和数据关系实例; 计算三元组实例和自然 语句的四元 组实例集的语义相似度, 根据语义相 似度计算结果获取四元组实例推荐集; 根据四元 组实例推荐集包含的数据关系实例提取自然语 句的词关系模 型, 根据词关系模 型对数据库进行 搜索, 获得知识结果集。 本发明结合大数据进行 语义搜索, 实现知识挖掘, 满足了用户对数据的 共享与发现。 权利要求书2页 说明书9页 附图5页 CN 114691845 A 2022.07.01 CN 114691845 A 1.一种语义搜索方法, 其特 征在于, 包括: 获取自然语句; 根据语义结构模型对所述自然语句进行 结构映射, 获得 所述自然语句的三元组实例; 对所述三元组实例进行实体映射, 获得所述自然语句包含的实体, 对所述自然语句包 含的实体根据语义结构模型进行数据关系索引, 获得所述自然语句的四元组实例集, 所述 四元组包括 三元组实例和数据关系实例; 计算所述自然语句的三元组实例和所述自然语句的四元组实例集的语义相似度, 根据 语义相似度计算结果获取 所述自然语句的四元组实例推荐集; 根据所述 四元组实例推荐集包含的数据关系实例提取所述自然语句的词关系 模型, 根 据所述自然语句的词关系模型对数据库进行搜索, 获得 所述自然语句的知识结果 集。 2.根据权利要求1所述的语义搜索方法, 其特征在于, 所述语义结构模型包括实体集、 语义关系集、 事实集和数据关系集。 3.根据权利要求1所述的语义搜索方法, 其特征在于, 所述词关系模型包括: 以数据集 分词的数据对象集、 以字段分词的数据对象集和以实例内容分词的数据对象集。 4.根据权利要求3所述的语义搜索方法, 其特征在于, 所述以数据集分词的数据对象集 包括数据来源库、 词所在数据库表名、 表说明和应用程序接口服 务; 所述以字段分词的数据对象集包括字段语义关键词组、 词所在数据库表、 字段类型、 表 字段名、 显示字段名和映射关系; 所述以实例内容分词的数据对象集包括词所在内容的词集和词间关系。 5.根据权利要求1至3中任一所述的语义搜索方法, 其特征在于, 所述计算所述自然语 句的三元组实例和所述自然语句的四元组实例集的语义相似度, 根据语义相似度计算结果 获取所述自然语句的四元组实例推荐集, 包括: 根据基于词项量的余弦相似度公式计算所述自然语句的三元组实例和所述自然语句 的四元组实例集的语义相似度; 将所述语义结构搜索集中语义相似度计算结果大于等于推荐值的四元组实例作为所 述自然语句的四元组实例推荐集。 6.根据权利要求1至3中任一所述的语义搜索方法, 其特征在于, 所述根据所述自然语 句的词关系模型对数据库进行搜索, 获得 所述自然语句的知识结果 集, 包括: 根据所述自然语句的词关系 模型对知识存在的数据集, 获得所述自然语句的知识结果 集, 所述知识结果 集包括所述自然语句的知识特 征。 7.一种语义搜索装置, 其特征在于, 包括采集模块、 实例构建模块、 相似度推荐模块和 搜索模块; 所述采集模块, 用于获取自然语句; 所述实例构建模块, 用于根据语义结构模型对所述自然语句进行结构映射, 获得所述 自然语句的三元组实例; 所述实例构建模块, 还用于对所述三元组实例进行实体映射, 获得所述自然语句包含 的实体, 对所述自然语句包含的实体根据语义结构模型进行数据关系索引, 获得所述自然 语句的四元组实例集, 所述四元组包括 三元组实例和数据关系实例; 所述相似度推荐模块, 用于计算所述自然语句的三元组实例和所述自然语句的四元组权 利 要 求 书 1/2 页 2 CN 114691845 A 2实例集的语义相似度, 根据语义相似度计算结果获取 所述自然语句的四元组实例推荐集; 所述搜索模块, 用于根据所述 四元组实例推荐集包含的数据关系实例提取所述自然语 句的词关系模型, 根据所述自然语句的词关系模型对数据库进行搜索, 获得所述自然语句 的知识结果 集。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述语义搜索方法的步骤。 9.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处 理器执行时实现如权利要求1至 6任一项所述语义搜索方法的步骤。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至 6任一项所述语义搜索方法的步骤。权 利 要 求 书 2/2 页 3 CN 114691845 A 3

PDF文档 专利 语义搜索方法、装置、电子设备、存储介质及产品

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语义搜索方法、装置、电子设备、存储介质及产品 第 1 页 专利 语义搜索方法、装置、电子设备、存储介质及产品 第 2 页 专利 语义搜索方法、装置、电子设备、存储介质及产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:30上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。