standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210161709.4 (22)申请日 2022.02.22 (71)申请人 北京市农林科 学院 地址 100097 北京市海淀区曙光 花园中路9 号 (72)发明人 余军 罗长寿 郑亚明 魏清风 于峰 曹承忠 陆阳 王富荣 (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 张睿 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/31(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01)G06F 16/338(2019.01) G06F 16/36(2019.01) (54)发明名称 语义搜索方法、 装置、 电子设备、 存储介质及 产品 (57)摘要 本发明提供一种语义搜索方法、 装置、 电子 设备、 存储介质及产品。 该方法包括: 获取自然语 句; 根据语义结构模型对自然语句进行结构映 射, 获得自然语句的三元组实例; 对三元组实例 进行实体映射, 获得自然语句包含的实体, 对自 然语句包含的实体根据语义结构模型进行数据 关系索引, 获得四元组实例集, 四元组包括三元 组实例和数据关系实例; 计算三元组实例和自然 语句的四元 组实例集的语义相似度, 根据语义相 似度计算结果获取四元组实例推荐集; 根据四元 组实例推荐集包含的数据关系实例提取自然语 句的词关系模 型, 根据词关系模 型对数据库进行 搜索, 获得知识结果集。 本发明结合大数据进行 语义搜索, 实现知识挖掘, 满足了用户对数据的 共享与发现。 权利要求书2页 说明书9页 附图5页 CN 114691845 A 2022.07.01 CN 114691845 A 1.一种语义搜索方法, 其特 征在于, 包括: 获取自然语句; 根据语义结构模型对所述自然语句进行 结构映射, 获得 所述自然语句的三元组实例; 对所述三元组实例进行实体映射, 获得所述自然语句包含的实体, 对所述自然语句包 含的实体根据语义结构模型进行数据关系索引, 获得所述自然语句的四元组实例集, 所述 四元组包括 三元组实例和数据关系实例; 计算所述自然语句的三元组实例和所述自然语句的四元组实例集的语义相似度, 根据 语义相似度计算结果获取 所述自然语句的四元组实例推荐集; 根据所述 四元组实例推荐集包含的数据关系实例提取所述自然语句的词关系 模型, 根 据所述自然语句的词关系模型对数据库进行搜索, 获得 所述自然语句的知识结果 集。 2.根据权利要求1所述的语义搜索方法, 其特征在于, 所述语义结构模型包括实体集、 语义关系集、 事实集和数据关系集。 3.根据权利要求1所述的语义搜索方法, 其特征在于, 所述词关系模型包括: 以数据集 分词的数据对象集、 以字段分词的数据对象集和以实例内容分词的数据对象集。 4.根据权利要求3所述的语义搜索方法, 其特征在于, 所述以数据集分词的数据对象集 包括数据来源库、 词所在数据库表名、 表说明和应用程序接口服 务; 所述以字段分词的数据对象集包括字段语义关键词组、 词所在数据库表、 字段类型、 表 字段名、 显示字段名和映射关系; 所述以实例内容分词的数据对象集包括词所在内容的词集和词间关系。 5.根据权利要求1至3中任一所述的语义搜索方法, 其特征在于, 所述计算所述自然语 句的三元组实例和所述自然语句的四元组实例集的语义相似度, 根据语义相似度计算结果 获取所述自然语句的四元组实例推荐集, 包括: 根据基于词项量的余弦相似度公式计算所述自然语句的三元组实例和所述自然语句 的四元组实例集的语义相似度; 将所述语义结构搜索集中语义相似度计算结果大于等于推荐值的四元组实例作为所 述自然语句的四元组实例推荐集。 6.根据权利要求1至3中任一所述的语义搜索方法, 其特征在于, 所述根据所述自然语 句的词关系模型对数据库进行搜索, 获得 所述自然语句的知识结果 集, 包括: 根据所述自然语句的词关系 模型对知识存在的数据集, 获得所述自然语句的知识结果 集, 所述知识结果 集包括所述自然语句的知识特 征。 7.一种语义搜索装置, 其特征在于, 包括采集模块、 实例构建模块、 相似度推荐模块和 搜索模块; 所述采集模块, 用于获取自然语句; 所述实例构建模块, 用于根据语义结构模型对所述自然语句进行结构映射, 获得所述 自然语句的三元组实例; 所述实例构建模块, 还用于对所述三元组实例进行实体映射, 获得所述自然语句包含 的实体, 对所述自然语句包含的实体根据语义结构模型进行数据关系索引, 获得所述自然 语句的四元组实例集, 所述四元组包括 三元组实例和数据关系实例; 所述相似度推荐模块, 用于计算所述自然语句的三元组实例和所述自然语句的四元组权 利 要 求 书 1/2 页 2 CN 114691845 A 2实例集的语义相似度, 根据语义相似度计算结果获取 所述自然语句的四元组实例推荐集; 所述搜索模块, 用于根据所述 四元组实例推荐集包含的数据关系实例提取所述自然语 句的词关系模型, 根据所述自然语句的词关系模型对数据库进行搜索, 获得所述自然语句 的知识结果 集。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述语义搜索方法的步骤。 9.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处 理器执行时实现如权利要求1至 6任一项所述语义搜索方法的步骤。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至 6任一项所述语义搜索方法的步骤。权 利 要 求 书 2/2 页 3 CN 114691845 A 3
专利 语义搜索方法、装置、电子设备、存储介质及产品
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:30
上传分享
举报
下载
原文档
(875.3 KB)
分享
友情链接
GB-T 36377-2018 计量器具识别编码.pdf
AI大模型将彻底改变智能汽车产业-2023-11-智能网联.pdf
GB/T 39188-2020 电动门窗通用技术要求.pdf
XF 95-2015 灭火器维修.pdf
DB52-T 1636.3-2021 机关事务云 第3部分:国有资产(房地产)管理数据 贵州省.pdf
GB-T 42137-2022 离散型智能制造能力建设指南.pdf
GB-T 271-2017 滚动轴承 分类.pdf
NY-T 4205-2022 农作物品种数字化管理数据描述规范.pdf
证券期货业信息系统渗透测试指南 (JRT 0276—2023).pdf
GB-T 25055-2010 信息安全技术 公钥基础设施安全支撑平台技术框架.pdf
GB-T 33817-2017 铜及铜合金管材内表面碳含量的测定方法.pdf
安全培训教育管理制度.pdf
GB-T 5271.8-2001 信息技术 词汇 第8部分 安全.pdf
DB37-T 3386-2018 工业园区规划水资源论证技术导则 山东省.pdf
GB-T 20270-2006 信息安全技术 网络基础安全技术要求.pdf
GM-T 0096-2020 射频识别防伪系统密码应用指南.pdf
GB-T 42016-2022 信息安全技术网络音视频服务数据安全要求.pdf
2022-2023 年中国信创生态及信创PC市场发展研究报告.pdf
DB12-T 905-2019 地源热泵系统节能减排绩效评价方法 天津市.pdf
GB-T 39335-2020 信息安全技术 个人信息安全影响评估指南.pdf
1
/
17
评价文档
赞助2.5元 点击下载(875.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。