standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211234031.4 (22)申请日 2022.10.10 (71)申请人 联仁健康医疗大 数据科技股份有限 公司 地址 200131 上海市浦东 新区中国 (上海) 自由贸易试验区川和路5 5弄3号 (72)发明人 张晓刚 李登高 徐新鹏 冯易成 (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 骆文欣 (51)Int.Cl. G06F 40/284(2020.01) G06F 40/242(2020.01) G06F 16/2458(2019.01) (54)发明名称 一种信息匹配方法、 装置、 电子设备及存储 介质 (57)摘要 本发明公开了一种信息匹配方法、 装置、 电 子设备及存储介质。 该方法包括: 获取待匹配项, 对待匹配项进行分词, 得到至少一个待匹配分 词; 获取字典中的字典项和字典编码矩阵, 基于 待匹配分词、 字典项和字典编码矩阵确定字典项 与待匹配分词的相似度矩阵; 基于相似度矩阵 中, 任一字典项与各待匹配分词的相似度数据, 确定字典项与待匹配项的相似度; 基于各字典项 与待匹配项的相似度, 确定与待匹配项相匹配的 字典项。 本发 明通过对待匹配项进行分词得到待 匹配分词, 并基于待匹配分词、 字典项和字典编 码矩阵得到字典项与待匹配分词的相似度矩阵, 以及字典项与待匹配项的相似度, 进而基于相似 度确定与待匹配项匹配的字典项, 提高了信息匹 配的准确性。 权利要求书2页 说明书10页 附图3页 CN 115422924 A 2022.12.02 CN 115422924 A 1.一种信息匹配方法, 其特 征在于, 包括: 获取待匹配项, 对所述待匹配项 进行分词, 得到 至少一个待匹配分词; 获取字典中的字典项和字典编码矩阵, 基于所述待匹配分词、 所述字典项和所述字典 编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵; 基于所述相似度矩阵中, 任一所述字典项与各所述待匹配分词的相似度数据, 确定所 述字典项与所述待匹配项的相似度; 基于各所述字典项与所述待匹配项的相似度, 确定与所述待匹配项相匹配的字典项。 2.根据权利要求1所述的方法, 其特 征在于, 所述字典编码矩阵的确定方法包括: 获取字典项目中的多个字典项, 确定对所述多个字典项 去重的字典分词; 对于任一字典项, 基于所述字典项与所述字典分词的对应关系, 设置所述字典项对应 的字典分词编码, 形成字典编码矩阵。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述待匹配分词、 所述字典项和 所述字典编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵, 包括: 基于所述待匹配分词和所述字典分词进行相似度计算, 得到分词相似度, 并基于各分 词相似度生成分词相似度矩阵; 基于所述字典编码矩阵和所述分词相似度矩阵确定所述字典项与所述待匹配分词的 相似度矩阵。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述待匹配分词和所述字典分词 进行相似度计算, 得到分词相似度, 包括: 将任一所述待匹配分词和任一所述字典分词进行两 两组合得到分词组合; 基于多个预设相似度函数分别对所述分词组合进行相似度计算, 得到各所述预设相似 度函数对应的中间相似度; 基于各所述预设相似度函数对应的权重对多个中间相似度进行加权处理, 得到所述分 词组合的分词相似度。 5.根据权利要求3所述的方法, 其特征在于, 所述基于所述字典编码矩阵和所述分词相 似度矩阵确定所述字典项与所述待匹配分词的相似度矩阵, 包括: 对所述字典编码矩阵和所述分词相似度矩阵进行矩阵乘法, 得到所述字典项与所述待 匹配分词的相似度矩阵。 6.根据权利要求1所述的方法, 其特征在于, 所述基于各所述字典项与 所述待匹配项的 相似度, 确定与所述待匹配项相匹配的字典项, 包括: 基于所述字典项与 所述待匹配项的相似度对所述字典项进行排序, 提取所述排序中预 设数量的字典项; 或者, 将所述字典项与所述待匹配项的相似度与预设匹配阈值进行比对, 若所述字典 项与所述待匹配项的相似度大于所述预设匹配阈值, 则确定为与所述待匹配项相匹配的字 典项。 7.根据权利要求1所述的方法, 其特征在于, 所述与所述待 匹配项相匹配的字典项为至 少一个; 在确定与所述待匹配项相匹配的字典项之后, 所述方法还 包括: 将至少一个所述字典项发送至审核 端, 并接收所述审核 端返回的审核结果。权 利 要 求 书 1/2 页 2 CN 115422924 A 28.一种信息匹配装置, 其特 征在于, 包括: 待匹配项分词模块用于获取待匹配项, 对所述待匹配项进行分词, 得到至少一个待匹 配分词; 相似度矩阵确定模块用于获取字典中的字典项和字典编码矩阵, 基于所述待匹配分 词、 所述字典项和所述字典编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵; 相似度确定模块基于所述相似度矩阵中, 任一所述字典项与 各所述待 匹配分词的相似 度数据, 确定所述字典项与所述待匹配项的相似度; 字典项确定模块基于各所述字典项与所述待 匹配项的相似度, 确定与 所述待匹配项相 匹配的字典项。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 信息匹配方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的信息匹配方法。权 利 要 求 书 2/2 页 3 CN 115422924 A 3
专利 一种信息匹配方法、装置、电子设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:34:06
上传分享
举报
下载
原文档
(782.5 KB)
分享
友情链接
DB51-T 2738-2020 大熊猫圈养机构宣传教育标准 四川省.pdf
T-GSIA 002—2022 大数据产品评估规范.pdf
GB-Z 18906-2002 开放式电子图书出版物结构.pdf
T-GDC 19—2019 埋地用双高筋增强聚乙烯 HDPE 缠绕管.pdf
中国电子学会 2021年中国信创产业发展白皮书.pdf
GB-T 43512-2023 全钒液流电池可靠性评价方法.pdf
人工智能大模型体验报告2.0.pdf
DB33-T 2351-2021 数字化改革 公共数据分类分级指南 浙江省.pdf
GB-T 24265-2014 工业用硅藻土助滤剂.pdf
工商银行 2021网络金融黑产研究报告.pdf
T-SOFIDPA 0004—2023 有机肥 好氧发酵 低碳技术规范.pdf
商用密码检测机构管理办法(征求意见稿).pdf
GB/T 29827-2013 信息安全技术 可信计算规范 可信平台主板功能接口.pdf
GB-T 30132-2013 胶印书刊纸.pdf
GB-T 5907.5-2015 消防词汇 第5部分:消防产品.pdf
专利 一种温控器在线监测用显示装置.PDF
GB-T 43582-2023 区块链和分布式记账技术 应用程序接口 中间件技术指南.pdf
DB31-T 1240.2-2020 公共数据共享交换工作规范 第2部分:平台接入技术要求 上海市.pdf
ISO 17987-6-2016.pdf
DB36-T 1099-2018 电子政务云平台安全规范 江西省.pdf
1
/
16
评价文档
赞助2.5元 点击下载(782.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。