standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210094425.8 (22)申请日 2022.01.26 (71)申请人 深圳壹账通科技 服务有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 邹倩霞 (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 专利代理师 姚泽鑫 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/34(2019.01) G06F 40/194(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01) (54)发明名称 文本匹配方法、 装置、 终端及存 储介质 (57)摘要 本申请实施例提供一种文本匹配方法、 装 置、 终端及存储介质, 所述方法包括: 获取待匹配 短文本; 对所述待匹配短文本进行过滤处理, 以 得到过滤后的待匹配短文本; 根据特征提取模型 对所述过滤后的待匹配短文本进行特征提取, 以 得到向量特征; 将所述向量特征输入至文本匹配 模型中进行匹配, 以得到与所述待匹配 短文本对 应的目标文本; 展示所述目标文本, 能够提升短 文本匹配时的准确性。 权利要求书2页 说明书10页 附图3页 CN 114490999 A 2022.05.13 CN 114490999 A 1.一种文本匹配方法, 其特 征在于, 所述方法包括: 获取待匹配短文本; 对所述待匹配短文本进行 过滤处理, 以得到过 滤后的待匹配短文本; 根据特征提取模型对所述过 滤后的待匹配短文本进行 特征提取, 以得到向量特 征; 将所述向量特征输入至文本匹配模型中进行匹配, 以得到与 所述待匹配短文本对应的 目标文本; 展示所述目标文本 。 2.根据权利要求1所述的方法, 其特征在于, 所述根据特征提取模型对所述过滤后的待 匹配短文本进行 特征提取, 以得到向量特 征, 包括: 将所述过滤后的待匹配短文本输入至所述特征提取模型的嵌入层进行运算, 得到第 一 运算结果; 将所述第一运算结果输入至所述特征提取模型的卷积池化层进行运算, 以得到第 二运 算结果; 将所述第二运算结果输入至所述特征提取模型的全连接层进行运算, 以得到第 三运算 结果, 以及将所述第三 运算结果确定为所述向量特 征。 3.根据权利要求1或2所述的方法, 其特征在于, 在展示所述目标文本之前, 所述方法还 包括: 获取所述待匹配短文本与所述目标文本之间的目标相似度; 若所述目标相似度低于第 一预设相似度阈值, 则对所述待 匹配短文本和所述目标文本 进行分词处 理, 以得到所述待匹配短文本的第一词集 合和所述目标文本的第二词集 合; 获取所述第 一词集合与所述第 二词集合中对应的词语之间的相似度, 以得到相似度集 合; 获取所述相似度集合中高于第二预设相似度阈值的相似度对应于所述第一词集合中 的词语, 得到参 考词语, 所述第二预设相似度阈值高于所述第一预设相似度阈值; 获取包括所述 参考词语的短文本, 以得到 至少一个参 考短文本; 根据所述至少一个参考短文本和所述第 二词集合中, 确定出与 所述待匹配短文本对应 的短文本; 将与所述待匹配短文本对应的短文本确定为目标文本 。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述至少一个参考短文本, 确定 出与所述待匹配短文本对应的短文本, 包括: 获取所述至少一个参考短文本的语义信 息, 以得到与 所述至少一个参考短文本对应的 参考语义信息; 获取所述待匹配短文本的目标语义信息; 根据所述目标语义信 息和所述至少一个参考短文本对应的参考语义信 息, 从所述至少 一个参考短文本中确定出与所述待匹配短文本对应的短文本 。 5.根据权利要求3所述的方法, 其特征在于, 所述根据所述至少一个参考短文本, 确定 出与所述待匹配短文本对应的短文本, 包括: 获取所述至少一个参考短文本的语义信 息, 以得到与 所述至少一个参考短文本对应的 参考语义信息;权 利 要 求 书 1/2 页 2 CN 114490999 A 2对所述至少一个参考短文本对应的参考语义信息进行融合处理, 以得到目标语义信 息; 根据所述目标语义信息对所述目标文本进行调整, 以得到调整后的目标文本; 将所述调整后的目标文本, 确定为与所述待匹配短文本对应的短文本 。 6.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述方法还 包括: 对所述待匹配短文本进行去感叹词处 理, 以得到第一处 理文本; 对所述第一处 理文本进行语义结构分析, 以得到所述第一处 理文本的语义结构; 根据所述语义结构对所述目标文本进行 校验, 以得到校验结果; 展示所述校验结果。 7.一种文本匹配装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取待匹配短文本; 过滤单元, 用于对所述待匹配短文本进行 过滤处理, 以得到过 滤后的待匹配短文本; 提取单元, 用于根据特征提取模型对所述过滤后的待匹配短文本进行特征提取, 以得 到向量特 征; 匹配单元, 用于将所述向量特征输入至文本匹配模型中进行匹配, 以得到与所述待匹 配短文本对应的目标文本; 展示单元, 用于展示所述目标文本 。 8.根据权利要求7 所述的装置, 其特 征在于, 所述 提取单元用于: 将所述过滤后的待匹配短文本输入至所述特征提取模型的嵌入层进行运算, 得到第 一 运算结果; 将所述第一运算结果输入至所述特征提取模型的卷积池化层进行运算, 以得到第 二运 算结果; 将所述第二运算结果输入至所述特征提取模型的全连接层进行运算, 以得到第 三运算 结果, 以及将所述第三 运算结果确定为所述向量特 征。 9.一种终端, 其特征在于, 包括处理器、 输入设备、 输出设备和存储器, 所述处理器、 输 入设备、 输出设备和存储器相互连接, 其中, 所述存储器用于存储计算机程序, 所述计算机 程序包括程序指 令, 所述处理器被配置用于调用所述程序指 令, 执行如权利要求 1‑6任一项 所述的方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序包括程序指令, 所述程序指令当被处理器执行时使所述处理器执行如 权利要求1 ‑6任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114490999 A 3
专利 文本匹配方法、装置、终端及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:42
上传分享
举报
下载
原文档
(668.5 KB)
分享
友情链接
山石网科《岩谈》第五期-2022年4月(数据安全专刊).pdf
GB 21148-2020 足部防护 安全鞋.pdf
GB-T 20270-2006 信息安全技术 网络基础安全技术要求.pdf
GB-T 32932-2016 留学中介服务规范.pdf
GB-T 38625-2020 信息安全技术 密码模块安全检测要求.pdf
付晓岩 数字银行论坛-以企业架构推动数字化 转型指导文件的落实 .pdf
穿越数据的迷宫扫描版.pdf
GB-T 1151-2023 内燃机 主轴瓦及连杆轴瓦 技术条件.pdf
GB-T 706-2016 热轧型钢.pdf
DB52-T 1636.6-2021 机关事务云 第6部分:公共机构节能管理数据 贵州省.pdf
GB-T 39717-2020 水处理用陶瓷膜板.pdf
青藤云安全 - 2023.2 - 政务云安全建设实践指南.pdf
亿格云 陈吴栋 零信任SASE 助力数字化企业建立多云安全访问体系.pdf
GM T 0131-2023 电子签章应用接口规范.pdf
GB-T 35499-2017 呋喃树脂耐蚀作业质量技术规范.pdf
GB-T 38634.4-2020 系统与软件工程 软件测试 第4部分:测试技术.pdf
易观分析 AIGC产业研究报告2023——视频生成篇.pdf
GB-T 3161-2015 光学经纬仪.pdf
NIST 关键基础设施网络安全改善框架-美国关基-v1.1-2018年 安全内参翻译版本.pdf
GB-T 42627-2023 机械安全 围栏防护系统 安全要求.pdf
1
/
16
评价文档
赞助2.5元 点击下载(668.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。