(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211031940.8 (22)申请日 2022.08.26 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 唐杰聪 周远侠 昝传晖 杨卜菘  (74)专利代理 机构 北京三友知识产权代理有限 公司 11127 专利代理师 周永君 任默闻 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06Q 40/00(2012.01) (54)发明名称 一种金融领域问题的处 理方法及装置 (57)摘要 本发明提供一种金融领域问题的处理方法 及装置, 涉及金融领域或其他技术领域。 所述方 法包括: 对待匹配问题进行分词, 获得待匹配问 题对应的词汇; 根据待匹配问题对应的词汇以及 金融领域词汇分类模型, 获得待匹配问题对应的 词汇中每个词汇的类型; 根据待匹配问题对应的 词汇中每个词汇的类型过滤待匹配问题对应的 词汇中的干扰词汇, 获得待匹配问题对应的重点 词汇; 根据待匹配问题对应的重点词汇, 获得待 匹配问题对应的句子向量; 根据待匹配问题对应 的句子向量以及各个基础问题对应的句子向量, 获得待匹配问题对应的答案。 所述装置用于执行 上述方法。 本发 明实施例提供的金融领域问题的 处理方法及装置, 提高了答案获得的准确性。 权利要求书2页 说明书13页 附图7页 CN 115374249 A 2022.11.22 CN 115374249 A 1.一种金融领域问题的处 理方法, 其特 征在于, 包括: 对待匹配问题进行分词, 获得 所述待匹配问题对应的词汇; 根据所述待匹配问题对应的词汇以及金融领域词汇分类模型, 获得所述待匹配问题对 应的词汇中每个词汇的类型; 其中, 所述金融领域词汇分类模型是基于金融领域词汇分类 训练数据以及对应的分类标签训练获得的; 根据所述待匹配问题对应的词汇中每个词汇的类型过滤所述待匹配问题对应的词汇 中的干扰词汇, 获得 所述待匹配问题对应的重点词汇; 根据所述待匹配问题对应的重点词汇, 获得 所述待匹配问题对应的句子向量; 根据所述待匹配问题对应的句子向量以及各个基础问题对应的句子向量, 获得与 所述 待匹配问题匹配的基础问题; 其中, 各个 基础问题对应的句子向量是 预先获得的; 从基础问答库中获取与所述待 匹配问题匹配的基础问题对应的答案, 作为所述待 匹配 问题对应的答案 。 2.根据权利要求1所述的方法, 其特征在于, 基于金融领域词汇分类训练数据以及对应 的分类标签训练获得 所述金融领域词汇分类模型的步骤 包括: 获取金融领域词汇分类训练数据以及对应的分类标签; 将所述金融领域词汇分类训练数据中每个训练词汇转换成向量, 获得每个训练词汇对 应的样本特 征; 根据N个原始模型、 各个训练词 汇对应的样本特征以及各自对应的分类标签, 分别训练 获得N个金融领域词汇分类子模型; 其中, N 为大于等于 3的正整数; 从N个金融领域词汇分类子模型选择两个分类准确率最高的模型, 组成所述金融领域 词汇分类模型。 3.根据权利要求2所述的方法, 其特征在于, 所述从N个金融领域词汇分类子模型选择 两个准确率 最高的模型包括: 根据验证集以及非金融领域词汇库, 获得所述验证集中的非金融词汇子集; 并根据所 述验证集以及金融领域词汇库, 获得 所述验证集中的金融词汇子集; 获取在所述非金融词汇子集和所述金融词汇子集都存在的词语, 构 成金融闲聊词汇子 集; 根据非金融词汇子集、 金融闲聊词汇子集以及每个金融领域词汇分类子模型, 获得每 个金融领域词汇分类子模型的分类准确率; 根据各个金融领域词汇分类子模型的分类准确率获得两个分类准确率最高的模型, 组 成所述金融领域词汇分类模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据非金融词汇子集、 金融闲聊词汇 子集以及每个金融领域词汇分类子模型, 获得每个金融领域词汇分类子模 型的分类准确率 包括: 根据金融领域词汇分类子模型对非金融词汇的分类准确率和金融领域词汇分类子模 型对金融闲聊词汇的分类准确率以及各自对应的权重, 计算 获得金融领域词汇分类子模型 的分类准确率。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所述待匹配问题对应的词汇以及 金融领域词汇分类模型, 获得 所述待匹配问题对应的词汇中每 个词汇的分类标签包括:权 利 要 求 书 1/2 页 2 CN 115374249 A 2将所述待匹配问题对应的词汇中的每个词汇转换成向量, 获得每个词汇对应的词向 量; 将每个词汇对应的词向量分别输入到所述金融领域词汇分类模型中, 输出每个词汇的 分类标签。 6.根据权利要求5所述的方法, 其特征在于, 所述将每个词汇对应的词向量分别输入到 所述金融领域词汇分类模型中, 输出每 个词汇的分类标签包括: 将每个词汇对应的词向量分别输入到所述金融领域词汇分类模型包括的两个金融领 域词汇分类子模型中, 分别输出每 个词汇的两个中间分类标签; 根据每个词汇 的两个中间分类标签以及组合分类规则, 获得每个词汇的分类标签; 其 中, 所述组合分类规则是 预设的。 7.根据权利要求1至6任一项所述的方法, 其特征在于, 预先获得各个基础 问题对应的 句子向量的步骤 包括: 对基础问题进行分词, 获得基础问题对应的词汇; 根据所述基础问题对应的词汇以及金融领域词汇分类模型, 获得所述基础问题对应的 词汇中每 个词汇的分类标签; 根据所述基础问题对应的词汇中每个词汇的分类标签保留所述基础问题对应的词汇 中分类标签对应金融领域分类的词汇, 获得 所述基础问题对应的重点词汇; 根据所述基础问题对应的重点词汇, 获得基础问题对应的句子向量。 8.一种金融领域问题的处 理装置, 其特 征在于, 包括: 分词模块, 用于对待匹配问题进行分词, 获得 所述待匹配问题对应的词汇; 分类模块, 用于根据所述待匹配问题对应的词汇以及金融领域词汇分类模型, 获得所 述待匹配问题对应的词汇中每个词汇的类型; 其中, 所述金融领域词汇分类模型是基于金 融领域词汇分类训练数据以及对应的分类标签训练获得的; 过滤模块, 用于根据 所述待匹配问题对应的词汇中每个词汇的类型过滤所述待 匹配问 题对应的词汇中的干扰词汇, 获得 所述待匹配问题对应的重点词汇; 第一获得模块, 用于根据所述待匹配问题对应的重点词汇, 获得所述待匹配问题对应 的句子向量; 第二获得模块, 用于根据所述待匹配问题对应的句子向量以及各个基础问题对应的句 子向量, 获得与所述待匹配问题匹配的基础问题; 其中, 各个基础问题对应的句子向量是预 先获得的; 获取模块, 用于从基础 问答库中获取与所述待匹配问题匹配的基础 问题对应的答案, 作为所述待匹配问题对应的答案 。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7任一项所述 的方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序被处 理器执行时实现权利要求1至7任一项所述的方法。 11.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序, 所述计 算机程序被处 理器执行时实现权利要求1至7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115374249 A 3

.PDF文档 专利 一种金融领域问题的处理方法及装置

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种金融领域问题的处理方法及装置 第 1 页 专利 一种金融领域问题的处理方法及装置 第 2 页 专利 一种金融领域问题的处理方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:13:05上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。