standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210048892.7 (22)申请日 2022.01.17 (71)申请人 空地互联网络科技股份有限公司 地址 200050 上海市长 宁区广顺路3 3号8幢 1层2099室 (72)发明人 李华  (74)专利代理 机构 北京纪凯知识产权代理有限 公司 11245 专利代理师 陆惠中 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/151(2020.01) G06F 16/332(2019.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种风险数据识别方法及系统 (57)摘要 本发明提供了一种风险数据识别方法及系 统; 其中, 所述方法包括: S10, 响应于服务接通信 号, 持续监测接通过程中的交互数据; S20, 对所 述交互数据进行语义识别以提取出交互内容序 列; S30, 对所述交互内容序列进行第一计算, 若 第一计算的第一结果满足第一条件, 则转S40, 否 则转S10; S40, 对所述交互内容序列进行第二计 算, 若所述第二计算的第二结果满足第二条件, 则输出所述交互数据存在风险的提示信息, 否则 转S10; 本发明的方案设计了对风险数据的两步 分析法, 既保证了风险数据识别的低遗漏率, 也 降低了非必要识别的处 理量, 提高了识别效率。 权利要求书2页 说明书8页 附图2页 CN 114444511 A 2022.05.06 CN 114444511 A 1.一种风险数据识别方法, 其特 征在于, 包括如下步骤: S10, 响应于服 务接通信号, 持续 监测接通过程中的交 互数据; S20, 对所述交 互数据进行语义识别以提取 出交互内容序列; S30, 对所述交互内容序列进行第一计算, 若第一计算的第一结果满足第一条件, 则转 S40, 否则转S10; S40, 对所述交互内容序列进行第二计算, 若所述第二计算的第二结果满足第二条件, 则输出所述交互数据存在风险的提 示信息, 否则转S10 。 2.根据权利要求1所述的一种风险数据识别方法, 其特征在于: 步骤S20 中, 所述对所述 交互数据进行语义识别以提取 出交互内容序列, 包括: 将所述交互数据转化为标准文本数据, 对所述标准文本数据进行分割处理以获得文本 矩阵, 所述文本矩阵中包括若干词汇; 将所述文本矩阵与各主题项目进行匹配 计算, 以得 出目标主题项目矩阵; 将所述文本矩阵与所述目标主题项目矩阵作为所述交 互内容序列。 3.根据权利要求2所述的一种风险数据识别方法, 其特征在于: 所述将所述文本矩阵与 各主题项目进行匹配 计算, 以得 出目标主题项目矩阵, 包括: 分别计算所述文本矩阵中各词汇与所述各主题项目的第一相似度; 基于各词汇的所述第 一相似度计算所述文本矩阵与各主题项目的第 二相似度, 基于所 述第二相似度确定所述文本矩阵匹配的目标主题项目矩阵。 4.根据权利要求3所述的一种风险数据识别方法, 其特征在于: 所述基于各词汇的所述 第一相似度计算所述文本矩阵与各主题项目的第二相似度, 包括: 基于所述第一相似度和第一阈值将各词汇与各主题项目进行分配; 通过下式计算所述文本矩阵与各主题项目的第二相似度: 式中, zi=j代表将所述文本矩阵分配给主题项目j, 即S(zi=j)代表 所述文本矩阵与各 主题项目的第二相似度, 即所述文本矩阵分配给所述主题项目j的概率; nw代表所述文本矩 阵中分配给所述主题项目j的特定词的数量, 所述特定词是各所述主题项目分别预先设置 的, 用于描述主题项目的核心内涵的词汇, δ代表所述文本矩阵特定词的数量; nd代表所述 文本矩阵中所有被分配了主题项目的词汇的数量, k代表所述主题项目的数量; α、 β 为预设 的调节参数, 其中, α +β =1, 且根据特定词在所述文本矩阵中特定词的等效序号确定得出, 等效序号越大, 则α 越大, 而等效序号可以为各 特定词的序号的均值/加权均值。 5.根据权利要求4所述的一种风险数据识别方法, 其特征在于: 步骤S30 中, 所述对所述 交互内容序列进行第一计算, 包括: 基于所述目标主题项目矩阵提取第一 风险序列; 基于所述文本矩阵中的被分配了的词汇计算所述文本矩阵与第一风险序列的第三相 似度, 将所述第三相似度作为第一结果; 相应地, 所述第 一计算的第 一结果满足第一条件, 具体为: 所述第三相似度大于第二阈权 利 要 求 书 1/2 页 2 CN 114444511 A 2值。 6.根据权利要求5所述的一种风险数据识别方法, 其特征在于: 步骤S40 中, 所述对所述 交互内容序列进行第二计算, 包括: 将所述文本矩阵和所述第 一风险序列输入深度学习 模型, 所述深度学习 模型输出第四 相似度, 将所述第四相似度作为所述第二结果; 相应地, 所述第 二计算的第 二结果满足第二条件, 具体为: 所述第四相似度大于第三阈 值。 7.根据权利要求6所述的一种风险数据识别方法, 其特征在于: 在输出所述交互数据存 在风险的提 示信息之后, 还 包括: 监测响应数据, 所述响应数据包括 正响应和负响应; 基于所述负响应对应的所述文本矩阵和所述第 一风险序列构建训练集, 基于所述训练 集对所述深度学习模型进行 再训练。 8.一种风险数据识别系统, 包括处理模块、 存储模块、 通信模块, 所述处理模块分别与 所述存储模块和所述 通信模块连接; 其中, 所述存储模块, 用于存 储可执行的计算机程序代码; 所述通信模块, 用于响应于服务接通信号而持续监测接通过程中的交互数据, 并将所 述交互数据传输给 所述处理模块; 其特征在于: 所述处理模块, 用于通过调用所述存储模块中的所述可执行的计算机程 序代码, 执 行如权利要求1 ‑7任一项所述的方法。 9.一种电子设备, 包括: 存储有可执行程序代码的存 储器; 与所述存 储器耦合的处 理器; 其特征在于: 所述处理器调用所述存储器中存储的所述可执行程序代码, 执行如权利 要求1‑7任一项所述的方法。 10.一种计算机存储介质, 该存储介质上存储有计算机程序, 其特征在于: 该计算机程 序被处理器运行时执 行如权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114444511 A 3

PDF文档 专利 一种风险数据识别方法及系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种风险数据识别方法及系统 第 1 页 专利 一种风险数据识别方法及系统 第 2 页 专利 一种风险数据识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。