(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210107767.9
(22)申请日 2022.01.28
(71)申请人 上海携旅信息技 术有限公司
地址 201803 上海市嘉定区金园一路13 31
号401室-4
(72)发明人 王子奕 鞠剑勋 李健
(74)专利代理 机构 上海隆天律师事务所 31282
专利代理师 潘一诺
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/211(2020.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06Q 30/02(2012.01)
G06Q 50/14(2012.01)
(54)发明名称
投诉预测方法及其模 型建立方法、 装置以及
相关设备
(57)摘要
本发明提供一种投诉预测方法及其模型建
立方法、 装置以及相关设备, 方法包括: 设置投诉
预测模型的预测的标签集合; 获取历史客服对话
文本以及历史客服对话文本的标签; 使用LTP语
言处理工 具对历史客服对话文本进行分词; 使用
BERT分词器生成字令牌id序列、 字位置id序列、
字片段id序列以及字掩码序列; 输入模型编码
层, 获得字 特征序列; 获得词特征序列; 将词特征
序列输入至语 法层的图神经网络, 以感知语法特
征; 输出历史客服对话文本的句子表示; 对句子
表示执行仿射变换以及归一化处理, 获得标签概
率分布; 将句子表示输入至标签混淆层, 计算伪
标签概率分布; 计算损失函数; 迭代训练投诉预
测模型。 本发明实现线上旅行 社的投诉预测。
权利要求书2页 说明书12页 附图4页
CN 114676247 A
2022.06.28
CN 114676247 A
1.一种投诉预测模型建立方法, 其特 征在于, 包括:
设置所述投诉预测模型的预测的标签集 合;
获取历史客 服对话文本以及历史客 服对话文本的标签;
使用LTP语言处理工具对所述历史客服对话文本进行分词, 生成词掩码序列以及句法
依存关系图;
使用BERT分词器基于所述历史客服对话文本, 生成字令牌id序列、 字位置id序列、 字片
段id序列以及字掩码序列;
将所述字令牌id序列、 字位置id序列、 字片段id序列输入模型编码层, 获得所述历史客
服对话文本标识的用户内容在字符维度的字特 征序列;
将所述字特征序列和字掩码序列转换为设定尺寸, 并基于所述字特征序列和字掩码序
列获得词特 征序列;
将所述词特 征序列输入至语法层的图神经网络, 以感知所述词特 征序列的语法特 征;
根据所述词特征序列的语法特征以及词掩码序列输出所述历史客服对话文本的句子
表示;
对所述句子表示执行仿射变换以及归一化处理, 获得所述投诉预测模型输出的标签的
标签概率分布;
将所述句子表示输入至标签混淆层, 计算伪标签概 率分布;
根据所述伪标签概 率分布和所述标签概 率分布计算所述投诉预测模型的损失函数;
迭代训练所述投诉预测模型, 以使得 所计算的损失函数符合设定条件。
2.如权利要求1所述的投诉预测模型建立方法, 其特征在于, 所述获取历史客服对话文
本以及历史客 服对话文本的标签还 包括:
设置所述历史客 服对话文本的最大词数量;
设置所述历史客 服对话文本中的词的最大字符数量。
3.如权利要求1所述的投诉预测模型建立方法, 其特征在于, 所述字特征序列为仅使用
所述BERT分词器的前6个输出字符获得的序列, 输入所述编码层获得的字特 征序列。
4.如权利要求1所述的投诉预测模型建立方法, 其特征在于, 所述将所述字特征序列和
字掩码序列转换为设定尺寸, 并基于所述字特 征序列和字掩码序列获得词特 征序列包括:
以所述字掩码序列的字掩码为权重, 对单词字符维度对单词的各字符的特征求平均,
获得词特 征序列。
5.如权利要求1所述的投诉预测模型建立方法, 其特征在于, 所述语法层的图神经网络
包括两个多关系图神经网络层。
6.如权利要求5所述的投诉预测模型建立方法, 其特征在于, 所述投诉预测模型的损失
函数为KL散度。
7.一种投诉预测方法, 其特 征在于, 包括:
接收用户输入的对话文本;
根据所述对话文本, 生成字令牌id序列、 字位置id序列、 字分段id序列、 字掩码序列以
及句法依存关系图;
将所述对话文本, 生成字令牌id序列、 字位置id序列、 字分段id序列、 字掩码序列以及
句法依存关系图输入如权利要求1至6任一项所述的投诉预测模型建立方法建立的投诉预权 利 要 求 书 1/2 页
2
CN 114676247 A
2测模型中;
获取所述投诉预测模型 预测的标签的标签概 率分布;
将所述标签概 率分布中概 率最高的标签作为所述对话文本的预测标签。
8.一种投诉预测模型建立装置, 其特 征在于, 包括:
设置模块, 用于设置所述投诉预测模型的预测的标签集 合;
获取模块, 用于获取历史客 服对话文本以及历史客 服对话文本的标签;
分词模块, 用于使用LTP语言处理工具对所述历史客服对话文本进行分词, 生成词掩码
序列以及句法依存关系图;
嵌入模块, 用于使用BERT分词器基于所述历史客服对话文本, 生成字令牌id序列、 字位
置id序列、 字片段id序列以及字掩码序列;
编码模块, 用于将所述字令牌id序列、 字位置id序列、 字片段id序列输入模型编码层,
获得所述历史客 服对话文本标识的用户内容在字符维度的字特 征序列;
转换模块, 用于将所述字特征序列和字掩码序列转换为设定尺寸, 并基于所述字特征
序列和字掩码序列获得词特 征序列;
语法模块, 用于将所述词特征序列输入至语法层的图神经网络, 以感知所述词特征序
列的语法特 征;
句子表示模块, 用于根据所述词特征序列的语法特征以及词掩码序列输出所述历史客
服对话文本的句子表示;
概率分布模块, 用于对所述句子表示执行仿射变换以及归一化处理, 获得所述投诉预
测模型输出的标签的标签概 率分布;
标签混淆模块, 用于将所述句子表示输入至标签混淆层, 计算伪标签概 率分布;
损失计算模块, 用于根据所述伪标签概率分布和所述标签概率分布计算所述投诉预测
模型的损失函数;
迭代训练模块, 用于迭代训练所述投诉预测模型, 以使得所计算的损 失函数符合设定
条件。
9.一种电子设备, 其特 征在于, 所述电子设备包括:
处理器;
存储介质, 其上存储有计算机程序, 所述计算机程序被所述处理器运行时执行如权利
要求1至7任一项所述的投诉预测模型建立方法。
10.一种存储介质, 其特征在于, 所述存储介质上存储有计算机程序, 所述计算机程序
被处理器运行时执 行如权利要求1至7任一项所述的投诉预测模型建立方法。权 利 要 求 书 2/2 页
3
CN 114676247 A
3
专利 投诉预测方法及其模型建立方法、装置以及相关设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:40上传分享