专利 投诉预测方法及其模型建立方法、装置以及相关设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210107767.9 (22)申请日 2022.01.28 (71)申请人上海携旅信息技术有限公司地址 201803 上海市嘉定区金园一路13 31 号401室-4 (72)发明人王子奕　鞠剑勋　李健　 (74)专利代理机构上海隆天律师事务所 31282 专利代理师潘一诺 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/211(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06Q 30/02(2012.01) G06Q 50/14(2012.01) (54)发明名称投诉预测方法及其模型建立方法、装置以及相关设备 (57)摘要本发明提供一种投诉预测方法及其模型建立方法、装置以及相关设备，方法包括：设置投诉预测模型的预测的标签集合；获取历史客服对话文本以及历史客服对话文本的标签；使用LTP语言处理工具对历史客服对话文本进行分词；使用 BERT分词器生成字令牌id序列、字位置id序列、字片段id序列以及字掩码序列；输入模型编码层，获得字特征序列；获得词特征序列；将词特征序列输入至语法层的图神经网络，以感知语法特征；输出历史客服对话文本的句子表示；对句子表示执行仿射变换以及归一化处理，获得标签概率分布；将句子表示输入至标签混淆层，计算伪标签概率分布；计算损失函数；迭代训练投诉预测模型。本发明实现线上旅行社的投诉预测。权利要求书2页说明书12页附图4页 CN 114676247 A 2022.06.28 CN 114676247 A 1.一种投诉预测模型建立方法，其特征在于，包括：设置所述投诉预测模型的预测的标签集合；获取历史客服对话文本以及历史客服对话文本的标签；使用LTP语言处理工具对所述历史客服对话文本进行分词，生成词掩码序列以及句法依存关系图；使用BERT分词器基于所述历史客服对话文本，生成字令牌id序列、字位置id序列、字片段id序列以及字掩码序列；将所述字令牌id序列、字位置id序列、字片段id序列输入模型编码层，获得所述历史客服对话文本标识的用户内容在字符维度的字特征序列；将所述字特征序列和字掩码序列转换为设定尺寸，并基于所述字特征序列和字掩码序列获得词特征序列；将所述词特征序列输入至语法层的图神经网络，以感知所述词特征序列的语法特征；根据所述词特征序列的语法特征以及词掩码序列输出所述历史客服对话文本的句子表示；对所述句子表示执行仿射变换以及归一化处理，获得所述投诉预测模型输出的标签的标签概率分布；将所述句子表示输入至标签混淆层，计算伪标签概率分布；根据所述伪标签概率分布和所述标签概率分布计算所述投诉预测模型的损失函数；迭代训练所述投诉预测模型，以使得所计算的损失函数符合设定条件。 2.如权利要求1所述的投诉预测模型建立方法，其特征在于，所述获取历史客服对话文本以及历史客服对话文本的标签还包括：设置所述历史客服对话文本的最大词数量；设置所述历史客服对话文本中的词的最大字符数量。 3.如权利要求1所述的投诉预测模型建立方法，其特征在于，所述字特征序列为仅使用所述BERT分词器的前6个输出字符获得的序列，输入所述编码层获得的字特征序列。 4.如权利要求1所述的投诉预测模型建立方法，其特征在于，所述将所述字特征序列和字掩码序列转换为设定尺寸，并基于所述字特征序列和字掩码序列获得词特征序列包括：以所述字掩码序列的字掩码为权重，对单词字符维度对单词的各字符的特征求平均，获得词特征序列。 5.如权利要求1所述的投诉预测模型建立方法，其特征在于，所述语法层的图神经网络包括两个多关系图神经网络层。 6.如权利要求5所述的投诉预测模型建立方法，其特征在于，所述投诉预测模型的损失函数为KL散度。 7.一种投诉预测方法，其特征在于，包括：接收用户输入的对话文本；根据所述对话文本，生成字令牌id序列、字位置id序列、字分段id序列、字掩码序列以及句法依存关系图；将所述对话文本，生成字令牌id序列、字位置id序列、字分段id序列、字掩码序列以及句法依存关系图输入如权利要求1至6任一项所述的投诉预测模型建立方法建立的投诉预权　利　要　求　书 1/2 页 2 CN 114676247 A 2测模型中；获取所述投诉预测模型预测的标签的标签概率分布；将所述标签概率分布中概率最高的标签作为所述对话文本的预测标签。 8.一种投诉预测模型建立装置，其特征在于，包括：设置模块，用于设置所述投诉预测模型的预测的标签集合；获取模块，用于获取历史客服对话文本以及历史客服对话文本的标签；分词模块，用于使用LTP语言处理工具对所述历史客服对话文本进行分词，生成词掩码序列以及句法依存关系图；嵌入模块，用于使用BERT分词器基于所述历史客服对话文本，生成字令牌id序列、字位置id序列、字片段id序列以及字掩码序列；编码模块，用于将所述字令牌id序列、字位置id序列、字片段id序列输入模型编码层，获得所述历史客服对话文本标识的用户内容在字符维度的字特征序列；转换模块，用于将所述字特征序列和字掩码序列转换为设定尺寸，并基于所述字特征序列和字掩码序列获得词特征序列；语法模块，用于将所述词特征序列输入至语法层的图神经网络，以感知所述词特征序列的语法特征；句子表示模块，用于根据所述词特征序列的语法特征以及词掩码序列输出所述历史客服对话文本的句子表示；概率分布模块，用于对所述句子表示执行仿射变换以及归一化处理，获得所述投诉预测模型输出的标签的标签概率分布；标签混淆模块，用于将所述句子表示输入至标签混淆层，计算伪标签概率分布；损失计算模块，用于根据所述伪标签概率分布和所述标签概率分布计算所述投诉预测模型的损失函数；迭代训练模块，用于迭代训练所述投诉预测模型，以使得所计算的损失函数符合设定条件。 9.一种电子设备，其特征在于，所述电子设备包括：处理器；存储介质，其上存储有计算机程序，所述计算机程序被所述处理器运行时执行如权利要求1至7任一项所述的投诉预测模型建立方法。 10.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至7任一项所述的投诉预测模型建立方法。权　利　要　求　书 2/2 页 3 CN 114676247 A 3

专利 投诉预测方法及其模型建立方法、装置以及相关设备

专利投诉预测方法及其模型建立方法、装置以及相关设备