专利 一种基于深度学习的短信模板生成方法、系统及电子装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210005653.3 (22)申请日 2022.01.04 (71)申请人四川新网银行股份有限公司地址 610000 四川省成都市中国(四川)自由贸易试验区成都高新区吉泰三路8 号1栋1单元26楼1-8号 (72)发明人易磊　杨嘉　赵金铃　应翔飞　 (74)专利代理机构成都行之专利代理事务所 (普通合伙) 51220 代理人张杨 (51)Int.Cl. G06F 40/186(2020.01) G06F 40/216(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01)G06F 16/33(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) (54)发明名称一种基于深度学习的短信模板生成方法、系统及电子装置 (57)摘要本发明公开了一种基于深度学习的短信模板生成方法、系统及电子装置，方法包括以下步骤：获取短信文本的待压缩短信文本，并对所述待压缩短信文本进行预处理；将预处理后的所述待压缩短信文本输入至训练好的Transformer模型中，以获取压缩短信文本；获取所述压缩短信文本的语句通顺概率矩阵以及词频概率矩阵；根据所述语句通顺概率矩阵以及所述词频概率矩阵从所述压缩短信文本中选取最佳压缩短信文本。本发明的目的在于提供一种基于深度学习的短信模板生成方法、系统及电子装置，通过构建缩写模型生成大量与原文相似的句子，再通过分类模型，选出符合语句通顺性和字数尽可能少的句子作为输出，以此达到生成短信模板的目的。权利要求书3页说明书7页附图1页 CN 114330276 A 2022.04.12 CN 114330276 A 1.一种基于深度学习的短信模板生成方法，其特征在于，包括以下步骤：获取短信文本的待压缩短信文本，并对所述待压缩短信文本进行预处理；其中，所述待压缩短信文本为删除标注内容后的所述短信文本，所述标注内容为预先标注在所述短信文本中的内容；将预处理后的所述待压缩短信文本输入至训练好的Transformer模型中，以获取压缩短信文本；获取所述压缩短信文本的语句通顺概率矩阵以及词频概率矩阵；根据所述语句通顺概率矩阵以及所述词频概率矩阵从所述压缩短信文本中选取最佳压缩短信文本。 2.根据权利要求1所述的一种基于深度学习的短信模板生成方法，其特征在于，获取所述语句通顺概率矩阵包括以下子步骤：在每一条所述压缩短信文本的文本前插入“[CLS]”标记；将添加了“[CLS]”标记的所述压缩短信文本输入至训练好的BERT分类模型中，以获取每一条所述压缩短信文本的语句通顺概率矩阵[P1(0)， P1(1)]， P1(0)表示语句通顺的概率， P1(1)表示语句不通顺的概率。 3.根据权利要求1所述的一种基于深度学习的短信模板生成方法，其特征在于，获取所述词频概率矩阵包括以下子步骤：对所述压缩短信文本做分词处理；统计各个词汇在正类文本中的出现次数和在负类文本中的出现次数；其中，所述正类文本和所述负类文本由训练所述Transformer模型时获取；根据各个词汇在正类文本中的出现次数和各个词汇在负类文本中的出现次数获取所述压缩短信文本的词频概率矩阵[P2(0)， P2(1)]：其中， P2(0)表示所述压缩短信文本为所述正类文本的概率， P2(1)表示所述压缩短信文本为所述负类文本的概率， N1表示所述正类文本中的总词汇数， N2表示所述负类文本中的总词汇数， count1(wn)表示第n个词汇在所述正类文本中的出现次数， c ount2(wn)表示第n个词汇在所述负类文本中的出现次数。 4.根据权利要求1 ‑3中任意一项所述的一种基于深度学习的短信模板生成方法，其特征在于，根据所述语句通顺概率矩阵以及所述词频概率矩阵从所述压缩短信文本中选取最佳压缩短信文本包括以下子步骤：获取所述压缩短信文本的评分： S＝P1(0)‑P1(1)+P2(0)‑P2(1) 其中， S表示评分， P1(0)表示语句通顺的概率， P1(1)表示语句不通顺的概率， P2(0)表示压缩短信文本为正类文本的概率， P2(1)表示压缩短信文本为负类文本的概率；选择评分最高的所述压缩短信文本作为所述最佳压缩短信文本。 5.一种基于深度学习的短信模板生成系统，其特征在于，包括：权　利　要　求　书 1/3 页 2 CN 114330276 A 2第一获取模块，获取短信文本的待压缩短信文本，并对所述待压缩短信文本进行预处理；其中，所述待压缩短信文本为删除标注内容后的所述短信文本，所述标注内容为预先标注在所述短信文本中的内容；第二获取模块，用于将预处理后的所述待压缩短信文本输入至训练好的Transformer 模型中，以获取压缩短信文本；第三获取模块，用于获取所述压缩短信文本的语句通顺概率矩阵以及词频概率矩阵；选择模块，用于根据所述语句通顺概率矩阵以及所述词频概率矩阵从所述压缩短信文本中选取最佳压缩短信文本。 6.根据权利要求5所述的一种基于深度学习的短信模板生成系统，其特征在于，所述第三获取模块包括：插入单元，用于在每一条所述压缩短信文本的文本前插入“[CLS]”标记；第一获取单元，用于将添加了 “[CLS]”标记的所述压缩短信文本输入至训练好的BERT 分类模型中，以获取每一条所述压缩短信文本的语句通顺概率矩阵[P1(0)， P1(1)]， P1(0)表示语句通顺的概率， P1(1)表示语句不通顺的概率。 7.根据权利要求5所述的一种基于深度学习的短信模板生成系统，其特征在于，所述第三获取模块包括：分词单元，用于所述压缩短信文本做分词处理；统计单元，用于统计各个词汇在正类文本中的出现次数和在负类文本中的出现次数；其中，所述正类文本和所述负类文本由训练所述Transformer模型时获取；第二获取单元，用于根据各个词汇在正类文本中的出现次数和各个词汇在负类文本中的出现次数获取所述压缩短信文本的词频概率矩阵[P2(0)， P2(1)]：其中， P2(0)表示所述压缩短信文本为所述正类文本的概率， P2(1)表示所述压缩短信文本为所述负类文本的概率， N1表示所述正类文本中的总词汇数， N2表示所述负类文本中的总词汇数， count1(wn)表示第n个词汇在所述正类文本中的出现次数， c ount2(wn)表示第n个词汇在所述负类文本中的出现次数。 8.根据权利要求6所述的一种基于深度学习的短信模板生成系统，其特征在于，所述选择模块包括：计算单元，用于获取所述压缩短信文本的评分： S＝P1(0)‑P1(1)+P2(0)‑P2(1) 其中， S表示评分， P1(0)表示语句通顺的概率， P1(1)表示语句不通顺的概率， P2(0)表示所述压缩短信文本为正类文本的概率， P2(1)表示所述压缩短信文本为负类文本的概率；选择单元，用于选择评分最高的所述压缩短信文本作为所述最佳压缩短信文本。 9.一种电子装置，其特征在于，包括处理器和存储器；所述存储器，用于存储所述处理器可执行指令；权　利　要　求　书 2/3 页 3 CN 114330276 A 3

专利 一种基于深度学习的短信模板生成方法、系统及电子装置

专利一种基于深度学习的短信模板生成方法、系统及电子装置