专利 一种基于强化蒸馏的跨语言属性级情感分类方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210044125.9 (22)申请日 2022.01.14 (71)申请人东南大学地址 211189 江苏省南京市玄武区四牌楼 2 号 (72)发明人吴含前　王志可　吴国威　李露　 (74)专利代理机构南京众联专利代理有限公司 32206 代理人叶涓涓 (51)Int.Cl. G06F 40/44(2020.01) G06F 40/58(2020.01) G06F 40/30(2020.01) G06F 16/35(2019.01) G06N 3/04(2006.01) (54)发明名称一种基于强化蒸馏的跨语言属性级情感分类方法 (57)摘要本发明提供了一种基于强化蒸馏的跨语言属性级情感分类方法，基于源语言语料训练一个教师网络，基于知识蒸馏框架将源语言语料中的属性情感信息迁移到目标分类器中；采用序列选择器根据特定的属性从目标翻译句子序列中选择属性情感相关的信息，向目标分类器提供去噪后的句子序列表示；使用自注意力层构建基于跨语言蒸馏的目标分类器，建模属性序列与去噪后的目标翻译句子序列间的细粒度交互。本发明缓解了翻译语料与真实语料之间的领域偏差问题，目标分类器具有更强的泛化能力。本发明能够充分利用源语言与目标翻译中有效的属性情感信息，同时更好地建模句子与属性之间的细粒度交互。本发明在情感分类的各方面性能都较基线方法有了一定提升。权利要求书2页说明书8页附图2页 CN 114429143 A 2022.05.03 CN 114429143 A 1.一种基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，包括如下步骤：步骤一，基于源语言语料训练一个教师网络，基于知识蒸馏框架将源语言语料中的属性情感信息迁移到学生网络的目标分类器中；步骤二，采用属性敏感的序列选择器根据特定的属性从目标翻译句子序列中选择属性情感相关的信息，并作为模型的中间模块向目标分类器提供去噪后的句子序列表示；步骤三，使用自注意力层构建基于跨语言蒸馏的目标分类器，建模属性序列与去噪后的目标翻译句子序列间的细粒度交互。 2.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，所述序列选择器使用LSTM网络建模策略网络pπ，并利用策略梯度算法学习一个最优策略π (a1： n)，策略网络pπ通过定义回报学习最优策略，并以概率pπ(ai|si； θr)决定是否选择xi。 3.根据权利要求2所述的基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，所述策略网络的状态、动作和回报的定义如下： ·状态：第i个时间步的状态定义为si；根据给定的属性，状态需要提供足够的信息来决定是否选择xi，因此状态si由以下三部分构成：其中， hi是LSTM第i个时间步的隐状态表示， vi是第i个词xi的向量表示， vA是属性向量表示； ·动作：策略网络pπ以概率pπ(ai|si； θr)执行动作ai∈{0， 1}，并且使用逻吉斯特函数来计算此概率： a＝[a1， a2， ...， an]～pπ(A|S； θr) 其中θr为策略网络参数，～表示采样操作， S表示状态， A表示动作， wr与br表示可训练参数； ·回报：定义一个属性敏感的回报 R，该定义集成了属性情感分类损失和跨语言蒸馏损失，对于一个训练样本 <xs， xt， y>回报定义如下：其中θsrc为教师网络参数， θtgt为学生网络参数， γN ′/N为惩罚项防止过拟合。 4.根据权利要求1或3所述的基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，所述步骤二和步骤三具体包括如下过程：对于目标翻译句子表示属性表示通过序列选择器获得去噪后的句子表示HD，即： a＝[a1， a2， ...， aN]＝RATS(HS， vA) HD＝HS～a 其中， RATS表示序列选择器，生成动作序列a，～表示从HS中将所有位置ai＝1的向量提取出来拼接成新的句子序列表示；接着，在基于跨语言蒸馏的目标分类器中借助助自注意力层建模属性与去噪句子表示之间的细粒度交互： H＝Self Attention(HA， HD)权　利　要　求　书 1/2 页 2 CN 114429143 A 2最后，利用平均池化层和全连接层来计算每个类别的非归一化概率，即q＝[q1， q2， ...， qK]，其中K表示类别数；通过软化softmax层，将概率进行归一化：其中T表示温度，当T＝1时退化为softmax函数。 5.根据权利要求2或3所述的基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，对于所述序列选择器中的策略网络，利用基于策略梯度的REINFORCE算法进行优化；参数θr的优化目标即最大化期望回报关于参数θr的策略梯度定义如下：其中D表示数据集大小， N表示句子序列长度，表示表示第i个样本第t时间步的动作，表示第i个样本第t时间步的状态。 6.根据权利要求4所述的基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，对于目标分类器的参数θtgt，利用反响传播算法进行优化；寻求参数θtgt使得目标分类器的属性情感分类损失最小化：其中， <xs， xt>分别表示源语言训练样本和目标翻译训练样本， θsrc为教师网络参数， θtgt 为学生网络参数；知识蒸馏框架下教师网络参数在训练过程中需要被冻结。 7.根据权利要求4或6所述的基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，在模型训练初期， θr不参与训练过程，当参数θtgt在开发集上的损失开始收敛后，则开始对参数θr和 θtgt一起进行训练。 8.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，教师网络采用谷歌官方提供的BERTBase模型进行训练，学生网络的目标分类器使用多头自注意力层建模属性与去噪后句子序列之间的交互关系，由3层Transformer编码器子模块构成。句子序列最大长度设置为60，属性序列最大长度为5，词向量维度为768，句子序列和属性序列共享目标语言编码器。 9.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法，其特征在于，模型使用Adam优化器进行优化，初始学习率设置为1e ‑5用于训练学生网络，知识蒸馏温度T设置为3，回报中的惩罚项参数γ 设置为1e‑5；此外，模型训练的批次大小取值为32，训练迭代轮数为10，神经元随机失活率设置为0.3 。权　利　要　求　书 2/2 页 3 CN 114429143 A 3

专利 一种基于强化蒸馏的跨语言属性级情感分类方法

专利一种基于强化蒸馏的跨语言属性级情感分类方法