standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210044125.9 (22)申请日 2022.01.14 (71)申请人 东南大学 地址 211189 江苏省南京市玄武区四牌楼 2 号 (72)发明人 吴含前 王志可 吴国威 李露  (74)专利代理 机构 南京众联专利代理有限公司 32206 代理人 叶涓涓 (51)Int.Cl. G06F 40/44(2020.01) G06F 40/58(2020.01) G06F 40/30(2020.01) G06F 16/35(2019.01) G06N 3/04(2006.01) (54)发明名称 一种基于强化蒸馏的跨语言属性级情感分 类方法 (57)摘要 本发明提供了一种基于强化蒸馏的跨语言 属性级情感分类方法, 基于源语言语料训练一个 教师网络, 基于知识蒸馏框架将源语 言语料中的 属性情感信息迁移到目标分类器中; 采用序列选 择器根据特定的属性从目标翻译句子序列中选 择属性情感相关的信息, 向目标分类器提供去噪 后的句子序列表示; 使用自注 意力层构建基于跨 语言蒸馏的目标分类器, 建模属性序列与去噪后 的目标翻译句子序列间的细粒度交互。 本发明缓 解了翻译语料与真实语料之间的领域偏差问题, 目标分类器具有更强的泛化能力。 本发明能够充 分利用源语言与 目标翻译中有效的属性情感信 息, 同时更好地建模句子与属性之间的细粒度交 互。 本发明在情感分类的各方面性能都较基线 方 法有了一定提升 。 权利要求书2页 说明书8页 附图2页 CN 114429143 A 2022.05.03 CN 114429143 A 1.一种基于强化蒸馏的跨语言属性级情感分类方法, 其特 征在于, 包括如下步骤: 步骤一, 基于源语言语料训练一个教师网络, 基于知识蒸馏框架将源语言语料中的属 性情感信息 迁移到学生网络的目标分类 器中; 步骤二, 采用属性敏感的序列选择器根据 特定的属性从 目标翻译句子序列中选择属性 情感相关的信息, 并作为模型的中间模块向目标分类 器提供去噪后的句子序列表示; 步骤三, 使用自注意力层构建基于跨语言蒸馏的目标分类器, 建模属性序列与去噪后 的目标翻译句子序列间的细粒度交 互。 2.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 所 述序列选择器使用LSTM网络建模策略网络pπ, 并利用策略梯度算法学习一个最优策略π (a1: n), 策略网络pπ通过定义回报学习最优策略, 并以概 率pπ(ai|si; θr)决定是否 选择xi。 3.根据权利要求2所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 所 述策略网络的状态、 动作和回报的定义如下: ·状态: 第i个时间步的状态 定义为si; 根据给定的属性, 状态需要 提供足够的信息来决 定是否选择xi, 因此状态si由以下三部分构成: 其中, hi是LSTM第i个时间步的隐状态表示, vi是第i个词xi的向量表示, vA是属性向量表 示; ·动作: 策略网络pπ以概率pπ(ai|si; θr)执行动作ai∈{0, 1}, 并且使用逻吉斯特函数来 计算此概 率: a=[a1, a2, ..., an]~pπ(A|S; θr) 其中θr为策略网络参数, ~表示采样操作, S表示状态, A表示动作, wr与br表示可训练参 数; ·回报: 定义一个属性敏感的回报 R, 该定义集成了属性情 感分类损失和跨语言蒸馏损 失, 对于一个训练样本 <xs, xt, y>回报定义如下: 其中θsrc为教师网络参数, θtgt为学生网络参数, γN ′/N为惩罚项防止过拟合。 4.根据权利要求1或3所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在 于, 所述步骤二和步骤三具体包括如下 过程: 对于目标翻译句子表示 属性表示 通过序 列选择器获得去噪后的句子表示HD, 即: a=[a1, a2, ..., aN]=RATS(HS, vA) HD=HS~a 其中, RATS表示序列选择器, 生成动作序列a, ~表示从HS中将所有位置ai=1的向量提 取出来拼接成新的句子序列表示; 接着, 在基于跨语言蒸馏的目标分类器中借助助自注意力层 建模属性与去噪句子表示 之间的细粒度交 互: H=Self Attention(HA, HD)权 利 要 求 书 1/2 页 2 CN 114429143 A 2最后, 利用平均池化层和全连接层来计算每个类别的非归一化概率, 即q=[q1, q2, ..., qK], 其中K表示类别数; 通过 软化softmax层, 将概 率进行归一 化: 其中T表示温度, 当T=1时退化 为softmax函数。 5.根据权利要求2或3所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在 于, 对于所述序列选择器中的策略网络, 利用基于策略梯度的REINFORCE算法进行优化; 参 数θr的优化目标即最大化期望回报 关于参数θr的策略梯度定义如下: 其中D表示数据集大小, N表示句子序列长度, 表示表示第i个样本第t时间步的动作, 表示第i个样本第t时间步的状态。 6.根据权利要求4所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 对 于目标分类器的参数θtgt, 利用反响传播算法进行优化; 寻求参数θtgt使得目标分类器的属 性情感分类损失最小化: 其中, <xs, xt>分别表示源语言训练样本和目标翻译训练样本, θsrc为教师网络参数, θtgt 为学生网络参数; 知识蒸馏框架下教师网络参数在训练过程中 需要被冻结。 7.根据权利要求4或6所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在 于, 在模型训练初期, θr不参与训练过程, 当参数θtgt在开发集上的损失开始收敛后, 则开始 对参数θr和 θtgt一起进行训练。 8.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 教 师网络采用谷歌官方提供的BERTBase模 型进行训练, 学生网络的目标分类器使用多头自注 意力层建模属性与去噪后句子序列之间的交互关系, 由3层Transformer编码器子模块构 成。 句子序列最大长度设置为60, 属性序列最大长度为5, 词向量维度为768, 句子序列和属 性序列共享目标语言编码器。 9.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 模 型使用Adam优化器进 行优化, 初始学习率设置为1e ‑5用于训练学生网络, 知识蒸馏温度T设 置为3, 回报中的惩罚项参数γ 设置为1e‑5; 此外, 模 型训练的批次大小 取值为32, 训练迭代 轮数为10, 神经 元随机失活率设置为0.3 。权 利 要 求 书 2/2 页 3 CN 114429143 A 3

PDF文档 专利 一种基于强化蒸馏的跨语言属性级情感分类方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于强化蒸馏的跨语言属性级情感分类方法 第 1 页 专利 一种基于强化蒸馏的跨语言属性级情感分类方法 第 2 页 专利 一种基于强化蒸馏的跨语言属性级情感分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。