standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210044125.9 (22)申请日 2022.01.14 (71)申请人 东南大学 地址 211189 江苏省南京市玄武区四牌楼 2 号 (72)发明人 吴含前 王志可 吴国威 李露 (74)专利代理 机构 南京众联专利代理有限公司 32206 代理人 叶涓涓 (51)Int.Cl. G06F 40/44(2020.01) G06F 40/58(2020.01) G06F 40/30(2020.01) G06F 16/35(2019.01) G06N 3/04(2006.01) (54)发明名称 一种基于强化蒸馏的跨语言属性级情感分 类方法 (57)摘要 本发明提供了一种基于强化蒸馏的跨语言 属性级情感分类方法, 基于源语言语料训练一个 教师网络, 基于知识蒸馏框架将源语 言语料中的 属性情感信息迁移到目标分类器中; 采用序列选 择器根据特定的属性从目标翻译句子序列中选 择属性情感相关的信息, 向目标分类器提供去噪 后的句子序列表示; 使用自注 意力层构建基于跨 语言蒸馏的目标分类器, 建模属性序列与去噪后 的目标翻译句子序列间的细粒度交互。 本发明缓 解了翻译语料与真实语料之间的领域偏差问题, 目标分类器具有更强的泛化能力。 本发明能够充 分利用源语言与 目标翻译中有效的属性情感信 息, 同时更好地建模句子与属性之间的细粒度交 互。 本发明在情感分类的各方面性能都较基线 方 法有了一定提升 。 权利要求书2页 说明书8页 附图2页 CN 114429143 A 2022.05.03 CN 114429143 A 1.一种基于强化蒸馏的跨语言属性级情感分类方法, 其特 征在于, 包括如下步骤: 步骤一, 基于源语言语料训练一个教师网络, 基于知识蒸馏框架将源语言语料中的属 性情感信息 迁移到学生网络的目标分类 器中; 步骤二, 采用属性敏感的序列选择器根据 特定的属性从 目标翻译句子序列中选择属性 情感相关的信息, 并作为模型的中间模块向目标分类 器提供去噪后的句子序列表示; 步骤三, 使用自注意力层构建基于跨语言蒸馏的目标分类器, 建模属性序列与去噪后 的目标翻译句子序列间的细粒度交 互。 2.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 所 述序列选择器使用LSTM网络建模策略网络pπ, 并利用策略梯度算法学习一个最优策略π (a1: n), 策略网络pπ通过定义回报学习最优策略, 并以概 率pπ(ai|si; θr)决定是否 选择xi。 3.根据权利要求2所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 所 述策略网络的状态、 动作和回报的定义如下: ·状态: 第i个时间步的状态 定义为si; 根据给定的属性, 状态需要 提供足够的信息来决 定是否选择xi, 因此状态si由以下三部分构成: 其中, hi是LSTM第i个时间步的隐状态表示, vi是第i个词xi的向量表示, vA是属性向量表 示; ·动作: 策略网络pπ以概率pπ(ai|si; θr)执行动作ai∈{0, 1}, 并且使用逻吉斯特函数来 计算此概 率: a=[a1, a2, ..., an]~pπ(A|S; θr) 其中θr为策略网络参数, ~表示采样操作, S表示状态, A表示动作, wr与br表示可训练参 数; ·回报: 定义一个属性敏感的回报 R, 该定义集成了属性情 感分类损失和跨语言蒸馏损 失, 对于一个训练样本 <xs, xt, y>回报定义如下: 其中θsrc为教师网络参数, θtgt为学生网络参数, γN ′/N为惩罚项防止过拟合。 4.根据权利要求1或3所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在 于, 所述步骤二和步骤三具体包括如下 过程: 对于目标翻译句子表示 属性表示 通过序 列选择器获得去噪后的句子表示HD, 即: a=[a1, a2, ..., aN]=RATS(HS, vA) HD=HS~a 其中, RATS表示序列选择器, 生成动作序列a, ~表示从HS中将所有位置ai=1的向量提 取出来拼接成新的句子序列表示; 接着, 在基于跨语言蒸馏的目标分类器中借助助自注意力层 建模属性与去噪句子表示 之间的细粒度交 互: H=Self Attention(HA, HD)权 利 要 求 书 1/2 页 2 CN 114429143 A 2最后, 利用平均池化层和全连接层来计算每个类别的非归一化概率, 即q=[q1, q2, ..., qK], 其中K表示类别数; 通过 软化softmax层, 将概 率进行归一 化: 其中T表示温度, 当T=1时退化 为softmax函数。 5.根据权利要求2或3所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在 于, 对于所述序列选择器中的策略网络, 利用基于策略梯度的REINFORCE算法进行优化; 参 数θr的优化目标即最大化期望回报 关于参数θr的策略梯度定义如下: 其中D表示数据集大小, N表示句子序列长度, 表示表示第i个样本第t时间步的动作, 表示第i个样本第t时间步的状态。 6.根据权利要求4所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 对 于目标分类器的参数θtgt, 利用反响传播算法进行优化; 寻求参数θtgt使得目标分类器的属 性情感分类损失最小化: 其中, <xs, xt>分别表示源语言训练样本和目标翻译训练样本, θsrc为教师网络参数, θtgt 为学生网络参数; 知识蒸馏框架下教师网络参数在训练过程中 需要被冻结。 7.根据权利要求4或6所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在 于, 在模型训练初期, θr不参与训练过程, 当参数θtgt在开发集上的损失开始收敛后, 则开始 对参数θr和 θtgt一起进行训练。 8.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 教 师网络采用谷歌官方提供的BERTBase模 型进行训练, 学生网络的目标分类器使用多头自注 意力层建模属性与去噪后句子序列之间的交互关系, 由3层Transformer编码器子模块构 成。 句子序列最大长度设置为60, 属性序列最大长度为5, 词向量维度为768, 句子序列和属 性序列共享目标语言编码器。 9.根据权利要求1所述的基于强化蒸馏的跨语言属性级情感分类方法, 其特征在于, 模 型使用Adam优化器进 行优化, 初始学习率设置为1e ‑5用于训练学生网络, 知识蒸馏温度T设 置为3, 回报中的惩罚项参数γ 设置为1e‑5; 此外, 模 型训练的批次大小 取值为32, 训练迭代 轮数为10, 神经 元随机失活率设置为0.3 。权 利 要 求 书 2/2 页 3 CN 114429143 A 3
专利 一种基于强化蒸馏的跨语言属性级情感分类方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:54
上传分享
举报
下载
原文档
(775.9 KB)
分享
友情链接
GB-T 9176-2016 桑蚕干茧.pdf
GB-T 11066.1-2008 金化学分析方法 金量的测定 火试金法.pdf
辽宁省矛盾纠纷多元预防化解条例.pdf
ISO 20653 2023 Road vehicles — Degrees of protection (IP code) — Protection of elect.pdf
GB-T 20272-2019 信息安全技术 操作系统安全技术要求.pdf
清华大学自动化系:2023预训练大模型与医疗:从算法研究到应用.pdf
GB-T 2362-1990 小模数渐开线圆柱齿轮基本齿廓.pdf
GB-T 42014-2022 信息安全技术 网上购物服务数据安全要求.pdf
GB 35650-2017 国家基本比例尺地图测绘基本技术规定.pdf
T-ZSCPA 001—2023 绿色智慧城市评价指标体系.pdf
GB-T 32955-2016 集装箱用不锈钢钢板和钢带.pdf
GB-T 35164-2017 用于水泥、砂浆和混凝土中的石灰石粉.pdf
DB45-T 2129-2020 美丽乡村 人畜分离管理规范 广西壮族自治区.pdf
T-CPUMT 007—2022 工业控制系统信息安全事件应急演练基本要求.pdf
GB-T 24561-2009 干燥窑与烘烤炉节能监测.pdf
GB-T 10111-2008 随机数的产生及其在产品质量抽样检验中的应用程序.pdf
T-CSAE 286.2—2022 功能型无人车 第2部分:总体技术要求.pdf
GB-T 15478-2015 压力传感器性能试验方法.pdf
T-CRES 0008—2020 海上风力发电机组 验收规程.pdf
GB-T 32678-2016 橡胶配合剂 高分散沉淀水合二氧化硅.pdf
1
/
13
评价文档
赞助2.5元 点击下载(775.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。