(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210039899.2
(22)申请日 2022.01.14
(65)同一申请的已公布的文献号
申请公布号 CN 114065769 A
(43)申请公布日 2022.02.18
(73)专利权人 四川大学
地址 610065 四川省成 都市武侯区一环路
南一段24号
(72)发明人 琚生根 高德辰 周刚
(74)专利代理 机构 北京超凡宏宇专利代理事务
所(特殊普通 合伙) 11463
代理人 王新哲
(51)Int.Cl.
G06F 40/30(2020.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(56)对比文件
CN 103646088 A,2014.0 3.19
CN 106484767 A,2017.0 3.08
CN 111382565 A,2020.07.07
CA 2604690 A1,20 08.04.06
US 20143 58523 A1,2014.12.04
代建华 等. “基于情感膨胀门控CN N的情感-
原因对提取 ”. 《数据分析与知识发现》 .2020,第4
卷(第8期),
Kiichi Tago 等.“Influence Analysis of
Emotional Behavi ors and User
Relationships Based o n Twitter Data ”.
《Tsinghua Science and Tec hnology》 .2018,第
23卷(第1期),
审查员 王高云
(54)发明名称
情感原因对抽取模型的训练方法、 装置、 设
备及介质
(57)摘要
本发明实施例公开了情感原因对抽取模型
的训练方法、 装置、 设备及介质, 涉及神经网络模
型领域, 方法包括: 将文档样本输入至第一编码
网络以对词和子句编码, 得到情感子句表示和原
因子句表 示; 对每个子句的两种子句表示进行预
测, 得到两种子句预测结果、 情感输出及原因输
出; 将情感输出和原因输出输入至图注意力网络
以更新; 基于配对网络, 根据更新后的两种输出
得到对应的情感表示和原因表示, 将情感表示和
原因表示配对以得到情感原因对; 根据预测网
络, 得到情感原因对预测结果; 根据预测结果计
算损失值并更新模型。 由此, 本发明利用图注意
力网络对每个子句间的相互关系进行提取, 丰富
了每个子句的情感输出和原因输出包含的信息,
提高了准确率。
权利要求书3页 说明书12页 附图4页
CN 114065769 B
2022.04.08
CN 114065769 B
1.一种情感原因对抽取模型的训练方法, 其特征在于, 所述情感原因对抽取模型包括
第一编码网络、 第二编码网络、 图注意力网络、 配对网络及预测网络, 所述方法包括:
将文档样本输入至所述第 一编码网络, 得到文档样本 中每个子句的情感子句表示和每
个子句的原因子句表示;
基于第二编码网络, 根据每个所述子句的情感子句表示和原因子句表示, 得到每个所
述子句的第一情感子句预测结果和 第一原因子句预测结果, 并得到每个所述子句的情感输
出和每个所述子句的原因输出, 其中, 所述每个所述子句的情感输出通过子句的第一原因
子句预测结果和情感子句表示得到, 所述每个所述子句的原因输出通过子句的第一情感子
句预测结果和原因子句表示得到;
将每个所述子句的情感输出和 原因输出输入至图注意力网络, 得到每个所述子句更新
后的情感输出和更新后的原因输出, 其中, 所述图注意力网络用于根据每个所述子句的情
感输出和原因输出, 更新每 个所述子句的情感输出和原因输出;
基于所述配对 网络, 根据每个所述子句更新后的情感输出得到每个所述子句的情 感表
示, 及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示, 并将所有所述
子句的情感表示和原因表示两 两配对, 得到情感原因对;
将所有所述情感原因对输入至预测网络, 得到情感原因对预测结果;
根据第一预设算式, 得到所述情感原因对预测结果对应的情感原因对预测损 失值, 并
利用所述情感原因对预测损失值更新所述情感原因对抽取模型, 其中, 所述第一预设算式
包括:
式中,Lpair表示情感原因对预测损失值,
表示通过第 p个子句的情感表示和第 q个
子句的原因表示所 得到的情感原因对; 当
预测正确时 Yp,q取1, 否则取0 。
2.根据权利要求1所述的方法, 其特征在于, 所述图注意力网络包含依次相连的预设数
量层图注意力层, 第一层图注意力层用于更新每个所述子句的情感输出和原因输出, 图注
意力网络的其余每层所述图注意力层均用于更新上一个图注意力层的情感输出和原因输
出。
3.根据权利要求1所述的方法, 其特征在于, 所述基于所述配对网络, 根据每个所述子
句更新后的情感输出得到每个所述子句的情感表 示, 及根据每个所述子句更新后的原因输
出得到每个所述子句的原因表示, 包括:
将每个所述子句更新后的情感输出输入至所述配对 网络的第 二预设算式, 得到情 感表
示, 及将每个所述子句更新后的原因输出输入至所述配对网络的第三预设算式, 得到原因
表示;
所述第二预设算式包括:
式中,
表示第i个子句的情感表示, σ表示relu函数,
表示第i个子句更新后的情感权 利 要 求 书 1/3 页
2
CN 114065769 B
2输出,We表示情感表示对应的可训练权 重,be表示情感表示对应的可训练偏差;
所述第三预设算式包括:
式中,
表示第i个子句的原因表示, σ表示relu函数,
表示第i个子句更新后的原因
输出,Wc表示原因表示对应的可训练权 重,bc表示原因表示对应的可训练偏差 。
4.根据权利要求3所述的方法, 其特征在于, 所述将所有所述子句的情感表示和 原因表
示两两配对, 得到情感原因对, 包括:
基于双仿射机制, 将每个所述子句的情感表示作为中心项, 将每个所述子句的原因表
示作为从属项, 并基于配对网络中的预设算式集, 将所有所述中心项和所有所述从属项两
两配对, 得到对应的情感原因对。
5.根据权利要求1所述的方法, 其特征在于, 所述基于第二编码网络, 根据每个所述子
句的情感子句表示和原因子句表示, 得到每个所述子句的第一情感子句预测结果和第一原
因子句预测结果, 并得到每个所述子句的情感输出和每个所述子句的原因输出之后, 所述
方法还包括:
根据每个所述子句的第 一情感子句预测结果和第 一原因子句预测结果, 得到所述文档
样本对应的子句分类损失值;
所述利用所述情感原因对预测损失值更新所述情感原因对抽取模型, 包括:
利用所述情感原因对预测损失值和所述子句分类损失值更新所述情感原因对抽取模
型。
6.根据权利要求5所述的方法, 其特征在于, 所述基于第二编码网络, 根据每个所述子
句的情感子句表示和原因子句表示, 得到每个所述子句的第一情感子句预测结果和第一原
因子句预测结果, 并得到每个所述子句的情感输出和每个所述子句的原因输出之后, 所述
方法还包括:
基于所述预测网络, 利用每个所述子句的情感输出和每个所述子句的原因输出, 得到
每个所述子句的第二情感子句预测结果和第二原因子句预测结果;
根据每个所述子句的第 二情感子句预测结果和第 二原因子句预测结果, 得到所述文档
样本对应的子句预测损失值;
所述利用所述情感原因对预测损失值和所述子句分类损失值更新所述情感原因对抽
取模型, 包括:
利用所述情 感原因对预测损失值、 所述子句分类损失值及子句预测损失值更新所述情
感原因对抽取模型。
7.一种情感原因对抽取模型的训练装置, 其特征在于, 所述情感原因对抽取模型包括
第一编码网络、 第二编码网络、 图注意力网络、 配对网络及预测网络, 所述装置包括:
第一编码模块, 用于将文档样本输入至所述第一编码网络, 得到文档样本中每个子句
的情感子句表示和每 个子句的原因子句表示;
第二编码模块, 用于基于第二编码网络, 根据每个所述子句的情感子句表示和原因子
句表示, 得到每个所述子句的第一情感子句预测结果和第一原因子句预测结果, 并得到每
个所述子句的情感输出和每个所述子句的原因输出, 其中, 所述每个所述子句的情感输出权 利 要 求 书 2/3 页
3
CN 114065769 B
3
专利 情感原因对抽取模型的训练方法、装置、设备及介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:54上传分享