专利 情感原因对抽取模型的训练方法、装置、设备及介质

(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210039899.2 (22)申请日 2022.01.14 (65)同一申请的已公布的文献号申请公布号 CN 114065769 A (43)申请公布日 2022.02.18 (73)专利权人四川大学地址 610065 四川省成都市武侯区一环路南一段24号 (72)发明人琚生根　高德辰　周刚　 (74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人王新哲 (51)Int.Cl. G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (56)对比文件 CN 103646088 A,2014.0 3.19 CN 106484767 A,2017.0 3.08 CN 111382565 A,2020.07.07 CA 2604690 A1,20 08.04.06 US 20143 58523 A1,2014.12.04 代建华等. “基于情感膨胀门控CN N的情感- 原因对提取 ”. 《数据分析与知识发现》 .2020,第4 卷(第8期), Kiichi Tago 等.“Influence Analysis of Emotional Behavi ors and User Relationships Based o n Twitter Data ”. 《Tsinghua Science and Tec hnology》 .2018,第 23卷(第1期), 审查员王高云 (54)发明名称情感原因对抽取模型的训练方法、装置、设备及介质 (57)摘要本发明实施例公开了情感原因对抽取模型的训练方法、装置、设备及介质，涉及神经网络模型领域，方法包括：将文档样本输入至第一编码网络以对词和子句编码，得到情感子句表示和原因子句表示；对每个子句的两种子句表示进行预测，得到两种子句预测结果、情感输出及原因输出；将情感输出和原因输出输入至图注意力网络以更新；基于配对网络，根据更新后的两种输出得到对应的情感表示和原因表示，将情感表示和原因表示配对以得到情感原因对；根据预测网络，得到情感原因对预测结果；根据预测结果计算损失值并更新模型。由此，本发明利用图注意力网络对每个子句间的相互关系进行提取，丰富了每个子句的情感输出和原因输出包含的信息，提高了准确率。权利要求书3页说明书12页附图4页 CN 114065769 B 2022.04.08 CN 114065769 B 1.一种情感原因对抽取模型的训练方法，其特征在于，所述情感原因对抽取模型包括第一编码网络、第二编码网络、图注意力网络、配对网络及预测网络，所述方法包括：将文档样本输入至所述第一编码网络，得到文档样本中每个子句的情感子句表示和每个子句的原因子句表示；基于第二编码网络，根据每个所述子句的情感子句表示和原因子句表示，得到每个所述子句的第一情感子句预测结果和第一原因子句预测结果，并得到每个所述子句的情感输出和每个所述子句的原因输出，其中，所述每个所述子句的情感输出通过子句的第一原因子句预测结果和情感子句表示得到，所述每个所述子句的原因输出通过子句的第一情感子句预测结果和原因子句表示得到；将每个所述子句的情感输出和原因输出输入至图注意力网络，得到每个所述子句更新后的情感输出和更新后的原因输出，其中，所述图注意力网络用于根据每个所述子句的情感输出和原因输出，更新每个所述子句的情感输出和原因输出；基于所述配对网络，根据每个所述子句更新后的情感输出得到每个所述子句的情感表示，及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示，并将所有所述子句的情感表示和原因表示两两配对，得到情感原因对；将所有所述情感原因对输入至预测网络，得到情感原因对预测结果；根据第一预设算式，得到所述情感原因对预测结果对应的情感原因对预测损失值，并利用所述情感原因对预测损失值更新所述情感原因对抽取模型，其中，所述第一预设算式包括：式中，Lpair表示情感原因对预测损失值，表示通过第 p个子句的情感表示和第 q个子句的原因表示所得到的情感原因对；当预测正确时 Yp,q取1，否则取0 。 2.根据权利要求1所述的方法，其特征在于，所述图注意力网络包含依次相连的预设数量层图注意力层，第一层图注意力层用于更新每个所述子句的情感输出和原因输出，图注意力网络的其余每层所述图注意力层均用于更新上一个图注意力层的情感输出和原因输出。 3.根据权利要求1所述的方法，其特征在于，所述基于所述配对网络，根据每个所述子句更新后的情感输出得到每个所述子句的情感表示，及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示，包括：将每个所述子句更新后的情感输出输入至所述配对网络的第二预设算式，得到情感表示，及将每个所述子句更新后的原因输出输入至所述配对网络的第三预设算式，得到原因表示；所述第二预设算式包括：式中，表示第i个子句的情感表示， σ表示relu函数，表示第i个子句更新后的情感权　利　要　求　书 1/3 页 2 CN 114065769 B 2输出，We表示情感表示对应的可训练权重，be表示情感表示对应的可训练偏差；所述第三预设算式包括：式中，表示第i个子句的原因表示， σ表示relu函数，表示第i个子句更新后的原因输出，Wc表示原因表示对应的可训练权重，bc表示原因表示对应的可训练偏差。 4.根据权利要求3所述的方法，其特征在于，所述将所有所述子句的情感表示和原因表示两两配对，得到情感原因对，包括：基于双仿射机制，将每个所述子句的情感表示作为中心项，将每个所述子句的原因表示作为从属项，并基于配对网络中的预设算式集，将所有所述中心项和所有所述从属项两两配对，得到对应的情感原因对。 5.根据权利要求1所述的方法，其特征在于，所述基于第二编码网络，根据每个所述子句的情感子句表示和原因子句表示，得到每个所述子句的第一情感子句预测结果和第一原因子句预测结果，并得到每个所述子句的情感输出和每个所述子句的原因输出之后，所述方法还包括：根据每个所述子句的第一情感子句预测结果和第一原因子句预测结果，得到所述文档样本对应的子句分类损失值；所述利用所述情感原因对预测损失值更新所述情感原因对抽取模型，包括：利用所述情感原因对预测损失值和所述子句分类损失值更新所述情感原因对抽取模型。 6.根据权利要求5所述的方法，其特征在于，所述基于第二编码网络，根据每个所述子句的情感子句表示和原因子句表示，得到每个所述子句的第一情感子句预测结果和第一原因子句预测结果，并得到每个所述子句的情感输出和每个所述子句的原因输出之后，所述方法还包括：基于所述预测网络，利用每个所述子句的情感输出和每个所述子句的原因输出，得到每个所述子句的第二情感子句预测结果和第二原因子句预测结果；根据每个所述子句的第二情感子句预测结果和第二原因子句预测结果，得到所述文档样本对应的子句预测损失值；所述利用所述情感原因对预测损失值和所述子句分类损失值更新所述情感原因对抽取模型，包括：利用所述情感原因对预测损失值、所述子句分类损失值及子句预测损失值更新所述情感原因对抽取模型。 7.一种情感原因对抽取模型的训练装置，其特征在于，所述情感原因对抽取模型包括第一编码网络、第二编码网络、图注意力网络、配对网络及预测网络，所述装置包括：第一编码模块，用于将文档样本输入至所述第一编码网络，得到文档样本中每个子句的情感子句表示和每个子句的原因子句表示；第二编码模块，用于基于第二编码网络，根据每个所述子句的情感子句表示和原因子句表示，得到每个所述子句的第一情感子句预测结果和第一原因子句预测结果，并得到每个所述子句的情感输出和每个所述子句的原因输出，其中，所述每个所述子句的情感输出权　利　要　求　书 2/3 页 3 CN 114065769 B 3

专利 情感原因对抽取模型的训练方法、装置、设备及介质

专利情感原因对抽取模型的训练方法、装置、设备及介质