standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210033794.6 (22)申请日 2022.01.12 (71)申请人 广西大学 地址 530004 广西壮 族自治区南宁市西乡 塘区大学东路10 0号 (72)发明人 黄清宝 刘永康 张学军  (74)专利代理 机构 广西南宁公平知识产权代理 有限公司 45104 专利代理师 蓝文苑 (51)Int.Cl. G06F 40/205(2020.01) G06F 40/247(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于情感预训练模型的故事结尾生成 方法 (57)摘要 本发明的基于情感预训练模型的故事结尾 生成方法, 通过故事线提取模块抽取故事内容的 关键信息, 训练一个用于判别故事中输入每句话 情感和实时判别每个时刻输出的故事结尾情感 的情感判别器, 通过判别故事中输入每一句话的 情感训练出利用前四句故事 隐向量预测结尾期 望情感的情感预测模型, 计算生成过程中通过 实 时判别每个时刻输出的故事结尾情感和期望情 感的差距反向传播获得情感梯度, 根据情感判别 器返回的情感梯度更新 GPT‑2模型的内部历史状 态, 使故事中输入每句话的情感接近期望情感的 情感属性, 控制GPT ‑2模型自动生成与期望情感 一致的故事 结尾。 本发明结合故事线对内容主线 走势的判断以及情感判别器对情感走向的捕捉, 生成内容和情感上一 致的故事结局。 权利要求书2页 说明书6页 附图1页 CN 114462380 A 2022.05.10 CN 114462380 A 1.一种基于情 感预训练模型的故事结尾生成方法, 其特征在于, 包括如下步骤: 通过故 事线提取模块抽取故事内容的关键信息, 训练一个用于判别故事中输入每句话情感和实时 判别每个时刻输出的故事结尾情感的情感判别器, 通过情感判别器判别故事中输入每句话 的情感训练一个利用前四句故事隐向量预测结尾期 望情感的情感预测模型, 计算生成过程 中情感判别器实时判别每个时刻输出的故事结尾情感和情感预测模型的期望情感之间的 差距反向传播获得情感梯度, 根据情感判别器返回的情感梯度更新GPT ‑2模型的内部历史 状态, 使故事中输入每句话的情感接近期 望情感的情感属性, 控制GPT ‑2模型自动生成与期 望情感一 致的故事结尾文本 。 2.根据权利要求1所述的一种基于情感预训练模型的故事结尾生成方法, 其特征在于, 所述情感判别器和情感预测模型的训练步骤如下: S1, 抽取故事中的故事线, 将其 拼接到原始故事的结尾增强数据; S2, 通过交叉熵损失函数训练能自左向右自动回归生成句子的GPT ‑2模型, 通过步骤S1 中故事线的增强数据来 微调GPT‑2模型参数; S3, 冻住步骤S2中的GPT ‑2模型参数, 通过SST ‑5数据集训练一个用于判别故事中输入 每句话情感和实时判别每 个时刻输出的故事结尾情感的情感判别器; S4, 通过步骤S3 中的情感判别器判别故事中输入每句话的情 感的情感向量来训练一个 利用前四句故事的隐向量 来预测我们结尾所期望情感的情感预测模型。 3.根据权利要求2所述的一种基于情感预训练模型的故事结尾生成方法, 其特征在于, 所述步骤S2中训练GPT ‑2模型的交叉熵损失函数, 优化目标为 最大化如下似然: 其中, 表示损失函数, P表示 概率, ui为训练语料中第i个词汇, k 为窗口大小。 4.根据权利要求2所述的一种基于情感预训练模型的故事结尾生成方法, 其特征在于, 所述控制GPT ‑2模型自动生成故事结尾文本的步骤如下: S5.生成过程中, 通过交叉熵损失函数计算步骤S3中训练的情感判别器实时判别每个 时刻输出的故事结尾情感和步骤S4中训练的情感预测模型的期望情感之间的情感差距; S6.通过步骤S5中所计算的情感差距反向传播获得情感梯度, 将情感梯度当作扰动添 加到GPT‑2模型的隐向量中, 用于下一个词的计算; 根据情感判别器返回的梯度, 更新GPT ‑2 模型内部历史状态Ht, 然后根据得到的新的输出概 率分布进行采样并生成新的单词ot+1; S7.通过步骤S6的情感梯度反馈, 将情感预测模型内部的历史状态H更新为 再通过 GPT‑2模型根据新历史来 生成更接 近步骤S4中所计算的期望情感所需求的句子; S8.通过softmax函数生成按位置的前馈层产生目标词条的输出分布, 生成故事结尾文 本, 再通过贝叶斯公式将生成过程重写如下: p(x|a)∝p(a|x)p(x) 其中, a表示情感属性, x表示文本, p(x|a)表示在情感a上生成文本x的概率, p(a|x)表 示情感判别器鉴别文本x属于情感属性a的概率, p(x)表示GPT ‑2模型建模过程中文本的生 成概率。 控制GPT‑2模型生成与期望情感一致的故事结尾文本, 生成过程的解码器输出的结果 为产生文字序列的下 标, 且每个文字在词典中都有唯一的标识, 根据下 标找到对应文字 。权 利 要 求 书 1/2 页 2 CN 114462380 A 25.根据权利要求4所述的一种基于情感预训练模型的故事结尾生成方法, 其特征在于, 所述步骤S5中计算情感判别器实时判别每个时刻输出 的故事结尾情感和情感预测模型 的 期望情感之间情感差距的损失函数如下: 其中, 表示损失函数, Ep表示情感预测模型所预测故事结尾期望情感的情感向量, E5为训练语料中情感判别器实时判别每个时刻输出的故事结尾情感的情感向量, 训练语料 为ROC‑stories公开数据集。 6.根据权利要求4所述的一种基于情感预训练模型的故事结尾生成方法, 其特征在于, 所述步骤6中的内部历史状态Ht主要包括Kt, Vt矩阵, 即: ot+1,Ht+1=GPT(xt,Ht) 其中, ot+1表示t+1时刻的输出, Ht+1表示t+1时刻的状态, Ht表示t时刻的状态, 表示 GPT‑2模型里的Key矩阵, 表示GPT‑2模型里的Value矩阵。 7.根据权利要求4所述的一种基于情感预训练模型的故事结尾生成方法, 其特征在于, 将所述情感判别器鉴别 文本x属于情感属性a的概率p(a|x)重写为p(a|Ht+ΔHt), 然后对Δ Ht进行基于梯度的更新, 具体过程如下 所示: 其中, P表示概率, a代表情感属性, γ代表情感控制强度, 算子表示对情感梯度求导, ΔHt为进行梯度更新后的状态。 8.根据权利要求4所述的一种基于情感预训练模型的故事结尾生成方法, 其特征在于, 所述步骤S8中的故事结尾的生成的softmax函数如下: 其中, P表示概率, u为文本的上下文向量, We为词条的嵌入矩阵, ΔHt为进行梯度更新后 的状态。 9.根据权利要求1所述的一种基于情感预训练模型的故事结尾生成方法, 其特征在于, 所述故事内容的关键信息包括 故事中的关键人物、 关键事件、 事件发生的关键地点, 所述提 取模块采用YAKE算法, 从原 始句子中抽取多个n ‑gram的关键词。权 利 要 求 书 2/2 页 3 CN 114462380 A 3

PDF文档 专利 一种基于情感预训练模型的故事结尾生成方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于情感预训练模型的故事结尾生成方法 第 1 页 专利 一种基于情感预训练模型的故事结尾生成方法 第 2 页 专利 一种基于情感预训练模型的故事结尾生成方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。