standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210033958.5 (22)申请日 2022.01.12 (71)申请人 西安交通大 学 地址 710049 陕西省西安市咸宁西路28号 (72)发明人 徐亦飞 曹帅 朱利 尉萍萍  张屿琪 程菊飞 张美丹  (74)专利代理 机构 西安通大专利代理有限责任 公司 6120 0 代理人 陈翠兰 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/126(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于RoBERTa模型的网络舆情情感分析 方法及系统 (57)摘要 本发明公开了一种基于RoBERTa模 型的网络 舆情情感分析方法及系统, 通过对网络舆情信息 进行分割, 获取文本分割后序列的input   embedding, 并在input  embedding层生成对抗网 络, 有效提升了模型的泛化能力, 再将分割后的 文本信息分别输入到预训练模型中获取文本信 息的词嵌入 特征, 并进一步获取长文本信息的更 高维度特征, 进而对长文本的情感进行分析, 提 高了对特征的抽取能力, 增强了获取网络舆情内 容的上下文信息和语义的能力, 提高了网络舆情 情感分析的准确率, 有助于对社会、 企业对网络 舆情进行管控和分析, 减少因网络舆情处理不当 造成的经济损失。 解决了 现有技术中网络舆情情 感分析的准确率 不理想的问题。 权利要求书3页 说明书8页 附图1页 CN 114372475 A 2022.04.19 CN 114372475 A 1.一种基于RoBERTa模型的网络 舆情情感分析 方法, 其特 征在于, 包括以下步骤: S1: 对文本信息进行分割, 获取文本分割后序列的input  embedding, 并在input   embedding层生成对抗网络; S2: 将分割后的文本信 息分别输入到预训练模型中分别获取分割后文本信息的词嵌入 特征; S3: 基于分割后文本信息的词嵌入特 征提取文本的高维特 征; S4: 根据分割后文本的高维特征, 获取整个长文本的高维特征, 进行长文本的情感分 析。 2.根据权利要求1所述的一种基于RoBERTa模型的网络舆情情感分析方法, 其特征在 于, 所述S1包括以下步骤: S1.1: 根据输入的长文本序列对文本信息进行分割, 根据分割后的信息分别进行3种不 同的词嵌入, 并将3种不同的词嵌入总和构成input  embedding, 作为预训练模型的输入向 量 S1.2: 对获取的每部分文本信息i nput embedding层采用生成对抗网络进行扰动: 其中, x表示inρ ut  embedding; g表示梯度, ||g||2表示梯度g两次归一化的结; L表示损 失函数。 3.根据权利要求2所述的一种基于RoBERTa模型的网络舆情情感分析方法, 其特征在 于, 所述3种不同的词嵌入 包括: 利用句子中的字进行编码生成to ken embeddings, 用来表示字的主 要语义信息; 利用句子的结构信息进行编码生成segmentati on embeddings; 利用句子中每个字的位置信息生成position  embeddings, 为注意力机制增加时序信 息。 4.根据权利要求2所述的一种基于RoBERTa模型的网络舆情情感分析方法, 其特征在 于, 所述S2包括以下步骤: S2.1: 预训练模型采用多层Transformer的encode进行特征提取, 每一层Transformer 的encode中都包含两个sub ‑layer, 一个 是Multi‑Head Attention层, 一个 是Feed Forward 层, 在Multi ‑Head Attention中将文本中的字融入到别的字信息, 并提取不同维度的特征, 即通过查询向量矩阵和键向量矩阵的点乘来确定值向量矩阵的权重 分布, 得到注意力机制 结果: MultiHead(Q, K, V)=Co ncat(Attention(Q, K, V) )W    (4) 其中, Q表示 查询向量矩阵; K为键向量矩阵; V 表示值向量矩阵; dk表示embed ding维度; S2.2: 将注意力机制结果通过残差连接Add和 Layer Normalization再向前传递, 计算 方法见下式:权 利 要 求 书 1/3 页 2 CN 114372475 A 2Xa=XAttention+Xh                          (5) Xb=LayerNorm(Xa)                           (6) 其中, XAttention表示经过自注意力机制以后的结果; Xh表示字向量; Xa表示经过残差链接 后的结果; Xb表示归一 化后的结果。 5.根据权利要求4所述的一种基于RoBERTa模型的网络舆情情感分析方法, 其特征在 于, 所述S3包括以下步骤: S3.1: 将n个预训练模型最后一个隐藏层所有状态位信息输入到GRU神经网络中, 通过 GRU网络分别获取重 置门状态 r和更新门状态u, 计算方法见 下式: r=σ(Wr·(xt, ht‑1))                  (7) u=σ(Wu·(xt, ht‑1))                   (8) 其中, ht‑1表示上一个传输下来的状态; xt表示当前节点的输入; σ 表示sigmoid函数; Wr 和Wu表示权重; S3.2: 在重 置门r中, 通过长时信息进行局部信息的提取: 将h1t‑1与当前输入 xt进行拼接, 最后由tanh获取当前时间步的信息 h1t; 在更新门中将会遗忘一部分隐藏信息, 也会选择记忆一些信息, 生成新的信息ht, 计算 方法见下式: h1t‑1=ht‑1⊙r                                 (9) h1t=tanh(W·(xt, h1t‑1))               (10) ht=(1‑u)⊙ht‑1+u⊙h1t                      (11) 其中, ht‑1表示上一个传输下来的状态; xt表示当前节点的输入; r表示从重置门状态; u 表示从重 置门状态; W表示权 重。 6.根据权利要求5所述的一种基于RoBERTa模型的网络舆情情感分析方法, 其特征在 于, 所述S4包括以下步骤: S4.1: 通过LSTM网络来获取长文本的全局特 征和语义信息, 计算方法见 下式: H(et, yt, ct)=LSTM(et‑1, xt, ct‑1)                (12) 其中, et‑1表示上一个传输下来的状态; xt表示当前节点的输入; ct‑1表示上一个的全局 信息载体; et表示当前状态量; yt表示当前输出; ct表示当前的全局信息载体; S4.2: 使用softmax函数进行回归处 理: 其中, N表示预测类别的个数; b表示模型的输出; yi表示类别i的概 率; S4.3: 使用交叉熵作为损失函数: 其中, N表示预测类别的个数; p(xi)表示预测概 率。 7.根据权利要求1所述的一种基于RoBERTa模型的网络舆情情感分析系统, 其特征在 于, 包括文本信息进行分割模块、 词嵌入特 征模块、 高维特 征模块和长文本高维特 征模块; 文本信息进行分割模块, 用于对文本信息进行分割, 获取文本分割后序列的input  权 利 要 求 书 2/3 页 3 CN 114372475 A 3

PDF文档 专利 一种基于RoBERTa模型的网络舆情情感分析方法及系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于RoBERTa模型的网络舆情情感分析方法及系统 第 1 页 专利 一种基于RoBERTa模型的网络舆情情感分析方法及系统 第 2 页 专利 一种基于RoBERTa模型的网络舆情情感分析方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。