(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211017366.0 (22)申请日 2022.08.23 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区黄桷垭崇文路2 号 (72)发明人 甘玲 陈祚杰  (74)专利代理 机构 北京同恒源知识产权代理有 限公司 1 1275 专利代理师 廖曦 (51)Int.Cl. G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于融合标签图的双 图卷积网络的文 本情感多分类方法 (57)摘要 本发明涉及一种基于融合标签图的双图卷 积网络的文本情感多分类方法, 属于计算机技术 领域。 该方法包括以下步骤: S1: 句子编码层; S2: 标签图嵌入; S3: 句法图卷积网络SynGCN; S4: 语 义图卷积网络SemGCN; S5: 双仿射变换。 本发明针 对现有的研究大都只考虑了句子的语义表示, 忽 略句子的语法信息, 发明了一种双图卷积网络, 即句法图卷积网络和语义图卷积网络, 该方法能 同时提取句子的句法信息和语义信息。 以往的模 型忽略了标签的语义信息, 基于此本发明了标签 图嵌入, 通过将标签图表示和语义图卷积网络融 合, 使得模 型能够学习更加精确的语义表示和捕 获标签和文本中单词之间的潜在关系。 权利要求书3页 说明书6页 附图2页 CN 115391529 A 2022.11.25 CN 115391529 A 1.一种基于融合标签图的双图卷积网络的文本情感多分类方法, 其特征在于: 该方法 包括以下步骤: S1: 建立句子编码层; S2: 嵌入标签图; S3: 建立句法图卷积网络SynGCN; S4: 建立语义图卷积网络Sem GCN; S5: 进行双仿射变换。 2.根据权利要求1所述的一种基于融合标签图的双图卷积网络的文本情感多分类方 法, 其特征在于: 所述S1具体为: 为获得每个句子的文本表示, 模型采用BERT和BiLSTM作 为句子编码器来提取隐藏的上 下文表示; 采用预训练模 型BERT来生 成词向量, 依据单词所在的语境生成动态词向量; 然后 将BERT得到的词向量输入到BiLSTM计算获得包含上下文信息的表隐藏状态向量表示H= [h1,h2,...,hn]将得到的隐藏状态向量用于后续模块的输入; 其中hi表示一个句子中第i个 单词的词向量表示, n表示输入句子的单词个数。 3.根据权利要求2所述的一种基于融合标签图的双图卷积网络的文本情感多分类方 法, 其特征在于: 所述S2具体为: 将标签图定义为G={V,e}; 其中V表示图中的结点, 即标签的表示[c1,c2,...,cm], ci则 表示第i个标签的向量表示, m表示标签的个数, e表示图中的边, 即标签之间的语义关系; 为获得每个标签的表示, 使用标签的文本内容作为输入, 使用词向量平均函数来计算 标签的词向量表示, 计算如公式(1)所示; ci表示第i个情感标签的向量表示, ki表示第i个标签的样本数量Hj表示属于第i个标签 样本中的第 j个句子的 隐藏状态向量表示; 为得到标签之 间的关系, 使用标签之 间的相关性 系数作为 标签图的邻接矩阵Alabel; 使用两向量之间的余弦相似度计算不同标签之间的相似 性, 即 ci、 cj表示两个不同的标签的向量表示, ||  ||表示向量的模运算; 接 着使用GCN更新标签的表示, 公式如下: 其中l表示图卷积网络的层数, 表示图卷及网络第l层的第i个标签的表示, 表示图 卷积网络第l ‑1层第j个标签的表 示, W和b为学习的权重和偏 差, σ 为激活函数, m为标签的数 量; 为有效使用标签语义信息, 通过标签注意力计算句子中单词与标签相关的语义成分; 计算公式如下:权 利 要 求 书 1/3 页 2 CN 115391529 A 2Hlabel=HUT      (5) hj表示句子中第j个单词的向量表示; ci表示公式(2)中经过GCN更新后的标签表示, T表 示向量的转置, αij表示句子中第j个单词特征向量对于第i个标签的信息量; U=[u1, u2,...,um], 其中ui表示第i个标签ci在句子中的语义信息携带量; H表示通过BiLSTM得到的 上下文隐藏表示; Hlabel表示每个句子中每 个单词的特定的标签表示。 4.根据权利要求3所述的一种基于融合标签图的双图卷积网络的文本情感多分类方 法, 其特征在于: 所述S3具体为: SynGCN模块以句子的句 法编码作为输入; 为对句 法信息进行编码, 使用句 法解析方法 PerturbedMasking; 给定一个输入文本X=[x1,x2,...,xn], xi表示句子中的第i个单词, 将 文本中的每个单词xi映射为一个上下文化表示Hθ(x)i; 首先, 使用[MASK]来替换单词xi, 并 将替换后的句子x\{xi}输入至BERT, 得到单词xi的向量表示Hθ(x\{xi})i; 其次, 计算xj∈x\ {xi}对Hθ(x\{xi})i的影响, 将xj替换为[MASK]来获得第二个句子x\{xi,xj}, 得到的xj新向量 表示Hθ(x\{xi,xj})i; 基于两个向量的表示, 定义 函数f(xi,xj); f(xi,xj)=d(Hθ(x\{xi})i,Hθ(x\{xi,xj})i)      (6) 其中d(x,y)是衡量两个向量距离的函数, 使用欧氏距离表示; 通过对句子中的单词xi, xj重复执行上述步骤, 得到一个影响矩阵Asyn; 将BiLSTM的隐状态向量H作为语法图中的初 始节点表示; 然后得到句法图表示 表示句子中第i个单词的句 法表示, 句法图中的节点计算如公式(7)所示; 其中l表示图卷积网络的层数, 表示图卷及网络第l层的第 i个单词的表示, W和b为学 习的权重和偏差, σ 为激活函数。 5.根据权利要求4所述的一种基于融合标签图的双图卷积网络的文本情感多分类方 法, 其特征在于: 所述S4具体为: 在SemGCN模块中, 使用自注意力机制计算每对元素的注意力分数, 将得到的注意力得 分矩阵Asem作为SemGCN模块的邻接矩阵, 具体的计算公式如下: soft max为归一化指数函数, Q、 K为注意力机制得到的特征向量, WQ、 WK为权重矩阵, T表 示向量转置, d表示特 征向量的维度;权 利 要 求 书 2/3 页 3 CN 115391529 A 3

.PDF文档 专利 一种基于融合标签图的双图卷积网络的文本情感多分类方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于融合标签图的双图卷积网络的文本情感多分类方法 第 1 页 专利 一种基于融合标签图的双图卷积网络的文本情感多分类方法 第 2 页 专利 一种基于融合标签图的双图卷积网络的文本情感多分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:11:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。