(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211013667.6 (22)申请日 2022.08.23 (71)申请人 哈尔滨工业大 学 地址 150001 黑龙江省哈尔滨市南岗区西 大直街92号 (72)发明人 车万翔 雷志林 赵妍妍 刘挺  (74)专利代理 机构 哈尔滨华夏松花江知识产权 代理有限公司 23213 专利代理师 岳昕 (51)Int.Cl. G06F 16/901(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06F 9/448(2018.01) (54)发明名称 一种图到图结构的自动标注转换方法 (57)摘要 一种图到图结构的自动标注 转换方法, 涉及 自然语言处理技术领域, 针对现有技术中通过人 工进行标注 规范转换准确率低的问题, 本申请通 过简单有效的线性变换将源解析器中的核心参 数适配到目标解析器中, 并继承源解析器中的所 有其他参数。 图到图线性变换方法能充分继承源 标准规范的信息并将其迁移 到目标规范, 因此本 申请能有效避免人工规则和大量平行语料的限 制, 大幅提升图结构转换的准确率以及获得高质 量的图结构标注数据。 在少量平行语料帮助下, 本申请的方法可以取得比现有的各种基线模型 更好的效果。 权利要求书2页 说明书5页 附图2页 CN 115391608 A 2022.11.25 CN 115391608 A 1.一种图到图结构的自动标注转换 方法, 其特 征在于包括以下步骤: 步骤一: 获取源规范文本, 然后使用预训练语言模型对源规范文本进行编码, 得到向量 表示; 步骤二: 根据编码后的向量表示, 并利用双仿射分析器得到源规范解析器; 步骤三: 将线性函数作用于源规范解析器的注意力矩阵上, 同时冻结注意力矩阵的参 数, 得到目标规范解析器; 步骤四: 对源规范文本进行标注, 得到目标规范的标注文本, 之后利用目标规范的标注 文本和源规范文本对目标规范解析器进行优化, 得到优化后的目标规范解析器; 步骤五: 利用优化后的目标规范解析器对待标注文本进行预测, 得到目标规范的标注 信息。 2.根据权利要求1所述的一种图到图结构的自动标注转换方法, 其特征在于所述步骤 二的具体步骤为: 步骤二一: 将编码后的向量表示 通过多层的双向LSTM结构进行编码, 得到编码表示hi; 步骤二二: 将编码表示hi分别送入 4个单层的前向神经网络层中, 得到第i个词语作为头 结点或者依附节点的弧表示和标签表示; 步骤二三: 通过双仿射分类 器预测弧表示的分数和标签表示的分数; 步骤二四: 对于弧表示的分数, 若弧表示的分数不小于预先设定的阈值, 则头结点和 依 附节点之间存在弧, 并执 行步骤二五; 步骤二五: 对于标签表示的分数, 取最大的分数对应的标签类别, 将该标签类别标记在 对应的头结点和依附节点的弧上, 得到源规范解析器。 3.根据权利要求2所述的一种图到图结构的自动标注转换方法, 其特征在于所述头结 点的弧表示 为: 依附节点的弧表示 为: 头结点的标签表示 为: 依附节点的标签表示 为: 其中, FFNarc‑head表示作用于头节点的前馈神经网络得到的头节点的弧表示, FFNarc‑dep 表示作用于依附节点的前馈神经网络得到的依附节点的弧表示, FFNrel‑head表示作用于头节 点的前馈神经网络得到的头结点的标签表示, FFNrel‑dep表示作用于依附节点的前馈神经网 络得到的依附节点的标签表示。 4.根据权利要求3所述的一种图到图结构的自动标注转换方法, 其特征在于所述双仿 射分类器表示为: 权 利 要 求 书 1/2 页 2 CN 115391608 A 2其中, Biaf(xi,xj)表示双仿射分析器的函数表示, xi和xj表示输入的两个节点表示, U表 示双仿射注意力矩阵的二阶参数, W表示双仿射注意力矩阵的一阶参数, b表示双仿射注意 力矩阵的零阶参数。 5.根据权利要求4所述的一种图到图结构的自动标注转换方法, 其特征在于所述弧表 示的分数表示 为: 其中, Biafarc()表示预测弧的双仿射分析器, 和 分别表示输入参数为 节点i和节点j的弧表示, 节点j作为头节点, 节点i作为依附节点, 表示存在一条由节点j 指向节点 i的依存弧的得分。 6.根据权利要求5所述的一种图到图结构的自动标注转换方法, 其特征在于所述标签 表示的分数表示 为: 其中, Biafrel()表示预测依存弧标签的双仿射分析器, 输入参数为节点i和节点j的标 签表示, 分别为 节点j作为头节点, 节点i作为依附节点, 表示在一条 由节点j指向节点 i的依存弧上 各个标签的得分。 7.根据权利要求6所述的一种图到图结构的自动标注转换方法, 其特征在于所述目标 规范解析器表示 为: Ut=VuUs Wt=VwWs 其中, Us、 Ws和bs分别为源分析器中的相应参数, Vu和Vw为线性变换函数, Vu作用于Us, Vw 作用于Ws, Biaft(xi,xj)为目标规范的双仿射解析器, Ut、 Wt分别为目标规范双仿射解析器中 的二阶注意力矩阵参数和一阶注意力矩阵参数。权 利 要 求 书 2/2 页 3 CN 115391608 A 3

.PDF文档 专利 一种图到图结构的自动标注转换方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种图到图结构的自动标注转换方法 第 1 页 专利 一种图到图结构的自动标注转换方法 第 2 页 专利 一种图到图结构的自动标注转换方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:10:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。