文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211013667.6 (22)申请日 2022.08.23 (71)申请人 哈尔滨工业大 学 地址 150001 黑龙江省哈尔滨市南岗区西 大直街92号 (72)发明人 车万翔 雷志林 赵妍妍 刘挺 (74)专利代理 机构 哈尔滨华夏松花江知识产权 代理有限公司 23213 专利代理师 岳昕 (51)Int.Cl. G06F 16/901(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06F 9/448(2018.01) (54)发明名称 一种图到图结构的自动标注转换方法 (57)摘要 一种图到图结构的自动标注 转换方法, 涉及 自然语言处理技术领域, 针对现有技术中通过人 工进行标注 规范转换准确率低的问题, 本申请通 过简单有效的线性变换将源解析器中的核心参 数适配到目标解析器中, 并继承源解析器中的所 有其他参数。 图到图线性变换方法能充分继承源 标准规范的信息并将其迁移 到目标规范, 因此本 申请能有效避免人工规则和大量平行语料的限 制, 大幅提升图结构转换的准确率以及获得高质 量的图结构标注数据。 在少量平行语料帮助下, 本申请的方法可以取得比现有的各种基线模型 更好的效果。 权利要求书2页 说明书5页 附图2页 CN 115391608 A 2022.11.25 CN 115391608 A 1.一种图到图结构的自动标注转换 方法, 其特 征在于包括以下步骤: 步骤一: 获取源规范文本, 然后使用预训练语言模型对源规范文本进行编码, 得到向量 表示; 步骤二: 根据编码后的向量表示, 并利用双仿射分析器得到源规范解析器; 步骤三: 将线性函数作用于源规范解析器的注意力矩阵上, 同时冻结注意力矩阵的参 数, 得到目标规范解析器; 步骤四: 对源规范文本进行标注, 得到目标规范的标注文本, 之后利用目标规范的标注 文本和源规范文本对目标规范解析器进行优化, 得到优化后的目标规范解析器; 步骤五: 利用优化后的目标规范解析器对待标注文本进行预测, 得到目标规范的标注 信息。 2.根据权利要求1所述的一种图到图结构的自动标注转换方法, 其特征在于所述步骤 二的具体步骤为: 步骤二一: 将编码后的向量表示 通过多层的双向LSTM结构进行编码, 得到编码表示hi; 步骤二二: 将编码表示hi分别送入 4个单层的前向神经网络层中, 得到第i个词语作为头 结点或者依附节点的弧表示和标签表示; 步骤二三: 通过双仿射分类 器预测弧表示的分数和标签表示的分数; 步骤二四: 对于弧表示的分数, 若弧表示的分数不小于预先设定的阈值, 则头结点和 依 附节点之间存在弧, 并执 行步骤二五; 步骤二五: 对于标签表示的分数, 取最大的分数对应的标签类别, 将该标签类别标记在 对应的头结点和依附节点的弧上, 得到源规范解析器。 3.根据权利要求2所述的一种图到图结构的自动标注转换方法, 其特征在于所述头结 点的弧表示 为: 依附节点的弧表示 为: 头结点的标签表示 为: 依附节点的标签表示 为: 其中, FFNarc‑head表示作用于头节点的前馈神经网络得到的头节点的弧表示, FFNarc‑dep 表示作用于依附节点的前馈神经网络得到的依附节点的弧表示, FFNrel‑head表示作用于头节 点的前馈神经网络得到的头结点的标签表示, FFNrel‑dep表示作用于依附节点的前馈神经网 络得到的依附节点的标签表示。 4.根据权利要求3所述的一种图到图结构的自动标注转换方法, 其特征在于所述双仿 射分类器表示为: 权 利 要 求 书 1/2 页 2 CN 115391608 A 2其中, Biaf(xi,xj)表示双仿射分析器的函数表示, xi和xj表示输入的两个节点表示, U表 示双仿射注意力矩阵的二阶参数, W表示双仿射注意力矩阵的一阶参数, b表示双仿射注意 力矩阵的零阶参数。 5.根据权利要求4所述的一种图到图结构的自动标注转换方法, 其特征在于所述弧表 示的分数表示 为: 其中, Biafarc()表示预测弧的双仿射分析器, 和 分别表示输入参数为 节点i和节点j的弧表示, 节点j作为头节点, 节点i作为依附节点, 表示存在一条由节点j 指向节点 i的依存弧的得分。 6.根据权利要求5所述的一种图到图结构的自动标注转换方法, 其特征在于所述标签 表示的分数表示 为: 其中, Biafrel()表示预测依存弧标签的双仿射分析器, 输入参数为节点i和节点j的标 签表示, 分别为 节点j作为头节点, 节点i作为依附节点, 表示在一条 由节点j指向节点 i的依存弧上 各个标签的得分。 7.根据权利要求6所述的一种图到图结构的自动标注转换方法, 其特征在于所述目标 规范解析器表示 为: Ut=VuUs Wt=VwWs 其中, Us、 Ws和bs分别为源分析器中的相应参数, Vu和Vw为线性变换函数, Vu作用于Us, Vw 作用于Ws, Biaft(xi,xj)为目标规范的双仿射解析器, Ut、 Wt分别为目标规范双仿射解析器中 的二阶注意力矩阵参数和一阶注意力矩阵参数。权 利 要 求 书 2/2 页 3 CN 115391608 A 3
专利 一种图到图结构的自动标注转换方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 02:10:37
上传分享
举报
下载
原文档
(733.2 KB)
分享
友情链接
CSA 零信任安全理念.pdf
JR-T0223-2021 金融数据安全 数据生命周期安全规范.pdf
GB-T 12183-2018 空中交通管制机载应答机通用规范.pdf
GB-T 35276-2017 信息安全技术 SM2密码算法使用规范.pdf
T-CQTX 0001—2023 蒸汽锅炉水容积测试技术规范.pdf
GB-T 29072-2012 航天器研制技术流程编写规则.pdf
信通院 数据中心智能化运维发展研究报告 2023年.pdf
GB-T 36959-2018 信息安全技术 网络安全等级保护测评机构能力要求和评估规范.pdf
GB-T 36630.3-2018 信息安全技术 信息技术产品安全可控评价指标 第3部分:操作系统.pdf
互联网信息服务管理办法(修订草案征求意见稿).pdf
DB43-T 612-2021 医疗机构能耗定额 湖南省.pdf
GB-T 42392-2023 洁净手术部通用技术要求.pdf
GB-T 40682-2021 工业自动化和控制系统安全 IACS服务提供商的安全程序要求 IEC 62443-2-4-2015.pdf
GB-T 43766-2024 智能网联汽车运行安全测试技术要求.pdf
DB13-T 5387-2021 水库库容曲线修测及特征值复核 修正技术导则 河北省.pdf
纯电动乘用车控制芯片功能安全要求及测试方法.pdf
GB-T 30290.3-2013 卫星定位车辆信息服务系统 第3部分:信息安全规范.pdf
T-CPPC 1055—2022 全地形车 休闲项目技术规范.pdf
GB-T 28458-2020 信息安全技术 网络安全漏洞标识与描述规范.pdf
法律法规 重庆市科技创新促进条例2021-11-25.pdf
1
/
3
10
评价文档
赞助2元 点击下载(733.2 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。