(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210002249.0
(22)申请日 2022.01.04
(71)申请人 北京快确信息科技有限公司
地址 100000 北京市西城区阜成门外大街
31号4层411D
(72)发明人 甘伟超 林远平 喻广博 邹鸿岳
周靖宇
(74)专利代理 机构 广东良马律师事务所 4 4395
代理人 王宁
(51)Int.Cl.
G06F 40/284(2020.01)
G06F 40/126(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于图神经网络的交易信息识别方法、 系统
及介质
(57)摘要
本发明公开了基于图神经网络的交易信息
识别方法、 系统及介质, 通过 获取待识别文本; 对
待识别文本进行特征提取和标签预测, 得到待识
别文本中实体要素的标注结果; 根据实体要素的
标注结果构建相应的实体关系图; 通过图注意力
网络对实体关系图进行特征学习后输出实体节
点特征向量; 对实体节点特征向量进行特征多分
类, 输出每个实体节点的交易要素类别。 通过构
建实体关系图来对实体要素之间的关系进行特
征学习与分类, 识别得到每个实体的交易机构类
别, 能更加准确地结合实体要素的文本特征和关
系特征进行分类判断, 有效提高了现券交易中信
息分类识别的效率和准确性。
权利要求书2页 说明书10页 附图4页
CN 114398881 A
2022.04.26
CN 114398881 A
1.一种基于图神经网络的交易信息识别方法, 其特 征在于, 包括:
获取待识别文本;
对所述待识别文本进行特征提取和标签预测, 得到所述待识别文本 中实体要素的标注
结果;
根据所述实体要素的标注结果构建相应的实体关系图;
通过图注意力网络对所述实体关系图进行 特征学习后输出实体节点特 征向量;
对所述实体节点特 征向量进行 特征多分类, 输出每 个实体节点的交易要素类别。
2.根据权利要求1所述的基于图神经网络的交易信 息识别方法, 其特征在于, 所述对所
述待识别文本进行特征提取和标签预测, 得到所述待识别文本中实体要素 的标注结果, 包
括:
对所述待识别文本分别进行字符编码和词汇编码, 得到 字符向量编码和词向量编码;
对所述字符向量编码进行 特征提取后输出每 个字符的语义特 征向量;
通过图神经网络对所述词向量编码进行图特征提取后输出各个词汇的图关系特征向
量;
将所述语义特 征向量和所述图关系特 征向量进行 特征融合, 输出融合特 征向量;
对所述融合特 征向量中的实体要素进行 标签预测, 得到所述实体要素的标注结果。
3.根据权利要求2所述的基于图神经网络的交易信 息识别方法, 其特征在于, 所述通过
图神经网络对所述词向量编码进行图特 征提取后输出 各个词汇的图关系特 征向量, 包括:
根据所述词向量编码中各个词汇 节点的位置和连接关系构建相应的词汇关系图;
将各个词汇作为对应词汇节点的初始特征向量输入至图神经网络 中, 通过所述图神经
网络对所述词汇关系图进行 特征学习后输出相应词汇的图关系特 征向量。
4.根据权利要求2所述的基于图神经网络的交易信 息识别方法, 其特征在于, 所述将所
述语义特 征向量和所述图关系特 征向量进行 特征融合, 输出融合特 征向量, 包括:
对所述语义特征向量和所述图关系特征向量进行拼接 , 得到拼接向量G ,
其中HLSTM为所述语义特征向量,
为第m个词汇节点的图关
系特征向量;
通过预设的权重矩阵对所述拼接向量进行全连接映射, 并通过多头注意力 机制计算不
同特征之间的注意力关系特征以进行特征融合, 得到特征融合后的融合特征向量R, 其中R
=MultiH eadAttention(Q, K, V), Q=GWq, K=GWk, V=GWv, Q为查询矩阵, K为键矩阵, V为值矩
阵, Wq, Wk, Wv权重矩阵。
5.根据权利要求2 ‑4任意一项所述的基于 图神经网络的交易信息识别方法, 其特征在
于, 所述对所述待识别文本分别进行字符编码和词汇编码, 得到字符向量编码和词向量编
码, 包括:
通过预训练模型对所述待识别文本进行 逐个字符切分, 得到相应的字符向量编码;
通过预设分词方法对所述待识别文本进行词汇分割, 并对各个词汇进行预训练编码后
得到相应的词向量编码。
6.根据权利要求1所述的基于图神经网络的交易信 息识别方法, 其特征在于, 所述根据
所述实体要素的标注结果构建相应的实体关系图, 包括:权 利 要 求 书 1/2 页
2
CN 114398881 A
2对所述待识别文本进行 换行分割, 得到若干行子文本;
根据所述实体要素的标注结果对每一行子文本 中的实体要素进行排序, 得到每个实体
要素的二维位置信息;
根据预设聚类算法和所述二维位置信 息确认每两个实体要素之间的关联关系, 并根据
所述关联关系构建相应的实体关系图。
7.根据权利要求6所述的基于图神经网络的交易信 息识别方法, 其特征在于, 所述根据
预设聚类算法和所述二维位置信息确认每两个实体要 素之间的关联关系, 并根据所述关联
关系构建相应的实体关系图, 包括:
根据所述 二维位置信息计算每两个实体要素之间的空间距离;
通过K临近算法对所述每两个实体要素之间的空间距离进行聚类处理, 得到各个实体
要素之间的关联关系;
根据各个实体要素之间的关联关系构建相应的实体关系图。
8.根据权利要求1所述的基于图神经网络的交易信 息识别方法, 其特征在于, 所述通过
图注意力网络对所述实体图结构进行 特征学习后输出实体节点特 征向量, 具体包括:
通过公式
对所述实体关系图进行特征
学习, 输出所述实体节点特征向量, 其中
为实体节点i第l+1层的输出特征,
表示
实体节点i第l层的输入特征, ||表示拼接操作, σ 表示激活函数, vj∈N(vi)表示所有属于实
体节点vi的近邻域N(vi)内的领域节点;
表示第k个注意力机制下实体节点i和实体节点
j之间的注意力权重;
表示第k个注意力机制下输入特征的线性变换权重矩
阵, 其中,
为F×F的矩阵空间, F为空间维度, K为图注意力网络中注意力机制的数
目。
9.一种基于 图神经网络的交易信息识别系统, 其特征在于, 所述系统包括至少一个处
理器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处
理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑8任一项所述的基于图神经网络
的交易信息识别方法。
10.一种非易失性计算机可读存储介质, 其特征在于, 所述非易失性计算机可读存储介
质存储有计算机可执行指令, 该计算机可执行指令被一个或多个处理器执行时, 可使得所
述一个或多个处理器执行权利要求1 ‑8任一项所述的基于图神经网络的交易信息识别方
法。权 利 要 求 书 2/2 页
3
CN 114398881 A
3
专利 基于图神经网络的交易信息识别方法、系统及介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:02上传分享