(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210153195.8
(22)申请日 2022.02.18
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 陈珺 孙清清 郑行 赖伟达
张天翼 王爱凌 邹泊滔
(74)专利代理 机构 北京博思佳知识产权代理有
限公司 1 1415
专利代理师 陈雨柔
(51)Int.Cl.
G06F 40/295(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
名称匹配方法、 训练方法、 设备及存 储介质
(57)摘要
本说明书一个或多个实施例提供一种名称
匹配方法、 训练方法、 设备及存储介质。 所述方法
包括: 获取待匹配名称的名称字符串; 根据预先
训练好的神经网络将所述待匹配名 称的名称字
符串转换成表征向量; 其中, 所述神经网络用于
将同一名称的不同变体的字符串均转换成同一
表征向量; 确定所述待匹配名称的表征向量分别
与预存的若干参考名 称的表征向量之间的相似
度; 其中, 所述参考名称 的表征向量为将所述参
考名称的任一变体的字符串输入所述神经网络
得到; 根据所述相似度确定所述待匹配名称与所
述参考名称是否匹配。 本实施例有利于提高匹配
效率和匹配准确性。
权利要求书3页 说明书12页 附图4页
CN 114510944 A
2022.05.17
CN 114510944 A
1.一种名称匹配方法, 包括:
获取待匹配名称的名称字符串;
根据预先训练好的神经网络将所述待匹配名称的名称字符串转换成表征向量; 其中,
所述神经网络用于将同一名称的不同变 体的字符串均转换成同一表征向量;
确定所述待匹配名称的表征向量分别与预存的若干参考名称的表征向量之间的相似
度; 其中, 所述参考名称的表征向量为将所述参考名称的任一变体的字符串输入所述神经
网络得到;
根据所述相似度确定所述待匹配名称与所述 参考名称是否匹配。
2.根据权利要求1所述的方法, 所述神经网络用于将同一名称中, 语音和/或语义相似
的不同变 体的字符串均转换成同一表征向量。
3.根据权利要求1所述的方法, 所述根据预先训练好的神经网络将所述待匹配名称 的
名称字符串转换成表征向量, 包括:
将所述待匹配名称的名称字符串 进行分词处 理, 得到所述待匹配名称的字符集 合;
将所述字符集合输入预先训练好的神经网络 中, 通过所述神经网络将所述字符集合转
换成表征向量。
4.根据权利要求1或3所述的方法, 所述神经网络 至少包括嵌入层和编码器;
所述嵌入层用于将所述名称字符串在 分词后得到的字符集合进行转换处理, 获取嵌入
向量;
所述编码器用于将所述嵌入向量从字符 向量空间 映射到数值向量空间, 获取所述表征
向量。
5.根据权利要求 4所述的方法, 所述神经网络还 包括全连接层;
所述全连接层用于将所述编码器输出的表征向量进行降维处 理。
6.根据权利要求1所述的方法, 在训练过程中, 所述神经网络根据 具有多个变体的名称
样本进行对比学习和表征 学习得到;
其中, 所述具有多个变体的名称样本包括语音相似的不同变体的字符串, 和/或, 语义
相似的不同变 体的字符串。
7.根据权利要求6所述的方法, 在训练过程中, 所述神经网络的优化目标包括: 最小化
属于同一名称样本的不同变体的字符串分别对应的表征向量之间的距离, 和/或最大化属
于不同名称 样本的至少两个字符串分别对应的表征向量之间的距离 。
8.根据权利要求7 所述的方法, 还 包括:
在训练过程中, 获取若干三元组样本, 所述三元组样本包括两个正样本和一个负样本,
所述两个正样本包括同一名称样本的不同变体的字符串, 所述负样本包括与所述正样本属
于不同名称 样本的字符串;
将所述三元组样本输入具有三条支路的预设神经网络 中, 由每条支路处理所述三元组
样本中的其中一个样本, 获取三个表征向量; 其中, 所述 三条支路的权 重共享;
根据两个正样本分别对应的表征向量之间的相似程度、 和/或其中一个正样本的表征
向量与所述负样本的表征向量之间的差异程度, 调整所述预设神经网络的参数, 获得所述
训练好的神经网络; 其中, 所述训练好的神经网络包括至少一条 所述支路。
9.根据权利要求7 所述的方法, 还 包括:权 利 要 求 书 1/3 页
2
CN 114510944 A
2在训练过程中, 获取若干二元组样本, 其中一部分所述二元组样本包括两个正样本, 另
一部分所述二元组样本包括一个正样本和一个负样本; 所述两个正样本包括同一名称样本
的不同变 体的字符串, 所述负 样本包括与所述 正样本属于不同名称 样本的字符串;
将所述二元组样本输入具有两条支路的预设神经网络 中, 由每条支路处理所述二元组
样本中的其中一个样本, 获取两个表征向量; 其中, 所述两条支路的权 重共享;
根据两个正样本分别对应的表征向量之间的相似程度、 和/或所述正样本的表征向量
与所述负样本的表征向量之间的差异程度, 调整所述预设神经网络的参数, 获得训练好的
神经网络; 其中, 训练好的神经网络具有至少一条 所述支路。
10.根据权利要求8 或9所述的方法, 在训练过程中, 所述神经网络的损失函数包括三元
损失函数和/或对比损失函数;
所述三元损失函数用于度量两个正样本分别对应的表征向量之间的相似程度、 以及其
中一个正样本的表征向量与所述负 样本的表征向量之间的差异程度;
所述对比损失函数用于度量两个正样本分别对应的表征向量之间的相似程度、 或者所
述正样本的表征向量与所述负 样本的表征向量之间的差异程度。
11.根据权利要求1所述的方法, 所述根据所述相似度确定所述待匹配名称与 所述参考
名称是否匹配, 包括:
若所述相似度大于预设阈值, 确定所述待匹配名称与所述参考名称匹配, 所述待匹配
名称和所述 参考名称指向同一实体, 否则, 确定所述待匹配名称与所述 参考名称不匹配。
12.一种用于名称匹配的神经网络的训练方法, 包括:
获取若干三元组样本, 所述三元组样本包括两个正样本和一个负样本, 所述两个正样
本包括同一名称样本的不同变体的字符串, 所述负样本包括与所述正样本属于不同名称样
本的字符串;
将所述三元组样本输入具有三条支路的预设神经网络 中, 由每条支路处理所述三元组
样本中的其中一个样本, 获取三个表征向量; 其中, 所述 三条支路的权 重共享;
根据两个正样本分别对应的表征向量之间的相似程度、 和/或其中一个正样本的表征
向量与所述负样本的表征向量之间的差异程度, 调整所述预设神经网络的参数, 获得训练
好的神经网络; 其中, 训练好的神经网络包括至少一条所述支路; 所述训练好的神经网络用
于将同一名称的不同变 体的字符串均转换成同一表征向量。
13.一种用于名称匹配的神经网络的训练方法, 包括:
获取若干二元组样本, 其中一部分所述二元组样本包括两个正样本, 另一部分所述二
元组样本包括一个正样本和一个负样本; 所述两个正样本包括同一名称样本的不同变体的
字符串, 所述负 样本包括与所述 正样本属于不同名称 样本的字符串;
将所述二元组样本输入具有两条支路的预设神经网络 中, 由每条支路处理所述二元组
样本中的其中一个样本, 获取两个表征向量; 其中, 所述两条支路的权 重共享;
根据两个正样本分别对应的表征向量之间的相似程度、 和/或所述正样本的表征向量
与所述负样本的表征向量之间的差异程度, 调整所述预设神经网络的参数, 获得训练好的
神经网络; 其中, 训练好的神经网络具有至少一条所述支路; 所述训练好的神经网络用于将
同一名称的不同变 体的字符串均转换成同一表征向量。
14.一种电子设备, 包括:权 利 要 求 书 2/3 页
3
CN 114510944 A
3
专利 名称匹配方法、训练方法、设备及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:31上传分享