(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210750396.6
(22)申请日 2022.06.29
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 李瑞达 方硕 马晨光
(74)专利代理 机构 北京恒博知识产权代理有限
公司 11528
专利代理师 侯世俭
(51)Int.Cl.
G06V 10/74(2022.01)
G06V 10/774(2022.01)
G06V 40/12(2022.01)
G06V 40/16(2022.01)
G06V 40/18(2022.01)G06V 10/82(2022.01)
G06N 3/08(2006.01)
G10L 17/04(2013.01)
G10L 17/18(2013.01)
(54)发明名称
开集识别方法、 装置、 电子设备、 介质及程序
产品
(57)摘要
本说明书实施例公开了一种开集识别方法、
装置、 电子设备、 介质及程序产品。 其中, 该方法
包括: 获取待识别数据; 将待识别数据输入开集
识别模型中, 基于指定目标的基准数据输出待识
别数据对应的分数, 分数用于表征待识别数据与
基准数据之间的相似度; 开集识别模 型对应的损
失函数用于使开集识别模型的神经网络输出的
目标得分集合中多个目标得分的最小值大于神
经网络输出的非目标得分集合中多个非目标得
分的最大值, 目标得分用于表征目标相同的数据
之间的相似度, 非目标得分用于表征目标不同的
数据之间的相似度; 在待识别数据对应的分数大
于预设阈值的情况下, 确定待识别数据对应的目
标为指定目标。
权利要求书2页 说明书17页 附图5页
CN 115222970 A
2022.10.21
CN 115222970 A
1.一种开 集识别方法, 所述方法包括:
获取待识别数据;
将所述待识别数据输入开集识别模型中, 基于指定目标的基准数据输出所述待识别数
据对应的分数; 所述分数用于表征所述待识别数据与所述基准数据之间的相似度; 所述开
集识别模型对应的损失函数用于使所述开集识别模型的神经网络输出的目标得分集合中
多个目标得分的最小值大于所述神经网络输出的非目标得分集合中多个非目标得分的最
大值; 所述 目标得分用于表征目标相同的数据之间的相似度; 所述非目标得分用于表征目
标不同的数据之间的相似度;
在所述待识别数据对应的分数大于预设阈值的情况下, 确定所述待识别数据对应的目
标为所述指定目标。
2.如权利要求1所述的方法, 所述将所述待识别数据输入开集识别模型中, 基于指定目
标的基准数据输出 所述待识别数据对应的分数之后, 所述方法还 包括:
在所述待识别数据对应的分数小于或等于预设阈值的情况下, 确定所述待识别数据对
应的目标不 为所述指定目标。
3.如权利要求1所述的方法, 所述将所述待识别数据输入开集识别模型中, 基于指定目
标的基准数据输出 所述待识别数据对应的分数之前, 所述方法还 包括:
获取样本训练集; 所述样本训练集包括已知目标的N个样本训练数据; 所述样本训练集
对应的目标 组成的目标集合为闭集; 所述目标集合包括M个不同的目标; 所述N和M均为大于
1的整数;
基于所述样本训练集对原 始的开集识别模型进行训练, 得到训练后的开 集识别模型;
所述将所述待识别数据输入开集识别模型中, 基于指定目标的基准数据输出所述待识
别数据对应的分数, 包括:
将所述待识别数据输入所述训练后的开集识别模型中, 基于指定目标的基准数据输出
所述待识别数据对应的分数。
4.如权利要求3所述的方法, 所述基于所述样本训练集对原始的开集识别模型进行训
练, 得到训练后的开 集识别模型, 包括:
将所述样本训练集输入原始的开集识别模型中, 所述原始的开集识别模型的神经网络
输出所述N个样本训练数据各自对应的目标 得分和非目标 得分;
按照所述损失函数基于所述N个样本训练数据各自对应的目标得分和非 目标得分确定
所述原始的开集识别模型的目标损失;
在所述目标损失不满足预设条件的情况下, 基于所述目标损失更新所述原始的开集识
别模型的神经网络, 直至所述目标损失满足所述预设条件, 得到训练后的开 集识别模型。
5.如权利要求1 ‑4任一项所述的方法, 所述损失函数为:
其中, loss为所述损失函数; N表示所述开集识别模型对应的样本训练数据的数量; i表
示所述样本训练集中的第i个样本训练数据; M表示所述样本训练集对应的不同的目标 组成权 利 要 求 书 1/2 页
2
CN 115222970 A
2的目标集合; yj表示所述样本训练集中第j个样本训练数据对应的目标;
表示所述第j个
样本训练数据, 和所述样本训练集中与所述目标yj不同的目标k对应 的样本训练数据之间
的相似度;
表示所述第i个样本训练数据, 和所述样本训练集中与所述第i个样本训练数
据的目标相同的样本训练数据之间的相似度; α 为常数; m为所述 开集识别模型的参数。
6.如权利要求5所述的方法, 所述损失函数对应的决策边界为:
其中, i和j可以为任意 值, k≠yj。
7.如权利要求5所述的方法, 所述损失函数对应的收敛空间为:
min(sp)≥max(sn)+m; 其中, sp表示所述开集识别模型的神经网络输出的目标得分集
合; min(sp)表示所述目标得分集合中多个目标得分的最小值; sn表示所述开集识别模型的
神经网络输出的非目标得分集合; max(sn)表示所述非目标得分集合中多个非目标得分的
最大值。
8.如权利要求1所述的方法, 所述目标待识别数据包括待识别语音数据, 所述开集识别
模型包括声纹识别模型;
和/或
所述目标待识别数据包括待识别指纹数据, 所述 开集识别模型包括指纹识别模型;
和/或
所述目标待识别数据包括待识别脸部图像, 所述 开集识别模型包括 脸部识别;
和/或
所述目标待识别数据包括待识别虹膜图像, 所述 开集识别模型包括虹膜 识别模型。
9.一种开 集识别装置, 所述装置包括:
第一获取模块, 用于获取待识别数据;
开集识别模块, 用于将所述待识别数据输入开集识别模型中, 基于指定目标的基准数
据输出所述待识别数据对应的分数; 所述分数用于表征所述待识别数据与所述基准数据之
间的相似度; 所述开集识别模型对应的损失函数用于使所述开集识别模型的神经网络输出
的目标得分集合中多个目标得分的最小值大于所述神经网络输出的非目标得分集合中多
个非目标得分的最大值; 所述 目标得分用于表征目标相同的数据之间的相似度; 所述非目
标得分用于表征目标不同的数据之间的相似度;
第一确定模块, 用于在所述待识别数据对应的分数大于预设阈值的情况下, 确定所述
待识别数据对应的目标为所述指定目标。
10.一种电子设备, 包括: 处 理器和存 储器;
所述处理器与所述存 储器相连;
所述存储器, 用于存 储可执行程序代码;
所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序
代码对应的程序, 以用于执 行如权利要求1 ‑8任一项所述的方法。
11.一种计算机存储介质, 所述计算机存储介质存储有多条指令, 所述指令适于由处理
器加载并执 行如权利要求1 ‑8任一项的方法步骤。
12.一种包含指令的计算机程序产品, 当所述计算机程序产品在计算机或处理器上运
行时, 使得 所述计算机或所述处 理器执行如权利要求1 ‑8任一项所述的开 集识别方法。权 利 要 求 书 2/2 页
3
CN 115222970 A
3
专利 开集识别方法、装置、电子设备、介质及程序产品
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:21上传分享