专利 开集识别方法、装置、电子设备、介质及程序产品

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210750396.6 (22)申请日 2022.06.29 (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人李瑞达　方硕　马晨光　 (74)专利代理机构北京恒博知识产权代理有限公司 11528 专利代理师侯世俭 (51)Int.Cl. G06V 10/74(2022.01) G06V 10/774(2022.01) G06V 40/12(2022.01) G06V 40/16(2022.01) G06V 40/18(2022.01)G06V 10/82(2022.01) G06N 3/08(2006.01) G10L 17/04(2013.01) G10L 17/18(2013.01) (54)发明名称开集识别方法、装置、电子设备、介质及程序产品 (57)摘要本说明书实施例公开了一种开集识别方法、装置、电子设备、介质及程序产品。其中，该方法包括：获取待识别数据；将待识别数据输入开集识别模型中，基于指定目标的基准数据输出待识别数据对应的分数，分数用于表征待识别数据与基准数据之间的相似度；开集识别模型对应的损失函数用于使开集识别模型的神经网络输出的目标得分集合中多个目标得分的最小值大于神经网络输出的非目标得分集合中多个非目标得分的最大值，目标得分用于表征目标相同的数据之间的相似度，非目标得分用于表征目标不同的数据之间的相似度；在待识别数据对应的分数大于预设阈值的情况下，确定待识别数据对应的目标为指定目标。权利要求书2页说明书17页附图5页 CN 115222970 A 2022.10.21 CN 115222970 A 1.一种开集识别方法，所述方法包括：获取待识别数据；将所述待识别数据输入开集识别模型中，基于指定目标的基准数据输出所述待识别数据对应的分数；所述分数用于表征所述待识别数据与所述基准数据之间的相似度；所述开集识别模型对应的损失函数用于使所述开集识别模型的神经网络输出的目标得分集合中多个目标得分的最小值大于所述神经网络输出的非目标得分集合中多个非目标得分的最大值；所述目标得分用于表征目标相同的数据之间的相似度；所述非目标得分用于表征目标不同的数据之间的相似度；在所述待识别数据对应的分数大于预设阈值的情况下，确定所述待识别数据对应的目标为所述指定目标。 2.如权利要求1所述的方法，所述将所述待识别数据输入开集识别模型中，基于指定目标的基准数据输出所述待识别数据对应的分数之后，所述方法还包括：在所述待识别数据对应的分数小于或等于预设阈值的情况下，确定所述待识别数据对应的目标不为所述指定目标。 3.如权利要求1所述的方法，所述将所述待识别数据输入开集识别模型中，基于指定目标的基准数据输出所述待识别数据对应的分数之前，所述方法还包括：获取样本训练集；所述样本训练集包括已知目标的N个样本训练数据；所述样本训练集对应的目标组成的目标集合为闭集；所述目标集合包括M个不同的目标；所述N和M均为大于 1的整数；基于所述样本训练集对原始的开集识别模型进行训练，得到训练后的开集识别模型；所述将所述待识别数据输入开集识别模型中，基于指定目标的基准数据输出所述待识别数据对应的分数，包括：将所述待识别数据输入所述训练后的开集识别模型中，基于指定目标的基准数据输出所述待识别数据对应的分数。 4.如权利要求3所述的方法，所述基于所述样本训练集对原始的开集识别模型进行训练，得到训练后的开集识别模型，包括：将所述样本训练集输入原始的开集识别模型中，所述原始的开集识别模型的神经网络输出所述N个样本训练数据各自对应的目标得分和非目标得分；按照所述损失函数基于所述N个样本训练数据各自对应的目标得分和非目标得分确定所述原始的开集识别模型的目标损失；在所述目标损失不满足预设条件的情况下，基于所述目标损失更新所述原始的开集识别模型的神经网络，直至所述目标损失满足所述预设条件，得到训练后的开集识别模型。 5.如权利要求1 ‑4任一项所述的方法，所述损失函数为：其中， loss为所述损失函数； N表示所述开集识别模型对应的样本训练数据的数量； i表示所述样本训练集中的第i个样本训练数据； M表示所述样本训练集对应的不同的目标组成权　利　要　求　书 1/2 页 2 CN 115222970 A 2的目标集合； yj表示所述样本训练集中第j个样本训练数据对应的目标；表示所述第j个样本训练数据，和所述样本训练集中与所述目标yj不同的目标k对应的样本训练数据之间的相似度；表示所述第i个样本训练数据，和所述样本训练集中与所述第i个样本训练数据的目标相同的样本训练数据之间的相似度； α 为常数； m为所述开集识别模型的参数。 6.如权利要求5所述的方法，所述损失函数对应的决策边界为：其中， i和j可以为任意值， k≠yj。 7.如权利要求5所述的方法，所述损失函数对应的收敛空间为： min(sp)≥max(sn)+m；其中， sp表示所述开集识别模型的神经网络输出的目标得分集合； min(sp)表示所述目标得分集合中多个目标得分的最小值； sn表示所述开集识别模型的神经网络输出的非目标得分集合； max(sn)表示所述非目标得分集合中多个非目标得分的最大值。 8.如权利要求1所述的方法，所述目标待识别数据包括待识别语音数据，所述开集识别模型包括声纹识别模型；和/或所述目标待识别数据包括待识别指纹数据，所述开集识别模型包括指纹识别模型；和/或所述目标待识别数据包括待识别脸部图像，所述开集识别模型包括脸部识别；和/或所述目标待识别数据包括待识别虹膜图像，所述开集识别模型包括虹膜识别模型。 9.一种开集识别装置，所述装置包括：第一获取模块，用于获取待识别数据；开集识别模块，用于将所述待识别数据输入开集识别模型中，基于指定目标的基准数据输出所述待识别数据对应的分数；所述分数用于表征所述待识别数据与所述基准数据之间的相似度；所述开集识别模型对应的损失函数用于使所述开集识别模型的神经网络输出的目标得分集合中多个目标得分的最小值大于所述神经网络输出的非目标得分集合中多个非目标得分的最大值；所述目标得分用于表征目标相同的数据之间的相似度；所述非目标得分用于表征目标不同的数据之间的相似度；第一确定模块，用于在所述待识别数据对应的分数大于预设阈值的情况下，确定所述待识别数据对应的目标为所述指定目标。 10.一种电子设备，包括：处理器和存储器；所述处理器与所述存储器相连；所述存储器，用于存储可执行程序代码；所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于执行如权利要求1 ‑8任一项所述的方法。 11.一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行如权利要求1 ‑8任一项的方法步骤。 12.一种包含指令的计算机程序产品，当所述计算机程序产品在计算机或处理器上运行时，使得所述计算机或所述处理器执行如权利要求1 ‑8任一项所述的开集识别方法。权　利　要　求　书 2/2 页 3 CN 115222970 A 3

专利 开集识别方法、装置、电子设备、介质及程序产品

专利开集识别方法、装置、电子设备、介质及程序产品