专利 神经网络的训练方法及装置、人脸识别方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210539985.X (22)申请日 2022.05.18 (71)申请人北京市商汤科技开发有限公司地址 100080 北京市海淀区北四环西路58 号11层1101-1117室 (72)发明人刘博晓　宋广录　刘宇　 (74)专利代理机构北京中知恒瑞知识产权代理事务所(普通合伙) 11889 专利代理师张媛媛 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 40/16(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01)G06V 10/40(2022.01) G06V 10/30(2022.01) G06N 3/04(2006.01) (54)发明名称神经网络的训练方法及装置、人脸识别方法及装置 (57)摘要本公开提供了一种神经网络的训练方法及装置、人脸识别方法及装置，其中，训练方法包括：获取第一图像和至少预设数量张第二图像，第二图像与第一图像具有相同的图像标签；利用目标神经网络模型对第一图像进行特征提取，得到第一特征信息，并利用目标神经网络模型的滑动平均模型，分别对每张第二图像进行特征提取，得到至少预设数量个第二特征信息；基于第一特征信息和每个第二特征信息之间的第一相似度，确定第一损失系数，并基于第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度，确定第二损失系数；基于第一损失系数和第二损失系数，确定目标损失，利用目标损失对目标神经网络模型进行迭代训练，得到训练好的目标神经网络模型。权利要求书3页说明书18页附图2页 CN 114842302 A 2022.08.02 CN 114842302 A 1.一种神经网络的训练方法，其特征在于，包括：获取第一图像和至少预设数量张第二图像，所述第二图像与所述第一图像具有相同的图像标签；利用目标神经网络模型对所述第一图像进行特征提取，得到第一特征信息，并利用所述目标神经网络模型的滑动平均模型，分别对每张所述第二图像进行特征提取，得到至少预设数量个第二特征信息；基于所述第一特征信息和每个所述第二特征信息之间的第一相似度，确定第一损失系数，并基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度，确定第二损失系数；每个所述历史特征组中包括的第三特征信息为在进行当前轮训练之前，在其他轮训练中利用其他第二图像确定的；基于所述第一损失系数和所述第二损失系数，确定目标损失，并利用所述目标损失对所述目标神经网络模型进行迭代训练，直至满足训练截止条件，得到训练好的目标神经网络模型。 2.根据权利要求1所述的方法，其特征在于，所述第一图像和第二图像为人脸图像，所述目标神经网络模型为人脸识别模型。 3.根据权利要求1或2所述的方法，其特征在于，所述基于所述第一特征信息和每个所述第二特征信息之间的第一相似度，确定第一损失系数，包括：从所述至少预设数量个所述第一相似度中，筛选出最大相似度，并基于所述最大相似度和预设的分隔值之间的第一差值，确定所述第一损失系数。 4.根据权利要求1至3任一项所述的方法，其特征在于，所述基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度，确定第二损失系数，包括：针对每个历史特征组，基于该历史特征组中的每个所述第三特征信息与所述第一特征信息之间的第二相似度，确定该历史特征组对应的最小相似度；基于每个所述历史特征组的组标签，从所述历史特征组中筛选出所述组标签与所述第一图像的图像标签不一致的目标历史特征组；所述组标签为用于提取所述历史特征组中任一所述第三特征信息的其他第二图像的图像标签；基于每个所述目标历史特征组分别对应的最小相似度，确定所述第二损失系数。 5.根据权利要求1至3任一项所述的方法，其特征在于，在所述基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度，确定第二损失系数之前，还包括：根据所述第二特征信息的数量和预设分组值，将所述至少预设数量个所述第二特征信息，划分至多个当前特征组中；在所述历史特征组和所述当前特征组的数量之和大于预设组数量的情况下，确定所述数量之和与所述预设组数量之间的第二差值；按照每个所述历史特征组的生成时间的先后顺序，对每个所述历史特征组进行排序，得到每个所述历史特征组的排序值；删除排序值不大于所述第二差值的各个所述历史特征组。 6.根据权利要求5所述的方法，其特征在于，在所述删除排序值不大于所述第二差值的各个所述历史特征组之后，还包括：保留每个所述当前特征组，其中，保留下来的每个所述当前特征组作为下一轮训练的权　利　要　求　书 1/3 页 2 CN 114842302 A 2历史特征组。 7.根据权利要求1至3任一项所述的方法，其特征在于，所述基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度，确定第二损失系数，包括：基于每个历史特征组的组标签，从所述历史特征组中筛选出所述组标签与所述第一图像的图像标签不一致的目标历史特征组；针对每个目标历史特征组，基于该目标历史特征组中的每个所述第三特征信息与所述第一特征信息之间的第二相似度，确定该目标历史特征组对应的最小相似度；基于每个所述目标历史特征组分别对应的最小相似度，确定所述第二损失系数。 8.根据权利要求4所述的方法，其特征在于，所述基于每个所述目标历史特征组分别对应的最小相似度，确定所述第二损失系数，包括：利用目标扩展参数分别对每个所述最小相似度进行数值扩展，基于每个数值扩展后的最小相似度，确定所述第二损失系数。 9.根据权利要求1至8任一项所述的方法，其特征在于，所述基于所述第一损失系数和所述第二损失系数，确定目标损失，包括：确定所述第一损失系数和所述第二损失系数的系数和，并基于第一损失系数与所述系数和的比值，确定所述目标损失。 10.根据权利要求1至10任一项所述的方法，其特征在于，所述方法还包括：在所述当前轮训练为首轮训练的情况下，将所述第二损失系数置为预设系数。 11.一种人脸识别方法，其特征在于，包括：获取待识别的人脸图像；将所述人脸图像输入基于权利要求1～10任一所述的训练方法训练得到的目标神经网络模型，得到所述人脸图像中包括的目标人脸信息。 12.一种神经网络的训练装置，其特征在于，包括：第一获取模块，用于获取第一图像和至少预设数量张第二图像，所述第二图像与所述第一图像具有相同的图像标签；提取模块，用于利用目标神经网络模型对所述第一图像进行特征提取，得到第一特征信息，并利用所述目标神经网络模型的滑动平均模型，分别对每张所述第二图像进行特征提取，得到至少预设数量个第二特征信息；确定模块，用于基于所述第一特征信息和每个所述第二特征信息之间的第一相似度，确定第一损失系数，并基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度，确定第二损失系数；每个所述历史特征组中包括的第三特征信息为在进行当前轮训练之前，在其他轮训练中利用其他第二图像确定的；训练模块，用于基于所述第一损失系数和所述第二损失系数，确定目标损失，并利用所述目标损失对所述目标神经网络模型进行迭代训练，直至满足训练截止条件，得到训练好的目标神经网络模型。 13.一种人脸识别装置，其特征在于，包括：第二获取模块，用于获取待识别的人脸图像；识别模块，用于将所述人脸图像输入基于权利要求1～10任一所述的训练方法训练得到的目标神经网络模型，得到所述人脸图像中包括的目标人脸信息。权　利　要　求　书 2/3 页 3 CN 114842302 A 3

专利 神经网络的训练方法及装置、人脸识别方法及装置

专利神经网络的训练方法及装置、人脸识别方法及装置