standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210539985.X (22)申请日 2022.05.18 (71)申请人 北京市商汤科技 开发有限公司 地址 100080 北京市海淀区北四环西路58 号11层1101-1117室 (72)发明人 刘博晓 宋广录 刘宇  (74)专利代理 机构 北京中知恒瑞知识产权代理 事务所(普通 合伙) 11889 专利代理师 张媛媛 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 40/16(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01)G06V 10/40(2022.01) G06V 10/30(2022.01) G06N 3/04(2006.01) (54)发明名称 神经网络的训练方法及 装置、 人脸识别方法 及装置 (57)摘要 本公开提供了一种神经网络的训练方法及 装置、 人脸识别方法及装置, 其中, 训练方法包 括: 获取第一图像和至少预设数量张第二图像, 第二图像与第一图像具有相同的图像标签; 利用 目标神经网络模 型对第一图像进行特征提取, 得 到第一特征信息, 并利用目标神经网络模型的滑 动平均模型, 分别对每张第二图像进行特征提 取, 得到至少预设数量个第二特征信息; 基于第 一特征信息和每个第二特征信息之间的第一相 似度, 确定第一损失系数, 并基于第一特征信息 与至少部分历史特征组中的第三特征信息的第 二相似度, 确定第二损失系数; 基于第一损失系 数和第二损失系数, 确定目标损失, 利用目标损 失对目标神经网络模型进行迭代训练, 得到训练 好的目标神经网络模型。 权利要求书3页 说明书18页 附图2页 CN 114842302 A 2022.08.02 CN 114842302 A 1.一种神经网络的训练方法, 其特 征在于, 包括: 获取第一图像和至少预设数量张第 二图像, 所述第 二图像与 所述第一图像具有相同的 图像标签; 利用目标神经网络模型对所述第一图像进行特征提取, 得到第一特征信息, 并利用所 述目标神经网络模型 的滑动平均模型, 分别对每张所述第二图像进行特征提取, 得到至少 预设数量个第二特 征信息; 基于所述第 一特征信 息和每个所述第 二特征信 息之间的第 一相似度, 确定第 一损失系 数, 并基于所述第一特征信息与至少 部分历史特征组中的第三特征信息的第二相似度, 确 定第二损失系 数; 每个所述历史特征组中包括的第三特征信息为在进行当前轮训练之前, 在其他轮训练中利用其 他第二图像确定的; 基于所述第一损 失系数和所述第二损 失系数, 确定目标损 失, 并利用所述目标损 失对 所述目标神经网络模型进行迭代训练, 直至满足训练截止条件, 得到训练好的目标神经网 络模型。 2.根据权利要求1所述的方法, 其特征在于, 所述第一图像和第二图像为人脸图像, 所 述目标神经网络模型为人脸识别模型。 3.根据权利要求1或2所述的方法, 其特征在于, 所述基于所述第一特征信息和每个所 述第二特 征信息之间的第一相似度, 确定第一损失系数, 包括: 从所述至少预设数量个所述第一相似度中, 筛选出最大相似度, 并基于所述最大相似 度和预设的分隔值之间的第一差值, 确定所述第一损失系数。 4.根据权利要求1至3任一项所述的方法, 其特征在于, 所述基于所述第一特征信息与 至少部分历史特 征组中的第三特 征信息的第二相似度, 确定第二损失系数, 包括: 针对每个历史特征组, 基于该历史特征组中的每个所述第 三特征信 息与所述第 一特征 信息之间的第二相似度, 确定该历史特 征组对应的最小相似度; 基于每个所述历史特征组的组标签, 从所述历史特征组中筛选出所述组标签与所述第 一图像的图像标签不一致的目标历史特征组; 所述组标签为用于提取所述历史特征组中任 一所述第三特 征信息的其 他第二图像的图像标签; 基于每个所述目标历史特 征组分别对应的最小相似度, 确定所述第二损失系数。 5.根据权利要求1至3任一项所述的方法, 其特征在于, 在所述基于所述第一特征信息 与至少部分历史特 征组中的第三特 征信息的第二相似度, 确定第二损失系数之前, 还 包括: 根据所述第 二特征信 息的数量和预设分组值, 将所述至少预设数量个所述第 二特征信 息, 划分至多个当前 特征组中; 在所述历史特征组和所述当前特征组 的数量之和大于预设组数量的情况下, 确定所述 数量之和与所述预设组数量之间的第二差值; 按照每个所述历史特征组的生成时间的先后顺序, 对每个所述历史特征组进行排序, 得到每个所述历史特 征组的排序值; 删除排序值 不大于所述第二差值的各个所述历史特 征组。 6.根据权利要求5所述的方法, 其特征在于, 在所述删除排序值不大于所述第 二差值的 各个所述历史特 征组之后, 还 包括: 保留每个所述当前特征组, 其中, 保留下来的每个所述当前特征组作为下一轮训练的权 利 要 求 书 1/3 页 2 CN 114842302 A 2历史特征组。 7.根据权利要求1至3任一项所述的方法, 其特征在于, 所述基于所述第一特征信息与 至少部分历史特 征组中的第三特 征信息的第二相似度, 确定第二损失系数, 包括: 基于每个历史特征组 的组标签, 从所述历史特征组中筛选出所述组标签与 所述第一图 像的图像标签不 一致的目标历史特 征组; 针对每个目标历史特征组, 基于该目标历史特征组中的每个所述第 三特征信 息与所述 第一特征信息之间的第二相似度, 确定该目标历史特 征组对应的最小相似度; 基于每个所述目标历史特 征组分别对应的最小相似度, 确定所述第二损失系数。 8.根据权利要求4所述的方法, 其特征在于, 所述基于每个所述目标历史特征组分别对 应的最小相似度, 确定所述第二损失系数, 包括: 利用目标扩展参数分别对每个所述最小相似度进行数值扩展, 基于每个数值扩展后的 最小相似度, 确定所述第二损失系数。 9.根据权利要求1至8任一项所述的方法, 其特征在于, 所述基于所述第一损 失系数和 所述第二损失系数, 确定目标损失, 包括: 确定所述第 一损失系数和所述第 二损失系数的系数和, 并基于第 一损失系数与所述系 数和的比值, 确定所述目标损失。 10.根据权利要求1至10任一项所述的方法, 其特 征在于, 所述方法还 包括: 在所述当前轮训练为首轮训练的情况 下, 将所述第二损失系数置为预设系数。 11.一种人脸识别方法, 其特 征在于, 包括: 获取待识别的人脸图像; 将所述人脸图像输入基于权利要求1~10任一所述的训练方法训练得到的目标神经网 络模型, 得到所述人脸图像中包括的目标 人脸信息 。 12.一种神经网络的训练装置, 其特 征在于, 包括: 第一获取模块, 用于获取第一图像和至少预设数量张第二图像, 所述第二图像与所述 第一图像具有相同的图像标签; 提取模块, 用于利用目标神经网络模型对所述第一图像进行特征提取, 得到第一特征 信息, 并利用所述 目标神经网络模型 的滑动平均模型, 分别对每张所述第二图像进行特征 提取, 得到 至少预设数量个第二特 征信息; 确定模块, 用于基于所述第一特征信息和每个所述第二特征信息之间的第一相似度, 确定第一损失系数, 并基于所述第一特征信息与至少部 分历史特征组中的第三特征信息的 第二相似度, 确定第二损失系 数; 每个所述历史特征组中包括的第三特征信息为在进行当 前轮训练之前, 在其 他轮训练中利用其 他第二图像确定的; 训练模块, 用于基于所述第 一损失系数和所述第 二损失系数, 确定目标损失, 并利用所 述目标损失对所述 目标神经网络模型进行迭代训练, 直至满足训练截止条件, 得到训练好 的目标神经网络模型。 13.一种人脸识别装置, 其特 征在于, 包括: 第二获取模块, 用于获取待识别的人脸图像; 识别模块, 用于将所述人脸图像输入基于权利要求1~10任一所述的训练方法训练得 到的目标神经网络模型, 得到所述人脸图像中包括的目标 人脸信息 。权 利 要 求 书 2/3 页 3 CN 114842302 A 3

PDF文档 专利 神经网络的训练方法及装置、人脸识别方法及装置

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 神经网络的训练方法及装置、人脸识别方法及装置 第 1 页 专利 神经网络的训练方法及装置、人脸识别方法及装置 第 2 页 专利 神经网络的训练方法及装置、人脸识别方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。