(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211130047.0
(22)申请日 2022.09.16
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 李弼 彭楠 希滕 张刚
(74)专利代理 机构 北京英赛 嘉华知识产权代理
有限责任公司 1 1204
专利代理师 王达佐 马晓亚
(51)Int.Cl.
G06V 40/16(2022.01)
G06V 20/40(2022.01)
G06V 10/762(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
训练人脸识别模型、 人脸识别的方法和装置
(57)摘要
本公开提供了训练人脸识别模 型、 人脸识别
的方法和装置, 涉及人工智能技术领域, 具体为
深度学习、 图像处理、 计算机视觉技术领域, 可应
用于人脸等场景。 具体实现方案为: 获取包括不
同年龄段的人脸图像的视频; 通过人脸检测模型
从所述视频中提取人脸图像集合; 通过第一人脸
识别模型对 所述人脸图像集合进行聚类, 得到第
一聚类结果; 根据所述第一聚类结果, 将同一类
的人脸图像和不同类的人脸图像分别作为正样
本和负样 本训练所述第一人脸识别模 型, 得到训
练后的第二人脸识别模型。 通过该 实施方式能够
通过无监督的训练得到跨年龄人脸识别模型, 不
仅可以节省人工标注成本, 还能提高跨年龄人脸
识别的准确性。
权利要求书2页 说明书9页 附图5页
CN 115471893 A
2022.12.13
CN 115471893 A
1.一种训练人脸识别模型的方法, 包括:
获取包括 不同年龄段的人脸图像的视频;
通过人脸检测模型从所述视频中提取 人脸图像集 合;
通过第一人脸识别模型对所述人脸图像集 合进行聚类, 得到第一聚类结果;
根据所述第 一聚类结果, 将同一类的人脸图像和不同类的人脸图像分别作为正样本和
负样本训练所述第一人脸识别模型, 得到训练后的第二人脸识别模型。
2.根据权利要求1所述的方法, 其中, 所述方法还 包括:
通过所述第二人脸识别模型对所述人脸图像集 合进行聚类, 得到第二聚类结果;
响应于所述第 二聚类结果不同于所述第 一聚类结果, 基于所述第 二聚类结果训练所述
第二人脸识别模型。
3.根据权利要求1所述的方法, 其中, 所述根据所述第一聚类结果, 将同一类的人脸图
像和不同类的人脸图像分别作为 正样本和负 样本训练所述第一人脸识别模型, 包括:
从所述人脸图像集 合中提取 出包含字幕的目标图像集 合;
从所述目标图像集 合中每个目标图像的字幕中识别人物名称;
将具有相同人物名称的目标图像确定为所述 正样本。
4.根据权利要求1所述的方法, 其中, 所述根据所述第一聚类结果, 将同一类的人脸图
像和不同类的人脸图像分别作为 正样本和负 样本训练所述第一人脸识别模型, 包括:
将所述视频的语音帧转换成文本信息集 合;
从所述文本信息集 合中识别人物名称;
根据每个人物名称对应的语音帧在视频中的位置确定每 个人物名称对应的人脸图像;
将相同人物名称对应的人脸图像确定为所述 正样本。
5.根据权利要求1所述的方法, 其中, 所述根据所述第一聚类结果, 将同一类的人脸图
像和不同类的人脸图像分别作为 正样本和负 样本训练所述第一人脸识别模型, 包括:
从所述视频的字幕或语音中提取年龄信息;
确定每种年龄信息对应的人脸图像;
将正样本和负 样本分别添加上年龄信息后训练所述第一人脸识别模型。
6.一种人脸识别方法, 包括:
获取待识别的两张人脸图像;
将所述两张人脸图像输入采用如权利要求1 ‑4之一所述的方法生成的第 二人脸识别模
型中, 识别出 所述两张人脸图像是否为同一人。
7.根据权利要求6所述的方法, 其中, 所述方法还 包括:
分别获取 所述两张人脸图像的年龄信息;
将所述两张人脸图像和对应的年龄信 息输入采用如权利要求5所述的方法生成的第 二
人脸识别模型中, 识别出 所述两张人脸图像是否为同一人。
8.一种训练人脸识别模型的装置, 包括:
获取单元, 被配置成获取包括 不同年龄段的人脸图像的视频;
提取单元, 被配置成通过 人脸检测模型从所述视频中提取 人脸图像集 合;
聚类单元, 被配置成通过第一人脸识别模型对所述人脸图像集合进行聚类, 得到第一
聚类结果;权 利 要 求 书 1/2 页
2
CN 115471893 A
2训练单元, 被配置成根据所述第一聚类结果, 将同一类的人脸图像和不同类的人脸图
像分别作为正样本和负样本训练所述第一人脸识别模型, 得到训练后的第二人脸识别模
型。
9.根据权利要求8所述的装置, 其中, 所述装置还 包括迭代单 元, 被配置成:
通过所述第二人脸识别模型对所述人脸图像集 合进行聚类, 得到第二聚类结果;
响应于所述第 二聚类结果不同于所述第 一聚类结果, 基于所述第 二聚类结果继续所述
第二人脸识别模型。
10.根据权利要求8所述的装置, 其中, 所述聚类单 元进一步被配置成:
从所述人脸图像集 合中提取 出包含字幕的目标图像集 合;
从所述目标图像集 合中每个目标图像的字幕中识别人物名称;
将具有相同人物名称的目标图像确定为所述 正样本。
11.根据权利要求8所述的装置, 其中, 所述聚类单 元进一步被配置成:
将所述视频的语音帧转换成文本信息集 合;
从所述文本信息集 合中识别人物名称;
根据每个人物名称对应的语音帧在视频中的位置确定每 个人物名称对应的人脸图像;
将相同人物名称对应的人脸图像确定为所述 正样本。
12.根据权利要求8所述的装置, 其中, 所述聚类单 元进一步被配置成:
从所述视频的字幕或语音中提取年龄信息;
确定每种年龄信息对应的人脸图像;
将正样本和负 样本分别添加上年龄信息后训练所述第一人脸识别模型。
13.一种人脸识别装置, 包括:
获取单元, 被配置成获取待识别的两张人脸图像;
识别单元, 被配置成将所述两张人脸图像输入采用如权利要求8 ‑11之一所述的装置生
成的第二人脸识别模型中, 识别出 所述两张人脸图像是否为同一人。
14.根据权利要求13所述的装置, 其中, 所述装置还 包括年龄单元, 被配置成:
分别获取 所述两张人脸图像的年龄信息;
将所述两张人脸图像和对应的年龄信息输入采用 如权利要求12所述的装置生成的第
二人脸识别模型中, 识别出 所述两张人脸图像是否为同一人。
15.一种电子设备, 包括:
至少一个处 理器; 以及
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处
理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于
使所述计算机执 行根据权利要求1 ‑7中任一项所述的方法。
17.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根
据权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115471893 A
3
专利 训练人脸识别模型、人脸识别的方法和装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 04:16:50上传分享