(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210717759.6
(22)申请日 2022.06.20
(71)申请人 咪咕文化科技有限公司
地址 100032 北京市西城区德胜门外大街
11号5幢40 0室(德胜园区)
申请人 中国移动通信集团有限公司
(72)发明人 程星星
(74)专利代理 机构 北京市浩天知识产权代理事
务所(普通 合伙) 11276
专利代理师 石志娟
(51)Int.Cl.
G06V 40/16(2022.01)
G06V 20/40(2022.01)
G06V 10/74(2022.01)
G06F 16/783(2019.01)
(54)发明名称
视频人物搜索方法、 装置及计算机设备
(57)摘要
本发明实施例涉及视频处理技术领域, 公开
了一种视频人物搜索方法, 该方法包括: 获取目
标人物的待识别人脸图像, 并提取所述待识别人
脸图像的待识别人脸图像特征; 将所述待识别人
脸图像特征与 目标视频对应的视频人脸特征库
中的人脸图像特征进行匹配, 得到匹配识别结
果, 以确定所述目标视频中存在所述目标人物的
各个目标视频帧; 所述视频人脸特征库中包括所
述目标视频中至少一个人物对应的人脸图像特
征集, 所述人脸图像特征集中包括至少一张人脸
图像的目标人脸图像特征以及所述目标人脸图
像特征所属视频帧的视频帧信息。 通过上述方
式, 本发明实施例实现了及时响应被识别人物多
变, 提高了识别效率的有益效果。
权利要求书2页 说明书15页 附图4页
CN 115050073 A
2022.09.13
CN 115050073 A
1.一种视频 人物搜索方法, 其特 征在于, 所述方法包括:
获取目标人物的待识别人脸图像, 并提取所述待识别人脸图像的待识别人脸图像特
征;
将所述待识别人脸图像特征与目标视频对应的视频人脸特征库中的人脸图像特征进
行匹配, 得到匹配识别结果, 以确定所述目标视频中存在所述目标人物的各个目标视频帧;
所述视频人脸特征库中包括所述目标视频中至少一个人物对应的人脸图像特征集, 所述人
脸图像特征集中包括至少一张人脸图像的目标人脸图像特征以及所述目标人脸图像特征
所属视频帧的视频帧信息 。
2.根据权利要求1所述的方法, 其特征在于, 所述将所述待识别人脸图像特征与目标视
频对应的视频人脸特征库中的人脸图像特征进行匹配, 得到匹配识别结果, 以确定所述 目
标视频中存在所述目标 人物的各个目标视频帧之前, 所述方法还 包括:
对目标视频中各个视频帧分别进行人脸检测, 获取至少一张人脸图像的目标人脸图像
特征以及所述目标 人脸图像特 征对应的视频帧信息;
根据各个目标人脸图像特征的相似性, 对所述至少一张人脸图像的目标人脸图像特征
进行分组, 将每组中的目标人脸图像特征及对应的视频帧信息关联存储, 得到视频关联 的
所述视频 人脸特征库。
3.根据权利要求2所述的方法, 其特征在于, 所述对目标视频中各个视频帧分别进行人
脸检测, 获取至少一张人脸图像的多个目标人脸图像特征以及所述目标人脸图像特征对应
的视频帧信息, 包括:
获取目标视频的各个视频帧及对应的视频帧信息;
对所述各个视频帧进行 人脸检测, 确定所述各个视频帧对应的多张人脸图像;
对所述多张人脸图像进行 过滤;
提取过滤后的人脸图像所对应的目标 人脸图像特 征及对应的目标视频帧信息 。
4.根据权利要求2所述的方法, 其特征在于, 所述根据各个目标人脸图像特征的相似
性, 对所述至少一张人脸图像的多个目标人脸图像特征进行分组, 将每组中的目标人脸图
像特征及对应的视频帧信息关联存 储, 得到视频关联的所述视频 人脸特征库, 包括:
根据所述目标视频的第 一帧视频帧中的所述人脸图像特征, 构建至少一个初始人脸图
像特征集合, 将所述第一帧视频帧中不同的人脸图像特征分别存储至不同的所述初始人脸
图像特征集合; 所述初始人脸图像特征集合中第一帧视频帧的所述人脸图像特征与所述第
一帧视频帧的第一视频帧信息关联存 储;
依次计算每帧视频帧中人脸图像特征与各个所述初始人脸图像特征集合中的人脸图
像特征的第一相似度;
根据所述第 一相似度, 将每帧视频帧中的人脸图像特征及对应的视频帧信 息更新至对
应的所述初始人脸图像特 征集合中, 形成所述视频 人脸特征库。
5.根据权利要求4所述的方法, 其特征在于, 所述依次计算每帧视频帧中人脸图像特征
与各个所述初始人脸图像特 征集合中的人脸图像特 征的相似度, 包括:
通过计算所述每帧视频帧中人脸图像特征与各个所述初始人脸图像特征集合中人脸
图像特征的平均空间距离, 确定所述第一相似度。
6.根据权利要求1所述的方法, 其特征在于, 所述将所述待识别人脸图像特征与目标视权 利 要 求 书 1/2 页
2
CN 115050073 A
2频对应的视频人脸特征库中的人脸图像特征进行匹配, 得到匹配识别结果, 以确定所述 目
标视频中是否存在所述目标 人物, 包括:
计算所述待识别人脸图像特征与各个人脸图像特征集中的目标人脸图像特征的相似
度;
确定各个所述人脸图像特征集中所述相似度满足预设阈值的目标人脸图像特征的数
量;
将所述相似度满足预设阈值的目标人脸图像特征的数量最多的所述人脸图像特征集,
确定为与所述待识别人脸图像特 征匹配的人脸图像特 征集。
7.根据权利要求1所述的方法, 其特征在于, 所述根据所述第一相似度, 将每帧视频帧
中的人脸图像特征及对应的视频帧信息更新至对应的所述初始人脸图像特征集合中, 形成
所述视频 人脸特征库之后, 所述方法还 包括:
将所述第一相似度小于第一预设阈值的人脸图像特征及对应的视频帧信息存储至缓
冲区的人脸图像特 征集合;
计算下一帧视频帧中人脸图像特征与各个所述初始人脸图像特征集合中的人脸图像
特征的第二相似度, 当所述第二相似度小于所述第一预设阈值时, 将所述下一帧视频帧中
人脸图像特征与所述缓冲区的人脸图像特征集合中的人脸图像特征进 行比较, 计算第三相
似度;
当所述第三相似度大于第 一预设阈值 时, 在所述视频人脸特征库中新建一个初始人脸
图像特征集合, 将所述下一帧视频帧中人脸图像特征及所述缓冲区中与所述下一帧视频帧
中人脸图像特征的第二相似度大于所述第一预设阈值的人脸图像特征存储于新建的初始
人脸图像特 征集合中, 并删除所述缓冲区对应的人脸图像特 征集合。
8.一种视频 人物搜索装置, 其特 征在于, 所述装置包括:
获取模块, 用于获取目标人物的待识别人脸图像, 并提取所述待识别人脸图像的待识
别人脸图像特 征;
匹配模块, 用于将所述待识别人脸图像特征与目标视频对应的视频人脸特征库中的人
脸图像特征进行匹配, 得到匹配识别结果, 以确定所述 目标视频中存在所述 目标人物的各
个目标视频帧; 所述视频人脸特征库中包括所述目标视频中至少一个人物对应的人脸图像
特征集, 所述人脸图像特征集中包括至少一张人脸图像的目标人脸图像特征以及所述目标
人脸图像特 征所属视频帧的视频帧信息 。
9.一种计算机设备, 其特征在于, 包括: 处理器、 存储器、 通信接口和通信总线, 所述处
理器、 所述存 储器和所述 通信接口通过 所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令, 所述可执行指令使所述处理器执行如权利要
求1‑7任意一项所述的视频 人物搜索方法的操作。
10.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有至少一可执行指
令, 所述可执行指 令在计算机 设备上运行时, 使得计算机 设备执行如权利要求 1‑7任意一项
所述的视频 人物搜索方法的操作。权 利 要 求 书 2/2 页
3
CN 115050073 A
3
专利 视频人物搜索方法、装置及计算机设备
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:30上传分享