专利 视频人物搜索方法、装置及计算机设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210717759.6 (22)申请日 2022.06.20 (71)申请人咪咕文化科技有限公司地址 100032 北京市西城区德胜门外大街 11号5幢40 0室(德胜园区) 申请人中国移动通信集团有限公司 (72)发明人程星星　 (74)专利代理机构北京市浩天知识产权代理事务所(普通合伙) 11276 专利代理师石志娟 (51)Int.Cl. G06V 40/16(2022.01) G06V 20/40(2022.01) G06V 10/74(2022.01) G06F 16/783(2019.01) (54)发明名称视频人物搜索方法、装置及计算机设备 (57)摘要本发明实施例涉及视频处理技术领域，公开了一种视频人物搜索方法，该方法包括：获取目标人物的待识别人脸图像，并提取所述待识别人脸图像的待识别人脸图像特征；将所述待识别人脸图像特征与目标视频对应的视频人脸特征库中的人脸图像特征进行匹配，得到匹配识别结果，以确定所述目标视频中存在所述目标人物的各个目标视频帧；所述视频人脸特征库中包括所述目标视频中至少一个人物对应的人脸图像特征集，所述人脸图像特征集中包括至少一张人脸图像的目标人脸图像特征以及所述目标人脸图像特征所属视频帧的视频帧信息。通过上述方式，本发明实施例实现了及时响应被识别人物多变，提高了识别效率的有益效果。权利要求书2页说明书15页附图4页 CN 115050073 A 2022.09.13 CN 115050073 A 1.一种视频人物搜索方法，其特征在于，所述方法包括：获取目标人物的待识别人脸图像，并提取所述待识别人脸图像的待识别人脸图像特征；将所述待识别人脸图像特征与目标视频对应的视频人脸特征库中的人脸图像特征进行匹配，得到匹配识别结果，以确定所述目标视频中存在所述目标人物的各个目标视频帧；所述视频人脸特征库中包括所述目标视频中至少一个人物对应的人脸图像特征集，所述人脸图像特征集中包括至少一张人脸图像的目标人脸图像特征以及所述目标人脸图像特征所属视频帧的视频帧信息。 2.根据权利要求1所述的方法，其特征在于，所述将所述待识别人脸图像特征与目标视频对应的视频人脸特征库中的人脸图像特征进行匹配，得到匹配识别结果，以确定所述目标视频中存在所述目标人物的各个目标视频帧之前，所述方法还包括：对目标视频中各个视频帧分别进行人脸检测，获取至少一张人脸图像的目标人脸图像特征以及所述目标人脸图像特征对应的视频帧信息；根据各个目标人脸图像特征的相似性，对所述至少一张人脸图像的目标人脸图像特征进行分组，将每组中的目标人脸图像特征及对应的视频帧信息关联存储，得到视频关联的所述视频人脸特征库。 3.根据权利要求2所述的方法，其特征在于，所述对目标视频中各个视频帧分别进行人脸检测，获取至少一张人脸图像的多个目标人脸图像特征以及所述目标人脸图像特征对应的视频帧信息，包括：获取目标视频的各个视频帧及对应的视频帧信息；对所述各个视频帧进行人脸检测，确定所述各个视频帧对应的多张人脸图像；对所述多张人脸图像进行过滤；提取过滤后的人脸图像所对应的目标人脸图像特征及对应的目标视频帧信息。 4.根据权利要求2所述的方法，其特征在于，所述根据各个目标人脸图像特征的相似性，对所述至少一张人脸图像的多个目标人脸图像特征进行分组，将每组中的目标人脸图像特征及对应的视频帧信息关联存储，得到视频关联的所述视频人脸特征库，包括：根据所述目标视频的第一帧视频帧中的所述人脸图像特征，构建至少一个初始人脸图像特征集合，将所述第一帧视频帧中不同的人脸图像特征分别存储至不同的所述初始人脸图像特征集合；所述初始人脸图像特征集合中第一帧视频帧的所述人脸图像特征与所述第一帧视频帧的第一视频帧信息关联存储；依次计算每帧视频帧中人脸图像特征与各个所述初始人脸图像特征集合中的人脸图像特征的第一相似度；根据所述第一相似度，将每帧视频帧中的人脸图像特征及对应的视频帧信息更新至对应的所述初始人脸图像特征集合中，形成所述视频人脸特征库。 5.根据权利要求4所述的方法，其特征在于，所述依次计算每帧视频帧中人脸图像特征与各个所述初始人脸图像特征集合中的人脸图像特征的相似度，包括：通过计算所述每帧视频帧中人脸图像特征与各个所述初始人脸图像特征集合中人脸图像特征的平均空间距离，确定所述第一相似度。 6.根据权利要求1所述的方法，其特征在于，所述将所述待识别人脸图像特征与目标视权　利　要　求　书 1/2 页 2 CN 115050073 A 2频对应的视频人脸特征库中的人脸图像特征进行匹配，得到匹配识别结果，以确定所述目标视频中是否存在所述目标人物，包括：计算所述待识别人脸图像特征与各个人脸图像特征集中的目标人脸图像特征的相似度；确定各个所述人脸图像特征集中所述相似度满足预设阈值的目标人脸图像特征的数量；将所述相似度满足预设阈值的目标人脸图像特征的数量最多的所述人脸图像特征集，确定为与所述待识别人脸图像特征匹配的人脸图像特征集。 7.根据权利要求1所述的方法，其特征在于，所述根据所述第一相似度，将每帧视频帧中的人脸图像特征及对应的视频帧信息更新至对应的所述初始人脸图像特征集合中，形成所述视频人脸特征库之后，所述方法还包括：将所述第一相似度小于第一预设阈值的人脸图像特征及对应的视频帧信息存储至缓冲区的人脸图像特征集合；计算下一帧视频帧中人脸图像特征与各个所述初始人脸图像特征集合中的人脸图像特征的第二相似度，当所述第二相似度小于所述第一预设阈值时，将所述下一帧视频帧中人脸图像特征与所述缓冲区的人脸图像特征集合中的人脸图像特征进行比较，计算第三相似度；当所述第三相似度大于第一预设阈值时，在所述视频人脸特征库中新建一个初始人脸图像特征集合，将所述下一帧视频帧中人脸图像特征及所述缓冲区中与所述下一帧视频帧中人脸图像特征的第二相似度大于所述第一预设阈值的人脸图像特征存储于新建的初始人脸图像特征集合中，并删除所述缓冲区对应的人脸图像特征集合。 8.一种视频人物搜索装置，其特征在于，所述装置包括：获取模块，用于获取目标人物的待识别人脸图像，并提取所述待识别人脸图像的待识别人脸图像特征；匹配模块，用于将所述待识别人脸图像特征与目标视频对应的视频人脸特征库中的人脸图像特征进行匹配，得到匹配识别结果，以确定所述目标视频中存在所述目标人物的各个目标视频帧；所述视频人脸特征库中包括所述目标视频中至少一个人物对应的人脸图像特征集，所述人脸图像特征集中包括至少一张人脸图像的目标人脸图像特征以及所述目标人脸图像特征所属视频帧的视频帧信息。 9.一种计算机设备，其特征在于，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1‑7任意一项所述的视频人物搜索方法的操作。 10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一可执行指令，所述可执行指令在计算机设备上运行时，使得计算机设备执行如权利要求 1‑7任意一项所述的视频人物搜索方法的操作。权　利　要　求　书 2/2 页 3 CN 115050073 A 3

专利 视频人物搜索方法、装置及计算机设备

专利视频人物搜索方法、装置及计算机设备