专利 一种视频识别方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210618307.2 (22)申请日 2022.06.01 (71)申请人北京字节跳动网络技术有限公司地址 100041 北京市石景山区实兴大街3 0 号院3号楼 2层B-0035房间 (72)发明人杨飞　刘亮　洪进栋　王红阳　李想　 (74)专利代理机构北京中知法苑知识产权代理有限公司 1 1226 专利代理师李明 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/44(2022.01) G06V 10/74(2022.01) G06V 10/762(2022.01)G06V 10/764(2022.01) (54)发明名称一种视频识别方法及装置 (57)摘要本公开提供了一种视频识别方法及装置，该方法将满足聚类条件的第一参考视频作为样本，将其对应的第二特征向量与待识别视频对应的第一特征向量进行对比，得到目标相似度，并根据目标相似度判断待识别视频是否属于目标类型的视频，由于聚类后的第一参考视频集合中的第一参考视频对应的观看用户对于喜爱的视频类型更加专一，使得该第一参考视频更能够与目标类型的视频一致，进而提高判断待识别视频是否为目标类型的视频的精确度。权利要求书2页说明书13页附图4页 CN 114926771 A 2022.08.19 CN 114926771 A 1.一种视频识别方法，其特征在于，包括：获取待识别视频；获取所述待识别视频的第一特征向量；所述第一特征向量包含所述待识别视频的观看用户群体的属性特征；获取第一参考视频集合中多个第一参考视频分别对应的第二特征向量；所述第一参考视频为目标类型的视频；所述第一参考视频集合中包括满足聚类条件的至少一个聚类类别中的多个第一参考视频，其中所述聚类类别满足聚类条件是指：所述聚类类别包括的第一参考视频的数量大于预设数量，且该聚类类别中的各个第一参考视频的第二特征向量之间的相似度大于设定阈值；基于所述第一参考视频集合中每个第一参考视频的所述第二特征向量分别与所述第一特征向量之间的目标相似度，确定所述待识别视频是否属于所述目标类型的视频。 2.根据权利要求1所述的方法，其特征在于，根据以下步骤确定所述第一参考视频集合：获取所述目标类型的多个第一参考视频的第二特征向量；将所述第二特征向量输入至预先训练好的目标密度聚类模型，得到聚类成功的第一参考视频集合；所述目标密度聚类模型为根据目标类型的多个第二参考视频以及携带有类型标签的多个训练视频样本，从配置有不同模型参数的密度聚类模型中确定的。 3.根据权利要求2所述的方法，其特征在于，根据以下步骤训练所述目标密度聚类模型：获取目标类型的多个第二参考视频的第三特征向量，以及多个训练视频样本的第四特征向量；将所述第三特征向量分别输入至配置有不同模型参数的密度聚类模型，得到不同模型参数下聚类成功的第二参考视频集合；针对任一所述第二参考视频集合，基于该第二参考视频集合中各个第二参考视频对应的所述第三特征向量与所述训练视频样本对应的第四特征向量之间的目标相似度，确定所述训练视频样本的测试结果；所述测试结果指示有所述训练视频样本是否属于所述目标类型的视频；基于不同模型参数下的各个训练视频样本的测试结果及其对应的类型标签，确定所述密度聚类模型对应的目标模型参数，并将配置所述目标模型参数的密度聚类模型作为训练好的目标密度聚类模型。 4.根据权利要求1所述的方法，其特征在于，所述第一特征向量为所述待识别视频在达到目标展现量时的特征向量；通过以下步骤确定所述目标展现量：获取目标类型的第三参考视频在达到多个不同的展现量时的第五特征向量；确定所述第三参考视频在达到所述多个不同的展现量中预设展现量时，与在达到所述多个不同的展现量中除所述预设展现量外的其它展现量时，分别对应的第五特征向量之间的目标相似度；将所述目标相似度的变化趋势指示的平缓临界点对应的第五特征向量作为目标特征向量；权　利　要　求　书 1/2 页 2 CN 114926771 A 2将所述目标特征向量对应的展现量作为所述目标展现量。 5.根据权利要求 4所述的方法，其特征在于，确定所述目标相似度，包括：确定所述第三参考视频在达到所述多个不同的展现量中预设展现量时，与在达到所述多个不同的展现量中除所述预设展现量外的其他展现量时，分别对应的第五特征向量之间的余弦相似度及欧氏距离相似度；分别确定所述欧氏距离相似度及所述余弦相似度的变化趋势指示的平缓临界点所对应的展现量；将所述欧氏距离相似度及所述余弦相似度中平缓临界点所对应的展现量最低的相似度作为所述目标相似度。 6.根据权利要求1所述的方法，其特征在于，所述基于所述第一参考视频集合中每个第一参考视频的所述第二特征向量分别与所述第一特征向量之间的目标相似度，确定所述待识别视频是否属于所述目标类型的视频，包括：确定得到的各个所述目标相似度中，是否存在大于预设阈值的目标相似度；若存在，则确定所述待识别视频属于所述目标类型。 7.一种视频识别装置，其特征在于，包括：第一获取模块，用于获取待识别视频；以及，获取所述待识别视频的第一特征向量；所述第一特征向量包含所述待识别视频的观看用户群体的属性特征；第二获取模块，用于获取第一参考视频集合中多个第一参考视频分别对应的第二特征向量；所述第一参考视频为目标类型的视频；所述第一参考视频集合中包括满足聚类条件的至少一个聚类类别中的多个第一参考视频，其中所述聚类类别满足聚类条件是指：所述聚类类别包括的第一参考视频的数量大于预设数量，且该聚类类别中的各个第一参考视频的第二特征向量之间的相似度大于设定阈值；第一确定模块，用于基于所述第一参考视频集合中每个第一参考视频的所述第二特征向量分别与所述第一特征向量之间的目标相似度，确定所述待识别视频是否属于所述目标类型的视频。 8.根据权利要求7 所述的装置，其特征在于，所述装置还包括第二确定模块，用于：获取所述目标类型的多个第一参考视频的第二特征向量；将所述第二特征向量输入至预先训练好的目标密度聚类模型，得到聚类成功的第一参考视频集合；所述目标密度聚类模型为根据目标类型的多个第二参考视频以及携带有类型标签的多个训练视频样本，从配置有不同模型参数的密度聚类模型中确定的。 9.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的视频识别方法的步骤。 10.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至6任意一项所述的视频识别方法的步骤。权　利　要　求　书 2/2 页 3 CN 114926771 A 3

专利 一种视频识别方法及装置

专利一种视频识别方法及装置