(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210701609.6
(22)申请日 2022.06.17
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518057 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 熊鹏飞 徐鲁辉
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 彭程
(51)Int.Cl.
G06V 20/40(2022.01)
G06V 10/42(2022.01)
G06V 10/44(2022.01)
G06V 10/74(2022.01)
(54)发明名称
数据处理方法、 装置、 设备、 存储介质及计算
机程序产品
(57)摘要
本申请提供了数据处理方法、 装置、 设备、 存
储介质及计算机程序产品, 可应用于人工智 能、
车载等领域或场景, 该方法包括: 获取包括M个视
频帧的待处理视频帧序列, 对M个视频帧中的每
一个视频帧进行全局特征提取和局部特征提取,
得到每一个视频帧的全局特征向量和局部特征
向量; 根据得到的M个全局特征向量和M个局部特
征向量分别构造M个视频帧的全局相似度矩阵和
局部相似度矩阵; 根据全局相似度矩阵和局部相
似度矩阵确定待处理视频帧序列对应的时序特
征序列, 对时序特征序列进行时序增强处理, 对
增强处理后的时序特征序列进行处理, 确定每一
个视频帧的场景分割点检测结果。 通过该方法可
以提高视频场景分割的准确率。
权利要求书3页 说明书16页 附图6页
CN 115115981 A
2022.09.27
CN 115115981 A
1.一种数据处 理方法, 其特 征在于, 所述方法包括:
获取目标视频的待处理视频帧序列, 所述待处理视频帧序列包括M个视频帧, M为大于1
的正整数;
对所述M个视频帧中的每一个视频帧进行全局特征提取和局部特征提取, 得到所述每
一个视频帧的全局特 征向量和 局部特征向量;
根据得到的M个全局特征向量, 构造所述M个视频帧的全局相似度矩阵, 根据 得到的M个
局部特征向量, 构造所述M个视频帧的局部相似度矩阵;
根据所述全局相似度矩阵和所述局部相似度矩阵确定所述待处理视频帧序列对应的
时序特征序列, 对所述时序特 征序列进行时序增强处 理, 得到增强处 理后的时序特 征序列;
对所述增强处理后的时序特征序列进行处理, 确定所述M个视频帧中的每一个视频帧
的场景分割点检测结果。
2.根据权利要求1所述的方法, 其特征在于, 所述根据所述全局相似度矩阵和所述局部
相似度矩阵确定所述待处 理视频帧序列对应的时序特 征序列, 包括:
将所述全局相似度矩阵和所述局部相似度矩阵进行拼接处 理, 得到拼接相似度矩阵;
利用帧间相似度处理网络对所述拼接相似度矩阵进行处理, 得到时序 特征序列; 其中,
所述时序特征序列包括M个时序特征, 每一个时序特征对应所述M个视频帧中的一个视频
帧。
3.根据权利要求2所述的方法, 其特征在于, 所述根据 得到的M个全局特征向量, 构造所
述M个视频帧的全局相似度矩阵, 包括:
计算第一全局特征向量和第 二全局特征向量之间的余弦距离和欧式距离, 所述第 一全
局特征向量为所述M个全局特征向量中的任意一个, 所述第二全局特征向量为所述M个全局
特征向量中的任意 一个;
根据计算得到的全局特征向量之间的余弦距离, 确定第一全局相似度矩阵, 根据计算
得到的全局特征向量之间的欧式距离, 确定第二全局相似度矩阵, 将所述第一全局相似度
矩阵和所述第二全局相似度矩阵确定为所述M个视频帧的全局相似度矩阵;
其中, 所述根据得到的M个局部特征向量, 构造所述M个视频帧的局部相似度矩阵, 包
括:
计算第一局部特征向量和第 二局部特征向量之间的余弦距离和欧式距离, 所述第 一局
部特征向量为所述M个局部特征向量中的任意一个, 所述第二局部特征向量为所述M个局部
特征向量中的任意 一个;
根据计算得到的局部特征向量之间的余弦距离, 确定第一局部相似度矩阵, 根据计算
得到的局部特征向量之间的欧式距离, 确定第二局部相似度矩阵, 将所述第一局部相似度
矩阵和所述第二局部相似度矩阵确定为所述M个视频帧的局部相似度矩阵。
4.根据权利要求3所述的方法, 其特征在于, 所述将所述全局相似度矩阵和所述局部相
似度矩阵进行拼接处 理, 得到拼接相似度矩阵, 包括:
将所述第一全局相似度矩阵、 所述第二全局相似度矩阵、 所述第一局部相似度矩阵以
及所述第二局部相似度矩阵进行拼接处 理, 得到拼接相似度矩阵。
5.根据权利要求2 ‑4任一项所述的方法, 其特征在于, 所述对所述 时序特征序列进行时
序增强处 理, 得到增强处 理后的时序特 征序列, 包括:权 利 要 求 书 1/3 页
2
CN 115115981 A
2利用时序增强网络对所述 时序特征序列进行时序增强处理, 得到增强处理后的时序 特
征序列; 其中, 所述增强处理后的时序特征序列包括M个增强处理后的时序特征, 每一个增
强处理后的时序特 征对应所述M个视频帧中的一个视频帧;
所述对所述增强处理后的时序特征序列进行处理, 确定所述M个视频帧中的每一个视
频帧的场景分割点检测结果, 包括:
利用分类网络对所述增强处理后的时序特征序列进行处理, 得到所述每一个增强处理
后的时序特 征所对应的分类概 率值;
将多个分类概率值中差值在设定范围内的任意两个分类概率值进行合并处理, 并将合
并处理后得到的分类概 率值与概率阈值进行比较;
根据比较结果确定所述M个视频帧中的每一个视频帧的场景分割点检测结果。
6.根据权利要求1所述的方法, 其特征在于, 所述获取目标视频的待处理视频帧序列,
包括:
获取所述目标视频;
对所述目标视频进行等间隔抽帧处 理, 得到所述目标视频的待处 理视频帧序列。
7.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
针对所述M个视频帧中的任一视频帧, 从所述目标视频中获取所述任一视频帧的前一
视频帧;
若所述任一视频帧的场景分割点检测结果指示所述任一视频帧为场景分割点, 且所述
前一视频帧与所述任一视频帧所指示的场景不一致, 则确定所述任一视频帧为场景分割
点。
8.一种数据处 理装置, 其特 征在于, 所述装置包括:
获取单元, 用于获取目标视频的待处理视频帧序列, 所述待处理视频帧序列包括M个视
频帧, M为大于1的正整数;
处理单元, 用于:
对所述M个视频帧中的每一个视频帧进行全局特征提取和局部特征提取, 得到所述每
一个视频帧的全局特 征向量和 局部特征向量;
根据得到的M个全局特征向量, 构造所述M个视频帧的全局相似度矩阵, 根据 得到的M个
局部特征向量, 构造所述M个视频帧的局部相似度矩阵;
根据所述全局相似度矩阵和所述局部相似度矩阵确定所述待处理视频帧序列对应的
时序特征序列, 对所述时序特 征序列进行时序增强处 理, 得到增强处 理后的时序特 征序列;
对所述增强处理后的时序特征序列进行处理, 确定所述M个视频帧中的每一个视频帧
的场景分割点检测结果。
9.一种计算机设备, 其特征在于, 所述计算机设备包括输入接口和输出接口, 所述计算
机设备还 包括:
处理器, 适于实现一条或多条计算机程序; 以及,
计算机可读存储介质, 所述计算机可读存储介质存储有一条或多条计算机程序, 所述
一条或多 条计算机程序适于由所述处理器加载并执行如权利要求 1‑7任一项所述的数据处
理方法。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有一条或多权 利 要 求 书 2/3 页
3
CN 115115981 A
3
专利 数据处理方法、装置、设备、存储介质及计算机程序产品
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:31:01上传分享