文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211268922.1 (22)申请日 2022.10.17 (71)申请人 珠海普罗米修 斯视觉技术有限公司 地址 519000 广东省珠海市香洲区旅游路 168号(梅溪商业广场B座)云溪谷数字 产业园5层5 -196(集中办公区) (72)发明人 张煜 江宇骄 孙伟 邵志兢 (74)专利代理 机构 深圳紫藤知识产权代理有限 公司 44570 专利代理师 秦志权 (51)Int.Cl. G06V 20/40(2022.01) G06V 20/64(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06T 7/80(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) H04N 13/275(2018.01) H04N 13/282(2018.01) (54)发明名称 视频处理方法、 装置及计算机可读存 储介质 (57)摘要 本申请公开了一种视频处理方法、 装置及计 算机可读存储介质, 方法通过 获取目标对象多视 角同步视频, 并对多视角同步视频中每一视频帧 进行关节 点识别; 根据关节点识别结果确定每一 视频帧中的目标对象三维模型参数, 三维模型参 数包括姿态参数、 体型参数、 顶点位移数据以及 纹理数据; 基于多个视频帧以及对应的三维模型 参数构成的训练数据集训练以姿态参数为变量 的条件变分自编码器; 获取目标姿态参数, 并基 于条件变分自编码器和目标姿态参数生成驱动 视频。 该方法可以提升对视频中角色进行驱动的 效果。 权利要求书2页 说明书15页 附图2页 CN 115497029 A 2022.12.20 CN 115497029 A 1.一种视频处 理方法, 其特 征在于, 所述方法包括: 获取目标对象多视角同步视频, 并对所述多视角同步视频中每一视频帧进行关节点识 别; 根据关节点识别结果确定每一视频帧中的所述目标对象三维模型参数, 所述三维模型 参数包括姿态参数、 体型参数、 顶点 位移数据以及纹 理数据; 基于多个视频帧以及对应的三维模型参数构成的训练数据集训练以姿态参数为变量 的条件变分自编码器; 获取目标姿态参数, 并基于所述条件变分自编码器和所述目标姿态参数生成驱动视 频。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述多视角同步视频中每一视频帧 进行关节点识别, 包括: 对所述多视角同步视频的每一视角对应的视频进行切帧, 得到多帧视频帧; 对每一视频帧进行关节点检测, 得到每一视频帧的关节点识别结果。 3.根据权利要求2所述的方法, 其特征在于, 所述对每一视频帧进行关节点检测, 得到 每一视频帧的关节点识别结果, 包括: 对每一视频帧进行姿态检测, 得到每一视频帧的二维关节点数据; 对所述二维关节点数据进行三角化处 理, 得到每一视频帧的三维关节点数据; 根据所述 二维关节点数据与所述 三维关节点数据确定每一视频帧的关节点识别结果。 4.根据权利要求1所述的方法, 其特征在于, 所述根据关节点识别结果确定每一视频帧 中的所述目标对象三维模型参数, 包括: 根据每一视频帧的关节点识别结果拟合所述目标对象的三维模型, 得到所述三维模型 的体型参数和姿态参数; 将所述三维模型的顶点进行位移拟合, 得到所述 三维模型的顶点 位移数据; 根据每一视频帧确定所述三维模型的纹理数据, 并根据所述体型参数、 所述姿态参数、 所述顶点 位移数据和所述纹 理数据确定所述目标对象三维模型参数。 5.根据权利要求4所述的方法, 其特征在于, 所述将所述三维模型的顶点进行位移拟 合, 得到所述 三维模型的顶点 位移数据, 包括: 确定所述三维模型中每一顶点对应的目标关节点, 所述目标关节点为与顶点距离最近 的关节点; 计算每一顶点与对应的目标关节点之间的位移数据, 得到所述三维模型的顶点位移数 据。 6.根据权利要求1所述的方法, 其特征在于, 所述基于多个视频帧 以及对应的三维模型 参数构成的训练数据集训练以姿态参数为变量的条件变分自编码器, 包括: 将三维模型的姿态参数为输入, 得到条件变分自编码器输出的输出模型 数据; 基于所述输出模型数据与 所述三维模型参数中所述体型参数、 顶点位移数据以及纹理 数据的差异对所述条件变分自编码器的参数进行调整。 7.根据权利要求1所述的方法, 其特征在于, 所述获取目标姿态参数, 并基于所述条件 变分自编码器和所述目标姿态参数生成 驱动视频, 包括: 接收输入的目标姿态参数;权 利 要 求 书 1/2 页 2 CN 115497029 A 2将所述目标姿态参数输入至所述条件变分自编码器中, 得到 输出的目标模型 数据; 对所述目标模型 数据进行渲染, 得到多视角同步图像; 根据所述多视角同步图像生成 驱动视频。 8.一种视频处 理装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取目标对象多视角同步视频, 并对所述多视角同步视频中每一视频 帧进行关节点识别; 确定单元, 用于根据关节点识别结果确定每一视频帧中的所述目标对象三维模型参 数, 所述三维模型参数包括姿态参数、 体型参数、 顶点 位移数据以及纹 理数据; 训练单元, 用于基于多个视频帧 以及对应的三维模型参数构 成的训练数据集训练以姿 态参数为变量的条件变分自编码器; 生成单元, 用于获取目标姿态参数, 并基于所述条件变分自编码器和所述目标姿态参 数生成驱动视频。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有多条指令, 所述指令适于处理器进 行加载, 以执行权利要求 1至7中任一项 所述的视频处理方法中的步 骤。 10.一种计算机设备, 其特征在于, 包括存储器、 处理器以及存储在所述存储器中并可 以在所述处理器上运行 的计算机程序, 所述处理器执行所述计算机程序时实现权利要求1 至7中任一项所述的视频处 理方法中的步骤。 11.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 所述计算机程序/指令 被处理器执行时实现权利要求1至7中任一项所述的视频处 理方法中的步骤。权 利 要 求 书 2/2 页 3 CN 115497029 A 3
专利 视频处理方法、装置及计算机可读存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:24:34
上传分享
举报
下载
原文档
(565.1 KB)
分享
友情链接
DB61-T 1497-2021 人间充质干细胞库建设与管理规范 陕西省.pdf
JR-T 0231—2021 银行业第三方软件开发工具包(SDK)安全接入指南.pdf
GB-T 23981.2-2023 色漆和清漆 遮盖力的测定 第2部分:黑白格板法.pdf
T-CASME 668—2023 CD3-CD4-CD8-CD16+CD56-CD19-CD45检测试剂盒 流式细胞仪法-6色.pdf
NIST 关键基础设施网络安全改善框架-美国关基-v1.1-2018年 安全内参翻译版本.pdf
GB-T 33174-2016 资产管理 管理体系 GB-T 33173 应用指南.pdf
SAE_1999-01-1061_Hyundai_Modeling of Proportional Control Solenoid Valve for Automatic Transmission Using System Identification Theory.pdf
GB-T 13606-2007 土工试验仪器 岩土工程仪器 振弦式传感器通用技术条件.pdf
GB-T 22264.6-2009 安装式数字显示电测量仪表 第6部分:绝缘电阻表的特殊要求.pdf
MZ-T 120-2018 自立式辅助起床架.pdf
DB42-T 1417-2018 生态浮岛(浮床)植物种植技术规程 湖北省.pdf
GB-T 42869-2023 机械产品三维模型简化与轻量化要求.pdf
GM-T 0115-2021 信息系统密码应用测评要求.pdf
GM-T 0079-2020 可信计算平台直接匿名证明规范.pdf
DB34-T 3264-2018 公路泥岩路基施工及质量检验评定规范 安徽省.pdf
专利 一种新能源汽车用水冷板散热器碰焊定位装置.PDF
GB-T 9439-2023 灰铸铁件.pdf
DL-T 5209-2020 混凝土坝安全监测资料整编规程.pdf
GB-T 25970-2010 不燃无机复合板.pdf
GB-T 14926.22-2001 实验动物 小鼠肝炎病毒检测方法.pdf
1
/
20
评价文档
赞助2元 点击下载(565.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。