standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210918184.4 (22)申请日 2022.08.01 (71)申请人 陈兵 地址 200000 上海市浦东 新区张杨路19 96 号 (72)发明人 陈兵  (74)专利代理 机构 北京沁优知识产权代理有限 公司 11684 专利代理师 周庆路 (51)Int.Cl. H04N 21/44(2011.01) H04N 21/435(2011.01) H04N 21/4788(2011.01) H04N 21/433(2011.01) G06V 10/82(2022.01)G06V 10/74(2022.01) (54)发明名称 一种用于商务直播的演示文稿生成系统及 方法 (57)摘要 本发明公开了一种用于商务直播的演示文 稿生成系统及方法, 包括视频帧抽取模块引入若 干帧原始图像; 图像预处理模块对若干原始图像 预处理得到采样图像; 特征选取单元将若干对采 样图像特征比对 得到一对优选特征; 下限处理单 元求得最优 特征; 还原子单元扫掠特征基点得到 最优特征的位置, 将若干对比对图像还原为若干 对初始图像, 图像 分割单元将若干对初始图像分 割为若干图像块, 差值计算单元计算得到初始图 像中的最优图像差值; 阈值比较单元将第一连续 时间段中任意的初始 图像保存并作为一演示文 稿图像; 文稿生成模块根据若干演示文稿图像生 成演示文稿。 本发明实现了自动截 取直播过程中 的演示文稿内容。 权利要求书4页 说明书10页 附图2页 CN 115396726 A 2022.11.25 CN 115396726 A 1.一种用于商务 直播的演示文稿生成系统, 其特 征在于: 视频帧抽取模块(1), 用于引入商务直播的视频流数据, 并从所述视频流数据中抽取得 到若干帧原 始图像; 图像预处理模块(2), 连接所述视频帧抽取模块(1), 用于对若干所述原始图像依次进 行图像预处 理, 得到相应的采样图像; 图像处理模块(3), 连接所述图像预处 理模块(2), 包括: 特征选取单元(31), 用于将选取若干对连续两帧人像框位置不变的所述采样图像进行 特征比对, 处 理得到一对 优选特征, 所述优选特 征包含有若干优选特 征值; 下限处理单元(32), 连接所述特征选取单元(31), 用于获取得到所述优选特征所在区 域内的像素点数量、 所述优选特征 的覆盖面积、 所述优选特征所对应的色值的方差以及所 述优选特征所对应的色值位置的标准差, 并将所述像素点数量、 所述覆盖面积、 所述色值的 方差以及所述色值位置的标准差带入预设的特征计算 公式中得到一下限特征值, 进而选取 大于所述下限特征值的若干所述最优特征值中的最小值作为最优特征值, 并将所述最优特 征值对应的特 征标记为最优特征; 动作识别单 元(33), 连接所述下限处 理单元(32), 包括: 运算子单元(331), 用于选取连续两帧人像框位置运动的所述采样图像, 并识别得到一 对所述采样图像中的一对所述最优特征, 进而对一对所述最优特征进 行卷积运算得到一对 所述最优特征之间的相似度, 同时计算得到一对所述 最优特征随时间的变化 率; 第一识别子单元(332), 连接所述运算子单元(331), 用于在所述相似度大于预设的第 一相似阈值且不大于预设的第二相似阈值, 同时所述变化率大于预设的变化阈值时生成一 人像框平 移识别结果, 所述第一相似阈值小于所述第二相似阈值; 第二识别子单元(333), 连接所述运算子单元(331), 用于在所述相似度不大于所述第 一相似度阈值并持续一预设时间段后, 在所述采样图像的其余位置识别得到所述最优特征 时生成一人像框切换识别结果; 第三识别子单元(335), 连接所述运算子单元(331), 用于在所述相似度大于所述第一 相似阈值且不大于所述第二相似阈值, 同时所述变化率不大于所述变化阈值时生成一人像 框缩放识别结果; 还原子单元(334), 分别连接所述第一识别子单元(332)、 所述第二识别子单元(433)和 所述第三识别子单元(335), 用于通过扫掠特征基点分别得到生成所述人像框平移识别结 果、 所述人像框切换识别结果和所述人像框缩放识别结果时所述最优特征 的位置, 以根据 相应的动作还原算法将若干对连续两 帧人像框位置运动的所述采样图像还原得到若干对 初始图像; 图像比对 模块(4), 连接所述图像处 理模块(3), 包括: 图像分割单元(41), 用于选取若干对所述初始图像, 并选取若干分割系数将每对所述 初始图像依次均匀分割为若干个图像块; 差值计算单元(42), 连接所述图像分割单元(41), 用于计算得到每对所述初始图像在 各相同位置处的所述图像块之 间的像块差值, 进而根据各所述像块差值计算得到在不同分 割系数下每对所述初始图像的图像差值, 最 终选取各所述图像差值中的最小值作为最优图 像差值;权 利 要 求 书 1/4 页 2 CN 115396726 A 2阈值比较单元(43), 连接所述差值计算单元(42), 用于将所述最优图像差值与预设的 差值阈值进行比较, 并在一第一连续时间段中的所述最优图像差值均小于所述差值阈值 时, 将所述第一连续时间段中任意 一帧的所述初始图像保存并作为 一张演示文稿图像; 文稿生成模块(5), 连接所述 图像比对模块(4), 用于根据若干张连续的所述演示文稿 图像生成所述演示文稿。 2.根据权利要求1所述的用于商务直播的演示文稿生成系统, 其特征在于, 所述图像预 处理模块(2)包括: 平滑处理单元(21), 用于对各 所述原始图像进行高斯平 滑处理, 得到相应的平 滑图像; 降采样单元(22), 连接所述平滑处理单元(21), 用于对各所述平滑图像进行降采样处 理, 得到相应的所述采样图像。 3.根据权利要求1所述的用于商务直播的演示文稿生成系统, 其特征在于, 所述差值计 算单元(42)包括: 第一计算子单元(421), 用于将连续两帧的所述初始图像中相同位置处的所述 图像块 的坐标带入预设的差值计算公式 中, 计算得到相应的所述像块差值; 第二计算子单元(422), 连接所述第一计算子单元(421), 用于将各所述像块差值带入 预设的图像 计算公式 中, 计算得到相应的各 所述图像差值。 4.根据权利要求3所述的用于商务直播的演示文稿生成系统, 其特征在于, 所述差值计 算公式配置为: block_diff[j][i]=dif f(B1(j,i),B2(j,i)), i∈[0,n ‑1],j∈[0,n ‑1]; 其中, n用于表示所述分割 系数; i用于表示所述图像块在所述采样图像中的横坐标; j用于表示所述图像块在所述采样图像中的纵坐标; B1(j,i)表示连续两帧中其中一帧所述采样图像中的所述图像块; B2(j,i)表示连续两帧中其 余一帧所述采样图像中的所述图像块; diff()用于表示预设的差值 算法; block_diff[j][i]用于表示所述像块差值。 5.根据权利要求4所述的用于商务直播的演示文稿生成系统, 其特征在于: 所述图像计 算公式配置为: 其中, candidate_dif f[n]用于表示所述图像差值。 6.根据权利要求1所述的用于商务直播的演示文稿生成系统, 其特征在于: 所述特征选 取单元(31)包括: 比对子单元(311), 用于在预设的一连续训练时间段内的若干对所述比对图像进行特 征比对, 得到若干对图像特 征; 第三计算子单元(312), 连接所述比对子单元(311), 用于计算得到每对所述图像特征 之间的偏差值; 统计子单元(313), 连接所述第三计算子单元(312), 用于统计每对图像特征在所述连 续训练时间段内的出现次数, 并根据每对图像特征的所述偏差值和所述出现次数输入预设权 利 要 求 书 2/4 页 3 CN 115396726 A 3

PDF文档 专利 一种用于商务直播的演示文稿生成系统及方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于商务直播的演示文稿生成系统及方法 第 1 页 专利 一种用于商务直播的演示文稿生成系统及方法 第 2 页 专利 一种用于商务直播的演示文稿生成系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:31:49上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。