专利 一种用于商务直播的演示文稿生成系统及方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210918184.4 (22)申请日 2022.08.01 (71)申请人陈兵地址 200000 上海市浦东新区张杨路19 96 号 (72)发明人陈兵　 (74)专利代理机构北京沁优知识产权代理有限公司 11684 专利代理师周庆路 (51)Int.Cl. H04N 21/44(2011.01) H04N 21/435(2011.01) H04N 21/4788(2011.01) H04N 21/433(2011.01) G06V 10/82(2022.01)G06V 10/74(2022.01) (54)发明名称一种用于商务直播的演示文稿生成系统及方法 (57)摘要本发明公开了一种用于商务直播的演示文稿生成系统及方法，包括视频帧抽取模块引入若干帧原始图像；图像预处理模块对若干原始图像预处理得到采样图像；特征选取单元将若干对采样图像特征比对得到一对优选特征；下限处理单元求得最优特征；还原子单元扫掠特征基点得到最优特征的位置，将若干对比对图像还原为若干对初始图像，图像分割单元将若干对初始图像分割为若干图像块，差值计算单元计算得到初始图像中的最优图像差值；阈值比较单元将第一连续时间段中任意的初始图像保存并作为一演示文稿图像；文稿生成模块根据若干演示文稿图像生成演示文稿。本发明实现了自动截取直播过程中的演示文稿内容。权利要求书4页说明书10页附图2页 CN 115396726 A 2022.11.25 CN 115396726 A 1.一种用于商务直播的演示文稿生成系统，其特征在于：视频帧抽取模块(1)，用于引入商务直播的视频流数据，并从所述视频流数据中抽取得到若干帧原始图像；图像预处理模块(2)，连接所述视频帧抽取模块(1)，用于对若干所述原始图像依次进行图像预处理，得到相应的采样图像；图像处理模块(3)，连接所述图像预处理模块(2)，包括：特征选取单元(31)，用于将选取若干对连续两帧人像框位置不变的所述采样图像进行特征比对，处理得到一对优选特征，所述优选特征包含有若干优选特征值；下限处理单元(32)，连接所述特征选取单元(31)，用于获取得到所述优选特征所在区域内的像素点数量、所述优选特征的覆盖面积、所述优选特征所对应的色值的方差以及所述优选特征所对应的色值位置的标准差，并将所述像素点数量、所述覆盖面积、所述色值的方差以及所述色值位置的标准差带入预设的特征计算公式中得到一下限特征值，进而选取大于所述下限特征值的若干所述最优特征值中的最小值作为最优特征值，并将所述最优特征值对应的特征标记为最优特征；动作识别单元(33)，连接所述下限处理单元(32)，包括：运算子单元(331)，用于选取连续两帧人像框位置运动的所述采样图像，并识别得到一对所述采样图像中的一对所述最优特征，进而对一对所述最优特征进行卷积运算得到一对所述最优特征之间的相似度，同时计算得到一对所述最优特征随时间的变化率；第一识别子单元(332)，连接所述运算子单元(331)，用于在所述相似度大于预设的第一相似阈值且不大于预设的第二相似阈值，同时所述变化率大于预设的变化阈值时生成一人像框平移识别结果，所述第一相似阈值小于所述第二相似阈值；第二识别子单元(333)，连接所述运算子单元(331)，用于在所述相似度不大于所述第一相似度阈值并持续一预设时间段后，在所述采样图像的其余位置识别得到所述最优特征时生成一人像框切换识别结果；第三识别子单元(335)，连接所述运算子单元(331)，用于在所述相似度大于所述第一相似阈值且不大于所述第二相似阈值，同时所述变化率不大于所述变化阈值时生成一人像框缩放识别结果；还原子单元(334)，分别连接所述第一识别子单元(332)、所述第二识别子单元(433)和所述第三识别子单元(335)，用于通过扫掠特征基点分别得到生成所述人像框平移识别结果、所述人像框切换识别结果和所述人像框缩放识别结果时所述最优特征的位置，以根据相应的动作还原算法将若干对连续两帧人像框位置运动的所述采样图像还原得到若干对初始图像；图像比对模块(4)，连接所述图像处理模块(3)，包括：图像分割单元(41)，用于选取若干对所述初始图像，并选取若干分割系数将每对所述初始图像依次均匀分割为若干个图像块；差值计算单元(42)，连接所述图像分割单元(41)，用于计算得到每对所述初始图像在各相同位置处的所述图像块之间的像块差值，进而根据各所述像块差值计算得到在不同分割系数下每对所述初始图像的图像差值，最终选取各所述图像差值中的最小值作为最优图像差值；权　利　要　求　书 1/4 页 2 CN 115396726 A 2阈值比较单元(43)，连接所述差值计算单元(42)，用于将所述最优图像差值与预设的差值阈值进行比较，并在一第一连续时间段中的所述最优图像差值均小于所述差值阈值时，将所述第一连续时间段中任意一帧的所述初始图像保存并作为一张演示文稿图像；文稿生成模块(5)，连接所述图像比对模块(4)，用于根据若干张连续的所述演示文稿图像生成所述演示文稿。 2.根据权利要求1所述的用于商务直播的演示文稿生成系统，其特征在于，所述图像预处理模块(2)包括：平滑处理单元(21)，用于对各所述原始图像进行高斯平滑处理，得到相应的平滑图像；降采样单元(22)，连接所述平滑处理单元(21)，用于对各所述平滑图像进行降采样处理，得到相应的所述采样图像。 3.根据权利要求1所述的用于商务直播的演示文稿生成系统，其特征在于，所述差值计算单元(42)包括：第一计算子单元(421)，用于将连续两帧的所述初始图像中相同位置处的所述图像块的坐标带入预设的差值计算公式中，计算得到相应的所述像块差值；第二计算子单元(422)，连接所述第一计算子单元(421)，用于将各所述像块差值带入预设的图像计算公式中，计算得到相应的各所述图像差值。 4.根据权利要求3所述的用于商务直播的演示文稿生成系统，其特征在于，所述差值计算公式配置为： block_diff[j][i]＝dif f(B1(j,i),B2(j,i))， i∈[0,n ‑1],j∈[0,n ‑1]；其中， n用于表示所述分割系数； i用于表示所述图像块在所述采样图像中的横坐标； j用于表示所述图像块在所述采样图像中的纵坐标； B1(j,i)表示连续两帧中其中一帧所述采样图像中的所述图像块； B2(j,i)表示连续两帧中其余一帧所述采样图像中的所述图像块； diff()用于表示预设的差值算法； block_diff[j][i]用于表示所述像块差值。 5.根据权利要求4所述的用于商务直播的演示文稿生成系统，其特征在于：所述图像计算公式配置为：其中， candidate_dif f[n]用于表示所述图像差值。 6.根据权利要求1所述的用于商务直播的演示文稿生成系统，其特征在于：所述特征选取单元(31)包括：比对子单元(311)，用于在预设的一连续训练时间段内的若干对所述比对图像进行特征比对，得到若干对图像特征；第三计算子单元(312)，连接所述比对子单元(311)，用于计算得到每对所述图像特征之间的偏差值；统计子单元(313)，连接所述第三计算子单元(312)，用于统计每对图像特征在所述连续训练时间段内的出现次数，并根据每对图像特征的所述偏差值和所述出现次数输入预设权　利　要　求　书 2/4 页 3 CN 115396726 A 3

专利 一种用于商务直播的演示文稿生成系统及方法

专利一种用于商务直播的演示文稿生成系统及方法