(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211523224.1
(22)申请日 2022.12.01
(71)申请人 浙江出海云技 术有限公司
地址 314050 浙江省嘉兴 市经济技 术开发
区昌盛南路3 6号15幢6 01-2室
(72)发明人 华俊
(74)专利代理 机构 郑州知倍 通知识产权代理事
务所(普通 合伙) 41191
专利代理师 陈佳丽
(51)Int.Cl.
G06F 40/279(2020.01)
G06F 40/211(2020.01)
G06F 40/30(2020.01)
G06N 3/08(2006.01)
G06Q 30/02(2012.01)
(54)发明名称
一种基于大数据的广告引流效果分析方法
(57)摘要
本发明涉及一种基于大数据的广告引流效
果分析方法, 属于数据处理技术领域。 方法包括
以下步骤: 根据标准词向量组、 标准音频向量组、
目标向量组和音频向量组, 得到各子时间段对应
的综合向量组; 根据综合向量组和目标网络, 得
到各子时间段对应的目标广告文本信息; 根据目
标广告文本信息、 标准广告文本信息和目标网
络, 得到各目标子时间段; 根据各目标子时间段
对应的直播数据, 得到目标商品对应的引流效
果。 本发明能够依据直播视频得到相对准确的文
本信息, 然后在相对准确的文本信息的基础上也
能够较可靠的找到与 目标商品存在关联的时间
段, 进而能相对可靠的分析判断引流效果。
权利要求书4页 说明书11页 附图1页
CN 115545020 A
2022.12.30
CN 115545020 A
1.一种基于大 数据的广告引流效果分析 方法, 其特 征在于, 该 方法包括如下步骤:
获取主播对目标商 品进行讲解 时对应的直播 时间段; 获取所述直播 时间段对应的直播
数据和直播视频; 获取目标商品对应的标准广告文本信息和标准广告文本信息对应的标准
音频信息;
根据所述直播视频、 所述标准广告文本信息和所述标准音频信息, 得到所述标准广告
文本信息对应的标准词向量组、 所述标准音频信息对应的标准音频向量组、 各子时间段对
应的目标向量组和各子时间段对应的音频向量组; 根据所述标准词向量组、 所述标准音频
向量组、 所述目标向量组和所述音频向量组, 得到各子时间段对应的综合向量组;
根据所述综合向量组和目标网络, 得到所述各子时间段对应的目标广告文本信息; 根
据所述目标广告 文本信息、 所述标准广告 文本信息和所述目标网络, 得到各目标子时间段;
根据所述各目标子时间段对应的直 播数据, 得到目标商品对应的引流效果。
2.如权利要求1所述的一种基于大数据的广告引流效果分析方法, 其特征在于, 所述根
据所述直播视频、 所述标准广告文本信息和所述标准音频信息, 得到所述标准广告文本信
息对应的标准词向量组、 所述标准音频信息对应的标准音频向量组、 各子时间段对应的目
标向量组和各子时间段对应的音频向量组的方法, 包括:
将所述标准音频信 息对应的时间长度记为标准 时间段; 对所述标准广告文本信 息进行
分词, 得到各 标准词模块和各 标准词模块对应的标准子音频信息;
获取所述各标准子音频信息对应的时间长度, 记为标准时间模块;
根据所述各 标准子音频信息, 得到各 标准子音频信息对应的标准音频向量;
根据所述各标准 时间模块对应的标准词模块, 得到各标准 时间模块对应的标准词模块
的词向量, 记为标准词向量; 根据所述标准词向量和所述标准音 频向量, 构建得到标准广告
文本信息对应的标准词向量组和标准音频信息对应的标准音频向量组;
获得所述直播时间段中各子时间段对应的各文本信息, 记为第一文本信息; 获得所述
直播时间段中各子时间段对应的音频信息, 记为第一音频信息;
对于任一子时间段对应的任一第一文本信息: 获得该第一文本信息对应的各词模块,
记为第一词模块;
获得各第一词模块对应的音频信息, 记为第一子音频信息; 将各第一子音频信息对应
的时间长度记为第一时间模块;
根据所述第一子音频信息, 得到所述第一子音频信息对应的音频向量;
根据所述各第 一时间模块对应的第 一子音频信 息, 得到所述各第 一时间模块对应的词
向量类型 数量;
判断所述各第 一时间模块对应的词向量类型数量是否大于1, 若是, 则对该第 一时间模
块对应的各词向量进 行MASK掩码处理, 记为掩码词向量; 否则, 则不对该第一时间模块对应
的词向量进行MASK掩码处 理, 记为第一词向量
将各子时间段对应的掩码词向量和第一词向量记为目标向量;
根据所述各第 一时间模块对应的目标向量和各第 一子音频信 息对应的音频向量, 构建
得到各子时间段对应的目标向量组和各子时间段对应的音频向量组; 所述任一子时间段对
应的任一第一时间模块对应一个音频向量和一个目标向量。
3.如权利要求2所述的一种基于大数据的广告引流效果分析方法, 其特征在于, 获得所权 利 要 求 书 1/4 页
2
CN 115545020 A
2述直播时间段中各子时间段的方法, 包括:
获取直播视频对应的音频信息; 根据所述直播视频对应的音频信息, 得到直播视频中
主播没有说话的时间段, 记为停顿时间段;
判断停顿时间段对应的时长是否大于预设时长阈值, 若是, 则将对应停顿时间段记为
分句时间段;
根据各分句时间段 得到直播时间段对应的各子时间段;
对于任一子时间段: 该子时间段处于两个分句时间段之间; 将时序靠前的分句时间段
记为第一分句时间段、 将时序靠后的分句时间段记为第二分句时间段; 该子时间段中的起
始时刻与第一分句时间段中的结尾时刻相 邻, 该子时间段中的结尾时刻与第二分句时间段
中的起始时刻相邻。
4.如权利要求1所述的一种基于大数据的广告引流效果分析方法, 其特征在于, 所述根
据所述标准词向量组、 所述标准音频向量组、 所述目标向量组和所述音 频向量组, 得到各子
时间段对应的综合向量组的方法, 包括:
将各子时间段对应的目标向量组和标准词向量组进行连接, 得到各子时间段对应的连
接向量组;
根据所述连接向量组中的各元素、 所述连接向量组中各元素在连接向量组中的位置以
及连接向量组中各元素 的属性, 构建得到连接 向量组中各元素对应的向量, 记为格式化向
量;
根据所述连接向量组中各元素对应的格式化向量, 得到所述连接向量组对应的格 式化
向量组, 记为该子时间段对应的格式化向量组;
根据所述标准音频向量组和所述音频向量组, 得到所述连接向量组中各元素对应的音
频向量, 记为特 征音频向量;
根据所述格式化向量组和所述连接向量组中各元素对应的特征音频向量, 构建得到各
子时间段对应的综合向量组; 所述综合向量组中的任一综合向量包含一个格式化向量和一
个特征音频向量。
5.如权利要求4所述的一种基于大数据的广告引流效果分析方法, 其特征在于, 所述将
各子时间段对应的目标向量组和标准词向量组进 行连接, 得到各子时间段对应的连接向量
组的方法, 包括:
对于任一子时间段:
在开头加上[CLS]标记向量, 按照时间的顺序依次将标准词向量组中的各标准词向量
连接在[CLS]标记向量后面, 当标准词向量组中的各标准词向量连接完成之后, 再连接
[SEP]标记向量, 再按照时间的顺序依次将该子时间段对应的目标向量组中的各目标向量
连接在[SEP]标记向量后面, 得到该子时间段对应的连接向量组。
6.如权利要求1所述的一种基于大数据的广告引流效果分析方法, 其特征在于, 所述根
据所述综合向量组和目标网络, 得到所述各子时间段对应的目标广告文本信息的方法, 包
括:
将所述综合向量组输入到目标网络中, 得到各子时间段对应的各综合向量与对应的邻
域综合向量 集合中各综合向量之间的权 重;
根据所述各综合向量与对应的邻域综合向量集合中的各综合向量之间的权重对各综权 利 要 求 书 2/4 页
3
CN 115545020 A
3
专利 一种基于大数据的广告引流效果分析方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:40上传分享