(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210015812.8
(22)申请日 2022.01.07
(71)申请人 北京中视广信科技有限公司
地址 100038 北京市海淀区复兴 路12号43
号楼309室
(72)发明人 金璨 孙剑 麻书城
(74)专利代理 机构 北京市盛峰律师事务所
11337
代理人 席小东
(51)Int.Cl.
G06F 16/41(2019.01)
G06F 16/432(2019.01)
G06F 16/45(2019.01)
G06F 40/30(2020.01)
H04N 21/2187(2011.01)
(54)发明名称
一种体育赛事直播的全媒体内容智能感知
及关联的方法
(57)摘要
本发明提供一种体育赛事直播的全媒体内
容智能感知及关联的方法, 包括以下步骤: 步骤
1, 预建立内容库与内容索引库; 步骤2, 离线赛前
预筛选阶段; 步骤3, 事件提取过程; 步骤4, 初步
匹配过程; 步骤5, 事件语义扩展过程; 步骤6, 深
度语义匹配过程; 步骤7, 多模态内容输出, 作为
当前时刻的实时赛事数据的关联内容, 即时呈
现。 本发明能够实现对体育赛事直播节目的全媒
体内容智能感知及同源内容动态关联, 可以快
速、 全面准确的从全媒体内容数据库中搜索到与
当前赛事数据最为关联的关联内容, 提升体育赛
事直播效果。
权利要求书4页 说明书11页 附图3页
CN 114372159 A
2022.04.19
CN 114372159 A
1.一种体育赛事直播的全媒体内容智能感知及关联的方法, 其特征在于, 包括以下步
骤:
步骤1, 预建立内容库 与内容索引库;
所述内容库用于存 储多条原 始内容; 每条 所述原始内容具有内容 id;
所述内容索引库用于存储绑定有对应的内容id的内容索引; 其中, 每条所述内容索引
包括多个内容属性标签;
步骤2, 离线赛前 预筛选阶段:
步骤2.1, 针对当前待直播的体育赛事, 获取赛事静态数据集; 所述赛事静态数据集包
括多个赛事静态数据;
步骤2.2, 以所述赛事静态数据集中的每个赛事静态数据为检索词, 检索所述内容索引
库, 一共预筛选得到N 1条与所述赛事静态数据集相关联的内容索引, 表示为: 预筛选内容索
引
预筛选内容索引
...,预筛选内容索引
由此形成预筛内容索引
库B0_index;
步骤3, 事 件提取过程:
步骤3.1, 针对当前待直播的体育赛事, 预定义赛事提取触发规则以及重点关注的锚点
集合; 其中, 所述 赛事提取触发规则包括多个赛事关键词; 所述锚点 集合包括多个锚点;
预定义事件层次结构; 所述事件层次结构为三层结构, 按自上向下的方向, 包括: 第一
层节点, 第二层节点和第三层节点; 其中, 所述第一层节点为根节点, 用于存储一级事件类
型; 所述第二层节 点为所述第一层节 点的子节点, 包括多种不同的二级事件类型; 所述第三
层节点为各个所述第二层节点的子节点, 用于表示二级事件类型包括的三级事件类型; 其
中, 所述三级事件类型中, 包括体育赛事 事件;
步骤3.2, 当体育赛事直播开始时, 通过体育赛事直播源实时读取到当前t时刻的实时
赛事数据;
根据步骤3.1预定义的事件层次结构, 判断所述实时赛事数据是否属于体育赛事事件
数据, 如果不是, 则结束对此实时赛事数据的处理, 继续读取下一时间段的实时赛事数据;
如果是, 则进一步判断所述实时赛事数据, 是否满足所述赛事提取触发规则, 如果不满足,
则结束对此实时赛事 数据的处理, 继续读取下一时间段的实时赛事数据; 如果满足, 则执行
步骤3.3;
步骤3.3, 采用事件抽取模型, 从所述实时赛事数据中提取得到事件, 表示为: 事件
Eventt={et1,et2,...,et11}; 其中, et1,et2,...,et11代表事件Eventt的11个事件变量;
其中:
et1为一级事件类型变量;
et2为二级事件类型变量;
et3为三级事件类型变量;
et4为赛事具体事 件类型变量;
et5为对阵双方名称变量;
et6为当前比分变量;
et7为事件锚点变量;权 利 要 求 书 1/4 页
2
CN 114372159 A
2et8为当前球员姓名变量;
et9为当前球员所在球队名称变量;
et10为事件简要描述变量;
et11为事件发生时间变量;
从所述实时赛事数据中提取 得到事件的提取 方法为:
按照设定顺序排列11个事件变量的组合槽位, 从第1个槽位开始, 利用槽位识别技术确
定当前槽位, 再通过对所述 实时赛事数据的分析, 得到 当前槽位的变量值, 并向当前槽位填
充相应的变量值; 然后向后移动一个槽位, 循环进行, 直到完成对第11个槽位的填充, 得到
包含11个事件变量的事件Eventt, 即为提取到的事件; 如果某个槽位相应的变量值不存在,
则为空;
其中, 事件锚点变量的提取方法为: 根据步骤3.1预定义的锚点集合, 如果存在属于锚
点集合的事件属性, 则将该事 件属性作为事 件锚点;
步骤4, 初步匹配过程:
步骤4.1, 将步骤3提取到的事件Eventt, 与步骤2得到 的预筛选内容索引
预筛
选内容索引
...,预筛选内容索引
输入到已训练完成的逻辑回归模型进行
补步匹配, 逻辑回归模型分别计算得到事件Eventt与预筛选内容索引
的匹配得分
事件Eventt与预筛选内容索引
的匹配得分
...,事件Eventt与预筛
选内容索引
的匹配得分
获得匹配得分最高 的前N2个预筛选内容索引, 表示为: 预筛选内容索引
预筛选
内容索引
...,预筛选内容索引
其中, N2<N1, 由此 形成初筛内容索引库B1_
index;
步骤4.2, 由于每条预筛选内容索引均绑定有对应的内容id, 因此, 对于初筛内容索引
库B1_index中的每一条预筛选内容索引, 根据其绑定的内容id, 查找步骤1预建立的内容
库, 得到对应的初步关联内容, 将得到的N2个初步关联内容表示为: 初步关联内容
初步关联内容
...,初步关联内容
由此形成初步关联内容
库;
步骤5, 事 件语义扩展过程:
步骤5.1, 对事件Eventt往前进行一定时间长度的回溯, 提取事件Eventt在回溯时间段
内的所有前置事件, 形成前置事件合集, 按时间序列, 依次表示为: 前置事件F_Eventt(1),
前置事件F_Eventt(2),...,前置事 件F_Eventt(n1); 其中, n1代 表前置事 件的总数量;
将n1个前置事 件按时间序列的排序, 称为语义扩展后的前置事 件合集;
步骤5.2, 判断步骤5.1得到的前置事件的总数量n1, 是否达到设定数量 阈值; 如果未达
到, 则执行步骤5.3; 如果达 到, 则执行步骤5.4;
步骤5.3, 基于体育赛事知识图谱, 对步骤5.1得到的n1个前置事件进行实体扩展得到
二次扩展后事 件合集;
采用二次扩展后事件合集更新步骤5.1得到的语义扩展后的前置事件合集; 然后执行权 利 要 求 书 2/4 页
3
CN 114372159 A
3
专利 一种体育赛事直播的全媒体内容智能感知及关联的方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:01上传分享