standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210015812.8 (22)申请日 2022.01.07 (71)申请人 北京中视广信科技有限公司 地址 100038 北京市海淀区复兴 路12号43 号楼309室 (72)发明人 金璨 孙剑 麻书城  (74)专利代理 机构 北京市盛峰律师事务所 11337 代理人 席小东 (51)Int.Cl. G06F 16/41(2019.01) G06F 16/432(2019.01) G06F 16/45(2019.01) G06F 40/30(2020.01) H04N 21/2187(2011.01) (54)发明名称 一种体育赛事直播的全媒体内容智能感知 及关联的方法 (57)摘要 本发明提供一种体育赛事直播的全媒体内 容智能感知及关联的方法, 包括以下步骤: 步骤 1, 预建立内容库与内容索引库; 步骤2, 离线赛前 预筛选阶段; 步骤3, 事件提取过程; 步骤4, 初步 匹配过程; 步骤5, 事件语义扩展过程; 步骤6, 深 度语义匹配过程; 步骤7, 多模态内容输出, 作为 当前时刻的实时赛事数据的关联内容, 即时呈 现。 本发明能够实现对体育赛事直播节目的全媒 体内容智能感知及同源内容动态关联, 可以快 速、 全面准确的从全媒体内容数据库中搜索到与 当前赛事数据最为关联的关联内容, 提升体育赛 事直播效果。 权利要求书4页 说明书11页 附图3页 CN 114372159 A 2022.04.19 CN 114372159 A 1.一种体育赛事直播的全媒体内容智能感知及关联的方法, 其特征在于, 包括以下步 骤: 步骤1, 预建立内容库 与内容索引库; 所述内容库用于存 储多条原 始内容; 每条 所述原始内容具有内容 id; 所述内容索引库用于存储绑定有对应的内容id的内容索引; 其中, 每条所述内容索引 包括多个内容属性标签; 步骤2, 离线赛前 预筛选阶段: 步骤2.1, 针对当前待直播的体育赛事, 获取赛事静态数据集; 所述赛事静态数据集包 括多个赛事静态数据; 步骤2.2, 以所述赛事静态数据集中的每个赛事静态数据为检索词, 检索所述内容索引 库, 一共预筛选得到N 1条与所述赛事静态数据集相关联的内容索引, 表示为: 预筛选内容索 引 预筛选内容索引 ...,预筛选内容索引 由此形成预筛内容索引 库B0_index; 步骤3, 事 件提取过程: 步骤3.1, 针对当前待直播的体育赛事, 预定义赛事提取触发规则以及重点关注的锚点 集合; 其中, 所述 赛事提取触发规则包括多个赛事关键词; 所述锚点 集合包括多个锚点; 预定义事件层次结构; 所述事件层次结构为三层结构, 按自上向下的方向, 包括: 第一 层节点, 第二层节点和第三层节点; 其中, 所述第一层节点为根节点, 用于存储一级事件类 型; 所述第二层节 点为所述第一层节 点的子节点, 包括多种不同的二级事件类型; 所述第三 层节点为各个所述第二层节点的子节点, 用于表示二级事件类型包括的三级事件类型; 其 中, 所述三级事件类型中, 包括体育赛事 事件; 步骤3.2, 当体育赛事直播开始时, 通过体育赛事直播源实时读取到当前t时刻的实时 赛事数据; 根据步骤3.1预定义的事件层次结构, 判断所述实时赛事数据是否属于体育赛事事件 数据, 如果不是, 则结束对此实时赛事数据的处理, 继续读取下一时间段的实时赛事数据; 如果是, 则进一步判断所述实时赛事数据, 是否满足所述赛事提取触发规则, 如果不满足, 则结束对此实时赛事 数据的处理, 继续读取下一时间段的实时赛事数据; 如果满足, 则执行 步骤3.3; 步骤3.3, 采用事件抽取模型, 从所述实时赛事数据中提取得到事件, 表示为: 事件 Eventt={et1,et2,...,et11}; 其中, et1,et2,...,et11代表事件Eventt的11个事件变量; 其中: et1为一级事件类型变量; et2为二级事件类型变量; et3为三级事件类型变量; et4为赛事具体事 件类型变量; et5为对阵双方名称变量; et6为当前比分变量; et7为事件锚点变量;权 利 要 求 书 1/4 页 2 CN 114372159 A 2et8为当前球员姓名变量; et9为当前球员所在球队名称变量; et10为事件简要描述变量; et11为事件发生时间变量; 从所述实时赛事数据中提取 得到事件的提取 方法为: 按照设定顺序排列11个事件变量的组合槽位, 从第1个槽位开始, 利用槽位识别技术确 定当前槽位, 再通过对所述 实时赛事数据的分析, 得到 当前槽位的变量值, 并向当前槽位填 充相应的变量值; 然后向后移动一个槽位, 循环进行, 直到完成对第11个槽位的填充, 得到 包含11个事件变量的事件Eventt, 即为提取到的事件; 如果某个槽位相应的变量值不存在, 则为空; 其中, 事件锚点变量的提取方法为: 根据步骤3.1预定义的锚点集合, 如果存在属于锚 点集合的事件属性, 则将该事 件属性作为事 件锚点; 步骤4, 初步匹配过程: 步骤4.1, 将步骤3提取到的事件Eventt, 与步骤2得到 的预筛选内容索引 预筛 选内容索引 ...,预筛选内容索引 输入到已训练完成的逻辑回归模型进行 补步匹配, 逻辑回归模型分别计算得到事件Eventt与预筛选内容索引 的匹配得分 事件Eventt与预筛选内容索引 的匹配得分 ...,事件Eventt与预筛 选内容索引 的匹配得分 获得匹配得分最高 的前N2个预筛选内容索引, 表示为: 预筛选内容索引 预筛选 内容索引 ...,预筛选内容索引 其中, N2<N1, 由此 形成初筛内容索引库B1_ index; 步骤4.2, 由于每条预筛选内容索引均绑定有对应的内容id, 因此, 对于初筛内容索引 库B1_index中的每一条预筛选内容索引, 根据其绑定的内容id, 查找步骤1预建立的内容 库, 得到对应的初步关联内容, 将得到的N2个初步关联内容表示为: 初步关联内容 初步关联内容 ...,初步关联内容 由此形成初步关联内容 库; 步骤5, 事 件语义扩展过程: 步骤5.1, 对事件Eventt往前进行一定时间长度的回溯, 提取事件Eventt在回溯时间段 内的所有前置事件, 形成前置事件合集, 按时间序列, 依次表示为: 前置事件F_Eventt(1), 前置事件F_Eventt(2),...,前置事 件F_Eventt(n1); 其中, n1代 表前置事 件的总数量; 将n1个前置事 件按时间序列的排序, 称为语义扩展后的前置事 件合集; 步骤5.2, 判断步骤5.1得到的前置事件的总数量n1, 是否达到设定数量 阈值; 如果未达 到, 则执行步骤5.3; 如果达 到, 则执行步骤5.4; 步骤5.3, 基于体育赛事知识图谱, 对步骤5.1得到的n1个前置事件进行实体扩展得到 二次扩展后事 件合集; 采用二次扩展后事件合集更新步骤5.1得到的语义扩展后的前置事件合集; 然后执行权 利 要 求 书 2/4 页 3 CN 114372159 A 3

PDF文档 专利 一种体育赛事直播的全媒体内容智能感知及关联的方法

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种体育赛事直播的全媒体内容智能感知及关联的方法 第 1 页 专利 一种体育赛事直播的全媒体内容智能感知及关联的方法 第 2 页 专利 一种体育赛事直播的全媒体内容智能感知及关联的方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:01上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。