(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211061449.X
(22)申请日 2022.09.01
(71)申请人 山东浪潮超高清智能科技有限公司
地址 250000 山东省济南市 市辖区自由贸
易试验区济南片区浪潮路1036号S06
楼北一层西区
(72)发明人 赵霖 刘旭 孟凡栋 刘永辉
房兰涛 谢恩鹏 丛锐
(74)专利代理 机构 济南泉城专利商标事务所
37218
专利代理师 刘德
(51)Int.Cl.
G06F 16/735(2019.01)
G06V 10/74(2022.01)
G06Q 30/06(2012.01)
(54)发明名称
一种隐式的视频推荐算法
(57)摘要
一种隐式的视频推荐算法, 通过计算用户观
看视频的时长占视频总时长的比例, 然后对数据
分散情况资料进行统计, 将此数据作为参数, 建
立用户与视频的数据透视表, 然后计算余弦相似
度, 排序后将相似度最高的视频进行推荐, 根据
训练的结果准确率, 召回率, 来动态调节数据划
分时的比例, 以达到优化最终的推荐结果的目
的。 通过深入挖掘用户与视频的关系来推荐, 这
样可以解决长尾商品推荐不到的问题和数据稀
疏的问题, 而且此算法时间复杂度低, 运算速度
快。
权利要求书1页 说明书4页 附图1页
CN 115422396 A
2022.12.02
CN 115422396 A
1.一种隐式的视频推荐算法, 其特 征在于, 包括如下步骤:
a)计算用户观看视频的时长占视频总时长的比例;
b)汇总所有用户观看视频的时长占视频总时长的比例值, 将所有比例值由大到小排列
并分成四等份;
c)建立用户与视频的数据透 视表;
d)计算视频之间的余弦相似度;
e)设置相似度系数, 将余弦相似度大于相似度系数的视频放入推荐列表;
f)将推荐列表给用户推荐后, 得到该用户反馈的真实数据, 统计准确率和召回率;
g)调整比例值划分的比例及相似度系数, 重复执 行步骤b)至步骤f)O次。
2.根据权利要求1所述的隐式的视频推荐算法, 其特征在于, 步骤a)中通过公式: 比例
=用户观看视频的时长 /视频总时长计算得到比例值。
3.根据权利要求1所述的隐式的视频推荐算法, 其特征在于: 步骤b)中所有比例值由大
到小排列并分成四等份时处于第一分割点位置的数值定义为上四分位数Q3, 处于第二分割
点位置的数值定义为中位数, 处于第三分割点位置上的数值定义为下四分位数Q1, 四分位
距为IQR, IQR=Q3 ‑Q1, 上内限为Q3+1.5IQR, 下内限为Q1 ‑1.5IQR, 上外限为Q3+3IQR, 下外限
为Q1‑3IQR。
4.根据权利要求3所述的隐式的视频推荐算法, 其特征在于: 步骤c)中所述用户与视频
的数据透视表每行的最左侧端为视频ID, 每列的最上端为用户ID, 用户与视频的数据透视
表中数值为用户对此视频的喜好度值, 喜好度值为1、 2、 3、 4、 5, 上内限到上四分位数的数值
定义为喜好度值为5, 上四分位数到中位数的数值定义为喜好度值为4, 中位数到下四分位
数的数值定义为喜好度值为3, 下四分位数到下内限的数值定义为喜好度值为2, 下内限到
下外限的数值定义 为喜好度值 为1。
5.根据权利要求4所述的隐式的视频推荐算法, 其特征在于: 步骤d)中通过公式
计算得到视频之间的余弦相似度Sim, 式中VpAi为第
i个用户对第p个视频的喜好度 值, n为用户总数, p={1,2,...,m}, m为视频总数, VqAi为第i
个用户对第q个视频的喜好度值, q={1,2,...,m}, 将所有的余弦相似度Sim组成视频相似
度矩阵。
6.根据权利要求1所述的隐式的视频推荐算法, 其特征在于: 步骤e)中相似度系数为
0.8, 将余弦相似度大于相似度系数的视频放入推荐列表后对推荐列表进 行去重操作, 删除
该用户已经看过的视频。
7.根据权利要求1所述的隐式的视频推荐算法, 其特征在于: 步骤f)中准确率为推荐列
表中的与真实数据相同的数据与推荐 数据的比值, 召回率为与真实数据相同的数据与真实
数据的比值。
8.根据权利要求1所述的隐式的视频推荐算法, 其特 征在于: O的取值 为5。权 利 要 求 书 1/1 页
2
CN 115422396 A
2一种隐式的视频推荐算法
技术领域
[0001]本发明涉及视频点 播推荐领域, 具体涉及一种隐式的视频推荐算法。
背景技术
[0002]随着互联 网和信息技术的发展, 人们逐渐从信息匮乏的时代走入了信息过载的时
代, 在这个时代, 无论信息生产者还是信息消费者都遇到了很大的挑战, 作为信息消费者,
如何从大量信息中挑出自己感兴趣的信息是一件非常困难的事情, 作为信息生产者, 如何
让自己的信息脱颖而 出, 受到广大用户的关注, 也是一件非常 困难的事情。 推荐系统就是解
决这一矛盾的工具。
[0003]近些年个性化推荐系统通过分析大量用户行为日志, 给不同用户提供不同的个性
化页面展示, 来 提高网站的点击率和转 化率, 在电影和视频 领域取得广泛的应用。
[0004]现有的推荐算法如协同过滤的泛化能力比较差, 无法将两个物品相似这一信息推
广到其他物品的相似度计算上。 这就导致了一个严重的问题, 热门物品具有很强的头部效
应, 容易跟大量的商品产生相似度, 而长尾商品, 由于其特征向量稀疏, 很少与其他物品产
生相似度, 导致被推荐的可能性很小。 但是去发掘长尾商品, 增加长尾被推荐的可能性却是
推荐系统最重要的目标之一。 这其实也可以被视为是协同过滤的天然缺陷, 本身无论是基
于用户还是基于商品, 协同过滤对稀疏向量的处理本身就很弱, 所以头部效应才会这么明
显。
[0005]当用户仅对数据库中可用的项目中的一小部分进行评分时, 就会导致数据稀疏性
问题。 数据规模越大, 一般而言越稀疏。 因为计算通常随着用户和项目的数量线性增长。 当
数据集的量有限时, 推荐技术是有效可行的, 但当数据集的量增加时, 生成推荐的量就不太
好。 Svd算法的计算代价很大, 时间复杂度是3次方, 空间复杂度是2次方, 并且数据转换难以
理解。
发明内容
[0006]本发明为了克服以上技术的不足, 提供了一种算法时间复杂度低、 运算速度快的
隐式的视频推荐算法。
[0007]本发明克服 其技术问题所采用的技 术方案是:
[0008]一种隐式的视频推荐算法, 包括如下步骤:
[0009]a)计算用户观看视频的时长占视频总时长的比例;
[0010]b)汇总所有用户观看视频的时长占视频总时长的比例值, 将所有比例值由大到小
排列并分成四等份;
[0011]c)建立用户与视频的数据透 视表;
[0012]d)计算视频之间的余弦相似度;
[0013]e)设置相似度系数, 将余弦相似度大于相似度系数的视频放入推荐列表;
[0014]f)将推荐列表给用户推荐后, 得到该用户反馈的真实数据, 统计准确率和召回率;说 明 书 1/4 页
3
CN 115422396 A
3
专利 一种隐式的视频推荐算法
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:31:24上传分享