(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211163989.9
(22)申请日 2022.09.23
(71)申请人 上海哔哩哔哩科技有限公司
地址 200433 上海市杨 浦区四平路1945号
1641室
(72)发明人 陆志君
(74)专利代理 机构 北京智信禾专利代理有限公
司 11637
专利代理师 张瑞
(51)Int.Cl.
G06F 16/22(2019.01)
G06F 16/21(2019.01)
G06F 16/2458(2019.01)
(54)发明名称
用户访问数据处 理方法及装置
(57)摘要
本申请实施例提供了用户访问数据处理方
法及装置, 其中, 所述用户访问数据处理方法包
括: 获取目标业务在目标维度的用户访问数据,
将所述用户访问数据中包含的访问时间信息, 按
照目标压缩位图对应的数据结构进行压缩, 生成
对应的压缩结果并存储, 基于预设数据存储模
型、 所述用户访问数据及所述压缩结果, 构建所
述访问时间信息对应的数据存储模 型, 根据所述
压缩结果及所述数据存储模型, 确定所述目标 维
度下目标统计指标对应的指标值统计结果。
权利要求书3页 说明书16页 附图6页
CN 115525652 A
2022.12.27
CN 115525652 A
1.一种用户访问数据处 理方法, 其特 征在于, 包括:
获取目标业 务在目标维度的用户访问数据;
将所述用户访问数据中包含的访问时间信 息, 按照目标压缩位图对应的数据 结构进行
压缩, 生成对应的压缩结果并存 储;
基于预设数据存储模型、 所述用户访 问数据及所述压缩结果, 构建所述访 问时间信息
对应的数据存 储模型;
根据所述压缩结果及所述数据存储模型, 确定所述目标维度下目标统计指标对应的指
标值统计结果。
2.根据权利要求1所述的用户访问数据处理方法, 其特征在于, 所述将所述用户访问数
据中包含的访问时间信息, 按照目标压缩位图对应的数据结构进行压缩, 生成对应的压缩
结果并存 储, 包括:
将所述用户访问数据中包含的访问时间信 息, 按照目标压缩位图对应的数据 结构进行
压缩, 生成对应的压缩结果;
通过预设加密算法对所述压缩结果进行加密处 理, 并将加密结果存 储至数据仓库。
3.根据权利要求2所述的用户访问数据处理方法, 其特征在于, 所述基于预设数据存储
模型、 所述用户访问数据及所述压缩结果, 构建所述访问时间信息对应的数据存储模型, 包
括:
确定预设数据存 储模型包含的至少两个字段;
确定与所述用户访问数据对应的第 一目标字段, 并将所述用户访问数据作为字段值添
加至所述第一目标字段;
确定与所述加密结果对应的第 二目标字段, 并将所述加密结果作为字段值添加至所述
第二目标字段, 生成所述访问时间信息对应的数据存 储模型。
4.根据权利要求2所述的用户访问数据处理方法, 其特征在于, 所述访问时间信 息包括
访问日期;
相应地, 所述将所述用户访 问数据中包含的访 问时间信息, 按照目标压缩位图对应的
数据结构进行压缩, 包括:
根据基准时间对所述用户访问数据中包含的访问日期进行转化, 生成对应的转化结
果;
将所述转化结果按照目标压缩位图对应的数据结构进行压缩。
5.根据权利要求1所述的数据处理方法, 其特征在于, 所述将所述用户访问数据中包含
的访问时间信息, 按照目标压缩位图对应的数据结构进行压缩, 生成对应的压缩结果并存
储, 包括:
按照目标压缩位图的数据结构, 将所述用户访问数据中包含的访问时间信 息转化为目
标数据类型, 其中, 所述目标 数据类型包括32位 二进制数;
对目标数据类型的所述访问时间信 息进行数据拆分, 生成第 一访问时间标识及第 二访
问时间标识, 其中, 所述第一访问时间标识及所述第二访问时间标识分别包括16位二进制
数;
基于所述第一访 问时间标识, 索引获得所述目标压缩位图中的目标桶索引号, 并将所
述第二访问时间标识存 储至所述目标桶索引号对应的容器。权 利 要 求 书 1/3 页
2
CN 115525652 A
26.根据权利要求2所述的用户访问数据处理方法, 其特征在于, 所述根据 所述压缩结果
及所述数据存 储模型, 确定所述目标维度下目标统计指标对应的指标值统计结果, 包括:
确定所述目标维度下待统计的目标统计指标, 并确定与 所述目标统计指标相关的目标
访问时间信息;
确定包含所述目标访问时间信 息的加密结果的目标数据存储模型, 并根据所述目标数
据存储模型中包 含的用户访问数据, 确定所述目标统计指标对应的指标值统计结果。
7.根据权利要求6所述的用户访问数据处理方法, 其特征在于, 所述确定与 所述目标统
计指标相关的目标访问时间信息之后, 还 包括:
获取所述数据仓库中存储的所述加密结果, 并对所述加密结果进行解密处理, 获得所
述访问时间信息的压缩结果;
根据所述压缩结果确定是否存在包含所述目标访问时间信息的加密结果的目标数据
存储模型;
若是, 则执行所述确定包含所述目标访问时间信 息的加密结果的目标数据存储模型的
步骤。
8.根据权利要求6所述的用户访问数据处理方法, 其特征在于, 所述根据 所述目标数据
存储模型中包 含的用户访问数据, 确定所述目标统计指标对应的指标值统计结果, 包括:
调用预先创建的统计函数, 对所述目标数据存储模型中包含的用户访问数据进行处
理, 生成所述目标统计指标对应的指标值统计结果。
9.根据权利要求1所述的用户访问数据处理方法, 其特征在于, 所述数据存储模型包括
第一数据存储模型及第二数据存储模型, 所述第一数据存储模型基于历史用户访问数据、
所述历史用户访问数据的历史访问时间信息的压缩结果及所述预设数据存储模型构建; 所
述第二数据存储模型基于增量用户访问数据、 所述增量用户访问数据的当前访问时间信息
的压缩结果及所述预设数据存 储模型构建;
相应地, 所述方法还 包括:
确定所述第 二数据存储模型包含的用户标识, 并在确定所述第 一数据存储模型包含所
述用户标识的情况下, 建立所述第一数据存储模型与所述第二数据存储模型间的关联关
系。
10.根据权利要求1所述的用户访问数据处理方法, 其特征在于, 所述将所述用户访问
数据中包含的访问时间信息, 按照目标压缩位图对应的数据结构进行压缩, 生成对应的压
缩结果并存 储, 包括:
将所述用户访问数据中包含的访问时间信 息, 按照目标压缩位图对应的数据 结构进行
压缩, 生成对应的压缩结果;
根据所述压缩结果确定所述访问时间信息在所述目标压缩位图中的目标位置;
根据所述压缩结果对所述目标位置对应的值进行调整, 并将调整后的目标压缩位图存
储至数据仓库。
11.根据权利要求1所述的用户访问数据处理方法, 其特征在于, 所述目标维度下的目
标统计指标包括: 目标时间区间内, 基于目标维度对所述 目标业务的业务对 象进行访问对
应的待统计指标, 所述待统计指标包括访问用户数量、 对应的访问时长和/或对象交易 量;
相应地, 所述指标值统计结果包括: 对目标时间区间内, 基于目标维度对所述目标业务权 利 要 求 书 2/3 页
3
CN 115525652 A
3
专利 用户访问数据处理方法及装置
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:12上传分享