standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211183409.2 (22)申请日 2022.09.27 (71)申请人 上海品顺信息科技有限公司 地址 201100 上海市闵行区申长路158 8弄6 号903室 (72)发明人 王朋飞  (74)专利代理 机构 北京市万慧达律师事务所 11111 专利代理师 康丽丽 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/28(2019.01) G06F 16/2455(2019.01) G06F 16/27(2019.01) (54)发明名称 标签预处理方法、 装置、 计算机设备和存储 介质 (57)摘要 本申请涉及一种标签预处理方法、 装置、 计 算机设备和存储介质, 方法包括: 根据预处理标 签的任务类型配置相关数据信息; 读取相关数据 信息中的第一配置信息, 得到Aviator表达式和 预处理标签, 解析预处理标签得到原子标签, 在 本地缓存应用中建立预处理标签和原子标签之 间的键对值 关系; 基于本地 缓存应用中的键值对 关系构建用户范围查询数据库, 利用流批一体结 构化查询语言引擎进行用户范围查询, 得到用户 范围数据; 基于Av iator表达式和用户范围数据, 计算获取预处理标签的值, 根据预设的存储机制 储存预处理标签的计算值。 本申请可以解决现有 标签系统超时的问题, 降低人群标签开发的复杂 度, 极大提升了数据的处理能力, 并能够大幅提 升存储机构的存 储空间。 权利要求书2页 说明书11页 附图5页 CN 115544007 A 2022.12.30 CN 115544007 A 1.一种标签预处 理方法, 其特 征在于, 所述方法包括: 根据预处 理标签的任务类型配置相关数据信息; 读取所述相关数据信息中的第一配置信息, 得到Aviator表达式和预处理标签, 解析所 述预处理标签得到原子标签, 并在本地缓存应用中建立所述预 处理标签和所述原子标签之 间的键对值关系; 基于所述本地缓存应用中的键值对关系构建用户范围查询数据库, 利用流批一体结构 化查询语言引擎进行用户范围查询, 得到用户范围数据; 基于所述Aviator表达式和所述用户范围数据, 计算获取所述预处理标签的值, 根据预 设的存储机制储 存所述预处 理标签的计算 值。 2.根据权利要求1所述的标签预处理方法, 其特征在于, 所述相关数据信 息包括所述第 一配置信息和第二配置信息, 具体为: 所述第一配置信 息包括自助 人群管理表、 人群配置管理表和属性配置管理表, 在新增/ 修改所述第一配置信息时, 添加标签预处理选项, 在列表操作列, 添加预处理状态查看选 项; 所述第二配置信息包括 监控表, 所述 监控表的配置过程包括: 配置交互功能: 在列表上添加预设队列字段; 新增/编辑监控表, 添加预设队列项; 在列 表上添加业务抽数表名字段; 新增/编辑 监控表功能, 添加业 务抽数表名项; 初始化配置: 对接现有表的所述预设队列项, 并更新监控表记录, 更新现有记录的业务 抽数表名。 3.根据权利要求2所述的标签预处理方法, 其特征在于, 所述读取所述相关数据信 息中 的第一配置信息, 得到Av  i ator表达式和预处理标签, 解析所述预处理标签得到原子标 签, 并在本地缓存应用中建立所述预处 理标签和所述原子标签之间的键对值关系包括: 读取所述属性配置管理表作为基础数据, 读取所述自助 人群管理表和人群配置管理表 中的预处 理标签及所述预处 理标签的表达式规则; 解析所述预处 理标签的表达式规则得到原子标签; 在所述本地缓存应用中建立所述原子标签键对值对象、 建立所述原子标签与 所述预处 理标签的对应关系键对值对象、 建立所述预处 理标签的标签规则键对值对象。 4.根据权利要求1所述的标签预处理方法, 其特征在于, 所述基于所述本地缓存应用中 的键值对关系构建用户范围查询数据库, 利用流批一体结构化查询语言引擎进行用户范围 查询, 得到用户范围数据包括: 基于所述本地缓存应用中的键值对关系查询所述预处 理标签的原子标签; 通过所述原子标签查询对应的监控表 记录, 读取配置的数据仓库工具表; 基于所述原子标签的配置及所述数据仓库工具表, 构造数据仓库工具语句; 定义当前 预处理标签的状态为初始化中, 并生成用户范围查询数据库; 利用流批一体结构化查询语言引擎对所述用户范围查询数据库进行用户范围查询, 得 到所述用户范围数据。 5.根据权利要求1所述的标签预处理方法, 其特征在于, 所述基于所述Aviator表达式 和所述用户范围数据, 计算获取 所述预处 理标签的值包括: 消费增量数据消息, 根据所述原子标签的配置信息, 进行消息 筛选;权 利 要 求 书 1/2 页 2 CN 115544007 A 2根据所述原子标签的计算 规则, 读取筛 选出的消息数据并进行计算, 产生原子标签值; 从所述本地缓存应用中查询所述原子标签与预处理标签的对应关系键对值对象并与 所述原子标签值进行比对, 若所述原子标签值有变化, 则, 遍历多个所述预处 理标签。 6.根据权利要求5所述的标签预处 理方法, 其特 征在于, 还 包括: 根据所述预处理标签的原子标签, 查询非消息原子标签在所述用户范围数据中的键 值; 执行所述预处 理标签的Aviator 表达式, 生成所述预处 理标签的值。 7.根据权利要求1所述的标签预处理方法, 其特征在于, 所述根据 预设的存储机制储存 所述预处 理标签的计算 值包括: 采用压缩位图机制, 存 储所述预处 理标签的值: 将二值化的人群标签的标识符作为压缩位图的位存入位图对象中, 序列化为字符串之 后存入键值存 储数据库中。 8.一种标签预处 理装置, 其特 征在于, 所述装置包括: 信息配置模块, 用于根据预处 理标签的任务类型配置相关数据信息; 关系建立模块, 用于读取所述相关数据信息中的第一配置信息, 得到Aviator表达式和 预处理标签, 解析所述预处理标签得到原子标签, 并在本地缓存应用中建立所述预处理标 签和所述原子标签之间的键对值关系; 用户范围数据获取模块, 用于基于所述本地缓存应用中的键值对关系构建用户范围查 询数据库, 利用流批一体结构化 查询语言引擎进行用户范围查询, 得到用户范围数据; 计算存储模块, 用于基于所述Avi  ator表达式和所述用户范围数据, 计算获取所述预 处理标签的值, 根据预设的存 储机制储 存所述预处 理标签的计算 值。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所 述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115544007 A 3

PDF文档 专利 标签预处理方法、装置、计算机设备和存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 标签预处理方法、装置、计算机设备和存储介质 第 1 页 专利 标签预处理方法、装置、计算机设备和存储介质 第 2 页 专利 标签预处理方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。