standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211172070.6 (22)申请日 2022.09.26 (71)申请人 北京信格科技有限公司 地址 100089 北京市海淀区农大南路1号院 2号楼3层办公B- 302 (72)发明人 肖云鹤 刘亚军 贺欢庆 代庆国  (74)专利代理 机构 北京细软智谷知识产权代理 有限责任公司 1 1471 专利代理师 涂凤琴 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/27(2019.01) G06F 16/2457(2019.01) G06F 16/28(2019.01) (54)发明名称 一种海量数据异步存取处理方法、 系统、 装 置和存储介质 (57)摘要 本发明涉及数据的存 取处理技术领域, 具体 涉及一种海量数据异步存取处理方法、 系统、 装 置和存储介质, 本发明根据存储 单元的分布信息 和哈希值对 数据进行分流, 并将分流信息记录到 分流数据库中并存储, 其中, 哈希值通过数据的 特征值进行哈希计算得到; 分流数据库至少包 括: 分流后的数据和数据存储单元的地址, 根据 所述哈希值查找到相应的分流数据库并获取数 据, 本发明的技术方案在存储数据时通过哈希值 的方式对数据进行分类, 并确定数据的存储位 置, 在获取数据库时, 采用哈希值的方式获取, 本 发明的方案摆脱了对于Po stgreSQL的依 赖, 对于 其他数据库本发明的方案也 适用。 权利要求书1页 说明书6页 附图1页 CN 115510063 A 2022.12.23 CN 115510063 A 1.一种海量数据异步存取处 理方法, 其特 征在于, 包括: 根据存储单元的分布信 息和哈希值对数据进行分流, 并将分流信 息记录到分流数据库 中并存储; 其中, 所述哈希值通过数据的特征值进 行哈希计算得到; 所述分流数据库至少包 括: 分流后的数据和数据存 储单元的地址; 根据所述哈希值 查找到相应的分流数据库并获取 数据。 2.根据权利要求1所述的方法, 其特征在于, 所述根据存储单元的分布信 息和哈希值对 数据进行分流并将分流信息记录 到分流数据库中并存 储, 包括: 将结构化数据和非结构化数据进行分流后, 需要将分流信息记录到分流数据库, 并由 异步线程推送至存 储单元。 3.根据权利要求2所述的方法, 其特 征在于, 所述由异步线程推送至存 储单元, 包括: 结构化数据通过异步线程推送至存 储单元集群中的Write 数据库; 或者, 非结构化数据通过异步线程推送至FIFO队列并按照分流规则存储在不同的存储 单元。 4.根据权利要求3所述的方法, 其特征在于, 所述结构化数据通过异步线程推送至存储 单元集群中的Write 数据库之后, 包括: 数据自动将Write 数据库中的内容同步至Read数据库。 5.根据权利要求3所述的方法, 其特征在于, 所述根据所述哈希值查找到相应的分流数 据库并获取 数据, 包括: 若获取的数据为结构化数据, 根据获取数据的哈希值在分流数据库的缓存集群Redis 中查找, 若 有, 则查找结束; 若无, 则在所述存 储单元集群中的Read数据库中查找; 若获取的数据为非结构化数据, 根据获取数据的哈希值在 分流数据库中找到所述数据 存储单元的地址并获取。 6.根据权利要求1 ‑5任意一项所述的方法, 其特征在于, 所述分流数据库为本地数据 库, 且为关系型 数据库。 7.一种海量数据异步存取处 理系统, 其特 征在于, 包括: 数据存储模块, 用于根据存储单元的分布信息和哈希值对数据进行分流, 并将分流信 息记录到 分流数据库中并存储; 其中, 所述哈希 值通过数据的特征值进 行哈希计算得到; 所 述分流数据库至少包括: 分流后的数据和数据存 储单元的地址; 数据获取模块, 用于根据所述哈希值 查找到相应的分流数据库并获取 数据。 8.根据权利 要求7所述的系统, 其特征在于, 所述系统的处理终端为WEB应用或作为SDK 嵌入式供第三方 软件调用。 9.一种执行海量数据异步存取处理装置, 其特征在于, 包括如权利要求1 ‑6任意一项所 述的方法。 10.一种计算机可读存 储介质, 其特 征在于, 其上存 储有可擦 写的计算机程序; 当所述计算机程序在计算机设备上运行时, 使得所述计算机设备执行如权利要求1 ‑6 任意一项所述的方法。权 利 要 求 书 1/1 页 2 CN 115510063 A 2一种海量数据异步存取处理 方法、 系统、 装 置和存储介质 技术领域 [0001]本发明涉及数据的存取处理技术领域, 具体涉及一种海量数据异步存取处理方 法、 系统、 装置和存 储介质。 背景技术 [0002]水的流动 汇成江河大海, 孕育生命, 形成大自然生态。 数据流动, 推进社会进步, 拓 展业务边界。 [0003]目前, 利用阿里云RDS  PostgreSQL, HybridDB  for PostgreSQL, 海量对象存储 OSS, 打造一个从流计算到在线业务, 再到数据分析和挖掘的业务, 发挥数据的价值, 在银 行、 证券交易、 保险公司、 游戏、 电商等机构应用广泛。 其中, 实时数据写入采用RDS   PostgreSQL, 准实时数据写入采用HybridDB  for PostgreSQL, 但此方法需要使用定制版的 PostgreSQL, 无法拓展到其他类型的数据库中使用, 若是在金融、 政府等机构中, 要求基于 原系统的应用进行改造, 改造成适用于Oracle数据库或者DB2数据库, 这个时候就没发实 现。 发明内容 [0004]有鉴于此, 本 发明的目的在于提供一种海量数据异步存取处理方法、 系统、 装置和 存储介质, 以解决现有技术中原系统依赖PostgreSQL, 在对其进行升级改造时, 无法适用于 其他数据库的技 术问题。 [0005]根据本发明实施例的第一方面, 提供一种海量数据异步存取处 理方法, 包括: [0006]根据存储单元的分布信息和哈希值对数据进行分流, 并将分流信息记录到分流数 据库中并存储; 其中, 所述哈希值通过数据的特征值进 行哈希计算得到; 所述分流数据库至 少包括: 分流后的数据和数据存 储单元的地址; [0007]根据所述哈希值 查找到相应的分流数据库并获取 数据。 [0008]优选地, 所述根据存储单元的分布信息和哈希值对数据进行分流并将分流信息记 录到分流数据库中并存 储, 包括: [0009]将结构化数据和非结构化数据进行分流后, 需要将分流信息记录到分流数据库, 并由异步线程推送至存 储单元。 [0010]优选地, 所述由异步线程推送至存 储单元, 包括: [0011]结构化数据通过异步线程推送至存 储单元集群中的Write 数据库; [0012]或者, 非结构化数据通过异步线程推送至FIFO队列并按照分流规则存储在不同的 存储单元。 [0013]优选地, 所述结构化数据通过异步线程推送至存储单元集群中的Write数据库之 后, 包括: [0014]数据自动将Write 数据库中的内容同步至Read数据库。 [0015]优选地, 所述 根据所述哈希值 查找到相应的分流数据库并获取 数据, 包括:说 明 书 1/6 页 3 CN 115510063 A 3

PDF文档 专利 一种海量数据异步存取处理方法、系统、装置和存储介质

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种海量数据异步存取处理方法、系统、装置和存储介质 第 1 页 专利 一种海量数据异步存取处理方法、系统、装置和存储介质 第 2 页 专利 一种海量数据异步存取处理方法、系统、装置和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。