(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211291851.7
(22)申请日 2022.10.20
(71)申请人 东北大学
地址 110819 辽宁省沈阳市和平区文化路3
号巷11号
申请人 北京奥星贝斯科技有限公司
(72)发明人 方伯阳 徐泉清 聂铁铮 王国平
申德荣 杨传辉 寇月
(74)专利代理 机构 北京君慧知识产权代理事务
所(普通合伙) 11716
专利代理师 肖鹏
(51)Int.Cl.
G06F 16/22(2019.01)
G06F 16/2458(2019.01)
G06F 16/28(2019.01)
(54)发明名称
一种数据库中的数据合并方法、 装置以及设
备
(57)摘要
本说明书实施例公开了一种数据库中的数
据合并方法、 装置以及设备。 所述数据库具有多
个数据存储层, 所述多个数据存储层具有时序顺
序。 方案包括: 检测指定的内存存储区域中存储
的数据是否达到设定阈值; 若是, 则从所述内存
存储区域中选择符合设定条件的数据, 将所述符
合设定条件的数据写入所述多个数据存储层中
时序最新的数据存储层中, 作为一个数据子集
合; 在所述时序最新的数据存储层中, 确定已存
在的各所述数据子集合的总数量和占据的总存
储空间; 根据所述总数量和所述总存储空间, 判
断是否将所述时序最新的数据存储层中的数据,
向所述多个数据存储层中时序次新的数据存储
层中合并。
权利要求书4页 说明书15页 附图5页
CN 115544014 A
2022.12.30
CN 115544014 A
1.一种数据库中的数据合并方法, 所述数据库具有多个数据存储层, 所述多个数据存
储层具有时序顺序, 所述方法包括:
检测指定的内存 存储区域中存 储的数据是否 达到设定阈值;
若是, 则从所述内存存储区域中选择符合设定条件的数据, 将所述符合设定条件的数
据写入所述多个数据存 储层中时序最 新的数据存 储层中, 作为 一个数据子集 合;
在所述时序最新的数据存储层中, 确定已存在的各所述数据子集合的总数量和占据的
总存储空间;
根据所述总数量和所述总存储空间, 判断是否将所述时序最新的数据存储层中的数
据, 向所述多个数据存 储层中时序次新的数据存 储层中合并。
2.如权利要求1所述的方法, 所述设定条件 包括: 属于冷数据;
所述从所述内存 存储区域中选择符合设定条件的数据, 具体包括:
对所述内存 存储区域中的数据进行冷热 数据区分处 理, 选择得到其中的冷数据。
3.如权利要求1所述的方法, 所述将所述符合设定条件的数据写入所述多个数据存储
层中时序最 新的数据存 储层中, 作为 一个数据子集 合, 具体包括:
根据所述符合设定条件的数据的数据量大小, 在所述多个数据存储层中时序最新的数
据存储层中, 生成一个对应的排序字符串表;
将所述符合设定条件的数据写入所述排序字符串表中, 将写入后的所述排序字符串表
作为一个数据子集 合。
4.如权利要求1所述的方法, 所述根据 所述总数量和所述总 存储空间, 判断是否将所述
时序最新的数据存储层中的数据, 向所述多个数据存储层中时序次新的数据存储层中合
并, 具体包括:
确定是以所述总数量为主要因子, 还是以所述总存储空间为主要因子, 来判断是否要
将所述时序最新的数据存储层中的数据, 向所述多个数据存储层中时序次新的数据存储层
中合并。
5.如权利要求4所述的方法, 所述确定是以所述总数量为主要因子, 还是以所述总存储
空间为主 要因子, 具体包括:
根据所述总存储空间, 计算要执行所述合并的概率值, 作为第一概率值, 所述总存储空
间与所述第一 概率值正相关;
根据所述总数量, 计算要执行所述合并的概率值, 作为第 二概率值, 所述总数量与所述
第二概率值正相关;
比较所述第一概率值与第二概率值, 若所述第一概率值较大, 则以所述总存储空间作
为主要因子, 若所述第二 概率值较大, 则以所述总数量作为主 要因子。
6.如权利要求5所述的方法, 在所述总数量增多后, 所述第 二概率值随所述总数量增长
而增长的速度, 倾向于高于所述第一 概率值随所述总存 储空间增长而增长的速度。
7.如权利要求5所述的方法, 所述根据所述总存储空间, 计算要执行所述合并的概率
值, 作为第一 概率值, 具体包括:
根据所述总存储空间、 为所述数据子集合设定的期望固定大小、 设定的小于所述总数
量的数据子集合数量的合并触发参考阈值, 计算要执行所述合并的概率值, 作为第一概率
值;权 利 要 求 书 1/4 页
2
CN 115544014 A
2其中, 所述 时序最新的数据存储层中的所述数据子集合的实际大小小于所述期望 固定
大小, 所述期望固定大小、 所述 合并触发参 考阈值与所述第一 概率值负相关; 和/或,
所述根据所述总数量, 计算要执 行所述合并的概 率值, 作为第二 概率值, 具体包括:
根据所述总数量、 所述合并触发参考阈值, 计算要执行所述合并的概率值, 作为第二概
率值;
其中, 所述 合并触发参 考阈值与所述第二 概率值负相关。
8.如权利要求 4所述的方法, 还 包括:
根据所述总存储空间、 为所述数据子集合设定的期望固定大小、 指定数据存储层对应
的时序新旧程度, 计算要 执行将所述指定数据存储层中的数据向下一个时序更旧的数据存
储层合并的概 率值, 作为第三 概率值;
其中, 所述指定数据存储层为所述多个数据存储层中, 时序最新和时序最旧的数据存
储层以外的数据存储层, 所述指定数据存储层中的数据子集合的大小为所述期望固定大
小, 所述总存储空间与所述第三概率值正相关, 所述期 望固定大小、 所述指 定数据存储层对
应的时序旧的程度与所述第三 概率值负相关。
9.如权利要求3所述的方法, 所述根据 所述符合设定条件的数据的数据量大小, 在所述
多个数据存 储层中时序最 新的数据存 储层中, 生成一个对应的排序字符串表, 具体包括:
确定所述符合设定条件的数据能够符合的融合过 滤条件;
在所述多个数据存储层中时序次新的数据存储层中获取也符合所述融合过滤条件的
另一部分数据;
将所述符合设定条件的数据和所述另一部分数据确定为过 滤条件一致性数据;
在所述多个数据存储层中时序最新的数据存储层中, 生成一个与所述过滤条件一致性
数据大小一致的排序字符串表, 用于将所述另一部 分数据反向合并至所述时序最新的数据
存储层中。
10.如权利要求9所述的方法, 所述与 所述过滤条件一致性数据大小一致的排序字符串
表的大小等于为所述数据子集 合设定的期望固定大小;
所述确定所述符合设定条件的数据能够符合设定的融合过滤条件之前, 所述方法还包
括:
根据针对所述数据库的多个历史查询 请求对应的过滤条件, 确定各所述过滤条件中包
含的共性子条件, 作为所述融合过 滤条件;
所述将所述符合设定条件的数据写入所述 排序字符串表中, 还 包括:
将所述另一部分数据从所述时序次新的数据存储层, 也写入所述排序字符串表中, 以
反向合并至所述时序最 新的数据存 储层中。
11.一种数据库中的数据合并装置, 所述数据库 具有多个数据存储层, 所述多个数据存
储层具有时序顺序, 所述装置包括:
内存数据检测模块, 检测指定的内存 存储区域中存 储的数据是否 达到设定阈值;
内存数据转存模块, 若是, 则从所述内存存储区域中选择符合设定条件的数据, 将所述
符合设定条件的数据写入所述多个数据存储层中时序最新的数据存储层中, 作为一个数据
子集合;
合并因子确定模块, 在所述时序最新的数据存储层中, 确定已存在的各所述数据子集权 利 要 求 书 2/4 页
3
CN 115544014 A
3
专利 一种数据库中的数据合并方法、装置以及设备
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:09上传分享