(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211048967.8
(22)申请日 2022.08.30
(71)申请人 广东工业大 学
地址 510090 广东省广州市越秀区东 风东
路729号
(72)发明人 徐国涛 陈家辉 彭翠薇 刘煜
万世成 程芳炫
(74)专利代理 机构 广州粤高专利商标代理有限
公司 44102
专利代理师 高棋
(51)Int.Cl.
G06F 16/2458(2019.01)
G06N 7/02(2006.01)
G06F 9/50(2006.01)
(54)发明名称
一种基于模糊列表缓冲区的高模糊效用项
集挖掘方法
(57)摘要
本发明公开了一种基于模糊列表缓冲区的
高模糊效用项集挖掘方法、 系统及计算机可读存
储介质, 方法包括: S1: 初始化数据挖掘运行参
数; S2: 扫描事务数据库D并根据隶属度函数R计
算单一项的模糊效用上界FUUB, 并创建初始化列
表I*; S3: 将模糊效用上界值不小于最小阈值
minUtil的单一模糊项存入初始化列表I*, 并按
照模糊效用上界值升序排序; S4: 再次扫描数据
库D, 构建评估模糊效用共现结构EFuCS、 模糊列
表缓冲区FLBuf及其辅助的概要列表SL; S5: 调用
递归搜索子程序 Search, 传入参数; S6: 输 出模糊
效用不低于最小阈值的所有高模糊效用项集
HFUIs, 完成数据挖掘。 本发明降低高模糊效用项
集挖掘算法运行时间、 降低了内存消耗。
权利要求书3页 说明书8页 附图5页
CN 115470262 A
2022.12.13
CN 115470262 A
1.一种基于模糊列表缓冲区的高模糊效用项集挖掘方法, 其特 征在于, 包括以下步骤:
S1: 初始化数据挖掘运行参数, 所述数据挖掘运行参数包括: 待挖掘的定量数据库D, 预
定义的隶属度函数R, 结果 集最小模糊效用阈值mi nUtil;
S2: 扫描事务数据库D并根据隶属度函数R计算单一项的模糊效用上界FUUB, 并创建初
始化列表I*;
S3: 将模糊效用上界值不小于最小阈值minUtil的单一模糊项存入初始化列表I*, 并按
照模糊效用上界值升序排序;
S4: 再次扫描数据库D, 构建评估模糊效用共现结构EFuCS、 模糊列表缓冲区FLBuf及其
辅助的概要列表SL;
S5: 调用递归搜索子程序Search, 传入参数, 所述参数包括: 初始前缀模糊项集
初始
化列表I*、 最小模糊效用阈值minUtil、 评估模糊效用共现结构EFuCS、 模糊列表缓冲区
FLBuf及其 概要列表SL;
S6: 输出模糊效用不低于最小阈值的所有高模糊效用项集HFUIs, 完成数据 挖掘。
2.根据权利要求1所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法, 其特
征在于, 步骤S5中调用递归搜索子程序Searc h, 包括如下步骤:
S501: 在递归搜索子程序Search中, 对于模糊项集P的一个扩展模糊项集X, 如果概要列
表SL(X)中存储的模糊项集X的模糊效用之和sumFu不小于最小阈值minUtil, 那么将模糊项
集X加入到高模糊效用项集的集 合HFUIs中;
S502: 如果模糊项集X的概要列表SL(X)中的模糊效用之和sumFu与剩余模糊效用之和
sumRfu相加结果不小于最小阈值minUtil, 那么模糊项集X的扩展模糊项集则可能是高模糊
效用项集;
S503: 对于模糊项集P的另一个扩展模糊项集Y, 其 中Y在模糊项集X之后, 找到模糊项集
Y满足: 在评估模糊效用共现结构 EFuCS中模糊项集X和Y的模糊效用上界值不小于最小阈值
minUtil;
S504: 将模糊列表缓冲区FLBuf, 概要列表SL, 模糊项集P、 X、 Y, 最小阈值minUtil作为参
数调用模糊列表缓冲区构建程序, 返回构建结果;
S505: 若构建结果返回真, 那么合并模糊项集X和Y为Pxy, 若模糊项集Pxy的概要列表SL
(Pxy)的模糊效用之和大于0, 那么将模糊项集Pxy加入模糊项集X的扩展模糊项集的集合
ExtensionsOfX中;
S506: 合并模糊项集P和X作为新的前缀模糊项集Px, 递归调用搜索子程序Search, 直到
遍历完所有的扩展模糊项集。
3.根据权利要求2所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法, 其特
征在于, 步骤S5 04所述的模糊列表缓冲区构建程序,包括以下步骤:
S5041: 在模糊列表缓冲区构建程序中, 设指针PPnt, PxPnt, PyPnt 分别为概要列表中SL
(P), SL(Px), SL(Py)的起始位置, 指针指向模糊列表缓冲区中的元组;
S5042: 设变量EAMe asure为模糊项集Px, Py的概要列表SL(Px), SL(Py)的模糊效用之和
与剩余模糊效用之和的相加结果, 设变量insertPos为概要列表SL最后一个模糊项集的起
始位置;
S5043: 如 果指针PxPnt指向的元组中Tids小于PyPnt指向的元组中 的Tids, 那么将指针权 利 要 求 书 1/3 页
2
CN 115470262 A
2PxPnt向右 移动一位, 变量EAMeasure减去PxPnt指向的元组的fus和rfus之和;
S5044: 如 果指针PxPnt指向的元组中Tids大于PyPnt指向的元组中 的Tids, 那么将指针
PyPnt向右 移动一位, 变量EAMeasure减去PyPnt指向的元组的fus和rfus之和;
S5045: 如 果指针PxPnt指向的元组中Tids等于PyPnt指向的元组中 的Tids, 并且概要列
表SL(P)不为空, 那么PPnt的指针连续向右移动, 直到PPnt移动到SL(P)的末尾或者PPnt指
向的元组中的Tids与PxPnt指向的元组中的Tids相等 为止;
S5046: 如果待插入位置insertPos超过模糊 列表缓冲区大小, 那么分配新的内存 空间,
否则回收再利用 内存空间, 模糊列表缓冲区添加新元组, 令Tids为PxPnt的Tids, fus为
PxPnt的fus加PyPnt的fus减去P Pnt的fus, rfus为PyPnt的rfus;
S5047: 插入数据后, 指针PxPnt和PyPnt同时向右 移动一位;
S5048: 当指针PxPnt 没有指向概要列表SL(Px)的末位置EndPos, 并且指针PyPnt 没有指
向概要列表SL(Py)的末位置 EndPos时, 重复执 行模糊列表缓冲区程序;
S5049: 如果变量EAMeasure小于最小阈值mi nUtil, 返回结果false;
S50410: 更新 概要列表SL(Pxy), 返回结果t rue, 结束模糊列表缓冲区构建程序。
4.根据权利要求1所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法, 其特
征在于, 模糊列表缓冲区FLBuf利用三元 组(Tids,fus,rfus)构成, Tid为数据库中的事务标
识符, fu为事务的模糊效用, rfu为事务的剩余模糊效用。
5.根据权利要求1所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法, 其特
征在于, 概要列表SL利用元组(Itemsets,StartPoss,EndPoss,sumFus,sumRfus)构成, 其
中, Itemset表示模糊项集, StartPos和EndPos分别表示模糊列表缓冲区FLBuf中对应模糊
项集的起始和结束位置, sumFu表示模糊列表缓冲区中对应模糊项集的模糊效用fus之和,
sumRfu表示模糊列表缓冲区FLBuf中对应模糊项集的剩余模糊效用rfus之和。
6.根据权利要求5所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法, 其特
征在于, 在递归搜索子程序Search检查完一个结点及其所有子孙结点后, 程序开始回溯, 此
时已经检查过的结点不再被使用, 模糊列表缓冲区FLBuf中分配用于存储该结点的内存空
间将被回收再利用, 新的潜在的模糊项集的数据直接覆盖写入被回收的内存空间, 同时更
新概要列表SL中的信息, 实现内存复用, 减少程序的内存消耗。
7.根据权利要求1所述的一种基于模糊列表缓冲区的高模糊效用项集挖掘方法, 其特
征在于, 评估模糊效用共现结构EFuCS以矩阵形式表示, 索引为模糊项集, 数值表示两个模
糊项集合并后的模糊效用上界FU UB。
8.一种基于模糊列表缓冲区的高模糊效用项集挖掘系统, 其特征在于, 该系统包括: 存
储器、 处理器, 所述存储器中包括一种基于模糊列表缓冲区的高模糊效用项集挖掘方法程
序, 所述一种基于模糊列 表缓冲区的高模糊效用项集挖掘方法程序被所述处理器执行时实
现如下步骤:
S1: 初始化数据挖掘运行参数, 所述数据挖掘运行参数包括: 待挖掘的定量数据库D, 预
定义的隶属度函数R, 结果 集最小模糊效用阈值mi nUtil;
S2: 扫描事务数据库D并根据隶属度函数R计算单一项的模糊效用上界FUUB, 并创建初
始化列表I*;
S3: 将模糊效用上界值不小于最小阈值minUtil的单一模糊项存入初始化列表I*, 并按权 利 要 求 书 2/3 页
3
CN 115470262 A
3
专利 一种基于模糊列表缓冲区的高模糊效用项集挖掘方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:11:22上传分享