(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211259313.X
(22)申请日 2022.10.14
(71)申请人 浙江理工大 学
地址 310000 浙江省杭州市经济技 术开发
区白杨街道 2号大街9 28号
(72)发明人 雷蕾 郭雪松
(74)专利代理 机构 南宁胜荣专利代理事务所
(特殊普通 合伙) 45126
专利代理师 关文龙
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于K-Means++、 BP神经网络和孤立森林的
建筑异常能耗检测方法
(57)摘要
本发明公开了基于K ‑Means++、 BP神经网络
和孤立森 林的建筑异常能耗检测方法, 包括以下
步骤, 步骤一: 通过建筑能耗检测平台收集历史
建筑能耗数据; 步骤二: 利用软件导入历史能耗
数据样本, 通过计算误差平方和指标得到最优聚
类数, 采用K ‑means++算法对历史能耗数据聚类
分析, 赋予类别标签; 步骤三: 将含有标签的历史
能耗数据对BP神经网络进行训练, 构建实时能耗
数据识别匹配机制; 步骤四: 在同类别中采用孤
立森林方法对能耗进行异常检测, 判断是否异
常; 步骤五: 输出异常检测结果, 并根据检测结果
对历史能耗数据动态更新。 本发 明可提升能耗异
常检测的准确性, 解决实用性不强及动态更新不
足问题, 降低获取含 有标签数据的成本 。
权利要求书2页 说明书6页 附图3页
CN 115496163 A
2022.12.20
CN 115496163 A
1.基于K‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测方法, 其特征在于, 包
括以下步骤:
步骤一: 通过建筑能耗检测平台收集历史建筑能耗数据;
步骤二: 利用软件导入历史能耗数据样本, 通过计算误差平方和指标得到最优聚类数,
采用K‑means++算法对历史能耗数据聚类分析, 赋予类别标签;
步骤三: 根据聚类结果, 将含有标签的历史能耗数据对BP神经网络进行训练, 构建实时
能耗数据识别匹配机制;
步骤四: 不含标签的实时能耗数据根据神经网络识别匹配到对应的类别后, 在同类别
中采用孤立森林 方法对能耗进行异常检测, 判断是否异常;
步骤五: 输出异常检测结果, 并根据检测结果对历史能耗数据动态更新。
2.根据权利要求1所述的基于K ‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测
方法, 其特 征在于, 步骤二中所述软件为Matlab软件。
3.根据权利要求1所述的基于K ‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测
方法, 其特征在于, 基于计算误差平方和方法的肘部法则作为确定最优聚类数目的依据, 其
公式如下:
其中, k为聚类数目, Ck表示为聚类结果中第k类能耗数据 集; xik为第k聚类中第i个能耗
点; μk为第k类能耗数据的质心。
4.根据权利要求1所述的基于K ‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测
方法, 其特征在于, 步骤二中所述K ‑means++聚类算法中对含有n个数据的建筑能耗数据集X
={x1,…,xn}, 随机选取第一个聚类中心点μ1, 计算数据集X中每一个能耗数据点与已选取
的聚类中心 点在m维空间中的最小欧几里德距离D, 计算每个能耗点被选为下一个聚类中心
的概率P, 重复以上步骤, 按照轮盘法选取k个聚类中心, 最小欧几里德距离D和聚类中心的
选取概率P定义如下:
初步选取聚类中心后, 计算每个能耗数据xi与每个聚类中心的欧几里德距离D, 按照最
近准则将该能耗数据划分到相应的聚类簇中, 在每个聚类中计算所有能耗数据的特征均
值, 该均值将作为 新的聚类中心, 重复以上步骤, 直到聚类中心位置不再发生变化。
5.根据权利要求1所述的基于K ‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测
方法, 其特征在于, 步骤三中通过对历史 能耗数据聚类分析后, 将具有相似特征的能耗数据
赋予了相同的能耗模式类别标签。
6.根据权利要求1所述的基于K ‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测
方法, 其特征在于, 步骤四中不含标签的实时能耗数据根据神经网络识别, 匹配到对应类别
中, 在同类别内对能耗数据采用孤立森林方法对能耗进 行异常检测, 判断是否异常, 根据检权 利 要 求 书 1/2 页
2
CN 115496163 A
2测结果对历史能耗数据实现动态更新, 保证数据集的时效性。
7.根据权利要求6所述的基于K ‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测
方法, 其特征在于, 所述孤立森林方法是通过从能耗数据集中随机挑选 m个能耗数据作为子
样本数据集T={ t1,t2···,tm}, 将其作为一颗孤立树的根节 点, 在子样 本数据集中, 随机
产生一个介于子样本数据最大值与最小值间的分割值p, 通过分割值p 对子样本数集进行划
分, 不断构建左侧分支和右侧分支, 重复上述过程, 直至达到下列条件之一停止: ①孤立树
达到高度限制值; ②子样本空间中只剩下一个能耗数据。
8.根据权利要求7所述的基于K ‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测
方法, 其特征在于, 对于任意一个能耗数据, 通过查询孤立森林所有孤立树, 计算其在每一
棵树中的路径长度h(x), 路径长度是指样本能耗从根节点到外节点所经过的二叉树的边
数, 根据下列公式, 计算该能耗的异常得分 s(x,m), 从而判断该点是否为离群点;
H(m)=ln(m)+ξ
其中, E(h(x))为在孤立森林中路径长度的期望值; H(m)为调和函数, ξ为欧拉常数; c
(m)为搜索路径长度平均值。
9.根据权利要求8所述的基于K ‑Means++、 BP神经网络和孤立森林的建筑异常能耗检测
方法, 其特 征在于, 所述s(x,m)的取值范围为[0,1]。权 利 要 求 书 2/2 页
3
CN 115496163 A
3
专利 基于K-Means++、BP神经网络和孤立森林的建筑异常能耗检测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:38上传分享