(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211021285.8 (22)申请日 2022.08.24 (71)申请人 国网山西省电力公司物资 分公司 地址 030001 山西省太原市杏 花岭区南肖 墙12号北办公楼 (72)发明人 刘星廷 宁克 侯滨 王海旗  王欣伟  (74)专利代理 机构 上海海贝律师事务所 313 01 专利代理师 朱震林 (51)Int.Cl. G06Q 10/06(2012.01) G06F 16/36(2019.01) G06F 16/38(2019.01) G06Q 50/06(2012.01) (54)发明名称 一种物资检测关键参数关联分析方法 (57)摘要 本发明涉及电网物资质量检测技术领域, 具 体地说是一种物资检测关键参数关联分析方法, 基于Apriori算法的不合格检测项目关联规则 挖 掘方法筛选出核心关键检测项目, 保留最重要的 检测项目, 通过基于图数据库、 关联规则的分析 结果、 以及检测项目的不合格原因的归纳, 构建 物资设备检测管理知识图谱, 以便于知识查询和 问题问诊, 提升物资质量检测保障体系, 严把质 量关, 支撑国网公司物资采购降本增 效、 设备健 康运行, 在兼顾可靠性的基础上, 不断提升公司 采购的先进 性、 合理性, 降低电网整体运行成本, 实现电力资产可靠性和经济性的综合优化, 充分 发挥电网物资质量检测为电力建设和运维保驾 护航的作用。 权利要求书2页 说明书6页 附图3页 CN 115392704 A 2022.11.25 CN 115392704 A 1.一种物资检测关键参数关联分析 方法, 其特 征在于, 包括: 一、 基于Apri ori算法的不 合格检测项目关联规则挖掘方法的步骤: S1, 输入历年不合格检测项目的数据集, 并设置最小支持度和最小置信度阈值, 所述数 据集包括物资设备名称、 设备序列号和不合格检测项目, 设有N个事务集构成的事务数据集 D={T1, T2,…, TN}, 将所述事务数据集D中的第j个事务集定义为Tj, 其中j=1, 2, …, N; 构成 每个所述Tj的元素称为事务集的项集Ik, 其中k=1, 2, …, p, I={I1, I2,…, Ip}为数据集D中 所有不同的项组成的集合, 所述事务集中的项Ik为检测项目名称, 同一台设备所有的不合 格检测项目组成一条事务 集Tj; S2, 扫描整个所述数据集, 对每个项集Ik都计算一遍支持度, 筛选出支持度大于最小支 持度阈值的项集, 构 成频繁1项集, 记作L1, 所述项集Ik的支持度为包含项集Ik的事务数, 即 项集Ik的频率, 记为f(Ik); S3, 以所述k ‑1维频繁项集集合Lk‑1为新的样本空间, 与自身连接产生k维候选项集集 合, 记作Ck; 利用Apriori性质 “任一频繁项集的所有非空子集也必须是频繁的, 反之, 如果 某个候选的非空子集不是频繁的, 那么该候选肯定不是频繁的 ”的原则进 行剪枝, 不满足的 将其删除, 缩小Ck的范围; S4, 对剪枝后的每个k维候选项集计算其支持度, 去掉不满足最小支持度的项集, 得到 频繁项集 Lk; 支持度sup port公式为: 所述式中: A、 B为所述I中任意项组成的项集, f(A∪B)为事务数据库D中包含A∪B的比 例, |D|为事务数据库D中所有子集事务T的个数; S5, 令k=k+1, 转入步骤S3~S4 直至无法挖掘更高阶的频繁项集 为止; S6, 生成关联规则: 在挖掘出所有的频繁项集后, 进一步生成输入数据之间的关联规 则; 首先基于频繁项集生成一个包含所有可能的规则表, 再逐条校验规则表中的每一条规 则, 筛选出置信度大于 置信度阈值的关联规则; 关联规则 的置信度为所述事务数据库D中包含A的同时又包含B的比例, 即条件概 率P(B|A), 置信度co nfidence的计算公式为: 所述式中: A、 B为所述I中任意项组成的项集, f(A∪B)为事务数据库D中包含A∪B的比 例, f(A)为事物数据D中包 含项集A的比例; 二、 基于图数据库技 术构建物资 设备检测管理知识图谱的步骤: S10, 概念集定义: 明确物资设备检测管理知识图谱的设计需求后, 通过对物资设备领 域相关知识进行研究和分析, 总 结物资设备 的重要术语及概念, 并对物资设备 的检测报告 等非结构化及半结构化数据进行归纳整理; 在明确 概念划分体系的前提下, 对物资设备知 识体系及知识点之间的关联关系进行准确描述, 修正有歧义、 易混淆的术语, 形成精准完善 的物资设备核心概念集; S20, 实体及其属性抽取: 实体抽取旨在从物资设备检测分析语料中抽取出表示实体的权 利 要 求 书 1/2 页 2 CN 115392704 A 2词以及实体的属性以及属性值, 并对其进行词性标注, 使用三元组词表: 实体, 属性, 属性 值, 描述实体的属性及其属性值; 物资设备检测管理知识图谱以图模 型进行表示, 实体抽取 产生的是节点, 在进行实体定义时, 应考虑在冗余程度最低的条件下满足应用及可视化展 现; S30, 关系抽取: 关系抽取旨在从物资设备检测分析语料中抽取出实体之间的语义关 系, 阐述了各实体间的关联, 是提供查询功能以及可视化展现必不可少的一个步骤; 关系一 般以三元组的形式表 示, 即实体1、 关系、 实体2或实体、 关系、 属性, 实体与属性为节 点, 关系 为连接两节点的有向边, 所述三元组通过实体或属 性及其之间的关系进行连结, 构成了具 有网状结构的知识图谱; S40, 知识图谱构建: 在Neo4j图数据库中以图节点和 关系边对物资设备检测知识图谱 进行存储和管理, 所述Neo4j是一种高性能的NoSQL图数据库, 能够将结构化数据存储在拓 扑图上, 实现对 大量数据的集中管理, 其属性图模 型由节点Node和关系Relationship组成, 节点存储实体Entity信息, 各节点以其间的关系进行链接, 节点与关系的属性Property和 标签Label以键值对key ‑value的形式进行存 储; S50, 知识图谱展示与查询: 根据所收集的物资设备检测分析语料, 经过实体、 关系抽取 及知识存储, 实现了知识图谱的构建; Neo4j图数据库通过查询语 言清晰地展现物资设备检 测知识图谱相关实体及其关系, 所述 实体按属性类型分别存储, 便于对各类实体进 行维护; 同时, 所述存储结构 便于对知识图谱内容进 行扩展, 若有新的设备检测分析语料, 只需在图 数据库中建立相 应的实体及关系属 性即可, 整个数据库的存储架构不会 改变, 便于进行知 识更新。权 利 要 求 书 2/2 页 3 CN 115392704 A 3

.PDF文档 专利 一种物资检测关键参数关联分析方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种物资检测关键参数关联分析方法 第 1 页 专利 一种物资检测关键参数关联分析方法 第 2 页 专利 一种物资检测关键参数关联分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:40:13上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。