(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211086406.7 (22)申请日 2022.09.06 (71)申请人 国家电网有限公司 地址 100000 北京市西城区长安 街86号 申请人 国网辽宁省电力有限公司抚顺供电 公司  东北大学 (72)发明人 李智 刘正祎 李默涵 张瑶瑶  张海 倪玉露 刘鑫蕊 裴玉杰  金银龙 王野 袁明阳 路学文  贾俊海 吴厚毅  (74)专利代理 机构 北京东方芊悦知识产权代理 事务所(普通 合伙) 11591 专利代理师 彭秀丽(51)Int.Cl. G06F 16/36(2019.01) G06F 40/279(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 5/02(2006.01) (54)发明名称 一种配电网故障辅助决策知识抽取方法及 系统 (57)摘要 本发明公开了一种配电网故障辅助决策知 识抽取方法及系统, 对整理汇总后的原始文本数 据进行向量化操作, 形成词向量集数据; 对词向 量集进行实体抽取, 并对得到的实体进行标注; 采用多分类原则将标注后的同一实体所具备的 属性关系分配到某一关系类中, 完成实体关系抽 取; 训练相邻标注实体之间的关系, 修复各实体 间的标注 误差, 并输出修复后各实体间的结构化 关联关系; 根据原始文本数据与修复后各实体间 的结构化关联关系的误差范围, 对知识抽取结果 作出评价; 系统包 括数据预处理模块、 Bi ‑LSTM模 块、 权重关联模型、 误差修正模块及模型评估模 块。 本发明方法及系统实现对配电网故障处理文 本的知识抽取, 更贴近原始语义, 有助于优化知 识抽取过程。 权利要求书4页 说明书13页 附图7页 CN 115438190 A 2022.12.06 CN 115438190 A 1.一种配电网故障辅助决策知识抽取 方法, 其特 征在于, 对获得原 始文本数据进行向量 化操作, 形成保留原 始语义的词向量 集; 对所述词向量 集进行实体抽取, 并对得到的实体进行 标注; 采用多分类原则将标注后的同一实体所具备的属性关系分配到某一关系类中, 完成实 体的多种属性关系标注; 训练相邻标注实体之间的关系, 修复各实体间的标注误差, 并输出修复后各实体间的 结构化关联关系; 根据所述原始文本数据与修复后各实体间的结构化关联关系的误差范围, 对知识抽取 结果作出评价。 2.根据权利要求1所述的配电网故障辅助决策知识抽取方法, 其特征在于, 对获得原始 文本数据进 行向量化操作, 形成保留原始语义的词向量集, 包括: 对输入的原始文本数据中 的非文本数据采用人工操作或利用文字转换软件将其整理汇总为文本数据; 利用  Python  代码以标点符号为标识符将文本数据分段化, 形成分段文本数据; 利用 词向量训练工具对 分段文本数据进行向量化操作, 经多次循环后汇总到一个数据集中, 形成能够保留原始语 义的词向量 集。 3.根据权利要求2所述的配电网故障辅助决策知识抽取方法, 其特征在于, 所述非文本 数据包括操作规程、 处置预案、 调度规程、 故障信息和调度指 令的表格、 图片、 语音中的一种 或几种。 4.根据权利要求2所述的配电网故障辅助决策知识抽取方法, 其特征在于, 对输入的原 始文本数据中的非文本数据采用人工操作或利用文字转换软件将其整理汇总为文本数据 之后, 还包括对文本数据进行缺失值处 理、 异常值处 理、 重复值处 理和噪声过 滤处理。 5.根据权利要求4所述的配电网故障辅助决策知识抽取方法, 其特征在于, 对所述词向 量集进行实体抽取, 并对得到的实体进行 标注, 包括: 采用Bi‑LSTM 组合模型对输入的实体进行学习, 并通过LSTM网络进行实体抽 取, 采用 BIEOS 实体标注法对文本数据中抽取 出的实体做标注处 理, 具体为: LSTM 网络接收词向量集作为输入并进行学习, 包括接收门 、 丢弃门 、 结果门    以及数据记录门 ; 所述丢弃门处 理需舍弃的文本数据, 其丢弃内容所采用的公式如下: 其中: 表征时间t的接收变量; 表征前一时段 的深层结果; 是 权重; 是 的权值; 是偏置; 所述接收门 在 LSTM 网络进行单元格更新时计算需储存下来的信息, 所采用的公式 如下:权 利 要 求 书 1/4 页 2 CN 115438190 A 2其中:  是 的权重; 是 的权重; 是假设单 元状态; 是 的 权重; 是 的 权重; 和 分别表征 和 的误差量; 表征现刻网格 状态; 表征前一时段网格 状态; 表征 中参数由  Sigmoid 函数变换后的CA Vs; 表征 中参数由  Sigmoid 函数变换后的CA Vs; 表征 中参数由  tanh 函数变换后的CA Vs, CAVs为激活向 量; 所述结果门 输出 Bi‑LSTM 组合模型中抽取到的实体: 式中: 是 权重; 是 权重; 表征误差量; 表征 LSTM 网络的输出 结果; 表征 中参数由  Sigmoid 函数变换后的CA Vs。 6.根据权利要求5所述的配电网故障辅助决策知识抽取方法, 其特征在于, 通过引入权 重关联机制改善权重参数, 依据不同权重参数训练文本数据, 并筛选重点内容进行实体关 系抽取, 其具体为: 采用下述公式对输入的词向量集数据进行学习训练, 有选择性地对输入的词向量集数 据进行并行处 理: 式中:  表征非明显状态 的相对重要程度;  征某一向量   的误差量; 是权重关联模型自动分配的权 重; 表征 Bi‑LSTM网络中独立 参数的数目;权 利 要 求 书 2/4 页 3 CN 115438190 A 3

.PDF文档 专利 一种配电网故障辅助决策知识抽取方法及系统

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种配电网故障辅助决策知识抽取方法及系统 第 1 页 专利 一种配电网故障辅助决策知识抽取方法及系统 第 2 页 专利 一种配电网故障辅助决策知识抽取方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:41:15上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。