文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211086406.7 (22)申请日 2022.09.06 (71)申请人 国家电网有限公司 地址 100000 北京市西城区长安 街86号 申请人 国网辽宁省电力有限公司抚顺供电 公司 东北大学 (72)发明人 李智 刘正祎 李默涵 张瑶瑶 张海 倪玉露 刘鑫蕊 裴玉杰 金银龙 王野 袁明阳 路学文 贾俊海 吴厚毅 (74)专利代理 机构 北京东方芊悦知识产权代理 事务所(普通 合伙) 11591 专利代理师 彭秀丽(51)Int.Cl. G06F 16/36(2019.01) G06F 40/279(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 5/02(2006.01) (54)发明名称 一种配电网故障辅助决策知识抽取方法及 系统 (57)摘要 本发明公开了一种配电网故障辅助决策知 识抽取方法及系统, 对整理汇总后的原始文本数 据进行向量化操作, 形成词向量集数据; 对词向 量集进行实体抽取, 并对得到的实体进行标注; 采用多分类原则将标注后的同一实体所具备的 属性关系分配到某一关系类中, 完成实体关系抽 取; 训练相邻标注实体之间的关系, 修复各实体 间的标注 误差, 并输出修复后各实体间的结构化 关联关系; 根据原始文本数据与修复后各实体间 的结构化关联关系的误差范围, 对知识抽取结果 作出评价; 系统包 括数据预处理模块、 Bi ‑LSTM模 块、 权重关联模型、 误差修正模块及模型评估模 块。 本发明方法及系统实现对配电网故障处理文 本的知识抽取, 更贴近原始语义, 有助于优化知 识抽取过程。 权利要求书4页 说明书13页 附图7页 CN 115438190 A 2022.12.06 CN 115438190 A 1.一种配电网故障辅助决策知识抽取 方法, 其特 征在于, 对获得原 始文本数据进行向量 化操作, 形成保留原 始语义的词向量 集; 对所述词向量 集进行实体抽取, 并对得到的实体进行 标注; 采用多分类原则将标注后的同一实体所具备的属性关系分配到某一关系类中, 完成实 体的多种属性关系标注; 训练相邻标注实体之间的关系, 修复各实体间的标注误差, 并输出修复后各实体间的 结构化关联关系; 根据所述原始文本数据与修复后各实体间的结构化关联关系的误差范围, 对知识抽取 结果作出评价。 2.根据权利要求1所述的配电网故障辅助决策知识抽取方法, 其特征在于, 对获得原始 文本数据进 行向量化操作, 形成保留原始语义的词向量集, 包括: 对输入的原始文本数据中 的非文本数据采用人工操作或利用文字转换软件将其整理汇总为文本数据; 利用 Python 代码以标点符号为标识符将文本数据分段化, 形成分段文本数据; 利用 词向量训练工具对 分段文本数据进行向量化操作, 经多次循环后汇总到一个数据集中, 形成能够保留原始语 义的词向量 集。 3.根据权利要求2所述的配电网故障辅助决策知识抽取方法, 其特征在于, 所述非文本 数据包括操作规程、 处置预案、 调度规程、 故障信息和调度指 令的表格、 图片、 语音中的一种 或几种。 4.根据权利要求2所述的配电网故障辅助决策知识抽取方法, 其特征在于, 对输入的原 始文本数据中的非文本数据采用人工操作或利用文字转换软件将其整理汇总为文本数据 之后, 还包括对文本数据进行缺失值处 理、 异常值处 理、 重复值处 理和噪声过 滤处理。 5.根据权利要求4所述的配电网故障辅助决策知识抽取方法, 其特征在于, 对所述词向 量集进行实体抽取, 并对得到的实体进行 标注, 包括: 采用Bi‑LSTM 组合模型对输入的实体进行学习, 并通过LSTM网络进行实体抽 取, 采用 BIEOS 实体标注法对文本数据中抽取 出的实体做标注处 理, 具体为: LSTM 网络接收词向量集作为输入并进行学习, 包括接收门 、 丢弃门 、 结果门 以及数据记录门 ; 所述丢弃门处 理需舍弃的文本数据, 其丢弃内容所采用的公式如下: 其中: 表征时间t的接收变量; 表征前一时段 的深层结果; 是 权重; 是 的权值; 是偏置; 所述接收门 在 LSTM 网络进行单元格更新时计算需储存下来的信息, 所采用的公式 如下:权 利 要 求 书 1/4 页 2 CN 115438190 A 2其中: 是 的权重; 是 的权重; 是假设单 元状态; 是 的 权重; 是 的 权重; 和 分别表征 和 的误差量; 表征现刻网格 状态; 表征前一时段网格 状态; 表征 中参数由 Sigmoid 函数变换后的CA Vs; 表征 中参数由 Sigmoid 函数变换后的CA Vs; 表征 中参数由 tanh 函数变换后的CA Vs, CAVs为激活向 量; 所述结果门 输出 Bi‑LSTM 组合模型中抽取到的实体: 式中: 是 权重; 是 权重; 表征误差量; 表征 LSTM 网络的输出 结果; 表征 中参数由 Sigmoid 函数变换后的CA Vs。 6.根据权利要求5所述的配电网故障辅助决策知识抽取方法, 其特征在于, 通过引入权 重关联机制改善权重参数, 依据不同权重参数训练文本数据, 并筛选重点内容进行实体关 系抽取, 其具体为: 采用下述公式对输入的词向量集数据进行学习训练, 有选择性地对输入的词向量集数 据进行并行处 理: 式中: 表征非明显状态 的相对重要程度; 征某一向量 的误差量; 是权重关联模型自动分配的权 重; 表征 Bi‑LSTM网络中独立 参数的数目;权 利 要 求 书 2/4 页 3 CN 115438190 A 3
专利 一种配电网故障辅助决策知识抽取方法及系统
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-17 23:41:15
上传分享
举报
下载
原文档
(1.2 MB)
分享
友情链接
DB23-T 2979—2021 大豆对大豆拟茎点种腐病抗病性鉴定技术规程 黑龙江省.pdf
GB-T 42980-2023 智能制造 机器视觉在线检测系统 测试方法.pdf
SN-T 5476-2022 进境马属动物指定隔离检疫场建设规范.pdf
DB43-T 1903-2020 茶园有机肥替减化肥技术规程 湖南省.pdf
GB-T 37931-2019 信息安全技术 Web应用安全检测系统安全技术要求和测试评价方法.pdf
福建省数字政府改革和建设总体方案1.10.pdf
GB-T 41131-2021 科技馆展览教育服务规范.pdf
T-CSTM 00065—2019 丙烯酸催化剂.pdf
DB32-T 4013-2021 第三方社会稳定风险评估规范 江苏省.pdf
T-CAAM 016—2014 循证针灸临床实践指南:过敏性鼻炎.pdf
GB-T 22081-2016 信息技术 安全技术 信息安全控制实践指南.pdf
GB-T 24252-2019 蚕丝被.pdf
GB 29437-2012 工业冰醋酸单位产品能源消耗限额.pdf
SC-T 1077-2004 渔用配合饲料通用技术要求.pdf
GA-T 1944-2021 法庭科学 三硝基甲苯等6种有机炸药及其爆炸残留物检验 液相色谱-质谱法.pdf
绿盟 2014工控系统的安全研究与实践报告.pdf
T-ZZB 1993—2020 电梯光幕.pdf
DB14-T 2280-2021 时代云运维规范 山西省.pdf
GB-T 38702-2020 供应链安全管理体系 实施供应链安全、评估和计划的最佳实践 要求和指南.pdf
T-GZBD 9—2022 大数据安全管理规范.pdf
1
/
3
25
评价文档
赞助2元 点击下载(1.2 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。