standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210137068.9 (22)申请日 2022.02.15 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 冯毅雄 陈美好 胡炳涛 洪兆溪 张志峰 谭建荣 (74)专利代理 机构 杭州求是专利事务所有限公 司 33200 专利代理师 林超 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/34(2019.01) G06F 16/35(2019.01) G06F 40/216(2020.01)G06F 40/30(2020.01) G06K 9/62(2022.01) G06Q 50/06(2012.01) (54)发明名称 基于语义识别的核电厂布置设计本体关联 可视化方法 (57)摘要 本发明公开了一种基于语义识别的核电厂 布置设计本体 关联可视化方法。 采集各个核电布 置设计平台的布置设计文本, 通过自然语言处理 建立核电领域特征词典; 利用TextRank算法从核 电领域特征词典提取核电厂布置设计 关键词, 组 建核电厂布置设计 关键词集合; 对核电厂布置设 计关键词之间关系识别; 根据核电厂布置设计关 键词和关系识别结果, 对布置设计文本对应的核 电厂布置设计本体 关联建模, 最后进行布置关系 的可视化。 本发明方法, 针对核电厂布置设计中 布置关系的自身特点, 基于语义识别的方法实现 核电厂布置设计中布置关系多源非结构化数据 的布置设计文本预处理、 布置设计关键词提取、 关键词之间关系识别, 实现布置设计本体可视化 表示。 权利要求书3页 说明书9页 附图2页 CN 114647712 A 2022.06.21 CN 114647712 A 1.一种基于语义识别的核电厂布置设计本体关联可视化方法, 其特征在于: 所述方法 依次包括以下步骤: 步骤一: 采集各个核电布置设计平台中的文本数据作为布置设计文本, 对布置设计文 本预处理, 建立核电领域特 征词典; 步骤二: 利用TextRank算法从核电领域特征词典提取核电厂布置设计关键词, 组建核 电厂布置设计关键词集 合; 步骤三: 对核电厂布置设计关键词集合中的核电厂布置设计关键词之间关系进行识 别, 识别分为分类关系与非分类关系; 步骤四: 根据 前面步骤中抽取的核电厂布置设计关键词以及核电厂布置设计关键词间 的关系识别结果, 对布置设计文本对应的核电厂布置设计本体关联建模, 利用建模获得 的 模型进行布置关系的可视化。 2.根据权利要求1所述的一种基于语义识别的核电厂布置设计本体关联可视化方法, 其特征在于: 所述步骤一在建立词典前, 在预处理过程中采用线性链条件随机场模型对文 本数据分词。 3.根据权利要求1或2所述的一种基于语义识别的核电厂布置设计本体关联可视化方 法, 其特征在于: 所述步骤一中, 所述的预 处理中采用线性链条件随机场模型对文本数据进 行分词, 分词 过程中提取获得核电领域术语特征词与布置设计技术状态特征词, 将核电领 域术语特征词与布置设计技 术状态特 征词融合 为核电领域特 征词典。 4.根据权利要求1所述的一种基于语义识别的核电厂布置设计本体关联可视化方法, 其特征在于: 所述 步骤二中, 具体为: S2.1、 利用Text Rank算法先根据核电领域特征词典中的词与词之间的共现关系构 建词 图; 词图中, 以一个词作为节 点而形成词节点, 词节点之 间的边代表了两个词之 间的共现关 系; S2.2、 采用BERT方法对核电领域特征词典处理生成器中每个词的词向量作为布置设计 文本的词向量, 采用AP聚类算法对词向量进行相似度聚类, 获得各个簇Cj; 按照以下公式先 计算每个词节点vj的语义聚类重要度wc(vj), 进而再根据语 义聚类重要度wc(vj)得到词节点 间语义聚类重要度跳转 概率 如下式所示: 上式中, 表示词节点vj的所在簇Cj的簇聚类中心的向量; wc(vi)表示词节点vi的语义 聚类重要度, 表示词节点vj到所在簇Cj的簇聚类中心的向量, Cj表示词节点vj的所在簇; 表示词节点vj和词节点vi之间语义聚类重要度的跳转概率; Out(vj)表示所有词节点vj指 向的词节点的集 合; S2.3、 按照以下公式先计算每个词节点vj的统计重要度 ws(vj), 进而再根据统计重要度权 利 要 求 书 1/3 页 2 CN 114647712 A 2ws(vi)得到词节点间统计重要度跳转 概率 如下式所示: ws(vj)=σj×tfjg×idfj 上式中, σj表示词节点vj的词频波动程度, tfjg表示词节点vj的词频, idfj表示词节点vj 的逆文档频率; ws(vi)表示词节点vi的语义聚类重要度, 表示词节点vj和词节点vi间统计 重要度跳转 概率; S2.4、 计算语义聚类重要度跳转概率与统计重要度跳转概率的加权和获得词节点跳转 概率: α1+β1=1 其中, pji表示词节点vj和词节点vi间词节点跳转概率, α1、 β1分别为语义聚类重要度、 统 计重要度的影响比例系数; S2.5、 将词节点跳转 概率pji带入以下公式计算各个词节点的权 重WS(vi), 如下式所示: 上式中, d为阻尼系数, 表示词节点之间的指向概率; WS(vi)表示词节点vi的权重, wji是 词节点vj和词节点vi之间边的权重, In(vi)表示所有指向单词节点vi的词节点集合, Out(vj) 表示所有词节点vj指向的词节点 集合; S2.6、 各个词节点的权重WS(vi)进行排序, 排序后 取前面K个词作为词节点的核电厂布 置设计关键词, 构成核电厂布置设计关键词集 合。 5.根据权利要求1所述的一种基于语义识别的核电厂布置设计本体关联可视化方法, 其特征在于: 所述 步骤三中: S3.1、 针对步骤二获得的所有 核电厂布置设计关键词, 进行以下处 理: 以核电厂布置设计关键词集合中排序第一位的核电厂布置设计关键词作为顶级核电 厂布置设计关键词, 以顶级核电厂布置设计关键词为根节点, 基于普里姆算法Prim得到核 电厂布置设计关键词集合的最大生成树, 再根据得到的最大生成树中所有边的集合得到词 节点对集 合; S3.2、 对于词节点对集 合中的词节点对 vci和vcj, 计算每个词节点对的相似重要度: 其中, 分别表示词节点对 vci和vcj在集合中的词频向量; S3.3、 针对最大生成树中词节点对, 通过在核电知识资源库和Web资源中搜索, 将搜索 结果与预设的分类关系语言模板中的关键 字匹配, 进 而计算词节点对的关联重要度:权 利 要 求 书 2/3 页 3 CN 114647712 A 3
专利 基于语义识别的核电厂布置设计本体关联可视化方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:34
上传分享
举报
下载
原文档
(932.2 KB)
分享
友情链接
GB-T 37932-2019 信息安全技术 数据交易服务安全要求.pdf
DB14-T 2658—2023 农村公路工程技术标准 山西省.pdf
T-CASME 668—2023 CD3-CD4-CD8-CD16+CD56-CD19-CD45检测试剂盒 流式细胞仪法-6色.pdf
GB-T 40873-2021 大洋富钴结壳资源勘查规程.pdf
OWASP go语言 安全编码实践指南 中文版.pdf
GB-T 33009.3-2016工业自动化和控制系统网络安全集散控制系统(DCS)第3部分评估指南.pdf
GB-T 25360-2010 汽车加气站用往复活塞天然气压缩机.pdf
GB-T 41454-2022 实景影像数据产品质量检查与验收.pdf
专利 一种轴承质量检测装置及方法.PDF
GB-T 35347-2017 机动车安全技术检测站.pdf
GB-T 13545-2014 烧结空心砖和空心砌块.pdf
GB-T 24936-2010 全地形车 术语.pdf
Tomcat Web服务器安全配置基线.doc
GB-T 21053-2023 信息安全技术 公钥基础设施 PKI系统安全技术要求.pdf
GB-T 42555-2023 计量器具控制软件的通用要求.pdf
GB-T 28827.7-2022 信息技术服务 运行维护 第7部分:成本度量规范.pdf
YD-T 1756-2008 电信网和互联网管理安全等级保护要求.pdf
DB31-T 1244-2020 冷却塔节能降噪改造技术指南 上海市.pdf
T-BMCA 012—2023 机动车驾驶实车智能培训系统.pdf
DB37-T 3521.2-2019 政务信息资源目录 第2部分:核心元数据 山东省.pdf
1
/
15
评价文档
赞助2.5元 点击下载(932.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。