standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210024050.8 (22)申请日 2022.01.11 (71)申请人 广东拓思软件科 学园有限公司 地址 510000 广东省广州市萝岗区广州经 济技术开发区科 学城彩频路1 1号 申请人 广州番禺职业 技术学院 (72)发明人 王萍 陈振宇 张晋桂 黄万民 杨鹏 孙伟松 黄静旋 吴先裕 (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 代理人 戴尧罡 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/289(2020.01)G06F 40/30(2020.01) (54)发明名称 一种缺陷报告融合方法、 装置、 电子设备及 存储介质 (57)摘要 本申请提供了一种缺陷报告融合方法、 装 置、 电子设备及存储介质, 涉及数据分析技术领 域。 首先获取多个缺陷报告, 然后依据文本内容 提取缺陷报告的实体与关联关系, 并将实体与关 联关系引用知识图谱中进行补 充, 再将知识图谱 中的实体与关联关系翻译成第一向量, 并依据第 一向量整合每个缺陷报告对应的第二向量, 再依 据第二向量确定每两个缺陷报告的相似度, 并将 相似度大于第一阈值的缺陷报告聚合为同一报 告簇, 然后依据知识图谱中的实体与关联关系对 报告簇中缺陷报告进行排序, 以确定报告簇中的 主报告, 最后提取报告簇中与主报告关联的差异 点信息与歧义点信息。 本申请具有避免了重复报 告, 降低了整编人员的工作量的优点。 权利要求书2页 说明书10页 附图8页 CN 114048293 A 2022.02.15 CN 114048293 A 1.一种缺陷报告融合方法, 其特 征在于, 所述方法包括: 获取多个缺陷报告, 其中, 所述 缺陷报告包括文本内容; 依据所述文本 内容提取所述缺陷报告的实体与关联关系, 并将所述实体与关联关系引 用知识图谱中进行补充; 将所述知识图谱中的实体与关联关系翻译成第 一向量, 并依据 所述第一向量整合每个 缺陷报告对应的第二向量; 依据所述第 二向量确定每两个缺陷报告的相似度, 并将相似度 大于第一阈值的缺陷报 告聚合为同一报告簇; 依据所述知识图谱中的实体与关联关系对报告簇中缺陷报告进行排序, 以确定所述报 告簇中的主报告; 提取所述报告簇中与所述主报告关联的差异点信息与歧义点信息, 并将所述主报告、 所述差异点信息以及所述歧义 点信息存 储至数据库中, 以实现缺陷报告的融合。 2.如权利要求1所述的缺陷报告融合方法, 其特征在于, 依据所述文本 内容提取所述缺 陷报告的实体与关联关系的步骤 包括: 对所述文本内容进行分句, 以获取多个短句; 对每个短句进行分词并进行词性分析与依存分析, 以确定所述缺陷报告的实体与关联 关系。 3.如权利要求2所述的缺陷报告融合方法, 其特征在于, 将所述知识图谱中的实体与关 联关系翻译成第一向量, 并依据所述第一向量整合每个缺陷报告对应的第二向量的步骤包 括: 确定所述 缺陷报告中每 个短句对应的第一向量; 利用所述 缺陷报告对应的所有第一向量 合成所述第二向量。 4.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述缺陷报告还包括图片内 容, 在所述确定每两个缺陷报告的相似度的步骤之前, 所述方法还 包括: 提取所述图片内容的特 征; 依据所述图片内容的特 征确定第三向量; 所述确定每两个缺陷报告的相似度的步骤 包括: 依据所述第二向量与所述第三向量确定每两个报告的相似度。 5.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述依据 所述知识图谱中的实 体与关联关系对报告簇中缺陷报告 进行排序, 以确定所述报告簇中的主报告的步骤 包括: 依次将所述报告簇 中的每个缺陷报告作为目标缺陷报告, 确定与所述目标缺陷报告存 在关联的其 余缺陷报告的数量; 依据所述其余缺陷报告的数量与所述目标缺陷报告的评价信息确定所述目标缺陷报 告的权重, 其中, 所述评价信息包括 正向评价信息与负向评价信息; 将权重最大的目标缺陷报告作为主报告。 6.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述依据 所述文本 内容提取所 述缺陷报告的实体与关联关系的步骤 包括: 对所述文本内容进行分句, 以获取多个短句; 所述提取所述报告簇中与所述主报告关联的差异点信息与歧义 点信息的步骤 包括:权 利 要 求 书 1/2 页 2 CN 114048293 A 2将其余报告中每个短句与 所述主报告进行相似度计算, 并将与 所述主报告相似度小于 第二阈值的短句作为差异点信息; 将与所述主报告语义相反的短句作为歧义 点信息。 7.如权利要求6所述的缺陷报告融合方法, 其特征在于, 在将其余报告中每个短句与 所 述主报告进行相似度计算, 并将与所述主报告相似度小于第二阈值的短句作为差异 点信息 的步骤之后, 所述方法还 包括: 依据所述差异点信息所处的缺陷报告对应的排序结果对所述差异点信息进行排序。 8.一种缺陷报告融合装置, 其特 征在于, 所述装置包括: 数据获取 单元, 用于获取多个缺陷报告, 其中, 所述 缺陷报告包括文本内容; 处理单元, 还用于依据所述文本内容提取所述缺陷报告的实体与关联关系, 并将所述 实体与关联关系引用知识图谱中进行补充; 处理单元, 还用于将所述知识图谱中的实体与关联关系翻译成第一向量, 并依据所述 第一向量整合每 个缺陷报告对应的第二向量; 处理单元, 还用于依据所述第二向量确定每两个缺陷报告的相似度, 并将相似度大于 第一阈值的缺陷报告聚合 为同一报告簇; 处理单元, 还用于依据 所述知识图谱中的实体与关联关系 对报告簇 中缺陷报告进行排 序, 以确定所述报告簇中的主报告; 处理单元, 还用于提取所述报告簇中与所述主报告关联的差异点信息与歧义点信息, 并将所述主报告、 所述差异点信息以及所述歧义点信息存储至数据库中, 以实现缺陷报告 的融合。 9.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储一个或多个程序; 处理器; 当所述一个或多个程序被所述处理器执行时, 实现如权利要求1 ‑7中任一项所述的方 法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现如权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114048293 A 3
专利 一种缺陷报告融合方法、装置、电子设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:58
上传分享
举报
下载
原文档
(1.3 MB)
分享
友情链接
中国移动 运营商数据安全白皮书 2020.pdf
GB-Z 42885-2023 信息安全技术 网络安全信息共享指南.pdf
SY-T 7651-2021 储气库井运行管理规范.pdf
AQ 1098-2014 露天煤矿安全设施设计编制导则.pdf
悬镜SDL-DevSecOps安全开发建设v6.pdf
YD-T 4060-2022 云计算安全责任共担模型.pdf
T-LYYLXH 002—2021 养老护理员职业技能操作培训规范.pdf
T-CERDS 3—2022 企业ESG评价体系.pdf
DPO 非个人数据自由流动框架条例 中文版.pdf
GB-T 43500-2023 安全管理体系 要求.pdf
HB 8574-2020 民用飞机机载嵌入式操作系统应用集成验证要求.pdf
DB61-T 983-2015 旧水泥混凝土路面共振碎石化技术规范 陕西省.pdf
GB-T 22900-2022 科学技术研究项目评价通则.pdf
GB-T 41776-2022 法庭科学 弹药鉴定方法.pdf
DB36-T 1477-2021 碳普惠平台运营管理规范 江西省.pdf
T-ZGCSC 003—2022 智慧城市 知识体系框架.pdf
Gartner 网络安全IT路线图 .pdf
CB-T 4521-2022 船舶行业企业工业管道和气体橡胶软管安全管理规定.pdf
GB-T 25068.1-2020 信息技术 安全技术 网络安全 第1部分:综述和概念.pdf
GB-T 20282-2006 信息安全技术 信息系统安全工程管理要求.pdf
1
/
21
评价文档
赞助2.5元 点击下载(1.3 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。