standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210024050.8 (22)申请日 2022.01.11 (71)申请人 广东拓思软件科 学园有限公司 地址 510000 广东省广州市萝岗区广州经 济技术开发区科 学城彩频路1 1号 申请人 广州番禺职业 技术学院 (72)发明人 王萍 陈振宇 张晋桂 黄万民  杨鹏 孙伟松 黄静旋 吴先裕  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 代理人 戴尧罡 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/289(2020.01)G06F 40/30(2020.01) (54)发明名称 一种缺陷报告融合方法、 装置、 电子设备及 存储介质 (57)摘要 本申请提供了一种缺陷报告融合方法、 装 置、 电子设备及存储介质, 涉及数据分析技术领 域。 首先获取多个缺陷报告, 然后依据文本内容 提取缺陷报告的实体与关联关系, 并将实体与关 联关系引用知识图谱中进行补 充, 再将知识图谱 中的实体与关联关系翻译成第一向量, 并依据第 一向量整合每个缺陷报告对应的第二向量, 再依 据第二向量确定每两个缺陷报告的相似度, 并将 相似度大于第一阈值的缺陷报告聚合为同一报 告簇, 然后依据知识图谱中的实体与关联关系对 报告簇中缺陷报告进行排序, 以确定报告簇中的 主报告, 最后提取报告簇中与主报告关联的差异 点信息与歧义点信息。 本申请具有避免了重复报 告, 降低了整编人员的工作量的优点。 权利要求书2页 说明书10页 附图8页 CN 114048293 A 2022.02.15 CN 114048293 A 1.一种缺陷报告融合方法, 其特 征在于, 所述方法包括: 获取多个缺陷报告, 其中, 所述 缺陷报告包括文本内容; 依据所述文本 内容提取所述缺陷报告的实体与关联关系, 并将所述实体与关联关系引 用知识图谱中进行补充; 将所述知识图谱中的实体与关联关系翻译成第 一向量, 并依据 所述第一向量整合每个 缺陷报告对应的第二向量; 依据所述第 二向量确定每两个缺陷报告的相似度, 并将相似度 大于第一阈值的缺陷报 告聚合为同一报告簇; 依据所述知识图谱中的实体与关联关系对报告簇中缺陷报告进行排序, 以确定所述报 告簇中的主报告; 提取所述报告簇中与所述主报告关联的差异点信息与歧义点信息, 并将所述主报告、 所述差异点信息以及所述歧义 点信息存 储至数据库中, 以实现缺陷报告的融合。 2.如权利要求1所述的缺陷报告融合方法, 其特征在于, 依据所述文本 内容提取所述缺 陷报告的实体与关联关系的步骤 包括: 对所述文本内容进行分句, 以获取多个短句; 对每个短句进行分词并进行词性分析与依存分析, 以确定所述缺陷报告的实体与关联 关系。 3.如权利要求2所述的缺陷报告融合方法, 其特征在于, 将所述知识图谱中的实体与关 联关系翻译成第一向量, 并依据所述第一向量整合每个缺陷报告对应的第二向量的步骤包 括: 确定所述 缺陷报告中每 个短句对应的第一向量; 利用所述 缺陷报告对应的所有第一向量 合成所述第二向量。 4.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述缺陷报告还包括图片内 容, 在所述确定每两个缺陷报告的相似度的步骤之前, 所述方法还 包括: 提取所述图片内容的特 征; 依据所述图片内容的特 征确定第三向量; 所述确定每两个缺陷报告的相似度的步骤 包括: 依据所述第二向量与所述第三向量确定每两个报告的相似度。 5.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述依据 所述知识图谱中的实 体与关联关系对报告簇中缺陷报告 进行排序, 以确定所述报告簇中的主报告的步骤 包括: 依次将所述报告簇 中的每个缺陷报告作为目标缺陷报告, 确定与所述目标缺陷报告存 在关联的其 余缺陷报告的数量; 依据所述其余缺陷报告的数量与所述目标缺陷报告的评价信息确定所述目标缺陷报 告的权重, 其中, 所述评价信息包括 正向评价信息与负向评价信息; 将权重最大的目标缺陷报告作为主报告。 6.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述依据 所述文本 内容提取所 述缺陷报告的实体与关联关系的步骤 包括: 对所述文本内容进行分句, 以获取多个短句; 所述提取所述报告簇中与所述主报告关联的差异点信息与歧义 点信息的步骤 包括:权 利 要 求 书 1/2 页 2 CN 114048293 A 2将其余报告中每个短句与 所述主报告进行相似度计算, 并将与 所述主报告相似度小于 第二阈值的短句作为差异点信息; 将与所述主报告语义相反的短句作为歧义 点信息。 7.如权利要求6所述的缺陷报告融合方法, 其特征在于, 在将其余报告中每个短句与 所 述主报告进行相似度计算, 并将与所述主报告相似度小于第二阈值的短句作为差异 点信息 的步骤之后, 所述方法还 包括: 依据所述差异点信息所处的缺陷报告对应的排序结果对所述差异点信息进行排序。 8.一种缺陷报告融合装置, 其特 征在于, 所述装置包括: 数据获取 单元, 用于获取多个缺陷报告, 其中, 所述 缺陷报告包括文本内容; 处理单元, 还用于依据所述文本内容提取所述缺陷报告的实体与关联关系, 并将所述 实体与关联关系引用知识图谱中进行补充; 处理单元, 还用于将所述知识图谱中的实体与关联关系翻译成第一向量, 并依据所述 第一向量整合每 个缺陷报告对应的第二向量; 处理单元, 还用于依据所述第二向量确定每两个缺陷报告的相似度, 并将相似度大于 第一阈值的缺陷报告聚合 为同一报告簇; 处理单元, 还用于依据 所述知识图谱中的实体与关联关系 对报告簇 中缺陷报告进行排 序, 以确定所述报告簇中的主报告; 处理单元, 还用于提取所述报告簇中与所述主报告关联的差异点信息与歧义点信息, 并将所述主报告、 所述差异点信息以及所述歧义点信息存储至数据库中, 以实现缺陷报告 的融合。 9.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储一个或多个程序; 处理器; 当所述一个或多个程序被所述处理器执行时, 实现如权利要求1 ‑7中任一项所述的方 法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现如权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114048293 A 3

PDF文档 专利 一种缺陷报告融合方法、装置、电子设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种缺陷报告融合方法、装置、电子设备及存储介质 第 1 页 专利 一种缺陷报告融合方法、装置、电子设备及存储介质 第 2 页 专利 一种缺陷报告融合方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。