(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210151153.0
(22)申请日 2022.02.14
(71)申请人 中国工商银行股份有限公司
地址 100140 北京市西城区复兴门内大街
55号
(72)发明人 杨济银
(74)专利代理 机构 北京康信知识产权代理有限
责任公司 1 1240
专利代理师 周春枚
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/216(2020.01)
G06F 40/194(2020.01)
G06F 11/34(2006.01)
(54)发明名称
异常日志的分析方法、 装置及电子设备
(57)摘要
本发明公开了一种异常日志的分析方法、 装
置及电子设备。 涉及人工智能领域, 该方法包括:
获取系统发生异常时所产生的待处理异常日志;
将待处理异常日志输入至预先训练得到的目标
语言模型中, 得到多个第一维向量; 从多个第一
维向量中确定相似概率最大的目标第一维向量,
并从目标第一维向量对应的句子对中提取目标
标签解释文本; 将目标标签解释文本作为待处理
异常日志的分析结果。 本发明解决了现有技术中
由于依赖人工方式分析日志文件造成的分析效
率差的技 术问题。
权利要求书2页 说明书13页 附图4页
CN 114528845 A
2022.05.24
CN 114528845 A
1.一种异常日志的分析 方法, 其特 征在于, 包括:
获取系统发生异常时所产生的待处 理异常日志;
将所述待处理异常日志输入至预先训练得到的目标语言模型中, 得到多个第一维向
量, 其中, 每个第一维向量表征所述待处理异常日志与所述待处理异常日志所对应的每个
句子对的相似概率, 所述每个句子对由所述待处理异常日志与一个标签解释文本组合生
成, 所述标签解释文本 至少包括预设异常类型 标签的异常详情信息和/或异常解决方案;
从所述多个第 一维向量中确定所述相似概率最大的目标第 一维向量, 并从所述目标第
一维向量对应的句子对中提取目标 标签解释文本;
将所述目标 标签解释文本作为所述待处 理异常日志的分析 结果。
2.根据权利要求1所述的方法, 其特征在于, 所述多个第 一维向量中的每个第 一维向量
分别对应一个第二维向量, 其中, 所述第二维向量表征所述待处理异常日志与所述待处理
异常日志所对应的每 个句子对的不相似概 率。
3.根据权利要求1所述的方法, 其特征在于, 在将所述待处理异常日志输入至预先训练
得到的目标语言模型中之前, 所述方法还 包括:
获取多个历史异常日志, 其中, 每个历史异常日志中至少包含系统逻辑的描述文本, 其
中, 所述系统逻辑的描述文本 至少包括 导致所述系统发生异常的事 件的描述信息;
根据所述系统逻辑的描述文本对所述每个历史异常日志进行向量化处理, 得到所述每
个历史异常日志对应的语义向量。
4.根据权利要求3所述的方法, 其特征在于, 根据 所述系统逻辑的描述文本对所述每个
历史异常日志进行向量 化处理, 得到所述每 个历史异常日志对应的语义向量, 包括:
统计所述系统逻辑的描述文本中每个单词在所述每个历史异常日志中出现的第一频
率以及所述每 个单词在所有历史异常日志中出现的第二频率;
根据所述第一频率以及所述第二频率计算得到所述每个单词在所述每个历史异常日
志中的权 重值;
在所述每个历史异常日志中, 对所述每个单词的权重值与所述每个单词的单词语义向
量进行加权求和, 得到所述每 个历史异常日志所对应的语义向量。
5.根据权利要求3所述的方法, 其特征在于, 在根据 所述系统逻辑的描述文本对所述每
个历史异常日志进行向量化处理, 得到所述每个历史异常日志对应的语义向量之后, 所述
方法还包括:
对所述多个历史异常日志对应的语义向量进行聚类处理, 得到所述每个历史异常日志
对应的异常类型, 其中, 每种异常类型对应至少一个历史异常日志;
获取所述每种异常类型对应的预设异常类型标签, 并将所述预设异常类型标签标注在
对应的历史异常日志上, 得到标注后的历史异常日志, 其中, 一种异常类型与一个预设异常
类型标签相对应;
根据所述标注后的历史异常日志训练得到所述目标语言模型。
6.根据权利要求5所述的方法, 其特征在于, 根据 所述标注后的历史异常日志训练得到
所述目标语言模型, 包括:
对所述标注后的历史异常日志进行文本扩充, 得到扩充后的历史异常日志, 其中, 所述
扩充后的历史异常日志至少包括: 所述系统逻辑的描述文本、 系统状态的描述文本以及所权 利 要 求 书 1/2 页
2
CN 114528845 A
2述预设异常类型 标签的标签解释文本;
基于所述扩充后的历史异常日志对初始语言模型进行训练, 得到所述目标语言模型。
7.根据权利要求6所述的方法, 其特征在于, 对所述标注后的历史异常日志进行文本扩
充, 得到扩充后的历史异常日志, 包括:
获取所述预设异常类型标签的标签解释文本, 其中, 每一种预设异常类型标签对应至
少一个标签解释文本;
在一种预设异常类型标签与多个标签解释文本相对应的情况下, 将每个标签解释文本
分别加入至对应预设异常类型标签所对应的每个标注后的历史异常日志中, 得到多个扩充
后的历史异常日志。
8.根据权利要求1所述的方法, 其特征在于, 所述待处理异常日志至少包括系统逻辑的
描述文本以及系统状态的描述文本, 其中, 将所述待处理异常日志输入至预先训练得到的
目标语言模型中, 得到多个第一维向量, 包括:
控制所述目标语言模型在每种预设异常类型标签对应的至少一个标签解释文本中获
取一个待组合的标签解释文本, 并在所述系统逻辑的描述文本、 所述系统状态的描述文本
以及所述待组合的标签解释文本之间插入预设分隔符, 得到目标文本, 在目标文本的句首
位置插入预设句首标签, 得到所述每种 预设异常类型标签所对应的句 子对, 基于所述每种
预设异常类型 标签所对应的句子对, 生成所述多个第一维向量。
9.一种异常日志的分析装置, 其特 征在于, 所述装置包括:
获取模块, 用于获取系统发生异常时所产生的待处 理异常日志;
输入模块, 用于将所述待处理异常日志输入至预先训练得到的目标语言模型中, 得到
多个第一维向量, 其中, 每个第一维向量表征所述待处理异常日志与所述待处理异常日志
所对应的每个句子对的相似概率, 所述每个句子对由所述待处理异常日志与一个标签解释
文本组合生成, 所述标签解释文本至少包括预设异常类型标签的异常详情信息和/或异常
解决方案;
第一确定模块, 用于从所述多个第 一维向量中确定所述相似概率最大的目标第 一维向
量, 并从所述目标第一维向量对应的句子对中提取目标 标签解释文本;
第二确定模块, 用于将所述目标 标签解释文本作为所述待处 理异常日志的分析 结果。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的程
序, 其中, 在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至8 中
任意一项所述的异常日志的分析 方法。
11.一种电子设备, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有计算机程
序, 所述处理器被设置为运行所述计算机程序以执行权利要求1至8中任意一项 所述的异常
日志的分析 方法。权 利 要 求 书 2/2 页
3
CN 114528845 A
3
专利 异常日志的分析方法、装置及电子设备
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:35上传分享