(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211142752.2
(22)申请日 2022.09.20
(71)申请人 国家电网有限公司信息通信分公司
地址 100053 北京市西城区白广路二条1号
国网信通公司
(72)发明人 高雅婷 黄星杰 王婵 尚智婕
赵金梦 张静 苏蓓蓓 刘新渝
董子娴 李劲松
(74)专利代理 机构 苏州国卓知识产权代理有限
公司 323 31
专利代理师 林阳清
(51)Int.Cl.
G06F 21/56(2013.01)
G06F 21/60(2013.01)
G06F 21/62(2013.01)G06K 9/62(2022.01)
(54)发明名称
一种数据安全 级别的识别检测方法及装置
(57)摘要
本发明涉及数据安全级别的识别检测技术
领域, 具体为一种数据安全级别的识别检测方法
及装置, 包 括以下步骤: S100: 建立数据安全级别
词库, 并对词库内的安全级别进行细化分类, 本
发明中, 通过安全级别词库中的子分类类别, 收
录词库关键字内容, 并通过相关信息链接, 依据
词库关键字内容, 超链接相关信息, 使得该识别
检测方法所能够识别的信息更加多元化, 并且占
用文件空间较小, 通过后缀名识别单元和特征提
取单元的配合, 达成对于数据类型的识别以及特
征提取功能, 进而给判断流程提供数据支撑, 通
过防病毒软件对 数据文件进行查杀, 并通过多级
数据库与安全密钥的配合, 给数据的调用流程提
供依据, 确保数据安全级别识别的可参照性和实
用性。
权利要求书3页 说明书7页 附图5页
CN 115438343 A
2022.12.06
CN 115438343 A
1.一种数据安全级别的识别检测方法, 其特 征在于, 所述方法包括:
S100: 建立数据安全级别词库, 并对词库内的安全级别进行细化分类;
S200: 细化对于数据内容的识别方法与安全级别判定方法;
S300: 建立数据传输通道及沙盘数据缓存, 对数据文件进行查杀批处 理;
S400: 导入存储数据, 调用数据并识别判定数据安全级别;
S500: 对数据进行存 储, 并依照安全级别进行加密处 理。
2.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S100步骤,
还包括:
S101: 根据相 关专业类型, 建立子分类, 如在自然科学分类的处理过程中, 建立地理地
质词库、 生物词库、 化学化工词库、 数 学词库、 天文词库、 气象词库等;
S102: 根据子分类类别, 收录词库关键字内容, 例如在天文词库中, 收录如 日冕物质抛
射、 辐射转移方程、 宇宙中轻元素、 多波 段天文学、 极限曝光时间、 暂现射线源、 束缚跃进、 射
线脉冲星、 天体偏振测置、 射线食现象等关键 字;
S103: 依据词库关键字内容, 超链接相 关信息, 相 关信息包括文本信息参考、 音频信息
参考以及视频信息参 考;
S104: 构建数据安全级别, 如公示信息、 私密信息、 保密信息、 绝密信息等, 并对私密信
息、 保密信息、 绝密信息等内容建立敏感词汇子数据库;
S105: 对与 安全相关的敏感词及其安全权重记录进行统计, 并依照上述S103步骤, 优先
收集敏感词内容, 超链接相关信息;
S106: 采用网状索引链接方式, 对关键 字、 相关信息和敏感词构建索引, 方便后期调用。
3.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S200步骤,
还包括:
S201: 根据数据文件 的后缀名, 识别数据类型, 如文本文件、 图片文件、 音频文件、 视频
文件、 压缩 包文件等, 如zip文件列为压缩 包文件, txt、 doc文件等列为文本文件等;
S202: 对压缩 包文件进行解压, 并再次识别数据类型;
S203: 分类型对数据文件进行读取, 并进行初步处理, 提取特征信息, 如对于图片文件
的提取方式为, 打开原始图片后提取像素分布规律, 去除干扰点并提取特征信息, 特征匹配
S103步骤中所超链接的相关信息;
S204: 根据相关信息在S106步骤中索引的关键字和敏感词, 对特征信息进行识别, 并匹
配安全级别;
S205: 在特征信息识别的过程中, 如遇到敏感词则优先检索敏感词汇子数据库内的相
关信息;
S206: 在匹配安全级别的过程中, 依照数据文件中涉及公示信息、 私密信息、 保密信息、
绝密信息中最高类别的信息级别, 对分类进行记录 。
4.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S300步骤,
还包括:
S301: 建立数据存取数据通道, 建立数据沙盘分区, 通过数据存储数据通道将数据文件
导入数据沙盘分区内部;
S302: 通过防病毒软件, 对数据文件进行查杀, 如发现病毒则在沙盘分区内部对数据项权 利 要 求 书 1/3 页
2
CN 115438343 A
2进行粉碎删除, 如未发现病毒则该 数据项通过安全自检;
S303: 在安全自检的步骤中, 采用批处理的方式, 依次对数据文件的数据项进行查杀,
确保待存 储文件的安全性。
5.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S400步骤,
还包括:
S401: 依照S104步骤中数据安全级别, 建立多级数据库, 其中多级数据库具体包含公示
数据库、 私密数据库、 保密数据库、 绝密数据库;
S402: 对公示数据库、 私密数据库、 保密 数据库、 绝密 数据库依照安全级别排序, 细化数
据存储过程中的加密流程, 并在数据存储的过程中, 对数据进行特征关键字提取和数据安
全级别判定, 建立投影文件;
S403: 特征关键字的提取步骤参照S200步骤中S201至S203步骤, 进行关键字提取, 数据
安全级别判定的具体判定步骤参照S20 0步骤中S204至S20 6步骤, 进行 数据安全级别判定;
S404: 关键字压缩则是根据关联性规则判定, 选择不涉及安全内容或涉及安全内容较
少, 并且识别性较强的内容进行压缩。
6.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S500步骤,
还包括:
S501: 在私密 数据库、 保密 数据库、 绝密 数据库的加密流程中, 建立读取IP, 并对IP信息
划分对应级别, 即在某级别IP中, 能且仅能够对该级别数据库以及该级别向下包含的数据
库进行信息读取;
S502: 对各IP建立安全密钥, 并对多级数据库建立总调用通道以及投影文件数据库, 在
投影文件数据库中存 入S402步骤所建立的投影文件;
S503: 对数据的调用流 程进行细化。
7.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S503步骤,
还包括:
细化内容具体为调用流程的细化规则, 即对投影文件的关键字进行公示, 在使用者选
择调用数据时, 通过安全密钥验证IP信息, 并根据IP所对应的级别判断是否能够调用, 如果
是, 则调用多 级数据库的相关内容, 如果否, 则无法调用。
8.一种数据安全级别的识别检测装置, 其特 征在于, 所述装置包括:
数据安全级别词库: 根据相关专业类型, 建立子分类, 并根据子分类类别, 收录词库关
键字内容;
相关信息链接: 依据词库关键字内容, 超链接相关信息, 包括文本信息参考、 音频信息
参考以及视频信息参 考;
敏感词汇子数据库: 收录私密信息、 保密信息、 绝密信息的相关内容;
后缀名识别单元: 根据 数据文件的后缀名, 识别数据类型, 如文本文件、 图片文件、 音频
文件、 视频文件、 压缩包文件等, 如zip文件列为压缩包文件, txt、 doc文件等列为文本文件
等;
特征提取单元: 分类型对数据文件进行读取, 并进行初步处理, 提取特征信息, 如对于
图片文件的提取方式为, 打开原始图片后提取像素分布规律, 去除干扰点并提取特征信息,
特征匹配S10 3步骤中所超链接的相关信息;权 利 要 求 书 2/3 页
3
CN 115438343 A
3
专利 一种数据安全级别的识别检测方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:12:07上传分享