(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211142752.2 (22)申请日 2022.09.20 (71)申请人 国家电网有限公司信息通信分公司 地址 100053 北京市西城区白广路二条1号 国网信通公司 (72)发明人 高雅婷 黄星杰 王婵 尚智婕  赵金梦 张静 苏蓓蓓 刘新渝  董子娴 李劲松  (74)专利代理 机构 苏州国卓知识产权代理有限 公司 323 31 专利代理师 林阳清 (51)Int.Cl. G06F 21/56(2013.01) G06F 21/60(2013.01) G06F 21/62(2013.01)G06K 9/62(2022.01) (54)发明名称 一种数据安全 级别的识别检测方法及装置 (57)摘要 本发明涉及数据安全级别的识别检测技术 领域, 具体为一种数据安全级别的识别检测方法 及装置, 包 括以下步骤: S100: 建立数据安全级别 词库, 并对词库内的安全级别进行细化分类, 本 发明中, 通过安全级别词库中的子分类类别, 收 录词库关键字内容, 并通过相关信息链接, 依据 词库关键字内容, 超链接相关信息, 使得该识别 检测方法所能够识别的信息更加多元化, 并且占 用文件空间较小, 通过后缀名识别单元和特征提 取单元的配合, 达成对于数据类型的识别以及特 征提取功能, 进而给判断流程提供数据支撑, 通 过防病毒软件对 数据文件进行查杀, 并通过多级 数据库与安全密钥的配合, 给数据的调用流程提 供依据, 确保数据安全级别识别的可参照性和实 用性。 权利要求书3页 说明书7页 附图5页 CN 115438343 A 2022.12.06 CN 115438343 A 1.一种数据安全级别的识别检测方法, 其特 征在于, 所述方法包括: S100: 建立数据安全级别词库, 并对词库内的安全级别进行细化分类; S200: 细化对于数据内容的识别方法与安全级别判定方法; S300: 建立数据传输通道及沙盘数据缓存, 对数据文件进行查杀批处 理; S400: 导入存储数据, 调用数据并识别判定数据安全级别; S500: 对数据进行存 储, 并依照安全级别进行加密处 理。 2.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S100步骤, 还包括: S101: 根据相 关专业类型, 建立子分类, 如在自然科学分类的处理过程中, 建立地理地 质词库、 生物词库、 化学化工词库、 数 学词库、 天文词库、 气象词库等; S102: 根据子分类类别, 收录词库关键字内容, 例如在天文词库中, 收录如 日冕物质抛 射、 辐射转移方程、 宇宙中轻元素、 多波 段天文学、 极限曝光时间、 暂现射线源、 束缚跃进、 射 线脉冲星、 天体偏振测置、 射线食现象等关键 字; S103: 依据词库关键字内容, 超链接相 关信息, 相 关信息包括文本信息参考、 音频信息 参考以及视频信息参 考; S104: 构建数据安全级别, 如公示信息、 私密信息、 保密信息、 绝密信息等, 并对私密信 息、 保密信息、 绝密信息等内容建立敏感词汇子数据库; S105: 对与 安全相关的敏感词及其安全权重记录进行统计, 并依照上述S103步骤, 优先 收集敏感词内容, 超链接相关信息; S106: 采用网状索引链接方式, 对关键 字、 相关信息和敏感词构建索引, 方便后期调用。 3.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S200步骤, 还包括: S201: 根据数据文件 的后缀名, 识别数据类型, 如文本文件、 图片文件、 音频文件、 视频 文件、 压缩 包文件等, 如zip文件列为压缩 包文件, txt、 doc文件等列为文本文件等; S202: 对压缩 包文件进行解压, 并再次识别数据类型; S203: 分类型对数据文件进行读取, 并进行初步处理, 提取特征信息, 如对于图片文件 的提取方式为, 打开原始图片后提取像素分布规律, 去除干扰点并提取特征信息, 特征匹配 S103步骤中所超链接的相关信息; S204: 根据相关信息在S106步骤中索引的关键字和敏感词, 对特征信息进行识别, 并匹 配安全级别; S205: 在特征信息识别的过程中, 如遇到敏感词则优先检索敏感词汇子数据库内的相 关信息; S206: 在匹配安全级别的过程中, 依照数据文件中涉及公示信息、 私密信息、 保密信息、 绝密信息中最高类别的信息级别, 对分类进行记录 。 4.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S300步骤, 还包括: S301: 建立数据存取数据通道, 建立数据沙盘分区, 通过数据存储数据通道将数据文件 导入数据沙盘分区内部; S302: 通过防病毒软件, 对数据文件进行查杀, 如发现病毒则在沙盘分区内部对数据项权 利 要 求 书 1/3 页 2 CN 115438343 A 2进行粉碎删除, 如未发现病毒则该 数据项通过安全自检; S303: 在安全自检的步骤中, 采用批处理的方式, 依次对数据文件的数据项进行查杀, 确保待存 储文件的安全性。 5.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S400步骤, 还包括: S401: 依照S104步骤中数据安全级别, 建立多级数据库, 其中多级数据库具体包含公示 数据库、 私密数据库、 保密数据库、 绝密数据库; S402: 对公示数据库、 私密数据库、 保密 数据库、 绝密 数据库依照安全级别排序, 细化数 据存储过程中的加密流程, 并在数据存储的过程中, 对数据进行特征关键字提取和数据安 全级别判定, 建立投影文件; S403: 特征关键字的提取步骤参照S200步骤中S201至S203步骤, 进行关键字提取, 数据 安全级别判定的具体判定步骤参照S20 0步骤中S204至S20 6步骤, 进行 数据安全级别判定; S404: 关键字压缩则是根据关联性规则判定, 选择不涉及安全内容或涉及安全内容较 少, 并且识别性较强的内容进行压缩。 6.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S500步骤, 还包括: S501: 在私密 数据库、 保密 数据库、 绝密 数据库的加密流程中, 建立读取IP, 并对IP信息 划分对应级别, 即在某级别IP中, 能且仅能够对该级别数据库以及该级别向下包含的数据 库进行信息读取; S502: 对各IP建立安全密钥, 并对多级数据库建立总调用通道以及投影文件数据库, 在 投影文件数据库中存 入S402步骤所建立的投影文件; S503: 对数据的调用流 程进行细化。 7.根据权利要求1所述的数据安全级别的识别检测方法, 其特征在于, 所述S503步骤, 还包括: 细化内容具体为调用流程的细化规则, 即对投影文件的关键字进行公示, 在使用者选 择调用数据时, 通过安全密钥验证IP信息, 并根据IP所对应的级别判断是否能够调用, 如果 是, 则调用多 级数据库的相关内容, 如果否, 则无法调用。 8.一种数据安全级别的识别检测装置, 其特 征在于, 所述装置包括: 数据安全级别词库: 根据相关专业类型, 建立子分类, 并根据子分类类别, 收录词库关 键字内容; 相关信息链接: 依据词库关键字内容, 超链接相关信息, 包括文本信息参考、 音频信息 参考以及视频信息参 考; 敏感词汇子数据库: 收录私密信息、 保密信息、 绝密信息的相关内容; 后缀名识别单元: 根据 数据文件的后缀名, 识别数据类型, 如文本文件、 图片文件、 音频 文件、 视频文件、 压缩包文件等, 如zip文件列为压缩包文件, txt、 doc文件等列为文本文件 等; 特征提取单元: 分类型对数据文件进行读取, 并进行初步处理, 提取特征信息, 如对于 图片文件的提取方式为, 打开原始图片后提取像素分布规律, 去除干扰点并提取特征信息, 特征匹配S10 3步骤中所超链接的相关信息;权 利 要 求 书 2/3 页 3 CN 115438343 A 3

.PDF文档 专利 一种数据安全级别的识别检测方法及装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据安全级别的识别检测方法及装置 第 1 页 专利 一种数据安全级别的识别检测方法及装置 第 2 页 专利 一种数据安全级别的识别检测方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:12:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。