(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211537098.5 (22)申请日 2022.12.02 (71)申请人 北京国信蓝盾科技有限公司 地址 100097 北京市海淀区昆明湖南路47 号一层A02 (72)发明人 陈玉强 秦峰 吴昊 陆月明  韩道岐 高佳琪 王成月 樊明睿  王秦君 王大明 徐文杰 陆文强  王占峰  (74)专利代理 机构 北京星通盈泰知识产权代理 有限公司 1 1952 专利代理师 黄正奇 (51)Int.Cl. H04L 9/40(2022.01) G06N 3/08(2006.01) (54)发明名称 一种融合动态资源池调度与响应的方法及 系统 (57)摘要 本发明提供了一种融合动态资源池调度与 响应的方法及系统, 该方法包括以下步骤: S1: 根 据实体防御资源 特性, 对实体防御资源进行轻量 化处理, 并添加到资源池中; S2: 根据应用场景, 对网络中的设备状态进行定义, 并基于攻防策略 生成模型建立攻防双方策略空间以及收益空间, 并通过纳什均衡生成最优的防御资源调度策略; S3: 利用增强学习算法, 并根据经过网络威胁后 网络中设备的状态, 对最优防御策略进行迭代优 化。 本发明所提供的一种融合动态资源池调度与 响应的方法及系统, 构建动态 安全资源池可以实 现安全防御资源 轻量化的灵活编排, 为实现防御 策略的自适应生成奠定基础。 同时可以实现对网 络威胁的协同防御, 进而最大化提升安全防御资 源的组合功效。 权利要求书3页 说明书12页 附图3页 CN 115550078 A 2022.12.30 CN 115550078 A 1.一种融合动态资源 池调度与响应的方法, 其特 征在于, 包括以下步骤: S1: 根据实体防御资源特性, 对实体防御资源进行 轻量化处理, 并添加到资源 池中; S2: 根据应用场景, 对 网络中的设备状态进行定义, 并基于攻防策略生成模型建立攻防 双方策略空间以及收益空间, 并通过纳什均衡生成最优的防御资源调度策略; S3: 利用增强学习算法, 并根据经过网络威胁后网络中设备的状态, 对最优防御策略进 行迭代优化。 2.根据权利要求1所述的一种融合动态资源池调度与响应的方法, 其特征在于, 所述S1 还包括: S11: 获取实体防御资源特性; S12: 对实体防御资源类别进行判断, 若为软件程序, 则进行容器化处理; 若为非软件程 序, 则通过虚拟机对物力资源虚拟化; S13: 将通过 轻量化处理的实体防御资源添加到资源 池中。 3.根据权利要求2所述的一种融合动态资源池调度与响应的方法, 其特征在于, 所述S2 包括: S21: 根据应用场景, 对网络中的设备状态进行定义, 包括防御状态、 攻击状态、 正常状 态、 正在遭受攻击以及瘫 痪状态; S22 : 根据设备状态之间的转化关系 , 建立攻防策略生成模型 , 并定义为 ; 其中 代表攻击者, 代表防御者, 代表选取不同强度的攻击策 略, 代表第N种攻击策略, 代表选取不同强度的防御 策略, 代表第 N种防御策略, 代表选择不同强度攻击策略的概率, 代表选择第N 种攻击策略的概率, 代表选择不同防御策略的概率, 代表选择第 N种防御策略的概率, 代表攻击方的收益函数, 代表防御方的收益函 数, 代表第i种攻击策略, 代表第j种防御策略; S23: 根据纳什均衡, 并根据防策略生成模型, 最小化系统损失为目标, 计算最优防御策 略。 4.根据权利要求3所述的一种融合动态资源池调度与响应的方法, 其特征在于, 所述S3 包括: S31: 设定多个防御策略, 统计经过网络威胁后各个安全防御策略的防御状态, 并根据 防御状态是否满足防御需求, 构建初始防御状态 矩阵; S32: 设定动作集, 对防御不足的策略将进行防御资源的补充或替换, 对防御过剩的资 源进行防御资源 缩减; S33: 设定奖励函数, 在动作执行后, 在初始防御状态矩阵中增加奖励值, 直到初始防御 状态矩阵达到最大值。 5.一种融合动态资源 池调度与响应的系统, 其特 征在于, 包括: 动态资源池构建模块, 用于根据实体防御资源特性, 对实体防御资源进行轻量化处理,权 利 要 求 书 1/3 页 2 CN 115550078 A 2并添加到资源 池中; 防御策略生成模块, 用于根据应用场景, 对网络中的设备状态进行定义, 并基于攻防策 略生成模型建立攻防双方策略空间以及收益空间, 并通过纳什均衡生成最优的防御资源调 度策略; 防御资源自适应模块, 用于利用增强学习算法, 并根据经过网络威胁后网络中设备的 状态, 对最优防御策略进行迭代优化。 6.根据权利要求5所述的一种融合动态资源池调度与响应的系统, 其特征在于, 所述动 态资源池构建模块包括: 防御资源特性获取子模块, 用于获取实体防御资源特性; 防御资源轻量化子模块, 用于对实体防御资源类别进行判断, 若为软件程序, 则进行容 器化处理; 若为非软件程序, 则通过虚拟机对物力资源虚拟化; 防御资源添加子模块, 用于将通过 轻量化处理的实体防御资源添加到资源 池中。 7.根据权利要求6所述的一种融合动态资源池调度与响应的系统, 其特征在于, 所述防 御策略生成模块包括: 设备状态定义子模块, 用于根据应用场景, 对 网络中的设备状态进行定义, 包括防御状 态、 攻击状态、 正常状态、 正在遭受攻击以及瘫 痪状态; 攻防策略生成模型建立子模块, 用于根据设备状态之间的转化关系, 建立攻防策略生 成模型, 并定义 为 ; 其中 代表攻击者, 代表防御者, 代表选取不同强度的攻击策 略, 代表第N种攻击策略, 代表选取不同强度的防御 策略, 代表第 N种防御策略, 代表选择不同强度攻击策略的概率, 代表选择第N 种攻击策略的概率, 代表选择不同防御策略的概率, 代表选择第 N种防御策略的概率, 代表攻击方的收益函数, 代表防御方的收益函 数, 代表第i种攻击策略, 代表第j种防御策略; 最优防御策略生成子模块, 用于根据纳什均衡, 并根据防策略生成模型, 最小化系统损 失为目标, 计算 最优防御策略。 8.根据权利要求7所述的一种融合动态资源池调度与响应的系统, 其特征在于, 所述防 御资源自适应模块还 包括: 初始防御状态矩阵构建子模块, 用于设定多个防御策略, 统计经过网络威胁后各个安 全防御策略的防御状态, 并根据防御状态是否满足防御需求, 构建初始防御状态 矩阵; 动作集设定子模块, 用于设定动作集, 对 防御不足的策略将进行防御资源的补充或替 换, 对防御过剩的资源进行防御资源 缩减; 奖励函数设定子模块, 用于设定奖励函数, 在动作 执行后, 在初始防御状态矩阵中增加 奖励值, 直到初始防御状态 矩阵达到最大值。 9.一种计算机设备, 包括存储器, 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1‑4任一项所述权 利 要 求 书 2/3 页 3 CN 115550078 A 3

PDF文档 专利 一种融合动态资源池调度与响应的方法及系统

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合动态资源池调度与响应的方法及系统 第 1 页 专利 一种融合动态资源池调度与响应的方法及系统 第 2 页 专利 一种融合动态资源池调度与响应的方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。