(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211537098.5
(22)申请日 2022.12.02
(71)申请人 北京国信蓝盾科技有限公司
地址 100097 北京市海淀区昆明湖南路47
号一层A02
(72)发明人 陈玉强 秦峰 吴昊 陆月明
韩道岐 高佳琪 王成月 樊明睿
王秦君 王大明 徐文杰 陆文强
王占峰
(74)专利代理 机构 北京星通盈泰知识产权代理
有限公司 1 1952
专利代理师 黄正奇
(51)Int.Cl.
H04L 9/40(2022.01)
G06N 3/08(2006.01)
(54)发明名称
一种融合动态资源池调度与响应的方法及
系统
(57)摘要
本发明提供了一种融合动态资源池调度与
响应的方法及系统, 该方法包括以下步骤: S1: 根
据实体防御资源 特性, 对实体防御资源进行轻量
化处理, 并添加到资源池中; S2: 根据应用场景,
对网络中的设备状态进行定义, 并基于攻防策略
生成模型建立攻防双方策略空间以及收益空间,
并通过纳什均衡生成最优的防御资源调度策略;
S3: 利用增强学习算法, 并根据经过网络威胁后
网络中设备的状态, 对最优防御策略进行迭代优
化。 本发明所提供的一种融合动态资源池调度与
响应的方法及系统, 构建动态 安全资源池可以实
现安全防御资源 轻量化的灵活编排, 为实现防御
策略的自适应生成奠定基础。 同时可以实现对网
络威胁的协同防御, 进而最大化提升安全防御资
源的组合功效。
权利要求书3页 说明书12页 附图3页
CN 115550078 A
2022.12.30
CN 115550078 A
1.一种融合动态资源 池调度与响应的方法, 其特 征在于, 包括以下步骤:
S1: 根据实体防御资源特性, 对实体防御资源进行 轻量化处理, 并添加到资源 池中;
S2: 根据应用场景, 对 网络中的设备状态进行定义, 并基于攻防策略生成模型建立攻防
双方策略空间以及收益空间, 并通过纳什均衡生成最优的防御资源调度策略;
S3: 利用增强学习算法, 并根据经过网络威胁后网络中设备的状态, 对最优防御策略进
行迭代优化。
2.根据权利要求1所述的一种融合动态资源池调度与响应的方法, 其特征在于, 所述S1
还包括:
S11: 获取实体防御资源特性;
S12: 对实体防御资源类别进行判断, 若为软件程序, 则进行容器化处理; 若为非软件程
序, 则通过虚拟机对物力资源虚拟化;
S13: 将通过 轻量化处理的实体防御资源添加到资源 池中。
3.根据权利要求2所述的一种融合动态资源池调度与响应的方法, 其特征在于, 所述S2
包括:
S21: 根据应用场景, 对网络中的设备状态进行定义, 包括防御状态、 攻击状态、 正常状
态、 正在遭受攻击以及瘫 痪状态;
S22 : 根据设备状态之间的转化关系 , 建立攻防策略生成模型 , 并定义为
;
其中
代表攻击者,
代表防御者,
代表选取不同强度的攻击策
略,
代表第N种攻击策略,
代表选取不同强度的防御 策略,
代表第
N种防御策略,
代表选择不同强度攻击策略的概率,
代表选择第N
种攻击策略的概率,
代表选择不同防御策略的概率,
代表选择第
N种防御策略的概率,
代表攻击方的收益函数,
代表防御方的收益函
数,
代表第i种攻击策略,
代表第j种防御策略;
S23: 根据纳什均衡, 并根据防策略生成模型, 最小化系统损失为目标, 计算最优防御策
略。
4.根据权利要求3所述的一种融合动态资源池调度与响应的方法, 其特征在于, 所述S3
包括:
S31: 设定多个防御策略, 统计经过网络威胁后各个安全防御策略的防御状态, 并根据
防御状态是否满足防御需求, 构建初始防御状态 矩阵;
S32: 设定动作集, 对防御不足的策略将进行防御资源的补充或替换, 对防御过剩的资
源进行防御资源 缩减;
S33: 设定奖励函数, 在动作执行后, 在初始防御状态矩阵中增加奖励值, 直到初始防御
状态矩阵达到最大值。
5.一种融合动态资源 池调度与响应的系统, 其特 征在于, 包括:
动态资源池构建模块, 用于根据实体防御资源特性, 对实体防御资源进行轻量化处理,权 利 要 求 书 1/3 页
2
CN 115550078 A
2并添加到资源 池中;
防御策略生成模块, 用于根据应用场景, 对网络中的设备状态进行定义, 并基于攻防策
略生成模型建立攻防双方策略空间以及收益空间, 并通过纳什均衡生成最优的防御资源调
度策略;
防御资源自适应模块, 用于利用增强学习算法, 并根据经过网络威胁后网络中设备的
状态, 对最优防御策略进行迭代优化。
6.根据权利要求5所述的一种融合动态资源池调度与响应的系统, 其特征在于, 所述动
态资源池构建模块包括:
防御资源特性获取子模块, 用于获取实体防御资源特性;
防御资源轻量化子模块, 用于对实体防御资源类别进行判断, 若为软件程序, 则进行容
器化处理; 若为非软件程序, 则通过虚拟机对物力资源虚拟化;
防御资源添加子模块, 用于将通过 轻量化处理的实体防御资源添加到资源 池中。
7.根据权利要求6所述的一种融合动态资源池调度与响应的系统, 其特征在于, 所述防
御策略生成模块包括:
设备状态定义子模块, 用于根据应用场景, 对 网络中的设备状态进行定义, 包括防御状
态、 攻击状态、 正常状态、 正在遭受攻击以及瘫 痪状态;
攻防策略生成模型建立子模块, 用于根据设备状态之间的转化关系, 建立攻防策略生
成模型, 并定义 为
;
其中
代表攻击者,
代表防御者,
代表选取不同强度的攻击策
略,
代表第N种攻击策略,
代表选取不同强度的防御 策略,
代表第
N种防御策略,
代表选择不同强度攻击策略的概率,
代表选择第N
种攻击策略的概率,
代表选择不同防御策略的概率,
代表选择第
N种防御策略的概率,
代表攻击方的收益函数,
代表防御方的收益函
数,
代表第i种攻击策略,
代表第j种防御策略;
最优防御策略生成子模块, 用于根据纳什均衡, 并根据防策略生成模型, 最小化系统损
失为目标, 计算 最优防御策略。
8.根据权利要求7所述的一种融合动态资源池调度与响应的系统, 其特征在于, 所述防
御资源自适应模块还 包括:
初始防御状态矩阵构建子模块, 用于设定多个防御策略, 统计经过网络威胁后各个安
全防御策略的防御状态, 并根据防御状态是否满足防御需求, 构建初始防御状态 矩阵;
动作集设定子模块, 用于设定动作集, 对 防御不足的策略将进行防御资源的补充或替
换, 对防御过剩的资源进行防御资源 缩减;
奖励函数设定子模块, 用于设定奖励函数, 在动作 执行后, 在初始防御状态矩阵中增加
奖励值, 直到初始防御状态 矩阵达到最大值。
9.一种计算机设备, 包括存储器, 处理器及存储在存储器上并可在处理器上运行的计
算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1‑4任一项所述权 利 要 求 书 2/3 页
3
CN 115550078 A
3
专利 一种融合动态资源池调度与响应的方法及系统
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:40上传分享