(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211288243.0 (22)申请日 2022.10.20 (71)申请人 北京宽客进化科技有限公司 地址 100088 北京市西城区新 街口外大街 28号C座6层6 09号 (72)发明人 王舸 岑忠培 赵雪峰  (74)专利代理 机构 北京格汇 专利代理事务所 (特殊普通 合伙) 16088 专利代理师 张伟洋 (51)Int.Cl. G06F 21/62(2013.01) G06N 3/08(2006.01) (54)发明名称 一种基于生成式人工智能的去隐私方法和 系统 (57)摘要 本申请公开了一种基于生成式人工智能的 去隐私方法和系统, 所述方法包括: 对目标数据 进行特征编码、 约束差分计算和归一化处理; 基 于处理后的目标数据根据监控指标对生成式对 抗网络进行训练; 将随机变量输入 所述生成式对 抗网络, 得到所述目标数据的合成数据; 对所述 目标数据和所述目标数据的合成数据进行统计 特征和覆盖范围的计算, 若满足设定条件, 则确 定为待测试数据; 对所述目标数据和所述待测试 数据进行连接攻击, 若满足设定条件, 则将所述 目标数据的合成数据确定为所述目标数据的去 隐私数据。 高效且高质量的对数据进行去隐私处 理。 权利要求书2页 说明书12页 附图4页 CN 115357941 A 2022.11.18 CN 115357941 A 1.一种基于生成式人工智能的去隐私方法, 其特 征在于, 所述方法包括: 对目标数据进行 特征编码、 约束差分计算和归一 化处理; 基于处理后的目标 数据根据监控指标对生成式对抗网络进行训练; 将随机变量输入所述 生成式对抗网络, 得到所述目标 数据的合成数据; 对所述目标数据和所述目标数据的合成数据进行统计特征和覆盖范围的计算, 若满足 设定条件, 则确定为待测试 数据; 对所述目标数据和所述待测试数据进行连接攻击, 若满足设定条件, 则将所述目标数 据的合成数据确定为所述目标 数据的去隐私数据。 2.如权利要求1所述的方法, 其特征在于, 在对目标数据进行特征编码、 约束差分计算 和归一化处理之前, 所述方法还 包括: 对所述目标 数据进行离群点去除和缺失数据插补。 3.如权利要求1所述的方法, 其特征在于, 基于处理后的目标数据根据监控指标对生成 式对抗网络进行训练, 包括: 基于处理后的目标数据, 根据监控指标对所述生成式对抗网络的训练过程进行控制, 经过多次迭代和超参调整, 学习 出生成式对抗网络的参数, 以完成所述生成式对抗网络的 训练。 4.如权利要求1所述的方法, 其特 征在于, 所述 监控指标按照如下公式计算: 其中, E和G为数据集, 为E和G数据集分布之间的距离, 若E数据集中任意一个点Ei 距离最近的第L个点 来自于数据集E∪G, 则1Ei(l)取值为1, 否则为0 。 5.如权利要求1所述的方法, 其特 征在于, 所述 生成式对抗网络是按照如下公式构建: 其中, 表示最小化生成器G (generator) 的损失函数值同时最大化判 别器D (discriminator) 的损失函数值; x ∼pdata(x)表示从真实的数据分布pdata(x)中采样出样 本x, D(x)表示样本x通过判别器后的结果,  z∼pz(z)表示从分布pz(z)中抽取一个 随机数z, G (z)表示随机数z通过生成器G后的合成数据。 6.一种基于生成式人工智能的去隐私系统, 其特 征在于, 所述系统包括: 强约束模块, 用于对目标 数据进行 特征编码、 约束差分计算和归一 化处理; 训练模块, 用于基于处 理后的目标 数据根据监控指标对生成式对抗网络进行训练;权 利 要 求 书 1/2 页 2 CN 115357941 A 2合成数据确定模块, 用于将随机变量输入所述生成式对抗网络, 得到所述目标数据的 合成数据; 特征计算模块, 用于对所述目标数据和所述目标数据的合成数据进行统计特征和覆盖 范围的计算, 若满足设定条件, 则确定为待测试 数据; 连接攻击模块, 用于对所述目标数据和所述待测试数据进行连接攻击, 若满足设定条 件, 则将所述目标 数据的合成数据确定为所述目标 数据的去隐私数据。 7.如权利要求6所述的系统, 其特 征在于, 所述系统还 包括: 预处理模块, 用于对所述目标 数据进行离群点去除和缺失数据插补。 8.如权利要求6所述的系统, 其特 征在于, 所述训练模块, 具体用于: 基于处理后的目标数据, 根据监控指标对所述生成式对抗网络的训练过程进行控制, 经过多次迭代和超参调整, 学习 出生成式对抗网络的参数, 以完成所述生成式对抗网络的 训练。 9.一种电子设备, 包括: 存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器运行所述计算机程序时执行以实现如权利要求 1‑5任一项所述的方法。 10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机可读指令, 所述计算机 可读指令可被处 理器执行以实现如权利要求1 ‑5任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115357941 A 3

PDF文档 专利 一种基于生成式人工智能的去隐私方法和系统

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于生成式人工智能的去隐私方法和系统 第 1 页 专利 一种基于生成式人工智能的去隐私方法和系统 第 2 页 专利 一种基于生成式人工智能的去隐私方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。