(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211178332.X (22)申请日 2022.09.26 (71)申请人 深圳致星科技有限公司 地址 518000 广东省深圳市南 山区粤海街 道大冲社区深南大道9676号大冲商务 中心 (一期) 2栋 3号楼18C -1 (72)发明人 王雨竹 赵彬  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 肖腾蛟 (51)Int.Cl. G06F 16/9035(2019.01) G06F 16/906(2019.01) G06N 20/00(2019.01) G06F 3/0481(2022.01)G06F 9/451(2018.01) G06F 21/62(2013.01) (54)发明名称 隐私计算、 隐私数据和联邦学习的数据管 理 方法 (57)摘要 本申请涉及隐私计算、 隐私数据和联邦学习 技术领域, 具体涉及一种隐私计算、 隐私数据和 联邦学习的数据管理方法。 方法包括: 在第一界 面上提供第一组件从而使得数据源方可以通过 第一组件录入 数据集相关联的信息; 将数据集输 入机器学习模 型, 机器学习模型用于对数据集进 行处理从而根据一级行业分类库和在该一级行 业分类库下设的二级特征分类库生成数据集相 关联的数据测绘结果; 通过比较数据应用方的检 索偏好和数据测绘结果来判断是否显示数据集, 如果是, 则在第二界面上展示数据集相关联的信 息并提供第二组件从而使得数据应用方可以通 过第二组件选择所述数据集。 如此有利于提高识 别匹配效率。 权利要求书2页 说明书10页 附图2页 CN 115510297 A 2022.12.23 CN 115510297 A 1.一种用于隐私计算、 隐私数据和联邦学习的数据 管理方法, 其特征在于, 所述数据 管 理方法包括: 在呈现给数据源方的第一界面上提供第一组件从而使得所述数据源方可以通过所述 第一组件录入数据集相关联的信息; 将所述数据集输入机器学习 模型, 所述机器学习 模型用于对所述数据集进行处理从而 根据一级行业分类库和在该一级行业分类库下设的二级特征分类库生成所述数据集相关 联的数据测绘结果; 通过比较数据应用方的检索偏好和所述数据测绘结果来判断是否显示所述数据集, 如 果是, 则在呈现给数据应用方的第二界面上展示所述数据集相关联的信息并提供第二组件 从而使得所述数据应用方 可以通过 所述第二组件选择 所述数据集, 其中, 当所述数据应用方选择所述数据集 时, 所述数据集相关联的信 息、 所述检索偏好 以及所述数据测绘结果用于优化所述机器学习模型。 2.根据权利要求1所述的数据 管理方法, 其特征在于, 所述数据测绘结果包括所述数据 集的数据资产分级分类结果。 3.根据权利要求2所述的数据 管理方法, 其特征在于, 所述数据集的数据资产分级分类 结果用于按照类别维度对所述数据集的数据特 征进行自动化分级分类。 4.根据权利要求1所述的数据 管理方法, 其特征在于, 所述数据源方还可以通过所述第 一组件选择 所述数据集对指定数据应用方为可 见或者不可见, 所述数据管理方法还 包括: 基于所述数据源方所选择的所述数据集对所述指定数据应用方为可见或者不可见, 判 断是否显示所述数据集。 5.根据权利要求1所述的数据 管理方法, 其特征在于, 所述一级行业分类库用于按照行 业数据特性区分所述数据集的数据特 征。 6.根据权利要求5所述的数据 管理方法, 其特征在于, 所述二级特征分类库用于按照关 键字段匹配规则识别所述数据集的数据特 征中的关键 字段。 7.根据权利要求6所述的数据 管理方法, 其特征在于, 所述关键字段匹配规则包括模糊 匹配规则和精确匹配规则, 所述机器学习模型还用于确定所述数据集的数据特征中的关键 字段的扫描时间相对于命中率的优先级, 所述二级特征分类库用于按照所述模糊匹配规则 识别所述数据集的数据特征中的扫描时间相对于命中率的优先级较低的关键字段以及用 于按照所述精确匹配规则识别所述数据集的数据特征中的扫描时间相对于命中率的优先 级较高的关键 字段。 8.根据权利要求6所述的数据管理方法, 其特征在于, 所述机器学习模型还用于, 对所 识别的所述数据集的数据特 征中的关键 字段进行正则化处 理。 9.根据权利要求1所述的数据管理方法, 其特征在于, 所述检索偏好包括至少一个标 签, 当所述数据测绘结果符合所述至少一个标签中的一个或者多个标签时显示所述数据 集。 10.根据权利要求9所述的数据管理方法, 其特征在于, 所述检索偏好还包括至少一个 时间要求, 当所述数据测绘结果符合所述至少一个时间要求时显示所述数据集, 所述至少 一个时间要求包括回溯时间范围、 使用时间范围或者销毁 时间范围。 11.根据权利要求9所述的数据管理方法, 其特征在于, 生成所述数据测绘结果包括按权 利 要 求 书 1/2 页 2 CN 115510297 A 2照多个特征标签标注所述数据集的数据特征, 所述检索偏好包括所述多个特征标签中的一 个或者多个特征标签, 当所述数据测绘结果符合所述一个或者多个特征标签时显示所述数 据集。 12.根据权利要求9所述的数据管理方法, 其特征在于, 所述检索偏好还包括使用次数 要求, 当所述数据集的使用次数符合所述使用次数要求时显示所述数据集。 13.根据权利要求1至12中任一项所述的数据管理方法, 其特征在于, 所述数据管理方 法还包括: 当所述数据应用方的进行中的任务数量达到第一阈值或者进行中的所述数据集相关 联的任务数量达 到第二阈值时, 禁止所述数据应用方发起所述数据集相关联的新任务。 14.一种非瞬时性计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有 计算机指令, 该计算机指令被处 理器执行时实现根据权利要求1至13中任一项所述的方法。 15.一种电子设备, 其特 征在于, 所述电子设备包括: 处理器; 用于存储处理器可执行指令的存 储器; 其中, 所述处理器通过运行所述可执行指令以实现根据权利要求1至13中任一项所述 的方法。权 利 要 求 书 2/2 页 3 CN 115510297 A 3

.PDF文档 专利 隐私计算、隐私数据和联邦学习的数据管理方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 隐私计算、隐私数据和联邦学习的数据管理方法 第 1 页 专利 隐私计算、隐私数据和联邦学习的数据管理方法 第 2 页 专利 隐私计算、隐私数据和联邦学习的数据管理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:16:18上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。