(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211164422.3 (22)申请日 2022.09.23 (71)申请人 南京农业大 学 地址 210000 江苏省南京市玄武区卫岗1号 (72)发明人 李延斌 王雪梅 任守纲  (74)专利代理 机构 南京天华专利代理有限责任 公司 32218 专利代理师 刘畅 徐冬涛 (51)Int.Cl. G06N 20/00(2019.01) G06F 21/62(2013.01) G06F 21/60(2013.01) (54)发明名称 基于信任度的分散式联邦学习的医疗机构 数据共享方法 (57)摘要 本发明公开了一种基于信任度的分散式联 邦学习的医疗机构数据共享方法, 包含以下步 骤: 所有医疗机构随机分组, 选出代表性机构; 每 组计算平均梯度值与可信度; 代表 性医疗机构计 算自己与其余代表性医疗机构的欧氏距离; 代表 性机构之间根据信任度/欧氏距离选出最终参与 聚合的代表 性医疗机构的参数; 计算所选机构参 数的平均值更新全局模型。 本发 明基于分散式联 邦学习实现分层聚合, 以此 实现隐私保护与鲁棒 性; 实验结果表明, 在不同规模的恶意医疗机构 场景下, 本方法均能取得较好的实验效果。 权利要求书1页 说明书3页 附图2页 CN 115423119 A 2022.12.02 CN 115423119 A 1.一种基于信任度的分散式联邦学习的医疗机构数据共享方法, 包 含以下步骤: 步骤1: 所有的医疗机构随机分组, 每组选出一家 代表性医疗机构; 步骤2: 每组的医疗机构根据其本地数据集训练模型参数, 利用同态加密算法对梯度值 进行加密处理, 并将加密后的梯度值发送给代表性医疗机构, 代表性医疗机构计算各组内 模型参数的平均值, 并将选择本地训练数据集作为测试集, 计算可信度; 步骤3: 代表性医疗机构之间互相发送各自的参数与可信度, 计算自己与其余代表性医 疗机构参数之间的欧氏距离; 步骤4: 代表性医疗机构根据可信度和欧氏距离选择最终参加聚合的代表性医疗机构 的参数; 步骤5: 计算所选代 表性医疗机构的参数的平均值作为 参数值以进行全局模型的更新。 2.根据权利要求1所述的方法, 其特征在于, 步骤1中选择代表性医疗机构的方法具体 为: 将所有医疗机构视为无向图中的顶点, 机构之间的通信距离视为无向图中的边, 根据 Dijkstra算法求出每个医疗机构 到其余机构的最短路径, 将所得路径最短的机构视为每组 的代表性医疗机构。 3.根据权利要求1所述的方法, 其特 征在于, 步骤2中计算可信度 的方法具体为: 其中, f(·)表示损失函数, f(x; ξ )表示全局参数的损失值, x表示当前轮次的全局参 数, ξ表示该节点的本地数据样 本, η表示学习率, g表 示单个节 点进行本地训练所得的梯度, 表示第i组。 4.根据权利要求1所述的方法, 其特 征在于, 步骤4中选择参数的方法具体为: 其中, 表示对应分组的可信度, 表示对应分组计算的与其他代表性医疗机构的 梯度的欧氏距离, argmax( ·)表示返回数组中最大值 的梯度, c表示小组个数, 表示第i 组。权 利 要 求 书 1/1 页 2 CN 115423119 A 2基于信任度的分散式联邦学习的医疗机构数据 共享方法 技术领域 [0001]本发明涉及医疗数据共享隐私保护领域, 尤其涉及联邦学习、 同态加密的方法。 具 体是一种基于信任度的分散式联邦学习的医疗机构数据共享方法。 背景技术 [0002]互联网、 大数据分析、 移动边缘计算等技术的爆发式增长推动了 “共享经济 ”的发 展。 随着海量医疗数据的产生以及时代发展的需要, 人们将共享经济的关注点转向医疗行 业。 但由于医疗数据涉及患者隐私且独立存储于医疗机构的数据库中, 因此, 利用医疗数据 要考虑共享过程中的隐私保护和 “脏”数据的问题。 不仅如此, 集合多家医疗机构的第三方 也会存在不可信的问题, 因此, 考虑以分散式系统实现数据共享。 [0003]随着医疗大数据的发展, 医疗数据安全、 个人隐私保护、 可信第三方难以实现等问 题日益突出, 分散式联邦学习的隐私安全及鲁棒 性得到越来越多的重 视。 发明内容 [0004]本发明所解决的问题在于提供一种基于信任度的分散式联邦学习方法以实现医 疗数据安全共享。 以现有分散式联邦学习研究为基础, 结合集中式联邦学习的隐私安全和 鲁棒性研究, 实现分散式联邦学习的隐私安全, 提升其鲁棒 性。 [0005]技术方案: [0006]一种基于信任度的分散式联邦学习的医疗机构数据共享方法, 包 含以下步骤: [0007]步骤1: 所有的医疗机构随机分组, 每组选出一家 代表性医疗机构; [0008]步骤2: 每组的医疗机构 根据其本地数据集训练模型参数, 利用同态加密算法对梯 度值进行加密处理, 并将加密后的梯度值发送给代表性医疗机构, 代表性医疗机构计算各 组内模型参数的平均值, 并将选择本地训练数据集作为测试集, 计算可信度; [0009]步骤3: 代表性医疗机构之间互相发送各自的参数与可信度, 计算自己与其余代表 性医疗机构参数之间的欧氏距离; [0010]步骤4: 代表性医疗机构根据可信度和欧氏距离选择最终参加聚合的代表性医疗 机构的参数; [0011]步骤5: 计算所选代表性医疗机构的参数的平均值作为参数值以进行全局模型的 更新。 [0012]优选的, 步骤1中选择代 表性医疗机构的方法具体为: [0013]将所有医疗机构视为无向图中的顶点, 机构之间的通信距离视为无向图中的边, 根据Dijkstra算法求出每个医疗机构 到其余机构的最短路径, 将所得路径 最短的机构 视为 每组的代 表性医疗机构。 [0014]优选的, 步骤2中计算可信度 的方法具体为: [0015] 说 明 书 1/3 页 3 CN 115423119 A 3

.PDF文档 专利 基于信任度的分散式联邦学习的医疗机构数据共享方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于信任度的分散式联邦学习的医疗机构数据共享方法 第 1 页 专利 基于信任度的分散式联邦学习的医疗机构数据共享方法 第 2 页 专利 基于信任度的分散式联邦学习的医疗机构数据共享方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:13:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。