(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211131087.7 (22)申请日 2022.09.16 (71)申请人 北京数牍科技有限公司 地址 100083 北京市海淀区成府路28号优 盛大厦A座1801 (72)发明人 蔡超超 史路远 张鹏  (74)专利代理 机构 北京东方亿 思知识产权代理 有限责任公司 1 1258 专利代理师 彭琼 (51)Int.Cl. G06N 20/20(2019.01) G06N 5/00(2006.01) G06F 21/60(2013.01) G06F 21/62(2013.01) H04L 9/00(2022.01) (54)发明名称 XGBoost模型训练方法、 装置、 设备、 存储介 质及程序 产品 (57)摘要 本申请公开了一种XGBoost模型训练方法、 装置、 设备、 存储介质及程序产品。 该方法包括: 获取目标样 本集合, 所述目标样 本集合包括至少 一个第一样 本和至少一个第二样 本, 所述第一样 本为所述第一参与方和第二参与方的交集样本, 所述第二样本为所述第二参与方中除所述第一 样本之外的样本, 对第一梯度信息进行同态加 密, 得到所述至少一个第一样 本的第一同态加密 信息, 所述第一梯度信息包括所述至少一个第一 样本的一阶梯度和二阶梯度, 对0进行同态加密, 得到所述至少一个第二样本的第二同态加密信 息, 向所述第二参与方 发送所述第一同态加密信 息和所述第二同态加密信息。 根据本申请实施 例, 可以在保证模型的正确性的前提下保护交集 的信息。 权利要求书2页 说明书11页 附图2页 CN 115456203 A 2022.12.09 CN 115456203 A 1.一种XGBoost模型训练方法, 其特征在于, 所述方法应用于第一参与方, 所述方法包 括: 获取目标样本集合, 所述目标样本集合包括至少一个第一样本和至少一个第二样本, 所述第一样本为所述第一参与方和 第二参与方的交集样本, 所述第二样本为所述第二参与 方中除所述第一样本之外的样本; 对第一梯度信息进行同态加密, 得到所述至少一个第一样本的第一同态加密信息, 所 述第一梯度信息包括所述至少一个第一样本的一阶梯度和二阶梯度; 对0进行同态加密, 得到所述至少一个第二样本的第二同态加密信息; 向所述第二 参与方发送所述第一同态加密信息和所述第二同态加密信息 。 2.根据权利 要求1所述的XGBoost模型训练方法, 其特征在于, 所述第一参与方存储有N 个样本, 所述 N个样本对应N个加密信息, 其中, N 为正整数; 所述获取目标样本集 合, 包括: 接收所述第二 参与方发送的M个样本对应的M个加密信息, 其中, M为 正整数; 确定所述 N个加密信息和所述M个加密信息中交集加密信息; 将所述交集加密信息对应的样本确定为所述至少一个第一样本; 将所述M个加密信 息中除所述交集加密信 息之外的至少一个加密信 息所对应的样本确 定为所述至少一个第二样本; 根据所述至少一个第一样本和所述至少一个第二样本生成目标样本集 合。 3.根据权利要求2所述的XGBoost模型训练方法, 其特征在于, 所述根据所述至少一个 第一样本和所述至少一个第二样本生成目标样本集 合之后, 所述方法还 包括: 确定所述目标样本集 合中样本对应的索引信息; 向所述第二 参与方发送所述索引信息 。 4.根据权利要求1所述的XGBoost模型训练方法, 其特征在于, 所述向所述第二参与方 发送所述第一同态加密信息和所述第二同态加密信息之后, 所述方法还 包括: 接收所述第 二参与方发送的至少一组分组 的分组信 息, 所述分组信 息包括标识信 息和 当前分组的任一子树的第一梯度和信息, 所述第一梯度和信息包括任一子树中样本的一阶 梯度和以及二阶梯度和; 根据所述第一梯度和信息确定所述至少一组分组中各分组的得分值; 根据所述得分值从所述至少一组分组中选取最佳分组; 向所述第二 参与方发送所述 最佳分组的标识信息 。 5.一种XGBo ost模型训练装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取目标样本集合, 所述目标样本集合包括至少一个第一样本和至少 一个第二样本, 所述第一样本为所述第一参与方和第二参与方的交集样本, 所述第二样本 为所述第二 参与方中除所述第一样本之外的样本; 第一加密模块, 用于对第一梯度信息进行同态加密, 得到所述至少一个第一样本的第 一同态加密信息, 所述第一梯度信息包括所述至少一个第一样本的一阶梯度和二阶梯度; 第二加密模块, 用于对0进行同态加密, 得到所述至少一个第二样本的第 二同态加密信 息; 发送模块, 用于向所述第 二参与方发送所述第 一同态加密信 息和所述第 二同态加密信权 利 要 求 书 1/2 页 2 CN 115456203 A 2息。 6.根据权利要求5所述的XGBo ost模型训练装置, 其特 征在于, 所述获取模块包括: 第一接收单元, 用于接收所述第二参与方发送的M个样本对应的M个加密信息, 其中, M 为正整数; 交集确定单元, 用于确定所述N个加密信息和所述M个加密信 息中交集加密信息, 其中, N为正整数; 第一样本确定单元, 用于将所述交集加密信 息对应的样本确定为所述至少一个第 一样 本; 第二样本确定单元, 用于将所述M个加密信息中除所述交集加密信息之外的至少一个 加密信息所对应的样本确定为所述至少一个第二样本; 生成单元, 用于根据 所述至少一个第 一样本和所述至少一个第 二样本生成 目标样本集 合。 7.根据权利要求5所述的XGBoost模型训练装置, 其特征在于, 所述XGBoost模型训练装 置还包括: 索引确定单 元, 用于确定所述目标样本集 合中样本对应的索引信息; 第一发送单 元, 用于向所述第二 参与方发送所述索引信息 。 8.根据权利要求5所述的XGBoost模型训练装置, 其特征在于, 所述XGBoost模型训练装 置还包括: 第二接收单元, 用于接收所述第二参与方发送的至少一组分组的分组信息, 所述分组 信息包括标识信息和当前分组的任一子树的第一梯度和信息, 所述第一梯度和信息包括任 一子树中样本的一阶梯度和以及二阶梯度和; 评分单元, 用于根据所述第一梯度和信息确定所述至少一组分组中各分组的得分值; 选取单元, 用于根据所述得分值从所述至少一组分组中选取最佳分组; 第二发送单 元, 用于向所述第二 参与方发送所述 最佳分组的标识信息 。 9.一种XGBoost模型训练设备, 其特征在于, 所述XGBoost模型训练设备包括: 处理器以 及存储有计算机程序指令的存 储器; 所述处理器执行所述计算机程序指令时实现如权利要求1 ‑4中任一项所述的XGBoost 模型训练方法。 10.一种计算机存储介质, 其特征在于, 所述计算机存储介质上存储有计算机程序指 令, 所述计算机程序指 令被处理器执行时实现如权利要求 1‑4中任一项所述的XGBoost模 型 训练方法。 11.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序指令, 所 述计算机程序指令被处理器执行时实现权利要求1 ‑4中任一项所述的XGBoost模型训练方 法。权 利 要 求 书 2/2 页 3 CN 115456203 A 3

.PDF文档 专利 XGBoost模型训练方法、装置、设备、存储介质及程序产品

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 XGBoost模型训练方法、装置、设备、存储介质及程序产品 第 1 页 专利 XGBoost模型训练方法、装置、设备、存储介质及程序产品 第 2 页 专利 XGBoost模型训练方法、装置、设备、存储介质及程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:10:15上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。