standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211131087.7 (22)申请日 2022.09.16 (71)申请人 北京数牍科技有限公司 地址 100083 北京市海淀区成府路28号优 盛大厦A座1801 (72)发明人 蔡超超 史路远 张鹏 (74)专利代理 机构 北京东方亿 思知识产权代理 有限责任公司 1 1258 专利代理师 彭琼 (51)Int.Cl. G06N 20/20(2019.01) G06N 5/00(2006.01) G06F 21/60(2013.01) G06F 21/62(2013.01) H04L 9/00(2022.01) (54)发明名称 XGBoost模型训练方法、 装置、 设备、 存储介 质及程序 产品 (57)摘要 本申请公开了一种XGBoost模型训练方法、 装置、 设备、 存储介质及程序产品。 该方法包括: 获取目标样 本集合, 所述目标样 本集合包括至少 一个第一样 本和至少一个第二样 本, 所述第一样 本为所述第一参与方和第二参与方的交集样本, 所述第二样本为所述第二参与方中除所述第一 样本之外的样本, 对第一梯度信息进行同态加 密, 得到所述至少一个第一样 本的第一同态加密 信息, 所述第一梯度信息包括所述至少一个第一 样本的一阶梯度和二阶梯度, 对0进行同态加密, 得到所述至少一个第二样本的第二同态加密信 息, 向所述第二参与方 发送所述第一同态加密信 息和所述第二同态加密信息。 根据本申请实施 例, 可以在保证模型的正确性的前提下保护交集 的信息。 权利要求书2页 说明书11页 附图2页 CN 115456203 A 2022.12.09 CN 115456203 A 1.一种XGBoost模型训练方法, 其特征在于, 所述方法应用于第一参与方, 所述方法包 括: 获取目标样本集合, 所述目标样本集合包括至少一个第一样本和至少一个第二样本, 所述第一样本为所述第一参与方和 第二参与方的交集样本, 所述第二样本为所述第二参与 方中除所述第一样本之外的样本; 对第一梯度信息进行同态加密, 得到所述至少一个第一样本的第一同态加密信息, 所 述第一梯度信息包括所述至少一个第一样本的一阶梯度和二阶梯度; 对0进行同态加密, 得到所述至少一个第二样本的第二同态加密信息; 向所述第二 参与方发送所述第一同态加密信息和所述第二同态加密信息 。 2.根据权利 要求1所述的XGBoost模型训练方法, 其特征在于, 所述第一参与方存储有N 个样本, 所述 N个样本对应N个加密信息, 其中, N 为正整数; 所述获取目标样本集 合, 包括: 接收所述第二 参与方发送的M个样本对应的M个加密信息, 其中, M为 正整数; 确定所述 N个加密信息和所述M个加密信息中交集加密信息; 将所述交集加密信息对应的样本确定为所述至少一个第一样本; 将所述M个加密信 息中除所述交集加密信 息之外的至少一个加密信 息所对应的样本确 定为所述至少一个第二样本; 根据所述至少一个第一样本和所述至少一个第二样本生成目标样本集 合。 3.根据权利要求2所述的XGBoost模型训练方法, 其特征在于, 所述根据所述至少一个 第一样本和所述至少一个第二样本生成目标样本集 合之后, 所述方法还 包括: 确定所述目标样本集 合中样本对应的索引信息; 向所述第二 参与方发送所述索引信息 。 4.根据权利要求1所述的XGBoost模型训练方法, 其特征在于, 所述向所述第二参与方 发送所述第一同态加密信息和所述第二同态加密信息之后, 所述方法还 包括: 接收所述第 二参与方发送的至少一组分组 的分组信 息, 所述分组信 息包括标识信 息和 当前分组的任一子树的第一梯度和信息, 所述第一梯度和信息包括任一子树中样本的一阶 梯度和以及二阶梯度和; 根据所述第一梯度和信息确定所述至少一组分组中各分组的得分值; 根据所述得分值从所述至少一组分组中选取最佳分组; 向所述第二 参与方发送所述 最佳分组的标识信息 。 5.一种XGBo ost模型训练装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取目标样本集合, 所述目标样本集合包括至少一个第一样本和至少 一个第二样本, 所述第一样本为所述第一参与方和第二参与方的交集样本, 所述第二样本 为所述第二 参与方中除所述第一样本之外的样本; 第一加密模块, 用于对第一梯度信息进行同态加密, 得到所述至少一个第一样本的第 一同态加密信息, 所述第一梯度信息包括所述至少一个第一样本的一阶梯度和二阶梯度; 第二加密模块, 用于对0进行同态加密, 得到所述至少一个第二样本的第 二同态加密信 息; 发送模块, 用于向所述第 二参与方发送所述第 一同态加密信 息和所述第 二同态加密信权 利 要 求 书 1/2 页 2 CN 115456203 A 2息。 6.根据权利要求5所述的XGBo ost模型训练装置, 其特 征在于, 所述获取模块包括: 第一接收单元, 用于接收所述第二参与方发送的M个样本对应的M个加密信息, 其中, M 为正整数; 交集确定单元, 用于确定所述N个加密信息和所述M个加密信 息中交集加密信息, 其中, N为正整数; 第一样本确定单元, 用于将所述交集加密信 息对应的样本确定为所述至少一个第 一样 本; 第二样本确定单元, 用于将所述M个加密信息中除所述交集加密信息之外的至少一个 加密信息所对应的样本确定为所述至少一个第二样本; 生成单元, 用于根据 所述至少一个第 一样本和所述至少一个第 二样本生成 目标样本集 合。 7.根据权利要求5所述的XGBoost模型训练装置, 其特征在于, 所述XGBoost模型训练装 置还包括: 索引确定单 元, 用于确定所述目标样本集 合中样本对应的索引信息; 第一发送单 元, 用于向所述第二 参与方发送所述索引信息 。 8.根据权利要求5所述的XGBoost模型训练装置, 其特征在于, 所述XGBoost模型训练装 置还包括: 第二接收单元, 用于接收所述第二参与方发送的至少一组分组的分组信息, 所述分组 信息包括标识信息和当前分组的任一子树的第一梯度和信息, 所述第一梯度和信息包括任 一子树中样本的一阶梯度和以及二阶梯度和; 评分单元, 用于根据所述第一梯度和信息确定所述至少一组分组中各分组的得分值; 选取单元, 用于根据所述得分值从所述至少一组分组中选取最佳分组; 第二发送单 元, 用于向所述第二 参与方发送所述 最佳分组的标识信息 。 9.一种XGBoost模型训练设备, 其特征在于, 所述XGBoost模型训练设备包括: 处理器以 及存储有计算机程序指令的存 储器; 所述处理器执行所述计算机程序指令时实现如权利要求1 ‑4中任一项所述的XGBoost 模型训练方法。 10.一种计算机存储介质, 其特征在于, 所述计算机存储介质上存储有计算机程序指 令, 所述计算机程序指 令被处理器执行时实现如权利要求 1‑4中任一项所述的XGBoost模 型 训练方法。 11.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序指令, 所 述计算机程序指令被处理器执行时实现权利要求1 ‑4中任一项所述的XGBoost模型训练方 法。权 利 要 求 书 2/2 页 3 CN 115456203 A 3
专利 XGBoost模型训练方法、装置、设备、存储介质及程序产品
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:10:15
上传分享
举报
下载
原文档
(542.2 KB)
分享
友情链接
T-CQTX 0001—2023 蒸汽锅炉水容积测试技术规范.pdf
蚂蚁集团 安全平行切面白皮书 2021.pdf
GB-T 24564-2009 高炉热风炉节能监测.pdf
GB-T 42392-2023 洁净手术部通用技术要求.pdf
GB-T 39680-2020 信息安全技术 服务器安全技术要求和测评准则.pdf
GB-T 1470-2014 铅及铅锑合金板.pdf
GB-T 25060-2010 信息安全技术 公钥基础设施 X.509数字证书应用接口规范.pdf
GB-T 41665-2022 制造执行系统模块化框架.pdf
NY-T 1215-2006 水稻光、温敏雄性核不育系育性鉴定规程.pdf
GB-T 36896.3-2018 轻型有缆遥控水下机器人 第3部分:导管螺旋桨推进器.pdf
GB-T 13061-2017 商用车空气悬架用空气弹簧技术规范.pdf
CSA 基于个人信息保护法的合规控制验证框架.pdf
GB-T 7702.7-2023 煤质颗粒活性炭试验方法 第7部分:碘吸附值的测定.pdf
GB-T 41269-2022 网络关键设备安全技术要求 路由器设备.pdf
GM-T 0035.2-2014 射频识别系统密码应用技术要求 第2部分:电子标签芯片密码应用技术要求.pdf
GB-T 50087-2013 工业企业噪声控制设计规范.pdf
MZ-T 158-2020 固定在座便器上的助力扶手.pdf
GB-T 24936-2010 全地形车 术语.pdf
GB-T 16606.3-2018 快递封装用品 第3部分:包装袋.pdf
GB-T 5541-2017 分散染料 高温分散稳定性的测定 双层滤纸过滤法.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(542.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。