文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211261286.X (22)申请日 2022.10.14 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 毛丽雯 卢成业 南方 (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张思淼 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/10(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种用于员工离职倾向预测的模型训练方 法及装置 (57)摘要 本申请公开一种用于员工离职倾向预测的 模型训练方法, 包括: 将员工数据样本进行预处 理得到不完整数据样本, 并将不完整数据样本进 行预填补后加入到模型训练的过程中, 有效提高 了员工数据样本的利用率, 将填补数据作为变 量, 在模型训练的过程中动态更新, 通过计算代 价函数更新模 型的参数, 逐渐降低了预填补带来 的估计误差, 实现了对与不完整数据样本中缺失 数据的填补, 得到的预测模型不仅能够预测离职 倾向率, 当输入模型的员工基本信息不完整时, 还可以获得完整的员工数据, 使用完整的员工数 据进行预测, 提高了员工 离职预测的准确率。 权利要求书2页 说明书9页 附图5页 CN 115511199 A 2022.12.23 CN 115511199 A 1.一种用于员工 离职倾向预测的模型训练方法, 其特 征在于, 所述方法包括: 对员工数据样本进行预处理, 得到不完整数据样本; 其中, 所述不完整数据样本 中的员 工数据缺失挽留难度和至少一项员工基本信息; 对所述不完整数据样本中的缺失数据进行预填补, 得到输入数据样本, 并在所述输入 数据样本中标记填补数据的位置; 将所述输入数据样本输入模型训练, 对所述填补数据进行更新得到预测数据样本, 并 根据所述预测数据样本计算离职倾向率; 根据代价函数对所述模型进行优化; 其中, 所述代价函数是由所述员工数据样本和所 述预测数据样本计算得到的; 将第m次训练得到的预测数据样本作为第m+1次训练的输入数据样本, 输入所述模型进 行训练, 直至训练次数达到阈值n时, 将第n次训练后的模型保存为预测模型; 其中, 所述预 测模型通过对所述填补数据的更新获得完整员工数据, 并根据所述完整员工数据预测所述 离职倾向率。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述不完整数据样本 中的缺失数据 进行预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置包括: 将所述不完整数据样本按照4:1的比例划分为训练集和测试集, 对所述训练集中的缺 失数据进行 预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置 。 3.根据权利要求2所述的方法, 其特征在于, 在所述直至训练次数达到阈值n时, 将第n 次训练后的模型保存为预测模型之后进一 步包括: 对所述测试集中的缺失数据进行 预填补, 得到测试 数据样本; 将所述测试 数据样本 输入所述预测模型, 得到所述预测数据样本和所述离职倾向率; 根据所述挽留难度与挽留因素之间的对应关系, 将所述预测数据样本中的挽留难度转 换为所述挽留因素; 其中, 所述挽留因素与所述挽留难度一 一对应; 将所述挽留因素和所述离职倾向率可视化输出, 以便企业及时采取相对应的措施。 4.根据权利要求1所述的方法, 其特征在于, 在所述对员工数据样本进行预处理, 得到 不完整数据样本之前进一 步包括: 收集员工数据, 生成初始数据样本; 对所述初始数据样本进行数据清洗, 删除与预测员工离职无关的信息, 并对字符串型 数据进行数值化处理, 对离散型数据进 行二值化处理, 对连续性数据进 行归一化处理, 得到 所述员工数据样本 。 5.根据权利要求1所述的方法, 其特征在于, 所述对员工数据样本进行预处理, 得到不 完整数据样本包括: 删除员工数据样本 中的每条员工数据的挽留难度, 并在每条员工数据中随机删除至少 一项员工基本信息, 得到不完整数据样本 。 6.一种用于员工 离职倾向预测的模型训练装置, 其特 征在于, 所述装置包括: 数据预处理单元, 用于: 对员工数据样本进行预处理, 得到不完整数据样本; 其中, 所述 不完整数据样本中的员工数据缺失挽留难度和至少一项员工基本信息; 数据预填补单元, 用于: 对所述不完整数据样本中的缺失数据进行预填补, 得到输入数 据样本, 并在所述输入数据样本中标记填补数据的位置;权 利 要 求 书 1/2 页 2 CN 115511199 A 2模型训练单元, 用于: 将所述输入数据样本输入模型训练, 对所述填补数据进行更新得 到预测数据样本, 并根据所述预测数据样本计算离职倾向率; 模型优化单元, 用于: 根据代价函数对所述模型进行优化; 其中, 所述代价函数是由所 述员工数据样本和所述预测数据样本计算得到的; 所述模型训练单元还用于: 将第m次训练得到的预测数据样本作为第m+1次训练的输入 数据样本, 输入所述模型进 行训练, 直至训练 次数达到阈值n时, 将第n次训练后的模型保存 为预测模 型; 其中, 所述预测模 型通过对所述填补数据的更新获得完整员工数据, 并根据所 述完整员工数据预测所述离职倾向率。 7.根据权利要求6所述的装置, 其特 征在于, 所述数据预填补单 元还用于: 将所述不完整数据样本按照4:1的比例划分为训练集和测试集, 对所述训练集中的缺 失数据进行 预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置 。 8.根据权利要求7 所述的装置, 其特 征在于, 所述装置进一 步包括: 模型测试 单元, 用于: 对所述测试集中的缺失数据进行 预填补, 得到测试 数据样本; 所述模型测试单元还用于: 将所述测试数据样本输入所述预测模型, 得到所述预测数 据样本和所述离职倾向率; 所述模型测试单元还用于: 根据所述挽留难度与挽留因素之间的对应关系, 将所述预 测数据样本中的挽留难度转换为所述挽留因素; 其中, 所述挽留因素与所述挽留难度一一 对应; 所述模型测试单元还用于: 将所述挽留因素和所述离职倾向率可视化输出, 以便企业 及时采取相对应的措施。 9.根据权利要求6所述的装置, 其特 征在于, 所述装置进一 步包括: 数据清洗单 元, 用于: 收集员工数据, 生成初始数据样本; 所述数据清洗单元还用于: 对所述初始数据样本进行数据清洗, 删除与预测员工离职 无关的信息, 并对字符串 型数据进行数值化处理, 对离散型数据进 行二值化处理, 对连续性 数据进行归一 化处理, 得到所述员工数据样本 。 10.根据权利要求6所述的装置, 其特 征在于, 所述数据预处 理单元还用于: 删除员工数据样本 中的每条员工数据的挽留难度, 并在每条员工数据中随机删除至少 一项员工基本信息, 得到不完整数据样本 。权 利 要 求 书 2/2 页 3 CN 115511199 A 3
专利 一种用于员工离职倾向预测的模型训练方法及装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:24:35
上传分享
举报
下载
原文档
(826.1 KB)
分享
友情链接
DB32-T 3614-2019 工贸企业安全风险管控基本规范 江苏省.pdf
DB52-T 1539.3-2021 政务云 第3部分:云计算平台运维管理规范 贵州省.pdf
GB-T 22080-XXXX ISO IEC 27001 2022 信息安全技术 信息安全管理体系 要求.pdf
GB-T 18336.1-2015 信息技术 安全技术 信息技术安全评估准则 第1部分:简介和一般模型.pdf
GB-T 15102-2017 浸渍胶膜纸饰面纤维板和刨花板.pdf
绿盟 2019工业控制系统信息安全保障框架.pdf
DB22-T 1707-2012 用能单位供配电系统节能监测 吉林省.pdf
GB-T 43512-2023 全钒液流电池可靠性评价方法.pdf
GB-T 20272-2019 信息安全技术 操作系统安全技术要求.pdf
GB-T 36629.2-2018 信息安全技术 公民网络电子身份标识安全技术要求 第2部分:载体安全技术要求.pdf
奇安信 实战攻防之紫队视角下的实战攻防演习组织.pdf
GM-T 0074-2019 网上银行密码应用技术要求.pdf
GB-T 12688.5-2019 工业用苯乙烯试验方法 第5部分:总醛含量的测定 滴定法.pdf
DB42-T 1833-2022 河道管理范围钻孔封孔技术规程 湖北省.pdf
DB32-T 3514.8-2019 电子政务外网建设规范 第8部分:运维服务 江苏省.pdf
6-02-06-03 白酒酿造工.pdf
DB3301-T 0233—2018 数字化城市管理无人机信息采集管理规范 杭州市.pdf
JR-T0171-2020 个人金融信息保护技术规范.pdf
T-ZZB 1671—2020 竹木纤维装饰板.pdf
GB-T 31257-2014 蹦极通用技术条件.pdf
1
/
17
评价文档
赞助2元 点击下载(826.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。