文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211058933.7 (22)申请日 2022.08.31 (71)申请人 中国平安人寿保险股份有限公司 地址 518000 广东省深圳市福田区福田街 道益田路5033号平安金融中心14、 15、 16、 37、 41、 4 4、 45、 46、 54、 58、 59层 (72)发明人 钱金华 (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 廖慧贤 (51)Int.Cl. G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 资讯分类模型自动训练方法、 系统、 装置及 存储介质 (57)摘要 本申请公开了一种资讯分类模型自动训练 方法、 系统、 装置及存储介质, 训练方法包括获取 第一资讯集; 所述第一资讯集包括当日新增资 讯; 根据所述第一资讯集, 确定第二资讯集; 所述 第二资讯集包括历史新增资讯; 根据所述第一资 讯集, 确定第一分类标签集; 所述第一分类标签 集包括标签内容量排序超过第一预设阈值的新 分类标签; 根据所述第一资讯集以及所述第二资 讯集, 对模型训练样本进行样本重构, 得到第一 样本数据集; 将所述第一分类标签集以及所述第 一样本数据集输入原始模型进行训练, 得到目标 分类模型。 该训练方法可以提高资讯分类模型预 测准确度; 本申请可广泛应用于资讯分类技术领 域内。 权利要求书2页 说明书13页 附图4页 CN 115292502 A 2022.11.04 CN 115292502 A 1.一种资 讯分类模型自动训练方法, 其特 征在于, 包括: 获取第一资 讯集; 所述第一资 讯集包括当日新增资 讯; 根据所述第一资 讯集, 确定第二资 讯集; 所述第二资 讯集包括历史新增资 讯; 根据所述第一资讯集, 确定第一分类标签集; 所述第一分类标签集包括标签内容量排 序超过第一预设阈值的新分类标签; 根据所述第一资讯集以及所述第二资讯集, 对模型训练样本进行样本重构, 得到第一 样本数据集; 将所述第一分类标签集以及所述第 一样本数据集输入原始模型进行训练, 得到目标分 类模型。 2.根据权利要求1所述的一种资讯分类模型自动训练方法, 其特征在于, 所述根据 所述 第一资讯集, 确定第一分类标签集, 包括: 对第一资讯集的所有子资讯进行标签分类, 确定子资讯的第二分类标签; 所述第二分 类标签包括 新增分类标签; 提取各个所述第二分类标签对应的子资 讯的资讯内容点击量以及资 讯内容发布量; 根据所述资讯内容点击量以及所述资讯内容发布量, 对所述第 二分类标签进行标签 内 容量排序; 根据所述标签内容量排序大于第一预设阈值的第二分类标签, 确定为第一分类标签 集。 3.根据权利要求1所述的一种资讯分类模型自动训练方法, 其特征在于, 所述根据 所述 第一资讯集, 确定第二资 讯集, 包括: 提取所述第一资 讯集的资 讯发布日期以及资 讯数量; 根据所述资 讯发布日期以及所述资 讯数量, 确定第二资 讯集。 4.根据权利要求3所述的一种资讯分类模型自动训练方法, 其特征在于, 所述根据 所述 资讯发布日期以及资 讯数量, 确定第二资 讯集, 包括: 根据资讯发布日期以及资讯数量, 确定若干个第二资讯子集; 所述第二资讯子集包括 资讯发布日期以前 单日的历史新增资 讯; 其中所述第二资 讯子集的资 讯数量满足 公式: 其中n≥1, n为单日历史新增 资讯的数量; a为衰减系数, 0<a<1; N为第一资讯集的资 讯数量; dt为资 讯发布日期与历史资 讯发布日期的差值; e为自然底数; 对所述第二资 讯子集进行并运 算, 确定第二资 讯集。 5.根据权利要求1所述的一种资讯分类模型自动训练方法, 其特征在于, 所述根据 所述 第一资讯集以及所述第二资讯集, 对模 型训练样本进 行样本重构, 得到第一样本数据集, 包 括: 将所述第一资 讯集以及所述第二资 讯集进行 数据融合, 得到第一样本数据; 根据所述第一样本数据, 得到第 一样本数据集; 其中, 所述第一资讯集的资讯数量在所 述第一样本数据集中占比为固定数值。 6.根据权利要求1所述的一种资讯分类模型自动训练方法, 其特征在于, 所述获取第 一权 利 要 求 书 1/2 页 2 CN 115292502 A 2资讯集, 包括: 获取当日所有新增资 讯; 提取所述当日所有新增资讯的若干个新增资讯作为第 一资讯集, 所述若干个新增资讯 对应至少一个新分类标签。 7.根据权利要求2所述的一种资讯分类模型自动训练方法, 其特征在于, 所述根据 所述 资讯内容点击量以及所述资讯内容发布量, 对所述第二分类标签进行标签内容量排序, 包 括: 确定资讯内容点击量的第一权 重以及资 讯内容发布量的第二权 重; 根据所述第一权 重以及所述资 讯内容点击量, 确定第一热度参数; 根据所述第二权 重以及所述资 讯内容发布量, 确定第二热度参数; 计算所述第一热度参数和所述第二热度参数的热度总和, 根据所述热度总和, 对所述 第二分类标签进行排序。 8.一种资 讯分类模型自动训练装置, 其特 征在于, 包括: 获取模块, 用于获取第一资 讯集; 第一处理模块, 用于根据所述第一资 讯集, 确定第二资 讯集; 第二处理模块, 用于根据 所述第一资讯集, 确定第 一分类标签集; 所述第 一分类标签集 包括标签内容 量排序超过第一预设阈值的新分类标签集 合; 第三处理模块, 用于根据所述第一资讯集以及第二资讯集, 对模型训练样本进行样本 重构, 得到第一样本数据集; 第四处理模块, 用于将所述第 一分类标签集以及所述第 一样本数据集输入原始模型进 行训练, 得到目标分类模型。 9.一种计算机设备, 其特 征在于, 包括: 至少一个处 理器; 至少一个存 储器, 用于存 储至少一个程序; 当所述至少一个程序被所述至少一个处理器执行, 使得所述至少一个处理器实现如权 利要求1‑7中任一项所述的资 讯分类模型自动训练方法。 10.一种计算机可读存储介质, 其中存储有处理器可执行的程序, 其特征在于: 所述处 理器可执行的程序在由处理器执行时用于实现如权利要求 1‑7中任一项 所述资讯分类模型 自动训练方法。权 利 要 求 书 2/2 页 3 CN 115292502 A 3
专利 资讯分类模型自动训练方法、系统、装置及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 02:16:13
上传分享
举报
下载
原文档
(804.3 KB)
分享
友情链接
CH-T 3005-2021 低空数字航空摄影规范.pdf
奇安信 中国政企机构数据安全风险研究报告.pdf
NB-T 11240-2023 空气源热泵干燥系统节能量和减排量计算方法.pdf
GB-T 29321-2012 光伏发电站无功补偿技术规范.pdf
T-ZZB 1236—2019 汽车减振器用轴承及其单元.pdf
JR-T0213-2021 金融网络安全 Web 应用服务安全测试通用 规范.pdf
T-CES 114—2022 智能型特高频局部放电在线监测装置 技术规范.pdf
GB-T 32746-2016 岩土工程仪器信号与接口.pdf
DB11-T 1448-2017 城市轨道交通工程资料管理规程 北京市.pdf
DB34-T 3897-2021 安徽科技大市场运营服务规范 安徽省.pdf
GB-T 26935-2011 集装箱钢材表面处理和涂料施工规范.pdf
GB-T 27563-2011 工业用N-甲基-2-吡咯烷酮.pdf
GB-T 19964-2024 光伏发电站接入电力系统技术规定.pdf
GB-T 6003.2-2012 试验筛 技术要求和检验 第2部分:金属穿孔板试验筛.pdf
T-SSITS 204—2023 工业应用移动机器人与其调度系统数据接口规范.pdf
GB-T 40482-2021 城市发展质量评价指标.pdf
GB-T 36344-2018信息技术数据质量评价指标.pdf
GM-T 0074-2019 网上银行密码应用技术要求.pdf
GB-T 23935-2009 圆柱螺旋弹簧设计计算.pdf
青藤 鹊桥SOAR解决方案.pdf
1
/
3
20
评价文档
赞助2元 点击下载(804.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。