(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211259141.6 (22)申请日 2022.10.14 (71)申请人 展讯通信 (上海) 有限公司 地址 201203 上海市浦东 新区中国 (上海) 自由贸易试验区祖冲之路2288弄展讯 中心1号楼 (72)发明人 陈纬 刘志坚  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 董建姣 刘芳 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/52(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 模型训练方法、 装置及设备 (57)摘要 本申请实施例提供一种模型训练方法、 装置 及设备。 该方法包括: 获取训练数据集和验证数 据集, 训练数据集和验证数据集 分别包括多张样 本图像、 每个样本图像对应的样 本区域和样本区 域的样本识别结果; 确定初始模型, 并通过训练 数据集对初始模型进行训练, 得到第一模型; 根 据预设精度损失值和验证数据集, 对第一模型进 行剪裁处理, 得到第二模型; 对第二模型进行模 型量化处理, 得到目标模型, 目标模型用于确定 在图像中确定目标区域和目标区域的识别结果。 在上述过程中, 通过构建目标模 型对检测结果图 像进行自动识别, 以获得检测结果图像对应的识 别结果, 无需人工进行识别, 提高了对检测结果 图像的识别效率。 权利要求书3页 说明书13页 附图4页 CN 115527092 A 2022.12.27 CN 115527092 A 1.一种模型训练方法, 其特 征在于, 包括: 获取训练数据集和验证数据集, 所述训练数据集和所述验证数据集分别包括多 张样本 图像、 每个样本图像对应的样本区域和所述样本区域的样本识别结果; 确定初始模型, 并通过 所述训练数据集对初始模型进行训练, 得到第一模型; 根据预设精度损 失值和所述验证数据集, 对所述第一模型进行剪裁处理, 得到第二模 型; 对所述第二模型进行模型量化处理, 得到目标模型, 所述目标模型用于确定在图像中 确定目标区域和所述目标区域的识别结果。 2.根据权利要求1所述的方法, 其特征在于, 根据预设精度损 失值和所述验证数据集, 对所述第一模型进行剪 裁处理, 得到第二模型, 包括: 根据所述预设精度损失值和所述验证数据集, 确定所述第 一模型中通道的目标剪裁比 例; 根据所述第一模型中通道的目标剪裁比例, 对所述第一模型进行剪裁处理, 得到所述 第二模型。 3.根据权利要求2所述的方法, 其特征在于, 根据 所述预设精度损失值和所述验证数据 集, 确定所述第一模型中通道的目标剪 裁比例, 包括: 按照多个预设剪 裁比例对所述第一模型进行 预剪裁, 得到多个待选模型; 通过所述验证数据集对所述多个待选模型进行测试, 得到每个预设剪裁比例对应的精 度损失值; 根据所述预设精度损失值和每个预设剪裁比例对应的精度损失值, 在所述多个预设剪 裁比例中确定所述目标剪 裁比例。 4.根据权利要求3所述的方法, 其特征在于, 根据 所述预设精度损失值和每个预设剪裁 比例对应的精度损失值, 在所述多个预设剪 裁比例中确定所述目标剪 裁比例, 包括: 根据所述预设精度损失值和每个预设剪裁比例对应的精度损失值, 在所述多个预设剪 裁比例中确定待选剪裁比例, 所述待选剪裁比例对应的精度损失值小于或等于所述预设精 度损失值; 将精度损失值与所述预设精度损失值差值最小的待选剪裁比例, 确定为所述目标剪裁 比例。 5.根据权利要求1 ‑4任一项所述的方法, 其特 征在于, 确定初始模型, 包括: 获取YOLO模型; 将所述YOLO模型的主干网络更新为混洗网络, 在所述YOLO模型中删除中尺度特征层, 以及更新所述YOLO模型的损失函数, 得到所述初始模型。 6.根据权利要求1 ‑5任一项所述的方法, 其特征在于, 获取训练数据集和验证数据集, 包括: 获取多个初始图像; 对所述多个初始图像进行增强处 理, 得到多个样本图像; 通过预设工具对所述多个样本图像进行标注处理, 得到每个样本图像的图像识别结 果; 根据所述多个样本图像和每个样本图像的图像识别结果, 确定所述训练数据集和所述权 利 要 求 书 1/3 页 2 CN 115527092 A 2验证数据集。 7.根据权利要求6所述的方法, 其特征在于, 针对所述多个初始图像中的任意一个初始 图像; 对所述初始图像进行增强处 理, 得到所述初始图像对应的多个样本图像, 包括: 对所述初始图像进行如下处理中的至少一种, 以得到所述初始图像对应的多个样本图 像: 缩放处理、 翻转处理、 平移处理、 旋转处理、 灰度填补处理、 均值化处理、 方差标准化处 理、 颜色变换处 理、 混合图像处 理、 随机多尺度操作处 理。 8.根据权利要求1 ‑7任一项所述的方法, 其特征在于, 通过所述训练数据集对初始模型 进行训练, 得到第一模型, 包括: 通过所述初始模型对所述训练集中的样本图像进行处理, 以在所述样本图像中确定预 测区域, 所述预测区域对应预测框; 确定所述样本区域对应的样本 框的样本面积和样本中心点; 根据所述预测框的预测面积、 预测中心点、 所述样本面积和所述样本中心点, 确定损失 函数的损失值; 根据所述损 失值更新所述初始模型的模型参数, 直至所述初始模型收敛时, 得到所述 第一模型。 9.根据权利要求1 ‑8任一项所述的方法, 其特 征在于, 所述方法还 包括: 确定待处 理图像; 对所述待处 理图像进行 预处理; 通过所述目标模型对所述预处理后的图像进行处理, 以确定得到第一目标区域、 和所 述第一目标区域的识别结果。 10.一种模型训练装置, 其特征在于, 所述装置包括: 获取模块、 第一确定模块、 剪裁模 块、 量化模块, 其中, 所述获取模块用于, 获取训练数据集和验证数据集, 所述训练数据集和所述验证数据 集分别包括多张样本图像、 每个样本图像对应的样本区域和所述样本区域的样本识别结 果; 所述第一确定模块用于, 确定初始模型, 并通过所述训练数据集对初始模型进行训练, 得到第一模型; 所述剪裁模块用于, 根据预设精度损 失值和所述验证数据集, 对所述第一模型进行剪 裁处理, 得到第二模型; 所述量化模块用于, 对所述第 二模型进行模型量化处理, 得到目标模型, 所述目标模型 用于确定在图像中确定目标区域和所述目标区域的识别结果。 11.一种终端设备, 其特 征在于, 包括: 处 理器和存 储器; 所述存储器用于, 存 储计算机程序; 所述处理器用于, 执行所述存储器中存储的计算机程序, 实现如权利要求1至9中任一 项所述的方法。 12.一种计算机可读存储介质, 其特征在于, 其中, 所述计算机可读存储介质中存储有 计算机执行指 令, 当所述计算机执行指 令被处理器执行时用于实现权利要求 1至9任一项 所 述的方法。 13.一种计算机程序产品, 其特征在于, 包括计算机程序, 该计算机程序被处理器执行权 利 要 求 书 2/3 页 3 CN 115527092 A 3

PDF文档 专利 模型训练方法、装置及设备

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、装置及设备 第 1 页 专利 模型训练方法、装置及设备 第 2 页 专利 模型训练方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:35上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。