(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211215646.2
(22)申请日 2022.09.30
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 王莹桂 王力 王磊
(74)专利代理 机构 北京永新同创知识产权代理
有限公司 1 1376
专利代理师 林锦辉 刘景峰
(51)Int.Cl.
G06V 40/16(2022.01)
G06V 10/774(2022.01)
G06V 10/44(2022.01)
G06F 21/62(2013.01)
(54)发明名称
用于训练图像识别模型的方法及装置
(57)摘要
本说明书的实施例提供用 于训练图像识别
模型的方法及装置。 在各个第一成员设备处, 对
训练样本图像数据进行基于频域变换的数据脱
敏处理以得到第一脱 敏图像数据; 将第一脱 敏图
像数据提供给超参数选择模型来选择第一超参
数; 使用第一超参数对第一脱敏图像数据进行基
于数据增强的图像 混合处理, 以得到第二脱 敏图
像数据以及经过标签混合处理的标记标签数据。
然后, 使用第二脱敏图像数据以及对应的经过标
签混合处理后的标记标签数据训练图像识别模
型。 第二成员设备使用从各个第一成员设备接收
的模型训练结果 来更新图像识别模型。
权利要求书4页 说明书20页 附图15页
CN 115497142 A
2022.12.20
CN 115497142 A
1.一种用于训练图像识别模型的方法, 所述方法由具有本地训练数据的第 一成员设备
执行, 所述方法包括:
循环执行下述模型训练过程, 直到满足模型训练结束条件:
获取当前训练样本图像数据及其标记标签数据;
对所述当前训练样本图像数据进行基于频域变换的数据脱敏处理, 以得到所述当前训
练样本图像数据的第一脱敏图像数据;
将所述第一脱敏图像数据提供给超参数选择模型来从候选超参数集中选择用于指示
参与图像混合处 理的图像 个数的第一超参数;
使用所述第 一超参数对所述第一脱敏图像数据进行基于Mixup数据增强的图像混合处
理, 以得到第二脱敏图像数据以及对应的经 过标签混合处 理的标记标签数据;
使用所述第二脱敏图像数据以及对应的经过标签混合处理的标记标签数据训练所述
当前图像识别模型; 以及
将所述当前图像识别模型的模型训练结果提供给用于维护图像识别模型的第二成员
设备, 以供所述第二成员设备使用来自多个第一成员设备的模型训练结果来进行图像识别
模型更新, 并从所述第二成员设备接收所述更新后的图像识别模型以用于下轮图像识别模
型训练。
2.如权利要求1所述的方法, 其中, 在将所述第 一脱敏图像数据提供给超参数选择模型
来从候选超参数集中选择用于指示参与图像混合处理的图像个数的第一超参数之前, 所述
方法还包括:
响应于满足第一预定条件, 通过 下述模型 更新过程 来更新所述超参数选择模型:
将所述第一脱敏图像数据提供给超参数选择模型来从所述候选超参数集中选择用于
指示参与图像混合处 理的图像 个数的第二超参数;
使用所述第 二超参数对所述第 一脱敏图像数据进行基于数据增强的图像混合处理, 以
得到第三脱敏图像数据以及对应的经 过标签混合处 理的标记标签数据;
将所述第三脱敏图像数据提供给所述当前图像识别模型, 得到所述第 三脱敏图像数据
的第二预测标签数据, 并根据所述第二预测标签数据以及 对应的经过标签混合处理后的标
记标签数据确定第一损失函数;
根据所述第一损失函数 更新所述当前图像识别模型;
将所述第三脱敏图像数据提供给更新后的当前图像识别模型, 得到所述第 三脱敏图像
数据的第三预测标签数据, 并根据所述第三预测标签数据以及 对应的经过标签混合处理后
的标记标签数据确定第二损失函数;
基于所述第一损失函数和所述第二损失函数, 确定所述第三损失函数; 以及
基于所述第三损失函数 更新所述超参数选择模型的模型参数。
3.如权利要求2所述的方法, 其中, 所述第一预定条件 包括:
所述图像识别模型的当前训练轮数与所述超参数选择模型的上一更新处理时的训练
轮数之间的轮数间隔达 到第一指定轮数。
4.如权利要求1所述的方法, 其中, 将所述当前图像识别模型的模型训练结果提供给所
述第二成员设备包括:
响应于满足第 二预定条件, 将所述当前图像识别模型的模型训练结果提供给所述第 二权 利 要 求 书 1/4 页
2
CN 115497142 A
2成员设备。
5.如权利要求 4所述的方法, 其中, 所述第二预定条件 包括:
所述图像识别模型的当前训练轮数与上次发送所述模型训练结果时的训练轮数之间
的轮数间隔达 到第二指定轮数。
6.如权利要求1所述的方法, 其中, 所述第一超参数为k, 以及 混合图像的最大权重系数
为Wmax,
使用所述第一超参数对所述第一脱敏图像数据进行基于数据增强的图像混合处理包
括:
对所述第一脱敏图像数据的图像数据集合进行k ‑1次打乱处理, 以得到k个图像数据集
合;
基于所述k个图像数据集合, 构建大小为m*k的图像超矩阵, 所述图像超矩阵中的第一
列对应所述第一脱敏图像数据的原始图像数据集合, 以及m为所述原始图像数据集合中的
图像数据的个数;
为所述图像超矩阵中的每 个图像数据随机生成权 重系数;
对所述图像超矩阵中的图像数据的权重系数进行行归一化, 使得每行图像数据的权重
系数的和为1, 并且每 个图像数据的权 重系数不大于Wmax; 以及
对所述图像超矩阵的每行图像数据进行加权求和, 得到大小为m*1的混合图像超矩阵,
所述混合图像超矩阵中的图像数据为经 过数据增强后的脱敏图像数据。
7.如权利要求1所述的方法, 其中, 对所述当前训练样本图像数据进行基于频域变换的
数据脱敏处 理包括:
对所述当前训练样本 图像数据进行局部频域变换处理, 以得到至少一个特征图, 每个
特征图包括多个元素并且对应所述当前训练样本图像数据中的一个数据块, 每个元素对应
频域中的一个频率;
分别使用所述至少一个特征图中的各个频率所对应的元素, 构建各个频率所对应的频
率分量通道特征图; 以及
从所构建的频率分量通道特征图中筛选出至少一个目标频率分量通道特征图, 以得到
所述当前训练样本图像数据的脱敏图像数据, 所筛选出的目标频率分量通道特征图是图像
识别的关键通道特 征。
8.如权利要求7所述的方法, 其中, 在从所构建的频率分量通道特征图中筛选出至少一
个目标频率分量 通道特征图后, 所述方法还 包括:
对所述目标 频率分量 通道特征图进行第一次洗牌处 理, 以得到第一洗牌特 征图; 以及
对所述第一洗牌特征图进行归一化处理, 得到所述当前训练样本图像数据的脱敏图像
数据。
9.如权利要求8所述的方法, 其中, 在对所述第一洗牌特征图进行归一化处理后, 所述
方法还包括:
对经过归一化处理后的第一洗牌特 征图进行通道混合处 理;
对经过通道混合处理后的第 一洗牌特征图进行第 二次洗牌处理, 以得到第 二洗牌特征
图; 以及
对所述第二洗牌特征图进行归一化处理, 以得到所述当前训练样本图像数据的脱敏图权 利 要 求 书 2/4 页
3
CN 115497142 A
3
专利 用于训练图像识别模型的方法及装置
文档预览
中文文档
40 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共40页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:15:51上传分享