专利 一种基于相似性正则化类内挖掘的跨粒度小样本学习方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211012661.7 (22)申请日 2022.08.23 (71)申请人上海交通大学地址 200240 上海市闵行区东川路80 0号 (72)发明人杨华　杨锦海　 (74)专利代理机构上海恒慧知识产权代理事务所(特殊普通合伙) 31317 专利代理师徐红银　张琳 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/74(2022.01) G06V 10/40(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种基于相似性正则化类内挖掘的跨粒度小样本学习方法 (57)摘要本发明提供一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，包括：利用图像特征提取网络生成训练图像样本特征；实施第一优化环，利用弱监督对深度学习模型的粗粒度类别间语义辨识性进行约束；实施第二优化环，通过对称的特征嵌入器和非对称的特征预测器，实现粗粒度类别内部的相似性正则化；将第一优化环与第二优化环损失相加，对整个网络结构进行端到端的误差反向传播，对网络参数进行优化；利用场景式微调使得到的图像特征提取网络适应小样本分类任务，最终得到细粒度小样本分类模型。本发明联合并改进弱监督和自监督两种学习范式的协同优化，同时考虑粗粒度类别的类内和类间辨识性，能得到更具有细粒度辨识能力的小样本分类模型。权利要求书3页说明书9页附图1页 CN 115359294 A 2022.11.18 CN 115359294 A 1.一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，其特征在于，包括：利用图像特征提取网络生成训练图像样本特征；基于所述图像样本特征，实施第一优化环，利用弱监督对深度学习模型的粗粒度类别间的语义辨识性进行约束；基于所述图像样本特征，实施第二优化环，通过对称的特征嵌入器和非对称的特征预测器，实现粗粒度类别内部的相似性正则化约束；将所述第一优化环与所述第二优化环两部分损失相加，对整个网络结构进行端到端的误差反向传播，对网络参数进行优化，得到优化的图像特征提取网络；利用场景式微调使得所述优化的图像特征提取网络适应小样本分类任务，最终得到细粒度小样本分类模型。 2.根据权利要求1所述的一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，其特征在于，所述利用图像特征提取网络生成训练图像样本特征，包括：构建所述图像特征提取网络；定义数据增广集合；训练集中的图像样本基于所述数据增广集合和所述图像特征提取网络，生成隐层视图。 3.根据权利要求2所述的一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，其特征在于，还包括如下一种或多种选择： ‑所述图像特征提取网络包括若干有监督的深度卷积神经网络和输出为设定维度数据的全局平均池化层；输入图像在所述深度卷积神经网络中，减小特征分辨率，同时拓宽特征通道数，提取出高维特征；所述高维特征通过全局平均池化层，对每个通道的特征分别取全局平均，最终得到设定维度的特征向量； ‑所述数据增广集合包括至少五组图像变化技术，分别为：随机变形裁剪：对于任意输入图像，随机采取其一部分，该部分大小范围限制在全图的 20％‑100％以内，并重采样至所述图像特征提取网络所需的指定大小；随机色彩抖动：对于任意输入图像，以设定的概率对其进行随机色彩变换，所述色彩变换包括调整亮度、对比度、饱和度和色调的一种或多种；随机灰度转换：对于任意输入图像，以设定的概率对其进行随机灰度转换，将彩色图像转换为各通道值相同的灰度图像；随机高斯模糊：对于任意输入图像，以设定的概率对其进行随机高斯模糊，所述高斯核标准差范围在[0.1,2.0]之间；随机水平翻转：对于任意输入图像，以设定的概率对其进行随机水平翻转； ‑所述训练集中的图像样本基于数据增广集合和图像特征提取网络，生成隐层视图，包括：对训练集的每个图像样本，在每一次迭代中均经过所述数据增广集合采样得到两个增广函数；基于所述两个增广函数，将每个图像样本投射为正样本对；对所述正样本对中的两个样本矩阵，分别利用图像特征提取网络将其从样本空间投射为设定维数的实数向量空间，得到两个增广的训练图像样本特征，称为隐层视图。权　利　要　求　书 1/3 页 2 CN 115359294 A 24.根据权利要求1所述的一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，其特征在于，所述基于所述图像样本特征，实施第一优化环，利用弱监督对深度学习模型的粗粒度类别间语义辨识性进行约束，包括：基于全连接神经网络和Softmax激活层，形成粗粒度类别分类器；将所述训练图像样本特征作为输入，利用所述粗粒度类别分类器得到粗粒度类别概率；基于粗粒度类别概率，执行粗粒度图像分类任务，计算交叉熵损失，作为粗粒度类间语义监督，并将误差反向传播。 5.根据权利要求4所述的一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，其特征在于，所述基于粗粒度类别概率，执行粗粒度图像分类任务，计算交叉熵损失，包括：设粗粒度类别的集合为输入的隐层视图v∈Rd，则分类器执行从特征空间到类别标签空间的映射并得到前向传播输出qi：记qi的第j维值为qi,j，以及图像样本的真实粗粒度标签为yj，则粗粒度分类的交叉熵损失计算如下： 6.根据权利要求2所述的一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，其特征在于，基于所述图像样本特征，实施第二优化环，通过对称的特征嵌入器和非对称的特征预测器，实现粗粒度类别内部的相似性正则化约束，包括：基于多层感知机，构建三层的特征嵌入器和双层的特征预测器；基于所述特征嵌入器和特征预测器对所述隐层视图进行对称的嵌入预测，其中，利用所述特征嵌入器将所述隐层视图投射为嵌入向量；利用所述特征预测器执行所述嵌入向量之间的相互预测，获得预测向量；计算一个嵌入向量的对应的预测向量与另一个嵌入向量本身的余弦相似度。 7.根据权利要求6所述的一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，其特征在于，对所述隐层视图进行对称的嵌入预测，其中，计算取得粗粒度内部自监督损失为：其中， stopgrad为梯度截断操作，防止两侧样本出现特征崩塌现象， p1和z1分别为一个隐层视图对应的预测向量和嵌入向量； p2和z2分别为另一个隐层视图对应的预测向量和嵌入向量。 8.根据权利要求1所述的一种基于相似性正则化类内挖掘的跨粒度小样本学习方法，其特征在于，所述利用场景式微调使得所述优化的图像特征提取网络适应小样本分类任务，最终得到细粒度小样本分类模型，包括：从训练集中采样若干小样本分类场景；使用经过第一优化环和第二优化环优化后的图像特征提取器从所述若干个小样本分类场景中提取图像特征；权　利　要　求　书 2/3 页 3 CN 115359294 A 3

专利 一种基于相似性正则化类内挖掘的跨粒度小样本学习方法

专利一种基于相似性正则化类内挖掘的跨粒度小样本学习方法