专利 特征提取模型的训练方法、卡通对象的识别方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210760357.4 (22)申请日 2022.06.29 (71)申请人腾讯科技（深圳）有限公司地址 518000 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人许剑清　 (74)专利代理机构北京市立方律师事务所 11330 专利代理师张筱宁　张海秀 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称特征提取模型的训练方法、卡通对象的识别方法及装置 (57)摘要本申请实施例提供了一种特征提取模型的训练方法、卡通对象识别方法、装置及设备，涉及人工智能、大数据、多媒体及云技术领域。该训练方法包括：获取包含多个图像集的第一训练集和待训练的神经网络模型，每个图像集包括同一卡通对象的至少两张第一图像，神经网络模型包括级联的第一特征提取模块和特征映射模块；基于第一训练集对神经网络模型重复执行第一训练操作直至满足第一预设条件；获取包括多个带有标签的第二图像的第二训练集，基于第二训练集对满足第一预设条件的第一特征提取模块进行监督训练，得到训练好的目标特征提取模型。基于本申请实施例提供的方法，能够有效提升训练得到的特征提取模型的性能，且能够有效降低训练成本。权利要求书3页说明书20页附图5页 CN 115100717 A 2022.09.23 CN 115100717 A 1.一种特征提取模型的训练方法，其特征在于，所述方法包括：获取第一训练集和待训练的神经网络模型，所述第一训练集包括多个图像集，每个所述图像集包括同一卡通对象的至少两张第一图像，所述神经网络模型包括级联的第一特征提取模块和特征映射模块；基于所述第一训练集对所述神经网络模型重复执行第一训练操作，直至满足第一预设条件，其中，所述第一训练操作包括：将各个图像集中的第一图像分别输入到所述神经网络模型中，得到每个第一图像对应的卡通对象的对象特征向量；基于同一图像集中的第一图像对应的对象特征向量之间的相似度、以及不同图像集中的第一图像对应的对象特征向量之间的相似度，确定所述神经网络模型的第一训练损失；若不满足所述第一预设条件，则基于所述第一训练损失对所述神经网络模型的模型参数进行调整；获取第二训练集，其中，所述第二训练集中包括多个标注有标签的第二图像，每个所述第二图像的标签表征了该第二图像中包含的卡通对象的真实对象类别；将满足所述第一预设条件的第一特征提取模块作为第二特征提取模块，基于所述第二训练集对所述第二特征提取模块进行监督训练，将训练好的第二特征提取模块作为训练好的目标特征提取模型。 2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取目标类别特征矩阵，其中，所述目标类别特征矩阵中包括所述第二训练集对应的各个真实对象类别的目标类别特征向量；所述基于所述第二训练集对所述第二特征提取模块进行监督训练，包括：基于所述第二训练集对所述第二特征提取模块重复执行第二训练操作，直至满足第二预设条件，得到训练好的第二特征提取模块，其中，所述第二训练操作包括：将所述第二训练集中的各个第二图像分别输入到所述第二特征提取模块中，得到每个所述第二图像的特征向量；对于每个所述第二图像，基于该第二图像的特征向量与所述目标类别特征矩阵中的各个目标类别特征向量之间相似度，确定该第二图像对应的卡通对象的第一类别预测结果；基于各所述第二图像的第一类别预测结果和标签，确定第二训练损失；若不满足所述第二预设条件，则基于所述第二训练损失对所述第二特征提取模块的模型参数进行调整。 3.根据权利要求2所述的方法，其特征在于，所述获取目标类别特征矩阵，包括：获取初始类别特征矩阵，所述初始类别特征矩阵包括所述第二训练集对应的各个真实对象类别的初始类别特征向量；将所述初始类别特征矩阵作为待训练的模型参数，基于所述第二训练集重复执行第三训练操作，直至满足第三预设条件，将满足所述第三预设条件的类别特征矩阵作为所述目标类别特征矩阵；其中，所述第三训练操作包括：将所述第二训练集中的各个第二图像分别输入到所述第二特征提取模块中，得到每个所述第二图像的特征向量；对于每个所述第二图像，基于该第二图像的特征向量与所述初始类别特征矩阵中各个权　利　要　求　书 1/3 页 2 CN 115100717 A 2初始类别特征向量之间相似度，确定该第二图像对应的卡通对象的第二类别预测结果；基于各所述第二图像的第二类别预测结果和标签，确定第三训练损失；若不满足所述第三预设条件，则基于所述第三训练损失对所述初始类别特征矩阵的元素值进行调整。 4.根据权利要求2所述的方法，所述获取目标类别特征矩阵，包括：基于所述第二训练集，获取每个真实对象类别对应的多张样本图像；将每个真实对象类别对应的多张样本图像分别输入到所述第二特征提取模块中，得到每个所述样本图像对应的特征向量；对于每个所述真实对象类别，基于该真实对象类别对应的多张样本图像对应的特征向量，确定该真实对象类别的目标类别特征向量。 5.根据权利要求2所述的方法，其特征在于，所述基于所述第二训练损失对所述第二特征提取模块的模型参数进行调整，包括：基于所述第二训练损失对所述第二特征提取模块的模型参数和所述目标类别特征矩阵中的元素值进行调整。 6.根据权利要求2至5中任一项所述的方法，其特征在于，所述第一特征提取模块包括多个级联的特征提取子模块；所述基于所述第二训练损失对所述第二特征提取模块的模型参数进行调整，包括：基于所述第二训练损失对所述第二特征提取模块的目标参数进行调整，其中，所述目标模型的目标参数为所述第二特征提取模块中靠后的设定数量的特征提取子模块的模型参数。 7.根据权利要求1至4中任一项所述的方法，其特征在于，所述获取第一训练集，包括：获取初始训练集，所述初始训练集中包括多个初始图像，每个所述初始图像为一个卡通对象的图像；通过对每个所述初始图像进行图像增强处理，得到每个所述初始图像对应的至少两张第一图像。 8.一种卡通对象的识别方法，其特征在于，所述方法包括；获取包含卡通对象的待处理图像；调用目标特征提取模型对所述待处理图像进行特征提取，得到所述待处理图像的特征向量；其中，所述目标特征提取模型是采用权利要求1至7中任一项所述的方法训练得到的；基于提取到的特征向量，确定所述卡通对象的识别结果。 9.一种特征提取模型的训练装置，其特征在于，所述装置包括：训练数据获取模块，用于获取第一训练集、待训练的神经网络模型以及第二训练集，所述第一训练集包括多个图像集，每个所述图像集包括同一卡通对象的至少两张第一图像，所述神经网络模型包括级联的第一特征提取模块和特征映射模块，所述第二训练集中包括多个标注有标签的第二图像，每个所述第二图像的标签表征了该第二图像中包含的卡通对象的真实对象类别；第一模型训练模块，用于基于所述第一训练集对所述神经网络模型重复执行第一训练操作，直至满足第一预设条件，其中，所述第一训练操作包括：将各个图像集中的第一图像分别输入到所述神经网络模型中，得到每个第一图像对应权　利　要　求　书 2/3 页 3 CN 115100717 A 3

专利 特征提取模型的训练方法、卡通对象的识别方法及装置

专利特征提取模型的训练方法、卡通对象的识别方法及装置