专利 图像处理、神经网络生成、样本图像的生成方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210912661.6 (22)申请日 2022.07.30 (71)申请人北京市商汤科技开发有限公司地址 100080 北京市海淀区北四环西路58 号11层1101-1117室 (72)发明人关英妲　常蕙滢　汪旻　刘文韬　钱晨　 (74)专利代理机构北京中知恒瑞知识产权代理事务所(普通合伙) 11889 专利代理师尹礼 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01) G06V 10/52(2022.01)G06V 10/74(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06T 3/00(2006.01) (54)发明名称图像处理、神经网络生成、样本图像的生成方法及装置 (57)摘要本公开提供了一种图像处理、神经网络生成、样本图像的生成方法及装置、电子设备及存储介质，其中，该图像处理方法包括：获取待处理图像；利用预先训练好的目标神经网络，对所述待处理图像进行目标检测处理，得到对所述待处理图像的目标检测结果；所述目标神经网络是利用第一样本图像、以及对所述第一样本图像进行风格迁移处理后得到的第二样本图像对原始神经网络进行迭代训练，以使得到的所述目标神经网络为所述第一样本图像提取的第一特征数据、和为所述第二样本图像提取的第二特征数据满足预设的相似度条件。权利要求书5页说明书22页附图4页 CN 115100504 A 2022.09.23 CN 115100504 A 1.一种图像处理方法，其特征在于，包括：获取待处理图像；利用预先训练好的目标神经网络，对所述待处理图像进行目标检测处理，得到对所述待处理图像的目标检测结果；所述目标神经网络是利用第一样本图像、以及对所述第一样本图像进行风格迁移处理后得到的第二样本图像对原始神经网络进行迭代训练，以使得到的所述目标神经网络为所述第一样本图像提取的第一特征数据、和为所述第二样本图像提取的第二特征数据满足预设的相似度条件。 2.根据权利要求1所述的方法，其特征在于，对所述待训练神经网络执行至少一个迭代周期的训练，得到所述目标神经网络，并在每个迭代周期中，执行下述过程：获取所述第一样本图像、和对所述第一样本图像进行风格迁移处理后得到的所述第二样本图像；利用当前迭代周期对应的待训练的神经网络，对所述第一样本图像和所述第二样本图像分别进行特征提取，分别得到所述第一特征数据和所述第二特征数据；所述当前迭代周期对应的待训练的神经网络包括：所述原始神经网络、或者所述当前迭代周期对应的前一迭代周期的已训练神经网络；基于所述第一特征数据和所述第二特征数据，确定第一损失；其中，所述第一损失用于描述所述第一特征数据和所述第二特征数据之间的相似度；基于所述第一损失以及所述相似度条件，对所述当前迭代周期对应的待训练的神经网络进行训练，得到当前迭代周期对应的已训练神经网络；基于最后一个迭代周期得到的待训练神经网络，得到所述目标神经网络。 3.根据权利要求2所述的方法，其特征在于，所述获取所述第一样本图像，包括：对现实目标场景进行三维建模，得到场景三维模型；将目标对象的三维模型添加至所述场景三维模型，得到目标场景三维模型；基于所述目标场景三维模型获得包括所述目标对象的所述第一样本图像。 4.根据权利要求3所述的方法，其特征在于，所述将目标对象的三维模型添加至所述场景三维模型，得到目标场景三维模型，包括：确定所述目标对象在所述场景三维模型中部署信息；所述部署信息包括下述至少一种：所述目标对象的三维模型在所述场景三维模型中的尺寸、长宽比、分布位置、数量以及摆放密度；基于所述部署信息，将所述目标对象的三维模型添加至所述场景三维模型中，得到所述目标场景三维模型。 5.根据权利要求3或4所述的方法，其特征在于，所述基于所述目标场景三维模型获得包括所述目标对象的所述第一样本图像，包括：控制所述目标对象的三维模型按照预设移动轨迹在所述目标场景三维模型对应的模型坐标系中移动，和/或，基于虚拟摄像机在所述目标场景三维模型中的不同位姿，得到备选图像；基于所述备选图像，生成所述第一样本图像。 6.根据权利要求5所述的方法，其特征在于，所述基于所述备选图像，生成所述第一样本图像，包括：权　利　要　求　书 1/5 页 2 CN 115100504 A 2确定所述备选图像中的各个目标对象是否满足预设的遮挡条件；响应于所述备选图像中的各个目标对象满足预设的遮挡条件，将所述备选图像确定为所述第一样本图像。 7.根据权利要求5或6所述的方法，其特征在于，所述基于所述备选图像，生成所述第一样本图像，包括：为所述备选图像添加随机色块、和/或添加非目标对象，得到所述第一样本图像。 8.根据权利要求5 ‑7任一项所述的方法，其特征在于，所述基于所述备选图像，生成所述第一样本图像，包括：利用所述备选图像训练生成辅助目标检测模型；以及，对所述备选图像中的第一备选图像施加随机干扰，得到干扰图像；利用所述辅助目标检测模型对所述干扰图像进行目标检测处理，得到所述干扰图像的目标检测结果；响应于所述干扰图像的目标检测结果的准确度满足预设的准确度条件，记录所述干扰图像的干扰信息；基于所述干扰信息、和所述备选图像中的第二备选图像，生成所述第一样本图像，和/ 或，将准确度满足所述准确度条件的干扰图像作为所述第一样本图像。 9.根据权利要求2 ‑8任一项所述的方法，其特征在于，获取对所述第一样本图像进行风格迁移处理后得到的所述第二样本图像，包括：随机从多个备选的风格迁移类型中，确定目标风格迁移类型；基于与所述目标风格迁移类型对应的风格迁移网络，对所述第一样本图像进行风格迁移处理，得到所述第二样本图像。 10.根据权利要求2 ‑9任一项所述的方法，其特征在于，所述当前迭代周期对应的待训练的神经网络包括：待训练的特征提取子网络；所述利用当前迭代周期对应的待训练的神经网络，对所述第一样本图像和所述第二样本图像分别进行特征提取，分别得到所述第一特征数据和所述第二特征数据，包括：利用所述当前迭代周期对应的待训练的特征提取子网络，对所述第一样本图像进行特征提取，得到所述当前迭代周期对应的待训练的特征提取子网络的多个目标网络层分别输出的第一特征图；多个所述目标网络层分别输出的所述第一特征图构成所述第一特征数据；以及利用所述当前迭代周期对应的待训练的特征提取子网络，对所述第二样本图像进行特征提取，得到多个所述目标网络层分别输出的第二特征图；多个所述目标网络层分别输出的所述第二特征图构成所述第二特征数据。 11.根据权利要求10所述的方法，其特征在于，所述基于所述第一特征数据和所述第二特征数据，确定第一损失，包括：基于所述第一特征数据和所述第二特征数据，确定特征距离；所述特征距离用于描述所述第一特征数据和所述第二特征数据之间的第一特征距离、和/或不同第二特征数据之间的第二特征距离；基于所述特征距离，确定所述第一损失。权　利　要　求　书 2/5 页 3 CN 115100504 A 3

专利 图像处理、神经网络生成、样本图像的生成方法及装置

专利图像处理、神经网络生成、样本图像的生成方法及装置