专利 一种网络模型的训练方法、目标识别方法及相关设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210983598.5 (22)申请日 2022.08.16 (71)申请人浙江大华技术股份有限公司地址 310051 浙江省杭州市滨江区滨安路 1187号 (72)发明人曾祁泽　殷俊　朱树磊　 (74)专利代理机构深圳市威世博知识产权代理事务所(普通合伙) 44280 专利代理师严翠霞 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/74(2022.01) G06V 40/16(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种网络模型的训练方法、目标识别方法及相关设备 (57)摘要本申请公开了一种网络模型的训练方法、目标识别方法及相关设备，该训练方法包括：获取至少两个训练集；获取与训练集数量对应的至少两个网络模型，其中至少两个网络模型具有相同的网络结构；利用各训练集中的训练样本图像对对应的网络模型进行迭代训练，以使得网络模型基于训练样本图像对自身的网络参数进行调整；响应于迭代训练达到预设的互学习条件，在至少两个网络模型的相同位置的网络参数之间进行互学习；响应于至少两个网络模型训练完成，从至少两个网络模型中确定出最终的网络模型。通过上述方式，本申请得到的网络模型能够精确识别多场景下的图像。权利要求书3页说明书11页附图5页 CN 115471671 A 2022.12.13 CN 115471671 A 1.一种网络模型的训练方法，其特征在于，包括：获取至少两个训练集；每个所述训练集分别包含不同应用场景下的多个训练样本图像；获取与所述训练集数量对应的至少两个网络模型，其中所述至少两个网络模型具有相同的网络结构；利用各所述训练集中的训练样本图像对对应的所述网络模型进行迭代训练，以使得所述网络模型基于所述训练样本图像对自身的网络参数进行调整；响应于所述迭代训练达到预设的互学习条件，在所述至少两个网络模型的相同位置的网络参数之间进行互学习；响应于所述至少两个网络模型未训练完成，返回所述利用各所述训练集中的训练样本图像对对应的所述网络模型进行迭代训练的步骤；响应于所述至少两个网络模型训练完成，从所述至少两个网络模型中确定出最终的网络模型。 2.根据权利要求1所述的网络模型的训练方法，其特征在于，所述响应于所述迭代训练达到预设的互学习条件，在所述至少两个网络模型的相同位置的网络参数之间进行互学习的步骤，包括：响应于各所述网络模型的当前迭代次数达到预设的次数阈值，判定所述迭代训练达到所述互学习条件。 3.根据权利要求1所述的网络模型的训练方法，其特征在于，所述响应于所述迭代训练达到预设的互学习条件，在所述至少两个网络模型的相同位置的网络参数之间进行互学习的步骤，还包括：从所述至少两个网络模型中选择任一网络模型作为待更新网络模型；将所述待更新网络模型和其他网络模型中位置相同的网络参数进行加权求和，以将求和值作为所述待更新网络模型的互学习后的网络参数；在所述待更新网络模型的网络参数更新完成后，从所述至少两个网络模型中选择另一网络模型作为待更新网络模型，直至所有网络模型遍历完毕。 4.根据权利要求3所述的网络模型的训练方法，其特征在于，所述将所述待更新网络模型和其他网络模型中位置相同的网络参数进行加权求和的步骤，包括：获取第一权重与第二权重；以所述第一权重作为所述待更新网络模型的网络参数的权重值，以所述第二权重作为其他网络模型的网络参数的权重值，其中所述第一权重随所述迭代训练逐步减小，并且/或者所述第二权重随所述迭代训练逐步增大。 5.根据权利要求4所述的网络模型的训练方法，其特征在于，所述获取第一权重与第二权重的步骤，包括：基于所述至少两个网络模型的总数量、当前迭代次数以及最大迭代次数，计算得到所述第一权重，其中所述第一权重与所述当前迭代次数负相关；基于所述第一权重与所述至少两个网络模型的总数量，计算得到所述第二权重，其中所述第二权重与所述第一权重负相关。 6.根据权利要求1所述的网络模型的训练方法，其特征在于，所述响应于所述迭代训练权　利　要　求　书 1/3 页 2 CN 115471671 A 2达到预设的互学习条件，在所述至少两个网络模型的相同位置的网络参数之间进行互学习的步骤，还包括：获取待更新网络模型在互学习前的网络参数下的第一损失值以及在互学习后的网络参数下对应的第二损失值；将所述第一损失值与所述第二损失值相减，得到损失变化值；基于所述损失变化值，计算得到更新概率值，其中所述更新概率值与所述损失变化值正相关；基于所述更新概率值，确定是否利用所述互学习后的网络参数对所述互学习前的网络参数进行更新。 7.根据权利要求6所述的网络模型的训练方法，其特征在于，所述基于所述损失变化值，计算得到更新概率值的步骤，包括：响应于所述损失变化值大于预设的损失阈值，确定所述更新概率值为第一预设数值；响应于所述损失变化值小于或等于所述损失阈值，基于预设退火温度值与所述损失变化值计算得到所述更新概率值，其中所述更新概率值进一步与所述退火温度值负相关，所述退火温度值随迭代训练逐步减小。 8.根据权利要求6所述的网络模型的训练方法，其特征在于，所述基于所述更新概率值，确定是否利用所述互学习后的网络参数对所述互学习前的网络参数进行更新的步骤，包括：针对所述待更新网络模型的每个所述网络参数，在预设数值区间内生成一随机数；响应于所述随机数大于所述更新概率值，保持所述互学习前的网络参数不变，响应于所述随机数小于或等于所述更新概率值，利用所述互学习后的网络参数对所述互学习前的网络参数进行更新；或者响应于所述随机数小于或等于所述更新概率值，保持所述互学习前的网络参数不变，响应于所述随机数大于所述更新概率值，利用所述互学习后的网络参数对所述互学习前的网络参数进行更新。 9.一种目标识别方法，其特征在于，包括：将待识别图像输入网络模型，得到目标对象的待识别特征；其中，所述网络模型为利用权利要求1 ‑8中任一项所述的网络模型的训练方法训练得到的最终的网络模型；对所述待识别特征与比对特征进行相似度计算，得到相似度值；基于所述相似度值，得到目标识别结果。 10.一种网络模型的训练装置，其特征在于，包括互相连接的存储器和处理器，其中，所述存储器用于存储计算机程序，所述计算机程序在被所述处理器执行时，用于实现权利要求1‑8中任一项所述的网络模型的训练方法。 11.一种目标识别装置，其特征在于，包括互相连接的存储器和处理器，其中，所述存储器用于存储计算机程序，所述计算机程序在被所述处理器执行时，用于实现权利要求9所述的目标识别方法。 12.一种计算机可读存储介质，用于存储计算机程序，其特征在于，所述计算机程序在被处理器执行时，用于实现权利要求 1‑8中任一项所述的网络模型的训练方法或权利要求9权　利　要　求　书 2/3 页 3 CN 115471671 A 3

专利 一种网络模型的训练方法、目标识别方法及相关设备

专利一种网络模型的训练方法、目标识别方法及相关设备