(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211136929.8 (22)申请日 2022.09.19 (71)申请人 东南大学 地址 211189 江苏省南京市江宁区东 南大 学路2号 (72)发明人 刘升恒 陈嘉诚 黄永明 杨绿溪  (74)专利代理 机构 南京瑞弘专利商标事务所 (普通合伙) 32249 专利代理师 任志艳 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/20(2022.01) G06V 10/54(2022.01) G06V 10/80(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于图像多重预处理的深度学习小目 标检测方法 (57)摘要 本发明公开了一种基于图像多重预处理的 深度学习小目标检测方法, 能够 有效提高网络捕 获小目标的能力。 所述方法包括: 图像多重预处 理模块包括: 过采样、 小目标复制粘贴、 图像增 强, 缓解了包含小目标的图像过少的问题并平衡 大物体与小物体的数量分布; 检测网络的建立包 括: ResNeXt ‑101特征提取网络、 FPN+特征纹理传 输模块, ROI  Align池化操作, 损失函数增加前 景‑背景平衡损失函数; 其中, 特征纹理传输模块 的建立, 形成一个包含更多信息的特征金字塔层 级, 实现了 更准确的小目标检测, 前景 ‑背景平衡 损失函数缓解了前景和背景的面积不平衡; 本发 明采取的训练原则包括分离训练以及端对端训 练, 逐步优化模型参数。 权利要求书2页 说明书5页 附图2页 CN 115527082 A 2022.12.27 CN 115527082 A 1.一种基于图像多重预处 理的深度学习小目标检测方法, 其特 征在于, 包括如下步骤: 步骤1, 获取图像原始数据集, 对原始数据集进行数据扩充 并平衡图像 中大物体与小物 体的数量分布, 并对数据进行增强; 步骤2, 构建Faster ‑RCNN检测网络; 步骤3, 将增强后的图片传入Faster ‑RCNN检测网络进行训练, 优化模型参数。 2.根据权利要求1所述一种基于图像多重预处理的深度学习小目标检测方法, 其特征 在于, 步骤1具体包括: 步骤1.1, 对图像原始数据集进行过采样处理, 增加包含小目标图像的数量; 在图像的 随机位置多次复制粘贴图像中的所有小目标,并且粘贴之前对目标进行尺度旋转变换, 粘 贴之后的小目标不会位于边 缘并且不会重 叠原有目标; 步骤1.2, 使用随机裁剪拼接, 旋转缩放, 翻转、 Mosaic方法对扩充过的数据 集进行数据 增强。 3.根据权利要求1所述一种基于图像多重预处理的深度学习小目标检测方法, 其特征 在于, 步骤2 中所述检测网络包括特征提取网络、 多特征融合模块、 RPN、 池化操作模块和检 测头; 使用特征提取网络对数据增强之后的图像进行特征提取后, 输入到多特征融合模块进 一步提取图像特征, 再分别输入到RPN和池化操作模块, RPN的输出数据与多特征融合模块 提取的图像特 征经过池化操作后输入检测头, 得到检测结果。 4.根据权利要求1所述一种基于图像多重预处理的深度学习小目标检测方法, 其特征 在于, 所述特 征提取网络采用ResNe Xt结构; 所述多特 征融合模块包括FPN检测网络和特 征纹理传输模块; 特征提取网络ResNeXt中ResNeXt  stage2的最大池化层被删除, 并得到C2’作为stage2 的输出, C2’输入到FPN的各层, 将FPN的P2层以及P3层的输出特征图传入特征纹理传输模块 生成P3’层特征图, P3’层再与C2’融合得到P2’层特征图, P2’层特征图为特征纹理传输模块的 输出, 随后, 特征纹理传输模块生成P2’层特征图会与FPN层的P2、 P3、 P4、 P5层传入后继的RPN 和池化操作模块进行处 理。 5.根据权利要求4所述一种基于图像多重预处理的深度学习小目标检测方法, 其特征 在于, 特征纹理传输模块包括内容语义 提取器、 亚像素 卷积和特 征纹理提取器; FPN的P3层特征图先经过内容语义提取器后, 再采用亚像素卷积增大尺度, 形成超分辨 率内容特征P3; FPN的P2层特征图先与超分辨率内容特征P3串联, 再送入特征纹理提取器处 理; 最终再将特 征纹理提取器的结果与超分辨 率内容特 征P3经1*1卷积处 理得到P3’。 6.根据权利要求4所述一种基于图像多重预处理的深度学习小目标检测方法, 其特征 在于, 步骤3中对Faster ‑RCNN检测网络的训练原则包括分离训练以及端对端训练; 首先, 去掉特征纹理传输模块, 对不含特征纹理传输模块的Faster ‑RCNN检测网络进行 训练, 训练使用的是原 始FPN; 其次, 固定特 征提取网络以及检测头, 增 加特征纹理传输模块训练; 最后, 当特 征纹理传输模块收敛时, 再对检测头进行训练微调。 7.根据权利要求4所述一种基于图像多重预处理的深度学习小目标检测方法, 其特征 在于, 损失函数增加前景 ‑背景平衡损失函数, 前景 ‑背景平衡损失函数由全局重建损失函权 利 要 求 书 1/2 页 2 CN 115527082 A 2数、 正样本损失函数组成; 全局重建损失函数强调与真实背景 特征的相似性, 用公式表达为: Lgrl(E,Et)=‖ Et‑E ‖1 式中, E表示Faster ‑RCNN检测网络生成的特 征图, Et表示目标 特征图; 正样本损失函数强调对正样本的关注度, 用公式表达为: 式中, Ppt表示真实目标 的区域, N表示正像素总和, (x, y)表示特征图上像素 的坐标; 前 景‑背景平衡损失函数用公式表达为: Lbf(E,Et)=Lgrl(E,Et)+λLpt(E,Et) 式中, λ是权 重平衡因子, 则总体前 景‑背景平衡损失函数表示 为: 权 利 要 求 书 2/2 页 3 CN 115527082 A 3

PDF文档 专利 一种基于图像多重预处理的深度学习小目标检测方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于图像多重预处理的深度学习小目标检测方法 第 1 页 专利 一种基于图像多重预处理的深度学习小目标检测方法 第 2 页 专利 一种基于图像多重预处理的深度学习小目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。