standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211155626.0 (22)申请日 2022.09.22 (71)申请人 南京信息 工程大学 地址 224002 江苏省盐城市 盐南高新区新 河街道文港南路10 5号 (72)发明人 魏新池 郑钰辉  (74)专利代理 机构 南京纵横知识产权代理有限 公司 32224 专利代理师 刘艳艳 (51)Int.Cl. G06V 20/10(2022.01) G06V 10/25(2022.01) G06V 10/762(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 基于通道注意力与多尺度特征融合的轻量 级遥感目标检测方法 (57)摘要 本发明公开了基于通道注意力与多尺度特 征融合的轻量级遥感目标检测方法, 包括: 获取 遥感数据; 将遥感数据中的图片输入训练好的遥 感目标检测模型; 根据模型的输出, 确定遥感目 标检测结果; 模型的构建训练方法包括: 获取数 据集, 使用Kmeans聚类算法对数据集作聚类处 理, 获得一组锚框; 构建主干网络提取特征图; 在 主干网络后构建快速空间金字塔池化结构进行 特征融合; 构建三层的加强特征提取网络BiFPN, 融合浅层特征图的空间信息与深层特征图的语 义信息; 在BiFPN后构建通道注意力模块ECA; 在 ECA后构建三个预测输 出头, 进行预测; 利用数据 集及锚框训练并评估模型。 网络参数少计算量 小, 提高了 检测精度的同时满足了实时性。 权利要求书4页 说明书13页 附图4页 CN 115457395 A 2022.12.09 CN 115457395 A 1.基于通道 注意力与多尺度特 征融合的轻量级遥感目标检测方法, 其特 征在于, 包括: 获取遥感数据, 其中所述遥感数据包括至少一张图片; 将遥感数据中的图片输入训练好的遥感目标检测模型; 根据遥感目标检测模型的输出, 确定 遥感目标检测结果; 其中所述遥感目标检测模型的构建训练方法包括: 步骤1: 获取 数据集; 步骤2: 使用Kmeans聚类算法对数据集作聚类处 理, 获得一组锚框; 步骤3: 构建主干网络经 过特征提取得到特征图; 步骤4: 在主干网络后构建快速空间金字塔池化结构SPPF进行特征融合得到融合特征 图; 步骤5: 在快速空间金字塔池化结构SPPF后构建三层的加强特征提取网络BiFPN, 融合 浅层特征图的空间信息与深层特 征图的语义信息, 减少信息 丢失; 步骤6: 在加强特征提取网络BiFPN后构 建三个通道注意力 模块ECA, 使网络更加关注目 标的细节信息, 提高检测精度; 步骤7: 在每 个通道注意力模块E CA后构建一个预测输出头, 对输出的特 征进行预测; 步骤8: 利用所述数据集及锚框对遥感目标检测模型进行训练并评估, 利用最佳模型进 行测试, 得到训练好的遥感目标检测模型。 2.根据权利要求1所述的基于通道注意力与多尺度特征融合的轻量级遥感 目标检测方 法, 其特征在于, 所述 步骤1中, 获取 数据集, 包括: 所述数据集至少包括遥感数据集DOTA  v1.0、 数据集VOC12以及遥感数据集RSOD、 遥感 数据集DIOR; 其中数据集VOC12、 RSOD的训练集, 验证集, 测 试集按照7:1:2进行随机划分, DIOR按照 官方给出的比例1:1:2进行随机划分; 其中遥感数据集DOTA  v1.0需要先进行 预处理, 包括: 步骤1‑1: 选取遥感数据集DOTA  v1.0中水平标注部分的图片; 将选取的每张图片切割 为多张固定大小的图片, 并对切割后的图片生成相应的标注信息xml文件; 步骤1‑2: 对步骤1 ‑1得到的xml文件进行处理, 删除不符合要求的xml文件及对应 的图 片, 得到处 理后的DOTA数据集; 其中不符合要求的xml文件有以下三种情况: 标注目标为空; 所有标注目标的 difficult值均为1; 标注目标存在越界的问题, 标注目标存在越界有六种情况: xmin<0、 ymin<0、 xmax>width、 ymax>height、 xmax<xmin、 ymax<ymin; 其中xmin: 标注框最小横坐标 值; ymin: 标注框最小纵坐标值; xmax: 标注框最大横坐标值; ymax: 标注框最大纵坐标值; width: 图片的宽; height: 图片的高; 步骤1‑3: 对步骤1 ‑2得到的处理后的DOTA数据集进行划分, 划分为train、 val、 trainval、 test四个文件, 训练集, 验证集, 测试集按照7:1:2进行随机划分。 3.根据权利要求1所述的基于通道注意力与多尺度特征融合的轻量级遥感 目标检测方 法, 其特征在于, 所述 步骤2中, 使用Kmeans聚类算法对数据集作聚类处 理, 包括: 步骤2‑1: 根据数据集, 在所有的边界框中随机 选择K个作为簇中心; 步骤2‑2: 计算每 个边界框与每 个簇中心的距离D, 公式如下:权 利 要 求 书 1/4 页 2 CN 115457395 A 2D=1‑IOU 式中, A、 B分别为 边界框与簇中心, I oU为A和B的交并比; 步骤2‑3: 计算每 个边界框距离最近的簇中心, 并分配到 离它最近的簇中; 步骤2‑4: 根据每 个簇中的边界框 重新计算簇中心, 默认使用中位数来更新簇中心; 步骤2‑5: 重复2‑3到2‑4, 直到每个簇中的元素不在发生变化则聚类完毕, 得到K个簇中 心, 即所需要的锚框; 步骤2‑6: 考虑到预测网络中K值较大时, 会增加神经网络的预测时间, 因而簇中心的个 数K设置为9; 在各 数据集上使用的锚框如下: DOTA v1.0: (11,10)(20,22)(29,41)(43,25)(44,98)(47,45)(78,63)(100,106)(169, 202) RSOD: (14,15)(2 2,23)(30,29)(36,39)(47,48)(5 5,62)(68,74)(80,9 2)(223,275) DIOR: (7,7)(8,16)(14,28)(19,1 1)(26,47)(3 6,20)(57,6 0)(107,128)(278,280) VOC12: (21,40)(52,68)(62,141)(97,272)(159,155)(177,380)(303,495)(372,267) (549,556)。 4.根据权利要求1所述的基于通道注意力与多尺度特征融合的轻量级遥感 目标检测方 法, 其特征在于, 所述 步骤3中, 主干网络的构建方法包括: 步骤3‑1: 图片输入的尺寸设置为416*416, 首先构建两个卷积模块DarknetConv2D_B N_ Leaky用于获取特征图, 卷积模块包括一个3*3的二维卷积, 归一化和激活函数Leaky  ReLu, 步长设置为2; 第一个卷积模块使图片尺寸降为208*208, 第二个卷积模块再次缩小图片尺 寸为104*104, Leaky  ReLu函数表达式如下, x代 表输入值: 步骤3‑2: 在两个卷积模块后串行构建三个残差网络Reduction; 残差网络分成两条支 路, 第一条支路是将输入的特征图进行一次1*1卷积, 特征图尺寸不变; 再进行一次3*3卷 积, 使特征图的尺 寸减小一半; 最后进行一次1*1卷积, 特征图的尺 寸不变; 第二条支路是将 输入的特征图进 行一次2*2的最大池化, 使 特征图尺 寸减半; 再进 行一次1*1卷积, 特征图尺 寸不变; 将这两条支路输出的特征图进 行堆叠拼接, 最 终获得尺寸减半后的特征图; 第一残 差网络、 第二残差网络、 第三残差网络 输出的特 征图尺寸分别为: 52* 52、 26*26、 13*13; 步骤3‑3: 在最后一个残差网络后构建一个卷积模块DarknetConv2D_BN_Leaky进行特 征整合, 主干网络最终输出的特 征图尺寸 为13*13。 5.根据权利要求1所述的基于通道注意力与多尺度特征融合的轻量级遥感 目标检测方 法, 其特征在于, 所述 步骤4中, 快速空间金字塔池化结构 SPPF的构建方法, 包括: 步骤4‑1: 将主干网络输出的特征图输入至快速空间金字塔池化结构SPPF, 对输入的特 征图进行一次卷积得到卷积后的特 征图, 使通道数减半; 步骤4‑2: 构建池化核大小为5*5的三个最大池化层, 将卷积后的特征图先经过第一最 大池化层进行一次最大池化, 输出 的结果再依次经过第二最大池化层、 第三最大池化层进 行最大池化, 将第一最大池化层、 第二最大池化层、 第三最大池化层的结果与卷积后的特征权 利 要 求 书 2/4 页 3 CN 115457395 A 3

.PDF文档 专利 基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法 第 1 页 专利 基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法 第 2 页 专利 基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 04:15:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。