standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211471454.8 (22)申请日 2022.11.23 (71)申请人 南京理工大 学 地址 210094 江苏省南京市玄武区孝陵卫 200号 (72)发明人 韩静 王川 陈霄宇 瞿超 徐启涵 蒋韫骋 (74)专利代理 机构 南京苏创专利代理事务所 (普通合伙) 32273 专利代理师 石嘉蓉 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 20/70(2022.01)G06V 10/143(2022.01) (54)发明名称 基于跨模态特征强化与交互的多模态图像 语义分割方法 (57)摘要 本发明公开了一种基于跨模态特征强化与 交互的多模态图像语义分割方法, 包括: 将对应 的可见光图像和红外图像作为输入, 采用双分支 编码结构分别提取两种图像特征, 在各个编码阶 段, 首先通过特征交互模块对提取的两种图像特 征进行增强和交互, 并将交互之后的特征送入下 一阶段的编码 模块, 而后通过特征融合模块将经 过增强和交互之后的特征进行融合, 并将融合特 征送入对应阶段的解码模块, 最后采用上采样和 跳层连接逐级解码, 获得多模态图像语义分割结 果。 本发明从编码网络的数据流出发, 利用注意 力机制增强各自模态的有效特征, 将增强后的特 征与另一模态的特征交互, 对单一模态的信息进 行补充, 最大程度利用跨模态信息解析场景。 权利要求书2页 说明书7页 附图5页 CN 115546489 A 2022.12.30 CN 115546489 A 1.一种基于跨模态特征强化与交互的多模态图像语义分割方法, 其特征在于, 包括: 将 对应的可见光图像和红外图像作为输入, 采用双分支编 码结构分别提取可见光图像特征及 红外图像特 征; 在各个编码阶段, 首先通过特征交互模块对提取的可见光图像特征及红外图像特征进 行增强和交互, 并将交互之后的可见光图像特征及红外图像特征分别送入 下一阶段的编码 模块, 而后通过特征融合模块将经过增强和交互之后的可见光图像特征及红外图像特征进 行融合, 并将融合特征送入对应阶段的解码模块, 最后采用上采样和跳层连接逐级解码, 获 得多模态图像 语义分割结果。 2.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述双分支编码结构采用ResNet作为骨干网络, 形成可见光支路和红外支 路两组编码模块。 3.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征交互模块的增强过程具体包括: , , , 其中, 分别表示当前阶段编码模块所提取的可见光图像特征和红外图像特 征, 分别表示经过一维卷积和二维卷积处理后的可见光图像特征, 分别表示增强后的可见光图像特征和红外图像特征, 表示Sigmoi d函数, 表示一维卷 积, 对应的卷积核大小为 , C表示输入特征图的通道数, 表示卷 积核为7×7的二维卷积, 表示MaxPool操作, 表示AvgPool操作, 表示按位点乘运 算, 的计算过程与 相同。 4.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征交互模块的交 互过程具体包括: , , 其中, 分别表示当前阶段编码模块所提取的可见光图像特征和红外图像特 征, 分别表示输出到下一阶段编码模块的可见光图像特征和红外图像特征, 分别表示增强后的可 见光图像特 征和红外图像特 征, 为设定的权 重因子。 5.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征融合模块实现的融合过程具体包括:权 利 要 求 书 1/2 页 2 CN 115546489 A 2对于经过增强和交互之后的可见光图像特征及红外图像特征 , 首先在通道 维度上进行堆叠, 而后经过通道融合模块融合, 输出当前编码阶段的融合特征 , 其中 通道融合模块包含两个1 ×1的卷积层、 一个3 ×3的卷积层、 一个激活层、 一个1 ×1的卷积 层、 两个归一 化层和一个跳层连接 。 6.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 每个解码模块的输入为上一个阶段的解码模块输出与当前阶段特征融合 模块输出的融合特 征相加。 7.根据权利要求6所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述解码模块包括3个级联的卷积模块, 每个卷积模块包括一个3 ×3卷积 层、 一个归一 化层和一个激活层。权 利 要 求 书 2/2 页 3 CN 115546489 A 3
专利 基于跨模态特征强化与交互的多模态图像语义分割方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:26:41
上传分享
举报
下载
原文档
(883.5 KB)
分享
友情链接
GB-T 24106-2009 岩土工程仪器术语及符号.pdf
T-CSAE 81—2018 能量回馈式整车动力学控制系统 性能要求及台架试验方法.pdf
T-CIECCPA 001—2021 工业节能监察平台系统技术规范.pdf
T-ISAS 004—2021 沙棘果油.pdf
DB42-T 1758-2021 模锻件数字化车间生产过程管理系统功能要求 湖北省.pdf
GB-T 16666-2012 泵类液体输送系统节能监测.pdf
企业安全运营实践研究报告 freebuf 2021版.pdf
GB-T 7666-2005 传感器命名法及代号.pdf
GB-T 14506.28-2010 硅酸盐岩石化学分析方法 第28部分:16个主次成分量测定.pdf
T-CBJ 3201—2019 工坊啤酒及其生产规范.pdf
GB 29440-2012 炭黑单位产品能源消耗限额.pdf
GB-T 42882-2023 城市和社区可持续发展 智慧城市运行模型 应对突发公共卫生事件的指南.pdf
DB32-T 4284-2022 居民住宅二次供水工程技术规程 江苏省.pdf
GB-T 29314-2023 电动机系统节能改造规范.pdf
淮南市科技创新促进条例.pdf
GA-T 460.1-2020 居民身份证卡体材料及打印薄膜技术规范 第1部分:制卡用垫平层白色PETG薄膜.pdf
DB65-T 4458-2021 南疆盐碱地土壤调理剂施用技术规程 新疆维吾尔自治区.pdf
T-CI 154—2023 深度学习驱动的智慧交通数据挖掘预测技术规范.pdf
GB-T 43779-2024 网络安全技术 基于密码令牌的主叫用户可信身份鉴别技术规范.pdf
T-CPQS A0011—2022 二手车车况检测及评估通则.pdf
1
/
15
评价文档
赞助2.5元 点击下载(883.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。