standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211471454.8 (22)申请日 2022.11.23 (71)申请人 南京理工大 学 地址 210094 江苏省南京市玄武区孝陵卫 200号 (72)发明人 韩静 王川 陈霄宇 瞿超 徐启涵 蒋韫骋 (74)专利代理 机构 南京苏创专利代理事务所 (普通合伙) 32273 专利代理师 石嘉蓉 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 20/70(2022.01)G06V 10/143(2022.01) (54)发明名称 基于跨模态特征强化与交互的多模态图像 语义分割方法 (57)摘要 本发明公开了一种基于跨模态特征强化与 交互的多模态图像语义分割方法, 包括: 将对应 的可见光图像和红外图像作为输入, 采用双分支 编码结构分别提取两种图像特征, 在各个编码阶 段, 首先通过特征交互模块对提取的两种图像特 征进行增强和交互, 并将交互之后的特征送入下 一阶段的编码 模块, 而后通过特征融合模块将经 过增强和交互之后的特征进行融合, 并将融合特 征送入对应阶段的解码模块, 最后采用上采样和 跳层连接逐级解码, 获得多模态图像语义分割结 果。 本发明从编码网络的数据流出发, 利用注意 力机制增强各自模态的有效特征, 将增强后的特 征与另一模态的特征交互, 对单一模态的信息进 行补充, 最大程度利用跨模态信息解析场景。 权利要求书2页 说明书7页 附图5页 CN 115546489 A 2022.12.30 CN 115546489 A 1.一种基于跨模态特征强化与交互的多模态图像语义分割方法, 其特征在于, 包括: 将 对应的可见光图像和红外图像作为输入, 采用双分支编 码结构分别提取可见光图像特征及 红外图像特 征; 在各个编码阶段, 首先通过特征交互模块对提取的可见光图像特征及红外图像特征进 行增强和交互, 并将交互之后的可见光图像特征及红外图像特征分别送入 下一阶段的编码 模块, 而后通过特征融合模块将经过增强和交互之后的可见光图像特征及红外图像特征进 行融合, 并将融合特征送入对应阶段的解码模块, 最后采用上采样和跳层连接逐级解码, 获 得多模态图像 语义分割结果。 2.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述双分支编码结构采用ResNet作为骨干网络, 形成可见光支路和红外支 路两组编码模块。 3.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征交互模块的增强过程具体包括: , , , 其中, 分别表示当前阶段编码模块所提取的可见光图像特征和红外图像特 征, 分别表示经过一维卷积和二维卷积处理后的可见光图像特征, 分别表示增强后的可见光图像特征和红外图像特征, 表示Sigmoi d函数, 表示一维卷 积, 对应的卷积核大小为 , C表示输入特征图的通道数, 表示卷 积核为7×7的二维卷积, 表示MaxPool操作, 表示AvgPool操作, 表示按位点乘运 算, 的计算过程与 相同。 4.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征交互模块的交 互过程具体包括: , , 其中, 分别表示当前阶段编码模块所提取的可见光图像特征和红外图像特 征, 分别表示输出到下一阶段编码模块的可见光图像特征和红外图像特征, 分别表示增强后的可 见光图像特 征和红外图像特 征, 为设定的权 重因子。 5.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征融合模块实现的融合过程具体包括:权 利 要 求 书 1/2 页 2 CN 115546489 A 2对于经过增强和交互之后的可见光图像特征及红外图像特征 , 首先在通道 维度上进行堆叠, 而后经过通道融合模块融合, 输出当前编码阶段的融合特征 , 其中 通道融合模块包含两个1 ×1的卷积层、 一个3 ×3的卷积层、 一个激活层、 一个1 ×1的卷积 层、 两个归一 化层和一个跳层连接 。 6.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 每个解码模块的输入为上一个阶段的解码模块输出与当前阶段特征融合 模块输出的融合特 征相加。 7.根据权利要求6所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述解码模块包括3个级联的卷积模块, 每个卷积模块包括一个3 ×3卷积 层、 一个归一 化层和一个激活层。权 利 要 求 书 2/2 页 3 CN 115546489 A 3
专利 基于跨模态特征强化与交互的多模态图像语义分割方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:26:41
上传分享
举报
下载
原文档
(883.5 KB)
分享
友情链接
T-ZGCMITT 004—2021 DSA引导微创手术室配置要求.pdf
TTAF 180.2—2023 小程序个人信息保护规范 第2部分:个人信息收集行为.pdf
GB-T 41621-2022 科学技术研究项目评价实施指南 开发研究项目.pdf
NY-T 3481-2019 根茎类中药材收获机 质量评价技术规范.pdf
T-NIFA 20—2023 金融数据资产管理指南.pdf
国家健康医疗大数据标准、安全和服务管理办法.pdf
数据安全解决方案.pdf
T-AHPCA 021—2021 聚乳酸可降解口罩.pdf
GB-T 19115.2-2018 风光互补发电系统 第2部分:试验方法.pdf
T-FSAS 58—2022 基于互联网的可信数字身份服务技术要求.pdf
LY-T 1738-2020 实木复合地板用胶合板.pdf
T-CMAX 116-01—2020 自动驾驶车辆道路测试能力评估内容与方法.pdf
GB-T 13923-2022 基础地理信息要素分类与代码.pdf
GB-T 10085-2018 圆柱蜗杆传动基本参数.pdf
TTAF 180.1—2023 小程序个人信息保护规范 第1部分:申请授权行为.pdf
DB5301-T 99-2023 改性磷石膏综合利用 矿山生态修复 过程环境监管规范 昆明市.pdf
T-CIECCPA 011—2020 工业节能监察人员业务培训导则.pdf
DB11-T 1289-2015 信息技术 灾难恢复系统成本效益评估规范 北京市.pdf
南方财经 个人信息保护法企业合规启示报告(上篇).pdf
DB13-T 5617-2022 精细化工反应安全风险评估导则 河北省.pdf
1
/
15
评价文档
赞助2.5元 点击下载(883.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。