文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211471454.8 (22)申请日 2022.11.23 (71)申请人 南京理工大 学 地址 210094 江苏省南京市玄武区孝陵卫 200号 (72)发明人 韩静 王川 陈霄宇 瞿超 徐启涵 蒋韫骋 (74)专利代理 机构 南京苏创专利代理事务所 (普通合伙) 32273 专利代理师 石嘉蓉 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 20/70(2022.01)G06V 10/143(2022.01) (54)发明名称 基于跨模态特征强化与交互的多模态图像 语义分割方法 (57)摘要 本发明公开了一种基于跨模态特征强化与 交互的多模态图像语义分割方法, 包括: 将对应 的可见光图像和红外图像作为输入, 采用双分支 编码结构分别提取两种图像特征, 在各个编码阶 段, 首先通过特征交互模块对提取的两种图像特 征进行增强和交互, 并将交互之后的特征送入下 一阶段的编码 模块, 而后通过特征融合模块将经 过增强和交互之后的特征进行融合, 并将融合特 征送入对应阶段的解码模块, 最后采用上采样和 跳层连接逐级解码, 获得多模态图像语义分割结 果。 本发明从编码网络的数据流出发, 利用注意 力机制增强各自模态的有效特征, 将增强后的特 征与另一模态的特征交互, 对单一模态的信息进 行补充, 最大程度利用跨模态信息解析场景。 权利要求书2页 说明书7页 附图5页 CN 115546489 A 2022.12.30 CN 115546489 A 1.一种基于跨模态特征强化与交互的多模态图像语义分割方法, 其特征在于, 包括: 将 对应的可见光图像和红外图像作为输入, 采用双分支编 码结构分别提取可见光图像特征及 红外图像特 征; 在各个编码阶段, 首先通过特征交互模块对提取的可见光图像特征及红外图像特征进 行增强和交互, 并将交互之后的可见光图像特征及红外图像特征分别送入 下一阶段的编码 模块, 而后通过特征融合模块将经过增强和交互之后的可见光图像特征及红外图像特征进 行融合, 并将融合特征送入对应阶段的解码模块, 最后采用上采样和跳层连接逐级解码, 获 得多模态图像 语义分割结果。 2.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述双分支编码结构采用ResNet作为骨干网络, 形成可见光支路和红外支 路两组编码模块。 3.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征交互模块的增强过程具体包括: , , , 其中, 分别表示当前阶段编码模块所提取的可见光图像特征和红外图像特 征, 分别表示经过一维卷积和二维卷积处理后的可见光图像特征, 分别表示增强后的可见光图像特征和红外图像特征, 表示Sigmoi d函数, 表示一维卷 积, 对应的卷积核大小为 , C表示输入特征图的通道数, 表示卷 积核为7×7的二维卷积, 表示MaxPool操作, 表示AvgPool操作, 表示按位点乘运 算, 的计算过程与 相同。 4.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征交互模块的交 互过程具体包括: , , 其中, 分别表示当前阶段编码模块所提取的可见光图像特征和红外图像特 征, 分别表示输出到下一阶段编码模块的可见光图像特征和红外图像特征, 分别表示增强后的可 见光图像特 征和红外图像特 征, 为设定的权 重因子。 5.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述特 征融合模块实现的融合过程具体包括:权 利 要 求 书 1/2 页 2 CN 115546489 A 2对于经过增强和交互之后的可见光图像特征及红外图像特征 , 首先在通道 维度上进行堆叠, 而后经过通道融合模块融合, 输出当前编码阶段的融合特征 , 其中 通道融合模块包含两个1 ×1的卷积层、 一个3 ×3的卷积层、 一个激活层、 一个1 ×1的卷积 层、 两个归一 化层和一个跳层连接 。 6.根据权利要求1所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 每个解码模块的输入为上一个阶段的解码模块输出与当前阶段特征融合 模块输出的融合特 征相加。 7.根据权利要求6所述的一种基于跨模态特征强化与交互的多模态图像语义分割方 法, 其特征在于, 所述解码模块包括3个级联的卷积模块, 每个卷积模块包括一个3 ×3卷积 层、 一个归一 化层和一个激活层。权 利 要 求 书 2/2 页 3 CN 115546489 A 3
专利 基于跨模态特征强化与交互的多模态图像语义分割方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:26:41
上传分享
举报
下载
原文档
(883.5 KB)
分享
友情链接
GB-T 5357-2023 内六角花形扳手.pdf
TB-T 3504-2018 列车接近预警地面设备.pdf
GM-T 0088-2020 云服务器密码机管理接口规范.pdf
GB-T 25068.5-2021 信息技术 安全技术 网络安全 第5部分:使用虚拟专用网的跨网通信安全保护.pdf
GA 1800.2-2021 电力系统治安反恐防范要求 第2部分:火力发电企业.pdf
DB23-T 2844—2021 电子政务云平台安全管理规范 黑龙江省.pdf
T-HFS 001—2023 商业银行外部数据价值评估指南.pdf
GB-T 33009.1-2016工业自动化和控制系统网络安全集散控制系统(DCS)第1部分防护要求.pdf
T-CEC 712—2022 抽水蓄能电站故障录波配置导则.pdf
T-CIIA 023—2022 科学数据 云平台运维流程与要求.pdf
GB-T 21720-2022 农贸市场管理技术规范.pdf
GB-T 38485-2021 微生物痕量基因残留测定 微滴数字PCR法.pdf
GB-T 34690.10-2018 印刷技术 胶印数字化过程控制 第10部分:评价方法.pdf
GB-T 41776-2022 法庭科学 弹药鉴定方法.pdf
GB-T 25063-2010 信息安全技术 服务器安全测评要求.pdf
GB-T 8487-2010 港口装卸术语.pdf
GB-T 7666-2005 传感器命名法及代号.pdf
GB-T 35281-2017 信息安全技术 移动互联网应用服务器安全技术要求.pdf
TTAF 180.2—2023 小程序个人信息保护规范 第2部分:个人信息收集行为.pdf
T-CACM 1230—2019 中医内科临床诊疗指南 慢性咳嗽.pdf
1
/
15
评价文档
赞助2元 点击下载(883.5 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。