standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210998060.1 (22)申请日 2022.08.19 (71)申请人 西安电子科技大 学 地址 710071 陕西省西安市太白南路2号 申请人 杭州职业 技术学院 (72)发明人 缑水平 杨华 姚瑶 陈云志  郭璋 李晟 毛莎莎  (74)专利代理 机构 陕西电子 工业专利中心 61205 专利代理师 王品华 (51)Int.Cl. G06V 10/74(2022.01) G06V 10/143(2022.01) G06V 10/82(2022.01) (54)发明名称 基于跨模态转换网络与最优传输理论的异 源图像匹配方法 (57)摘要 本发明公开了一种基于跨模态转换网络与 最优传输理论的异源图像匹配方法, 主要解决现 有技术对于大尺寸异源图像对难以平衡匹配速 度和精度的问题。 其实现方案为: 根据开源数据 集构建训练集和测试集; 构建相关图约束 Segformer特征提取骨架; 建立跨模态交叉注意 力Transformer网络, 并将其与特征提取骨架级 联, 构成跨模态转换匹配网络; 利用训练集数据 端到端地训练匹配网络; 将测试集图像输入到训 练好的匹配网络得到输出特征, 根据输出特征计 算测试图像的相似性矩阵, 并使用最优传输优化 该矩阵, 优化后相似性矩阵中最大值点的坐标即 为测试图像对的匹配点。 本发明提高了异源图像 匹配的准确率和匹配速度, 可用于飞行器的辅助 制导。 权利要求书4页 说明书9页 附图3页 CN 115331029 A 2022.11.11 CN 115331029 A 1.跨模态转换网络与最优传输理论的异源图像匹配方法, 其特 征在于, 包括: (1)构建异源图像匹配的训练数据和 测试数据: (1a)从开源数据集OSDataset中选择尺寸为512 ×512的图像对作为选用数据集, 该数 据集包含成对的已经完成配准的SAR和可 见光图像; (1b)将选用数据集每对图像中的可见光 图像作为搜索图像, 在每幅可见光对应的SAR 图像中随机选择像素作为左 上角坐标, 剪裁出256 ×256的图像作为模板图像, 并保存该左 上角坐标作为该图像对的真实标签; (1c)将成对的剪裁后的SAR图像和对应的可见光图像中80%的图像对作为训练集, 20%的图像对作为测试集; (2)构建跨模态Transformer匹配网络N1: (2a)设置包 含相关图约束的Segformer特 征提取骨架; (2b)建立包 含跨模态交叉注意力的Transformer网络N0; (2c)将包含相关图约束的Segformer特征提取骨架、 包含跨模态交叉注意力的 Transformer网络级联, 组成跨模态Transformer匹配网络N1; (3)利用训练数据和最优传输理论, 使用Adam算法对匹配网络N1进行迭代训练, 得到训 练好的匹配网络N2; (4)利用最优传输和训练好的匹配网络N2对测试集的图像对进行匹配: (4a)将测试集中的SAR图像和可见光图像输入到训练好的匹配网络N2中, 得到测试图 像对的SAR图像特 征fs′和可见光图像特 征fo′; (4b)计算测试图像对输出 特征的相似性矩阵M ′: 其中, T表示矩阵的转置, | |||表示取模; (4c)根据测试图像对输出特征的相似性矩阵M ′利用最优传输优化计算测试图像对最 优匹配概 率C*′; (4d)将测试图像最优匹配概率C*′与其相似 性矩阵M′相乘, 得到优化后的相似性度量矩 阵M′opt: M′opt=C*′ ⊙M′ 其中,⊙表示矩阵中对应位置的元 素相乘; (4e)将M′opt中最大值点的坐标作为匹配点(xtest,ytest), 该点即为测试集中SAR模板图 像在可见光图像中的对应匹配位置, 完成异源图像的匹配。 2.根据权利要求1所述的方法, 其特征在于, 所述(2a)中设置包含相关图约束的 Segformer特 征提取骨架, 实现如下: (2a1)在已有的Segformer网络中, 设第1个Transformer  Block输出SAR图像的输出特 征图尺寸为 可见光图像的输出特征图尺寸为 构建一个尺寸为 的零矩阵 作为待修 正的第一相关图; (2a2)计算Segfor mer网络中第1个Trans former Block输出SAR图像和可见光特征的互权 利 要 求 书 1/4 页 2 CN 115331029 A 2相关矩阵Cor1, 根据Cor1对第一相关图 进行修正, 得到修正后的第一相关图 并将 与第1个Transformer  Block输出的特 征相乘作为第2个Transformer  Block的输入; (2a3)在已有的Segformer网络中, 设第3个Transformer  Block输出SAR图像的输出特 征图尺寸 为 可见光图像的输出 特征图尺寸 为 构建一个尺寸 为 的零矩阵 作为待修 正的第二相关图; (2a4)计算Segfor mer网络中第3个Trans former Block输出SAR图像和可见光特征的互 相关矩阵Cor3, 根据Cor3对第二相关图 进行修正, 得到修正后的第二相关图 将 与第3个Transformer  Block输出的特 征相乘作为第4个Transformer  Block的输入。 3.根据权利要求2所述的方法, 其特征在于, 所述(2 a2)中根据Cor1对第一相关图 进 行修正, 是依次以Cor1中的每个点(x,y)为修正范围的左上角坐标对第一相关图 进行修 正, 即: 先设置每次修正时左上角坐标(x,y)对应的修正范围为: 再根据该修正范围将第一相关图 中的值修改为 得到修正后的 相关图 其中: 表示 中点(i,j)处的值, Cor1(x,y)为Cor1中点(x,y)处的值; 表示取 和Cor1(x,y)之间的最大值。 4.根据权利要求2所述的方法, 其特征在于, 所述(2 a4)中根据Cor3对第二相关图 进 行修正, 实现如下: 首先, 设置每次修正时Cor3中的每个点(x,y)对应的修正范围 然后, 根据所设置的修正范围将第二相关图 中的值修改为 得到 修正后的相关图 其中: 表示 中点(i,j)处的值, Cor3(x,y)为Cor3中点(x,y) 处的值; 表示取 和Cor3(x,y)之间的最大值。 5.根据权利要求1所述的方法, 其特征在于, 所述(2b)中建立包含跨模态交叉注意力的 Transformer网络N1, 是通过对现有Segformer网络的改进建立, 具体实现如下: 首先, 将现有Segformer网络中的第3、 第4个Transformer  Block去除; 然后, 交换第1个Transformer  Block中的可见光图像特征查询 和SAR图像特征查询 最后, 交换第2个Transformer  Block中的可见光图像特征查询 和SAR图像特征查询 得到包含跨模态交叉注意力的Transformer网络N1。 6.根据权利要求1所述的方法, 其特征在于, 所述(3)中利用训练数据和最优传输, 使用 Adam算法对匹配网络N1进行迭代训练, 实现如下:权 利 要 求 书 2/4 页 3 CN 115331029 A 3

PDF文档 专利 基于跨模态转换网络与最优传输理论的异源图像匹配方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于跨模态转换网络与最优传输理论的异源图像匹配方法 第 1 页 专利 基于跨模态转换网络与最优传输理论的异源图像匹配方法 第 2 页 专利 基于跨模态转换网络与最优传输理论的异源图像匹配方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:31:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。