standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221087967 7.1 (22)申请日 2022.07.25 (71)申请人 电子科技大 学长三角研究院 (湖州) 地址 313000 浙江省湖州市西塞山路819号 南太湖科技创新综合体B2幢8层 (72)发明人 沈冯立 李福生 赵彦春 (74)专利代理 机构 北京金智普华知识产权代理 有限公司 1 1401 专利代理师 郭美 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/40(2022.01) G06V 10/82(2022.01) G06V 10/74(2022.01) G06V 20/70(2022.01)G06N 3/04(2006.01) (54)发明名称 一种基于语义注意力机制的零样本语义分 割方法 (57)摘要 本发明公开了一种基于语义注意力机制的 零样本语义分割方法。 该方法包括如下步骤: 通 过背景提取模块提取背景掩码, 将背景掩码与初 始背景特征一起输入到背景更新模块中, 输出学 习得到的背景语义特征。 通过像素特征提取模块 得到语义注 意力图和视觉特征图, 利用语义特征 图和语义注意力图得到适用于当前图片的语义 特征, 最后计算语义特征和视觉特征图的余弦相 似度, 根据最大的相似度实现语义分割。 本方法 通过可学习可更新的背景和语义特征, 针对不同 的图片学习得到不同的语义特征, 根据得到的语 义特征帮助零样本语义分割模型更好地针对每 一个像素点进行语义分割, 提高模 型的泛化性和 通用性。 权利要求书2页 说明书4页 附图1页 CN 115424014 A 2022.12.02 CN 115424014 A 1.一种基于语义注意力机制的零样本语义分割方法, 其特 征在于, 包括以下步骤: 步骤一: 构建零样本语义分割数据集; 步骤二: 将步骤一数据集的训练图片输入到背景提取模块, 输出训练图片背景区域的 掩码图; 步骤三: 使用步骤二得到的掩码图掩盖训练图片的前景部分, 得到训练图片的背景区 域; 步骤四: 利用训练图片的背景 标注, 计算训练图片背景的语意分割损失; 步骤五: 将步骤三得到的背景区域输入到背景特征更新模块, 同时将初始背景特征输 入到背景模块中; 背景 特征更新模块输出适用于当前图片语义分割的背景 特征; 步骤六: 将训练图片输入到像素特征提取模块中, 像素特征提取模块输出两个图, 一个 是图片的像素级视 觉特征的特征图, 另一个是语义注意力图; 步骤七: 将步骤六中得到的语义注意力图作用在语义特征上得到针对每个像素点进行 语义分割的语义特 征向量; 步骤八: 计算步骤七中得到的针对每个像素点的语义特征向量和步骤五中得到的背景 特征与步骤六中输出 的特征图的每个像素点的相似度, 作为每个像素点的分类置信度, 通 过损失函数计算整图的语义分割损失; 步骤九: 根据步骤四和步骤八计算的背景和整图的语义分割损 失计算总损 失, 用总损 失训练背景提取模块、 背景 特征更新模块和像素 特征提取模块; 步骤十: 测试的时候, 先利用步骤三中的背景提取模块提取测试图片的背景区域掩码, 然后利用掩码得到测试图片的背 景区域, 将背景区域和初始背景特征输入到步骤五中的背 景特征更新模块中得到当前测试图片的背景特征; 与此同时, 将测试图片输入到步骤六中 的像素特征提取模型, 利用像素特征提取模型输出 的语义注意力图得到测试语义特征; 最 后采用步骤八的方法计算每个像素点的分类置信度, 取最大值作为每个像素点的分类结 果。 2.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤一中, 采用Vi sualObject Classes Challenge 2012(VOC2 012)数据集, 训练图 片有8256张, 测试图片有14 49张, 可见类有15类, 未 见类有5类。 3.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤二中, 背景提取模块采用MaskFormer模 型, 该模型主要用于有监督的语义分割 任务, 输入图片后可以输出图片的背景区域。 4.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤四中的训练图片背景的语义分割损失是通过二元交叉熵损失函数计算得到 。 5.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤五中的初始背景 特征是“background ”这个单词的词向量特 征。 6.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤五 中的背景特征更新模块由2层3 ×3卷积层和ReLU激活层组成, 最后通过全局 平局池化得到背 景特征, 然后拼接初始背景特征后, 经过1层 全连接层和ReLU激活层后得到 步骤五中的适用于当前图片语义分割的背景 特征。 7.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在权 利 要 求 书 1/2 页 2 CN 115424014 A 2于, 所述步骤六中的像素 特征提取模块采用的骨架模型 是deeplabv3模型。 8.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤 六中通过deeplabv3输出的像素特征图, 将像素特征图与可见类的语义特征相 乘后得到相 似度图, 然后将相 似度图输入到3层的3 ×3卷积层和ReLU层后输出一个语义注 意力图。 9.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤七中将语义注意力图作用在语义特征上 的具体操作为, 先在每个像素点上复 制对可见类数目的语义特征得到语义特征图, 然后 将步骤六中得到的语义注意力图和复制 得到的语义特 征图相乘得到利用语义注意力之后的语义注意力语义特 征图。 10.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤八中通过余弦相似度计算特征向量和语义特征向量的相似度, 所述步骤八中 的语义分割损失通过二元交叉熵损失函数计算得到 。权 利 要 求 书 2/2 页 3 CN 115424014 A 3
专利 一种基于语义注意力机制的零样本语义分割方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:31:56
上传分享
举报
下载
原文档
(396.9 KB)
分享
友情链接
GB-T 8566-2022系统与软件工程 软件生存周期过程.pdf
GB-Z 28828-2012 信息安全技术 公共及商用服务信息系统个人信息保护指南.pdf
GB-T 41985-2022 230MeV~250MeV超导质子回旋加速器.pdf
GA 1800.1-2021 电力系统治安反恐防范要求 第1部分:电网企业.pdf
GM-T 0044.4-2016 SM9标识密码算法 第4部分:密钥封装机制和公钥加密算法.pdf
GB-T 31501-2015 信息安全技术 鉴别与授权 授权应用程序判定接口规范.pdf
DB46-T 154-2009 电梯节能改造技术指南 海南省.pdf
DB11-T 948.13-2013 电梯运行安全监测信息管理系统技术规范 第13部分:平台维护要求 北京市.pdf
GB-T 20169-2015 离子型稀土矿混合稀土氧化物.pdf
奇安信 准入控制(NAC)解决方案分享.pdf
GB-T 22264.8-2022 安装式数字显示电测量仪表 第8部分:试验方法.pdf
中国评测 商用密码应用安全性评估白皮书(2021年).pdf
YD-T 零信任安全技术参考框架 2021报批稿.pdf
DB3206-T 1040-2022 叉车司机实际操作技能考核规范 南通市.pdf
国家健康医疗大数据标准、安全和服务管理办法(试行).pdf
纯电动乘用车控制芯片功能环境试验方法.pdf
GB-T 36692-2018 工业用顺式-1,3,3,3-四氟丙烯[HFO-1234ze(Z)].pdf
GB-T 4830-2015 工业自动化仪表 气源压力范围和质量.pdf
企业软件安全开发实践 培训材料.pdf
YD-T 4075-2022 以太网交换机多机虚拟化系统技术要求.pdf
1
/
8
评价文档
赞助2.5元 点击下载(396.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。