standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221087967 7.1 (22)申请日 2022.07.25 (71)申请人 电子科技大 学长三角研究院 (湖州) 地址 313000 浙江省湖州市西塞山路819号 南太湖科技创新综合体B2幢8层 (72)发明人 沈冯立 李福生 赵彦春  (74)专利代理 机构 北京金智普华知识产权代理 有限公司 1 1401 专利代理师 郭美 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/40(2022.01) G06V 10/82(2022.01) G06V 10/74(2022.01) G06V 20/70(2022.01)G06N 3/04(2006.01) (54)发明名称 一种基于语义注意力机制的零样本语义分 割方法 (57)摘要 本发明公开了一种基于语义注意力机制的 零样本语义分割方法。 该方法包括如下步骤: 通 过背景提取模块提取背景掩码, 将背景掩码与初 始背景特征一起输入到背景更新模块中, 输出学 习得到的背景语义特征。 通过像素特征提取模块 得到语义注 意力图和视觉特征图, 利用语义特征 图和语义注意力图得到适用于当前图片的语义 特征, 最后计算语义特征和视觉特征图的余弦相 似度, 根据最大的相似度实现语义分割。 本方法 通过可学习可更新的背景和语义特征, 针对不同 的图片学习得到不同的语义特征, 根据得到的语 义特征帮助零样本语义分割模型更好地针对每 一个像素点进行语义分割, 提高模 型的泛化性和 通用性。 权利要求书2页 说明书4页 附图1页 CN 115424014 A 2022.12.02 CN 115424014 A 1.一种基于语义注意力机制的零样本语义分割方法, 其特 征在于, 包括以下步骤: 步骤一: 构建零样本语义分割数据集; 步骤二: 将步骤一数据集的训练图片输入到背景提取模块, 输出训练图片背景区域的 掩码图; 步骤三: 使用步骤二得到的掩码图掩盖训练图片的前景部分, 得到训练图片的背景区 域; 步骤四: 利用训练图片的背景 标注, 计算训练图片背景的语意分割损失; 步骤五: 将步骤三得到的背景区域输入到背景特征更新模块, 同时将初始背景特征输 入到背景模块中; 背景 特征更新模块输出适用于当前图片语义分割的背景 特征; 步骤六: 将训练图片输入到像素特征提取模块中, 像素特征提取模块输出两个图, 一个 是图片的像素级视 觉特征的特征图, 另一个是语义注意力图; 步骤七: 将步骤六中得到的语义注意力图作用在语义特征上得到针对每个像素点进行 语义分割的语义特 征向量; 步骤八: 计算步骤七中得到的针对每个像素点的语义特征向量和步骤五中得到的背景 特征与步骤六中输出 的特征图的每个像素点的相似度, 作为每个像素点的分类置信度, 通 过损失函数计算整图的语义分割损失; 步骤九: 根据步骤四和步骤八计算的背景和整图的语义分割损 失计算总损 失, 用总损 失训练背景提取模块、 背景 特征更新模块和像素 特征提取模块; 步骤十: 测试的时候, 先利用步骤三中的背景提取模块提取测试图片的背景区域掩码, 然后利用掩码得到测试图片的背 景区域, 将背景区域和初始背景特征输入到步骤五中的背 景特征更新模块中得到当前测试图片的背景特征; 与此同时, 将测试图片输入到步骤六中 的像素特征提取模型, 利用像素特征提取模型输出 的语义注意力图得到测试语义特征; 最 后采用步骤八的方法计算每个像素点的分类置信度, 取最大值作为每个像素点的分类结 果。 2.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤一中, 采用Vi sualObject Classes Challenge  2012(VOC2 012)数据集, 训练图 片有8256张, 测试图片有14 49张, 可见类有15类, 未 见类有5类。 3.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤二中, 背景提取模块采用MaskFormer模 型, 该模型主要用于有监督的语义分割 任务, 输入图片后可以输出图片的背景区域。 4.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤四中的训练图片背景的语义分割损失是通过二元交叉熵损失函数计算得到 。 5.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤五中的初始背景 特征是“background ”这个单词的词向量特 征。 6.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤五 中的背景特征更新模块由2层3 ×3卷积层和ReLU激活层组成, 最后通过全局 平局池化得到背 景特征, 然后拼接初始背景特征后, 经过1层 全连接层和ReLU激活层后得到 步骤五中的适用于当前图片语义分割的背景 特征。 7.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在权 利 要 求 书 1/2 页 2 CN 115424014 A 2于, 所述步骤六中的像素 特征提取模块采用的骨架模型 是deeplabv3模型。 8.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤 六中通过deeplabv3输出的像素特征图, 将像素特征图与可见类的语义特征相 乘后得到相 似度图, 然后将相 似度图输入到3层的3 ×3卷积层和ReLU层后输出一个语义注 意力图。 9.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤七中将语义注意力图作用在语义特征上 的具体操作为, 先在每个像素点上复 制对可见类数目的语义特征得到语义特征图, 然后 将步骤六中得到的语义注意力图和复制 得到的语义特 征图相乘得到利用语义注意力之后的语义注意力语义特 征图。 10.根据权利要求1所述的一种基于语义注意力机制的零样本语义分割方法, 其特征在 于, 所述步骤八中通过余弦相似度计算特征向量和语义特征向量的相似度, 所述步骤八中 的语义分割损失通过二元交叉熵损失函数计算得到 。权 利 要 求 书 2/2 页 3 CN 115424014 A 3

PDF文档 专利 一种基于语义注意力机制的零样本语义分割方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于语义注意力机制的零样本语义分割方法 第 1 页 专利 一种基于语义注意力机制的零样本语义分割方法 第 2 页 专利 一种基于语义注意力机制的零样本语义分割方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:31:56上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。