文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211265948.0 (22)申请日 2022.10.17 (71)申请人 华中科技大 学 地址 430074 湖北省武汉市洪山区珞喻路 1037号 (72)发明人 左峥嵘 方林涛 沈凡姝 王岳环 (74)专利代理 机构 华中科技大 学专利中心 42201 专利代理师 尹丽媛 (51)Int.Cl. G06V 10/26(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01) G06V 10/77(2022.01)G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种分层自注意力场景语义分割模型的构 建方法 (57)摘要 本发明属于图像处理技术领域, 具体涉及一 种分层自注 意力场景语义分割模 型的构建方法, 包括: 将输入图像经过分层全自注 意力编码器不 同层的特征提取, 依次输出不同层对应的特征 图; 其中, 基于输入图像的掩码真值标签, 通过掩 码标签细节聚合, 得到细节真值标签, 采用细节 真值标签和当前次迭代中第二层所输出的特征 图, 通过计算损失, 对下一次迭代中分层全自注 意力编码器中第二层的特征提取过程进行约束, 以引导分层全自注意力编码器底层学习空间细 节信息; 将当前次迭代中不同层对应的特征图, 输入全多层感知器解码器进行解码, 得到预测的 分割掩码, 优化分层全自注意力编码器和全多层 感知器解码器参数。 本发明对目标尺 寸变化差异 适应性良好。 权利要求书2页 说明书11页 附图3页 CN 115546485 A 2022.12.30 CN 115546485 A 1.一种分层自注意力场景语义分割模型的构建方法, 其特 征在于, 包括: 将输入图像通过重叠块嵌入切分成小块, 经过分层全自注意力编码器不同层的特征提 取, 依次输出不同层对应的特征图; 其中, 基于所述输入图像的掩码真值标签, 通过掩码标 签细节聚合, 得到细节真值标签, 采用所述细节真值标签和当前次迭代中第二层所输出 的 特征图, 通过计算损失, 对下一次迭代中所述分层全自注意力编码器中第二层的特征提取 过程进行约束, 以引导分层全自注意力编码器底层学习空间细节信息; 将当前次迭代中所述不同层对应的特征图, 输入全多层感知器解码器进行解码, 得到 预测的分割掩码; 基于所述预测的分割掩码和所述掩码真值标签, 计算分割损失, 优化所述 分层全自注意力编码器和所述全多层感知器解码器参数, 重复上述步骤, 直至达到迭代终 止条件, 完成场景语义分割模型的构建。 2.根据权利要求1所述的构建方法, 其特征在于, 所述每层自注意力编码器包括多头自 注意力模块和Mix ‑FFN, 其中, Mix ‑FFN是由一个前馈网络混合使用3 ×3卷积以及多层感知 器MLP组合构成, 其输出表示 为: xout=MLP(GELU(Co nv3×3(FFN(xin))))+xin; 式中, xin表示所述多头自注意力模块得到的多头自注意力特征, GELU表示高斯误差线 性单元激活函数, Conv3×3表示3×3卷积, MLP表示所述多层感知器MLP结构, FFN表示所述前 馈网络, xout表示所述Mix ‑FFN的输出, 作为单个自注意力编码器的输出。 3.根据权利要求2所述的构建方法, 其特征在于, 所述多头自注意力模块在计算多头自 注意力特征时, 将 每个头节点矩阵的反映图像分辨率的行数以缩减比例R进行缩减, 以降低 计算复杂度, 缩 减方式如下: 其中, T是待缩减的矩阵, 分别为Q、 K、 V矩阵, 第一个式子表示将T变形成大小为 的矩阵, linear(Cinput, Coutput)(·)表示将列数为Cinput的输入张量转换成列 数为Coutput的输出张量的线性层, 为维度为 的新头节点矩阵。 4.根据权利要求1所述的构建方法, 其特征在于, 所述全多层感知器解码器由全MLP层 构成。 5.根据权利要求1所述的构建方法, 其特征在于, 所述掩码标签细节聚合的实现方式 为: 采用固定拉普拉斯算子以及不同步长值, 对所述输入图像的掩码真值标签进行卷积计 算, 提取各步长下 所述掩码真值标签的第一细节边 缘特征; 分别对不同步长下的所述细节边缘特征进行向上采样操作, 得到宽度和高度与所述输 入图像相同的第二细节边 缘特征; 对不同步长对应的所述第 二细节边缘特征进行级联, 通过1 ×1大小的卷积对级联后的 第二细节边 缘特征进行融合, 得到融合后的细节边 缘特征; 设置门限阈值实现二值分割, 将所述融合后的细节边缘特征, 转换为二值图像空间细 节标签, 作为所述细节真值标签。权 利 要 求 书 1/2 页 2 CN 115546485 A 26.根据权利要求5所述的构建方法, 其特征在于, 所述上采样操作采用线性插值函数完 成。 7.根据权利要求1所述的构建方法, 其特征在于, 用于所述对下一 次迭代中所述分层全 自注意力编码 器中第二层的特征提取过程进 行约束的损失, 通过交叉熵损失与Dice损失联 合计算得到, 表示为: Ldetail(pd, gd)=Ldice(pd, gd)+Lbce(pd, gd); 其中, Ldetail(pd, gd)表示通过 交叉熵损失与Dice损失联合计算得到的细节损失, pd∈RH×W表示所述分层全自注意力编码 器中第二层所输出的特征, gd∈RH×W表示所述细节真值标签; Lbce为二分类交叉熵损失, Ldice 为Dice损失, 即: 其中, i表示像素编号, τ0表示拉普拉斯平 滑项。 8.一种场景语义分割方法, 其特征在于, 采用 如权利要求1至7任一项所述的一种分层 自注意力场景语义分割模型的构建方法所构建的分层自注意力场景语义分割模型进行场 景语义分割。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的计算 机程序, 其中, 在所述计算机程序被处理器运行时控制所述存储介质所在设备执行如权利 要求1至7任一项所述的一种分层自注意力场景语义分割模型的构建方法。权 利 要 求 书 2/2 页 3 CN 115546485 A 3
专利 一种分层自注意力场景语义分割模型的构建方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:24:34
上传分享
举报
下载
原文档
(1.2 MB)
分享
友情链接
DL-T 1987-2019 六氟化硫气体泄漏在线监测报警装置技术条件.pdf
GB-T 36073-2018数据管理能力成熟度评估模型.pdf
GB-T 19438.1-2004 禽流感病毒通用荧光 RT-PCR 检测方法.pdf
思度安全-DSMM-008 数据分类分级管理规范V1.0.pdf
腾讯 2022产业互联网安全十大趋势.pdf
GB-T 38994-2020 船舶数字化协同制造技术通用要求.pdf
T-CESA 1255—2023 智慧博物馆评价方法.pdf
专利 一种高速隔离网闸数据摆渡的实现系统及方法.PDF
GB-T 2518-2019 连续热镀锌和锌合金镀层钢板及钢带.pdf
NB-T 10802—2021 水电工程预应力锚固设计规范.pdf
GM-T 0050-2016 密码设备管理 设备管理技术规范.pdf
GB-Z 22553-2010 利用重复性、再现性和正确度的估计值评估测量不确定度的指南.pdf
YD-T 3763.1-2021 研发运营一体化(DevOps)能力成熟度模型 第1部分:总体架构.pdf
CISSP AIO-9 中文.pdf
信通院 数字营销异常流量研究报告-2022年.pdf
证券研究报告 大模型应用下自动驾驶赛道将有哪些变化-2023-10-自动驾驶.pdf
T-CFA 031103.5--2018—2018 铸造数字化工厂通用技术要求.pdf
GB-Z 42759-2023 智慧城市 人工智能技术应用场景分类指南.pdf
SY-T 6586-2020 石油天然气钻采设备 钻机现场安装及检验.pdf
SN-T 2045-2022 进出口燃料油产品技术规范.pdf
1
/
17
评价文档
赞助2元 点击下载(1.2 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。