standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211175040.0 (22)申请日 2022.09.26 (71)申请人 上海汽车集团股份有限公司 地址 201203 上海市浦东 新区中国 (上海) 自由贸易试验区松涛路563号1号楼 509室 申请人 上海汽车工业 (集团) 有限公司 (72)发明人 艾建勇 丁文博 (74)专利代理 机构 北京信远 达知识产权代理有 限公司 1 1304 专利代理师 冯柳伟 (51)Int.Cl. G06V 20/56(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01)G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 一种深度学习网络训练方法、 装置、 设备及 存储介质 (57)摘要 本申请公开了一种视觉感知模 型训练方法、 装置、 设备及存储介质, 可用于人工智能领域, 该 方法中, 首先, 获取相机内参、 相机外参、 相机捕 捉图像以及相机捕捉图像中识别目标的标注二 维表达式; 然后, 根据预设的视觉感知模 型、 相机 内参以及相机外参, 确定相机捕捉图像中识别目 标的预测三维表达式; 接着, 基于识别目标的预 测三维表达式和相机捕捉图像中识别目标的标 注二维表达式, 得到网络损失; 最后, 根据网络损 失, 训练视觉感知模型。 由此, 不需获取识别目标 的三维真值 即可得到网络损失, 从而在训练过程 中完成参数梯度的反向传播, 实现视觉感知模型 的无真值训练, 能够以低成本的方式对视觉感知 模型进行训练。 权利要求书2页 说明书8页 附图2页 CN 115457499 A 2022.12.09 CN 115457499 A 1.一种视 觉感知模型训练方法, 其特 征在于, 所述方法包括: 获取相机内参、 相机外参、 相机捕捉图像以及所述相机捕捉图像中识别目标的标注二 维表达式; 根据预设的视觉感知模型、 所述相机内参以及所述相机外参, 确定所述相机捕捉图像 中识别目标的预测三维表达式; 基于所述识别目标的预测三维表达式以及所述相机捕捉图像中识别目标的标注二维 表达式, 得到网络损失; 根据所述网络损失, 训练视 觉感知模型。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述识别目标的预测三维表达式 以及所述相机捕捉图像中识别目标的标注二维表达式, 得到网络损失, 包括: 基于所述识别目标的预测三维表达式以及预设的坐标系转换规则, 将所述识别目标的 预测三维表达式转换为所述相机捕捉图像所在的坐标系下的投影二维表达式; 基于所述识别目标的投影二维表达式与所述相机捕捉图像中识别目标的标注二维表 达式的差异, 得到损失函数; 根据所述损失函数, 计算网络损失。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述识别目标的投影二维表达式 与所述相机捕捉图像中识别目标的标注二维表达式的差异, 得到损失函数, 包括: 基于所述识别目标的投影二维表达式与所述相机捕捉图像中识别目标的标注二维表 达式中组成所述识别目标的点的坐标值差异和存在性差异, 得到损失函数。 4.根据权利要求1所述的方法, 其特 征在于, 所述识别目标包括: 车道线; 所述基于所述识别目标的预测三维表达式以及所述相机捕捉图像中识别目标的标注 二维表达式, 得到网络损失, 包括: 基于所述识别目标的预测三维表达式在所述相机捕捉图像所在坐标系中的投影二维 表达式与所述相机捕捉图像中识别目标的标注二维表达式的差异, 得到第一损失函数; 基于所述识别目标的预测三维表达式, 计算同一车道的车道宽度差异, 得到第二损 失 函数; 基于所述识别目标的预测三维表达式, 计算同一距离下相邻车道线的高度差异, 得到 第三损失函数; 根据所述第一损 失函数、 所述第二损 失函数以及所述第三损 失函数中的至少一项, 计 算网络损失。 5.根据权利要求4所述的方法, 其特征在于, 所述基于所述识别目标的预测三维坐标 值, 获取同一车道的车道宽度差异, 得到第二损失函数, 包括: 基于所述识别目标的预测三维表达式, 获取同一车道的车道宽度差异 的标准差、 方差 或均方差中的任意 一项; 根据所述同一车道 的车道宽度差异 的标准差、 方差或均方差中的任意一项, 得到第二 损失函数。 6.根据权利要求4所述的方法, 其特征在于, 所述基于所述识别目标的预测三维表达 式, 计算同一距离下相邻车道线的高度差异, 得到第三损失函数, 包括: 基于所述识别目标的预测三维表达式, 计算同一距离下相邻车道线的高度差异的绝对权 利 要 求 书 1/2 页 2 CN 115457499 A 2值、 平方或多次幂中的任意 一项; 根据所述同一距离下相邻车道线的高度差异 的绝对值、 平方或多次幂中的任意一项, 得到第三损失函数。 7.根据权利要求1所述的方法, 其特征在于, 所述根据所述网络损 失, 训练视觉感知模 型, 包括: 根据所述网络损失, 更新视 觉感知模型的参数。 8.一种视觉感知模型训练装置, 其特征在于, 所述装置包括: 数据获取模块, 坐标预测 模块, 损失计算模块以及模型训练模块; 所述数据获取模块, 用于获取相机内参、 相机外参、 相机捕捉图像以及所述相机捕捉图 像中识别目标的标注二维表达式; 所述坐标预测模块, 用于根据 预设的视觉感知模型、 所述相机内参以及所述相机外参, 确定所述相机捕捉图像中识别目标的预测三维表达式; 所述损失计算模块, 用于基于所述识别目标的预测三维表达 式以及所述相机捕捉图像 中识别目标的标注二维表达式, 得到网络损失; 所述模型训练模块, 用于根据所述网络损失, 训练视 觉感知模型。 9.一种视 觉感知模型训练设备, 其特 征在于, 所述设备包括: 存 储器和处 理器; 所述存储器用于存 储程序代码, 并将所述 程序代码传输给 所述处理器; 所述处理器用于根据 所述程序代码中的指令执行权利要求1 ‑7中任一项所述的视觉感 知模型训练方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 指令, 当所述计算机指令在视觉感知模型训练设备上运行时, 所述视觉感知模型训练设备 执行权利要求1 ‑7中任一项所述的视 觉感知模型训练方法的步骤。权 利 要 求 书 2/2 页 3 CN 115457499 A 3
专利 一种深度学习网络训练方法、装置、设备及存储介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-24 00:58:47
上传分享
举报
下载
原文档
(461.4 KB)
分享
友情链接
GB-T 35003-2018 非易失性存储器耐久和数据保持试验方法.pdf
GB-T 12727-2023 核电厂安全重要电气设备鉴定 IEC IEEE 60780-323-2016.pdf
DB11-T 1855-2021 固定资产投资项目节能审查验收技术规范 北京市.pdf
ISO 21448 2022 Road vehicles — Safety of the intended functionality.pdf
GB-T 36340-2018 防静电活动地板通用规范.pdf
SY-T 7650-2021 盐穴储气库造腔井下作业规范.pdf
GB-T 25030-2010 建筑物清洗维护质量要求.pdf
GB-T 13389-2014 掺硼掺磷掺砷硅单晶电阻率与掺杂剂浓度换算规程.pdf
T-ACEF 071—2023 燃煤电厂耦合处理城镇污水处理厂污泥污染物控制要求.pdf
JR-T 0228—2021 环境权益融资工具.pdf
GB-T 33301-2016 燃煤工业锅炉及窑炉节能量计算方法.pdf
GB-Z 40847-2021 认知康复训练系统通用技术条件.pdf
GB-T 34575-2023 轨道交通 机车车辆变流设备 机车、动车组辅助变流器.pdf
GB-T 16451-2017 天然脂肪醇.pdf
GB-T 28701-2012 胀紧联结套.pdf
GB-T 37893-2019 激光-电弧复合焊接推荐工艺方法.pdf
DB4403-T 422.1—2024 诚信计量管理规范 第1部分:通则 深圳市.pdf
DL-T 5083-2019 水电水利工程预应力锚固施工规范.pdf
青藤云安全 关键信息基础设施云安全指南.pdf
GB-T 18902-2002 超高频测距仪性能要求和测试方法.pdf
1
/
13
评价文档
赞助2.5元 点击下载(461.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。