文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211175040.0 (22)申请日 2022.09.26 (71)申请人 上海汽车集团股份有限公司 地址 201203 上海市浦东 新区中国 (上海) 自由贸易试验区松涛路563号1号楼 509室 申请人 上海汽车工业 (集团) 有限公司 (72)发明人 艾建勇 丁文博 (74)专利代理 机构 北京信远 达知识产权代理有 限公司 1 1304 专利代理师 冯柳伟 (51)Int.Cl. G06V 20/56(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01)G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 一种深度学习网络训练方法、 装置、 设备及 存储介质 (57)摘要 本申请公开了一种视觉感知模 型训练方法、 装置、 设备及存储介质, 可用于人工智能领域, 该 方法中, 首先, 获取相机内参、 相机外参、 相机捕 捉图像以及相机捕捉图像中识别目标的标注二 维表达式; 然后, 根据预设的视觉感知模 型、 相机 内参以及相机外参, 确定相机捕捉图像中识别目 标的预测三维表达式; 接着, 基于识别目标的预 测三维表达式和相机捕捉图像中识别目标的标 注二维表达式, 得到网络损失; 最后, 根据网络损 失, 训练视觉感知模型。 由此, 不需获取识别目标 的三维真值 即可得到网络损失, 从而在训练过程 中完成参数梯度的反向传播, 实现视觉感知模型 的无真值训练, 能够以低成本的方式对视觉感知 模型进行训练。 权利要求书2页 说明书8页 附图2页 CN 115457499 A 2022.12.09 CN 115457499 A 1.一种视 觉感知模型训练方法, 其特 征在于, 所述方法包括: 获取相机内参、 相机外参、 相机捕捉图像以及所述相机捕捉图像中识别目标的标注二 维表达式; 根据预设的视觉感知模型、 所述相机内参以及所述相机外参, 确定所述相机捕捉图像 中识别目标的预测三维表达式; 基于所述识别目标的预测三维表达式以及所述相机捕捉图像中识别目标的标注二维 表达式, 得到网络损失; 根据所述网络损失, 训练视 觉感知模型。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述识别目标的预测三维表达式 以及所述相机捕捉图像中识别目标的标注二维表达式, 得到网络损失, 包括: 基于所述识别目标的预测三维表达式以及预设的坐标系转换规则, 将所述识别目标的 预测三维表达式转换为所述相机捕捉图像所在的坐标系下的投影二维表达式; 基于所述识别目标的投影二维表达式与所述相机捕捉图像中识别目标的标注二维表 达式的差异, 得到损失函数; 根据所述损失函数, 计算网络损失。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述识别目标的投影二维表达式 与所述相机捕捉图像中识别目标的标注二维表达式的差异, 得到损失函数, 包括: 基于所述识别目标的投影二维表达式与所述相机捕捉图像中识别目标的标注二维表 达式中组成所述识别目标的点的坐标值差异和存在性差异, 得到损失函数。 4.根据权利要求1所述的方法, 其特 征在于, 所述识别目标包括: 车道线; 所述基于所述识别目标的预测三维表达式以及所述相机捕捉图像中识别目标的标注 二维表达式, 得到网络损失, 包括: 基于所述识别目标的预测三维表达式在所述相机捕捉图像所在坐标系中的投影二维 表达式与所述相机捕捉图像中识别目标的标注二维表达式的差异, 得到第一损失函数; 基于所述识别目标的预测三维表达式, 计算同一车道的车道宽度差异, 得到第二损 失 函数; 基于所述识别目标的预测三维表达式, 计算同一距离下相邻车道线的高度差异, 得到 第三损失函数; 根据所述第一损 失函数、 所述第二损 失函数以及所述第三损 失函数中的至少一项, 计 算网络损失。 5.根据权利要求4所述的方法, 其特征在于, 所述基于所述识别目标的预测三维坐标 值, 获取同一车道的车道宽度差异, 得到第二损失函数, 包括: 基于所述识别目标的预测三维表达式, 获取同一车道的车道宽度差异 的标准差、 方差 或均方差中的任意 一项; 根据所述同一车道 的车道宽度差异 的标准差、 方差或均方差中的任意一项, 得到第二 损失函数。 6.根据权利要求4所述的方法, 其特征在于, 所述基于所述识别目标的预测三维表达 式, 计算同一距离下相邻车道线的高度差异, 得到第三损失函数, 包括: 基于所述识别目标的预测三维表达式, 计算同一距离下相邻车道线的高度差异的绝对权 利 要 求 书 1/2 页 2 CN 115457499 A 2值、 平方或多次幂中的任意 一项; 根据所述同一距离下相邻车道线的高度差异 的绝对值、 平方或多次幂中的任意一项, 得到第三损失函数。 7.根据权利要求1所述的方法, 其特征在于, 所述根据所述网络损 失, 训练视觉感知模 型, 包括: 根据所述网络损失, 更新视 觉感知模型的参数。 8.一种视觉感知模型训练装置, 其特征在于, 所述装置包括: 数据获取模块, 坐标预测 模块, 损失计算模块以及模型训练模块; 所述数据获取模块, 用于获取相机内参、 相机外参、 相机捕捉图像以及所述相机捕捉图 像中识别目标的标注二维表达式; 所述坐标预测模块, 用于根据 预设的视觉感知模型、 所述相机内参以及所述相机外参, 确定所述相机捕捉图像中识别目标的预测三维表达式; 所述损失计算模块, 用于基于所述识别目标的预测三维表达 式以及所述相机捕捉图像 中识别目标的标注二维表达式, 得到网络损失; 所述模型训练模块, 用于根据所述网络损失, 训练视 觉感知模型。 9.一种视 觉感知模型训练设备, 其特 征在于, 所述设备包括: 存 储器和处 理器; 所述存储器用于存 储程序代码, 并将所述 程序代码传输给 所述处理器; 所述处理器用于根据 所述程序代码中的指令执行权利要求1 ‑7中任一项所述的视觉感 知模型训练方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 指令, 当所述计算机指令在视觉感知模型训练设备上运行时, 所述视觉感知模型训练设备 执行权利要求1 ‑7中任一项所述的视 觉感知模型训练方法的步骤。权 利 要 求 书 2/2 页 3 CN 115457499 A 3
专利 一种深度学习网络训练方法、装置、设备及存储介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-24 00:58:47
上传分享
举报
下载
原文档
(461.4 KB)
分享
友情链接
T-SUCA 008.3—2022 显示系统视觉舒适度 第2-2部分:平板显示-蓝光测量方法.pdf
众城智库 信创产业发展报告 2021.pdf
GB-T 40753.4-2024 供应链安全管理体系 ISO 28000实施指南 第4部分:以符合GB-T 38702为管理目标实施ISO 28000的附加特定指南.pdf
GB-T 31487.2-2015 直流融冰装置 第2部分:晶闸管阀.pdf
GB-T 36699-2018 锅炉用液体和气体燃料燃烧器技术条件.pdf
等保三级-安全管理-系统运维管理.doc
GB-T 36631-2018 信息安全技术 时间戳策略和时间戳业务操作规则.pdf
GB-T 3094-2012 冷拔异型钢管.pdf
T-CNFPIA 3002—2018 无醛人造板及其制品.pdf
GB-T 30354-2013 食用植物油散装运输规范.pdf
ISO IEC 20924 2024 Internet of Things (IoT) and digital twin — Vocabulary.pdf
蚂蚁集团王维强:大模型安全的探索与实践分享-大模型安全的“快”与“慢”.pdf
GB-T 3624-2023 钛及钛合金无缝管.pdf
DB44-T 983-2012 水泥回转窑节能评价方法 广东省.pdf
DB37-T 3386-2018 工业园区规划水资源论证技术导则 山东省.pdf
YD-T 1728-2008 电信网和互联网安全防护管理指南.pdf
GB-T 36626-2018 信息安全技术 信息系统安全运维管理指南.pdf
NB-T 10607—2021 水力发电厂门禁系统设计导则.pdf
DB23-T 1574—2020 森林火灾林木损失调查评估技术规程 黑龙江省.pdf
GB/T 39409-2020 北斗网格位置码.pdf
1
/
13
评价文档
赞助2元 点击下载(461.4 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。