(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210631663.8
(22)申请日 2022.06.06
(71)申请人 中国第一汽车股份有限公司
地址 130011 吉林省长 春市汽车 经济技术
开发区新红旗大街1号
(72)发明人 刘媛媛 陈博 尹荣彬 张伟伟
(74)专利代理 机构 北京博浩百 睿知识产权代理
有限责任公司 1 1134
专利代理师 谢湘宁
(51)Int.Cl.
G06T 7/246(2017.01)
G06T 7/73(2017.01)
G06V 10/74(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
目标跟踪方法、 装置及电子设备
(57)摘要
本发明公开了一种目标跟踪 方法、 装置及电
子设备。 其中, 该方法包括: 采集车辆行驶环境的
当前帧图像和当前帧图像的上一帧图像; 采用上
一帧图像中识别出来的至少一个感知框, 预测当
前帧图像中的预测感知框; 将当前帧图像中识别
出来的至少一个感知框分别与对应位置的预测
感知框进行第一次匹配; 获取当前帧图像中匹配
成功的目标感知框; 调用神经网络模 型从匹配成
功的目标感知框中提取感知框特征; 基于提取得
到的目标感知框的感知框特征, 采用匈牙利算法
对目标感知框进行二次匹配; 在匹配成功的情况
下, 确定跟踪到的目标对象的位置。 本发明至少
解决了由于目标之间的遮挡和目标运动变化较
快导致目标跟踪不 准确的问题。
权利要求书3页 说明书11页 附图3页
CN 114943750 A
2022.08.26
CN 114943750 A
1.一种目标跟踪方法, 其特 征在于, 包括:
在车辆行驶过程中, 采集车辆行驶环境的当前帧图像和所述当前帧图像的上一帧图
像;
采用所述上一帧图像中识别出来的至少一个感知框, 预测所述当前帧图像中的预测感
知框, 其中, 所述感知框用于标识所述上一帧图像中待跟踪的目标对象;
将所述当前帧图像中识别出来的至少一个感知框分别与对应位置的预测感知框进行
第一次匹配;
获取所述当前帧图像中匹配成功的目标感知框;
调用神经网络模型从匹配成功的所述目标感知框中提取感知框特 征;
基于提取得到的所述目标感知框的感知框特征, 采用匈牙利算法对所述目标感知框进
行二次匹配;
在匹配成功的情况 下, 确定跟踪到的所述目标对象的位置 。
2.根据权利要求1所述的方法, 其特征在于, 采用所述上一帧图像中识别出来的至少一
个感知框, 预测所述当前帧图像中的预测感知框, 包括:
从所述上一帧图像中识别出待跟踪的所述目标对象, 并在所述上一帧图像中标识出与
所述目标对象匹配的至少一个所述感知框;
基于所述目标对象在所述上一帧图像中的至少一个感知框的坐标, 预测得到所述目标
对象在所述当前帧图像中的预测感知框的位置 。
3.根据权利要求2所述的方法, 其特征在于, 基于所述目标对象在所述上一帧图像 中的
至少一个感知框的坐标, 预测得到所述目标对象在所述当前帧图像中的预测感知框的位
置, 包括:
从所述上一帧图像中获取所述目标对象在相机坐标系下的坐标值, 其中, 所述相机坐
标系为以拍摄所述目标对象的相机为定位基准下的坐标系;
将所述目标对象在所述相机坐标系下的坐标值转换到对象坐标系, 其中, 所述对象坐
标系为以所述目标对象为定位基准下的坐标系;
基于所述目标对象的相对速度和在相邻 两个帧图像中发生位移前后的时间差, 预测得
到所述目标对象在所述当前帧图像的所述对象坐标系中的目标对象位置;
将预测得到的所述目标对象位置转换到所述相机坐标系下;
根据所述相机坐标系在所述相邻 两个帧图像中的坐标变化, 计算得到所述目标对象在
所述当前帧图像的图像坐标系下的位置;
基于所述目标对象在所述当前帧图像的图像坐标系下的位置, 获取所述目标对象在所
述当前帧图像中的预测感知框的位置 。
4.根据权利要求1至3中任意一项所述的方法, 其特征在于, 将所述当前帧图像中识别
出来的至少一个感知框分别与对应位置的预测感知框进行第一次匹配, 包括:
将所述当前帧图像中识别出来的至少一个感知框和对应类型的所述预测感知框进行
交并比计算, 获取 所述当前帧图像中每 个所述目标对象的交并比IOU;
从所述当前帧图像中确定交并比IOU最大的目标对象, 得到跟踪对象;
如果所述跟踪对象的交并比IOU满足最低限制, 校验所述跟踪对象的感知框与对应的
预测感知框是否存在坐标跳变;权 利 要 求 书 1/3 页
2
CN 114943750 A
2如果不存在所述坐标跳变, 则所述跟踪对象的感知框为所述当前帧图像中匹配成功的
目标感知框 。
5.根据权利要求4所述的方法, 其特征在于, 调用神经网络模型从匹配成功的所述目标
感知框中提取感知框特 征, 包括:
将所述当前帧图像中匹配成功的目标感知框进行多任务调度;
将所述目标感知框的范围进行外扩, 得到 外扩后的目标感知框;
调用所述神经网络模型对所述外扩后的目标感知框进行分类, 确定所述目标感知框的
类型, 并提取 得到所述当前帧图像中匹配成功的目标感知框的感知框特 征。
6.根据权利要求5所述的方法, 其特征在于, 基于提取得到的所述目标感知框的感知框
特征, 采用匈 牙利算法对所述目标感知框进行二次匹配, 包括:
将所述当前帧图像中提取到的至少一个感知框特征与对应的所述目标对象的历史特
征进行余弦相似度计算;
从计算结果中确定相似度最大的目标感知框;
如果所述相似度最大的目标感知框的交并比IOU满足最低阀值, 获取所述相似度最大
的目标感知框的权 重矩阵;
基于所述相似度最大的目标感知框的权重矩阵, 采用所述匈牙利算法对所述相似度最
大的目标感知框进行二次匹配。
7.根据权利要求6所述的方法, 其特征在于, 在匹配成功 的情况下, 确定跟踪到的所述
目标对象的位置, 包括:
在匹配成功的情况下, 校验所述相似度最大的目标感知框与对应的历史感知框是否存
在坐标跳变;
如果不存在所述坐标跳变, 则确定所述相似度最大的目标感知框所对应的目标对象为
跟踪到的所述目标对象, 并获取跟踪到的所述目标对象的位置 。
8.根据权利要求7 所述的方法, 其特 征在于, 所述方法还 包括:
获取匹配失败的目标感知框, 并对所述匹配失败的目标感知框赋予新的标识信息 。
9.一种目标跟踪装置, 其特 征在于, 包括:
采集模块, 用于采集车辆行驶环境的当前帧图像和所述当前帧图像的上一帧图像;
预测模块, 用于采用所述上一帧图像中识别出来的至少一个感知框, 预测所述当前帧
图像中的预测感知框, 其中, 所述感知框用于标识所述上一帧图像中待跟踪的目标对象;
第一匹配模块, 用于将所述当前帧图像中识别出来的至少一个感知框分别与对应位置
的预测感知框进行第一次匹配;
获取模块, 用于获取 所述当前帧图像中匹配成功的目标感知框;
调用模块, 用于调用神经网络模型从匹配成功的所述目标感知框中提取感知框特 征;
第二匹配模块, 用于基于提取得到的所述目标感知框的感知框特征, 采用匈牙利算法
对所述目标感知框进行二次匹配;
确定模块, 用于在匹配成功的情况 下, 确定跟踪到的所述目标对象的位置 。
10.一种电子设备, 其特征在于, 电子设备包括一个或多个处理器; 存储装置, 用于存储
一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所述一个
或多个处理器实现用于运行程序, 其中, 所述程序被设置为运行时执行所述权利要求1至8权 利 要 求 书 2/3 页
3
CN 114943750 A
3
专利 目标跟踪方法、装置及电子设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:42上传分享