专利 一种优化的视觉SLAM方法

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210597439.1 (22)申请日 2022.05.30 (65)同一申请的已公布的文献号申请公布号 CN 114677444 A (43)申请公布日 2022.06.28 (73)专利权人杭州蓝芯科技有限公司地址 311121 浙江省杭州市余杭区余杭街道文一西路1818-2号7幢902室 (72)发明人张易学　周玄昊　 (74)专利代理机构北京易捷胜知识产权代理事务所(普通合伙) 11613 专利代理师齐胜杰 (51)Int.Cl. G06T 7/73(2017.01) G06V 20/10(2022.01)G06V 10/44(2022.01) G06V 10/74(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (56)对比文件 CN 110781262 A,2020.02.1 1 审查员孟桓羽 (54)发明名称一种优化的视觉SLAM方法 (57)摘要本发明涉及一种优化的视觉SLAM方法，包括：获取SLAM定位过程中当前图像帧及当前图像帧的特征点、描述子；描述子为训练的神经网络得到的优化描述子或其他算法得到的描述子，基于描述子获取当前与上一相邻图像帧的相似度，并满足预设条件时，归属到字典Ω中，以及更新视觉地图；同时基于字典Ω的键，周期性采用筛选策略筛选用于神经网络训练的键的训练集合 Ψ，若训练集合Ψ满足训练条件，则基于训练集合Ψ中各键的值训练所述神经网络；训练集合Ψ 中每一键均为具有稳定可靠性的键。本发明的方法实现在视觉定位优化中无监督自主训练神经网络，同时借助神经网络获取可靠的优化描述子进行相似度匹配，提高了定位的精度和可靠性。权利要求书3页说明书8页附图1页 CN 114677444 B 2022.08.26 CN 114677444 B 1.一种优化的视觉SLAM方法，其特征在于，包括： A10、获取SLAM定位过程中当前图像帧，在当前图像帧非起始图像帧时，获取当前图像帧中关注区域的局部特征图像、该局部特征图像的特征点和每一特征点的描述子；其中，描述子为训练完的神经网络对局部特征图像处理的优化描述子，或神经网络未训练完时视觉算法对局部特征图像处理的描述子； A20、对当前图像帧的特征点、描述子和上一相邻图像帧的特征点、描述子进行匹配，获取描述子相似度信息； A30、若描述子的相似度信息满足预设条件，则将当前图像帧的局部特征图像归属到上一相邻图像帧的局部特征图像所属的图片集合中，若不存在上一相邻图像帧的局部特征图像所属的图片集合，则在字典Ω中添加新的键，并将当前图像帧的局部特征图像和上一相邻图像帧的局部特征图像作为新键的值；字典Ω中各键的值均为图片集合；所述键为具有标识的特征点；以及获取当前图像帧和上一相邻图像帧中相机的位置变化信息，并更新相机位置集合P中的相机位姿，获得具有相机位置轨迹的视觉地图； A40、基于字典Ω中的键，周期性采用筛选策略筛选用于神经网络训练的键的训练集合 Ψ，若训练集合Ψ满足训练条件，则基于训练集合Ψ中各键的值训练所述神经网络；训练集合Ψ中每一键所属的特征点均具有稳定可靠性；所述方法还包括：给定用于跟踪特征点的字典Ω，字典Ω记录正在跟踪中的所有特征点的局部特征图像集合，字典Ω的键KEY为具有ID的特征点，而每个键对应的值VALUE为图片集合，图片集合中各局部特征图像携带有所属图像帧的序号；将相似度信息符合预设条件的各局部特征图像添加到匹配的特征点的图片集合；在SLAM定位过程开始时，字典 Ω为空，训练集合Ψ为空；训练集合Ψ表示神经网络训练样本的集合；当前图像帧i所有提取的特征点集合为Фi， Фi中所有特征点具有唯一标识，如果当前图像帧为SLAM定位过程中的起始图像帧，则i=1，并将当前图像帧的所有局部特征图像添加至字典Ω；其中，基于字典Ω的键，周期性采用筛选策略筛选用于神经网络训练的键的训练集合 Ψ，若训练集合Ψ满足训练条件，则基于训练集合Ψ中各键的值训练所述神经网络，包括：判断字典Ω中的每一键m的图片集合中局部特征图像的数量是否大于给定的第三阈值，若是，则认为键m的特征点具有稳定可靠性，并将键m的键值对添加到训练集合Ψ；所述键值对包括键及该键的图片集合； m为字典 Ω中键的序号；若训练集合Ψ中图片数量超过给定的第四阈值，则对训练集合中的各图片进行干扰增强处理，获取最终的训练集合，并采用最终的训练集合训练所述神经网络。 2.根据权利要求1所述的方法，其特征在于，所述A 20包括：在神经网络未训练完成时，将Фi中特征点的描述子与上一相邻图像帧的Фi‑1中特征点的描述子进行匹配，将描述子的相似度作为与预设条件判断的依据；在神经网络训练完成时，将当前图像帧的局部特征图像输入训练的神经网络进行正向计算，得到当前图像帧的优化描述子，将上一相邻图像帧的局部特征图像输入训练的神经网络进行正向计算，得到上一相邻图像帧的优化描述子，以及权　利　要　求　书 1/3 页 2 CN 114677444 B 2将Фi中特征点的优化描述子与上一相邻图像帧的Фi‑1中特征点的优化描述子进行匹配，将优化描述子的相似度作为与预设条件判断的依据。 3.根据权利要求1所述的方法，其特征在于，所述A3 0包括：如果当前图像帧中的特征点，上一图像帧中的特征点且两个特征点的描述子的相似度信息满足预设条件，且所属的局部特征图像属于字典Ω中某个键的图片集合，则将所属的局部特征图像加入该图片集合；如果当前图像帧中的特征点，上一图像帧中的特征点且两个特征点的描述子的相似度信息满足预设条件，且所属的局部特征图像不属于字典Ω中任意键的图片集合，则向字典 Ω中添加一个新的键，同时将各自所属的局部特征图像组成一个新的键的图片集合。 4.根据权利要求1所述的方法，其特征在于，所述方法还包括：在当前图像帧i处理之后，查看字典Ω中每一键k，将键k的图片集合中最后更新的局部特征图像的序号s与当前图像帧i作比较；若i ‑s大于给定的第二阈值，则判断：该键k的图片集合中局部特征图像的数量大于给定的第三阈值，则，认为键k所属的特征点具有稳定可靠性； k 为字典Ω中键的序号；并将该键k的键值对添加到训练集合Ψ；同时在视觉地图中更新相机位置轨迹；若i‑s大于给定的第二阈值，则判断键k所属的特征点不具有稳定可靠性，在字典Ω中删除键k及键k的图片集合，以及不在视觉地图中更新相机位置。 5.根据权利要求1所述的方法，其特征在于，所述对训练集合中的各图片进行干扰增强处理，包括：基于随机生成的一系列图像增强系数，对各图片的所有像素点值进行线性或非线性的变化，使得图片整体变亮或者变暗，进而生成一系列新的局部特征图片；和/或，针对每一图片的旋转中心轴，将各图片以随机给定的旋转角度进行旋转，生成一系列新的局部特征图片。 6.根据权利要求1所述的方法，其特征在于，并采用最终的训练集合训练所述神经网络，包括：神经网络的训练过程的目标损失函数，定义如下：对于任意两个训练样本，假设其输出的优化描述子分别为A,B, 其中A,B为n维向量，即A =[A1, A2…An],B=[B1, B2…Bn], 则优化描述子之差定义为： i取1至n中的自然数；训练过程中，神经网络中权重的调整与优化目标有以下两个：如果A,B为同一键的两张图像计算得到的优化描述子，则需要最大化d值； d为实数；如果A,B为不同键的两张图像计算得到的优化描述子，则需要最小化d值。权　利　要　求　书 2/3 页 3 CN 114677444 B 3

专利 一种优化的视觉SLAM方法

专利一种优化的视觉SLAM方法