|期刊分享|SLAM|无人机上单目视觉稳健初始化估计方法
bigegpt 2024-10-12 05:36 6 浏览
编者序:本文是香港科技大学沈邵劼老师的一篇经典文章,沈老师在单目视觉与IMU融合的SLAM方面做了大量优质工作且在GitHub上提供了相关源码。传感器器融合中,初始化是至关重要的一项工作,本文理论焦点在于如何快速稳健初始化,但该部分水太深,编者理解有限,推荐看原文。
推荐指数 ☆☆☆☆☆
一、引言
微型无人机的需求越来越广泛,最近出现了空中拍摄、调查研究和搜救方面的应用。精确的状态估计是自主飞行的核心基础。许多基于单目、双目和RGBD相机及激光雷达的的定位算法在无人机上成功应用。一些应用中,受限于成本和功耗,机上的传感器数量非常有限。单目视觉惯性系统,仅含一个相机和一个低成本IMU,具有尺寸小、重量轻、低功耗的特点,已经成为一种非常有吸引力的选择。单目视觉惯性系统具有在没有GPS信号的环境中自主飞行的能力,是非常值得研究的。
稳健的状态估计是复杂环境无人机飞行的核心能力,由于视觉惯性系统的非线性,单目估计器的性能严重依赖于初始值(重力、速度、偏差和特征深度)的精度。不好的初始化会降低收敛速度甚至导致完全错误估计。尤其对拥有6自由度的无人机来讲,精确初始值是至关重要的。然而,获取精确的初始状态对单目视觉系统来讲并不容易:一方面,单目星级不能直接観测到尺度值;另一方面,初始化尺度值时需要非零加速运动。这会导致非平凡但是未知的初始attitude(重力向量)和速度。尤其是在时间约束的救援任务中,静止或按某种特定模式飞行进行初始化是不可取的,需要能快速起飞MAV,并不利用运动的先验信息初始化估计器。此外,视觉算法在快速运动或光照强烈变化时会失效,导致跟踪失败。这暗示着研究飞行中自动重新初始化是必要的,这是我们研究能够在飞行中初始化恢复所有关键状态的稳健系统的动机。
本文提出了一种飞行中初始化的单目视觉惯性系统初始化方法,初始速度、重力向量、尺度和陀螺仪偏差在初始化阶段校正。首先执行仅视觉的运动恢复结构(structure from motion,SfM),然后大致对齐IMU测量值和SfM结果以或得初始状态。本文的贡献主要是两方面:(1)该方法能够在飞行中初始化,从而为非线性优化系统提供精确初始值;(2)在系统方面,将该方法应用于基于划窗的单目视觉惯性系统。
二、算法总览
本文算法的动机是:无论松耦合还是紧耦合方法,都需要精确的初始估计以激活单目视觉惯性非线性系统。一方面,单目相机获取不了绝对尺度和速度;另一方面,初始化尺度需要非零加速运动,导致非平凡但未知的初始重力向量和速度。隐藏在IMU积分中的尺度信息很容易受噪声和偏差的影响。视觉和惯性测量时互补的,一个代表了上规模的全局结构,另一个包括了变量的增量信息,没有一个好的初始估计,很难将它们直接融合在一起。短时间的运动常常并不能驱动整个系统完全可观测。基于滤波的融合方法常常运行一段时间直到收敛;基于优化的方法在光束内保持长时间的测量,然后同时优化这些状态。坏的初始值将会导致基于滤波的方法不收敛,导致基于优化的方法收敛至局部最小。一般地,将最开始几秒的IMU测量值的平均看做重力向量,而IMU积分结果看做初始猜想。然而,这种处理当IMU测量受到非平凡偏差或加速运动时是不合适的。因此需要稳健的初始化过程。
仅单目的视觉SLAM或SfM比视觉惯性融合稳定的多。事实上,构建仅视觉的上规模结构并不依赖于上述任何初始状态,必要的初始值可以通过与IMU对齐提取。因此,我们采用松耦合视觉惯性初始化过程获得初始状态。本文算法的处理流程如下图所示,首先构建仅视觉的结构,然后将它与IMU预积分对齐以恢复初始值。
三、实验
本文算法在EuRoC数据集上的运行结果如下所示。
请点击此处输入图片描述请点击此处输入图片描述
本文算法在室内和室外实测结果分别如下图所示,ground truth 分别通过OptiTrack系统和GPS。
强烈推荐拜读原文,感觉做的工作真的很扎实。
英文名称:Robust Initialization of Monocular Visual-Inertial Estimation on Aerial Robots
链接:
http://www.ece.ust.hk/~eeshaojie/iros2017tong.pdf
死磕自律,遇见更好的自己;自斩双臂,方能长出强两翼。
败而不弃,潜龙勿用待时机;执着坚毅,飞升上神创奇迹!
关注该头条号,一起创造奇迹。
相关推荐
- 得物可观测平台架构升级:基于GreptimeDB的全新监控体系实践
-
一、摘要在前端可观测分析场景中,需要实时观测并处理多地、多环境的运行情况,以保障Web应用和移动端的可用性与性能。传统方案往往依赖代理Agent→消息队列→流计算引擎→OLAP存储...
- warm-flow新春版:网关直连和流程图重构
-
本期主要解决了网关直连和流程图重构,可以自此之后可支持各种复杂的网关混合、多网关直连使用。-新增Ruoyi-Vue-Plus优秀开源集成案例更新日志[feat]导入、导出和保存等新增json格式支持...
- 扣子空间体验报告
-
在数字化时代,智能工具的应用正不断拓展到我们工作和生活的各个角落。从任务规划到项目执行,再到任务管理,作者深入探讨了这款工具在不同场景下的表现和潜力。通过具体的应用实例,文章展示了扣子空间如何帮助用户...
- spider-flow:开源的可视化方式定义爬虫方案
-
spider-flow简介spider-flow是一个爬虫平台,以可视化推拽方式定义爬取流程,无需代码即可实现一个爬虫服务。spider-flow特性支持css选择器、正则提取支持JSON/XML格式...
- solon-flow 你好世界!
-
solon-flow是一个基础级的流处理引擎(可用于业务规则、决策处理、计算编排、流程审批等......)。提供有“开放式”驱动定制支持,像jdbc有mysql或pgsql等驱动,可...
- 新一代开源爬虫平台:SpiderFlow
-
SpiderFlow:新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。-精选真开源,释放新价值。概览Spider-Flow是一个开源的、面向所有用户的Web端爬虫构建平台,它使用Ja...
- 通过 SQL 训练机器学习模型的引擎
-
关注薪资待遇的同学应该知道,机器学习相关的岗位工资普遍偏高啊。同时随着各种通用机器学习框架的出现,机器学习的门槛也在逐渐降低,训练一个简单的机器学习模型变得不那么难。但是不得不承认对于一些数据相关的工...
- 鼠须管输入法rime for Mac
-
鼠须管输入法forMac是一款十分新颖的跨平台输入法软件,全名是中州韵输入法引擎,鼠须管输入法mac版不仅仅是一个输入法,而是一个输入法算法框架。Rime的基础架构十分精良,一套算法支持了拼音、...
- Go语言 1.20 版本正式发布:新版详细介绍
-
Go1.20简介最新的Go版本1.20在Go1.19发布六个月后发布。它的大部分更改都在工具链、运行时和库的实现中。一如既往,该版本保持了Go1的兼容性承诺。我们期望几乎所...
- iOS 10平台SpriteKit新特性之Tile Maps(上)
-
简介苹果公司在WWDC2016大会上向人们展示了一大批新的好东西。其中之一就是SpriteKitTileEditor。这款工具易于上手,而且看起来速度特别快。在本教程中,你将了解关于TileE...
- 程序员简历例句—范例Java、Python、C++模板
-
个人简介通用简介:有良好的代码风格,通过添加注释提高代码可读性,注重代码质量,研读过XXX,XXX等多个开源项目源码从而学习增强代码的健壮性与扩展性。具备良好的代码编程习惯及文档编写能力,参与多个高...
- Telerik UI for iOS Q3 2015正式发布
-
近日,TelerikUIforiOS正式发布了Q32015。新版本新增对XCode7、Swift2.0和iOS9的支持,同时还新增了对数轴、不连续的日期时间轴等;改进TKDataPoin...
- ios使用ijkplayer+nginx进行视频直播
-
上两节,我们讲到使用nginx和ngixn的rtmp模块搭建直播的服务器,接着我们讲解了在Android使用ijkplayer来作为我们的视频直播播放器,整个过程中,需要注意的就是ijlplayer编...
- IOS技术分享|iOS快速生成开发文档(一)
-
前言对于开发人员而言,文档的作用不言而喻。文档不仅可以提高软件开发效率,还能便于以后的软件开发、使用和维护。本文主要讲述Objective-C快速生成开发文档工具appledoc。简介apple...
- macOS下配置VS Code C++开发环境
-
本文介绍在苹果macOS操作系统下,配置VisualStudioCode的C/C++开发环境的过程,本环境使用Clang/LLVM编译器和调试器。一、前置条件本文默认前置条件是,您的开发设备已...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- httperror403.14-forbidden (63)
- logstashinput (65)
- hadoop端口 (65)
- dockernetworkconnect (63)
- esxi7 (63)
- vue阻止冒泡 (67)
- c#for循环 (63)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- java大写转小写 (63)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)