SLAM结合3D GS又一力作!使用DSO加速重建精度和收敛速度!

发布时间:2024-09-16

Image

SLAM(Simultaneous Localization and Mapping)技术正在迎来新的突破。近日,大连理工大学、东京大学和哥伦比亚大学的研究团队提出了一种名为SGS-SLAM的新系统,将3D高斯场(3D Gaussian Splatting)和直接稀疏优化(DSO)技术相结合,实现了前所未有的高精度3D语义地图重建。

SGS-SLAM系统的核心在于其独特的多通道优化策略。该系统不仅考虑了传统的几何和外观信息,还引入了语义约束,将这三者与关键帧优化相结合,显著提高了重建质量。实验结果显示,SGS-SLAM在Replica数据集上的重建质量比其他基线方法高出10dB,在深度L1损失和ATE误差方面分别降低了70%和34%。

这一突破性进展源于研究团队对3D GS技术的深入探索。3D GS是一种基于高斯分布的3D场景表示方法,它将场景中的每个点表示为一个高斯分布,通过调整高斯的参数来实现场景的实时渲染。这种方法不仅能够快速生成高质量的3D场景,还能支持场景的动态编辑和操作。

DSO技术则为SGS-SLAM提供了强大的优化能力。DSO是一种直接法SLAM技术,它不依赖特征点提取,而是直接利用图像像素的光度信息来优化相机位姿和场景结构。DSO采用滑动窗口优化策略,通过边缘化处理控制计算量,同时保持了良好的优化效果。这种优化方法使得SGS-SLAM能够在保持实时性的前提下,实现高精度的场景重建。

与传统的基于NeRF(Neural Radiance Field)的方法相比,SGS-SLAM在物体边缘处不会出现过度平滑的问题,能够保留更多的细粒度细节。同时,SGS-SLAM还克服了NeRF在大场景下容易发生灾难性遗忘的缺点,实现了更稳定、更精确的场景重建。

SGS-SLAM的另一大亮点是其强大的场景编辑能力。通过识别物体的语义标签,SGS-SLAM可以实现地图中对象的动态移动、旋转或移除,同时确保场景的其余部分保持不变和稳定。这种能力为机器人导航、增强现实(AR)和虚拟现实(VR)等应用提供了无限可能。

展望未来,SLAM技术的发展方向主要包括:进一步提高重建速度和精度,降低计算复杂度以支持实时应用,结合更多传感器信息以提高鲁棒性和准确性。随着深度学习和计算机视觉技术的不断进步,我们有理由相信,SLAM技术将在更多领域发挥重要作用,为人类创造更加美好的未来。