IEEE ROBOTICS AND AUTOMATION LETTERS 2021 文章链接

速读

1.1 论文试图解决什么问题？这是否是一个新的问题？
将道路中的语义信息用于解决自动驾驶定位这一问题。不是新问题。
1.2 有哪些相关研究？如何归类？谁是这一课题在领域内值得关注的研究员？
相关研究提及较少
1.3 文章的贡献是什么？
提出了一个提取、建模优化语义道路元素的视觉SLAM方法，结合深度学习模型提取语义。
①一个深度学习模块用于语义信息提取；
②道路语义的参数化（用关键点对道路线和路标建模、用分段三次样条曲线参数化车道线）并用其设计了相关的loss function
③用这些信息建立了完整的SLAM系统；
1.4 文章解决方案的关键是什么？
基于特征点和语义信息将SLAM中使用的信息从像素级向物体级扩展
1.5 实验如何设计？实验结果足够论证其效果吗？
①网络的训练上通过人工标注数据集中的图片作为训练数据；
②训练网络的对三种语义目标的分类准确率、召回率、像素误差做实验测试；
定位实验：一个基于类似特征点描述的传统方法作为baseline，尽量保持两个方法条件一致，不相同的地方做出了声明，主要比较绝对轨迹的translational root-mean-squared-error (T.RMSE)
③Self-Relocalization：地图大小和T.RMSE两个维度上的比较说明语义地图占用更小空间的情况下由高质量在线定位效果；
④Cross-Relocalization:还添加了一个baseline：Maplab。所有数据完成定位，鲁棒性好、准确性好、轻量
⑤Modular and Efficiency Analysis：更细节的比较，loose tracking和tight tracking两种情况的运行实验，三种语义对象使用的特征点数量实验，各个部分使用时间说明；
⑥Stability of Semantic Mapping：建图阶段的位姿结果实验；
1.6 数据集是什么？
两个真实的数据集：
一个公开的数据集KAIST：使用26, 28, 38, 39四条城市环境的左相机+IMU+GPS数据；
一个自己采集的数据集：于杭州采集共两条，设备为10Hz ON AR0144 stereo camera, a 200Hz Bosch BMI 088 IMU and a 10Hz u-blox F9 RTK-GPS，一条长4.7km一条长3.2km
1.7 还会存在什么问题
①好像没有对路口的建模

②还有那些语义信息可以使用
③对极端天气情况下，语义信息能够雨天下的有效定位（视觉上的模糊）、雪天下的定位（地面上语义信息消失）

以下是精读部分

2 系统框架

与使用类似框架的已有结果不同的是作者使用多种语义信息

框架分为离线构建语义地图+在线定位，具有批处理和滑动窗口策略的紧耦合状态优化；
语义实例被分为三类：地面上的物体（路灯、路标）、地面元素（左转右转标记）、线（车道线）

3 各部分功能

3.1 Selection of Road Features

被选定为语义标志的元素：
①道路上方的路灯和交通标志，稳定且足够被前放相机捕获；
②路面上的醒目标志，占据画面大部分的路面信息，虽然大多时候被遮挡；

[论文阅读]Road Mapping and Localization using Sparse Semantic Visual Features相关推荐

论文阅读：（三）DS-SLAM: A Semantic Visual SLAM towards Dynamic Environments
之前看了有关语义分割的SLAM,最近调研下动态场景下基于动态实例剔除的论文. DS-SLAM: A Semantic Visual SLAM towards Dynamic Environments- ...
【论文精读】Hybrid Bird‘s-Eye Edge Based Semantic Visual SLAM for Automated Valet Parking
[论文精读]Hybrid Bird's-Eye Edge Based Semantic Visual SLAM for Automated Valet Parking 论文出处 ICRA2021 摘要 ...
【论文阅读笔记】语义三维重建CVPR2011：Semantic Structure from Motion
前文回顾 [论文阅读笔记]Past, Present, and Future of Simultaneous Localization and Mapping [论文阅读笔记]语义SLAM语义映射模型 ...
全卷积（FCN）论文阅读笔记：Fully Convolutional Networks for Semantic Segmentation
论文阅读笔记:Fully Convolutional Networks forSemantic Segmentation 这是CVPR 2015拿到best paper候选的论文. 论文下载地址:Fu ...
【自监督论文阅读笔记】Instance Localization for Self-supervised Detection Pretraining
(2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)) 先前关于自监督学习的研究已经在图像分类方面 ...
论文阅读：Multi-scale orderless pooling of deep convolutional activation features
2014年ECCV Motivation 以往的图像分类,关注的信息可能更容易被干扰.比如下图中的(a),groundtruth应该是滑雪(ski),但是由于一些其他信息的干扰,导致红框中框出来的部分 ...
论文阅读：U-Net++: Redesigning Skip Connections to Exploit Multiscale Features in Image Segmentation
论文地址: https://arxiv.org/pdf/1912.05074.pdf 最先进的医学图像分割模型是U-Net和全卷积网络(FCN)的变体.尽管这些模型取得了成功,但它们有两个局限性:(1 ...
论文阅读：CVPR2020 | MoCo:Momentum Contrast for Unsupervised Visual Representation Learning
文章目录前言一.Introduction 二.Method Contrastive Learning as Dictionary Look-up Momentum Contrast Diction ...
论文阅读：No-Reference Image Quality Assessment with Global Statistical Features
paper:J. Imaging | Free Full-Text | No-Reference Image Quality Assessment with Global Statistical Fe ...

[论文阅读]Road Mapping and Localization using Sparse Semantic Visual Features