IEEE ROBOTICS AND AUTOMATION LETTERS 2021 文章链接

速读

1.1 论文试图解决什么问题?这是否是一个新的问题?
将道路中的语义信息用于解决自动驾驶定位这一问题。不是新问题。
1.2 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?
相关研究提及较少
1.3 文章的贡献是什么?
提出了一个提取、建模优化语义道路元素的视觉SLAM方法,结合深度学习模型提取语义。
①一个深度学习模块用于语义信息提取;
②道路语义的参数化(用关键点对道路线和路标建模、用分段三次样条曲线参数化车道线)并用其设计了相关的loss function
③用这些信息建立了完整的SLAM系统;
1.4 文章解决方案的关键是什么?
基于特征点和语义信息将SLAM中使用的信息从像素级向物体级扩展
1.5 实验如何设计?实验结果足够论证其效果吗?
①网络的训练上通过人工标注数据集中的图片作为训练数据;
②训练网络的对三种语义目标的分类准确率、召回率、像素误差做实验测试;
定位实验:一个基于类似特征点描述的传统方法作为baseline,尽量保持两个方法条件一致,不相同的地方做出了声明,主要比较绝对轨迹的translational root-mean-squared-error (T.RMSE)
③Self-Relocalization:地图大小和T.RMSE两个维度上的比较说明语义地图占用更小空间的情况下由高质量在线定位效果;
④Cross-Relocalization:还添加了一个baseline:Maplab。所有数据完成定位,鲁棒性好、准确性好、轻量
⑤Modular and Efficiency Analysis:更细节的比较,loose tracking和tight tracking两种情况的运行实验,三种语义对象使用的特征点数量实验,各个部分使用时间说明;
⑥Stability of Semantic Mapping:建图阶段的位姿结果实验;
1.6 数据集是什么?
两个真实的数据集:
一个公开的数据集KAIST:使用26, 28, 38, 39四条城市环境的左相机+IMU+GPS数据;
一个自己采集的数据集:于杭州采集共两条,设备为10Hz ON AR0144 stereo camera, a 200Hz Bosch BMI 088 IMU and a 10Hz u-blox F9 RTK-GPS,一条长4.7km一条长3.2km
1.7 还会存在什么问题
①好像没有对路口的建模

②还有那些语义信息可以使用
③对极端天气情况下,语义信息能够雨天下的有效定位(视觉上的模糊)、雪天下的定位(地面上语义信息消失)


以下是精读部分

2 系统框架


与使用类似框架的已有结果不同的是作者使用多种语义信息

框架分为离线构建语义地图+在线定位,具有批处理和滑动窗口策略的紧耦合状态优化;
语义实例被分为三类:地面上的物体(路灯、路标)、地面元素(左转右转标记)、线(车道线)

3 各部分功能

3.1 Selection of Road Features

被选定为语义标志的元素:
①道路上方的路灯和交通标志,稳定且足够被前放相机捕获;
②路面上的醒目标志,占据画面大部分的路面信息,虽然大多时候被遮挡;

[论文阅读]Road Mapping and Localization using Sparse Semantic Visual Features相关推荐

  1. 论文阅读:(三)DS-SLAM: A Semantic Visual SLAM towards Dynamic Environments

    之前看了有关语义分割的SLAM,最近调研下动态场景下基于动态实例剔除的论文. DS-SLAM: A Semantic Visual SLAM towards Dynamic Environments- ...

  2. 【论文精读】Hybrid Bird‘s-Eye Edge Based Semantic Visual SLAM for Automated Valet Parking

    [论文精读]Hybrid Bird's-Eye Edge Based Semantic Visual SLAM for Automated Valet Parking 论文出处 ICRA2021 摘要 ...

  3. 【论文阅读笔记】语义三维重建CVPR2011:Semantic Structure from Motion

    前文回顾 [论文阅读笔记]Past, Present, and Future of Simultaneous Localization and Mapping [论文阅读笔记]语义SLAM语义映射模型 ...

  4. 全卷积(FCN)论文阅读笔记:Fully Convolutional Networks for Semantic Segmentation

    论文阅读笔记:Fully Convolutional Networks forSemantic Segmentation 这是CVPR 2015拿到best paper候选的论文. 论文下载地址:Fu ...

  5. 【自监督论文阅读笔记】Instance Localization for Self-supervised Detection Pretraining

    (2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)) 先前关于自监督学习的研究已经在 图像分类 方面 ...

  6. 论文阅读:Multi-scale orderless pooling of deep convolutional activation features

    2014年ECCV Motivation 以往的图像分类,关注的信息可能更容易被干扰.比如下图中的(a),groundtruth应该是滑雪(ski),但是由于一些其他信息的干扰,导致红框中框出来的部分 ...

  7. 论文阅读:U-Net++: Redesigning Skip Connections to Exploit Multiscale Features in Image Segmentation

    论文地址: https://arxiv.org/pdf/1912.05074.pdf 最先进的医学图像分割模型是U-Net和全卷积网络(FCN)的变体.尽管这些模型取得了成功,但它们有两个局限性:(1 ...

  8. 论文阅读:CVPR2020 | MoCo:Momentum Contrast for Unsupervised Visual Representation Learning

    文章目录 前言 一.Introduction 二.Method Contrastive Learning as Dictionary Look-up Momentum Contrast Diction ...

  9. 论文阅读:No-Reference Image Quality Assessment with Global Statistical Features

    paper:J. Imaging | Free Full-Text | No-Reference Image Quality Assessment with Global Statistical Fe ...

最新文章

  1. 图像边缘检测技术与理论发展脉络梳理大放送
  2. 如何在cocoapods中使用更新版本的pod
  3. Mac上搭建Go语言环境及第一个hello.go程序
  4. [转载] ubuntu下pip的安装、升级和使用
  5. 魔兽怀旧服服务器怎么修改,魔兽世界怀旧服今日开服 魔兽世界怀旧服剥皮制皮玩法攻略 怀旧服服务器连不上怎么办?...
  6. 金融学核心期刊有哪些?
  7. cocos2dx3.17的csb文件使用方法
  8. SDU程序设计思维Week5-作业 B-TT's Magic Cat
  9. Ruby中的类和模块和变量使用说明
  10. Tableau的特点和案例--可视化和交互化 和 其他
  11. Camera ISO、快门、光圈、曝光这几个概念
  12. esxi与unraid比较
  13. Python-爬虫-requests库用语post登录
  14. 【opensource】开源网址推荐
  15. 程序设计思维与实践月模拟题X3
  16. 腾讯云 云点播 JAVASDK上传
  17. java实现AES解密解密
  18. windows c++程序在崩溃时自动生成dump
  19. 全国青少年软件编程等级考试标准 1-4级
  20. 利用赛门铁克漏洞渗透整个企业网络

热门文章

  1. 澳拳击袋鼠体型巨大 身高超2米体重近200斤
  2. EXCEL 技能——等行分页
  3. 将多个sheet页拆分成多个单独的excel
  4. C#使用拉依达准则(3σ准则)剔除异常数据(.Net剔除一组数据中的奇异值)
  5. eclipse改成护眼背景色
  6. spyder 护眼背景--纯黑色
  7. 医学图像预处理(五) 器官与病灶的直方图
  8. 上传webshell(入侵目标页面主机靶机演示)
  9. 【机器学习 - 8】:随机梯度下降法
  10. python的循环语句有哪些_python的循环语句