在移动互联网大潮之后,自动驾驶、无人机、服务机器人等人工智能硬件会成为下一个产业爆发点,其中关键的技术之一就是动态定位和环境建模的SLAM技术。


在计算机视觉(Computer Vision)创立之初,人们就想象着有朝一日计算机能和我们一样,用眼睛去观察世界,理解周遭的物体,探索未知的领域。这样一个美妙而又浪漫的梦想,吸引了无数科研人员日夜为之奋斗。

但事情的进展远不如预想那么顺利。我们眼中的花草树木、虫鱼鸟兽,在计算机中只是由一个个数字自排列而成矩阵。让计算机理解图像的内容,就像让我们自己理解这些数字一样困难。更别提让计算机去探索这个世界了。

随着技术的发展,现在的我们终于有了一点点成功迹象:一方面是机器学习技术的发展,使计算机渐渐能够辨别出物体、人脸、声音、文字。另一方面,在 SLAM ( SimultaneousLocalization andMapping,同时定位与地图构建 )发展了将近30年之后,我们的相机渐渐开始能够认识到自身的位置,发觉自己在运动并感受周围的环境,甚至可以进行实时的三维重建。

SLAM技术解决了机器人的一个基础性困难——定位和建图。当设备主体(机器人)来到一个完全陌生的环境时,它可以精准地在运动过程中建立环境模型,同时估计自己的运动。基于此,涌现出一大批与SLAM 相关的应用点:自动驾驶、无人机、服务机器人、虚拟现实和增强现实……

SLAM是计算机对世界的感知和理解,也一直是机器人和计算机视觉的研究热点。

虽然SLAM理论框架基本趋于稳定,但其编程实现仍然较为复杂,有着较高的技术门槛。加之,国内与SLAM 相关的论文、书籍非常匮乏,让许多对SLAM 技术感兴趣的初学者无从一窥门径。刚步入SLAM 领域的研究者,不得不花很长的时间,学习大量的知识,走许多弯路才得以接近SLAM 技术的核心。

幸运的是,2017年《视觉 SLAM 十四讲:从理论到实践》一书出版。作为SLAM第一本话语原创著作,这本书从基础理论到代码实例,系统性讲解SLAM,大大降低了国内学生和相关从业者的进入门槛。

两年来,《视觉SLAM十四讲》一书共经历了 13 次重印,在 GitHub 上拥有 2500 个星星,也在业界引起了广泛的关注和讨论。今天,《视觉SLAM十四讲:从理论到实践(第2版)》带着超40%的内容增补回来了!

本书全面系统地介绍了以视觉传感器为主体的视觉SLAM 技术,并极其重视实践。书中介绍的所有重要算法,都将给出可以运行的实际代码,以求加深读者的理解。在第2版中,我们会讨论大多数算法的内在原理,而非简单地从函数库中进行调用。

之所以这么做,主要是考虑到SLAM 是一项和实践紧密相关的技术。再漂亮的数学理论,如果不能转化为可以运行的代码,就仍是可望而不可及的空中楼阁,没有实际意义。我们相信,实践出真知,实践出真爱。只有实际地演算过各种算法,你才能真正认识SLAM,真正地喜欢上科研。

1. 更多的实例。增加了一些实验代码来介绍算法的原理。在第1版中,多数实践代码调用了各种库中的内置函数,现在作者认为更深入地介绍底层计算会更好。所以本书中的许多代码,除了调用库函数,还提供了底层的实现。

2. 更深入的内容。主要是从第7讲至第12讲的部分,同时删除了一些泛泛而谈的边角料(比如GTSAM 相关内容)。对第1版大部分数学公式进行了审查,重写了那些容易引起误解的内容。

3. 更完善的工程项目。将第1版的第9讲移至第13 讲。于是,我们可以在介绍了所有必要知识之后,向大家展现一个完整的SLAM 系统是如何工作的。相比于第1版,本书的项目中将追求以精简的代码实现完整的功能,你会得到一个由几百行代码实现的、有完整前后端的SLAM 系统。

4. 更通俗、简洁的表达。这是一本好书的标准,特别是当介绍一些看起来高深莫测的数学知识时。作者重新制作了部分插图,使它们即使在黑白印刷条件下也能看起来很清楚。

高 翔

清华大学自动化系博士,慕尼黑工业大学博士后。研究兴趣主要为计算机视觉、定位与建图、机器学习等,主要著、译作包括《视觉SLAM十四讲:从理论到实践》、《机器人学中的状态估计》,在RAS、Auto Robotics、IROS等期刊会议上发表论文,现从事自动驾驶车辆研发工作。

如果你完全看不懂上面再说什么,那么恭喜你!本书很适合你!只要你对这门新技术感兴趣,在学习本书的过程中肯定会有所收获!你会掌握与SLAM 相关的理论知识,你的编程能力也将有明显的进步。首批拿到第二版的读者给出了这样的评价:

  • 博文菌听说1000本高翔博士亲笔签名版《视觉SLAM十四讲(第2版)》就在京东,越早下手几率越高哦。

SLAM:计算机对世界的感知与理解相关推荐

  1. 计算机英语专业论感知,英语职前教师技术接受程度调查分析

    [摘要]技术接受模型(TechnologyAcceptanceModel)理论是通过使用者内在信念.态度和意图来预测和解释其接受和使用新技术可能性的一种工具模型,该理论认为感知有用性和感知易用性和使用 ...

  2. 计算机也可以看“视频”,理解“视频”

    计算机也可以看"视频",理解"视频" 2016-08-08 15:56 高婓 0条评论 联合编译: 高斐  章敏 摘要 我们将在文中介绍一种用于视频中动作检测的 ...

  3. 计算机的世界:[-bit之魂-]

    这里就是这样的世界,这里的1 + 1 = 10 --二进制物语 儒仁慈世安家业,墨守规矩自方圆. 兵戈铁马平天下,法理束欲定千秋. 佛释恶业普渡生,道化万物共长存. 诸子百家何为首? 且问君心何所求. ...

  4. 2016鄂教版小学信息技术初识计算机软件,鄂教版(2016)五年级全册信息技术 25.揭秘计算机工作世界--初识计算机工作原理 教案...

    鄂教版(2016)五年级全册信息技术 25.揭秘计算机工作世界--初识计算机工作原理 教案 揭秘计算机工作原理 --初始计算机工作世界 [教材分析] 本节课是鄂教版信息技术教材五年级第七单元的第一课, ...

  5. 未来生活里掌握计算机技术的重要性,浅谈计算机教育重要性的几点理解.doc

    浅谈计算机教育重要性的几点理解.doc 浅谈计算机教育重要性的几点理解 摘 要:本文主要阐述了计算机教育重要性的认识与理解,计算机教育如何适应现在与未来,是摆在我们面前刻不容缓的研究课题,需要我们认真 ...

  6. Part1:使用 TensorFlow 和 Keras 的 NeRF计算机图形学和深度学习——计算机图形学世界中相机的工作原理

    Part1:使用 TensorFlow 和 Keras 的 NeRF计算机图形学和深度学习 1. 效果图 2. 原理 2.0 前向成像模型 2.1 世界坐标系 2.2 相机坐标系 2.3 坐标变换 2 ...

  7. 杂篇:计算机的世界:[-bit之魂-]

    这里就是这样的世界,这里的1 + 1 = 10 --二进制物语 儒仁慈世安家业,墨守规矩自方圆. 兵戈铁马平天下,法理束欲定千秋. 佛释恶业普渡生,道化万物共长存. 诸子百家何为首? 且问君心何所求. ...

  8. 感知自然语言理解(NLU)

    AI即人工智能是一个令人着迷的领域,尤其是基于对话式AI系统的智能音箱的兴起,使人工智能直接走进了我们的家庭. 自然语言是人类的智慧,自然语言处理(NLP)是AI中最为困难的问题之一,而自然语言理解( ...

  9. ECCV 2020 SenseHuman Workshop:人类感知、理解与生成

    ECCV 2020 Workshop on Sensing, Understanding and Synthesizing Humans 将在周五(08/28)举办.这一 Workshop 关注于计算 ...

  10. 计算机视觉中的人类感知、理解和生成 (ICCV 2019 Workshop)

    点击我爱计算机视觉标星,更快获取CVML新技术 本次workshop会接收一个时长为一分钟的demo视频,欢迎大家踊跃投稿! workshop主页: https://sense-human.githu ...

最新文章

  1. 为什么 Kafka 速度那么快?
  2. 2016 ACM/ICPC Asia Regional Qingdao Online 1005 Balanced Game
  3. arcgis python脚本筛选与线共边的面_ArcGis Python脚本——遍历输出面或折线要素的折点坐标...
  4. java读取csv文件
  5. redis 哨兵模式 cluster模式区别_Redis哨兵(Sentinel)模式快速入门
  6. CSS基础----元素分类
  7. layui引入php项目,怎么将layui引入开发框架中
  8. 【医院综合管理专题】医院服务质量管理制度与规范
  9. ajax后台如何把对象转为json_SM后台数据与前端(PC、M站、Android、IOS)的交互——页面渲染...
  10. Spring Boot教程(十六):Spring Boot集成shiro
  11. 富人是如何发财的——思考致富的方法
  12. 王道 计算机网络试题讲解_计算机考研-统考计算机网络(2009-2012)试题及精心解析...
  13. iBatis和Hibernate浅析
  14. Typecho - MyTagCloud标签云插件
  15. 《我是一只IT小小鸟》读书笔记
  16. 扫荡波”来袭已造成大面积用户系统崩溃
  17. Spring原理机制
  18. 2021申请google开发者账号流程
  19. dell g7 重装win10
  20. 超融合服务器硬盘4T 6T 8T从性能上到底有什么区别

热门文章

  1. java day32【HTML标签:表单标签 、CSS】
  2. CODE[VS] 1548 贝贝的车牌问题
  3. 关于MDI窗体的那些问题
  4. 算法导论2-4习题解答(合并排序算法)
  5. Android开发者应该深入学习的10个开源应用项目[转]
  6. 接口XMPPConnection
  7. form resetFields并没有清空表单
  8. 解决navicat在未联网的情况下访问不了MySQL数据库的现象
  9. 峰Redis学习(7)Redis 之Keys 通用操作
  10. 无限级下拉菜单(树形菜单,二级菜单)