点击下方卡片,关注3D视觉工坊公众号

3D视觉干货第一时间送达

本文转载自:AI科技评论

作者 | 陈彩娴    编辑 | 青暮

自动驾驶的落地,离不开一个关键条件:安全

近日,清华大学校友、MIT 在读的中国博士生杨珩与团队合作开发了第一套针对自动驾驶汽车的“可认证的感知”算法,有助于提高下一代自动驾驶汽车的行驶安全。

链接:https://arxiv.org/pdf/2109.03349.pdf

杨珩,2015年本科毕业于清华大学汽车工程专业,硕士就读于麻省理工学院机械工程专业。

硕士期间,他主要研究如何改进超声成像系统,以追踪肝纤维化病症。为了做研究,他需要参加一门关于机器人的课程,叫《Underactuated Robotics》,学习如何通过设计算法来控制机器人。这使他爱上了算法设计的研究方向:

“这门课讲到了数学优化,用抽象的公式来模拟世界上几乎所有事物。我在这门课上学会了一个巧妙的方法来解决我的论文问题。计算在优化设计方面的强大表现让我感到惊讶,我很快确定了这是我接下来要探索的方向。”

2017年,杨珩硕士毕业,转读 MIT 博士,目前在 MIT 的信息与决策系统实验室(LIDS)读博,师从 Luca Carlone,主要研究可认证的感知挑战。

目前,他已在自动驾驶的可认证感知算法设计上取得了一系列杰出成果。

1

什么是可认证的感知算法?

当机器人在感知周围环境时,机器人必须使用算法来估计周围环境,并判断自己所处的位置。目前,用于机器人感知的算法都是被设计于快速感知,几乎无法保证机器人是否正确理解了周围的环境。这也是自动驾驶算法设计的现有缺陷之一,而杨珩与 LIDS 实验室的部分成员要解决的就是这一问题,希望通过设计“经过验证的”算法来确定评估是否正确。

比方说,机器人在进行感知之前,首先捕捉图像,如自动驾驶汽车会拍下正在靠近自己的汽车快照。然后,这张图像会通过神经网络,在图像中生成有关接近汽车的后视镜、车轮、车门等关键点,绘制出线条,以从 2D 汽车图像上检测到的关键点追踪到3D 汽车模型中标记的 3D 关键点。

在这个过程中,杨珩与团队必须解决一个优化问题,将 3D 模型旋转与平移,以使模型与图像上的关键点对齐。这个 3D 模型有助于机器人了解真实世界的环境。

在接受 MIT News 的采访中,杨珩解释:每一条被追踪的线都必须经过分析,以确保它们进行了准确的匹配。由于有许多关键的点可能会被错误匹配(比如,神经网络可能会将镜子识别为门把手),那么这个问题就是“非凸”的,很难解决。

去年,杨珩与团队找到了解决方法,并获得了 ICRA 2020 的机器人视觉最佳论文奖。

论文地址:https://arxiv.org/pdf/1909.08605.pdf

在杨珩的工作中,他将非凸问题转为凸问题,并找到了成功的匹配方法。杨珩称,即使匹配不正确,他们所设计的算法也知道应该如何继续尝试,以找到最佳解决方案,即“全局最小值”。“如果没有更好的解决方案,(系统)就会给出一个认证。”

他指出,这些可认证的算法有巨大的潜在影响,因为像自动驾驶汽车这样的工具必须鲁棒,且值得信赖。“我们的目标是,如果感知系统出现故障,驾驶员可以收到一个警报,快速接管方向盘。”

而杨珩与团队的最新工作采取了通用与可拓展的框架来设计可认证的算法,可以在自动驾驶汽车的行驶过程中进行鲁棒的几何体感知。这个工作的主要亮点如下:

1)将常见的鲁棒成本(如TLS、最大共识、Geman-McClure、Tukey 双权重等)转化为多项式优化问题(POP);

2)通过关注 TLS 的成本,他们利用 POP 中的稀疏性,提出了一种比标准 Lasserre 层次结构小得多的稀疏半定规划 (SDP) 松弛,同时保留了准确性;

3)提出 STRIDE(一种将凸 SDP 中的全局下降与非凸 POP 的快速局部搜索相结合的求解器),以前所未有的规模和精度解决了 SDP 松弛问题;

4)评估了所提出的针对六个几何感知问题的框架,包括单次与多次旋转平均、点云和网格配准、绝对姿态估计以及类别级对象姿态和形状估计。

他们的实验表明,虽然还达不到实时,但 STRIDE 在中等规模问题上比现有 SDP 求解器快了 100 倍,而且是目前唯一可以高精度求解具有数十万个约束的大规模 SDP 的求解器。

同时,STRIDE 为现有的快速启发式算法(如 RANSAC 或阶段非凸)提供了一种保护措施,即如果启发式估计是最优的,则证明全局最优。

2

使模型适应不同的汽车

在将 2D 图像与 3D 模型进行匹配时,一个假设是 3D 模型要与识别的汽车类型相一致。但是,如果图像中的汽车具有机器人从未见过的形状,会发生什么?结局可能无法预料,所以,杨珩需要估计汽车的位置,并重建 3D 模型的形状。

他们找到了一个解决方法:通过对原先识别的车辆进行线性组合,使 3D 模型自动变形、以匹配 2D 图像。比方说,该模型可以从奥迪变成现代,因为它已经记录了汽车的实际构造。识别接近车辆的尺寸是防止碰撞的关键。

杨珩与团队的这项工作还入围了机器人顶级会议 RSS 的最佳论文奖,杨珩被评为“RSS 先驱”。

链接:https://arxiv.org/pdf/2104.08383.pdf

参考链接:

https://news.mit.edu/2021/heng-yang-self-driving-cars-0916

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列、手眼标定、相机标定、orb-slam3知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

MIT中国博士生开发出第一套保护自动驾驶车辆的感知算法!相关推荐

  1. MIT中国博士生开发出第一套保护自动驾驶车辆的感知算法

    作者 | 陈彩娴 来源:AI科技评论 自动驾驶的落地,离不开一个关键条件:安全. 近日,清华大学校友.MIT 在读的中国博士生杨珩与团队合作开发了第一套针对自动驾驶汽车的"可认证的感知&qu ...

  2. simulink显示多个数据_Matlab/Simulink与自动驾驶(ADAS)算法开发

    Simulink是如何存在自动驾驶的开发过程中?废话少讲,让咱们开始娓娓道来! 自动驾驶的开发架构是什么? 自动驾驶软件开发基础的架构,逃不出我们经常所说的三大法宝,感知--- 决策(规划)--- 执 ...

  3. 千寻位置 开发demo_专攻高精定位解决方案,「千寻位置」要解决自动驾驶车辆“我在哪儿”的问题...

    对于自动驾驶车辆来说,在解决"去哪儿"和"怎么去"问题之前,首先要知道的是"我在哪儿".而判断"我在哪儿",就需要高精度 ...

  4. 全球第一辆商用自动驾驶卡车即将在瑞典上路!

    在技术上,它已经达到了L4自动驾驶级别. 自动驾驶汽车刚刚商用不久,自动驾驶卡车也要来了. 12月17日消息,据<金融时报>报道,瑞典自动驾驶初创公司Einride联合欧洲物流供应巨头德铁 ...

  5. 小米人形机器人“铁大”学会敲架子鼓;​大疆 Mini 3 将上市;4990万美元,巴菲特旗下公司将开发军用自动驾驶车辆……...

    本周,有哪些AI新鲜事? 产业界 小米机器人铁大学会敲架子鼓,未来软硬件还需加强 今年8月,小米的人形机器人CyberOne正式亮相,小名叫铁大.它是一个比较轻量级的机器人,1.77米的身高,只有54 ...

  6. 麦肯锡:中国未来将成为全球最大的自动驾驶市场

    本文由人工智能观察编译 译者:Sandy 继阿里无人车路测曝光后,腾讯紧随其后宣布与长安汽车签署协议,双方将在车联网等领域展开合作,同时,一起展开合作的还有一汽,不过腾讯与后者准备在高级自动驾驶上携手 ...

  7. Imagination和安霸半导体联合开发达到ASIL级别的自动驾驶汽车HMI可视化技术

    Ambarella安霸半导体在CV3汽车系统级芯片中使用IMG BXS系列ASIL-B级GPU 英国伦敦 - 2022年4月25日 - Imagination Technologies与Ambarel ...

  8. MIT用AI开发出道路识别系统,用于提升谷歌地图的精准性

    本文由人工智能观察编译 译者:Sandy 谷歌地图可谓是人工智能在出行方面的一个胜利,通过机器学习技术,它可以引导人们从一个出发点成功地找到目的地.尽管地图的路由部分并不需要太多人工混合,但手动追踪航 ...

  9. 澳大利亚研究者研制出一种计算机芯片 他们,快讯:几乎看不见的3D打印机器人;西澳大利亚大学的研究人员开发出一种保护生态机器鱼;效率达CPU一万倍的神经形态芯片发布!...

    [佐治亚理工学院研发了一种3D打印的微型机器人,这些微型机器人有朝一日可能会分组工作,以感知环境变化,移动材料,并可能有一天在人体内修复伤害.] 科学家们正在努力完善可以同时进行一项工作的小型机器人, ...

最新文章

  1. 在leangoo项目里怎么批量导入成员,更改项目成员权限,移除项目成员?
  2. Supervisor重新加载配置启动新的进程
  3. iOS设备屏幕像素总览
  4. 发达国家农业模式-国际农民丰收节贸易会:全球农业未来
  5. Leetcode12. 整数转罗马数字(C++)
  6. Git入门教程(1)
  7. php - preg_match
  8. LaTeX常见文件类型
  9. You have not concluded your merge (MERGE_HEAD exists)
  10. Win7的常用快捷键以及设置
  11. 【CocosCreator 3.x】实现双人同屏效果 => 攻略
  12. 【钉钉-场景化能力包】自有OA审批助力费控报销
  13. u盘安装原版window10系统
  14. 【中兴笔试题】外星母舰
  15. 油猴-今日头条去广告脚本
  16. Android studio突然报错Entry name ‘META-INF/androidx.vectordrawable_vectordrawable.version‘ collided的解决办法
  17. 云原生之使用Docker部署Python应用
  18. LeetCode 61-70题 这是动态规划合集啊?受宠若惊
  19. idea 双击打不开了咋办
  20. QuantLib 金融计算——收益率曲线之构建曲线(1)

热门文章

  1. Hive的JDBC使用并把JDBC放置后台运行
  2. 《软件测试经验与教训》之二——测试内容先后顺序
  3. 《文献检索》随感-2003年10月24日
  4. 玩转双核CPU:左手画圆,右手画方
  5. 4、变量和方法被static和final两个关键字修饰,为什么这么做?
  6. 硅谷产品实战-总结:23、增长的核心在于减少用户阻力
  7. 秒杀系统怎么设计?8张图带你搞定!
  8. 如何培养一个搞垮团队的Leader?
  9. 除了负载均衡,Nginx 还可以做很多:限流、缓存、黑白名单等
  10. Kafka一条消息如何被存储到Broker上?