作者 | 王汝嘉  编辑 | 汽车人

原文链接:https://zhuanlan.zhihu.com/p/572294360

后台回复【OccupanyNetwork】获取Occupany Network相关论文干货资料!

论文:https://arxiv.org/pdf/2210.01249v1.pdf

代码:https:/http://github.com/sisl/LOPR

作者单位:斯坦福大学

论文思路

环境预测框架对于自动驾驶车辆在动态环境中促进安全操纵至关重要。以前的方法已将占用网格图用作场景的鸟瞰图表示,并直接在像素空间中优化了预测架构。尽管这些方法在时空预测方面取得了一些成功,但有时会受到不切实际和不正确的预测的阻碍。本文假设使用生成模型可以提高预测占用网格的质量和真实性。本文提出了一个框架,该框架将占用网格预测分解为与任务无关的低维表示学习和潜在空间中的任务相关的预测。本文证明了其提出的方法在真实世界的自动驾驶数据集NuScenes上实现了最先进的性能。

主要贡献:

本文提出了一个称为潜在占用预测 (LOPR) 的框架,其中本文在生成体系结构的潜在空间中执行OGM预测。本文的方法包括两个连续的阶段: 1) 编码器和生成器神经网络的独立于任务的无监督训练,以及2) 在生成模型提供的可学习的潜在空间中运行的网络的依赖任务的监督训练。本文证明了所学习的潜在空间的可控性和可解释性。在自动驾驶数据集NuScenes [28] 上的实验表明,LOPR在定性和定量上都优于SOTA OGM预测方法。

论文设计:

潜在占用预测 (LOPR)。本文将OGM预测任务分为两个阶段: 独立于任务的表示学习和依赖于任务的预测。

插图展示了LOPR框架,该框架由 (a) 独立于任务的表示学习阶段和 (b) 依赖于任务的监督学习阶段组成。在表示学习阶段,本文以无监督的方式训练编码器和生成器。在监督学习阶段,本文将OGM数据集转换为低维表示,并完全在预先训练的生成模型的潜在空间中进行训练。

OGM预测的先前工作经历了预测帧的明显模糊。在本节中,本文介绍使用生成模型来解决这些问题的潜在占用预测 (LOPR)。LOPR解耦环境表示学习和预测任务,并在生成体系结构的潜在空间中执行预测。受世界模型 [21] 的启发,LOPR在两个连续阶段进行训练。在无监督表示学习阶段,本文训练编码器和生成器以获取预先训练的潜在空间。编码器学习OGM的低维表示,以后可以用于预测,并且生成器将潜在空间解码为OGM空间。随后,在监督学习阶段,本文在预先训练的潜在空间中训练本文的预测网络。它的任务是确保生成的ogm在时间和语义上是一致的。对于环境表示,本文使用按照Itkina等人描述的过程,从激光雷达测量生成的ogm。[1]。

实验结果:

NuScenes测试集上重建性能的可视化。从顶部开始: 地面真相,使用VAE-GAN重建的ogm,以及使用VAE重建的ogm。尽管质量相似,但VAE-GAN的重建似乎更清晰。

可视化prior的采样内容和样式潜在向量对NuScenes测试集的重建性能的影响。(左) OGM (右) 在行驶中的车辆上裁剪了OGM。内容潜在向量会影响场景中代理的存在和位置,而样式潜在向量会改变代理的外观。

潜空间的插值。本文在同一场景序列中的两个ogm之间进行插值。插值OGMs准确地捕获了环境的时空运动。正确插值了主体在自我车辆前面的水平运动。

在NuScenes测试集上比较基于占用的不同预测方法 (越低越好)。就IS而言,本文的方法明显优于基准方法。本文报告结果的标准误差。

训练时间的比较:

Nuscenes SOTA!LOPR: 使用生成模型进行潜在occupancy预测相关推荐

  1. 1. 深度生成模型-扩散模型(非均衡热力学的深度无监督学习)

    扩散模型:利用非均衡热力学的深度无监督学习 Deep Unsupervised Learning using Nonequilibrium Thermodynamics 扩散模型:利用非均衡热力学的深 ...

  2. 机器学习判定模型与生成模型区别

    作者:politer 链接:https://www.zhihu.com/question/20446337/answer/256466823 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权, ...

  3. 生成模型和判别模型的区别

    作者:politer 链接:https://www.zhihu.com/question/20446337/answer/256466823 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权, ...

  4. 生成模型(Generative)和判别模型(Discriminative)

    目录 1 决策函数Y=f(X)或者条件概率分布P(Y|X) 2 生成方法和判别方法 2.1 生成方法 2.2 判别方法 3 特点及对比 3.1 生成模型 3.2 判别模型 3.3 总结 4 对于跟踪算 ...

  5. 单张人像生成视频!中国团队提出最新3D人脸视频生成模型,实现SOTA

    来源:IEEE 编辑:新智元 [导读]稀疏人脸特征点生成的人脸图像视频通常会遇到图像质量损失.图像失真.身份改变,以及表情不匹配等问题.为此作者使用重建出的三维人脸动态信息来指导人脸视频的生成.结果显 ...

  6. 大规模计算时代:深度生成模型何去何从

    ©PaperWeekly 原创 · 作者|Chunyuan Li 单位|Microsoft Research Researcher 研究方向|深度生成模型 人工智能的核心愿望之一是开发算法和技术,使计 ...

  7. 李沐论文精读系列五:DALL·E2(生成模型串讲,从GANs、VE/VAE/VQ-VAE/DALL·E到扩散模型DDPM/ADM)

    文章目录 一. 前言 1.1 DALL·E简介 1.2 DALL·E2简介 1.3 文生图模型进展 二. 引言 2.1 摘要 2.2 引言&模型结构 三. 算法铺垫 3.1 GANs 3.2 ...

  8. KDD 2020(五) | 基于多源异构信息整合的视频标题生成模型(作者带你读论文)...

    ⬆⬆⬆              点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 论文:Comprehensive Information Integration Modeling F ...

  9. 生成模型(四):扩散模型(Diffusion Models)

    本文大纲如下: 生成模型种类 到目前为止,我已经写了三种类型的生成模型,[[生成模型-GAN]].[[生成模型-VAE]]和[[生成模型-Flow based model]]. 它们在生成高质量样本方 ...

最新文章

  1. python open ascii codec cant_解决Python2.7的UnicodeEncodeError: ‘ascii’ codec can’t encode异常错误...
  2. 取得NSDate实例各个字段的数字
  3. 【BZOJ】1649: [Usaco2006 Dec]Cow Roller Coaster(dp)
  4. 1023:坑爹的黑店
  5. 7001.ubuntu18.04搭建go语言开发环境
  6. 韩流音乐爱好者的福音!SM娱乐牵手腾讯音乐
  7. 苹果分屏软件_Mac软件推荐
  8. Nginx反向代理、静态资源下载
  9. caxa线切割怎样画链轮_Autocad实战教程-线切割画链轮
  10. php根据两点经纬度计算距离
  11. Logisim海明编码解码实验
  12. 2020最新中高阶Android面试题总结-上(附解题思路)
  13. Computer Vision的尴尬---by林达华
  14. Airwallex 基于 Flink 打造实时风控系统
  15. 基于Linux实现的聊天室小程序
  16. Hadoop 学习笔记(三)常用命令
  17. matlab图像剪裁命令imcrop()
  18. ESX5.1 安装Hyper v
  19. format code appears twice
  20. Java String类的split方法简介

热门文章

  1. JAVA面向对象的基础知识快速通过---自学笔记(一)
  2. Java毕业设计项目_企业级实战全栈项目中信CRM
  3. Flask报错及其相关解决方法汇总
  4. 《你是我的荣耀》制片人张萌犯受贿罪:被判处有期徒刑三年
  5. 一些PPT演讲前暖场的音乐
  6. 解决虚拟机不能连接外网问题
  7. Java学习之定义一个Circle类并测试所有方法
  8. 单片机进阶---HLK-W801硬件开发之制作PCB
  9. Unix/Linux编程:POSIX时钟
  10. DTC社群运营怎么做?