前言

前段时间打了kaggle上的"Peking University/Baidu - Autonomous Driving"比赛,竞赛时间为三个月,前期一直在银牌区域,但到了比赛后期,各路大神出来一顿乱秀,最终获得铜牌,该系列博客是在比赛中采取的一些方法技巧及心得的总结。

  • 本系列博客分为两部分:
    Part 1、该Kaggle竞赛的赛题解读以及数据集分析
    Part 2、我在竞赛中采取的一些方法技巧总结

Part 1、Kaggle竞赛的赛题解读及数据集分析

竞赛平台:kaggle
什么?还不知道kaggle是什么?看这里:
推荐一个知乎高赞的回答:Kaggle入门,看这一篇就够了
竞赛题目:Peking University/Baidu - Autonomous Driving
赛题描述:百度的RAL联合北京大学基于工业级的CAD汽车模型,为竞赛者提供来自5277个真实图片的超过60000个带标签的3D汽车实例。要求参赛者开发一种算法,并据此估计来自真实交通环境的单一图片中车辆的绝对姿态(6个自由度)。
属于图像处理计算机视觉一类的竞赛。

大致了解了这个比赛是做什么的,接下来我们开始详细剖析。

1、数据集分析

图像处理当然首先关心图像数据集!

  • 训练数据集(train_images.zip):包含4262张带标签的图片,所有图片均在一辆车车顶相机位置拍摄
  • 带标签文件(train.csv):对应所有训练集图片的姿态信息(pose information)
  • 测试数据集(test_images.zip):包含2021张未带标签的图片
  • train_masks.zip、test_masks.zip:这两个文件夹中图像是做什么的呢?有何用?不着急,后面再来说它俩的作用
  • sample_submission.csv:提交结果的样本示例
  • car_models.zip:训练/测试集图片中未遮挡汽车的3D模型,可用于姿态估计,但一直没能找到方法利用它,可能这就是我们和前排队伍分数之间的差距吧。
  • camera.zip:相机固有参数

既然是车辆绝对姿态估计,Pose Information表示如下,但都表示什么意思呢?
model type, yaw, pitch, roll, x, y, z
我们取train.csv中实际数据说话!图片名称(ID_8a6e65317)的pose information如下:

ID_8a6e65317,
16 0.254839 -2.57534 -3.10256 7.96539 3.20066 11.0225
56 0.181647 -1.46947 -3.12159 9.60332 4.66632 19.339
70 0.163072 -1.56865 -3.11754 10.39 11.2219 59.7825
70 0.141942 -3.1395 3.11969 -9.59236 5.13662 24.7337
46 0.163068 -2.08578 -3.11754 9.83335 13.2689 72.9323

(16 56 70 70 46为(ID_8a6e65317)中对应不同车辆的model type标号)

orientation 方向
yaw 偏航角
pitch 俯仰角
roll 滚动角
position 位置
x x轴
y y轴
z z轴

好!现在问题进一步清楚了,我们要根据测试集图片中车辆的pose information来估计测试集图片中车辆对应的pose information,此外,还需提供你对预测的置信度得分(confidence)。
至此,数据集部分的分析到此结束。

2、Kaggle参赛技巧
  • 如果说你什么都不知道,那还是从了解kaggle开始吧;如果说你已经打了一些练习赛,并且掌握计算机视觉,图像处理相关知识的话,推荐几位Competitions Grandmaster大佬的kaggle技巧分析。
    Kaggle你问我答【1】——SeuTao
    Kaggle你问我答【2】——Jiwei Liu
    本科生晋升GM记录 & kaggle比赛进阶技巧分享

请跳转查看:Part 2、我在竞赛中采取的一些方法技巧总结

kaggle自动驾驶竞赛铜牌总结:Peking University/Baidu - Autonomous Driving—(Part 1)相关推荐

  1. 自动驾驶文献学习《A Survey of Autonomous Driving: Common Practices and Emerging Technologies》

    这是一篇有关于自动驾驶的综述性很强的论文,发布于2020年4月. 全文系统地介绍了自动驾驶系统的发展历史及发展现状,阐述了自动驾驶系统目前面临的困难与挑战,然后依次从自动驾驶系统框架.传感器分类.地图 ...

  2. Coursera自动驾驶课程第17讲:An Autonomous Vehicle State Estimator

    在第16讲<Coursera自动驾驶课程第16讲:LIDAR Sensing>我们学习了自动驾驶目前常用的3D 传感器,激光雷达,了解了激光雷达的工作原理,掌握了对点云数据的操作以及如何使 ...

  3. 【自动驾驶】《Multi-modal Sensor Fusion for Auto Driving Perception: A Survey》论文阅读笔记

    引用 @article{Wang2020MultiSensorFI,title={Multi-Sensor Fusion in Automated Driving: A Survey},author= ...

  4. 综述自动驾驶中的计算机视觉Computer Vision for Autonomous Vehicles: Problems, Datasets and State-of-the-Art(上)

    综述原文链接https://arxiv.org/pdf/1704.05519.pdf 17年CVPR上的一篇关于自动驾驶和计算机视觉的综述,比较全面,大体整理一个提纲,重点关注比较新的研究成果,侧重于 ...

  5. 自动驾驶1-3 自动驾驶汽车的故事The Story of Autonomous Vehicles

    大家好欢迎来到这个视频 我们将快速浏览多个事件事件 以及自动驾驶高速发展的故事 一个感觉的未来似乎就在眼前 但要达到这一点而去的路线是一个 疯狂的梦想几乎和汽车一样. 早在1925年 弗朗西斯·胡迪纳 ...

  6. ECCV 2020 论文大盘点-自动驾驶篇

    自动驾驶(可能)是人工智能产业化进程中最令人兴奋.吸引最多投资.引起大众最多关注的领域,在其技术栈中来自计算机视觉的环境感知模块是各大厂商研究的重点. 本文盘点 ECCV 2020 中与自动驾驶(Au ...

  7. 华为、腾讯、百度扎堆进入的自动驾驶仿真市场,到底藏着怎样的秘密?

    文 | 魏启扬 来源 | 智能相对论(ID:aixdlun) 提到自动驾驶的商业竞争,车联网无疑是其中最为惨烈的一个领域,里面充斥着各种巨头博弈.屌丝逆袭的励志故事. 可是,自动驾驶赛道的复杂性远远不 ...

  8. 自动驾驶激荡风云录:来自圈内人的冷眼解读

    作者 | 黄浴,奇点汽车美研中心总裁兼自动驾驶首席科学家编辑 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 最近一个月,有关自动驾驶的新闻层出不穷,也是少有的热闹. 先说正面的吧. ...

  9. 英伟达自动驾驶技术:用于自动驾驶汽车的端到端深度学习

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:机器之心 AI博士笔记系列推荐 周志华<机器学习> ...

最新文章

  1. 树莓派做网站服务器同时做nas,【项目分享】树莓派4搭建NAS,让硬盘轻松联网...
  2. antd 文本域超长问题_「自然语言处理(NLP)」阿里团队--文本匹配模型(含源码)...
  3. 脉冲列输入型脉冲比较数字伺服系统的原理图
  4. linux分区挂载点在哪个文件,挂载的信息是存放在哪个文件中?
  5. 485通讯线是几芯的_RS485协议 电脑与stm32单片机通信 keil编程 在485的硬件错误中徘徊...
  6. C/C++代码调试:快速定位内存的申请和释放的位置
  7. 一题多解 —— 二项式分布的期望和方差的计算
  8. maven安装及配置
  9. HFSS - 倒F天线的设计与仿真
  10. vue-codemirror 代码编辑器
  11. Oracle中打印99乘法表的13种方法
  12. WinRAR分割超大文件
  13. 一加7t人脸识别_一加7Pro和一加7TPro你发现什么异常?详细对比才发现这个问题!...
  14. 拒绝访问html,IE拒绝访问如何解决?IE拒绝访问的原因及解决方法
  15. 日历小程序C语言,小程序日历功能实现
  16. vue 导出excel文件 利用 excelJs插件
  17. 《Linux设备驱动开发详解(第2版)》隆重出版
  18. python学了两个月我就开始接单了
  19. 13变积分限函数求极限问题
  20. 10 款开源的在线游戏,点开就能玩的那种

热门文章

  1. 关于2021年最热门的5种编程语言
  2. Word表格快速、完美转换成Excel
  3. Android 用代码查看本机保存的Wifi密码
  4. 绘画新手怎么学习绘画?怎么让自己的绘画作品看起来舒服?
  5. 西门子PLC中DB与DI有什么区别
  6. db与放大倍数的转化
  7. 回顾 12 个面向 Web 开发人员的在线代码编辑器
  8. nodejs+vue+elementui手办多商家商城交易平台
  9. 1.合宙Air32F103调试GPIO
  10. html图片轮播种类,支持4种类型的jQuery轮播图插件EasySlides