本次分享一个谷歌暗度陈仓收集客户标注数据的故事,城市套路深,我要回农村;分享九个数据标注最常用的工具,涵盖打点,拉框,OCR,语义分割,3D等。

01一个故事

2004 年,谷歌宣布开启全球图书馆馆藏图书的数字化计划,扫描了哈佛大学、牛津大学、斯坦福大学、康奈尔大学、纽约公共图书馆等世界一流设施内的书籍,光哈佛大学就有 1600 万册,将它们制作成电子版。

书页内的文字主要通过 OCR 光学字符扫描分析,转换成为文本。识别过程并非完美,字迹模糊、污迹等都可能产生错误,所以需要配合人工修正。

谷歌怎么做呢?他们直接把难于识别的文字,做成了验证码,当你在某些情况下需要登录验证谷歌帐号时,展示两个单词——一个单词是谷歌已知信息,靠这个完成真正的验证动作,另一个就是上述无法识别的图书文本,谷歌让你来肉眼识别,至少三个用户给出同一个结果,就会被提交给谷歌服务器。

恭喜你被套路了!

同样的,谷歌将这套发扬到了无人驾驶领域,做成了图形验证界面,让用户在验证环节,从一堆谷歌街景的实拍照片矩阵中,选出「人」、「车」或是「路牌」。

尽管谷歌自身已有海量数据积累,但为了提升现行主流的「有监督学习」算法模型的准确度,数据永远不嫌多,直接或者间接从用户手中花样收集数据标注,包装出各种各样的形态,防不胜防.但背后的一切还是流量的支持,没有流量怎么办?踏踏实实一点一点标注吧。02九个工具

1.LabelImg

下载以后根据作者提供的安装指南即可安装,如果安装不上怎么办,不用这么麻烦,下面这个地址提供了直接下载的地址,下载预编译exe即可:

支持VOC2012格式与tfrecord自动生成!

2.LabelIme

支持对象检测、图像语义分割数据标注,实现语言为Python与QT。

支持导出VOC与COCO格式数据实例分割

强烈推荐,实例分割都可以用它标注!

3.RectLabel

支持导出YOLO、KITTI、COCOJSON与CSV格式

读写Pascal VOC格式的XML文件

4.OpenCV/CVAT

高效的计算机视觉注释工具,支持图像分类,对象检测框,图像语义分割

5.VOTT

Microsoft发布了一个基于WEB的可视化数据注释工具,用于本地部署。

支持图像和视频数据注释

6.LableBox

WEB模式下的标记工具

提供自定义注释API支持

纯JS + HTML支持

7.VIA-VGG Image Annotator

VGG发布的图像标准工具

基于WEB方式的标注工具

8.PixelAnnotationTool

9.point-cloud-annotation-tool

3D点云数据注释工件

支持3D BOX盒子生成

支持KITTI-bin格式数据

python数据标注工具_数据标注|分享9个数据标注工具相关推荐

  1. python 3d大数据可视化软件_最受欢迎的大数据可视化软件

    最受欢迎的大数据可视化软件 发布时间:2020-05-26 想像阅读书本一样阅读数据流?这只有在电影中才有可能发生. 在现实世界中,企业必须使用数据可视化工具来读取原始数据的趋势和模式. 大数据可视化 ...

  2. python 百度百科 爬虫_爬虫爬取百度百科数据

    以前段时间<青春有你2>为例,我们使用Python来爬取百度百科中<青春有你2>所有参赛选手的信息. 什么是爬虫? 为了获取大量的互联网数据,我们自然想到使用爬虫代替我们完成这 ...

  3. python图形绘制星空图_如何将枯燥的大数据呈现为可视化的图和动画?

    在回答之前,先简单的介绍我自己,我是澎湃新闻美数课(数据新闻)栏目的课代表,擅长做数据可视化视频和信息图. 喂喂喂!憋看到我这个身份,就跑啊,下面有一吨实用干货等你~~~ 前段时间做了一个关于诺贝尔人 ...

  4. python pandas 读取数据库_数据分析-pandas从数据库读取数据

    数据分析-pandas从数据库读取数据 使用pandas读取数据到DataFrame,对于只是数据分析来说,重点是读取数据,读取数据过程越简单越好,并不需要写得很复杂显得自己很厉害的样子.最好就是代码 ...

  5. 前端微信签名验证工具_微信小程序API 用户数据的签名验证和加解密

    用户数据的签名验证和加解密 数据签名校验 为了确保 开放接口 返回用户数据的安全性,微信会对明文数据进行签名.开发者可以根据业务需要对数据包进行签名校验,确保数据的完整性.签名校验算法涉及用户的ses ...

  6. 大数据相关从业_如何在组织中以数据从业者的身份闪耀

    大数据相关从业 Build bridges, keep the maths under your hat and focus on serving. 架起桥梁,将数学放在脑海中,并专注于服务. 通过协 ...

  7. 大数据平台构建_如何像产品一样构建数据平台

    大数据平台构建 重点 (Top highlight) Over the past few years, many companies have embraced data platforms as a ...

  8. 软件开发向大数据开发过渡_如果您是过渡到数据科学的开发人员,那么这里是您的最佳资源...

    软件开发向大数据开发过渡 by Cecelia Shao 邵Ce It seems like everyone wants to be a data scientist these days - fr ...

  9. 数据科学与大数据排名思考题_排名前5位的数据科学课程

    数据科学与大数据排名思考题 目录 (Table of Contents) Introduction介绍 Udemy乌迪米 Machine Learning A-Z™: Hands-On Python ...

  10. 交通大数据应用细分_盈海科技 | 交通大数据可视化“掘金”数据价值

    面对日益拥堵的交通状况 智能交通布局虽在不断完善 但交通管理依旧收效甚微 问题究竟出在了哪里? 数据独立存储难以融合应用 数据内在规律难寻 数据可视化程度低 -- 问题繁多 困难重重 怎么办??? 交 ...

最新文章

  1. idea 2019安装完(打不开启动不了)问题解决(最全解决方法)
  2. HTML5中的Article和Section元素
  3. Andriod --- JetPack (六):Room 增删改查
  4. win7+ubuntu20.04双系统+easybcd安装以及Reached target Reboot卡住问题
  5. scala 函数中嵌套函数_如何在Scala中将函数转换为部分函数?
  6. python 默认配置文件_python各类配置文件写法
  7. java 反射 父类的属性_用反射的方式获取父类中的所有属性和方法
  8. URL请求到Action的映射规则
  9. python读取xml文件有哪些方法_深入解读Python 解析xml的几种方式
  10. php中的一些编程例子
  11. OpenCV中的内存泄露问题(cvLoadImage,cvCloneImage)【转】
  12. uBLAS——Boost 线性代数基础程序库 (三)
  13. guid会不会重复_最笨的方法也许是最快的方法,量变到质变,首先要做的是不断重复...
  14. 【Android动画】仿新浪微博雷达搜索效果
  15. java程序员简历范文
  16. Verilog——三角波发生器(状态机)
  17. 【线性代数】线性代数的几何意义
  18. Memory cgroup out of memory
  19. ArcGIS JS API实现地图场景视频融合
  20. 海思HI3516板子初体验

热门文章

  1. 微型计算机汇编用什么软件,EMU8086 汇编工具软件的使用
  2. C++预编译头文件 – stdafx.h
  3. oppo鸿蒙系统刷机包下载,OPPO A59st官方固件rom刷机包_OPPO A59st系统升级包下载
  4. 最近在建模,顺便汉化一个软件玩玩
  5. r9270公版bios_R9280,R9270,HD7000,VBE7007.系显卡全套修改超频刷BIOS工具
  6. 一步步学习java后台(一)(IDEA, Spring, Maven, MyBatis)
  7. Cent OS 7 配置静态ip
  8. 工业园区与大型制造工厂企业食堂消费管理系统常见需求及解决方案
  9. 台式计算机加固态硬盘,台式机加硬盘|台式机加SSD固态硬盘提速教程
  10. 华为主题包hwt下载_hwtTool下载-华为主题开发工具下载 v9.0.2.301 官方版[百度网盘资源] - 安下载...