本次分享一个谷歌暗度陈仓收集客户标注数据的故事,城市套路深,我要回农村;分享九个数据标注最常用的工具,涵盖打点,拉框,OCR,语义分割,3D等。01一个故事

2004 年,谷歌宣布开启全球图书馆馆藏图书的数字化计划,扫描了哈佛大学、牛津大学、斯坦福大学、康奈尔大学、纽约公共图书馆等世界一流设施内的书籍,光哈佛大学就有 1600 万册,将它们制作成电子版。

书页内的文字主要通过 OCR 光学字符扫描分析,转换成为文本。识别过程并非完美,字迹模糊、污迹等都可能产生错误,所以需要配合人工修正。

谷歌怎么做呢?他们直接把难于识别的文字,做成了验证码,当你在某些情况下需要登录验证谷歌帐号时,展示两个单词——一个单词是谷歌已知信息,靠这个完成真正的验证动作,另一个就是上述无法识别的图书文本,谷歌让你来肉眼识别,至少三个用户给出同一个结果,就会被提交给谷歌服务器。

恭喜你被套路了!

同样的,谷歌将这套发扬到了无人驾驶领域,做成了图形验证界面,让用户在验证环节,从一堆谷歌街景的实拍照片矩阵中,选出「人」、「车」或是「路牌」。

尽管谷歌自身已有海量数据积累,但为了提升现行主流的「有监督学习」算法模型的准确度,数据永远不嫌多,直接或者间接从用户手中花样收集数据标注,包装出各种各样的形态,防不胜防.但背后的一切还是流量的支持,没有流量怎么办?踏踏实实一点一点标注吧。02九个工具

1.LabelImg

主页地址:https://github.com/tzutalin/labelImg

下载以后根据作者提供的安装指南即可安装,如果安装不上怎么办,不用这么麻烦,下面这个地址提供了直接下载的地址,下载预编译exe即可:

https://github.com/zhaobai62/labelImg

支持VOC2012格式与tfrecord自动生成!

2.LabelIme

主页地址:https://github.com/wkentaro/labelme

支持对象检测、图像语义分割数据标注,实现语言为Python与QT。

支持导出VOC与COCO格式数据实例分割

强烈推荐,实例分割都可以用它标注!

3.RectLabel

https://rectlabel.com/

支持导出YOLO、KITTI、COCOJSON与CSV格式

读写Pascal VOC格式的XML文件

4.OpenCV/CVAT

官方主页:https://github.com/opencv/cvat

高效的计算机视觉注释工具,支持图像分类,对象检测框,图像语义分割

5.VOTT

官方主页:https://github.com/microsoft/VoTT

Microsoft发布了一个基于WEB的可视化数据注释工具,用于本地部署。

支持图像和视频数据注释

6.LableBox

官方主页:https://github.com/Labelbox/Labelbox

WEB模式下的标记工具

提供自定义注释API支持

纯JS + HTML支持

7.VIA-VGG Image Annotator

http://www.robots.ox.ac.uk/~vgg/software/via/

VGG发布的图像标准工具

基于WEB方式的标注工具

8.PixelAnnotationTool

https://github.com/abreheret/PixelAnnotationTool

9.point-cloud-annotation-tool

官方地址:https://github.com/springzfx/point-cloud-annotation-tool

3D点云数据注释工件

支持3D BOX盒子生成

支持KITTI-bin格式数据

数据标注|国家信息安全标准化技术委员会-人工智能安全标准化白皮书(2019)

数据标注|明星秒变宠物脸

数据标注|定义我,请先了解我

数据集标注工具_数据标注分享9个数据标注工具相关推荐

  1. c mysql实体类生成工具_【干货分享】C# 实体类生成工具

    前言: 项目实战中不论是业务编码还是通用编码,总会归纳出一些通用的工具类.放入项目中一劳永逸,让兄弟姐妹们避免编写重复代码.所以利用了工作之余的时间,将这些散落在多个项目中精致优雅的工具类,归纳起来形 ...

  2. 前端微信签名验证工具_微信小程序API 用户数据的签名验证和加解密

    用户数据的签名验证和加解密 数据签名校验 为了确保 开放接口 返回用户数据的安全性,微信会对明文数据进行签名.开发者可以根据业务需要对数据包进行签名校验,确保数据的完整性.签名校验算法涉及用户的ses ...

  3. colorpix取色小工具_五款互联网人必备的免费工具,超级实用

    运营公举小磊磊(公众号ID:gongjulei)所有文章均为独家原创,未经许可,不得转载. 一名互联网人,从来都不会嫌工具多.小公举今天找到了5款互联网人必备的免费工具,都是我亲自试用过的.话不多说, ...

  4. 下面哪个不是python常用的开发工具_有哪些值得推荐的 Python 开发工具?

    数据转化成更直观的图片,对于理解数据背后的真相很有帮助.如果你有这方面的需求,而且还在使用Python,那么强烈推荐你试一试Altair. Altair是一个专为Python编写的可视化软件包,它能让 ...

  5. 阿里数据总监分享《阿里数据中台建设实践案例》,PPT+语音讲解!

    戳蓝字"CSDN云计算"关注我们哦! 作者 |  技术领导力 责编 | 阿秃 本文整理自,阿里巴巴集团数据部商业应用总监列文,在"2019年阿里云(上海)峰会" ...

  6. wcf编程用什么工具_四个强大的自学编程网站工具,用的人都是学习欲望很强!...

    今天给大家分享几个自学编程的网站工具,希望可以帮到正在努力自学的你!~~ 慕课网 很多朋友都在想如何学习软件开发,这个自学开发的网站确实好用,一款专业的在线编程学习平台,早期的发展有很多免费的课程,对 ...

  7. python 数据挖掘工具_推荐19款最常用的数据挖掘工具

    数据在当今世界意味着金钱.随着向基于app的世界的过渡,数据呈指数增长.然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式. 数据挖掘或&qu ...

  8. 数据科学家分享:“大数据全栈技术与商用平台架构设计之路”

    各位好: 回首10年多的科研工作历程,也是中国经济高速发展的10多年,中国高铁.核电.航空.互联网.云计算.大数据.人工智能等领域无不铭刻着"中国名片",这就是科技是第一生产力的实 ...

  9. excel转mysql 工具_一个简单的批量excel转mysql工具

    背景:工作中,经常发现需要将excel中的表数据导入到mysql中,实际操作一般都是用navcat,但是使用中也发现navcat只支持单个表导入,对xlsx格式支持不友好.于是写了这么一个导表工具.在 ...

  10. 网口监视报文工具_真是神器!这款网络排查工具!

    常用的 ping,tracert,nslookup 一般用来判断主机的网络连通性,其实 Linux 下有一个更好用的网络联通性判断工具,它可以结合ping nslookup tracert 来判断网络 ...

最新文章

  1. 博士发公众号文章也能评国奖?双一流高校新规引热议!
  2. 去年我年薪 30W,今年我一天做 3 顿饭
  3. hibernate savealiasentity 保存后id为空_好程序员Java教程分享Java面试题之Hibernate
  4. 1.20 Java8新特性:Effectively final
  5. php注解rbac,PHP的RBAC权限详解
  6. 语言是用的,把日常的交流转换成其它语言就可以了(转)
  7. java 工厂模式的写法_设计模式-工厂模式
  8. LeetCode 205. 同构字符串(哈希map)
  9. 《论道HTML5》内容技术分享活动
  10. linux 查看usb端口_linux开发:Linux下查看端口占用
  11. Win10进不去系统怎么办? 不重装就能修复系统必备技能
  12. python 文件读写 newline_「Python」:文件读写
  13. HCIE-Security Day13:防火墙双机热备实验(一)防火墙直路部署,上下行连接交换机
  14. Trusted Execution Technology (TXT) --- 基本原理篇
  15. SpringMVC通过工具类获取Request域
  16. 主动FTP vs. 被动FTP 权威解释
  17. 移动跨平台框架ReactNative活动指示器组件【11】
  18. 怎么用计算机算化学,化学计算机
  19. 第三章 处理机调度与死锁(汤小丹版操作系统笔记) 超全超详细!!!
  20. 项目配置不当引发了数据泄露,人已裂开!!(建议收藏)

热门文章

  1. wxWidgets:wxCmdLineParser类用法
  2. boost::mpi模块all_reduce() 集合的测试
  3. boost::iterator_adaptor用法的测试程序
  4. Boost.Flyweight 键值测试的类
  5. boost::detail::allocator模块的测试程序
  6. boost::gregorian模块实现自年初以来的天数的测试程序
  7. 宏BOOST_TEST_TRAIT_TRUE的用法实例
  8. boost::contract模块实现move的测试程序
  9. ITK:区域最小图像过滤器
  10. VTK:PolyData之PolyDataToUnstructuredGrid