Tensorflow和Caffe等深度学习中,监督学习的数据标注是一件非常繁琐和耗时的工作,目前大多数公司都采用外包给标注公司进行处理,或者购买现有的数据集,使得进行深度学习研究的成本异常高。本文介绍一种以人工智能解决数据标注的思路和方法。

一、思路

步骤:

1、以一个初步模型对小批量待标注数据进行检测,这里的初步模型可以是自己用少批量数据集训练出来的,也可以用网上公布的;

2、对检测出来的结果进行人为干预纠正;

3、把纠正后的数据训练新的模型;

4、用新模型对中等批量待测数据进行检测;

5、通过1~5步骤的循环迭代,可以逐步求精;

6、虽然也需要人工参与,但可以极大减少工作量。

实现方法:

1、Anno-Mage

Anno-Mage是一个半自动标注工具,通过一个通用模型对数据集进行检测。但这个工具能标注的物品类型有限,也没有模型迭代逐步求精的过程,可以自行对其源码进行修改优化。

github代码地址:https://github.com/virajmavani/semi-auto-image-annotation-tool

2、easyDL智能标注

2.1、智能标注

百度easyDL提供了智能标注的功能,跟以上思路差不多,都是先对小批量数据进行标注学习训练,然后以学习结果去标注剩下的数据集,然后人工纠正,迭代求精。

easyDL平台网址:https://ai.baidu.com/easydl/lite

智能检测技术文档:https://ai.baidu.com/ai-doc/EASYDL/lk38n327g

2.2、数据导出

但easyDL官方不提供数据导出功能和api,这阻碍了我们把数据拿到Tensorflow和Caffe进行训练。所以我们可以通过爬虫技术来爬取训练好的数据。

工具github地址:https://github.com/kooky126/easydl2labelImg

深度学习图像-半自动和自动标注工具相关推荐

  1. 深度学习(DL) /人工智能(AI)数据集标注工具、图像语料数据库

    一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的标注结果能够把无结构化的原始文本结构化,供计算机处理.利用该工具可以方便的获得各项NLP ...

  2. 【深度学习样本准备系列】——标注工具:精灵标注助手(Colabeler)使用教程

    这篇文章是看到其他博主 https://blog.csdn.net/youmumzcs/article/details/79657132 推荐的,个人感觉不错,比自己编译的界面看上去要舒服,推荐下: ...

  3. 深度学习图像标注工具汇总

    深度学习图像标注工具汇总 原文地址: https://blog.csdn.net/chaipp0607/article/details/79036312 对于监督学习算法而言,数据决定了任务的上限,而 ...

  4. 深度学习图像标注工具labelme

    来源:极客Merry 前言 在深度学习中若是没有带标注的数据,这可能会阻碍研究的进展,所以深度学习第一步就是制作数据集,手动去标注一些数据.LabelMe就是这样一个在线的图像数据标注工具: Labe ...

  5. 读取图像矩阵维度必须一致_深度学习在放射治疗中的应用——工具篇(二)矩阵基本操作...

    我们在这期继续为大家介绍Matlab中关于图像的一些基本概念与操作.上期我们简单介绍了矩阵的生成方式,这里详细说明矩阵的基本定义.首先矩阵大小可以用"size"函数查看,其中返回结 ...

  6. 开源交互式自动标注工具EISeg

    在人工智能行业有这么一句话:"深度学习有多智能.背后就有多少人工".这句话直接说出了深度学习从业者心中的痛处,毕竟模型的好坏数据占着很大的因素,但是数据的标注成本却让很多从业者感到 ...

  7. 6-机器学习启蒙- 深度学习: 图像搜索

    6- 深度学习: 图像搜索 github: https://github.com/mtianyan/graphLabStartedML 深度学习: 图像搜索 基于图片的相似度来选购商品 可视化商品推荐 ...

  8. 业界首个高性能交互式自动标注工具EISeg正式开源,跨越式提升你的标注体验...

    在人工智能行业有这么一句话:"深度学习有多智能.背后就有多少人工".这句话直接说出了深度学习从业者心中的痛处,毕竟模型的好坏数据占着很大的因素,但是数据的标注成本却让很多从业者感到 ...

  9. 图像文本检测的标注工具_如何检测图像中的文本

    图像文本检测的标注工具 Images are a great way to communicate without text but oftentimes images are used/abused ...

  10. 快速构建深度学习图像数据集,微软Bing和Google哪个更好用?

    译者 | Serene 编辑 | 明明 出品 | AI 科技大本营(公众号ID:rgznai100) [AI 科技大本营导读]在本文中,作者将利用微软的 Bing Image Search API 来 ...

最新文章

  1. POST教程笔记 - WinHttp获取网页源码
  2. 数学--数论--最小公倍数+最大公约数
  3. 今天开通了博客园帐号
  4. 第一百一十四期:盘点十大最新Web UI测试工具
  5. lvds 共模电感_【成功案例】共模电感CM0805C221R-10解决车载LVDS信号的手持天线抗扰问题...
  6. linux安装qq_Windows和Linux的比较
  7. 拉取网页_用命令行管理你的 GitHub 项目,不必再开网页,官方 CLI 工具 1.0 版上线...
  8. 零基础大数据学习框架
  9. 常见爬虫/BOT对抗技术介绍(一)
  10. 使用redis kv数据库维护kafka主题分区的offset
  11. 最新手机号码归属地数据库(2017年4月1日)
  12. 第十课◆ Newland Edu Li nearI ayout和Re lati vel ayout
  13. c语言驻波,C版:基于声学驻波的液位检测方法C2-1(电子版)
  14. 山东移动服务器密码修改,移动服务器山东 dns地址
  15. 考研英语 - word-list-11
  16. 二、软件项目开发计划书-模板
  17. 简易画图工具(Python)
  18. 网络数据传输、网络安全与通信
  19. Linux中如何对虚拟机管理和恢复
  20. 史考特 容易忽略的开户细节

热门文章

  1. 基于单片机的学生视力保护仪
  2. 小写数字转成大写的中文,方便财务对账专用
  3. 4GMF论坛主席卢伟谈4G全球发展概况
  4. 利用python进行正球面的大圆航程与横向线航程计算
  5. QT菜单栏颜色与背景颜色设置
  6. php 上拉加载下拉刷新页面,html下拉刷新上拉加载Refresher3.0
  7. 2020福州大学计算机录取名单,福州大学数学与计算机科学/软件学院2020年硕士研究生招生复试结果(第二批非全日制公示)...
  8. 链家深圳二手房房价数据分析
  9. 红帽linux9 iso,RedHat Linux9.0 ISO 原版下载
  10. 帷幕的帷是什么意思_古时纺织什么样子?穿越时空看古代纺织发展