前言

最近,几个CV相关的项目陆续暴露出识别准确率不高的问题,导致客户反应强烈。其实在项目初期时我就指出过,只有千级的训练数据是无法训练出一个准确率高的模型的。

在此写一篇博文记录一下。

正文

《数据量不够大,别玩深度学习》

2017年 Jeff Leek 在 Simply Stats 上发表了一篇题为《数据量不够大,别玩深度学习》(Don’t use deep learning your data isn’t that big)的博文。

作者指出,当样本数据集很小时,简单的线性模型也能优于深度网络模型的。

为了证明自己的论点,Leek 举了一个基于 MNIST 数据库进行图像识别的例子,分辨 0 或 1。当用仅 80 个样本的 MNIST 数据集中进行 0 和 1 的分类时,一个简单的线性预测器要比深度神经网络的预测准确度更高。

原文链接:You can probably use deep learning even if your data isn’t that big

谷歌与CMU联合发文:审视数据对深度学习的重要性

深度学习在视觉问题上所取得的成功可归因于以下几点:

  • 高容量模型;

  • 高速增长的计算力;

  • 大规模标记数据的可用性。

原文链接:Revisiting Unreasonable Effectiveness of Data in Deep Learning Era

Why go large with Data for Deep Learning?

  • 从原理了解为什么需要大量训练数据

    1957年,弗兰克罗森布拉特设计了第一个模拟单个神经元活动的rst感知器。

    感知器(感知机)如下图所示:

    线性单元如下图所示:

    神经网络如下图所示:

    卷积神经网络的示意图:
    一个卷积神经网络由若干卷积层、Pooling层、全连接层组成。你可以构建各种不同的卷积神经网络,它的常用架构模式为:

    INPUT -> [[CONV]*N -> POOL?]*M -> [FC]*K

  • 以图像识别为例子

    图像识别是神经网络应用的主要领域之一,涉及识别隐藏在数据像素后面的大量特征。为了获取这些特征,采用了多层感知机。

    常用反向传播将输出与训练数据的误差进行比较,并计算输出中的误差。然后,紧靠输出层的层会调整其权重,导致后续内层中的权重调整,直到错误率降低。

    深度学习需要大量不同实例的数据集,模型从中学习要查找的特征并生成带有概率向量的输出。

  • 深度学习的性能能否提升取决于数据集的大小

    模型学习的参数越多,训练所需的数据也会增加。否则,具有更多维数和小数据的问题会导致过拟合。

    为了验证大数据的必要性,我们来看看2个大容量训练数据的成功应用场景

    1、Facebook上著名的现代人脸识别系统称为“DeepFace”,部署了一套4000多个身份的4百万面部图像,并且在带标签的数据集上达到了97.35%的准确率。

    2、Alex Krizhevsky与Geoffrey Hinton等其他学者,描述了一个涉及手眼协调的机器人抓握学习模型。为了训练他们的网络,共收集了800,000次抓握尝试,机器人手臂成功地学习了更多种类的抓握策略。

原文链接:Why go large with Data for Deep Learning?

AI实战:深度学习必须使用大量数据?数据量对深度学习的重要性可能超乎你的想象!相关推荐

  1. 【AI实战】深度学习基础环境搭建(Ubuntu + anaconda + tensorflow + GPU + PyCharm)

    为方便日常的深度学习模型开发与测试,本人在自己笔记本上搭建一个深度学习的基础环境,便于学习AI使用.本人使用的笔记本配置是CPU为8代i5,显卡为GTX1060,内存为8G,基本上可满足日常的AI研究 ...

  2. 开放下载!《阿里巴巴大数据及AI实战》深度解析典型场景大数据实践

    来源:开发者社区 本文约2000字,建议阅读5分钟. 阿里经济体大数据及AI典型场景最佳实践全揭秘.2019不容错过的大数据实战手册--<阿里巴巴大数据及AI实战>现在可以免费下载阅读啦! ...

  3. 深入云原生 AI:基于 Alluxio 数据缓存的大规模深度学习训练性能优化

    作者 | 车漾(阿里云高级技术专家).顾荣(南京大学 副研究员) 导读:Alluxio 项目诞生于 UC Berkeley AMP 实验室,自开源以来经过 7 年的不断开发迭代,支撑大数据处理场景的数 ...

  4. AI实战:深度学习模型压缩:模型裁剪——Pruning with Keras

    前言 上一篇文章 AI实战:深度学习模型压缩:模型裁剪--Pruning with Tensorflow 介绍了使用Tensorflow裁剪模型的方法,本文继续介绍使用Keras裁剪模型的方法及源码分 ...

  5. 自监督学习,如何从数据困境中拯救深度学习?

    2020-02-03 05:35:08 作者 | Thalles Silva编译 | 翻译官balala 编辑 | 丛末 大规模标注的数据集的出现是深度学习在计算机视觉领域取得巨大成功的关键因素之一. ...

  6. 数据不够怎么训练深度学习模型?不妨试试迁移学习 ——重用神经网络的结构2...

    数据不够怎么训练深度学习模型?不妨试试迁移学习 本质就是这个图!pretrained model就是你截取的部分神经网络模型(迁移学习),而nanonet就是你自己加入的网络层. 随着深度学习技术在机 ...

  7. 【深度学习】基于PyTorch深度学习框架的序列图像数据装载器

    作者 | Harsh Maheshwari 编译 | VK 来源 | Towards Data Science 如今,深度学习和机器学习算法正在统治世界.PyTorch是最常用的深度学习框架之一,用于 ...

  8. 大数据时代下的迁移学习_继深度学习后,下一个热点技术是迁移学习

    最早提出大数据时代到来的是知名咨询公司麦肯锡,麦肯锡称:"数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素.人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪 ...

  9. 本周AI热点回顾:十四五规划“人工智能第一!”;深度学习漫画第一卷现已开源;英伟达GPU“屠榜”MLPerf

    点击左上方蓝字关注我们 01 人工智能第一!十四五规划建议正式发布 近日,中国共产党第十九届中央委员会第五次全体会议深入分析国际国内形势后,就制定国民经济和社会发展「十四五」规划和2035年远景目标提 ...

最新文章

  1. python相关性分析特征过滤_特征选择-Filter过滤法后续(相关,互信息法)
  2. 当RabbitMQ使用Publish发布消息出现数据格式问题的解决方法
  3. 一个aov网用邻接矩阵表示_一起看看啥是图论算法-第一期:图的基本表示
  4. 【Java】单词倒序输出
  5. asp.net mvc webform和razor的page基类区别
  6. MySQL 深潜 - MDL 锁的实现与获取机制
  7. python 函数参数类型判断(判断类型)
  8. zabbix3 mysql_mysql分表-zabbix3.x
  9. 骑马与砍杀服务器修复,骑马与砍杀21.3.1公共版和热修说明 修复联机模式
  10. 【1291】数据结构上机测试4.1:二叉树的遍历与应用1 SDUTOJ
  11. 如何将access数据库导入到sql2005数据库中
  12. protected的继承方式有什么特点_酿酒:大曲酒有哪些配料方式?有什么特点?
  13. 【雕刻机】安装破解Artcam2017
  14. 嵌入式控制K60考试复习
  15. 电脑外放没声音但插入耳机有声音怎么回事
  16. nginx or apache前端禁收录,爬虫,抓取
  17. 文件上传进度条 c 语言,cgi 上传文件(c 语言) 进度条显示
  18. 7部必看的纪录片,每一部都堪称经典,让人叹为观止!
  19. On the burstiness of visual elements
  20. 等额本息还款和等额本金还款计算公式的推导

热门文章

  1. 用vue3.0.1如何搭建仿京东的电商H5项目呢?本文实战教你
  2. H264 无损压缩及编解码流程
  3. c语言怎么取字符串首字母,C语言 字符串首字母转换成大写简单实例
  4. 无线路由器无法在计算机上设置,无线路由器设置管理地址无法打开解决方法
  5. pandas不显示index_大熊猫 - 不在索引中(pandas - not in index)
  6. springbootTest为什么整合dubbo后无法使用
  7. SPI Flash芯片W25Q32英文版数据手册解读(二)---------存储器知识,寄存器
  8. MySQL高级---04
  9. 华为WeAutomate RPA产品首席规划师周为:企业数智化转型之路,RPA共创新价值
  10. 识别 零极点 matlab,matlab计算零极点分布图