本文科普了机器学习方面的知识,简单介绍了机器学习可以做什么,以及如何做的。以下是译文。

计算机应该为人类解决问题。传统的方法是“编写”所需的程序,换句话说,就是我们教电脑问题解决的算法。该算法详细描述了解决问题的过程,就像食谱一样。很多任务都可以用算法来描述。例如,在小学里,我们学习了数字加法算法。当涉及到要快速、完美地运行这种算法时,计算机比人类更胜任这个工作。

然而,这个问题解决的过程是有局限性的。我们如何识别一张猫的照片呢?这个看起来很简单的任务却难以用一种算法来描述。让我们稍等片刻,仔细想想。即使是简单的说明(如“有四条腿”或“有两只眼睛”)也有其缺点,因为这些特点可能会被隐藏,或照片可能只显示了猫的一部分。如果我们遇到识别腿或眼睛的任务时,那与识别猫一样的困难。

这正是机器学习展现其实力的地方。计算机不需要开发算法来解决问题,而是使用示例来学习算法本身。我们用样本来训练计算机。对于识别猫这个例子,我们需要使用大量的标注了猫的照片来训练系统(监督学习)。通过这种方式,算法会发生进化,继而成熟,并最终能够识别出陌生图片上的猫。

事实上,在这种情况下,计算机通常不会学习经典程序,甚至都不会学习模型中的参数,例如网络中的边缘权重。

在这种情况下,被称为深度学习的人工神经网络学习方法得到了巨大的成功。深度学习是一种特殊的机器学习,反过来又是人工智能的一门学科,是计算机科学研究的主要分支。

许多与练习有关的问题更倾向于属于“识别猫”这个类别,而不是“数字加法”,因此,很难用人类编写的算法来解决这些问题。这些问题通常是在某些数据中识别模式,例如识别图像中的对象、语言中的文本或交易数据中的欺诈行为。

虽然机器学习的原理并不新鲜,但目前深受大众的追捧。这主要有三个原因:首先,用于应用和训练的大量数据的可用性(“大数据”);其次,我们现在拥有巨大的计算能力,特别是在云端;第三,一系列的开源项目使得每个人或多或少会使用一些算法。

机器学习不能代替传统编程,而是对传统编程的补充。它提供了一些工具,使得我们能够解决迄今为止难以甚至不可能解决的很多类问题。总而言之,这些给我们带来了新的机会,而现有的系统也越来越多地被改造并加入了机器学习功能。

遵循某种模式的重复操作就是一个典型的例子。假设有一个计算机程序,你可以通过点击一系列复杂的菜单来使用它的一百个功能,但你每天只主动地使用其中的某些功能。

在每个领域都可以找到更多的例子:针对个别学生(特别是“大型开放式在线课程”,即MOOC)定制学习教材、疾病的早期诊断、在线营销目标群体、客户流失、自动识别数据质量问题,或通过约会服务匹配用户个人信息。

由于Spark拥有很多先进的工具,它(集成在Hadoop中)已经在机器学习领域成为领先的大数据框架。 Talend也正向着这个目标发展,并且通过建模能够抽象出一个更高的层次。建模可以降低复杂度,同时还会弱化与发展迅速并且门槛较高的基础技术之间的依赖关系。

只有少数专家需要真正了解机器学习方面的算法细节。但是,如果每个人都能理解机器学习相关概念的话也是有好处的,比如知道机器学习是从示例中学习模式,并且能够应用到新的数据集上。最终,机器学习扩大了机器可以解决问题的类别,从而实现自动化:具体来说就是通过决策来实现。一方面,我们可以通过自动化的决策,将机器学习应用在我们的业务或圈子中。另一方面,我们自己本身就是一个数据源,其他的机器可以对我们进行分析并优化他们自己的业务。

总而言之,我想给大家留下这样一幅画面:计算机现在不仅能够遵循明确的指令,还可以通过例子进行学习。根据要解决的问题的不同,某个方法可能比另外一个更合适。然而,当这两个方法以某种方式结合起来使用的话,最终能为自动化带来更多的机会。

干货丨有关机器学习每个人都应该了解的东西相关推荐

  1. 有关机器学习每个人都应该了解的东西

    原文:What Everyone Should Know About Machine Learning 作者:Gero Presser 翻译:雁惊寒 摘要:本文科普了机器学习方面的知识,简单介绍了机器 ...

  2. 干货丨关于机器学习那些你不知道的“民间智慧”

    机器学习算法可以通过从例子中推广来弄清楚如何执行重要的任务. 本文总结了机器学习研究人员和从业人员学到的8个关键经验教训,包括要避免的陷阱,重点问题并回答了一些常见的问题.在本文中分享了这些经验教训, ...

  3. 干货丨大规模机器学习框架的四重境界(经典长文,值得收藏)

    作者:carbon zhang 1. 背景 自从google发表著名的GFS.MapReduce.BigTable三篇paper以后,互联网正式迎来了大数据时代.大数据的显著特点是大,哪里都大的大.本 ...

  4. 干货丨入门机器学习,从搞懂这8大经典算法开始

    在机器学习领域,"没有免费的午餐"是一个不变的定理.简而言之,没有一种算法是完美的,可以作为任何问题的最佳解决方案.认清这一点,对于解决监督学习问题(如预测建模问题)尤其重要.我们 ...

  5. 干货丨各种机器学习任务的顶级结果(论文)汇总

    小编在 Github 上发现了一个良心项目:RedditSota 统计了各种机器学习任务的最顶级研究成果(论文),方便大家索引查阅. 项目地址:https://github.com//RedditSo ...

  6. 为什么现在那么多人都在网上买东西,都不去实体店买了?

    1.网上买的东西可以7天无理由退货,而且免费赠送运费险. 2.实体店的东西一经售出概不退换! 3.同样一种商品,实体店的售价要比网店贵很多. 4.网上的东西品类齐全,供买家选择的余地大. 5.而实体店 ...

  7. 干货丨先搞懂这八大基础概念,再谈机器学习入门

    翻译 | AI科技大本营 参与 | 林椿眄 准备好开始AI了吗?可能你已经开始了在机器学习领域的实践学习,但是依然想要扩展你的知识并进一步了解那些你听过却没有时间了解的话题. 这些机器学习的专业术语能 ...

  8. 为什么这么多人都学不会Java,找不到Java工作?还不是方式不对

    现在有很多人想转行学习Java,原因只有一个,想要拿到更高的薪资.而确实如此,在大部分岗位中程序员的薪资确实是比较高的,而且行业的上升空间会相对大一些,有更多的创业机会. Java程序员的工资分布大概 ...

  9. 为什么这么多人都学不会Java,找不到Java工作?在我看来还不是你方式不对!

    现在有很多人想转行学习Java,原因只有一个,想要拿到更高的薪资.而确实如此,在大部分岗位中程序员的薪资确实是比较高的,而且行业的上升空间会相对大一些,有更多的创业机会. Java程序员的工资分布大概 ...

最新文章

  1. 涉及位操作的算法辑录
  2. C++实现Hash表
  3. vue 解决跨域 调试_Electron-vue解决跨域
  4. ubuntu gcc安装总结
  5. js的apply方法使用详解,绝对NB
  6. [Bugku CTF——Pwn] pwn2
  7. [攻防世界 pwn]——CGfsb
  8. Python 原生爬虫
  9. ios开发ios9新特性关键字学习:泛型,逆变,协变,__kindof
  10. B75经典门户商业版discuz模板
  11. 安装centos7后不能联网
  12. Nginx的配置使用,启动、重启、关闭,以及路径配置
  13. 关于android中PendingIntent.getBroadcase的注册广播
  14. 台达PLC解密次数限制
  15. VS2010 0xC000041D:用户回调期间遇到未经处理的异常
  16. 如何将照片裁剪为圆形?教你一招图片裁剪的技巧
  17. java 去掉pdf文字_Java 解除PDF文档保护密码
  18. python:savgol_filter的简单使用
  19. Android Hook 实战--替换第三方sdk的类
  20. Storm-电商实时交易风控系统

热门文章

  1. 纪念小柴昌俊 | 中微子天体物理学的诞生
  2. 图灵5月书讯:阅读是对自己沉默的爱
  3. MongoDB权威指南
  4. TensorFlow入门(三)多层 CNNs 实现 mnist分类
  5. IntelliJ IDEA WEB项目的部署配置
  6. 深度学习难分样本挖掘(Hard Mining)
  7. 独家 | 数据科学家指南:梯度下降与反向传播算法
  8. 【ICLR2022】分布外泛化的不确定性建模
  9. 视觉深度伪造检测技术综述
  10. 干货 | 手把手教你用115行代码做个数独解析器!(附代码)