作者:Kannan Chandrasegaran

这里是另一家创业公司的聚会,你靠在吧台上,一边喝着小酒。这样的夜晚你只考虑自己,尽情享受社交活动。

偶然间,一个声音从你耳边传来。

“他们绝对是机器学习的创业公司。”

谈话声消失了。

“他们仍然在使用统计NLP吗?复发性神经网络似乎是一种趋势。”

谈话声再次消失。

机器学习像病毒一样迅速传播,你惊讶的发现这几分钟内,吧台上的每个人都在讨论机器学习。

过去你曾听说过这个术语,谁没有听说过呢?机器学习是一种潮流,毫无疑问,它是人工智能的未来。

问题是,你没有一点关于它的想法。

你放下酒杯转身离开,今晚将是不眠之夜。

世界末日

最开始听说的机器学习机器人,是代替蓝领完成工作。

然后,我们发现机器人开始抢白领的饭碗。

在我们失业的将来,会发现这些机器人在我们背后聊天。

可能在闲聊那些懒惰的失业的人类。

机器学习在如此多的场景被谈及,但却很难被准确定义,翻越查找得到的是抽象的原理解释,高频拼字游戏的词语,以及由数学和代码组成的一堵墙。

你只想知道什么是机器学习,为什么它是一个伟大的想法,顺便了解一点它是如何工作的。坦白的说,你只想搞清楚身边那些流行词汇的意思,这些词汇就像中学课堂上该死的单词,每个人都在使用它们,但你有一种感觉没有人知道它真正的意思。

开始潜入

所以机器学习,像AI?

这是一个很好的开始,我们都知道人工智能的含义。我们虽然在思考不同的事情,但可以肯定的是思考的都是有价值的想法。

人工智能(AI)是研究构建做出“智能”决策的系统。

基本上如果电脑能做出一些似乎有点聪明的事儿,我们就会给它贴人工智能的标签。

举一个常见的例子,电脑游戏通常会出现智能的Boss角色,他们跟随我们,并且他们的行为方式让游戏变成一种挑战。这就是AI的例子。

通过给予AI一些列的规则,游戏的发展可以实现,跟谁玩家,如果玩家正在射击,寻找掩护,如果玩家停止射击,尝试击毙玩家。规则越多,游戏将会越智能。

问题是电脑游戏的规则是有限的,玩家仅限于一些特定的操纵,而操作水平完全由开发者设计。所以那些似乎真的很智能的出色的AI特征,就是由开发者设计的规则组成。

并不是所有的问题都可以用规则解决

比如说用一台电脑来检测这是不是狗的照片。

如何为这个任务定义规则呢?

尝试设想一下需要哪些类别的规则。

狗有四条腿?

狗是白色的?

狗有皮毛?


这是众所周知的座椅。

电脑视觉问题,比如识别一个对象,是相当复杂的。但我们的大脑却能直观的分辨出。所以设计出明确的规则非常困难。

进入机器学习

我们不能建立识别狗狗的系统,却能建立学习识别狗狗的系统。

这里有上千张图片,其中一些是狗的图片,一些不是。系统能学习可以定义为狗的照片的规则。

机器学习是研究构建做出“智能”决策的系统。

关键字”学习”去区分机器学习与其他人智能不同的地方。

“既然机器可以学习规则,那么显然,规则是已存在的,不必费劲便能找到它们。”

完全正确,如果竭尽全力我们可以开发基于规则的狗狗检测大作,它是包含所有可能情景的上千条规则,这是一件漂亮的事情。

那么,倘若现在需要一个能识别包含食物图片的系统呢?好吧,我们将抛弃之前所有的从头开始,以前的规则都不适用。


“出色的识别技术,热狗也是狗。”

一个可以学习识别对象的系统,通过使用食物图片而不是狗狗图片,可以被训练为识别食物。

这就是机器学习的魅力。与其去明确一系列规则,不如让机器灵活的去学习和适应。

保持真实

现在更像是我们建立了一个活生生的、能不断学习的,并能让它通过与小狗一起玩耍从而教它识别狗的机器。然后再教它可爱和爱,并希望说服它不要起义把我们灭了,是吧?

现实情况并没那么复杂,我们希望机器可以智能决策,通常建立在预测的基础上,所以从这样的问题开始:人类是怎样预测的?

这里有一个很好的例子来说明我们怎样预测,可能在中学的科学课堂上就做过。

比如做实验,你需要收集数据,然后绘制成图。


实验>数据>图形

x轴表示改变的值,y轴便是测量的结果,然后绘制趋势线(或者最佳线)。

这条线便是最好的数据模型。

因为有这条线,所以可以做出预测。你可以选择没有测量过的重量,在x轴上观察,然后从y轴上预测弹簧的长度。

使用数据建立模型,然后通过模型进行预测。

如果编程可以完成这些步骤,那么恭喜:这就是机器学习。

发现线性模型并借此进行预测,这完全是机器学习技术,我们称之为线性回归。

将模型编程写入系统,系统便能对这个弹簧进行预测。但如果不编写新的程序,它便无法对其他弹簧进行预测。

如果我们让程序完成线性回归本身,同时学习模型,这才是机器学习。

我们不提供模型,而是让机器去学习模型。

巫师戏法

举个例子来形容那边是:

机器学习并不神秘。

我们并不是建立拥有自我意识可以学习任何东西的机器,弹簧模型程序不会学习识别狗狗。


即便是你,弹簧狗。

我们建立的系统是可以学习特定类型的模型,那个我们所忽略的模型。

几乎每个机器学习系统都会以下这些事儿:

系统给出基于模型的输出结果,对输出进行评估,以确定它有多糟糕,然后更新模型,使未来的输出变得更好。

建立可以完成对特定问题不断循环(评估->更新->输出->评估)的系统,机器学习便是这么一门艺术。

输出的复杂性取决于问题本身,它可能只是来自于聊天机器人的文本响应,或者是无人驾驶中是否踩刹车的一个决定。

真实的模型可能是像弹簧问题的线性模型,可能是更复杂的基于统计和概率的模型。或者是设计模拟人类大脑工作的神经网络。

不管细节是什么,几乎每个机器学习系统都是这样循环的运行。每次循环,系统都提升一点点。经过上千次甚至百万次循环,便可以得到已学会比人类更好完成任务的系统。

丰富多彩的应用程序,以及解决程序问题所需的技术,都是机器学习与许多其他领域交叉的重要原因,也是现在为什么机器学习是如此激动人心的话题。

总结

建立机器学习系统是复杂的,但要搞懂机器学习并不难。

所以去征服那个创业公司的聚会吧,抛出那些新发现的流行词汇。你只需要再沉浸几年,到时候相信也会有机器人来帮你做这些事。

写给非技术人员的机器学习指南相关推荐

  1. 面向开发人员的机器学习指南1

    现如今,大多数的开发人员都听说过机器学习,但是当他们试图寻找捷径来学习这些技术时,却有很多人都对机器学习中的一些抽象概念望而却步,诸如回归.无监督学习.概率密度函数和其他许多定义.如果诉诸于书本,代表 ...

  2. 写给非技术人员评估技术同事的参考

    原文:顾露(@顾露-Gu_Lu) http://gulu-dev.com/post/2015-11-05-tips-for-non-programmers 先说两句 这个易燃易爆的话题,其实俺是不敢写 ...

  3. 3个问题,1套非技术人员的AI方法论 | 哈佛商业评论最新热文

    雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI 这是一篇写给非技术人员的AI专栏. 给那些有意在公司组织.管理中寻求高效的人,那些希望走向管理岗位的人. 这篇<哈佛商业评论> ...

  4. 技术人员和非技术人员如何写出优质博客?-涵子的个人想法

    大家好,我是涵子.今天,我们来沉重的聊聊一个大家都很关心的一个问题:技术人员和非技术人员如何写出优质博客? 目录 前言 初写博客,仰望大师 中段时期,无粉无赞 优质博客,涨粉涨赞 优质内容从何而来 优 ...

  5. 给人类的机器学习指南

    原文地址:Machine Learning for Humans���� 原文作者:Vishal Maini 译文出自:掘金翻译计划 本文永久链接:https://github.com/xitu/go ...

  6. 机器学习指南_机器学习-快速指南

    机器学习指南 机器学习-快速指南 (Machine Learning - Quick Guide) 机器学习-简介 (Machine Learning - Introduction) Today's ...

  7. 写给NLP研究者的编程指南

    点击上方↑↑↑蓝字关注我们~ 参加 2019 Python开发者日,请扫码咨询 ↑↑↑ 作者 | 赤乐君,日本某大手研发部门的NLP工程师.关注关系抽取与知识图谱的相关研究. 来源 | 赤乐君的知乎专 ...

  8. 长文综述:给生物学家的机器学习指南

    来源:集智俱乐部 作者:Joe G. Greener, Shaun M. Kandathil等  译者:赵雨亭  审校:陈斯信  编辑:邓一雪 导语 过去几十年,生物数据集的规模与复杂性大幅增长,这使 ...

  9. 阿愚呱呱作为一个非技术人员,是如何做到不到3年时间成为RPA行业的一个头部IP的?

    Part1RPA帮入门训练营操作手册(问题集锦) 1禁用edge浏览器再重启 1.win+R (win是键盘最左边Ctrl和Alt之间的按键) 2.输入msconfig 3.启动 4.打开任务管理器 ...

最新文章

  1. [zz]ZeroMQ 的模式
  2. 11月第三周.COM增13.8万 ×××域名.XXX减9个
  3. linux 修改 ko文件内核版本号
  4. Unable to get repr for<class‘torch.Tensor‘>
  5. jumpserver-v2.9.2离线安装
  6. python每隔半个小时执行一次_一篇文章教你用Python抓取微博评论
  7. python输出para关键词占比_使用python操作word
  8. 小白学前端之:JavaScript null 和 undefined 的区别
  9. 文库系统 文库网站建设仿百度文库 道客巴巴 豆丁
  10. 第二章-FPGA的概要-《FPGA的原理与结构》
  11. 彻底解决阿里云图床上传图片,图片不显示问题
  12. 区块链的未来发展前景
  13. 2023年东南亚用户比较喜欢的社交媒体平台有哪些?
  14. 跨境运营培训做亚马逊广告要注意什么
  15. Bit Vector算法
  16. artTemplate-3.0(与项目实际结合)
  17. java 中结束程序方法
  18. 高中教学有计算机课吗,谈高中信息技术课教学
  19. sql盲注如何修补_如何修复SQL注入漏洞
  20. 项目中的有趣题目 -- 吃饺子问题

热门文章

  1. 苹果出了新手机,我却盯上了他的手机壳
  2. 图灵科普系列丛书封面有奖征集(贴图送书)
  3. 第一次全面揭示世界软件巨人微软致胜的技术奥秘
  4. Generative Adversarial Text to Image Synthesis --- 根据文字描述生成对应的图片
  5. 图像处理算法之瘦脸及放大眼睛
  6. 理解神经网络,从简单的例子开始(2)使用python建立多层神经网络
  7. 脚踏实地,自强不息——清华大学大数据软件团队2021年度先进个人风采展示
  8. 荐书 | 10 本机器学习电子书,美版 Kindle 免费读
  9. 数据分析显示,疫情下数据科学家的薪水几乎未受影响
  10. 英雄联盟如何指挥团战?AI帮你做决策(附资源)