本文作者Andrej Karpathy,现任特斯拉人工智能负责人,曾任OpenAI研究专家。在斯坦福大学读博时师从李飞飞,主要研究方向是卷积神经网络结构、自然语言处理及它们在计算机视觉上的应用。 Karpathy认为,我们已经进入了软件2.0时代。

经常看到人们将神经网络称为“机器学习工具箱中的另一个工具”,我不太认同,这是一种只见树木不见森林的短浅理解。神经网络不只是另一个分类器,还是编写软件基本转变的开始——带领我们进入了软件2.0时代。

我们熟悉的软件1.0的“经典堆栈”是用Python、C++等语言编写的计算机显式指令。通过编写每一行代码,程序员在程序空间中识别性能好的特定点。

与1.0不同,软件2.0是用神经网络的权重编写的。因为涉及很多权重,直接在权重中编码很困难,因此程序员不参与代码编写工作。

在软件2.0中,我们为理想程序的行为规定了一些约束条件,并用计算资源搜索程序空间来满足它们。在神经网络示例中,我们将搜索限制在程序空间的一个连续子集里。

事实证明,现实世界中的大部分问题都有这样的特性,即收集数据比显式编程容易得多。未来大部分程序员无需维护复杂的软件库、编写复杂的程序,或者分析它们的运行时间。他们只负责收集、清理、操作、打标签、分析和可视化为神经网络提供信息的数据即可。

不过,软件2.0不会取代1.0。实际上,还需要大量1.0基础结构进行训练和推理,以“编译”2.0代码。但是,它将接管软件1.0的大部分工作内容。让我们通过一些正在进行的转变,了解1.0和2.0间的变化。

视觉识别:过去做视觉识别相关任务时,用到的是特征工程加一点点SVM之类的机器学习方法。特斯拉开始开发更强大的在ConvNet架构中的图像分析程序由来已久,最近开始在架构上进行搜索。

语音识别:曾涉及大量的预处理、高斯混合模型和隐马尔可夫模型,但今天几乎全部由神经网络构成。

语音合成:之前曾有有各种各样的缝合机制,但今天最先进的模型是大型的卷积网络,可以产生原始音频信号输出(如WaveNet)。

机器翻译:之前通常采用基于短语的统计技术,但神经网络正迅速占据主导地位。我最喜欢的一个架构是在多语言环境下进行的,在弱监督(或完全不受监督)的条件下,一个模型可以从任何源语言转换到任何目标语言。

机器人技术:曾经需要将问题分解成多个模块,如感知、姿态估计、规划、控制、不确定性建模等,并在中间表示中使用显式表示和算法。但最近加州大学伯克利分校和谷歌的研究表明,软件2.0或许能够更好地代表所有这些代码。

游戏:围棋程序起源可以追溯到好几十年前,但AlphaGo Zero已成为游戏中最强大玩家。我希望在其他领域也能看到类似的结果,比如DOTA 2和星际争霸等游戏。

心细的朋友发现,上面很多研究都涉及到谷歌的工作。这是因为,谷歌目前处于将自身大部分软件重新编写为2.0版的前沿。“一个模型来管理它们”的观念是谷歌早期构想的草图,在那里,各领域的统计强度将被合并成一致的对世界的理解。

软件2.0的优劣势

为什么我们更喜欢将复杂的程序变成软件2.0的形式?

原因很多。让我们来看看软件2.0(请自动联想卷积网络)和软件1.0(请联想生产级的C++代码库)的好处。总体来说,2.0版的软件具有以下优势:

计算均匀:典型的神经网络归结为一阶只需两步操作,即0(ReLU)矩阵乘法和阈值。与经典软件指令集相比,2.0版软件具有明显的异源性和复杂性。你只需为一小部分核心计算原语提供软件1.0实现(例如矩阵乘法等),就能保证操作正确性。

更容易制成芯片:由于神经网络的指令集相对较小,更容易被制成芯片,例如自定义ASIC芯片、神经形态芯片等。当低功率的智能无处不在时,世界将发生改变。小巧而便宜的芯片可以装载着预先训练的卷积网络、语音识别器和WaveNet语音合成网络等,它们都集成在一个你可以附加在任何东西的小型芯片中。

恒定的运行时间:典型的神经网络前向传播的每一次迭代每秒能够执行的浮点运算的平均次数(FLOPS)都相同。你的代码通过扩展的C++代码库执行不同的路径的可变性为0。当然,你也可以用动态计算图,但执行流通常仍然受到极大的限制。

使用常量内存:与上面所说的运行时间相关,因为没有动态分配的内存,所以不存在交换到磁盘或在代码中搜索泄露内存的可能性。

高度可移植性:与经典二进制或脚本相比,2.0版在任意计算配置上运行矩阵相乘序列要容易得多。

非常敏捷:如果需要把你的C++代码的运行速度提升一倍,效果可以稍微差一点点,这会是一件非常麻烦的事,在软件1.0里,需要为了新标准而对系统进行重大调整。然而,在2.0版本中,我们可以删掉网络中一半的通道(channel)再训练——这时它的运行速度提升了一倍,效果不太好。如果的数据足够多,计算力足够强,你可以通过增加更多的通道和训练让程序更好用。

模块可以整合成一个最优整体:1.0时代,软件通常被分割为通过公共函数、API或端点进行通信的模块。然而,如果两个2.0模块最初是单独训练的,我们能够轻松在整个过程中进行反向传播。想象一下,如果你的web浏览器能自动自动重新设计低级别的系统指令实现高效加载网页,这该有多好。你很幸运,2.0版本可以实现这个场景。

容易上手:我喜欢开玩笑说深度学习很简单。平日用到的基本概念包含线性代数、微积分、Python和一些CS231n讲座上的知识。更准确的说法是,软件2.0的堆栈很容易理解,但却不容易掌握。

比想象的还要好:最重要的是,神经网络比会为你或我能想到的垂直领域带来最好的代码,目前的研究已经涉及到与图像/视频、声音/语音和文本有关的内容。

2.0版也有它自己的缺点。有时你甚至不知道你搭建失败了,它们可以“于无声中失败”。比如,如果训练数据中悄悄混进了一些偏差,你通常很难正确地进行分析,把它们从大量数据中检查出来。

写在最后

如果你把神经网络看作是一个软件堆栈而不仅仅是分类器,你就会发现它们有巨大的优势和潜力来改变软件。

从长远来看,软件2.0在开发AGI的过程中越来越清晰,是未来编程的主流。

可能你想问软件3.0是什么样子的,我也不知道,这完全取决于AGI。

最后,附原文连接:

https://medium.com/@karpathy/sofatware-2-0-a64152b37c35


关于机器学习 你不得不思考这些问题

 来源:Gero Presser   人工智能头条

                                             

在过去的几个月中,笔者与很多的决策者交流了有关人工智能特别是机器学习方面的问题。其中有几名高管已经被投资者询问了有关他们在机器学习(Machine Learning)方面的战略,以及在哪些方面运用了机器学习。那么这个技术课题为什么突然会成为公司董事会讨论的话题呢?

计算机应该为人类解决问题。传统的方法是“编写”所需的程序,换句话说,就是我们教电脑问题解决的算法。该算法详细描述了解决问题的过程,就像食谱一样。很多任务都可以用算法来描述。例如,在小学里,我们学习了数字加法算法。当涉及到要快速、完美地运行这种算法时,计算机比人类更胜任这个工作。

然而,这个问题解决的过程是有局限性的。我们如何识别一张猫的照片呢?这个看起来很简单的任务却难以用一种算法来描述。让我们稍等片刻,仔细想想。即使是简单的说明(如“有四条腿”或“有两只眼睛”)也有其缺点,因为这些特点可能会被隐藏,或照片可能只显示了猫的一部分。如果我们遇到识别腿或眼睛的任务时,那与识别猫一样的困难。

这正是机器学习展现其实力的地方。计算机不需要开发算法来解决问题,而是使用示例来学习算法本身。我们用样本来训练计算机。对于识别猫这个例子,我们需要使用大量的标注了猫的照片来训练系统(监督学习)。通过这种方式,算法会发生进化,继而成熟,并最终能够识别出陌生图片上的猫。

 事实上,在这种情况下,计算机通常不会学习经典程序,甚至都不会学习模型中的参数,例如网络中的边缘权重。这个原理可以与我们大脑(包含了神经元)的学习过程相比较。像大脑一样,与传统程序不同,这种具有边缘权重的网络几乎不可能被人类所理解。

 在这种情况下,被称为深度学习的人工神经网络学习方法得到了巨大的成功。深度学习是一种特殊的机器学习,反过来又是人工智能的一门学科,是计算机科学研究的主要分支。早在2012年,谷歌研究小组成功地训练了一个拥有16000台计算机,并从1000万段YouTube视频中识别猫(和其他对象类别)的网络。他们采用的就是深度学习技术。

 许多与练习有关的问题更倾向于属于“识别猫”这个类别,而不是“数字加法”,因此,很难用人类编写的算法来解决这些问题。这些问题通常是在某些数据中识别模式,例如识别图像中的对象、语言中的文本或交易数据中的欺诈行为。


这里有一个简单的例子,我们来看一下预测性维护。想象一下许多传感器正在发送数据流,有时,某些机器会发生故障。现在的难题就是学习导致故障的数据流的模式。一旦学会了这种模式,就可以在正常操作期间识别出这种模式,从而预防潜在的故障。

虽然机器学习的原理并不新鲜,但目前深受大众的追捧。这主要有三个原因:首先,用于应用和训练的大量数据的可用性(“大数据”);其次,我们现在拥有巨大的计算能力,特别是在云端;第三,一系列的开源项目使得每个人或多或少会使用一些算法。

 

机器学习不能代替传统编程,而是对传统编程的补充。它提供了一些工具,使得我们能够解决迄今为止难以甚至不可能解决的很多类问题。总而言之,这些给我们带来了新的机会,而现有的系统也越来越多地被改造并加入了机器学习功能。

遵循某种模式的重复操作就是一个典型的例子。假设有一个计算机程序,你可以通过点击一系列复杂的菜单来使用它的一百个功能,但你每天只主动地使用其中的某些功能。通过观察你平时点击的步骤,计算机可以学习预测你的下一步动作,从而提高你操作的效率。计算机通过“学习”这些重复的数据和对象,可以使得许多步骤自动化执行,从而加快了速度。

在每个领域都可以找到更多的例子:针对个别学生(特别是“大型开放式在线课程”,即MOOC)定制学习教材、疾病的早期诊断、在线营销目标群体、客户流失、自动识别数据质量问题,或通过约会服务匹配用户个人信息。

 

由于Spark拥有很多先进的工具,它(集成在Hadoop中)已经在机器学习领域成为领先的大数据框架。 Talend也正向着这个目标发展,并且通过建模能够抽象出一个更高的层次。建模可以降低复杂度,同时还会弱化与发展迅速并且门槛较高的基础技术之间的依赖关系。

只有少数专家需要真正了解机器学习方面的算法细节。但是,如果每个人都能理解机器学习相关概念的话也是有好处的,比如知道机器学习是从示例中学习模式,并且能够应用到新的数据集上。最终,机器学习扩大了机器可以解决问题的类别,从而实现自动化:具体来说就是通过决策来实现。这正是计算机学到的东西;它根据从训练数据积累到的知识,对新的数据做出决策。一方面,我们可以通过自动化的决策,将机器学习应用在我们的业务或圈子中。另一方面,我们自己本身就是一个数据源,其他的机器可以对我们进行分析并优化他们自己的业务。

总而言之,我想给大家留下这样一幅画面:计算机现在不仅能够遵循明确的指令(例如数字相加),还可以通过例子进行学习(例如通过训练样例来识别猫的图片)。根据要解决的问题的不同,某个方法可能比另外一个更合适。然而,当这两个方法以某种方式结合起来使用的话,最终能为自动化带来更多的机会。

原文:What Everyone Should Know About Machine Learning 

作者:Gero Presser 

编译:雁惊寒

分享朋友圈 也是另一种赞赏

The more we share, The more we have

 

欢迎加入数据君高效数据分析社区


加我私人微信进入大数据干货群:tongyuannow 












目前100000+人已关注加入我们

       

       








【软件2.0】软件2.0时代来了!特斯拉AI负责人说:神经网络正在改变编程相关推荐

  1. 软件2.0时代来了!特斯拉AI负责人说:神经网络正在改变编程

    原作:Andrej Karpathy 安妮 编译自 Medium 量子位 出品 | 公众号 QbitAI 本文作者Andrej Karpathy,现任特斯拉人工智能负责人,曾任OpenAI研究专家.在 ...

  2. 【转】寻找最好的笔记软件:海选篇 (v1.0)

    原文网址:http://blog.sina.com.cn/s/blog_46dac66f01000b55.html 序言: 我见过的多数软件爱好者,无论是资深用户,还是初级用户,都有一个梦想:找到最好 ...

  3. 当Web2.0进入企业——企业3.0软件3A完全评测

    当Web2.0进入企业--企业3.0软件3A完全评测 导读 当Web 2.0进入企业,并融合了即时通讯等网络工具以及思维导图等知识工具,企业3.0应运而生. 企业3.0是这样一种软件工具:是团队成员之 ...

  4. 当Web2.0进入企业——免费的企业3.0软件3A完全评测

    当Web2.0进入企业--免费的企业3.0软件3A完全评测 导读 当Web 2.0进入企业,并融合了即时通讯等网络工具以及思维导图等知识工具,企业3.0应运而生. 企业3.0是这样一种软件工具:是团队 ...

  5. 2023年最新水果DAW编曲软件fl studio21 macOS - 21.0.3.3036简体中文版免费下载支持苹果M1/M2处理器

    一直梦想制作自己的音乐(无论是作为一名制作人还是艺术家),你可能会想你出生在这个时代是你的幸运星.这个水果圈工作室和上一版之间的改进水平确实令人钦佩.这仅仅是FL Studio 21所提供的皮毛.你的 ...

  6. win7x64注册表显卡渲染速度_Geek3D GpuTest GUI(显卡测试软件)下载-Geek3D GpuTest GUI(显卡测试软件)免费版下载v0.7.0...

    Geek3D GpuTest GUI 能够对显卡的GPU.OpenGL进行基准压力的测试,而且测试完成也相当的快捷,功能强大,体积小巧,目前支持在windows 64位系统上进行测试,帮助用户检测显卡 ...

  7. 佳铁怎样传输程序_佳铁传输4.0工具下载|佳铁传输4.0软件 4.0 官方最新版

    佳铁传输4.0软件是一款支持与机床进行串口通信连接.还可以进行NC程序验证,显示详细的模拟运动轨迹,便捷实用,欢迎有需要的朋友前来jz5u下载使用. 佳铁传输软件特色 1.通信特性 WinDNC 系统 ...

  8. [PM Tools]软件项目进度跟踪表v4.0

    <软件项目进度跟踪表>适用于对公司多个项目进行管理的工具,通过科学的项目管理方法将整个表格分为项目概况和项目中各过程,可以对项目总体情况和各阶段进行单独管理.另外借助Excel强大的数据分 ...

  9. opencv4.5.0安装包_VB6.0软件安装包以及安装教程

    安装步骤: 1.鼠标右击软件压缩包,选择"解压到VB6.0中文企业版" 2.打开visual basic 6.0文件夹,鼠标左键双击SETUP.exe进入安装程序 3.在弹出的&q ...

最新文章

  1. 以太坊智能合约 Hexagon 存在溢出漏洞
  2. Opencv 找轮廓并画出相应的矩形
  3. 树莓派python gpio 模仿iic_Adafruit的树莓派教程:GPIO配置
  4. OpenCV3学习(1)——基本数据类型
  5. CodeSmith NetTier模板生成的代码框架用法 (转)
  6. 从css3书写顺序引出来的border-radius参数
  7. Idea(二) 解决IDEA卡顿问题及相关基本配置
  8. oracle 用户被锁定解决方法
  9. CentOS 6.5忘记root密码,怎么办?
  10. ContextCaptureMaster/Smart3D 集群简单配置
  11. java面试填空题 jsp_JSP面试题及答案
  12. LeetCode题解:猜数字大小
  13. 用python画简单的图形
  14. 程序员主流代码编辑器,你用过多少款?
  15. 【贪心+堆/模拟费用流增广】BZOJ4946 [NOI2017]蔬菜
  16. 加载java连接sqlserver驱动_sqlserverdriver配置方法 jdbc连接sqlserver
  17. 用英语表达“谢谢”,thank you,thank you very much的其他多种方式
  18. IO-BIO NIO
  19. A1056 Mice and Rice (25 分| queue用法,附详细注释,逻辑分析)
  20. 服务器通过笔记本共享网络连接外网

热门文章

  1. 哥哥教你学嵌入式 之 智芯科技 开发板 Z20K11x系列 教程(一)
  2. Traccar记录足迹-服务搭建及使用
  3. BIM技术越发成熟,项目利润从哪来?
  4. SpringCloud之消息总线组件及微服务网关
  5. 函数式编程中的副作用概念
  6. 如何用 ARKit 将太阳系装进 iPhone(二)
  7. python3 钉钉 加签名 钉钉群机器人巡检告警 脚本
  8. 长微博工具-长微博生成器-新浪长微博-腾讯长微博-长微博转换器
  9. 华为EMUI屏蔽更新
  10. 2022 Flutter 宣布发布 Windows 正式版