摘要: MATLAB开发运营团队深度解析何为机器学习,什么时候使用机器学习,如何选择机器学习算法,MATLAB到底能为机器学习提供怎样的便利?

机器学习是一种数据分析技术,让计算机执行人和动物与生俱来的活动:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预定方程模型。当可用于学习的样本数量增加时,这些算法可自适应提高性能。

一.机器学习为什么那么重要?

随着大数据应用增加,机器学习已成为解决以下领域问题的一项关键技术:

·         1.计算金融学,用于信用评估和算法交易。

·         2.图像处理和计算机视觉,用于人脸识别、运动检测和对象检测。

·         3.计算生物学,用于肿瘤检测、药物发现和 DNA 序列分析。

·         4.能源生产,用于预测价格和负载。

·         5.汽车、航空航天和制造业,用于预见性维护。

·         6.自然语言处理,用于语音识别应用。

更多数据、更多问题、更好的解答

机器学习算法能够在产生洞察力的数据中发现自然模式,帮助你更好地制定决策和做出预测。医疗诊断、股票交易、能量负荷预测及更多行业每天都在使用这些算法制定关键决策。例如,媒体网站依靠机器学习算法从数百万种选项中筛选出为你推荐的歌曲或影片。零售商利用这些算法深入了解客户的购买行为。

何时应该使用机器学习?

当你遇到涉及大量数据和许多变量的复杂任务或问题,但没有现成的处理公式或方程式时,可以考虑使用机器学习。例如,如果你需要处理以下情况,使用机器学习是一个很好的选择:

二.机器学习的工作原理:

机器学习采用两种技术:监督式学习和无监督学习。监督式学习根据已知的输入和输出训练模型,让模型能够预测未来输出;无监督学习从输入数据中找出隐藏模式或内在结构。

监督式学习:

监督式机器学习能够根据已有的包含不确定性的数据建立一个预测模型。监督式学习算法接受已知的输入数据集(包含预测变量)和对该数据集的已知响应(输出,响应变量),然后训练模型,使模型能够对新输入数据的响应做出合理的预测。如果你尝试去预测已知数据的输出,则使用监督式学习。

监督式学习采用分类和回归技术开发预测模型。

分类技术可预测离散的响应 — 例如,电子邮件是不是垃圾邮件,肿瘤是恶性还是良性的。分类模型可将输入数据划分成不同类别。典型的应用包括医学成像、语音识别和信用评估。

如果你的数据能进行标记、分类或分为特定的组或类,则使用分类。例如,笔迹识别的应用程序使用分类来识别字母和数字。在图像处理和计算机视觉中,无监督模式识别技术用于对象检测和图像分割。

用于实现分类的常用算法包括:支持向量机 (SVM)、提升 (boosted) 决策树和袋装 (bagged) 决策树、k-最近邻、朴素贝叶斯 (Naïve Bayes)、判别分析、逻辑回归和神经网络。

回归技术可预测连续的响应 — 例如,温度的变化或电力需求中的波动。典型的应用包括电力系统负荷预测和算法交易。

如果你在处理一个数据范围,或你的响应性质是一个实数(比如温度,或一件设备发生故障前的运行时间),则使用回归方法。

常用回归算法包括:线性模型、非线性模型、规则化、逐步回归、提升 (boosted) 和袋装 (bagged) 决策树、神经网络和自适应神经模糊学习。

小例子:使用监督式学习预测心脏病发作

假设临床医生希望预测某位患者在一年内是否会心脏病发作。他们有以前就医的患者的相关数据,包括年龄、体重、身高和血压。他们知道以前的患者在一年内是否出现过心脏病发作。因此,问题在于如何将现有数据合并到模型中,让该模型能够预测新患者在一年内是否会出现心脏病发作。

无监督学习:

无监督学习可发现数据中隐藏的模式或内在结构。这种技术可根据未做标记的输入数据集得到推论。

聚类是一种最常用的无监督学习技术。这种技术可通过探索性数据分析发现数据中隐藏的模式或分组。聚类分析的应用包括基因序列分析、市场调查和对象识别。

例如,如果移动电话公司想优化他们手机信号塔的建立位置,则可以使用机器学习来估算依赖这些信号塔的人群数量。一部电话一次只能与一个信号塔通信,所以,该团队使用聚类算法设计蜂窝塔的最佳布局,优化他们的客户群组或集群的信号接收。

用于执行聚类的常用算法包括:k-均值和 k-中心点(k-medoids)、层次聚类、高斯混合模型、隐马尔可夫模型、自组织映射、模糊 c-均值聚类法和减法聚类。

如何确定使用哪种机器学习算法?

选择正确的算法看似难以驾驭——需要从几十种监督式和无监督机器学习算法中选择,每种算法又包含不同的学习方法。

没有最佳方法或万全之策。找到正确的算法只是试错过程的一部分——即使是经验丰富的数据科学家,也无法说出某种算法是否无需试错即可使用。但算法的选择还取决于你要处理的数据的大小和类型、你要从数据中获得的洞察力以及如何运用这些洞察力。

下面是选择监督式或者无监督机器学习的一些准则:

·         1.在以下情况下选择监督式学习:你需要训练模型进行预测(例如温度和股价等连续变量的值)或者分类(例如根据网络摄像头的录像片段确定汽车的技术细节)。

·         2.在以下情况下选择无监督学习:你需要深入了解数据并希望训练模型找到好的内部表示形式,例如将数据拆分到集群中。

三.MATLAB机器学习:

你如何借助机器学习的力量,使用数据做出更好的决策?MATLAB 让机器学习简单易行。借助用于处理大数据的工具和函数,以及让机器学习发挥作用的应用程序,MATLAB 是将机器学习应用于你的数据分析的理想环境。

使用 MATLAB,工程师和数据科学家可以立即访问预置的函数、大量的工具箱以及用于分类、回归和聚类的专门应用程序。

MATLAB 可以做到:

·         1.比较各种方法,例如逻辑回归、分类树、支持向量机、集成方法和深度学习。

·         2.使用模型精化和缩减技术创建能够最好地捕捉预测能力的精确模型。

·         3.将机器学习模型集成到企业系统、集群和云中,并且将模型定位于实时嵌入式硬件。

·         4.为嵌入式传感器分析工具执行自动代码生成。

·         5.支持从数据分析到部署的集成工作流程。

本文由阿里云云栖社区组织翻译。

文章原标题《what is machine learning?》

作者:mathworks

译者:虎说八道,审校:。

原文链接


干货好文,请关注扫描以下二维码:


关于机器学习,你需要知道的三件事!相关推荐

  1. 人的一生有三件事不能等

    人的一生有三件事不能等 人的一生有三件事不能等 第一是"贫穷" 贫穷不能等,因为一但时间久了,你将习惯贫穷,到时不但无法突破自我,甚至会抹杀了自己的梦想,而庸庸碌碌的过一辈子... ...

  2. 世界上最浪费时间的三件事

    世界上最浪费时间的三件事 我问你,世界上最浪费时间的是什么事? 人人网?偷菜?魔兽世界? 不是,尽管它们排名也很靠前. 世界上最浪费时间的是三个单词:WORRY,BLAME,JUDGEMENT. 第一 ...

  3. 微信小程序:开发之前要知道的三件事

    2019独角兽企业重金招聘Python工程师标准>>> 微信之父张小龙在年初的那次演讲中曾表示:"我自己是很多年的程序员,我觉得我们应该为开发的团队做一些事情". ...

  4. 【杂谈】提升写代码效率不得不做的三件事

    想成为一个优秀的AI算法工程师必须要熟练使用Linux,这是学习AI的一个基础,如果你一直还在用Windows,那就很low了.本文我们聊聊提升写代码效率不得不做的三件事. 作者&编辑 | 汤 ...

  5. SAP HANA云平台YaaS,你不知道的三件事

    互联网圈大事小事天天有, 各大企业新闻每天轮番上演.这不,SAP在纽约宣布推出以hybris为主导的最新客户关系管理(CRM)解决方案,其中包括三款新产品:hybris Customer Experi ...

  6. 写了 15 年代码,总结出提升 10 倍效率的三件事

    [译者注]本文作者 Matt Watson 已经写了超过 15 年的代码,也由此总结出了提升 10 倍效率的三件事.Matt 表示,一个 10 倍效率的开发人员很快就知道了他们需要做什么,要问什么问题 ...

  7. java三件套_Java开发人员应该知道的三件事

    java三件套 对于那些长期关注JavaOne 2012会议的读者来说,这是一篇有趣的文章. 我最近对Java冠军Heinz Kabutz的采访引起了我的注意: 包括他的Java内存难题程序,从Jav ...

  8. Java开发人员应该知道的三件事

    对于那些长期关注JavaOne 2012会议的读者来说,这是一篇有趣的文章. 我最近对Java冠军Heinz Kabutz的采访引起了我的注意: 包括他的Java内存难题程序,从Java内存管理的角度 ...

  9. 学做三件事、三句话、三乐、三不要

    学做三件事 1 .学会关门 即学会关紧昨天和明天这两扇门,过好每一个今天,每一个今天过得好,就是一辈子过得好. 2.学会计算 即学会计算自己的幸福和计算自己做对的事情.计算幸福会使自己越计算越幸福,计 ...

  10. 什么叫中断隐指令,具体做哪三件事呢?

    中断隐指令:在中断响应中计算机会去做三件事,这三件事没有任何一条指令控制,都是自动去做的,所以叫中断隐指令. 具体做1.硬件关中断 2.保护断点 3.向中断服务程序的入口跳转.

最新文章

  1. 近期活动盘点:高管AI大数据能力研修班、英伟达初创企业展示开启报名
  2. 华为程序员频交Linux内核补丁遭质疑,管理员后续回应:承认贡献,但请不要琐碎提交...
  3. vue-router嵌套路由示例
  4. python字典顺序遍历_在Python中,如何按已排序的键顺序遍历字典?
  5. hdu1428(spfa与记忆化搜索)
  6. Oracle服务器修改IP后
  7. python 后10个元素_10 行 Python 代码写 1 个 USB 病毒
  8. Java-Exception异常
  9. 各种池化操作(包括组合池化)
  10. javascript 理解对象--- 定义多个属性和读取属性的特性
  11. 【Android】两种动画介绍(Tween动画、Frame动画)
  12. POJ1700 Crossing River
  13. 读《亿级流量网站架构核心技术》
  14. windows操作系统定时关机和取消定时关机命令
  15. 关于svn汉化包安装无效的解决办法
  16. mongoDB——readwrite操作
  17. Win10重装系统/迁移系统,教你如何简单快速删除原系统文件
  18. html5随鼠标移动动画,使用JS实现气泡跟随鼠标移动的动画效果
  19. 自己写编程语言-m语言
  20. 用户登录程序C语言实现

热门文章

  1. 内存条能4+8混插吗?_笔记本内存条双通道提升有多大?实测FORESEE,你知道好处在哪吗...
  2. java putifabsent_java8中Map的一些骚操作总结
  3. C++中类和对象的一些注意事项
  4. transactional注解的使用_Java:Spring @Transactional工作原理
  5. oracle和mysql通用建表语句_mysql建表语句到oracle怎么写?
  6. php sphinx api调用,php调用Sphinx
  7. 痛惜!年仅38岁,中科院研究员、博导周传不幸病逝!
  8. 告毕业生书——七剑送你下天山
  9. 解密五种AI筛选的“新冠”新药:能靶向病毒细胞侵入的蛋白酶
  10. 边打工边研究数学 泸州“农民数学家”出版15本著作