1.机器学习的重要性
通过了解机器学习为什么重要,你可以认识到其价值,认识到其包含的策略方法、开放性问题。同样,对机器学习价值的认识,有助于我们将其作为一个强大的信息处理工具,有助于我们专注挖掘那些实现其价值的具体方法。
本文中,你将认识到,机器学习之所以重要,是因为它可以为复杂问题提供解决方案。相对于传统人工程序设计,这些解决方案更快、更准确、更具可扩展性。而这些复杂问题,想通过传统人工程序设计来解决通常并不可行。
复杂问题 :
计算机程序,使数据处理过程得以自动化。它通常是线性的、基于过程和因果逻辑的。
传统程序具有如下特点 :
1. 你知道或者可以控制程序的输入
2. 你可以设计程序如何实现其目标
3. 你可以设计程序作出何种决策,以及在什么条件下作出这些决策
4. 你可以测试你的程序,并相信由于输入、输出是已知的,并且所有条件都已执行,那么程序将实现其既定目标。
有些问题,你可以用计算机描述,却不能通过传统程序去解决。这类问题具有如下特点 :
1. 你无法界定输入数据的范围
2. 你无法设计出因果逻辑去实现程序的目标
3. 你无法设计出程序为实现其目标所作出的所有决策
4. 你可以收集输入数据的样例
这类问题对基于过程和因果逻辑的传统程序解决方案免疫。这听上去会比较奇怪,因为作为程序员,我们通常会觉得,只要我们能定义出一个程序的目标是什么,我们就能够根据因果逻辑设计出该目标如何被实现的方案。情况并非总是如此,继续看下面的例子。
垃圾邮件过滤例子 :
一个日常的决策问题例子是区分垃圾邮件和普通邮件。该问题便不适合使用手动定义的解决方案去解决 : 你会如何编写一个程序来过滤进入你电子邮件账户的邮件,以便判断将其放入垃圾邮件文件夹或者收件箱文件夹 ?
一个解决方案的过程,可能像这样 :
1. 收集一些我知道是垃圾邮件还是非垃圾邮件的例子。
2. 阅读这些邮件,并写下在两组邮件中发现的任何模式。
3. 试着将这些模式抽象成可以用于编程的更通用化的规则。
4. 寻找一些可以被准确、快速地被区分为垃圾邮件或普通邮件的邮件。
5. 给程序编写测试方案,以确保其能够做出精准决策。
6. 监视部署的系统,并关注它正在做出的决策。
我可以写个程序来完成上面这些事情,你也可以。这会花费很长时间,需要阅读很多邮件,需要很多深入的思考。要使系统变得足够可信赖以用于部署,需要大量的开发和测试时间。部署之后,由于程序中存在大量的规则硬编码,运行维护将是一场噩梦。
上述的解决方案过程的描述同时也适用于机器学习区分垃圾邮件和普通邮件过程。重点是,机器学习可以让处理过程自动化。
机器学习的重要性 :
机器学习提供了一些工具,可以根据数据自动做出决策,以实现某些目标或需求。如何更好决策和决策结果可解释是这个领域的主要研究方向。
我们专注于这些工具解决实际问题的能力和机器学习实践。汇总机器学习的重要性为 :
1. 自动化 (Automatically) : 机器学习方法可以看做是自动化生成算法的算法。
2. 快速 (Fast) :机器学习方法可以节约时间。相比如人工处理,机器学习方法可以更加快速分析样例数据并生成算法。
3. 精确性 (Accurate) : 由于自动化的特性,机器学习方法可以基于更多的数据、运行更长的时间,生成更精确的决策。
4. 规模 (Scale) : 机器学习方法可以给人工无法解决的问题提供解决方案。
总体上来说,传统人工程序设计基于因果逻辑,机器学习则基于概率统计和经验反馈。
1.机器学习的重要性相关推荐
- 数据准备技巧及其对机器学习的重要性
2020-09-03 14:12:13 "数据只是数千个故事的整合,讲述其中一些故事可以为数据赋予意义."--Chip & Dan Heath 本文最初发布于 Medium ...
- 机器学习特征重要性分析
方法 特征重要性是指特征对目标变量的影响程度,即特征在模型中的重要性程度.判断特征重要性的方法有很多,下面列举几种常用的方法: 1. 基于树模型的特征重要性:例如随机森林(Random Forest) ...
- 机器学习 | 特征重要性判断
聊聊feature_importances_ 1 背景 2 原理 2.1 文字版 2.2 公式版 2.3 面试遇到的问题 3 Python实现 3.1 解决mac下用jupyter绘图不显示中文的问题 ...
- 机器学习竞争其实是一场数据上的竞争
来源:网络大数据 摘要:人工智能的三大发展要素已经是老生常谈了.算法.算力和数据对机器学习的重要性和声望不亚于"谦哥"的喝酒.烫头和抽烟. 那些热衷竞争实施机器学习的公司现在惊讶地 ...
- Coursera公开课笔记: 斯坦福大学机器学习第十一课“机器学习系统设计(Machine learning system design)”
Coursera公开课笔记: 斯坦福大学机器学习第十一课"机器学习系统设计(Machine learning system design)" 斯坦福大学机器学习斯坦福大学机器学习第 ...
- 【赠书】金融领域可解释机器学习模型与实践
今天要给大家介绍的书是<可解释机器学习:模型.方法与实践>,涵盖了可解释机器学习前沿的研究成果及行业成功应用经验. 本书内容 本书分为三部分: 第一部分为背景,阐述黑盒模型存在的问题 ...
- 【机器学习基础】机器学习中必知必会的 3 种特征选取方法!
随着深度学习的蓬勃发展,越来越多的小伙伴开始尝试搭建深层神经网络应用于工作场景中,认为只需要把数据放入模型中,调优模型参数就可以让模型利用自身机制来选择重要特征,输出较好的数据结果. 在现实工作场景中 ...
- 从数学入手,3招打破机器学习的边界
全世界只有3.14 % 的人关注了 数据与算法之美 本文约2007余字,阅读需要约6分钟: 系统资料领取见文末: 关键词:人工智能,机器学习,深度学习,数学,学习建议 01.机器学习工程师的边界是什么 ...
- 史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(二)
谢谢你们.小夕昨晚又熬夜被发现了,谢谢对小夕的关心... 有你们陪着,小夕很幸运. 路人乙:"小夕,别人都说上完coursera上的那门机器学习课就已经入门机器学习了,可你又不这样认为.那你 ...
最新文章
- “寒冬”下的金三银四跳槽季来了,帮你客观分析一下局面
- Makefile(二)
- gitlab重置root密码
- 你用的那些开源项目可能已经被放弃维护!
- [转]Java实现定时任务的三种方法
- python--List extend()方法
- js中0.1+0.2 与0.3的对比
- java opts参数_JVM内存JAVA_OPTS参数说明
- raid卡组不同raid_Linux 软件阵列与低端硬件阵列卡性能对比
- 3G模块SIM5360E拨号上网
- git glo_TWOdW,2011年8月31日:作者,演讲者,开发商Andy Glover
- MQTT keepalive和reconnect
- P2298 Mzc和男家丁的游戏
- windows server2012安全配置—停用Guest帐号的方法
- matlab 里定义全局变量,常量
- oracle 11g rac suse,suse linux 11 + 多路径+udev+oracle11g rac
- 外盘国际期货招商:从股票书挑出来的精华
- 终端天线—2.IFA天线仿真
- conda env create -f environment.yml报错ResolvePackageNotFound和Found conflicts的解决方案【已解决】
- 经典算法——筛选法求素数(素数筛选)