人类一直试图让机器具有智能,也就是人工智能(Artificial Intelligence)。从上世纪50年代,人工智能的发展经历了“推理期”,通过赋予机器逻辑推理能力使机器获得智能,当时的AI程序能够证明一些著名的数学定理,但由于机器缺乏知识,远不能实现真正的智能。因此,70年代,人工智能的发展进入“知识期”,即将人类的知识总结出来教给机器,使机器获得智能。 无论是“推理期”还是“知识期”,机器都是按照人类设定的规则和总结的知识运作,永远无法超越其创造者,其次人力成本太高。于是,一些学者就想到,如果机器能够自我学习问题不就迎刃而解了吗!机器学习(Machine Learning)方法应运而生,人工智能进入“机器学习时期”。机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。机器学习最大的突破是2006年的深度学习。深度学习是一类机器学习,目的是模仿人脑的思维过程,经常用于图像和语音识别。深度学习的出现导致了我们今天使用的(可能是理所当然的)许多技术。当你问你的iPhone关于今天的天气时,你的话语会用一种复杂的语音解析算法进行分析。如果没有深度学习,这一切都是不可能的。

机器学习与统计区别

机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。

通常学习一个好的函数,分为以下三步:

1、选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型。

2、判断一个函数的好坏,这需要确定一个衡量标准,如回归问题一般采用欧式距离,分类问题一般采用交叉验证函数。

3、找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。

机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。这意味着,与其显式地编写程序来执行某些任务,不如教计算机如何开发一个算法来完成任务。有三种主要类型的机器学习:监督学习、非监督学习和强化学习。

【案例分享】为了预测过程输出性能,提高客户满意度及产品质量,现从数据库中批量导入了2019年5月份生产报表,检测产品能否满足规格要求及相关生产环境,试分析影响产品质量的相关原因及预测结果。

本例共有9个变量,近5000个测试数据,其数据表如下:

在Minitab最新发布的版本Minitab19.2020中,除了可以将Python的脚本可以导入Minitab加载分析之外,还增加了机器学习的CART分析法。我们将上述案例用CART分析步骤如下:

  1. 统计---预测分析---CART分类,将响应和影响因子分别填入对应位置

2、点击 先验/成本,设置误分类成本

误分类成本就是判断错误的风险,例如,在医学影像检测中,把健康的人误诊为病人还不是最糟的情况,只要医生能对诊断结果进行复查,并把健康的这个人找出来就可以了。但反过来,未能诊断出真正的病人而不提供给他任何治疗,则就非常危险了。默认情况下,Minitab 使用相等的成本 1。

3、点击 验证,选择验证方法

设置模型验证:数据通常被分为训练数据和测试数据

训练数据(学习数据)通常被用来创建模型及评估模型的系数;测试数据通常检模型性能,通过测试数据得到拟合值,在用训练数据的数据和对应的拟合值进行比较来检验模型的预测性能通过验证,防止模型过度拟合若用同一组数据来拟合模型并评估模型的拟合优度,会导致过度拟合,过度拟合的模型并不能用于很好的预测…..

4、点击 选项,设置节点分裂方式

默认的节点分裂,选择 基尼

对所有对话框点击 确定,查看Minitab输出(部分):

默认情况下,Minitab 为误分类成本在最小误分类成本 1 个标准误内的最小树生成输出。也可以识别最优树的序列中探索其他树。终端节点数越多,模型就越复杂。

ROC曲线指受试者工作特征曲线 / 接收器操作特性曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。

点击ROC图左下角的预测,可以根据模型预测不同场景下的输出概率。

总结:

机器学习是目前业界最为火热的一项技术,从网上的每一次淘宝的购买东西,到自动驾驶汽车技术,以及网络攻击抵御系统等等,都有机器学习的因子在内,同时机器学习也是最有可能使人类完成“AI 梦”的一项技术,各种人工智能目前的应用,如微软小冰聊天机器人,到计算机视觉技术的进步,都有机器学习努力的成分。作为全球领先的统计分析软件,Minitab在2018年收购了SPM,并在Minitab.19.2020版中增加了预测分析的CART分类和CART回归功能,能够帮助我们了解一些机器学习的相关知识与概念,更好的理解为我们带来莫大便利技术的背后原理,以及让我们更好的理解当代科技的进程。

探索未知.预测未来------利用机器学习(CART)预测合格率相关推荐

  1. 20th Century Fox — 利用机器学习来预测电影观众

    文 / Miguel Campo-Rembado,SVP of Data Science, 20th Century Fox 和 Sona Oakley,Solutions Architect, Go ...

  2. 利用python预测未来疫情数据进行预测_根据数据预测/推断未来数据

    我对Python很陌生.我有一个数据集,我正在尝试使用numPy/sciPy来预测/推断未来的数据点.有没有一种简单的方法可以得到一个适合我当前数据的数学函数(比如正弦函数),然后我可以把新的值传递给 ...

  3. ai 预测未来股市_是预测分析的未来,人工智能将如何将其提升到一个新的水平...

    ai 预测未来股市 AI, machine learning, and deep learning have opened up opportunities to use predictive mod ...

  4. 用人工智能预测彩票,利用大数据预测彩票

    机器学习可以预测股票走向,靠谱么 谷歌人工智能写作项目:小发猫 有没有大佬能利用机器学习预测30天后股票涨跌情况啊,我实现不出来,头都大了? 考虑两个最简单的模型,第一个是趋势跟随,也就是正在上涨的股 ...

  5. python预测算整理集合 python根据历史数据,预测未来数据 神经网络时间序列预测python 销售收入分析与预测 神经网络预测控制 Python 源码 4个lstm做数据预测的案例源代码

    python 预测未来/神经网络/负荷/飞机零件故障/链路预测程序源码 1.python实现TensorFlow2股票股价预测(源码) 2.负荷预测(py thon例子,实时负荷预测,15分钟到4小时 ...

  6. python财务报表预测股票价格_机器学习股票价格预测从爬虫到预测-数据爬取部分...

    声明:本文已授权公众号「AI极客研修站」独家发布 前言 各位朋友大家好,小之今天又来给大家带来一些干货了.上篇文章机器学习股票价格预测初级实战是我在刚接触量化交易那会,因为苦于找不到数据源,所以找的一 ...

  7. 长江水质的评价和预测——未来10年水污染预测

    原创声明:未经作者允许,不得转载 题目来源:2005年_全国大学生建模比赛_A题 上一篇:<长江水质的评价和预测--主要污染地区> 1. 问题分析 本文的目标是:假如不采取更有效的治理措施 ...

  8. bp神经网络预测未来五年数据_预测 | 未来五年以太网收发器出货将达2.75亿只

    新闻导读 LC最新预测表明,从2021年到2025年间,供应商将售出2.75亿只以太网收发器,为其带来240亿美元的收入.但由于激烈的竞争.电信和企业网络投资的放缓,以及中美敌对升级可能导致中国云数据 ...

  9. python预测算法_Python机器学习:预测分析核心算法

    领取成功 您已领取成功! 您可以进入Android/iOS/Kindle平台的多看阅读客户端,刷新个人中心的已购列表,即可下载图书,享受精品阅读时光啦! - | 回复不要太快哦~ 回复内容不能为空哦 ...

最新文章

  1. 找出重复的数java_剑指offer:1.找出数组中重复的数(java版)
  2. 我的Python分析成长之路4
  3. D455 如何同时传输视频深度流和惯性单元IMU流?(双管道方法与调用回调方法)
  4. 详细解读神经网络十大误解,再也不会弄错它的事情原理
  5. MySQL主从复制(Master-Slave)与读写分离(MySQL-Proxy)实践 转载
  6. linux取消线程的原理,浅析 Linux 进程与线程
  7. 安装hadoop集群---resourcemanager和NameNode不在同一台机器上
  8. 图论 —— 网络流 —— 费用流 —— 基于 Dijkstra 的费用流
  9. php多站点共享用户表,php – Zend_Auth:允许用户登录到多个表/身份
  10. [转][.NET 基于角色安全性验证] 之一:基础知识
  11. java动态是如何根据实体建表_传入Java对象 自动创建动态表 并录入数据
  12. 纽微特荒唐事:都知道是找人顶罪,竟没人敢指正
  13. 干货分享:PDF分割合并工具免费哪个好用?
  14. 【机械制造基础部分(京玉海第二版)部分思考题】
  15. mac数字键盘错乱_苹果本键盘按键错位错乱是为什么?
  16. 基于java springboot的图书管理系统设计和实现
  17. PDF怎么在手机上删除不要的页
  18. vue-pdf 打印文字空白、每一页多一个空白页、电子签章不显示
  19. 计算机作业微波炉工作的原理,微波炉工作电路原理图及功能图解
  20. 图论 SCC(CCF高速公路)

热门文章

  1. 记录与学员交流后的十大心得体会
  2. Ubuntu Zsh乱码安装Powerline字体的方法
  3. sim卡人突然显示无服务器,手机突然间显示无SIM是怎么回事?可能是这些情况造成的!...
  4. 2013 编程之美挑战赛 仙剑5前传之璇光殿
  5. 智能手机2023:高端前攻、中端后守
  6. 关于我年久失修的C++的康复记录9
  7. fel 文档_HYB39S128160FEL-7
  8. html中prependid的作用,jQuery中append(),prepend()与after(),before()的区别
  9. 6.三层交换机交换端口改成路由端口(Cisco Packet Tracer)
  10. MongoDB查询条件 lt lte gt gte