[提前声明]
文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章
写作不易,转载请注明,谢谢!
代码案例地址: ?https://github.com/Mydreamandreality/sparkResearch


快速入门机器学习

计算机科学之父 艾伦 ’ 图灵很早就曾预测,有一天,人们会带着电脑在公园散步,并且告诉对方,今早我的计算机讲了一个很有趣的事情

  • 机器学习的核心就在于:用算法解析数据,从中学习,然后对某些事物做出决定和预测,很显然,这代表着我们无需明确的编码来执行任务,而是教计算机如何开发算法来完成任务

  • 机器学习主要有四种类型:

    • 监督学习
    • 半监督学习
    • 无监督学习
    • 强化学习

监督学习:

  • 从给定的训练数据集中学习出一个函数,当新的数据到来,可以根据这个函数预测结果,监督学习的训练集要求是包括输入和输出,也可以说是特征和目标,常见的监督算法包括回归分析和统计分类

统计分类

  • 举个栗子,比如我们最常用到的垃圾邮箱过滤器,过滤器会分析之前标记为垃圾邮件的邮件,并且和新的邮件进行对比,如果达到某个百分比,则新的邮件也会被标记为垃圾邮件,拦截到邮箱的垃圾箱中,不像垃圾邮件的邮件会被归类为正常邮件,并且进行发送

回归分析

  • 在回归中,机器使用先前标注的数 据进行未来预测,比如天气应用,利用天气的相关历史数据,对一定范围内的天气进行预测

无监督学习:

  • 在无监督学习中,数据是未标注的,考虑我们现实中,大多的数据都是未标注的,所以这种算法特别的有用,常见的无监督算法包括聚类和降维

聚类

  • 聚类根据属性和行为对象进行分组,与分类不同,这些组不会提供给你,聚类把一个组划分成不同的子组,进行针对性营销

降维

  • 降维通过查找共性,减少数据集的变量,以此来识别趋势和规则\

半监督学习:

  • 介于监督学习与无监督学习之间

强化学习

  • 强化学习是机器学习中的一个领域,它强调如何基于环境而行动,逐步调整其行为,并且评估每个行动之后的回馈是正向还是负向的,以此获得最大的预期利益
  • 说的通俗一些,强化学习最典型的案例就是游戏,它和监督,无监督学习相反,强化学习不重视提供正确的答案和输出,举个栗子,如果我们在玩CS游戏,每次我从中路跳出去都会死,这给我的回馈是负向的,那么之后我就会调整我自身的位置,不去中路,去A大或者B沟,在这个之上,加入其它的算法,在游戏中机器就可以击败人类玩家

咦?你说的为什么很像人工智能AI呢,请看机器学习的定义↓

机器学习的定义

  • 机器学习是一门人工智能的科学,该领域的研究对象是人工智能
  • 机器学习是对能通过经验自动改进的计算机算法的研究
  • 机器学习是用数据或者以往的经验,以优化计算机程序性能的标准

机器学习是人工智能的一个分支,人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法

算法

如果想要完全入门机器学习,需要对一些关键的数学概念有基本了解,算法是必不可少的,涉及到一些线性代数,微积分,概率,统计等

  • 具体的机器学习算法有:[包括但不限于以下]
  • 构造间隔理论分布:聚类分析和模式识别
  • 人工神经网络
  • 决策树
  • 感知器
  • 支持向量机
  • 集成学习AdaBoost
  • 降维与度量学习
  • 聚类
  • 贝叶斯分类器
  • 构造条件概率:回归分析和统计分类
  • 高斯过程回归
  • 线性判别分析
  • 最近邻居法
  • 径向基函数核
  • 通过再生模型构造概率密度函数:
  • 最大期望算法
  • 概率图模型:包括贝叶斯网和Markov随机场
  • Generative Topographic Mapping
  • 近似推断技术:
  • 马尔可夫链
  • 蒙特卡罗方法
  • 变分法
  • 最优化:大多数以上方法,直接或者间接使用最优化算法

有基础的兄弟搞起来会很轻松,没基础的也不用怕
现在网上一大堆学习的资料,只要你下功夫啃一啃,总是能学会的
也可以关注一些公众号,自己每天刷一道算法题,慢慢提升自己,加油

下一章我们做一个机器学习的入门案例

一文读懂:快速入门机器学习,基础向相关推荐

  1. 人工智能(8)---一文读懂人工智能产业链:基础技术、人工智能技术及人工智能应用

    一文读懂人工智能产业链:基础技术.人工智能技术及人工智能应用 概要:针对人工智能产业链,主要有三个核心:基础技术.人工智能技术及人工智能应用,本文将从主要从这三个方面进行梳理 人工智能(Artific ...

  2. 干货!一文读懂人工智能和机器学习有什么关系

    人工智能的演变 符号人工智能 人工智能作为计算机科学的一个分支出现于 20 世纪 50 年代.它的两个主要目标是:1) 通过在计算机上建模和模拟来研究人类智能,以及 2) 通过像人类一样解决复杂问题来 ...

  3. 一文读懂人工智能产业链:基础技术、人工智能技术及人工智能应用

    原文:https://blog.csdn.net/zhangbijun1230/article/details/82183281 概要:针对人工智能产业链,主要有三个核心:基础技术.人工智能技术及人工 ...

  4. 一文读懂可解释机器学习简史,让你的模型再也不是“Black Box”

    来源丨新智元 编辑丨极市平台 近年来,可解释机器学习(IML) 的相关研究蓬勃发展.尽管这个领域才刚刚起步,但是它在回归建模和基于规则的机器学习方面的相关工作却始于20世纪60年代.最近,arXiv上 ...

  5. 一文读懂 快速掌握示波器使用及原理

    示波器是一种用途十分广泛的电子测量仪器.它能把肉眼看不见的电信号变换成看得见的图像,便于人们研究各种电现象的变化过程.示波器利用狭窄的.由高速电子组成的电子束,打在涂有荧光物质的屏面上,就可产生细小的 ...

  6. 网络编程懒人入门(十一):一文读懂什么是IPv6

    本文同时发布于"即时通讯技术圈"公众号,链接是:https://mp.weixin.qq.com/s/cS5xB2DrjF52rmz6EGVJ6A. 本文参考了公众号鲜枣课堂的&q ...

  7. 一文读懂机器学习中奇异值分解SVD

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 目录: 矩阵分解 1.1 矩阵分解作用 1.2 矩阵分解的方法一文 ...

  8. 即时通讯新手入门:一文读懂什么是Nginx?它能否实现IM的负载均衡?

    本文引用了"蔷薇Nina"的"Nginx 相关介绍(Nginx是什么?能干嘛?)"一文部分内容,感谢作者的无私分享. 1.引言 Nginx(及其衍生产品)是目前 ...

  9. 一文读懂机器学习中的模型偏差

    一文读懂机器学习中的模型偏差 http://blog.sina.com.cn/s/blog_cfa68e330102yz2c.html 在人工智能(AI)和机器学习(ML)领域,将预测模型参与决策过程 ...

最新文章

  1. 2021牛客暑期多校训练营1 I-Increasing Subsequence(期望dp+优化)
  2. jquery叠加页片自动切换特效
  3. PIE SDK矢量点生成等值线、面
  4. mapbox 将坐标转换成米
  5. Qt6 tesseract-ocr 截图识字
  6. 立体匹配 -- PSM-Net 网络模型代码剖析
  7. 如何用修灯泡解读IT行业
  8. canvas画一个圆锥
  9. 头像采集,学生照片信息采集器
  10. 如何增加微信朋友圈分享链接的小图片
  11. 什么是大小端?如何判断大小端
  12. 如何把flv转换成mp3格式 音频转换器哪个好
  13. qs美国排名计算机专业,2016年QS美国大学计算机科学专业排名
  14. CRM是什么?能提供什么服务?
  15. Visual Studio 2022
  16. AAA认证 - 3A认证
  17. [ lucene扩展 ] 自定义Collector实现统计功能
  18. 企业支付宝/个人支付宝支付收款码在线生成API源码
  19. Android的视频通话的Java代码
  20. 项目管理.StandMeeting站立会议

热门文章

  1. 如何运行从网上下载的iWatch项目详细步骤.
  2. 星速配资:煤炭概念股大幅拉升 看好投资机会
  3. 用户登录验证最多3次java_实现用户注册、登录、幸运抽奖功能,验证次数最多3次...
  4. 哈夫曼树的概念与特点
  5. 怎么用计算机求称呼,亲戚关系称呼神器 三姑六婆计算器
  6. 新媒体运营人怎么做粉丝运营
  7. 使用git同步本地和线上环境代码
  8. 王者荣耀段位计算器软件
  9. QQ音乐播放器部分笔记
  10. 电路分析基础笔记(一)基础知识