• 大纲 Agenda
  • 第1章 课程介绍
    • 什么是机器学习
  • 第2章 认识机器学习
    • 从数据中找规律
    • 机器学习发展的原动力
    • 业务系统发展的历史
  • 第3章 机器学习的典型应用
    • 机器学习的典型应用
  • 第4章 数据分析和机器学习的区别
    • 机器学习和数据分析的区别
  • 第5章 常见的算法和分类
    • 机器学习算法分类
    • 机器学习常见算法
  • 第6章 解决问题

大纲 Agenda

  • 什么是机器学习
  • 生活中的机器学习
  • 数据分析和机器学习
  • 常用算法
  • 框架
  • Demo

第1章 课程介绍

什么是机器学习

  • 利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策
  • 确定性场景:明天太阳从东方升起
  • 不确定场景:明天公司的股票
  • 数据分析的主体是人,依靠人的经验和知识水平;机器学习的主体是机器,抛弃对人的依赖
  • 数据量越大,找出的规律越精准
  • 从数据中找规律-》数学规律,数学公式

第2章 认识机器学习

从数据中找规律

  • 机器学习的基石:概率论,数据统计
  • 传统统计学方式:抽样 -》描述统计 -》结论 -》假设检验

机器学习发展的原动力

  • 从历史数据中找规律,把这些规律用到对未来自动做出决定
  • 用数据代替expert
  • 经济驱动,数据变现

业务系统发展的历史

  • 基于专家经验
  • 基于统计————分维度统计
  • 机器学习————在线学习

第3章 机器学习的典型应用

机器学习的典型应用

  • 购物篮分析:纸尿布和啤酒

    • 关联规则
  • 用户细分精准营销:神州大众卡,全球通,动感地带,神州行

    • 聚类
  • 垃圾邮件

    • 朴素贝叶斯
  • 信用卡欺诈

    • 决策树
  • 互联网广告

    • ctr预估
  • 推荐系统

    • 协同过滤
  • 自然语言处理

    • 情感分析
    • 实体识别
  • 图像识别

    • 深度学习
  • 语音识别

  • 个性化医疗

  • 情感分析

  • 人脸识别

  • 自动驾驶


第4章 数据分析和机器学习的区别

机器学习和数据分析的区别

  • 数据特点

    • 交易数据 vs 行为数据
    • 少量数据 vs 海量数据
    • 采样分析 vs 全量分析
  • 解决业务问题不同

    • 数据分析:过去发生事情的总结
    • 机器学习:预测未来
  • 技术手段不同

  • 参与者不同

  • ………………


第5章 常见的算法和分类

机器学习算法分类

  • 有监督学习
  • 无监督学习
  • 半监督学习

机器学习常见算法

挖掘主题 算法 发表时间
分类 C4.5 1993
聚类 K-Means 1967
统计学习 SVM 1995
关联分析 Apriori 1994
统计学习 EM 2000
链接挖掘 PageRank 1998
集装与推进 AdaBoost 1997
分类 kNN 1996
分类 Naive Bayes 2001
分类 CART 1984

第6章 解决问题

  • 不以业务需求为目标的机器学习都是耍流氓

初识机器学习-理论篇相关推荐

  1. 【机器学习】Logistic Regression 的前世今生(理论篇)

    Logistic Regression 的前世今生(理论篇) 本博客仅为作者记录笔记之用,不免有很多细节不对之处. 还望各位看官能够见谅,欢迎批评指正. 博客虽水,然亦博主之苦劳也. 如需转载,请附上 ...

  2. 简单易学的机器学习算法——Latent Dirichlet Allocation(理论篇)

    引言 LDA(Latent Dirichlet Allocation)称为潜在狄利克雷分布,是文本语义分析中比较重要的一个模型,同时,LDA模型中使用到了贝叶斯思维的一些知识,这些知识是统计机器学习的 ...

  3. 机器学习原理篇:基础数学理论 Ⅱ

    机器学习原理篇:基础数学理论 Ⅱ 文章目录 机器学习原理篇:基础数学理论 Ⅱ 一.前言 二.概率论 三.数理统计 四.最优化理论 1.目标函数 2.线性规划 3.梯度下降法 五.思考 1.微积分的主要 ...

  4. 一步步教你轻松学朴素贝叶斯模型算法理论篇1

    一步步教你轻松学朴素贝叶斯模型理论篇1 (白宁超2018年9月3日17:51:32) 导读:朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果.所以很受欢迎,对 ...

  5. 手撕 CNN 经典网络之 VGGNet(理论篇)

    2014年,牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司一起研发了新的卷积神经网络,并命名为VGGNet.VGGNet是比AlexNet更深的 ...

  6. 手撕 CNN 经典网络之 AlexNet(理论篇)

    大家好,我是红色石头! 第一个典型的CNN是LeNet5网络,而第一个大放异彩的CNN却是AlexNet.2012年在全球知名的图像识别竞赛 ILSVRC 中,AlexNet 横空出世,直接将错误率降 ...

  7. 吴恩达《机器学习》学习笔记一——初识机器学习

    吴恩达<机器学习>学习笔记一 一. 什么是机器学习? 二.监督学习 三.无监督学习 初识机器学习 这是个人学习吴恩达<机器学习>课程的一些笔记,供自己和大家学习提升.第一篇内容 ...

  8. 决策树 随机森林 xgboost_从决策树到随机森林理论篇从人话到鬼话:看不懂来找我麻烦...

    从决策树产生的一些列的问题,过度到随机森林: 全文大概要阅读10分钟: 随机森林算法范畴 监督学习分类算法,基模型是由决策树组成 决策树 决策树模型与学习 特征选择 决策树生成 决策树剪枝 CART算 ...

  9. 机器学习应用篇(八)——基于BP神经网络的预测

    机器学习应用篇(八)--基于BP神经网络的预测 文章目录 机器学习应用篇(八)--基于BP神经网络的预测 一.Introduction 1 BP神经网络的优点 2 BP神经网络的缺点 二.实现过程 1 ...

最新文章

  1. RHCT 模拟题库及答案
  2. 如何防止锚标签上的默认值?
  3. python装饰器-究竟什么是装饰器?python中的装饰器介绍
  4. 深入理解多线程(五)—— Java虚拟机的锁优化技术
  5. 开发和编程是一样的吗?区别有哪些?
  6. Javascript基础回顾 之(二) 作用域
  7. 网络七大趋势 媒介将很快彻底消失
  8. python职位应该叫什么_从事什么职位的人适合学习Python​?
  9. 美国62%智能音箱用户都使用了语音购物,连鹦鹉都忍不住了
  10. 读写文件RandomAccessFile
  11. The Greatest C++ project
  12. 激活navicat提示rsa public key not find的问题
  13. tensorflow目标检测API实现血细胞图像识别和计数
  14. The project description file (.project) for 'xxx' is missing.
  15. JDK8 stream流的骚操作
  16. 云计算实验室建设方案分享
  17. python如何求解微分方程_用Python数值求解偏微分方程
  18. 数字音频总线A2B开发详解二十:ADAU1701做的功放板的音效(26个例程)(第一部分)
  19. 扫雷,潜伏者(python)
  20. IPU到底是个什么鬼?

热门文章

  1. 达梦数据库DCA培训课程总结
  2. 混合开发之仿微信朋友圈
  3. 单点登录技术:微软Passport单点登录协议和自由联盟规范
  4. 全国计算机等级考试过关条件,谈全国计算机等级考试二级过关心得经验(1)...
  5. 公共关系礼仪实务章节测试题——公共关系概述(三)
  6. 硬件描述语言VHDL之并行语句基本使用介绍
  7. 使用RPM打包QT程序
  8. qml 不刷新 放大还原_耳放攻略2020版|提升耳机音质,怎么买才不坑?手把手教你买...
  9. 如何用ipad或者是iphone来无线投屏到电视机
  10. 【东营seo诊断公司】SEO优化经验分享 如何成为一个合格的SEOer?