一、统计机器学习的研究内容

网络 算法 机器 优化 概率 统计
数据 矩阵 信息 模型 推理
获知识 靠学习

We are drowning in information and starving for knowledge. -John Naisbitt

Data -> Model -> Knowledge

二、机器学习与应用统计学对比

ML STATISTICS 备注
Networks Graphs Models 网络、图/模型
Weights parameters 权重/参数
learning fitting or estimating 学习/拟合、估计
generalization 泛化 Test set 可信度
superised learning regression/classification 回归 分类
unsuperised learning density estimating clustering 聚类

三、Data Science的三个能力

  • infrastructure 底层架构

  • coding 代码能力

  • math (解决问题的能力)

统计机器学习–SML:

A field that bridges computation and statistics, with ties to information theory,
signal processing,algorithm, control theory, and optimization theory。

SML = Matrix +Optimization+Algorithm+statistics

矩阵+优化+算法+统计,本质是一个最优化问题

N个数据 每个数据有P个特征

X = (
X11 X12 … X1P,
X21 X22 … X2P,

Xn1, Xn2 … Xnp
)

X1 = (X11 X12 … X1P)

1.降维 X1^P --> X1^Q 由P维降到Q维

线性降维

  1. 聚类

3.分类

binary
x1 -> input
x2 -> output

分类问题,数据分三类:
1.训练集
training data

模型+参数
e(y–>f(x,a))+c P(b)

2.validation data

验证数据估c

  1. 测试数据(只有输入)

4.regression 回归

y 属于R
回归是一个特殊的分类问题

5.Ranking

四、机器学习的基本方法:

1.频率派
The frequent.st approach views the model params as unknown
constants and estimates them by matching the model to the training data
using an appropritate metric.

(Xi,Yi)
least square estimation 最小二乘估计

i->n (Yi-Xi*a)^2

最大似然估计

高斯分布

2.Bayesiam Approach
y~N(XT*a,b2)

统计机器学习-1-统计机器学习基础相关推荐

  1. 数据挖掘,机器学习,统计学习的区别与联系

    这三个领域或学科交叉和重叠部分很多,数据挖掘,机器学习和统计学习的概念一直有或多或少的混淆,希望同样有我这样的困惑的朋友读完下面的文字能够清晰一些. 数据库提供数据管理技术,机器学习和统计学提供数据分 ...

  2. 个人认为不错的句子(part1)--机器学习是统计减去任何对模型和假设的检验

    学习笔记,句子来源于各种书籍和视频,不限种类 一些不错的句子 有些鸟儿注定是关不住的, 因为它们的每一片羽毛都闪耀着自由的光辉. 看见的不用去相信,看不见的才要去相信. 原则永远有例外 To para ...

  3. 机器学习与统计建模 —— 差异和联系

    相同点 1.相同的目标:从数据中学习,核心都是探讨如何从数据中提取人们需要的信息或规律. 2.相同含义的常见术语: 不同点 1.不同的学派: 机器学习(Machine Learning, ML)是一门 ...

  4. 如何理解机器学习和统计中的AUC?

    1.如何理解机器学习和统计中的AUC? 首先,在试图弄懂AUC和ROC曲线之前,一定,一定要彻底理解混淆矩阵的定义!!!混淆矩阵中有着Positive.Negative.True.False的概念,其 ...

  5. 统计学习:现代机器学习

    统计学习:现代机器学习 统计学习 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,统计学习也称为统计机器学习.当前大部分机器学习也都指的是统计机器学习. 特点 以 ...

  6. 一.统计学习(统计机器学习)

    自嗨 本人目前是一名统计学在读本科生,统计学作为当代火爆的一门专业,在生活中也发挥了很多重要的作用,目前的大数据.预测等等都需要用到统计学的知识.因此,我决定在csdn上面也更新一些关于统计学的专栏. ...

  7. 【Python|Kaggle】机器学习系列之Pandas基础练习题(五)

    前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出-   自我介绍 ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计 ...

  8. 三万字机器学习项目整理(基础到进阶)

    如果你是学生.计算机领域的工作者,我强烈建议你学习.掌握机器学习,我不敢说它是最简单的(机器学习的确很简单),但是掌握机器学习一定是性价比最高的. 本文用浅显易懂的语言精准概括了机器学习的相关知识,内 ...

  9. 【Python|Kaggle】机器学习系列之Pandas基础练习题(四)

    前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出-   自我介绍 ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计 ...

  10. 机器学习与大数据基础知识(一)

    大数据时代究竟改变了什么? 改变的是思维 增加了数据重要性:数据资源--->数据资产(增值) 改变了方法论:基于知识的理论完美主义--->基于数据的历史经验主义 改变了数据分析: 统计学( ...

最新文章

  1. [POJ2104]K-th Number(区间第k值 记录初始状态)
  2. 阿里P9大佬总结必备的算法和工具,被10万算法工程师点赞
  3. css命名规范和书写规范
  4. 转: eclipse 快捷键列表(功能清晰版本)
  5. 异步加载js的三种方法
  6. GetCurrentProcessID、OpenProcessToken、LookupPrivilegeValue、AdjustTokenPrivileges
  7. wex5 app应用 定时退出
  8. 一、基础篇--1.1Java基础-包装类的装箱和拆箱
  9. 如何快速搭建自己的阿里云服务器(宝塔、Xshell、Xftp配置)
  10. 自定义C语言头文件书写格式
  11. 电商后台管理系统(一)
  12. java libtorrent_基于libtorrent最简单的BT下载程序 | 学步园
  13. 大学四年恍然若梦,一直走在路上
  14. 【原创】将RGB图像转换到CMY空间
  15. 纯净版windows8安装包下载
  16. 卷积神经网络中feature map是什么
  17. AtomicBoolean意义何在
  18. 他,10年软件开发经验,告诉你30岁后的程序员如何成功转型?
  19. C#网络编程复习资料
  20. 小程序使用彩色字体图标

热门文章

  1. C# ChartControl
  2. C++算法之遗传算法及实现
  3. 学习《软件评测师教程》
  4. 微信【PC电脑版】消息提示音怎么还原
  5. silverlight自定义安装客户端插件
  6. 数据库系统工程师真题及详解(2015~2021)
  7. python抢商品_python爬虫,抢小米抢购,
  8. Android 获取系统签名 并使用系统签名
  9. Linux命令行下WEP密码破解(通用,也可非BT平台)
  10. 第十二届蓝桥杯模拟赛Python组(第一期)