统计学习方法--笔记(1)
学习理由:趁着研一的下半期刚开始有空闲的时候,打算开始学习朋友上学期介绍的李航《统计学习方法》,自己本身对于数学有着不一样的感情,所以,一旦跟自己专业相关的数学自己还是很感兴趣的读一读,学习学习。很多时候,光看书不记笔记的话,久了以后有不常用的话,看了也忘了。所以自己开始写博客记录自己的学习过程,也同时监督自己的学习。
第1章 统计学习方法概论
1.1 统计学习的基本概念
1、统计学习的定义
统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用对数据进行预测与分析的一门学科。统计学习也称为统计机器学习(statistical machine learning)。
2、统计学习的特点
(1)统计学习以计算及网络为平台,是建立在计算机及网络之上的。
(2)统计学习以数据为研究对象,是数据驱动的学科。
(3)统计学习的目的是对数据进行预测与分析
(4)统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析
3、统计学习的对象
统计学习的对象就是数据(data)。它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,然后又回到数据的分析与预测当中去。
数据是多样的,包括存在于计算机及网络上的各种数字、文字、图像、视频、音频数据以及它们的组合。
统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。PS:同类数据是指具有某种共同性质的数据,例如:英文文章、互联网网页、数据库里的数据等。由于它们具有某种统计规律性,所以可以用概率统计方法来加以处理。
3、统计学习的目的
统计学习用于对数据进行预测与分析来获取新的知识,能够提高计算机某些性能最终使计算机更加智能。其通过构建概率统计模型实现。统计学习总的目标就是考虑学习什么样的模型和如何学习模型,以使模型能对数据进行准确的预测与分析,并同时也要尽可能地提高学习的效率。
4、统计学习的方法
统计学习的方法是基于数据构建统计模型从而对数据进行预测与分析。
统计学习的组成:(1)监督学习(supervised learning) (2)非监督学习(unsupervised learning) (3)半监督学习(semi-supervised learning) (4)强化学习(reinforcement learning)
实现统计学习方法的步骤如下:
(1)得到一个有限的训练数据集合
(2)确定包含所有可能的模型的假设空间,即学习模型的集合
(3)确定模型选择的准则,即学习策略
(4)实现求解最有的算法,即学习的算法
(5)通过学习方法选择最优模型
(6)利用学习的最优模型对新数据进行预测和分析。
1.2 监督学习
统计学习方法--笔记(1)相关推荐
- 统计学习方法笔记第二章-感知机
统计学习方法笔记第二章-感知机 2.1 感知机模型 2.2感知机学习策略 2.2.1数据集的线性可分型 2.2.2感知机学习策略 2.3感知机学习算法 2.3.1感知机算法的原始形式 2.3.2算法的 ...
- 李航-统计学习方法-笔记-1:概论
写在前面 本系列笔记主要记录<统计学习方法>中7种常用的机器学习分类算法,包括感知机,KNN,朴素贝叶斯,决策树,逻辑斯谛回归与最大熵模型,SVM,boosting. 课本还涉及到3种算法 ...
- 【统计学习方法笔记】——第二章 感知机
目录 前言 一.感知机模型 1.1 定义 1.2 几何解释 二. 感知机学习策略 2.1 数据集的线性可分 2.2 感知机学习策略 三.感知机学习算法 3.1 感知机学习算法的原始形式 3.2 算法的 ...
- 统计学习方法笔记 -- 概论
统计学习方法是基于训练数据构建统计模型,从而对数据进行预测和分析. 统计学习分为,监督学习(supervised learning),非监督学习,半监督学习和强化学习(reinforcement l ...
- 统计学习方法笔记(九)-最大熵原理及python实现
最大熵模型 最大熵模型介绍 最大熵模型原理 代码案例 案例地址 最大熵模型介绍 最大熵模型(maximum entropy model)可以用于二分类,也可以用于多分类.其是由最大熵原理推导实现的,所 ...
- 统计学习方法笔记(七)-线性支持向量机原理及python实现
线性支持向量机 线性支持向量机 定义 线性支持向量机 线性支持向量机学习算法 代码案例 TensorFlow 案例地址 线性支持向量机 实际场景中训练数据往往不是线性可分的,当训练数据近似线性可分时, ...
- 统计学习方法笔记(六)-非线性支持向量机原理及python实现
非线性支持向量机 非线性支持向量机 定义 非线性支持向量机 算法 非线性支持向量机学习算法 代码案例 TensorFlow 案例地址 非线性支持向量机 定义 非线性支持向量机 从非线性分类训练集,通过 ...
- 统计学习方法笔记(五)-线性可分支持向量机原理及python实现
支持向量机 支持向量机 线性可分支持向量机 最大间隔法 代码实现 案例地址 支持向量机 支持向量机(support vector machines,SVM)是一种二分类模型,它的基本类型是定义在特征空 ...
- 统计学习方法笔记(四)-最大熵模型原理及python实现
最大熵模型 最大熵模型 最大熵原理 最大熵模型 代码实现 案例地址 最大熵模型 最大熵模型(maximum entropy model)可以用于二分类,也可以用于多分类.其是由最大熵原理推导实现的,所 ...
最新文章
- 迁移学习之DenseNet121(121层),DenseNet169(169层),DenseNet201(201层)(图像识别)
- 分布式架构中异步的使用场景
- 若依前后端分离版怎样去掉登录验证码
- Hadoop之Hadoop数据压缩
- 用不同显卡训练gan的区别_面霜质地这么多,到底哪一种最好用?不同质地面霜有什么区别?...
- 每日一学:如何转换png图片为jpg图片
- HDU3791 二叉搜索树【二叉搜索树】
- BLE蓝牙协议栈杂谈
- Python 数据处理 | 详解缩尾处理(winsorize)和代码实践
- 如何查看、检测Windows XP-Windows10系统是否为正版
- Skyscrapers (hard version)
- Ubuntu 旅行日记 Day 1
- JAVA分解与合并文件函数_Windows WIM文件的分割,合并,瘦身操作
- 你怎么看欧阳娜娜空降阿里p8?
- 【Lqb T336】Cowboys
- 线性代数(行列式矩阵向量)
- 求水仙花数字(指一个三位数的各位数立方和等于该数字本身)
- 计算机格式化磁盘6,装机必学:硬盘分区、格式化通用方法大全
- 【毕业设计】18-基于单片机的数字直流电源设计(源代码工程+仿真工程+答辩论文+答辩PPT)
- 西瓜书学习(一)—决策树(上)