机器学习(二) 机器学习基础
一、机器学习世界的数据
机器学习基础概念
关于数据
二、机器学习的主要任务
监督学习: 机器学习的基本任务,具体可以做什么?
1.分类任务。
二分类,多分类:识别图片,数字识别等
2.回归任务。
结果是一个连续数字的值,而非一个类别;
回归任务可以划分成分类任务。
三、监督学习,非监督学习、半监督学习和增强学习
监督学习:
给机器的训练数据拥有‘标记’或者‘答案’。
例如:
1.图像已经拥有了标定信息
2.银行已经积累了一定的客户信息和他们信用卡的信用情况
3.医院已经积累了一定的病人信息和他们最终确诊是否患病的情况
4.市场积累了房屋的基本信息和最终成交的金额
...
我接下来写的基本都是监督学习的算法:
K邻近
线性回归和多项式回归
逻辑回归
SVM
决策树和随机森林
非监督学习:
给机器的训练数据没有任何‘标记’或者‘答案’。
例如:
对数据进行降维处理
特征提取:信用卡的信用评级和人的胖瘦无关?
特征压缩:PCA(在尽量少的损失信息的情况下将高维的特征想想压缩成低维的特征向量)
半监督学习:
一部分数据有‘标记’或者‘答案’,另一部分数据没有。
更常见:各种原因产生的标记缺失。
通常都是先使用无监督学习手段对数据做处理,之后用监督学习手段做模型的训练的预测。
增强学习:
无人驾驶、机器人。
监督学习和半监督学习是基础。
四、批量学习、在线学习、参数学习和非参数学习
1.批量学习 Batch Learning
优点:简单
问题:如何适应环境变化?
解决方案:定时重新批量学习。
缺点:每次重新批量学习,运算巨大,在某些环境变化非常快的情况下,甚至不可能的。
2.在线学习 Online Learning
优点:即使反映新的环境变化。
问题:新的数据带来不好的变化?
解决方案:需要加强对数据进行监控。
其他:也适用于数据量巨大,完全无法批量学习的环境。
3.参数学习 Parametric Learning
利用原有数据集,找到参数,求得方程,不需要原来参数。
4.非参数学习 Nonparametric Lrearning
1. 不对模型进行过多假设。
2.非参数不等于没参数。
五、和机器学习相关的‘哲学’思想
数据即算法?
1.数据确实非常重要。
2.数据驱动
收集更多的数据
提高数据质量
提高数据的代表性
研究更重要的特征
奥卡姆的剃刀:
简单的就好。
到底在机器学习领域,什么叫做‘简单’
没有免费的午餐定理:
可以严格地数学推导出:任意两个算法,他们的期望性能事相同的!
具体到某个特定问题,有些算法可能更好。
但是没有一种算法,绝对比另一种算法好。
脱离具体问题,谈哪个算法好是没有意义的。
在面对一个具体问题的时候,尝试使用多种算法进行对比试验,是必要的。
其他思考?
面对不确定的世界,怎么看待使用机器学习进行预测的结果?
六、环境搭建
ANACONDA python一键安装环境
https://www.anaconda.com/ 官网 免费下载
IDE Pycharm
github.com/liuyubobobo/Play-with-Machine-Learning-Algorithms
我写的文章只是我自己对bobo老师讲课内容的理解和整理,也只是我自己的弊见。bobo老师的课 是慕课网出品的。欢迎大家一起学习。
机器学习(二) 机器学习基础相关推荐
- [Python从零到壹] 十二.机器学习之回归分析万字总结全网首发(线性回归、多项式回归、逻辑回归)
欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...
- 机器学习(二)线性模型---LR
机器学习(二)线性模型-LR 2.2 LR 2.2.1 基础 LR是一种二分类模型,属于线性模型的一种,是广义线性分类模型,采用极大似然估计,具有概率可解释性 条件概率: P(y=1|x) ...
- Python机器学习引言与基础知识储备
第一部分 机器学习入门 机器学习入门 第一部分 机器学习入门 1.1 为什么选择机器学习 1.1.1 机器学习能够解决的问题 1.1.2 熟悉任务和数据 1.2 为什么选择Python 1.3 sci ...
- 笔记|李沐-动手学习机器学习|CNN基础知识(视频19-23)
李沐-动手学习机器学习|CNN基础知识 卷积层(视频19) 从全连接到卷积(卷积算子) 进行图像识别的两个原则 如何从全连接层出发,应用以上两个原则,得到卷积 卷积层 二维交叉相关 二维卷积层 交叉相 ...
- 机器学习需要哪些基础知识?
机器学习需要一些基础知识,包括以下几个方面: 机器学习需要哪些基础知识? 数学基础:机器学习涉及到很多数学知识,如线性代数.微积分.概率论和统计学等.这些数学知识是理解和应用机器学习算法的基础. 编程 ...
- 机器学习 二分类分类阈值_分类指标和阈值介绍
机器学习 二分类分类阈值_分类指标和阈值介绍_weixin_26752765的博客-CSDN博客 机器学习 二分类分类阈值_分类指标和阈值介绍_weixin_26752765的博客-CSDN博客
- 机器学习与数据挖掘: 基础概念
如何成为机器学习工程师 https://keras-cn.readthedocs.... http://www.tensorfly.cn/tfdoc... 机器学习 vs 数据分析 数据特点 数据分析 ...
- 机器学习算法的基础知识
机器学习算法的基础知识 1.评估指标 2.偏差与方差(过拟合与欠拟合) 3.正则化(解决过拟合) 4.梯度下降算法(算法优化方式) 5.数据不平衡 1.评估指标 预测值 0 1 实际 0 TN FP ...
- 吴恩达《机器学习》学习笔记十二——机器学习系统
吴恩达<机器学习>学习笔记十二--机器学习系统 一.设计机器学习系统的思想 1.快速实现+绘制学习曲线--寻找重点优化的方向 2.误差分析 3.数值估计 二.偏斜类问题(类别不均衡) 三. ...
最新文章
- python基础知识整理 第二节:容器(list tuple dict)
- ASP.NET MVC Display Mode 移动端视图 配置对微信内置浏览器的识别
- Java:Java的输入类Scanner
- 使用MySQL的LAST_INSERT_ID--转
- Visual Studio 2015 编译与使用Boost库进行文件与目录的操作
- 如何用excel筛选相似内容_Excel筛选你用好了么?别再下拉点点点了
- 哪些云计算企业能活下来
- Linux 下 离线下载服务部署 CCAA的安装使用
- Linux 下安装配置C/C++开发环境 Code::Blocks
- python花瓣长度和花瓣宽度散点图鸢尾花_Python可视化seaborn练习题
- selenium中录制拖拽动作
- node js 非阻塞io_Node Express JS:套接字IO模块示例
- 橙瓜发布2018网络小说风云榜年度榜,顶级大神作家的无声角逐
- 苹果笔记本mac系统如何安装虚拟机?crossover22
- 布加迪奇龙Blender雕刻、shading,并导入Three.js ,3DWEB模型【Three.js+Blender建模+web前端+可视化】
- ffmpeg 用于转换视频格式的各种命令行
- 由浅入深玩转华为WLAN—12安全认证配置(5)Portal认证,外置Protal服务器TSM对接
- 长时间 正在加载个人设置 开机很慢
- 群体创新技术/群体决策的几种类型
- 25000 字详解 23 种设计模式(多图 + 代码)
热门文章
- 银联手机支付控件官方使用指南(ios版)
- Zjh游戏(十七)发牌的处理
- 备战Noip2018模拟赛7(B组)T2 Pearl 数数
- Zjh游戏(二十二)单机玩家比牌
- restrict 外键约束_主外键和外键约束
- ARM 在Unity3D 中的美术优化解决方案 3.纹理
- 数量乘单价秋金额的计算机公式,“excle函数公式 数量乘单价“Excel表格中,总计栏怎么设置每一行的数量乘以金额的总和?求公式...
- python3基础教程-廖雪峰_Python3基础教程-廖雪峰[带标签完整版]
- 8086汇编 DEBUG命令详解
- pushlet实现服务器推技术