1 机器学习世界的数据

1.数据
数据整体叫数据集(data set)
每一行数据称为一个样本(sample)
除最后一列,每一列表达样本的一个特征(eature)
最后一列,称为标记(label)
第i个样本行写作X(i),第i个样本第j个特征值写作X(i),第i个样本的标记写作y(i)

2 机器学习的主要任务

机器学习的基本任务:
·分类
·回归

分类任务:二分类;多分类;多标签分类
回归任务
·结果是一个连续数字的值,而非一个类别
·如:房屋价格·市场分析·学生成绩·股票价格
·有一些算法只能解决回归问题
·有一些算法只能解决分类问题
·有一些算法的思路既能解决回归问题,又能解决分类问题

什么是机器学习

3 监督学习,非监督学习,半监督学习和增强学习

机器学习方法的分类
·监督学习
·非监督学习
·半监督学习
·增强学习

监督学习:
给机器的训练数据拥有“标记”或者“答案”
我们学习的大部分算法,属于监督学习算法:
·k近邻
·线性回归和多项式回归
·逻辑回归
·SVM
·决策树和随机森林

非监督学习
给机器的训练数据没有任何“标记”或者“答案”
非监督学习的意义
1对没有“标记”的数据进行分类-聚类分析
2对数据进行降维处理
·特征提取:信用卡的信用评级和人的胖瘦无关?
·特征压缩:PCA
降维处理的意义:方便可视化
3异常检测

半监督学习
一部分数据有“标记”或者“答案”,另一部分数据没有。
更常见:各种原因产生的标记缺失
通常都先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测。

4 批量学习,在线学习,参数学习和非参数学习

机器学习的其他分类:
在线学习和批量学习(离线学习)
参数学习和非参数学习

批量学习

·优点:简单
·问题:如何适应环境变化?解决方案:定时重新批量学习
·缺点:每次重新批量学习,运算量巨大;在某些环境变化非常快的情况下,甚至不可能的。

在线学习

·优点:及时反映新的环境变化
·问题:新的数据带来不好的变化?解决方案:需要加强对数据进行监控
·其他:也适用于数据量巨大,完全无法批量学习的环境。

参数学习
一旦学到了参数,就不再需要原有的数据集

非参数学习
·不对模型进行过多假设
·非参数不等于没参数

机器学习--基础算法--机器学习基础相关推荐

  1. java程序员基础算法_java基础算法

    冒泡排序 图解 编码实现 public class Sort { public static void main(String[] args) { //通过冒泡排序给当前的数字进行排序(升序) int ...

  2. 《白话机器学习的数学》基础知识梳理 基于python的代码实现

    写在前面 这本书很适合我这个机器学习小白,从数学基础开始,用自己的话凝练总结,慢慢整理.未经授权,禁止转载!如需转载,请与我联系. 第一章:开始 机器学习初识 机器学习的基础理论和算法并不是新出现的, ...

  3. 机器学习初学者手抄本:数学基础、机器学习经典算法、统计学习方法等

    机器学习怎么学?当然是系统地学习了.没有时间这么办呢?利用碎片时间学习!很多人一天要花 2 个小时通勤,通勤路上有很多时间看手机.于是我把一些机器学习的基础知识做成了在线的机器学习手册,只需打开微信收 ...

  4. 数学基础、机器学习经典算法、统计学习方法,这份机器学习在线手册来帮你...

    机器学习怎么学?当然是系统地学习了.没有时间这么办呢?利用碎片时间学习!很多人一天要花 2 个小时通勤,通勤路上有很多时间看手机.于是我把一些机器学习的基础知识做成了在线的机器学习手册,只需打开微信收 ...

  5. 机器学习-SVM算法

    机器学习-基础知识 机器学习-线性回归 机器学习-逻辑回归 机器学习-聚类算法 机器学习-决策树算法 机器学习-集成算法 机器学习-SVM算法 文章目录 支持向量机 1. 间隔与支持向量 1.1. 点 ...

  6. 【机器学习基础】机器学习算法中分类知识总结!

    译者:张峰,Datawhale成员 本文将介绍机器学习算法中非常重要的知识-分类(classification),即找一个函数判断输入数据所属的类别,可以是二类别问题(是/不是),也可以是多类别问题( ...

  7. 【机器学习入门】机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)...

    Datawhale 作者:尹晓丹,Datawhale优秀学习者 寄语:首先,简单介绍了生成模型和判别模型,对条件概率.先验概率和后验概率进行了总结:其次,对朴素贝叶斯的原理及公式推导做了详细解读:再次 ...

  8. 机器学习算法的基础知识

    机器学习算法的基础知识 1.评估指标 2.偏差与方差(过拟合与欠拟合) 3.正则化(解决过拟合) 4.梯度下降算法(算法优化方式) 5.数据不平衡 1.评估指标 预测值 0 1 实际 0 TN FP ...

  9. 【机器学习】十大机器学习基础算法

    十大机器学习算法入门 近年来,机器学习与人工智能已广泛应用于学术与工程,比如数据挖掘.计算机视觉.自然语言处理.生物特征识别.搜索引擎.医学诊断.检测信用卡欺诈.证券市场分析.DNA序列测序.语音和手 ...

最新文章

  1. 突破安全狗防注入及上传的一些思路
  2. java小程序死机_求解,刚写的小程序,一运行我机器就死机
  3. 用python做加法_Python不用加减乘除做加法
  4. 学python对数学要求高吗_人工智能的小男孩 大专学历的人没有数学基础想学习python技术未来能往大数据或人工智能方向进行职业发展吗?...
  5. oracle实现序列,oracle中创建序列和自增长列的实现方式
  6. UML 中extend和include的区别
  7. 通过RSS订阅、邮件转发自动同步多个Blog
  8. IOS 8.0 适配应用图片设计
  9. Black Hat | PE Tree:BlackBerry 发布PE文件开源逆向工具
  10. node.js连接数据库(mysql)
  11. 2021年软件测试工具总结——测试管理工具
  12. 后台开发 vs App应用开发?
  13. 梦成真——一个普通学校计算机系学生的出国梦
  14. xpath提取招标网站的项目编号
  15. 1g内存编译android,如何让Android手机1G内存就“够用”?
  16. TFS(Taobao File System)团队CODE协作工具
  17. 微信小程序如何获取高清用户头像
  18. 如何提高工作激情,打造狼性团队
  19. Basic Authorization 认证方法
  20. mac 时间机器备份到windows共享文件遇到的问题及解决记录

热门文章

  1. 穿越山谷的英伟达 会成为元宇宙最重要的基础设施吗?
  2. 木兰编程当事人最新回应!谁为国产换皮透支信用买单
  3. PIXHAWK2.4.8飞控如果做双罗盘校准
  4. 计算机网络知识汇总(十万字超详细)
  5. TCP/IP four-storey model
  6. SAP-MM:物料采购订单的客制化开发与对应打印/预览的配置
  7. 南京三只松鼠java_又出新模式?三只松鼠南京首家品牌集合店开业
  8. 天下数据浅谈大数据和大规模数据的区别
  9. CodeForces - 366C Dima and Salad (01背包)
  10. NOIP 2001 一元三次方程求解(二分||盛金公式)