机器学习--基础算法--机器学习基础
1 机器学习世界的数据
1.数据
数据整体叫数据集(data set)
每一行数据称为一个样本(sample)
除最后一列,每一列表达样本的一个特征(eature)
最后一列,称为标记(label)
第i个样本行写作X(i),第i个样本第j个特征值写作Xj(i),第i个样本的标记写作y(i)
2 机器学习的主要任务
机器学习的基本任务:
·分类
·回归
分类任务:二分类;多分类;多标签分类
回归任务
·结果是一个连续数字的值,而非一个类别
·如:房屋价格·市场分析·学生成绩·股票价格
·有一些算法只能解决回归问题
·有一些算法只能解决分类问题
·有一些算法的思路既能解决回归问题,又能解决分类问题
什么是机器学习
3 监督学习,非监督学习,半监督学习和增强学习
机器学习方法的分类
·监督学习
·非监督学习
·半监督学习
·增强学习
监督学习:
给机器的训练数据拥有“标记”或者“答案”
我们学习的大部分算法,属于监督学习算法:
·k近邻
·线性回归和多项式回归
·逻辑回归
·SVM
·决策树和随机森林
非监督学习
给机器的训练数据没有任何“标记”或者“答案”
非监督学习的意义
1对没有“标记”的数据进行分类-聚类分析
2对数据进行降维处理
·特征提取:信用卡的信用评级和人的胖瘦无关?
·特征压缩:PCA
降维处理的意义:方便可视化
3异常检测
半监督学习
一部分数据有“标记”或者“答案”,另一部分数据没有。
更常见:各种原因产生的标记缺失
通常都先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测。
4 批量学习,在线学习,参数学习和非参数学习
机器学习的其他分类:
在线学习和批量学习(离线学习)
参数学习和非参数学习
批量学习
·优点:简单
·问题:如何适应环境变化?解决方案:定时重新批量学习
·缺点:每次重新批量学习,运算量巨大;在某些环境变化非常快的情况下,甚至不可能的。
在线学习
·优点:及时反映新的环境变化
·问题:新的数据带来不好的变化?解决方案:需要加强对数据进行监控
·其他:也适用于数据量巨大,完全无法批量学习的环境。
参数学习
一旦学到了参数,就不再需要原有的数据集
非参数学习
·不对模型进行过多假设
·非参数不等于没参数
机器学习--基础算法--机器学习基础相关推荐
- java程序员基础算法_java基础算法
冒泡排序 图解 编码实现 public class Sort { public static void main(String[] args) { //通过冒泡排序给当前的数字进行排序(升序) int ...
- 《白话机器学习的数学》基础知识梳理 基于python的代码实现
写在前面 这本书很适合我这个机器学习小白,从数学基础开始,用自己的话凝练总结,慢慢整理.未经授权,禁止转载!如需转载,请与我联系. 第一章:开始 机器学习初识 机器学习的基础理论和算法并不是新出现的, ...
- 机器学习初学者手抄本:数学基础、机器学习经典算法、统计学习方法等
机器学习怎么学?当然是系统地学习了.没有时间这么办呢?利用碎片时间学习!很多人一天要花 2 个小时通勤,通勤路上有很多时间看手机.于是我把一些机器学习的基础知识做成了在线的机器学习手册,只需打开微信收 ...
- 数学基础、机器学习经典算法、统计学习方法,这份机器学习在线手册来帮你...
机器学习怎么学?当然是系统地学习了.没有时间这么办呢?利用碎片时间学习!很多人一天要花 2 个小时通勤,通勤路上有很多时间看手机.于是我把一些机器学习的基础知识做成了在线的机器学习手册,只需打开微信收 ...
- 机器学习-SVM算法
机器学习-基础知识 机器学习-线性回归 机器学习-逻辑回归 机器学习-聚类算法 机器学习-决策树算法 机器学习-集成算法 机器学习-SVM算法 文章目录 支持向量机 1. 间隔与支持向量 1.1. 点 ...
- 【机器学习基础】机器学习算法中分类知识总结!
译者:张峰,Datawhale成员 本文将介绍机器学习算法中非常重要的知识-分类(classification),即找一个函数判断输入数据所属的类别,可以是二类别问题(是/不是),也可以是多类别问题( ...
- 【机器学习入门】机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)...
Datawhale 作者:尹晓丹,Datawhale优秀学习者 寄语:首先,简单介绍了生成模型和判别模型,对条件概率.先验概率和后验概率进行了总结:其次,对朴素贝叶斯的原理及公式推导做了详细解读:再次 ...
- 机器学习算法的基础知识
机器学习算法的基础知识 1.评估指标 2.偏差与方差(过拟合与欠拟合) 3.正则化(解决过拟合) 4.梯度下降算法(算法优化方式) 5.数据不平衡 1.评估指标 预测值 0 1 实际 0 TN FP ...
- 【机器学习】十大机器学习基础算法
十大机器学习算法入门 近年来,机器学习与人工智能已广泛应用于学术与工程,比如数据挖掘.计算机视觉.自然语言处理.生物特征识别.搜索引擎.医学诊断.检测信用卡欺诈.证券市场分析.DNA序列测序.语音和手 ...
最新文章
- 突破安全狗防注入及上传的一些思路
- java小程序死机_求解,刚写的小程序,一运行我机器就死机
- 用python做加法_Python不用加减乘除做加法
- 学python对数学要求高吗_人工智能的小男孩 大专学历的人没有数学基础想学习python技术未来能往大数据或人工智能方向进行职业发展吗?...
- oracle实现序列,oracle中创建序列和自增长列的实现方式
- UML 中extend和include的区别
- 通过RSS订阅、邮件转发自动同步多个Blog
- IOS 8.0 适配应用图片设计
- Black Hat | PE Tree:BlackBerry 发布PE文件开源逆向工具
- node.js连接数据库(mysql)
- 2021年软件测试工具总结——测试管理工具
- 后台开发 vs App应用开发?
- 梦成真——一个普通学校计算机系学生的出国梦
- xpath提取招标网站的项目编号
- 1g内存编译android,如何让Android手机1G内存就“够用”?
- TFS(Taobao File System)团队CODE协作工具
- 微信小程序如何获取高清用户头像
- 如何提高工作激情,打造狼性团队
- Basic Authorization 认证方法
- mac 时间机器备份到windows共享文件遇到的问题及解决记录
热门文章
- 穿越山谷的英伟达 会成为元宇宙最重要的基础设施吗?
- 木兰编程当事人最新回应!谁为国产换皮透支信用买单
- PIXHAWK2.4.8飞控如果做双罗盘校准
- 计算机网络知识汇总(十万字超详细)
- TCP/IP four-storey model
- SAP-MM:物料采购订单的客制化开发与对应打印/预览的配置
- 南京三只松鼠java_又出新模式?三只松鼠南京首家品牌集合店开业
- 天下数据浅谈大数据和大规模数据的区别
- CodeForces - 366C Dima and Salad (01背包)
- NOIP 2001 一元三次方程求解(二分||盛金公式)