机器学习系列(8)_回归算法,支持向量机
注:本篇文章参考:b站:机器学习经典算法——回归算法
文章目录
- 一、机器学习简介
- 二、回归算法
- 三、支持向量机要解决的问题
- 四、支持向量机求解目标
- 五、核函数变换
一、机器学习简介
机器学习应用的领域非常广泛:
- 数据挖掘:分析用户信息,提高用户对产品的依赖性。
- 计算机视觉:无人驾驶汽车–实时进行检测任务
机器学习的步骤:
1、训练样本
2、特征提取(数据科学家:知道一份数据如何是机器能更好的识别特征)
3、学习函数
4、预测
Numpy:科学计算库(矩阵)
Pandas:数据分析处理库(缺失值,异常值等数据分析处理)
Matplotlib:数据可视化库(画图)
Scikit-learn:机器学习库(机器学习)
二、回归算法
分类:最终得出的结果是一个类别
回归:最终的结果不是类别值,而是具体的值
例子:
根据工资和年龄来判断银行能够向该客户借多少钱。
由于最终的预测结果是一个具体的值,因此这是一个回归问题。
工资和年龄这两个指标称为特征,两个特征的影响程度是不一样的。
关于线性回归的算法,大体上面是使用了概率论与数理统计当中的似然函数以及对数似然函数,具体过程就不展示了,目标函数如下:
逻辑回归:
逻辑回归是经典的二分类问题,虽然是回归,但它得到的最终的结果是类别
关于梯度下降:梯度下降算法原理讲解——机器学习
三、支持向量机要解决的问题
支持向量机做的是分类任务,解决二分类问题。
支持向量机相比于决策树,不仅要分的纯,还要分的好,能够容忍的误差更大。
因此支持向量机要解决的问题就是找到最优的线,能最好的区分样本,进行分类。
四、支持向量机求解目标
根据上图,我们的目的是找到一条线,这条线要满足以下要求:
即下图
下图中的X1,X3就是支持向量机算法当中的支持向量。
对于线性的支持向量机,只要找出这样一个超平面即可。
但是如果样本数据当中存在异常点,那么就需要舍去这个异常点。
观察下面的实线:由于包含了异常点,因此O和X都离线很近,但如果使用虚线,则OX离虚线较远,能更好的满足我们的需求。
五、核函数变换
支持向量机就是通过一些核函数,将一些低维空间的数据,转化成高维空间的数据。
机器学习系列(8)_回归算法,支持向量机相关推荐
- 机器学习系列(4)_机器学习算法一览,应用建议与解决思路
作者:寒小阳 时间:2016年1月. 出处:http://blog.csdn.net/han_xiaoyang/article/details/50469334 声明:版权所有,转载请联系作者并注明出 ...
- 机器学习系列(10)_决策树与随机森林回归
注:本篇文章接上一篇文章>>机器学习系列(9)_决策树详解01 文章目录 一.决策树优缺点 二.泰坦尼克号幸存者案例 三.随机森林介绍 1.随机森林的分类 2.重要参数 [1]n_esti ...
- 机器学习系列(2)_从初等数学视角解读逻辑回归
作者:龙心尘 && 寒小阳 时间:2015年10月. 出处:http://blog.csdn.net/longxinchen_ml/article/details/49284391 ...
- 机器学习系列(1)_逻辑回归初步
转载自: 机器学习系列(1)_逻辑回归初步 - 寒小阳 - 博客频道 - CSDN.NET http://blog.csdn.net/han_xiaoyang/article/details/4912 ...
- 机器学习系列(8)_读《Nature》论文,看AlphaGo养成
机器学习系列(8)_读<Nature>论文,看AlphaGo养成 标签: 机器学习算法深度学习神经网络蒙特卡罗树搜索 2016-03-16 11:23 17843人阅读 评论(8) 收藏 ...
- 机器学习系列(1)_数据分析之Kaggle泰坦尼克之灾
本篇博客通过分析泰坦尼克号事故中乘客的信息,从而得出一些相关关系的判断,并且使用Python可视化的手段更加具体的展现. 注:本篇博客参考资料: 1.kaggle入门–泰坦尼克号之灾(某书) 2.机器 ...
- 机器学习系列-强填EM算法在理论与工程之间的鸿沟(下)
前言 在上一篇文章<机器学习系列-强填EM算法在理论与工程之间的鸿沟(上)>中,小夕用优(恐)雅(怖)的数学理论来向读者解释了EM算法的工作原理.那么从工程角度出发的EM算法又是怎样的呢? ...
- 《机器学习系列-强填EM算法在理论与工程之间的鸿沟(上)》
小夕曾经问一位做机器学习理论的学姐:"学姐学姐,EM算法是什么呢?" 学姐回答:"EM算法啊,就是解决包含隐变量的参数估计问题." 小夕: 然后小夕去问一位做工 ...
- 机器学习系列(9)_机器学习算法一览(附Python和R代码)
转载自:http://blog.csdn.net/longxinchen_ml/article/details/51192086 – 谷歌的无人车和机器人得到了很多关注,但我们真正的未来却在于能够使电 ...
最新文章
- 2020年人工神经网络第二次作业-参考答案第七题
- Alarm Clocks Everywhere
- 7.Java中变量的隐式转换以及强类型转换
- Docker ASP.NET Core 2.0 微服务跨平台实践
- 九、ES6的箭头函数
- Android基础控件之Button的基本使用
- 基于.NET的分词软件设计与实现V1.0--总体思路及算法实现
- Linux磁盘分区/格式化/挂载目录
- List集合中数据用set集合去重复,用set集合去重复数据重写了equals还是没成功!
- Android DialogFragment
- IOS逆向-静态分析
- 用批处理的方式解压文件
- 安卓开发——显示网速
- 数据类型--Number类型
- Floating point exception (core dumped)解决
- 一些常用的第三方平台和开放平台
- Allegro铜皮倒角技巧-shape倒角
- 云服务器 文件管理,云服务器如何管理文件
- python中判断字符串中出现次数最多的字母
- 使用PfamScan的API对蛋白结构域进行注释