Spark mllib包含的分类模型有:逻辑回归,决策树,随机森林,梯度提升树,多层感知机,线性SVM,朴素贝叶斯。

回归模型有:线性回归,决策树回归,随机森林回归,梯度提升树回归,生存回归,保序回归。

在spark mllib库外,还有一个比较常见的模型:KNN。

决策树==================

非线性分类模型

https://blog.csdn.net/tuntunwang/article/details/50587518

梯度提升树=================

梯度提升树(GBTs)包含两类:梯度提升决策树(GBDT)和梯度提升回归树(GBRT)。

传统的boost算法:初始所有样本的权重都是一致的,后续不断增加“被分错”样本的权重,降低分对样本的权重。例如adaboost集成学习算法

https://blog.csdn.net/weixin_40118768/article/details/80411482

GBTs:学习上一步分类的残差。

下面是一个预测年龄的例子:

构架树时,深度为1时通常效果很好(深度为1的决策树称为决策桩decision stumps)。

多层感知机MLP================

全连接的神经网络,除了输入层,其他层的激活函数都SIGMOD函数,采用BP算法学习权值:输出向后传递,误差向前传递。

SVM==========================

假设存在一个超平面,能够将所有样本进行隔开。

https://blog.csdn.net/tuntunwang/article/details/73826556

朴素贝叶斯====================

最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM)。和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier,或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。

https://blog.csdn.net/tuntunwang/article/details/50587462

逻辑回归 线性回归=========================

逻辑回归:y=sigmoid(wx)函数,根据某个概率阈值划分类别。

线性回归:y=wx

https://blog.csdn.net/tuntunwang/article/details/74012106

KNN=====================================

最近的K个样本进行投票

https://blog.csdn.net/tuntunwang/article/details/50587404

常见的机器学习分类模型相关推荐

  1. python 两点曲线_python机器学习分类模型评估

    python机器学习分类模型评估 1.混淆矩阵 在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多 ...

  2. 传统机器学习分类模型预测股价涨跌

    前言 股票市场风起云涌,只有对股价有良好的预测才能够更好的抓住盈利机会.那么传统的机器学习分类模型在这方面的效果如何呢? 本文在只考虑5.10.20日移动平均线.移动指数平均线这六项指标的情况下,比较 ...

  3. 机器学习分类模型评价指标详述

    问题建模 机器学习解决问题的通用流程:问题建模--特征工程--模型选择--模型融合 其中问题建模主要包括:设定评估指标,选择样本,交叉验证 解决一个机器学习问题都是从问题建模开始,首先需要收集问题的资 ...

  4. 大道至简——浅谈机器学习分类模型选择

    机器学习的基本分类模型: KNN,决策树,naive bayes,逻辑回归,SVM,adaboost KNN:一种直接的学习方法,通过相似的近邻投票分类.模型不确定性有三:距离度量(相似性度量),特征 ...

  5. 机器学习分类模型中的评价指标介绍:准确率、精确率、召回率、ROC曲线

    文章来源:https://blog.csdn.net/wf592523813/article/details/95202448 1 二分类评价指标 准确率,精确率,召回率,F1-Score, AUC, ...

  6. 机器学习分类模型评价指标之ROC 曲线、 ROC 的 AUC 、 ROI 和 KS

    前文回顾: 机器学习模型评价指标之混淆矩阵 机器学习模型评价指标之Accuracy.Precision.Recall.F-Score.P-R Curve.AUC.AP 和 mAP 图裂的话请参考:ht ...

  7. 【大数据专业】机器学习分类模型评估和优化之交叉验证的多种方法

    学习目标: 机器学习: 分类评估模型及优化之交叉验证 交叉验证的三种基本方法: 1.将拆分与评价合并执行 sklearn.model_selection.cross_val_score 2.同时使用多 ...

  8. 机器学习分类模型评价指标之Accuracy、Precision、Recall、F-Score、P-R Curve、AUC、AP 和 mAP

    前文:https://www.cnblogs.com/odesey/p/16902836.html 介绍了混淆矩阵.本文旨在说明其他机器学习模型的评价指标. 1. 准确率(Accuracy-Acc) ...

  9. 机器学习-分类模型(鸢尾花案例)

    众所周知,鸢尾花根据 '花瓣长度','花瓣宽度','花萼长度','花萼宽度',分为三类,在数据集中分别用0,1,2来表示类别 本次就是通过对鸢尾花特征进行训练来判断出为哪一类,用到了分类算法的4个模型 ...

最新文章

  1. 做 Java 工程师,挺!好!
  2. 如何短时间提高python面向对象_初识Python面向对象阶段,你们都是怎么过来的?
  3. python可以做什么有趣的东西-Python 里itchat 模块能实现什么有趣的东西?
  4. POJ1149 PIGS(最大流)
  5. PHPsymfony
  6. 电脑技巧:盘点常用的Win组合快捷键
  7. easyexcel导出百万级数据_百万级别数据Excel导出优化
  8. python计算两个日期的差
  9. 1.4编程基础之逻辑表达式与条件分支 03 奇偶数判断
  10. python开发环境一般用哪个快递_基于Python的常用快递sdk调用代码实例
  11. 叶子问题(层次遍历加判断叶子)
  12. gtk窗口和标签控件范例代码
  13. Atitit 数据校验法 目录 1. 用内置表单数据校验 简单快捷 1 1.1. input 元素的校验约束 — starting simple 1 1.1.1. required 属性 1 1.1
  14. 将微信数据提取为exel表格(2022年版)免root 保姆级教程
  15. 新概念英语第一册1-144课(转)
  16. 关于没有找到MFC80UD.DLL,因此这个程序未能启动.重新安装应用程序可能会修复此问题的解决方案
  17. 2.13navigation导航系统
  18. 家庭收支记账软件项目【Golang-面向过程】
  19. 计算机系统与用户的交互界面是,人机交互与人机界面基础知识对比分析
  20. 如何提高信息流广告的转化率?

热门文章

  1. 冬天膝盖发凉是怎么回事?
  2. JAVA——实现把字节数组转成字符串
  3. JS电话号座机号同时验证
  4. 大数据未来有哪些趋势,人工智能,区块链?
  5. .net中国(www.hiaspx.com),现面向所有.net程序员招聘版主
  6. 龙格-库塔法 wiki
  7. Camunda工作流引擎之bpmn设计器定制
  8. 2016年做好跨境电商,出口物流更重要
  9. 【Mac】强制退出程序
  10. java 中间件 pdf_Java中间件技术及其应用开发 PDF扫描版[51MB]