1.spark支持的分类包括以下几个场景:
a.二分类,顾名思义就是只分成A和B两类
b.多分类 分成A,B,C,D等多个分类
不支持多标签分类,所谓的多标签分类是指一个样本可以属于多个分类,也就是比如样本X既属于A分类又属于B分类,spark目前不支持
分类的算法主要有逻辑回归分类算法,决策树,随即森林等,不管是哪种算法,不同点主要在于支持的分类数量和样本数量的限制不同,评价分类算法的好坏的标志主要是看准确性和areaUnderRoc值,areaUnderRoc主要是为了解决样本不均匀时使用准确率指标不科学的问题.

2.线性回归与分类的主要区别是预测的结果是实数值,而不是离散值,衡量回归的算法的好坏的标准主要是均方差等.

附混淆矩阵:

TP:预测为 1,预测 正确,即 实际 1
FP :预测为 1,预测 错误,即 实际 0
FN :预测为 0,预测 错误,即 实际 1
TN :预测为 0,预测 正确,即 实际 0

参考wiki:
https://www.zhihu.com/question/39840928

spark机器学习-分类回归总结相关推荐

  1. Python机器学习--分类\回归--决策树算法

    决策树算法类型 决策树是一系列算法,而不是一个算法. 决策树包含了 ID3分类算法,C4.5分类算法,Cart分类树算法,Cart回归树算法. 决策树既可以做分类算法,也可以做回归算法.因此决策树既可 ...

  2. Spark机器学习库MLib分类和回归文档V1.4.1(翻译)

    Spark MLib分类与回归 MLlib支持各种方法二分类,多分类,和回归分析.下表概述了每个类型的问题支持的算法. 问题类型 支持的方法 二分类 线性支持向量机,Logistic回归,决策树,朴素 ...

  3. spark java 逻辑回归_逻辑回归分类技术分享,使用Java和Spark区分垃圾邮件

    原标题:逻辑回归分类技术分享,使用Java和Spark区分垃圾邮件 由于最近的工作原因,小鸟很久没给大家分享技术了.今天小鸟就给大家介绍一种比较火的机器学习算法,逻辑回归分类算法. 回归是一种监督式学 ...

  4. 手把手带你玩转Spark机器学习-使用Spark构建回归模型

    系列文章目录 手把手带你玩转Spark机器学习-专栏介绍 手把手带你玩转Spark机器学习-问题汇总 手把手带你玩转Spark机器学习-Spark的安装及使用 手把手带你玩转Spark机器学习-使用S ...

  5. Spark机器学习之垃圾邮件分类

    Spark机器学习之垃圾邮件分类 步骤概述 通过HashingTF构建文本的特征向量,然后使用随机梯度下降算法实现逻辑回归,进而对邮件进行分类 垃圾邮件分类代码 导入相关的包 import org.a ...

  6. 机器学习系列之手把手教你实现一个分类回归树

    https://www.ibm.com/developerworks/cn/analytics/library/machine-learning-hands-on5-cart-tree/index.h ...

  7. id3决策树 鸢尾花 python_机器学习之分类回归树(python实现CART)

    机器学习之分类回归树(python实现CART) 之前有文章介绍过决策树(ID3).简单回顾一下:ID3每次选取最佳特征来分割数据,这个最佳特征的判断原则是通过信息增益来实现的.按照某种特征切分数据后 ...

  8. 机器学习实战(八)分类回归树CART(Classification And Regression Tree)

    目录 0. 前言 1. 回归树 2. 模型树 3. 剪枝(pruning) 3.1. 预剪枝 3.2. 后剪枝 4. 实战案例 4.1. 回归树 4.2. 模型树 学习完机器学习实战的分类回归树,简单 ...

  9. Py之scikit-learn:机器学习sklearn库的简介、六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类)、安装、使用方法(实际问题中如何选择最合适的机器学习算法)之详细攻略

    Py之scikit-learn:机器学习sklearn库的简介(组件/版本迭代).六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类).安装.使用方法(实际问题中如何选择最合适的机器学 ...

最新文章

  1. 微信小程序红包开发 小程序发红包 开发过程中遇到的坑 微信小程序红包接口的...
  2. 自编网页是处理url时服务器出错,【上海校区】自编教材《web标准网页制作实例教程》连载...
  3. Linux 文件系统结构介绍
  4. 展示使用 boost bind 和 phoenix 处理删除的不同方法的测试程序
  5. 'weblogic.kernel.Default (self-tuning) 问题weblogic层面解决办法
  6. WebRTC基本介绍
  7. 关于STM32没有硬件浮点单元的纯经验之谈,是否可以在stm32上用float运算?
  8. python处理识别图片验证码
  9. BZOJ35453551[ONTAK2010]Peaks——kruskal重构树+主席树+dfs序+树上倍增
  10. 正确理解三极管的放大区、饱和区、截止区
  11. android 获取邮箱账号,android获取google邮箱
  12. 前端工作中碰到的一些小问题总结
  13. 自定义修改elementUI组件样式(贯穿样式)
  14. 网络安全形势严峻:国内黑灰产业产值达千亿
  15. postman传String类型参数时不能加双引号
  16. Ovftool安装导出vsphere虚拟机
  17. 朱丹老师课程学习笔记:8、职场晋升-没人带怎么办?这样搜资料的小白也能变大神
  18. 助力千亿级市场 阿里云进军智能电动车产业
  19. 14个SpringBoot优化小妙招
  20. 计算机进位制转换方法,计算机进位数制及其转换方法和技巧.doc

热门文章

  1. excel形式的测试用例模板及用例设计
  2. 计算机专业课答题技巧,高考各科答题技巧
  3. 51单片机的智能饮水机控制系统【proteus仿真+程序+原理图】
  4. 轻轻松松破解wifi,kali下fluxion的使用
  5. Pytorch预训练模型下载慢解决方式
  6. 条件概率 联合概率 边缘概率
  7. LightGCN 代码解析
  8. Scrapy使用报错socket.timeout: timed out
  9. PDP(等离子) VS LCD(液晶)
  10. Modbus RTU设备连接