spark机器学习-分类回归总结
1.spark支持的分类包括以下几个场景:
a.二分类,顾名思义就是只分成A和B两类
b.多分类 分成A,B,C,D等多个分类
不支持多标签分类,所谓的多标签分类是指一个样本可以属于多个分类,也就是比如样本X既属于A分类又属于B分类,spark目前不支持
分类的算法主要有逻辑回归分类算法,决策树,随即森林等,不管是哪种算法,不同点主要在于支持的分类数量和样本数量的限制不同,评价分类算法的好坏的标志主要是看准确性和areaUnderRoc值,areaUnderRoc主要是为了解决样本不均匀时使用准确率指标不科学的问题.
2.线性回归与分类的主要区别是预测的结果是实数值,而不是离散值,衡量回归的算法的好坏的标准主要是均方差等.
附混淆矩阵:
TP:预测为 1,预测 正确,即 实际 1
FP :预测为 1,预测 错误,即 实际 0
FN :预测为 0,预测 错误,即 实际 1
TN :预测为 0,预测 正确,即 实际 0
参考wiki:
https://www.zhihu.com/question/39840928
spark机器学习-分类回归总结相关推荐
- Python机器学习--分类\回归--决策树算法
决策树算法类型 决策树是一系列算法,而不是一个算法. 决策树包含了 ID3分类算法,C4.5分类算法,Cart分类树算法,Cart回归树算法. 决策树既可以做分类算法,也可以做回归算法.因此决策树既可 ...
- Spark机器学习库MLib分类和回归文档V1.4.1(翻译)
Spark MLib分类与回归 MLlib支持各种方法二分类,多分类,和回归分析.下表概述了每个类型的问题支持的算法. 问题类型 支持的方法 二分类 线性支持向量机,Logistic回归,决策树,朴素 ...
- spark java 逻辑回归_逻辑回归分类技术分享,使用Java和Spark区分垃圾邮件
原标题:逻辑回归分类技术分享,使用Java和Spark区分垃圾邮件 由于最近的工作原因,小鸟很久没给大家分享技术了.今天小鸟就给大家介绍一种比较火的机器学习算法,逻辑回归分类算法. 回归是一种监督式学 ...
- 手把手带你玩转Spark机器学习-使用Spark构建回归模型
系列文章目录 手把手带你玩转Spark机器学习-专栏介绍 手把手带你玩转Spark机器学习-问题汇总 手把手带你玩转Spark机器学习-Spark的安装及使用 手把手带你玩转Spark机器学习-使用S ...
- Spark机器学习之垃圾邮件分类
Spark机器学习之垃圾邮件分类 步骤概述 通过HashingTF构建文本的特征向量,然后使用随机梯度下降算法实现逻辑回归,进而对邮件进行分类 垃圾邮件分类代码 导入相关的包 import org.a ...
- 机器学习系列之手把手教你实现一个分类回归树
https://www.ibm.com/developerworks/cn/analytics/library/machine-learning-hands-on5-cart-tree/index.h ...
- id3决策树 鸢尾花 python_机器学习之分类回归树(python实现CART)
机器学习之分类回归树(python实现CART) 之前有文章介绍过决策树(ID3).简单回顾一下:ID3每次选取最佳特征来分割数据,这个最佳特征的判断原则是通过信息增益来实现的.按照某种特征切分数据后 ...
- 机器学习实战(八)分类回归树CART(Classification And Regression Tree)
目录 0. 前言 1. 回归树 2. 模型树 3. 剪枝(pruning) 3.1. 预剪枝 3.2. 后剪枝 4. 实战案例 4.1. 回归树 4.2. 模型树 学习完机器学习实战的分类回归树,简单 ...
- Py之scikit-learn:机器学习sklearn库的简介、六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类)、安装、使用方法(实际问题中如何选择最合适的机器学习算法)之详细攻略
Py之scikit-learn:机器学习sklearn库的简介(组件/版本迭代).六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类).安装.使用方法(实际问题中如何选择最合适的机器学 ...
最新文章
- 微信小程序红包开发 小程序发红包 开发过程中遇到的坑 微信小程序红包接口的...
- 自编网页是处理url时服务器出错,【上海校区】自编教材《web标准网页制作实例教程》连载...
- Linux 文件系统结构介绍
- 展示使用 boost bind 和 phoenix 处理删除的不同方法的测试程序
- 'weblogic.kernel.Default (self-tuning) 问题weblogic层面解决办法
- WebRTC基本介绍
- 关于STM32没有硬件浮点单元的纯经验之谈,是否可以在stm32上用float运算?
- python处理识别图片验证码
- BZOJ35453551[ONTAK2010]Peaks——kruskal重构树+主席树+dfs序+树上倍增
- 正确理解三极管的放大区、饱和区、截止区
- android 获取邮箱账号,android获取google邮箱
- 前端工作中碰到的一些小问题总结
- 自定义修改elementUI组件样式(贯穿样式)
- 网络安全形势严峻:国内黑灰产业产值达千亿
- postman传String类型参数时不能加双引号
- Ovftool安装导出vsphere虚拟机
- 朱丹老师课程学习笔记:8、职场晋升-没人带怎么办?这样搜资料的小白也能变大神
- 助力千亿级市场 阿里云进军智能电动车产业
- 14个SpringBoot优化小妙招
- 计算机进位制转换方法,计算机进位数制及其转换方法和技巧.doc