spark MLlib机器学习教程
来源地址:
https://blog.csdn.net/qq_30498935/article/details/82352348

机器学习介绍

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

机器学习算法是从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法.

机器学习可分未一下几种类别

     监督学习:输入数据被称为训练数据,它们有已知的标签和结果。常见的算法包括回归分析和统计分类无监督学习:输入数据不带标签或者没有一个已知的结果。常见算法有聚类半监督学习:输入数据由带标签和不带标签组成。有分类和回归强化学习:输入数据作为作为来自环境的激励供给模型,且模型做出反应。反馈作为环境的惩罚或奖赏。包括Q学习,时序差分学习。

常见算法

分类和回归-----线性回归、逻辑回归、贝叶斯分类、决策树分类等

聚类----KMeans聚类、LDA主题、KNN等

关联规则-----Apriori、FPGrowth等

推荐-----协同过滤、ALS等

神经网络-----BP、RBF、 SVM等

深度神经网络等

二、spark介绍

 引用官网一句话:Apache Spark™ is a unified analytics engine for large-scale data processing.

Spark, 是一种"One Stack to rule them all"的大数据计算框架, 期望使用一个技术堆栈就 完美地解决大数据领域的各种计算任务

Spark使用Spark RDD、 Spark SQL、 Spark Streaming、 MLlib、 GraphX成功解决了大数 据领域中, 离线批处理、 交互式查询、 实时流计算、 机器学习与图计算等最重要的任务和问题。

          Spark Core用于离线计算  Spark SQL用于交互式查询 Spark Streaming用于实时流式计算 Spark MLlib用于机器学习 Spark GraphX用于图计算

三、spark MLlib介绍

  spark MLlib 是spark中可以扩展的机器学习库,它有一系列的机器学习算法和实用程序组成。包括分类、回归、聚类、协同过滤、等,还包含一些底层优化的方法1.机器学习算法:常规机器学习算法包括分类、回归、聚类和协同过滤。2.特征工程:特征提取、特征转换、特征选择以及降维。3.管道:构造、评估和调整的管道的工具。4.存储:保存和加载算法、模型及管道5.实用工具:线性代数,统计,数据处理等。

接下来的课程包括

             spark MLlib机器学习教程-----入门教程【一】spark MLlib机器学习教程-----矩阵向量【二】spark MLlib机器学习教程-----线性回归【三】spark MLlib机器学习教程-----逻辑回归【四】spark MLlib机器学习教程-----保序回归【五】spark MLlib机器学习教程-----贝叶斯分类算法【六】spark MLlib机器学习教程-----SVM支持向量机算法【七】spark MLlib机器学习教程-----决策数算法【八】spark MLlib机器学习教程-----Kmeans聚类算法【九】spark MLlib机器学习教程-----LDA主题模型算法【十】spark MLlib机器学习教程-----FPGrowth关联规则挖掘算法【十一】spark MLlib机器学习教程-----ALS交替最小二乘算法【十二】spark MLlib机器学习教程-----协同过滤推荐算法【十三】spark MLlib机器学习教程-----神经网络算法【十四】

spark MLlib机器学习教程相关推荐

  1. Spark MLlib 机器学习

    本章导读 机器学习(machine learning, ML)是一门涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多领域的交叉学科.ML专注于研究计算机模拟或实现人类的学习行为,以获取新知识.新 ...

  2. Spark MLlib机器学习 | 算法综合实战(一)(史上最详细)

    ==========                         ========= 8.1.1 什么是机器学习 机器学习可以看做是一门人工智能的科学,该领域的主要研究对象是人工智能.机器学习利用 ...

  3. Spark MLlib机器学习 Pipelines

    Spark ML Pipelines ML管道 管道的主要概念 DataFrame Pipeline components(管道组件) Transformers(转换器) Estimators(估算器 ...

  4. 大数据Spark MLlib机器学习

    目录 1 什么是Spark MLlib? 2 支持的数据类型 2.1 本地向量集 2.1.1.密集型数据集 2.1.2 稀疏型数据集 2.2 向量标签 2.3 本地矩阵 2.4 分布式矩阵 2.4.1 ...

  5. 十二、Spark MLlib机器学习

    @Author : By Runsen @Date : 2020/6/21 作者介绍:Runsen目前大三下学期,专业化学工程与工艺,大学沉迷日语,Python, Java和一系列数据分析软件.导致翘 ...

  6. Spark Mllib里的Mllib基本数据类型(图文详解)

    不多说,直接上干货! Spark Mllib基本数据类型,根据不同的作用和应用场景,分为四种不同的类型 1.Local  vector : 本地向量集,主要向spark提供一组可进行操作的数据集合 2 ...

  7. Spark Mllib里的如何对两组数据用斯皮尔曼计算相关系数

    不多说,直接上干货! import org.apache.spark.mllib.stat.Statistics 具体,见 Spark Mllib机器学习实战的第4章 Mllib基本数据类型和Mlli ...

  8. Spark Mllib里的如何对单个数据集用斯皮尔曼计算相关系数

    不多说,直接上干货! import org.apache.spark.mllib.stat.Statistics 具体,见 Spark Mllib机器学习实战的第4章 Mllib基本数据类型和Mlli ...

  9. 既生Mahout,何生Spark MLlib ?

    Apache Mahout与Spark MLlib均是Apache下的项目,都是机器学习算法库,并且现在mahout已经不再接受MapReduce的作业了,也向Spark转移. 那两者有什么关系呢?我 ...

  10. spark 逻辑回归算法案例_黄美灵的Spark ML机器学习实战

    原标题:黄美灵的Spark ML机器学习实战 本课程主要讲解基于Spark 2.x的ML,ML是相比MLlib更高级的机器学习库,相比MLlib更加高效.快捷:ML实现了常用的机器学习,如:聚类.分类 ...

最新文章

  1. mkfs.ext4 /dev/sdb 与 mkfs.ext4 /dev/sdb1
  2. 如何在 Kaggle 首战中进入前 10%
  3. Http Handler 介绍(转)
  4. 回腾讯了......
  5. python中*args **kwargs
  6. 徐明星斥资超4亿香港买壳:史玉柱女儿现身股东行列
  7. 创业冲突的五种解决方法是_当创始合伙人发生冲突时,最好的解决方法4和5
  8. 通过adb命令安装卸载apk
  9. 前几日共享HCIE面试战报兄弟的通过感言,看完之后希望你不要沉默
  10. uni-app使用i18n实现国际化/多语言配置
  11. python中seek函数_Python seek()函数
  12. Eclipse Error - Error notifying a preference...
  13. 超赞~免费生成国庆风格微信头像API接口
  14. python如何生成指定均值向量和协方差矩阵的多维正态分布数据
  15. 神经网络学习----如何利用训练好的神经网络模型进行预测
  16. 7、数据恢复:文件误删、硬盘被格式化后的数据恢复
  17. 搜索android RAM ROM SD区别时找到一篇分析不错的文章
  18. 电影院选座的座位写法
  19. 加米谷大数据深度分析:大数据或将消亡?痛点在哪里?
  20. Photoshop插件-锐化-高反差保留-脚本开发-PS插件

热门文章

  1. CCA分析图如何解读_微生物群落与环境因子关联:全自动的CCA/RDA分析流程!!...
  2. 【精】Photoshop抠图全方位攻略
  3. 2018中国双态运维用户大会于1月13日在京举行
  4. IIS不能启动的原因
  5. 累土--电容屏和电阻屏区别
  6. 调用百度图像识别api处理网络图片(文字识别)
  7. linux怎么查找bin文件内容,[转载]Linux 文件、内容查找(递归) ,grep ,find
  8. 行业认证标准:IEC 62304-医疗设备软件安全分类标准
  9. 网站建设合同- 范文格式
  10. HTML页面多语言切换