Spart是什么

Spart是一个用来实现快速而而通用的集群计算平台。

在速度方面,Spart扩展了广泛使用的Mapreduce计算模型,而且高效的支持更多的计算模式,包括交互式查询和流处理。Spart的一个主要特点是能够在内存中进行计算,因而更快。即使必须在硬盘上进行复杂计算,Spart依然比Mapreduce快。

Spart适用于各种各样原先需要多种不同分布式平台的场景,包括批处理,迭代算法,交互式查询,流处理。通过在一个统一的框架下支持这些不同的计算,Spart使我们可以简单而低耗的把各种处理流程整合在一起,不仅如此这种特性还大大减轻了原先需要对各种平台分别管理的负担。

  1. Spart Core

    Spart Core实现Spart的基本功能,包含任务调度,内存管理,错误恢复,与存储系统交互。Spart Core中包含对弹性分布式数据集(RDD)的API的定义.。RDD表示分布在多个计算机节点上可以并行操作的元素的集合,是Spart主要的编程抽象。

  2. Spart SQL

    Spart SQL是Spart用来操作结构化数据的程序包,通过Spart SQL ,我们可以使用SQL或 Apache Hive版本的SQL来查询数据。

  3. Spart Streamig

    Spart Streamig是Spart提供的对实时数据进行流式计算的组件。如生产环境中网页服务器日志,或是网络服务中用户提交的状态更新组成的消息列队,都是数据流。

  4. MLlib

    Spart中提供常见的机器学习功能的程序裤,叫做MLlib。MLlib提供的机器学习算法,包括分类,回归,聚类,协同过滤,决策树,还提供模型评估,数据导入等功能。

  5. Graphx

    Graphx是用来操作图(如社交关系图)的程序库,可以进行并行的图计算。

转载于:https://www.cnblogs.com/SamllBaby/p/5695525.html

spart快速大数据分析学习提纲(一)相关推荐

  1. python测速程序_Python大数据分析学习.测试程序执行速度

    Python大数据分析学习.测试程序执行速度 发布时间:2019-03-25 22:26, 浏览次数:250 , 标签: Python Here, I introduce 2 magic functi ...

  2. 大数据分析学习笔记(Z检验,分类器以及Association Rule)

    大数据分析学习笔记(Z检验,分类器以及Association Rule) Task 1 – Hypothesis Testing To improve student learning perform ...

  3. 大数据分析学习哪些编程语言

    大数据分析已成为21世纪最受欢迎的技术之一.由于行业对大数据分析家的需求很高,因此需要具有所需技能的人员才能精通该领域.除了数学技能外,还需要编程专业知识.但是,在获得专业知识之前,有抱负的大数据分析 ...

  4. 大数据分析学习之七天玩转SAS-张璇-专题视频课程

    大数据分析学习之七天玩转SAS-674人已学习 课程介绍         本课程涉SAS编程基础.SAS数据获取与数据集操作.SAS变量操作.SAS观测值操作.SAS数据集管理.SAS数据汇总与展现. ...

  5. 详细解读大数据分析学习路线

    以大数据分析师为目标,从数据分析基础.JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop.HDFS.MapReduce和Hbase等理论知识和hadoop的生态环境. 一.大数据分 ...

  6. 大数据分析学习的详细解读

    以大数据分析师为目标,从数据分析基础.JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop.HDFS.MapReduce和Hbase等理论知识和hadoop的生态环境. 一.大数据分 ...

  7. 大数据分析学习Python需要多长时间

    学习Python需要多长时间?你可以在短短的一两个星期内学习基本知识.扎实的基础知识(变量,函数,for循环,if-else语句等)足以帮助你解决工作中的问题或编写简单的脚本.如果你想全职使用Pyth ...

  8. 【Daticist】|(二)大数据分析学习计划(更新ing)

    本文大纲来自:https://educoder.trustie.net/paths/158 目录 1.大数据基础-- 数据处理脚本语言Python 1-1  Python初体验--Hello worl ...

  9. Python大数据分析学习资源

    为方便初学者了解Python和大数据分析的入门知识,近期提供了一些新的学习资源: 1)慕课: <小白学Python>:主要为零基础的学习者提供Python,可以独立学习,目标是基本了解Py ...

  10. (大数据分析学习)16、标准化变量的广义样本方差和总样本方差

    标准化变量的广义方差: 总体样本方差:

最新文章

  1. 为什么神经网络的激活函数必须使用线性函数?
  2. Android自定义EditText去除边框并添加下划线
  3. 【Android 安装包优化】资源打包配置 ( resources.arsc 资源映射表 | 配置国际化资源 )
  4. Leetcode 103.二叉树的锯齿形层序遍历
  5. 新建swap分区的规划、挂载和自动挂载示例
  6. php cannot find libz,brew安装php70出现configure: error: Cannot find libz 错误解决方法
  7. VS2010开发ribbon风格的程序
  8. python多个strip_python 格式化多个Python3中strip()、lstrip()、rstrip()用法详解
  9. 百万数据报表导出:需求以及思路分析
  10. 把握三大计划 抓住ERP项目实施的灵魂
  11. linux 文件按时间 函数,[Linux文件属性]使用utime函数操作文件的时间参数
  12. Python 3 的新特性zz
  13. C语言hmacsha1,在C中执行hmac sha1
  14. 深度搜索和广度搜索领接表实现_算法基础04-深度优先搜索、广度优先搜索、二分查找、贪心算法...
  15. 中国象棋程序的设计与实现(十)--棋盘的定义和绘制
  16. J2ME-CLDC/MIDP资源
  17. 抖音seo源码二次开发 抖音seo源码二次开发
  18. win10专业版如何快速恢复出厂设置的方法
  19. 计算机常用小软件及参考书籍
  20. python脚本下载百度或必应图片

热门文章

  1. gradle java ide_用最简单的gradle代码,解决你java项目中的jar依赖之苦
  2. NYOJ 608 508筹划工程 HDU 1232 畅通工程
  3. linux fb设备驱动,Linux FB 驱动讲解
  4. 【SPOJ:FAVDICE】Favourite Dice(概率dp)
  5. 风控中英文术语手册(银行_消费金融信贷业务)_v4
  6. java套接字通信_Java网络通信套接字 | 学步园
  7. 2015年c语言等级考试题1 10 2分,2015年计算机二级《C语言》精选练习题及答案(2)...
  8. java sec_java.security文件
  9. 容器技术Docker K8s 52 边缘容器服务(ACK@Edge)-边缘计算和边缘容器
  10. oracle转为纯大写,Oracle认证:oracle中小写转换成大写方法