夫君子之行,静以修身,俭以养德,非淡泊无以明志,非宁静无以致远。
夫学须静也,才须学也,非学无以广才,非志无以成学。淫慢则不能励精,险躁则不能冶性。
年与时驰,意与日去,遂成枯落,多不接世,悲守穷庐,将复何及。
——诸葛亮《诫子书》
于文章中出现的任何错误请大家批评指出,一定及时修改
有任何想要讨论和学习的问题可联系我:yangmq@aliyun.com

文章目录

  • Spark下载和安装(学习笔记)
  • 一、Spark下载和安装

Spark下载和安装(学习笔记)


一、Spark下载和安装

  1. Spark安装 运行环境
    Spark是Scala写的,运行在JVM上,所以运行环境Java7+
    如果使用Python API,需要安装Python2.6+或者Python3.4+

  2. Spark下载
    服务器:centos7
    下载地址:http://spark.apache.org/downloads.html
    wget https://www.apache.org/dyn/closer.lua/spark/spark-3.2.0/spark-3.2.0-bin-hadoop3.2.tgz
    搭建Spark不需要Hadoop,如有hadoop集群,可下载相应的版本
    下载后解压

  3. Spark目录
    bin包含用来和Spark交互的可执行文件,如Spark shell
    core,Streaming,python,…包含主要组件的源代码
    examples包含一些单机Spark job,你可以研究和运行这些例子

  4. Spark的shell
    spark的shell使你能够处理分布在集群上的数据
    Spark把数据加载到节点的内存中,因此分布式处理可在秒级完成
    快速使迭代式计算,实时查询、分析一般能够在shells中完成
    Spark提供了Python shells 和 Scala shells

  5. Spark的Python shells
    位置:bin/pyspark
    ./pyspark 运行

  6. Spark的Scala shells
    位置:bin/spark-shell
    ./spark-shell 运行

  7. Scala shells的例子
    创建helloSpark文件
    vi helloSpark
    内容
    hello Spark
    hello World
    hello Spark !
    wq保存
    Scala shell执行
    val lines = sc.textFile("../../helloSpark")
    lines.count() 得到数量
    vlines.first()得到第一行

  8. 修改Spark日志级别
    修改日志级别log4j.rootCategory = WARN,console
    conf文件夹下有log4j.properties.template
    cp 一份修改名称 log4j.properties
    找到log4j.rootCategory = INFO,console进行修改

Spark下载和安装(学习笔记)相关推荐

  1. 第13课 spark内核架构解密学习笔记

    第13课 spark内核架构解密学习笔记  2016.01.16 内容: 1.通过手动绘图的方式解密spark内核架构 2.通过案例验证spark内核架构 3.spark架构思考 第一阶段:彻底精通s ...

  2. OpenStack Pike安装学习笔记

    此文原创,绝大部分资料翻译自OpenStack官方安装GUIDE,转载请注明出处. 目录 目录... 1 前言... 4 OpenStack参考架构... 4 硬件架构及配置... 5 控制器节点.. ...

  3. 大数据集群安装学习笔记

    目录 1 安装部署........................................................................... 4 1.1 solr单节点安装 ...

  4. TexLive发行版下载与安装教程笔记

    TexLive发行版下载与安装 打开 tug.org/texlive官方网址 打开连接有texlive的下载链接 下载IOS光盘镜像文件 选择最近的下载镜像源 选择4G的 texlive2021进行下 ...

  5. puppet最新源码包安装学习笔记

    最近去面试了2家大的电商网站的运维工作,公司对系统的自动化管理,虚拟化,mysql集群,系统性能的优化和shell及python编程的要求都比较高,虽然没有面试成功,但也明白了2013年自己学习的目标 ...

  6. ubuntu软件安装 caffe相关软件安装 学习笔记

    @解压rar文件 sudo 7z x filename.rar @解压zip文件 unzip archive_name.zip @解压TAR文件 # tar -cvf archive_name.tar ...

  7. 18、HTTP基本操作及源码编译安装 学习笔记

    HTTPHyper Text Transfer Protocol超文本传输协议 HTMLHyper Text Mark-up Language超文本标记语言 URIUniform Resource I ...

  8. python:下载精美壁纸--学习笔记

    个人学习记录 一.效果展示 这里贴一个还不错的某壁纸网:Wallpaper Abyss - HD Wallpapers, Background Images 下载的结果展示: 下载进度展示: 二.完整 ...

  9. linux+python+djiango+mysql编译安装学习笔记

    1 环境准备 oel5.8 32位 Database version : 5.0.77 MySQL-python-1.2.3.tar.gz Python-2.7.5.tar.bz2 setuptool ...

最新文章

  1. 浏览器无法访问虚拟机的服务器
  2. EOS开发步骤(1) 开发说明
  3. phpstrom安装bootstrap3插件
  4. react 判断图片是否加载完成_如何判断图片(img)是否已经加载成功--基于react...
  5. 《3D Math Primer for Graphics and Game Development》读书笔记1
  6. 百度宣布架构调整,BAT要在To B业务重开一局
  7. java 连接solrcloud_Solr 14 - SolrJ操作SolrCloud集群 (Solr的Java API)
  8. 故宫门票预订网站崩溃;岳云鹏信息打包卖 100 元;华为要做电视?| 极客头条...
  9. 红外传感器型号和参数_各类红外传感器比较
  10. ArcEngine代码 地图制图标注之 TextElement标注,Annotation注记,MapTips显示
  11. java 中的惰性初始化_java惰性初始化
  12. python turtle 绘图小猪佩奇_python海龟作图完成小猪佩奇
  13. ubuntu 黑体_Ubuntu 黑体解决方案
  14. 360浏览器模拟百度搜索引擎蜘蛛访问
  15. Redis应用---Redis可以用来做什么?
  16. 企业如何利用生产制造业ERP管理系统做好采购管理?
  17. 数理统计方差齐性检验Python实现
  18. Python ABC(抽象基类)
  19. windows10使用cuda11搭建pytorch深度学习框架——运行Dlinknet提取道路(二)——代码运行问题解决
  20. java 采集新闻数据

热门文章

  1. matlab科学计数法输入_matlab提取科学计数法指数
  2. 将收藏夹的内容保存为一个网页
  3. 3A锂电池充电管理IC,PW4035
  4. 面试时的自我介绍技巧
  5. 双网卡网络设置:有线网卡优先级高于无线网卡
  6. 整合GreyBox放大显示图片
  7. 人工智能到底是啥_人工智能(AI)到底是什么?——什么是AI、什么不是 AI ?...
  8. 电力系统为什么是三相的
  9. JavaScript入门记录
  10. oracle智能便携投影机,目前最好的便携投影仪,这几款便携投影仪不容错过