目录

  • windows下安装pyspark
  • PyCharm搭建Spark开发环境

windows下安装pyspark

spark和hadoop版本版本之间有对应关系

  1. 安装jdk

  1. 安装hadoop
  • 下载
    hadoop-2.7.7.tar.gz

  • 配置环境变量
    不再演示

  • 下载winutils.exe

https://github.com/steveloughran/winutils

选择对应的hadoop版本下载

  • 复制winutils.exe到安装好的hadoop的bin目录下

  1. 安装spark

下载spark-2.4.6-bin-hadoop2.7.tgz

  • 配置环境变量

  1. 安装Anaconda3.7

国内下载和安装配置

  • 配置环境变量
  • 复制py4j和pyspark

将D:\spark-2.4.6-bin-hadoop2.7\python\lib下两个包(pyspark.zip,py4j.zip)解压缩后拷贝到D:\Anaconda\libsite-packages目录下,然后全部替换

  1. 测试
  • 打开cmd输入pyspark

  • 输入语句
sc.parallelize(["b", "a", "c"]).collect()

PyCharm搭建Spark开发环境

上一标题是前提

  1. 在pycharm中随便建一个python文件
  2. 配置


PYSPARK_PYTHON:python路径
SPARK_HOME:spark路径

  1. 测试程序
from pyspark import SparkConf, SparkContextconf = SparkConf().setMaster("local").setAppName("myapp")
sc = SparkContext(conf=conf)
print(sc.parallelize([1, 2, 3]).collect())

PyCharm搭建Spark开发环境windows下安装pyspark相关推荐

  1. 如何使用intellij搭建spark开发环境(下)

    本文转自http://www.beanmoon.com/2014/10/11/%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8intellij%E6%90%AD%E5%BB%B ...

  2. PyCharm搭建Spark开发环境

    1.安装好JDK 下载并安装好jdk-12.0.1_windows-x64_bin.exe,配置环境变量: 新建系统变量JAVA_HOME,值为Java安装路径 新建系统变量CLASSPATH,值为 ...

  3. 如何使用IntelliJ IDEA搭建spark开发环境(上)

    本文部分转自http://www.beanmoon.com/2014/10/11/%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8intellij%E6%90%AD%E5%BB ...

  4. 搭建Spark开发环境并完成wordcount示例

    一.搭建Spark开发环境流程 1.安装eclipse,我这里用的是集成环境,解压就能用.(包含了scala环境) 安装包传送门: 2.导入相关的jar包 Jar包传送门: 具体操作: (1)装上以上 ...

  5. idea搭建spark开发环境完整版(windows)

    利用intellij idea 搭建spark开发环境(windows) 本文配置所有环境 Win10 企业版2016长期服务版 Jdk1.8.0.131 Hadoop2.7.3 Spark2.2.0 ...

  6. Intellij IDEA使用Maven搭建spark开发环境(scala)

    如何一步一步地在Intellij IDEA使用Maven搭建spark开发环境,并基于scala编写简单的spark中wordcount实例. 1.准备工作  首先需要在你电脑上安装jdk和scala ...

  7. PyCharm搭建Python开发环境

    PyCharm搭建Python开发环境 PyCharm搭建Python开发环境 Python安装 PyCharm下载 PyCharm安装 创建hello world示例进行环境测试 PyCharm搭建 ...

  8. Intellij搭建spark开发环境

    spark怎么学习呢?在一无所知的前提下,首先去官网快速了解一下spark是干什么的,官网在此.然后,安装开发环境,从wordcount开始学习.第三,上手以后可以学习其他算法了.最后,不要放弃,继续 ...

  9. idea spark java,IntelliJ Idea 搭建spark 开发环境

    笔者介绍的是在MAC环境下使用Idea搭建spark环境. 环境: spark 2.0.0 scala 2.11.8 maven 3.9.9 idea 15 1.Idea的安装.Idea可以在官网上下 ...

最新文章

  1. Python3中lambda表达式介绍
  2. JMeter基础之一个简单的性能测试
  3. 命令 —— awk内置变量(NF,NR,FS,FILENAME)
  4. 设计模式:访问者模式(Vistor)
  5. 面向对象的三大特性————继承,多态
  6. 一些部署django用到的linux命令
  7. VUE:checkbox 单选框(单选、多选)、一选全选 / 全选一选、表格单选列实现
  8. 终于用上gcc-4.1编译的系统了
  9. matlab拔河比赛_拔河比赛
  10. python的特殊方法介绍
  11. OpenShift 4 之AMQ Streams(3) - 用Kafka MirrorMaker在Kafka集群间复制数据
  12. Python:使用threading模块实现多线程编程三[threading.Thread类的重要函数]
  13. 图灵奖得主华人高徒发布首款AI芯片!64位RISC-V、高度可编程,低功耗
  14. 如何在Eclipse上使用SVN,安装、提交、拉取代码、解决冲突等操作
  15. 详解没有dSYM文件 如何解析iOS崩溃日志
  16. adb小天才_ADB工具包2020年最新版下载-支持解锁新机BL调试ROOT等各种操作
  17. 《Word排版艺术》读后感,兼谈LaTeX
  18. MP3编码之shine压缩异常解决
  19. 子线程中使用Handler
  20. linux u盘拷贝问题

热门文章

  1. 100个Python实战项目(十)从照片构建 GUI 应用程序铅笔素描
  2. 多租户AWS漏洞暴露账户资源
  3. 摩托罗拉v3android,一问易答:MOTO推出Android版V3靠谱吗!
  4. C#使用WinAPI中 WinExec 调用外部exe程序
  5. 火狐4(firefox4)无法播放songtaste音乐的解决办法
  6. PS CS2时,到到“正在读取文本全球资源”就开始没有响应了
  7. 投票|微信投票如何刷投票数的方法和步骤【禁止非法使用】
  8. 关于Linux(网上资料查询)
  9. bbr29_轻量云服务器安装BBR及加速
  10. 小学奥数思维训练题(九)