2019独角兽企业重金招聘Python工程师标准>>>

pycharm搭建spark环境
  • 安装python环境
    windows下有安装包,自行下载安装即可
  • 安装spark环境
    • 官网下载 spark-2.3.1-bin-hadoop2.7 包,解压即可
    • 配置
      HADOOP_HOME:D:\softwares\Java\hadoop-2.7.7
      SPARK_HOME:D:\softwares\Java\spark-2.3.1-bin-hadoop2.7
      PATH:%SPARK_HOME%\bin;%HADOOP_HOME%\bin;
      
  • 配置python-spark环境
    • 将spark目录 D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\python\lib 下的 py4j-0.10.7-src.zip 解压
    • 将解压后的 py4j 放到 python 目录 D:\softwares\Java\Python36\Lib\site-packages
    • 提示:python 和 spark 的安装目录自行替换
  • 下载安装pycharm
    • 创建项目
    • 创建python文件,内容如下:
      from pyspark import SparkConf, SparkContextconf = SparkConf().setMaster('local').setAppName('JackManWu')
      sc = SparkContext(conf=conf)
      lines = sc.textFile("D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\README.md")
      print(lines.count())
      
    • 点击run运行,结果如下:
      2018-08-20 17:30:13 WARN  NativeCodeLoader:62 - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
      Setting default log level to "WARN".
      To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
      2018-08-20 17:30:15 WARN  Utils:66 - Service 'SparkUI' could not bind on port 4040. Attempting port 4041.
      103
      
    • 运行是没有问题,但是在pycharm中,pysparkSparkConfSparkContext 会有红色波浪线,而且也没有spark的代码智能提示、补全等,极不方便,如下方法可以解决:
      • 点击File->Settings,在左侧导航栏找到自己的项目,点击 Project Structure ,在面板右侧,点击 Add Content Root ,将spark目录 D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\python\lib 下的 pyspark.zip 的文件添加进项目中,即可解决红色波浪线及智能提示补全问题。

转载于:https://my.oschina.net/u/3163032/blog/1930971

pycharm搭建spark环境相关推荐

  1. PyCharm搭建Spark开发环境windows下安装pyspark

    目录 windows下安装pyspark PyCharm搭建Spark开发环境 windows下安装pyspark spark和hadoop版本版本之间有对应关系 安装jdk 安装hadoop 下载 ...

  2. 解决办法在idea中搭建spark环境:Unable to fetch table student. Invalid method name: ‘get_table_req‘;

    项目场景: idea中搭建spark环境报错:Unable to fetch table student. Invalid method name: 'get_table_req'; 问题描述 Una ...

  3. 基于hadoop搭建Spark环境

    基于hadoop搭建Spark环境 需要准备的东西 1. 准备一个配置好的hadoop,master虚拟机 2. 下载下面的三个文件 3. jdk-8u181-linux-x64.tar.gz 4. ...

  4. PyCharm搭建Spark开发环境

    1.安装好JDK 下载并安装好jdk-12.0.1_windows-x64_bin.exe,配置环境变量: 新建系统变量JAVA_HOME,值为Java安装路径 新建系统变量CLASSPATH,值为 ...

  5. 【原创】搭建spark环境中的坑及解决办法

    一.在搭建好环境之后如果在安装了 spark-1.6-bin-without-hadoop (spark.apache.org/download) 之后,在python 中 "import ...

  6. 【Mac OS】Anaconda+PyCharm搭建PyTorch环境

    初衷,小编开始学PyTorch. PyTorch是一个Python包/库: PyCharm是一个Python开发工具/编辑器: Anaconda是一个Python管理工具(Python.各种Pytho ...

  7. 在PyCharm搭建Python环境+Anaconda配置

    图1 话不多说,先上一幅图,这是已经安装好的Python软件,正在跑CNN(用的是TensorFlow,以后会详细讲解该环境的安装).OK,现在我们正式来安装PyCharm+Anaconda,具体步骤 ...

  8. 【原创】搭建spark环境二

    我在Windows7系统安装了虚拟机,通过虚拟机安装了Ubuntu13.04,我设置的主机与虚拟机的连接方式是桥接,安装好后,发现虚拟机ping不通主机,但是主机可以ping通虚拟机. 我的操作是:关 ...

  9. idea spark java,IntelliJ Idea 搭建spark 开发环境

    笔者介绍的是在MAC环境下使用Idea搭建spark环境. 环境: spark 2.0.0 scala 2.11.8 maven 3.9.9 idea 15 1.Idea的安装.Idea可以在官网上下 ...

最新文章

  1. java编辑简单文本编辑器_简单的Java纯文本编辑器
  2. zabbix邮件报警python脚本
  3. 20个常用Linux性能监控工具/命令
  4. Fence Repair POJ - 3253
  5. tl494组成的超声波发射电路_透彻分析利用TL494组成的逆变器电路
  6. 因为我们一直强调选品的重要性
  7. Linux/windows下java调用lingo
  8. CCF推荐国际学术会议与学术期刊
  9. 京瓷1020手动双面打印提示_解决京瓷2201复印机不能双面打印问题
  10. 英语写作神器Quillbot---如何使用免费的Premium功能
  11. 服装尺寸 html,女装标准尺码对照表,服装尺寸对照表,衣服尺码对照表
  12. 软件智能:aaas系统设计概要 之 序 结篇:计算的三位一体主义
  13. 基因定相(Phasing) 与 SHAPEIT 原理简介
  14. 实现智能dns为用户分配最佳线路
  15. 武林三国辅助工具介绍
  16. 微信公众号开发之jfinal wxin
  17. c语言scandf用法,scan的用法总结大全
  18. 基金疯魔,硬汉落泪!用Python看破藏在盈损动态里的道道儿
  19. php获取之前五天的工作日
  20. golang爬虫colly 发送post请求

热门文章

  1. csgo手机上看demo_仪表上的车速和手机导航不一样,哪个更准?碰到测速了该看哪个?...
  2. 1001. 害死人不偿命的(3n+1)猜想 (15)-PAT乙级真题
  3. GCC 版本下载地址,这里比较全,gcc版本一定要对应,不然就会各种不兼容依赖,把人折腾疯了
  4. 君信财富获数千万元战略投资,投资方为银江集团
  5. solr6.6初探之主从同步
  6. [安卓] 14、安卓HTTP——POST和GET用法分析
  7. SHELL 003 -- ss命令常用方法
  8. 读书笔记_Effective_C++_条款二十四: 若所有参数皆需类型转换,请为此采用non-member函数...
  9. Windows-DHCP
  10. JS 获取元素当前的样式信息