pycharm搭建spark环境
2019独角兽企业重金招聘Python工程师标准>>>
pycharm搭建spark环境
- 安装python环境
windows下有安装包,自行下载安装即可 - 安装spark环境
- 官网下载
spark-2.3.1-bin-hadoop2.7
包,解压即可 - 配置
HADOOP_HOME:D:\softwares\Java\hadoop-2.7.7 SPARK_HOME:D:\softwares\Java\spark-2.3.1-bin-hadoop2.7 PATH:%SPARK_HOME%\bin;%HADOOP_HOME%\bin;
- 官网下载
- 配置python-spark环境
- 将spark目录
D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\python\lib
下的py4j-0.10.7-src.zip
解压 - 将解压后的
py4j
放到 python 目录D:\softwares\Java\Python36\Lib\site-packages
下 - 提示:python 和 spark 的安装目录自行替换
- 将spark目录
- 下载安装pycharm
- 创建项目
- 创建python文件,内容如下:
from pyspark import SparkConf, SparkContextconf = SparkConf().setMaster('local').setAppName('JackManWu') sc = SparkContext(conf=conf) lines = sc.textFile("D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\README.md") print(lines.count())
- 点击run运行,结果如下:
2018-08-20 17:30:13 WARN NativeCodeLoader:62 - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable Setting default log level to "WARN". To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel). 2018-08-20 17:30:15 WARN Utils:66 - Service 'SparkUI' could not bind on port 4040. Attempting port 4041. 103
- 运行是没有问题,但是在pycharm中,
pyspark
,SparkConf
和SparkContext
会有红色波浪线,而且也没有spark的代码智能提示、补全等,极不方便,如下方法可以解决:- 点击File->Settings,在左侧导航栏找到自己的项目,点击
Project Structure
,在面板右侧,点击Add Content Root
,将spark目录D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\python\lib
下的pyspark.zip
的文件添加进项目中,即可解决红色波浪线及智能提示补全问题。
- 点击File->Settings,在左侧导航栏找到自己的项目,点击
转载于:https://my.oschina.net/u/3163032/blog/1930971
pycharm搭建spark环境相关推荐
- PyCharm搭建Spark开发环境windows下安装pyspark
目录 windows下安装pyspark PyCharm搭建Spark开发环境 windows下安装pyspark spark和hadoop版本版本之间有对应关系 安装jdk 安装hadoop 下载 ...
- 解决办法在idea中搭建spark环境:Unable to fetch table student. Invalid method name: ‘get_table_req‘;
项目场景: idea中搭建spark环境报错:Unable to fetch table student. Invalid method name: 'get_table_req'; 问题描述 Una ...
- 基于hadoop搭建Spark环境
基于hadoop搭建Spark环境 需要准备的东西 1. 准备一个配置好的hadoop,master虚拟机 2. 下载下面的三个文件 3. jdk-8u181-linux-x64.tar.gz 4. ...
- PyCharm搭建Spark开发环境
1.安装好JDK 下载并安装好jdk-12.0.1_windows-x64_bin.exe,配置环境变量: 新建系统变量JAVA_HOME,值为Java安装路径 新建系统变量CLASSPATH,值为 ...
- 【原创】搭建spark环境中的坑及解决办法
一.在搭建好环境之后如果在安装了 spark-1.6-bin-without-hadoop (spark.apache.org/download) 之后,在python 中 "import ...
- 【Mac OS】Anaconda+PyCharm搭建PyTorch环境
初衷,小编开始学PyTorch. PyTorch是一个Python包/库: PyCharm是一个Python开发工具/编辑器: Anaconda是一个Python管理工具(Python.各种Pytho ...
- 在PyCharm搭建Python环境+Anaconda配置
图1 话不多说,先上一幅图,这是已经安装好的Python软件,正在跑CNN(用的是TensorFlow,以后会详细讲解该环境的安装).OK,现在我们正式来安装PyCharm+Anaconda,具体步骤 ...
- 【原创】搭建spark环境二
我在Windows7系统安装了虚拟机,通过虚拟机安装了Ubuntu13.04,我设置的主机与虚拟机的连接方式是桥接,安装好后,发现虚拟机ping不通主机,但是主机可以ping通虚拟机. 我的操作是:关 ...
- idea spark java,IntelliJ Idea 搭建spark 开发环境
笔者介绍的是在MAC环境下使用Idea搭建spark环境. 环境: spark 2.0.0 scala 2.11.8 maven 3.9.9 idea 15 1.Idea的安装.Idea可以在官网上下 ...
最新文章
- java编辑简单文本编辑器_简单的Java纯文本编辑器
- zabbix邮件报警python脚本
- 20个常用Linux性能监控工具/命令
- Fence Repair POJ - 3253
- tl494组成的超声波发射电路_透彻分析利用TL494组成的逆变器电路
- 因为我们一直强调选品的重要性
- Linux/windows下java调用lingo
- CCF推荐国际学术会议与学术期刊
- 京瓷1020手动双面打印提示_解决京瓷2201复印机不能双面打印问题
- 英语写作神器Quillbot---如何使用免费的Premium功能
- 服装尺寸 html,女装标准尺码对照表,服装尺寸对照表,衣服尺码对照表
- 软件智能:aaas系统设计概要 之 序 结篇:计算的三位一体主义
- 基因定相(Phasing) 与 SHAPEIT 原理简介
- 实现智能dns为用户分配最佳线路
- 武林三国辅助工具介绍
- 微信公众号开发之jfinal wxin
- c语言scandf用法,scan的用法总结大全
- 基金疯魔,硬汉落泪!用Python看破藏在盈损动态里的道道儿
- php获取之前五天的工作日
- golang爬虫colly 发送post请求
热门文章
- csgo手机上看demo_仪表上的车速和手机导航不一样,哪个更准?碰到测速了该看哪个?...
- 1001. 害死人不偿命的(3n+1)猜想 (15)-PAT乙级真题
- GCC 版本下载地址,这里比较全,gcc版本一定要对应,不然就会各种不兼容依赖,把人折腾疯了
- 君信财富获数千万元战略投资,投资方为银江集团
- solr6.6初探之主从同步
- [安卓] 14、安卓HTTP——POST和GET用法分析
- SHELL 003 -- ss命令常用方法
- 读书笔记_Effective_C++_条款二十四: 若所有参数皆需类型转换,请为此采用non-member函数...
- Windows-DHCP
- JS 获取元素当前的样式信息