python 2.7-为什么PySpark无法找到py4j.java_gateway?

我安装了Spark,运行了sbt程序集,并且可以毫无问题地打开bin / pyspark。 但是,我在将pyspark模块加载到ipython时遇到了问题。 我收到以下错误:

In [1]: import pyspark

---------------------------------------------------------------------------

ImportError Traceback (most recent call last)

in ()

----> 1 import pyspark

/usr/local/spark/python/pyspark/__init__.py in ()

61

62 from pyspark.conf import SparkConf

---> 63 from pyspark.context import SparkContext

64 from pyspark.sql import SQLContext

65 from pyspark.rdd import RDD

/usr/local/spark/python/pyspark/context.py in ()

28 from pyspark.conf import SparkConf

29 from pyspark.files import SparkFiles

---> 30 from pyspark.java_gateway import launch_gateway

31 from pyspark.serializers import PickleSerializer, BatchedSerializer, UTF8Deserializer, \

32 PairDeserializer, CompressedSerializer

/usr/local/spark/python/pyspark/java_gateway.py in ()

24 from subprocess import Popen, PIPE

25 from threading import Thread

---> 26 from py4j.java_gateway import java_import, JavaGateway, GatewayClient

27

28

ImportError: No module named py4j.java_gateway

5个解决方案

65 votes

在我的环境中(使用docker和映像sequenceiq / spark:1.1.0-ubuntu),我遇到了这个问题。 如果查看pyspark shell脚本,您会发现需要在PYTHONPATH中添加一些内容:

export PYTHONPATH=$SPARK_HOME/python/:$PYTHONPATH

export PYTHONPATH=$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip:$PYTHONPATH

那在ipython中为我工作。

更新:如注释中所述,py4j zip文件的名称随每个Spark版本而变化,因此请四处寻找正确的名称。

nealmcb answered 2020-08-08T20:19:35Z

25 votes

我通过在.bashrc中添加一些路径来解决此问题

export SPARK_HOME=/home/a141890/apps/spark

export PYTHONPATH=$SPARK_HOME/python/:$PYTHONPATH

export PYTHONPATH=$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip:$PYTHONPATH

此后,它再也不会引发ImportError:没有名为py4j.java_gateway的模块。

Anderson answered 2020-08-08T20:19:59Z

4 votes

在皮查姆,在运行上述脚本之前,请确保已解压缩py4j * .zip文件。并在脚本中添加其引用sys.path.append(“ spark * / python / lib的路径”)

它为我工作。

shubham gorde answered 2020-08-08T20:20:23Z

4 votes

#/home/shubham/spark-1.6.2

import os

import sys

# Set the path for spark installation

# this is the path where you have built spark using sbt/sbt assembly

os.environ['SPARK_HOME'] = "/home/shubham/spark-1.6.2"

# os.environ['SPARK_HOME'] = "/home/jie/d2/spark-0.9.1"

# Append to PYTHONPATH so that pyspark could be found

sys.path.append("/home/shubham/spark-1.6.2/python")

sys.path.append("/home/shubham/spark-1.6.2/python/lib")

# sys.path.append("/home/jie/d2/spark-0.9.1/python")

# Now we are ready to import Spark Modules

try:

from pyspark import SparkContext

from pyspark import SparkConf`enter code here`

print "Hey nice"

except ImportError as e:

print ("Error importing Spark Modules", e)

sys.exit(1)

shubham gorde answered 2020-08-08T20:20:39Z

4 votes

安装pip模块“ py4j”。

py4j

我在Spark 2.1.1和Python 2.7.x中遇到了这个问题。 不确定Spark是否停止在最新发行版中捆绑此软件包。 但是安装py4j模块为我解决了这个问题。

kn_pavan answered 2020-08-08T20:21:03Z

py4j.java gateway_python 2.7-为什么PySpark无法找到py4j.java_gateway?相关推荐

  1. Java要掌握哪些技术才能顺利找到工作?分享这6项

    在中国Java的市场永远都是巨大的,但是随着信息的普及,人人都知道Java开发做的时间久了,工资高,所以必然会增加竞争程度.那么,Java要掌握哪些技术才能顺利找到工作?这6项技术,你一定要掌握.下面 ...

  2. 前几天在头条上收到一条私信,内容大致是这样的:“我学校比较垃圾,想自学 Java 可以吗?自学 Java 难吗?毕业后能找到一份 6k左右的工作吗?”

    前几天在头条上收到一条私信,内容大致是这样的:"我学校比较垃圾,想自学 Java 可以吗?自学 Java 难吗?毕业后能找到一份 6k左右的工作吗?" 不知道有没有人有类似的问题, ...

  3. java.lang.IllegalArgumentException: 在请求目标中找到无效字符。有效字符在RFC 7230和RFC 3986中定义

    org.apache.coyote.http11.Http11Processor.service 解析 HTTP 请求 header 错误注意:HTTP请求解析错误的进一步发生将记录在DEBUG级别. ...

  4. java句子中找单词_java程序找到一个句子中每个单词的字母数

    我想找到一个句子中每个单词的字母数.我已经尝试了几次使用几个代码,但从来没有得到它.我总是显示错误StringIndexOutOfBounds异常.我的一个代码如下:java程序找到一个句子中每个单词 ...

  5. java数组显示最大值,java 如何用方法在数组中找到最大值并显示他的名称?

    public static void sub(int racetime[], String name[]) { int maxIndex = 0; // 记录racetime最大值的下标 for (i ...

  6. java unexpected type_意外类型需要变量找到值(Unexpected type required variable found value)...

    意外类型需要变量找到值(Unexpected type required variable found value) public class example { public ArrayList T ...

  7. 【shopify 1】调研出海项目,发现shopify没有java的相关SDK接口,但是找到一个最新2022年6月的Java项目分享了相关代码,使用docker进行环境搭建、编译,并成功启动

    目录 前言 1,关于shopify java调研 2,发现一个新的关于shopify的JavaSDK开源项目是2022年6月发布的 3,使用OAuth2 进行授权的逻辑 4,解决相关问题,解决配置依赖 ...

  8. java对象,属于你得地址找到了吗

    结婚分享,一个java程序new对象得实现过程,你的对象在那里呢,有地址了吗? 总体感慨 不知不觉10月4号就要到来了,这是准备在老婆老家办酒席,这个一办,人生中的大事也许就只剩下生娃娃了.我也不知道 ...

  9. Java学到什么程度才可以找到工作?

    非常理解,刚开始学习Java的小伙伴,尤其是那种又没钱又没有背景的,刚开始学习Java都关心这么一个问题:到底把Java学到何种程度才能找到第一份工作呢?每个人都很现实,目标都是相当的一致,都是为了能 ...

最新文章

  1. 450g吐司烘烤温度_美晨烘焙丨会吐蛋黄的黄金吐司
  2. Linux 多线程同步机制:互斥量、信号量、条件变量
  3. window.open打开一个新空白页面,不会自动刷新【解决方案】
  4. Decorator Pattern - C# 3.0 Design Patterns
  5. 十三、StringBuffer
  6. 12天背诵楞严咒的技巧_背诵楞严咒的技巧
  7. 图像处理的交并比(IoU)
  8. [分布式] ------ 全局唯一id生成之雪花算法(Twitter_Snowflake)
  9. 常见Markdown编辑博客中段落文字标记(浅红色且具有底色)怎么弄的?
  10. IntelliJ IDEA 2018 破解 汉化教程地址
  11. Linux下使用源码安装出现的坑
  12. bzoj 2440: [中山市选2011]完全平方数(二分+莫比乌斯函数)
  13. 读君山-七年阿里老人谈新人程序员的成长
  14. JSON.parse和eval的区别
  15. 应用计算机解数学模型,浅谈数学建模与计算机应用的融合
  16. 【已解决】Instances currently registered with Eureka中Application为UNKNOWN
  17. EMC辐射骚扰整改案例分析
  18. 关于物联网,互联网我们用到的通信
  19. Windows 文件夹修改为exe的原理和解决办法
  20. 如何删除多个计算机名称,电脑双系统怎么删除一个呢?教你快速删除

热门文章

  1. java-web-j2e学习建议路线
  2. About UserAccountControl
  3. python将非0数视为false_Python Numpy – 将小数字视为零
  4. 冷却水的循环方式有哪几种_VOCs2.0 | 闭式循环水系统,减少VOCs逸散的有效设施...
  5. python的idle支持两种方式_BO发布E8 Sport耳机,支持IP57防水
  6. 【免费毕设】基于Ajax+Lucene构建搜索引擎的设计和实现(源代码+lunwen)
  7. 学python电脑硬件_2020 python学习第一天————编程语言及计算机介绍
  8. 502 proxy error解决方法_老大说,网上这种获取真实IP地址的方法不对,我不信......
  9. linux如何运行windows游戏,如何在Linux上运行Windows应用程序和游戏 互联网技术圈 互联网技术圈...
  10. 你不知道的 CSS 文档流技巧,让布局更简单