公司的hadoop集群是之前的同事搭建的,我(小白一个)在spark shell中读取hdfs上的文件时,执行以下指令

>>> word=sc.textFile("hdfs://localhost:9000/user/hadoop/test.txt")
>>> word.first()

报错:java.net.ConnectException: Call From hadoop/133.0.123.130 to localhost:9000 failed on connection exception: java.net.ConnectException: Connection refuse。看来是hdfs与本地服务器连接出了问题,我又查看了以下hdfs上的文件,发现可以正常查看,这说明本地服务器与hdfs的连接、通信是没有问题的!思来想去,我有换另外一种方式读取hdfs上的文件

>>> word=sc.textFile("/user/hadoop/test.txt")
>>> word.first()

因为spark中默认读取的就是hdfs上的文件,因此这种方式也是可以的,结果发现运行正常,这下问题就明了了,是“localhost:9000”出了问题,我查看了hadoop/etc/core-site.xml中端口设置

显示端口设置正常,那么应该是localhost对应的IP地址不对了!接着查看hosts文件,发现

发现localhost对应的IP地址与本地服务器IP地址不一致,终于找到原因了,我将读取hdfs文件的指令更改为:

>>> word=sc.textFile("hdfs://hadoop:9000/user/hadoop/test.txt")
>>> word.first()

结果正常了。

转载于:https://www.cnblogs.com/hgz-dm/p/11356357.html

记录一次读取hdfs文件时出现的问题java.net.ConnectException: Connection refused相关推荐

  1. Hdfs连接报错java.net.ConnectException: Connection timed out: no further information

    目录 1 连接超时 2 排查具体问题 2.1.检查网络能不能ping通,防火墙问题 2.2 检查zookeeper有没有开启 2.3 最后检查Hue中Hdfs节点挂掉 3 解决方法 1 连接超时 2 ...

  2. python读取HDFS文件

    2019独角兽企业重金招聘Python工程师标准>>> ###方法一:使用hdfs库读取HDFS文件 ###在读取数据时,要加上 encoding='utf-8',否则字符串前面会有 ...

  3. C#读取excel文件时,报“外部表不是预期的格式”

    记录 读取Excel文件时报错 比较全面的问题汇总:转自https://blog.csdn.net/question00/article/details/51445663 最后发现我的excel文件的 ...

  4. python读取csv文件并修改指定内容-pandas读取CSV文件时查看修改各列的数据类型格式...

    下面给大家介绍下pandas读取CSV文件时查看修改各列的数据类型格式,具体内容如下所述: 我们在调bug的时候会经常查看.修改pandas列数据的数据类型,今天就总结一下: 1.查看: Numpy和 ...

  5. Qt读取TXT文件时,GBK与UTF-8编码判断

    读取txt文件时,很多时候无法获取文件的编码格式.如果直接进行使用,则有可能出现乱码.需要在使用前将其转为Unicode(Qt的默认编码格式). 虽然实际的编码格式种类非常多,但平常主要使用的有GBK ...

  6. Spark没有读取HDFS文件的方法?那textFile是怎么读的?

    直入正题吧,ctrl+鼠标点进textFile方法. package org.apache.spark ......... /*** Read a text file from HDFS, a loc ...

  7. python csv文件复制时的编码问题_使用python读取CSV文件时的编码问题

    尝试使用python读取CSV文件时遇到障碍. 更新:如果只想跳过字符或错误,可以打开文件,如下所示: with open(os.path.join(directory, file), 'r', en ...

  8. pythoncsv数据类型_pandas读取CSV文件时查看修改各列的数据类型格式

    下面给大家介绍下pandas读取CSV文件时查看修改各列的数据类型格式,具体内容如下所述: 我们在调bug的时候会经常查看.修改pandas列数据的数据类型,今天就总结一下: 1.查看: Numpy和 ...

  9. spring使用@Value注解读取.properties文件时出现中文乱码问题的解决

    spring使用@Value注解读取.properties文件时出现中文乱码问题的解决 参考文章: (1)spring使用@Value注解读取.properties文件时出现中文乱码问题的解决 (2) ...

最新文章

  1. UVa540 Team Queue
  2. 理解 Linux 网络栈(2):非虚拟化Linux 环境中的 Segmentation Offloading 技术
  3. python网络编程自学_五分钟搞定Python网络编程实现TCP和UDP连接
  4. 给一线讲产品·7期|用户在云上如何快速搭建安全防护体系?
  5. 计算机网络自查分析报告,网络安全自查报告
  6. 深度学习-吴恩达-笔记-5-深度学习的实践层面
  7. 疑似Bug:简书安卓10.7首页搜索关键字屏蔽敏感词不彻底
  8. 2019-4(2)-数据挖掘学习笔记
  9. ELK 性能(1) — Logstash 性能及其替代方案
  10. ldd usr bin mysql_ldd与otool
  11. 文件管理器android实现,基于Android的文件管理器的设计与实现
  12. scrum敏捷开发流程介绍和心得
  13. 当你不能够再拥有,你唯一可以做的,就是令自己不要忘记
  14. 6python项目 体脂率计算优化2
  15. 盘点20款让你脑洞大开的AR技术应用
  16. 跟着示例学Ubuntu UFW防火墙设置
  17. js中offsetHeight,offsetWidth,offsetTop,offsetLeft属性的使用
  18. java使用代理ip爬取网站内容
  19. [ UICompatibilityInputViewController ] WillAppear 崩溃处理
  20. 数字图像处理期末大作业 完成总结

热门文章

  1. Uber无人车在旧金山不仅仅是闯红灯,更大的问题是违法上路
  2. 那些年追过的......写过的技术博客
  3. 对java多线程里Synchronized的思考
  4. Docker学习笔记 — Docker私有仓库搭建
  5. 递归打印组合数、搜索模板
  6. if...else 小练习
  7. C#自定义工业控件开发
  8. 人人都能看懂LSTM
  9. 人类语言的表现形式和规则
  10. Django-model中的Querysets