pig下载

pig版本的选择非常重要!!!
因为pig不同版本支持的hadoop版本不同,很容易因为版本不同导致错误。直接上图说明


上图可以看到,官网针对每个pig适用的hadoop版本都做了说明,所以版本选择很重要。

我用的是hadoop1.0.0。按照官网的说法,最新的pig0.17.0都是可以使用的,但是我下载下来安装后,就直接报错,经过一番尝试,最高能用的版本是pig0.12.0。坑爹!!!!
pig官网:http://pig.apache.org/ 进去后,按照下面的步骤:

进去后就是一些下载的镜像网站,随便选一个,如果发现下载速度太慢就换一个。

这里只能看到最新的pig0.16.0和pig0.17.0版本,但是1标记的地方是旧版本的链接

点击1处的链接,去下载旧版本。

我下载的是pig0.12.0

下载完成。

pig安装

解压:

tar -zxvf pig-0.12.0.tar.gz

移动到合适的位置,你自己觉得哪里合适放哪里
我是放在/usr/local下

mv pig-0.12.0 /usr/local/pig-0.12.0

配置环境变量,pig安装的前提是你成功的安装hadoop,当然也可以不安装,pig会使用自己捆绑的hadoop,不过我没试过,我是自己安装了hadoop1.0.0。
pig要配置的环境变量不多,写在/etc/profile或者~/.bashrc中都可以,我是写在~/.bashrc中的,内容如下:

# pig
export PIG_HOME=/usr/local/pig-0.12.0
export PIG_CLASSPATH=$HADOOP_HOME/conf
export PATH=$PATH:$PIG_HOME/bin

PIG_HOME当然就是你的pig的路径了,HADOOP_HOME是你的hadoop的路径。其他的配置就没有了。
完成后,先启动hadoop,输入:

start-all.sh

成功启动hadoop后才能启动pig。输入:

pig


出现grunt>的输入提示就表明pig安装并启动成功了。

第一个红色框中指出了你的pig的版本;
第二个红色框指出了错误日志的存放目录(这个位置默认是在~/下,所以最好改一下,不然会有很多日志文件)
修改错误日志的存放路径:打开你的pig目录conf目录下的pig.properties文件。
找到pig.logfile变量,先取消注释,然后后面加上你想要存放错误日志的路径,错误日志能查看错误信息,很适合调试问题。

第三个红色框表明了pig连接hadoop的hdfs;
第四个红色框表明了pig连接hadoop的mapreduce。

至此,pig的安装配置和启动都完成了。

eclipse中集成PigPen插件

这里有一个英文的配置教程:https://wiki.apache.org/pig/PigPen

1)先要下载这个插件:https://issues.apache.org/jira/browse/PIG-366

选择一个版本下载即可。我用的是0.04的版本,0.7.5和0.7.4我试过了,不能用,只能看到一个图标,所以替换成了0.04的版本。

2)下载完成后,将插件放到eclipse/plugins/下,然后重启eclipse

若能看到PigPen的选项,说明插件成功导入了。

修改Pig jar location项,点击Browse,在你的pig目录下找到pig-x.x.x.jar

点击“New”添加key:ConfigurationPath ; value:你的pig的conf目录路径

点击“Apply”,点击“ok”。

添加了插件后,eclipse的工具栏会多出来三个按钮:

3)新建一个project(最简单的project)

然后新建一个文件,以.pig作为后缀
添加如下内容:

records = load 'PigData/testsmall' using PigStorage(',')
as(year:chararray,temperature:int,quality:int);
dump records;

保存。

到这里就出现问题了,点击那三个按钮的第一个按钮:

点击第二个按钮:


这里提示ConfigurationPath没有配置,但是我确实已经配置过了,不知道为什么会报错,而且Failed to create DataStorage也不知道是什么错误,网上的资料太少了。
点击第三个按钮:

Launching the job!
Using the configuration from /usr/local/pig-0.12.0/conf
2017-10-27 16:49:31,683 [main] INFO  org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: hdfs://localhost:9000
java.lang.RuntimeException: Failed to create DataStorageat org.apache.pig.backend.hadoop.datastorage.HDataStorage.init(HDataStorage.java:74)at org.apache.pig.backend.hadoop.datastorage.HDataStorage.<init>(HDataStorage.java:57)at org.apache.pig.backend.hadoop.executionengine.HExecutionEngine.init(HExecutionEngine.java:184)at org.apache.pig.backend.hadoop.executionengine.HExecutionEngine.init(HExecutionEngine.java:132)at org.apache.pig.impl.PigContext.connect(PigContext.java:172)at org.apache.pig.PigServer.<init>(PigServer.java:137)at org.apache.pig.tools.grunt.Grunt.<init>(Grunt.java:43)at org.apache.pig.Main.main(Main.java:241)
Caused by: java.io.IOException: Call failed on local exceptionat org.apache.hadoop.ipc.Client.call(Client.java:718)at org.apache.hadoop.ipc.RPC$Invoker.invoke(RPC.java:216)at org.apache.hadoop.dfs.$Proxy0.getProtocolVersion(Unknown Source)at org.apache.hadoop.ipc.RPC.getProxy(RPC.java:319)at org.apache.hadoop.dfs.DFSClient.createRPCNamenode(DFSClient.java:104)at org.apache.hadoop.dfs.DFSClient.<init>(DFSClient.java:174)at org.apache.hadoop.dfs.DistributedFileSystem.initialize(DistributedFileSystem.java:67)at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:1339)at org.apache.hadoop.fs.FileSystem.access$300(FileSystem.java:56)at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:1351)at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:213)at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:118)at org.apache.pig.backend.hadoop.datastorage.HDataStorage.init(HDataStorage.java:71)... 7 more
Caused by: java.io.EOFExceptionat java.io.DataInputStream.readInt(DataInputStream.java:392)at org.apache.hadoop.ipc.Client$Connection.receiveResponse(Client.java:499)at org.apache.hadoop.ipc.Client$Connection.run(Client.java:441)

报这个错误,也查不到相关的资料。

pig安装配置以及PigPen插件与eclipse的集成相关推荐

  1. 关于svn的安装配置开启服务过程和 eclipse安装SVN插件的方法

    eclipse安装SVN插件的方法链接:https://www.cnblogs.com/alamps/p/6155963.html svn的安装配置开启服务相关过程: 安装一直下一步cmd中:echo ...

  2. 安装配置postman及插件

    自己记录过程: 下载地址:https://www.postman.com/downloads/ 自动安装下一步 注册账户登录 注意 Postman⼀旦安装成功,不要轻易卸载! Postman有BUG, ...

  3. 安装配置java,tomcat,eclipse

    2019独角兽企业重金招聘Python工程师标准>>> 一.下载及安装java jdk 1.java jdk 下载:http://pan.baidu.com/s/1eRf7W6Q 2 ...

  4. WordPress丸子小程序从零到一搭建小程序[安装配置小程序插件]

    B站视频安装教程: 零基础小程序搭建上https://b23.tv/kWcbq9 零基础小程序搭建下https://b23.tv/ek7RZR 腾讯云视频安装教程 零基础小程序搭建上https://v ...

  5. WIN7下vim安装配置整理(插件齐全)

    首先安装spf13-vim,spf13集成Vundle,NeedTree,Ctrl-P等,再安装YouCompleteMe,Cscope,最后配上MacType外观. 要求系统WIN7以上,我用的是W ...

  6. svn与eclipse的集成(第三方插件与eclipse的集成)

    在eclipse中点击Help,选中install  from site.. 转载于:https://www.cnblogs.com/hwgok/p/5893501.html

  7. Eclipse 安装配置总结(WST WTP)(转)

    为什么80%的码农都做不了架构师?>>>    Eclipse 安装配置总结(WST WTP)(转) Eclipse 是最流行的功能强大的java IDE,有丰富的插件,配合插件可以 ...

  8. eclipse 2020-06版 安装配置完美教程(最后一版支持jdk1.8)

    eclipse 2020版 安装配置完美教程   声明:此博客为本人原创,但是由于发布第一版时,就已经被其他平台抄袭,导致原创文章在第二次修订的时候被视为抄袭他人作品,并被百度等搜索引擎屏蔽,所以特地 ...

  9. 8、Hudson集成服务器的安装配置与使用

    Hudson集成服务器的安装配置与使用 IP:192.168.159.120 center os 6.5 + jdk1.8 hudson不需要数据库支持 Hudson 只是一个持续集成服务器(持续集成 ...

最新文章

  1. 五分钟带你了解哈希算法
  2. JS判断GridView中复选框有没有被选中
  3. CTF(pwn)-格式化字符串漏洞讲解(二) --攻防世界CGfsb
  4. C++用二进制交换二个数的实现算法(附完整源码)
  5. 学习进度条——第八周
  6. 我的AWS开发人员考试未通过。 现在怎么办?
  7. 笨方法python3_“笨方法”学Python3,习题 43 。
  8. 同一列两行数据怎么合并成一行_经常加班怎么办?两分钟学会这4招,让同事刮目相看!...
  9. java毕业设计古典舞在线交流平台mybatis+源码+调试部署+系统+数据库+lw
  10. SAP-MM MRP类型详解
  11. Python计算机视觉之特征提取与图像匹配
  12. 数据结构与算法笔记 二叉树、二叉搜索树、二叉平衡树的区分与关系
  13. Linux 磁盘管理 高级篇 -- quota,RAID,LVM
  14. python绘画海贼王_Python入门之生成海贼王云图
  15. Photoshop图层混合公式
  16. keypair java_Java KeyPairGenerator genKeyPair()用法及代码示例
  17. 11.[STM32]PWM脉宽调制-呼吸灯
  18. Latex最后一页文本或参考文献左右对齐(平衡)
  19. accumulate详细用法
  20. TWS耳机OVP芯片,过压保护电路芯片

热门文章

  1. 连接数据库,OleDbDataReader读取mdb的数据
  2. SOLID Design Principle
  3. 【C语言】有一行电文,已按下面规律译成密文:A->Z a->z即第一个字母变成第26个字母,第i个字母变成第(26-i+1)个字母。非字母字符不变。要求编写程序将密文译回原文并输出。请使用数组实现。
  4. 物联网wifi模块一键配置
  5. 【Octave】柱面投影简析
  6. 《怪物猎人:崛起》那满满的和风从何而来?
  7. win10下nodejs内存泄漏查找工具node-heapdump和node-memwatch的安装
  8. Nodejs 如何发送邮件(Gmail 和 126邮箱)
  9. 手机电子词典_当年我们玩过的那些手机自带游戏,每一款都堪称是元祖级游戏...
  10. JavaWeb学习Day02(狂神说Java)