一、什么是pig?
Pig可以看做hadoop的客户端软件,可以连接到hadoop集群进行数据分析工作
Pig方便不熟悉java的用户,使用一种较为简便的类似于SQL的面向数据流的语言pig latin进行数据处理
Pig latin可以进行排序、过滤、求和、分组、关联等常用操作,还可以自定义函数,这是一种面向数据分析处理的轻量级脚本语言
Pig可以看做是pig latin到map-reduce的映射器

二、pig安装配置
1、下载安装pig
pig下载地址: https://mirrors.tuna.tsinghua.edu.cn/apache/pig/pig-0.16.0/
2、创建Pig目录与解压

[root@test1 home]# mkdir pig   //创建pig目录
[root@test1 home]# cd pig
[root@test1 pig]# rz       //上传pig`至hadoop
[root@test1 pig]# tar -zxvf pig-0.16.0.tar.gz -C      //解压至pig目录

3、环境变量的修改

[root@test1 pig]# vi /etc/profile
export PIG_HOME=/home/pig/pig-0.16.0
export PATH=$PATH:$PIG_HOME/bin
export PIG_CLASSPATH=/home/hadoop/hadoop/etc/hadoop
[root@test1 pig]# source /etc/profile

4、检测pig是否安装成功

[root@test1 pig]# pig
19/05/25 21:54:40 INFO pig.ExecTypeProvider: Trying ExecType : LOCAL
19/05/25 21:54:40 INFO pig.ExecTypeProvider: Trying ExecType : MAPREDUCE
19/05/25 21:54:40 INFO pig.ExecTypeProvider: Picked MAPREDUCE as the ExecType
2019-05-25 21:54:40,881 [main] INFO  org.apache.pig.Main - Apache Pig version 0.16.0 (r1746530) compiled Jun 01 2016, 23:10:49
2019-05-25 21:54:40,881 [main] INFO  org.apache.pig.Main - Logging error messages to: /home/pig/pig_1558792480869.log
2019-05-25 21:54:41,230 [main] INFO  org.apache.pig.impl.util.Utils - Default bootup file /root/.pigbootup not found
2019-05-25 21:54:43,842 [main] INFO  org.apache.hadoop.conf.Configuration.deprecation - mapred.job.tracker is deprecated. Instead, use mapreduce.jobtracker.address
2019-05-25 21:54:43,842 [main] INFO  org.apache.hadoop.conf.Configuration.deprecation - fs.default.name is deprecated. Instead, use fs.defaultFS
2019-05-25 21:54:43,842 [main] INFO  org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: hdfs://test1:9000
2019-05-25 21:54:48,299 [main] INFO  org.apache.pig.PigServer - Pig Script ID for the session: PIG-default-93484d75-acf6-4850-9626-8b842d9fa45a
2019-05-25 21:54:48,299 [main] WARN  org.apache.pig.PigServer - ATS is disabled since yarn.timeline-service.enabled set to false
grunt> 

三、pig的两种模式
本地模式:所有文件和执行过程都在本地,一般用于测试程序
输入pig –x local

Mapreduce模式(hadoop模式):实际工作模式
输入pig

四、xtfp6下载(Xftp是一个功能强大的SFTP、FTP 文件传输软件。用于下载pig需要的jar包)
下载地址:https://www.jb51.net/softs/621765.html

五、pig的jar包上传
1、pig目录下的pig-0.14.0-core-h2.jar
为什么不用pig-0.14.0-core-h1.jar?(因为hadoop是hadoop-2.9.2版本)
2、lib目录下所有jar包
3、hadoop-2.9.2/share/Hadoop/common下所有jar包
4、hadoop-2.9.2/share/hadoop/common/lib下所有jar包
5、/home/pig/pig-0.14.0/lib/h2下所有jar包
6、进入eclipse

取名pig
新建lib文件夹,把下载好的jar包复制粘贴到lib
然后选择所有的jar包,build path变成小奶瓶
环境搭建好啦。

Pig下载与安装与使用相关推荐

  1. ZK锦集:Zookeeper的下载和安装 | 真/伪集群的快速搭建| 总结的很详细

    前言 文章力求:通俗易懂.图文并茂.系统全面,语言精练,主要介绍以下知识点: 1.zk基础知识铺路,做到屋里有粮,心中不慌 2.zk的下载.安装.核心参数配置.节点参数释义 3.zk集群快速搭建的两种 ...

  2. MySQL下载与安装教程以及环境变量配置

    MySQL下载 1 搜索mysql 选择mysql downloads 如下 2 点击滑动到底部选择社区版本(免费) 如下 3 选择Community Server 如下 4 选择对应的版本下载 我选 ...

  3. java jdk 1.8 安装_下载、安装、配置 java jdk1.8

    近期配置react native的开发环境,所以就从配置环境开始.rn的环境配置有那么几项,其中重要的一个就是java jdk(Java Development Kit 的缩写),那么以下就是下载.安 ...

  4. vs安装一直在提取文件_Visual Studio 2019下载及安装教程

    宸1分钟前 这可是我珍藏多年的资源啊. Visual Studio 2019 Microsoft Visual Studio(简称VS)是美国微软公司的开发工具包系列产品.是目前最流行的Windows ...

  5. python安装包_迈出Python学习第一步:Python开发环境的下载与安装

    所谓"磨刀不误砍柴工"."工欲善其事,必先利其器",都在告诉我们一个道理:要做好一个事情,事先做好充分的准备工作是非常重要的.所以在我们正式学习用Python编 ...

  6. oracle怎么下载安装,Oracle数据库的下载和安装方法

    一.Oracle数据的下载与安装: 我这里是Oracle Database 11g Release 2版本的. 1.百度云链接: 链接:https://pan.baidu.com/s/1QYvBVS3 ...

  7. 我的世界php安装,我的世界Linux搭建网页后台Multicraft下载与安装

    小编为大家带来了<我的世界>Linux搭建网页后台Multicraft下载与安装,首先下载Multicraft Linux版,下载好了以后请玩家自己看着下面的教程来安装. 64位:http ...

  8. Editplus下载、安装并最佳配色方案(强烈推荐)

    不多说,直接上干货! Editplus下载 第一步:进入官网 https://www.editplus.com/ 第二步:下载 https://www.editplus.com/download.ht ...

  9. docker基础文档(链接,下载,安装)

    一.docker相关链接 1.docker中国区官网(包含部分中文文档,下载安装包,镜像加速器):https://www.docker-cn.com/ 2.docker官方镜像仓库:https://c ...

最新文章

  1. android studio怎么输出文本,Android Studio 如何获取 text文本内容
  2. 数据库异常 :java.sql.SQLException: Access denied for user ‘root‘@‘localhost‘ (using password: YES)
  3. C# delegate event
  4. 现代密码学5.4--对哈希函数的攻击
  5. Asp.net正则获取html内容
  6. Linux命令必知必会
  7. [Hive_6] Hive 的内置函数应用
  8. Linux 下搭建Apache,Linux 下搭建Apache 服务器
  9. pyspark读取json文件中的内容
  10. arcgis运行慢_ArcGIS Pro运行较慢的诊断方法
  11. 安装JDK_Tomcat
  12. JS日期前后一天方法
  13. python爬取斗鱼弹幕_【Python3爬虫】斗鱼弹幕爬虫
  14. 如何配置ASP运行环境
  15. 刚体运动学公式_1.力的观点 ⑴.匀变速直线运动中常见的公式: 牛顿第二定律: 运动学公式:.... ⑵.圆周运动的主要公式:...
  16. linux内核热插拔,Linux热插拔机制的介绍和应用
  17. 【pandas】set_index函数详解
  18. python编程语言的缺点-多种编程语言的优缺点梳理
  19. 华为设备BFD实战,双向转发检测BFD详解,理论+实战+抓包分析
  20. 实验三 使用CSS3

热门文章

  1. 多普达c838、c858侧滑键盘的利器--支持硬键盘的A4输入法
  2. [附源码]计算机毕业设计springboot高校流浪动物领养网站
  3. 鲁棒优化入门(一)——工具箱Xprog和RSOME的安装与使用
  4. CBTC系统车载人机界面的设计与实现
  5. 达梦数据库备份还原中出现的错误
  6. (MATLAB)一维信号峰值检测findpeaks
  7. destoon首页底部加产品分类拼音索引
  8. Origin作图流程
  9. 最常见的游戏建模软件有哪些?
  10. 如何处理​PHP 表单?