2021SC@SDUSC

PIG在大数据平台中的位置与作用

题主并没有上过大数据相关的课程,拿出了一份之前扫盲的时候整理的资料来带给大家

Pig是一种高级数据语言,运行于HDFS之上,是hadoop上层的衍生架构

主要的几种大数据架构及其之间的关系如下图所示

按照不同功能进行划分,一些的大数据项目可以如下所示

由上图可以看出,Pig是一种查询平台,我的资料中还有以下的引用:

简介:Pig是一种编程语言,它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义(如日志文件)。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。

Pig最大的作用就是对mapreduce算法(框架)实现了一套shell脚本 ,类似我们通常熟悉的SQL语句,在Pig中称之为Pig Latin,在这套脚本中我们可以对加载出来的数据进行排序、过滤、求和、分组(group by)、关联(Joining),Pig也可以由用户自定义一些函数对数据集进行操作,也就是传说中的UDF(user-defined functions)。

Pig官方网站>>>

Pig Latin介绍

Pig Latin是一种SQL like语言 ,其功能和SQL类似

Pig源码获取

首先访问Pig官网

点击侧边栏的Releases,下拉,找到Download标题,->Downloqd a release now!

点第一个网址https://dlcdn.apache.org/pig

进去后页面是这样的

选择下载pig-0.17.0-src.tar.gz

下载后是个压缩文件,解压后用任意编程软件打开就行了

核心代码目录

根据小组分工,本人接下来将对Pig的数据类型进行分析,代码集中于/data目录

【软件工程实践】Pig项目1-什么是Pig相关推荐

  1. 【软件工程实践 · 团队项目】 第一次作业

    [软件工程实践 · 团队项目] 第一次作业 Part 0 · 简 要 目 录 Part 1 · 队 伍 阵 容 Part 2 · 会 议 记 录 相 关 Part 3 · 会 议 讨 论 记 录 Pa ...

  2. 【软件工程实践 · 团队项目】 第二次作业

    队员姓名与学号(标记组长) 学号 姓名 20165211 丁奕(组长) 20165208 孔月 20165230 田坤烨 20165226 刘香杉 队名 快奶我一口 队员风采: 全军出击!!!! 团队 ...

  3. 软件工程实践 项目开始准备

    一.环境准备 1.idea 2022.2 2.jdk 8 3.maven 4.mysql 8.0.27 (以上只是基线包需求我能想到的环境准备,后期可能会添加) 5.我使用了gitee来作为我们软件工 ...

  4. 杰克布JeecgBoot低代码开发框架,优秀的国产开源项目,软件工程实践改进

    低代码low-code,无代码no-code,合称LCNC,近年来获得较快发展,一个重要的原因是需求推动,各个行业数字化升级和工业4.0,对软件开发人员需求巨大. 一,LCNC解决方案 很多公司和创业 ...

  5. 软件工程实践2017第二次作业-----个人项目实战之数独

    软件工程实践2017第二次作业-----个人项目实战之数独 最后一门考试2017.9.16 github地址:https://github.com/ssuo/shudu 题目地址:http://www ...

  6. 软件工程python就业方向-软件工程实践总结

    软工ByeBye~ 请回望暑假时的第一次作业,你对于软件工程课程的想象 对比开篇博客你对课程目标和期待,"希望通过实践锻炼,增强计算机专业的能力和就业竞争力",对比目前的所学所练所 ...

  7. 个人作业——软件工程实践总结

    一.请回望暑假时的第一次作业,你对于软件工程课程的想象 对比开篇博客你对课程目标和期待,"希望通过实践锻炼,增强计算机专业的能力和就业竞争力",对比目前的所学所练所得,在哪些方面达 ...

  8. 个人作业收官——软件工程实践总结

    个人作业收官--软件工程实践总结 一.回望开学初对于软件工程课程的想象,回望博客开篇时对于这门课和这学期的期望, 1)对比现在的你和开学初博客开篇的课程目标和期待. 能力的预期 1.对于java的一些 ...

  9. 2017软件工程实践总结

    一.请回望暑假时的第一次作业,你对于软件工程课程的想象 1)对比开篇博客你对课程目标和期待,"希望通过实践锻炼,增强计算机专业的能力和就业竞争力",对比目前的所学所练所得,在哪些方 ...

  10. 『软件工程12』软件工程实践方法——软件测试

    软件工程实践方法-- 软件测试 一.软件测试概述 1.软件测试的目的 (1)从用户和开发者角度 (2)Myers软件测试目的 2.软件测试的原则 3.软件测试的对象 4.测试信息流 5.测试与软件开发 ...

最新文章

  1. Android--MP3播放器MediaPlayer
  2. C#面向对象名词解释(四)
  3. 深度强化学习入门介绍
  4. js word 预览_微软补丁日:Word/DHCP/LNK远程代码执行漏洞预警
  5. date时区 es logstash_elastic date时区问题解决办法
  6. 一份关于.NET Core云原生采用情况调查
  7. 卷不动也得继续学!紧跟vue3的步伐,再来get一波进阶新特性!
  8. vue-resource安装
  9. mysql 数据库查看锁表_【数据库】MySQL查看是否锁表
  10. html下拉列表兼容性,下拉菜单select样式设置(兼容IE6/IE7/IE8/火狐)
  11. SAP License:SAP顾问你算哪根葱?
  12. 【NOIP初赛】【Luogu1787】普及组2013(洛谷初赛题提交水AC方法了解一下)
  13. 《涂抹Oracle—三思笔记之一步一步学Oracle》看书笔记(第一章)
  14. 3dmax模型导入unity
  15. 聊天机器人与自动问答技术
  16. 总线型,星型,环状,树形,网状拓扑结构
  17. 网站流量日志数据分析系统与技术架构
  18. 咖说 | 新基建中区块链的位置:基础设施的基础技术
  19. delphi10.2的Date/time 实用程序单元DateUtils.pas
  20. DijkstraAlgorithm(迪杰斯特拉算法)

热门文章

  1. 视频与编解码的技术邂逅,碰撞出的高清罗曼史
  2. 关于2013年1月21日的DNS故障分析文章
  3. java架构师线下培训,万分膜拜!
  4. lucas–kanade_Lucas-Kanade光流法 | 学步园
  5. 多种方式查看电脑是否支持Modern Standby
  6. C# 调用中通快递查询物流轨迹接口
  7. 2018-2019-2 20165205《网络对抗技术》Exp4 恶意代码分析
  8. win11右键菜单和win10右键菜单修改
  9. 小程序“成语猜题”部分答案
  10. 剑指 Offer(C++版本)系列:剑指 Offer 13 机器人的运动范围