转载原文:http://www.itpub.net/thread-1409964-1-1.html

什么是GREENPLUM?
对于很多IT人来说GREENPLUM是个陌生的名字。简单的说它就是一个与Oracle、DB2一样面向对象的关系型数据库。我们通过标准的SQL可以对GP中的数据进行访问存取。

GREENPLUM与其它普通的关系型数据库的区别?
本质上讲GREENPLUM是一个关系型数据库集群. 它实际上是由数个独立的数据库服务组合成的逻辑数据库。与RAC不同,这种数据库集群采取的是MPP架构。如下图所示

它的组件分成三个部分MASTER/SEGMENT以及MASTER与SEGMENT之间的高效互联技术GNET。其中MASTER和SEGMENT本身就是独立的数据库SERVER。不同之处在于,MASTER只负责应用的连接,生成并拆分执行计划,把执行计划分配给SEGMENT节点,以及返回最终结果给应用,它只存储一些数据库的元数据,不负责运算,因此不会成为系统性能的瓶颈。这也是GREENPLUM与传统MPP架构数据库的一个重要区别。 SEGMENT节点存储用户的业务数据,并根据得到执行计划,负责处理业务数据。也就是用户关系表的数据会打散分布到每个SEGMENGT节点。当进行数据访问时,首先所有SEGMENT并行处理与自己有关的数据,如果需要segment可以通过进行innterconnect进行彼此的数据交互。 segment节点越多,数据就会打的越散,处理速度就越快。因此与SHARE ALL数据库集群不同,通过增加SEGMENT节点服务器的数量,GREENPLUM的性能会成线性增长。

GREENPLUM适用场景?

GREENPLUM虽然是关系型数据库产品,它的特点主要就是查询速度快,数据装载速度快,批量DML处理快。而且性能可以随着硬件的添加,呈线性增加,拥有非常良好的可扩展性。因此,它主要适用于面向分析的应用。比如构建企业级ODS/EDW,或者数据集市等等。

GREENPLUM运行的平台?

GREENPLUM运行在X86架构的硬件平台上,目前支持的操作系统包括32/64位的 LINUX(REDHAT/SUSE)/SOLARIS/MAC OS

GREENPLUM的前景?

GREENPLUM 诞生于2003年硅谷,2010/07 EMC收购了GREENPLUM,并把GREENPLUM作为EMC面向分析云的战略核心产品,加以大力发展。该产品不仅在国际市场发展很快,在国内市场发展也很快。最著名的案例就是阿里巴巴集团,经过多种产品的精心选型,最终选择GREENPLUM作为它们的数据仓库平台存放数百TB的业务数据去高效支持各种分析应用。

如何学习GREENPLUM?

正是由于产品发展速度很快,但是在相关人才上存在很大缺口。因此,我个人认为对于各位有兴趣的技术人员来说,是一个很好的职业发展机会。以个人经验来说,只要有其它关系型数据库的基础,尤其是POSTGRESQL或者INFORMIX基础的(因为GREENPLUM是在POSTGRESQL基础上开发出来的),很容就可以上手学习并掌握GREENPLUM。
GREENPLUM的手册写的非常好,完全可以作为入门的教材使用。其软件本身也是软性LICENSE,用于学习研究完全免费,而且与生产环境并无不同,这与ORACLE完全一样。

如何下载GREENPLUM的资料?

官方途径可以从网站 http://www.greenplum.org 上下载手册和软件。但国内由于网络问题,可能不太好用。希望论坛或者哪位同志能提供一个好用的网盘,我愿意与大家分享相关软件和资料。

什么是GREENPLUM相关推荐

  1. greenplum 数据库如何增加列_Greenplum行存与列存的选择以及转换方法-阿里云开发者社区...

    背景 数据在数据库中的存储形式多种多样,比较常见的如 1. PostgreSQL的堆表,以行的形式存储,(当变成字段压缩后的长度超过数据块的四分之一时,会以TOAST的形式存储到TOAST表). 2. ...

  2. GreenPlum学习笔记:基础知识

    一.介绍 GreenPlum分布式数据仓库,大规模并行计算技术. 无共享/MPP核心架构 Greenplum数据库软件将数据平均分布到系统的所有节点服务器上,所以节点存储每张表或表分区的部分行,所有数 ...

  3. 浅谈Greenplum的Boolean类型与Text类型之间的转换

    在Greenplum或者Deepgreen中,如果我们想直接把Boolean类型转化为Text,那么可能会让你失望,因为他们不支持这种直接转化,但是可以通过UDF的方式实现,下面来简单看一下这个过程. ...

  4. 《Greenplum企业应用实战》一导读

    前 言 为什么写作本书 阿里巴巴是国内最早使用Greenplum作为数据仓库计算中心的公司.从2009年到2012年Greenplum都是阿里巴巴B2B最重要的数据计算中心,它替换掉了之前的Oracl ...

  5. hive外部表改为内部表_3000字揭秘Greenplum的外部数据加载——外部表

    外部表是greenplum的一种数据表,它与普通表不同的地方是:外部表是用来访问存储在greenplum数据库之外的数据.如普通表一样,可使用SQL对外部表进行查询和插入操作.外部表主要用于Green ...

  6. oom 如何避免 高并发_【转载】如何避免OOM?看Greenplum的最佳实践

    导致数据库 OOM 报错的原因可能有: 数据库节点内存不足 操作系统内存相关的内核参数配置不当 数据倾斜,导致某些查询时,某个 SEGMENT 需要申请的内存超大 查询倾斜,例如某些聚合.窗口函数的分 ...

  7. greenplum 存储过程_如何使用Greenplum提升PB级数据处理能力

    作者 个推高级数据研发工程师 糖炒栗子 前言:近年来,移动互联网.物联网.云计算的快速发展,催生了海量的数据.在大数据处理方面,不同技术栈所具备的性能也有所不同.如何快速有效地处理这些体量庞大的数据, ...

  8. Greenplum Hadoop分布式平台大数据解决方案实战教程

    基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析 [上集]百度网盘下载:链接:http://pan.baidu.com/s/1eQJFXZ0 密码:kdx9 [下集]百 ...

  9. greenplum安装札记(待完善)

    1.安装配置 1.1硬件配置 硬件服务器用到某私有云中ip段为192.168.228.111-192.168.228.120的十台服务器,相关主要配置如下表: 类别 主机名 IP 内存 硬盘 主要目录 ...

  10. Greenplum介绍

    一.Greenplum的发展历史 Greenplum的发展可以分为下面6个阶段: 图 1 Greenplum时间线 Postgres关系型数据库.Postgres是UC Berkeley开发的关系型数 ...

最新文章

  1. [原]OpenCV2.2无法打开摄像头或读取视频的解决方法
  2. 前端实现可绘制的canvas画布_前端图形学基础(五)——Canvas状态管理
  3. MySQL 基础--时间戳类型
  4. matlab用mkdir在指定的文件夹下创建新的文件夹,并把图像保存在该文件夹内
  5. 超级搜索术-朱丹-全部笔记整理
  6. pc端ui图片尺寸_聊聊PC端页面适配
  7. 笔记本固态硬盘大容量升级系统迁移(三天时间亲自实践,避坑专用)
  8. N-Tiers设计系列(一):传统Asp运作方式
  9. 几种视频格式(RMVB,FLV,MP4,AVI等等)区别比较
  10. 【从菜鸟到高手】日期格式化
  11. 算法设计与分析5.11求解满足方程解问题
  12. 12 权重衰退【动手学深度学习v2】
  13. This primary key of “id“ is primitive
  14. php 打印curl请求的header信息和返回的header信息
  15. 将Spine动画导入unity
  16. 7N60-ASEMI场效应管7N60
  17. dcs服务器性能指标,ECS700组态及DCS性能指标试题
  18. 【用Java爬取网页图片——爬虫爬取数据】
  19. 2021开鲁一中高考成绩查询,2021年通辽中考所有高中学校排名 通辽重点高中分数线...
  20. 区块链的本质是什么?看完这篇秒懂!

热门文章

  1. “AI理论之父应该是哥德尔”,LSTM之父再抛惊人观点,网友:他有点走火入魔...
  2. 如何用PyTorch进行语义分割?一个教程教会你|资源
  3. 深度学习已成强弩之末?Bengio等大牛NeurlPS2019上支招
  4. 揭秘华为麒麟990 5G:提前3年布局,百亿晶体管把7nm用到了极致
  5. Vue面试中经常会被问到的面试题
  6. Android进阶(六)Binder机制
  7. 【git】 重置文件
  8. JS学习之路之JavaScript match() 方法
  9. 实用ExtJS教程100例-009:ExtJS Form无刷新文件上传
  10. html页面内容改变,但是网页内容不变