Green Plum测试报告
最近在EMC公司就Green Plum做了下测试,总体而言,测试效果还是很不错的,在这里非常感谢EMC测试人员的协助,希望有机会能够合作。
本文先后从数据加载、数据查询、数据范围查询、数据更新、修改方面对Green Plum做了相关测试,并给出了评测结论。
第 1 章 测试环境
1.1硬件环境
测试项目 |
Oracle11G |
GreenPlum Master 节点 |
GreenPlum Segment 4节点 |
GreenPlum Segment 8节点 |
主机节点数 |
2 |
2 |
4 |
8 |
CPU |
2*4 intel 2.83GHz |
2*6 intel 3.0GHZ |
2*6 intel 2.93GHZ |
2*6 intel 2.93GHZ |
内存 |
16G |
|||
磁盘 |
146G*2(Raid1) SAS 10K |
6*300GB SAS(Raid5) |
12*600GB SAS(Raid5) |
12*600GB SAS(Raid5) |
存储 |
DELL MD3200 6Gbps SAS 36*2T(2Hotspace) 2T*8+10T( Raid5) |
N/A |
N/A |
N/A |
网络 |
2*1Gb千兆网口 |
4*1 Gb千兆网口 2*1 10GB 万兆网口 |
2*1 Gb 千兆网口 2*1 10GB 万兆网口 |
2*1 Gb 千兆网口 2*1 10GB 万兆网口 |
交换机 |
3560千兆交换机 |
万兆交换机2台,千兆交换机1台 |
1.2 软件环境
Oracle |
Green Plum |
|
操作系统&版本 |
Oracle Linux5.6 |
Linux5.5 |
数据库&版本 |
Oracle 11g 11.2.0.2.0 |
Greenplum-db-4.1.1.3 |
2.1 加载性能测试
2.1.1性能测试项目
测试项目 |
具体项目 |
Oracle 11G |
GreenPlum 4节点 |
GreenPlum 8节点 |
Copy VS SQL loader |
6400万 |
900秒 |
N/A |
N/A |
外部表 VS 外部表 |
6400万 |
N/A |
63秒 |
50秒 |
6400万*3 |
N/A |
130秒 |
76秒 |
|
Insert方式VS Insert方式 |
6400万 |
1800~9000秒 |
||
6400万*4 |
N/A |
74秒 |
39秒 |
|
6400万*8 |
N/A |
360秒 |
90秒 |
|
6400万*16 |
N/A |
356秒 |
209秒 |
2.1.2测试结果总结
从4节点与8节点的加载性能来看,性能和节点数量基本呈线性关系。
Green Plum与Oracle相比,数据加载的性能提高20倍~100倍不等。
2.2 SELECT性能测试
2.2.1性能测试项目
测试项目 |
具体项目 |
Oracle 11G |
GreenPlum 4节点 |
GreenPlum 8节点 |
单分区分组 (参见相关语句) |
Select |
120秒 |
—— |
40 |
CTAS |
33秒 |
17.5秒 |
12秒 |
|
Insert |
—— |
11.9秒 |
5.3秒 |
|
八分区分组 (参见相关语句) |
Select |
500秒 |
—— |
77.6秒 |
CTAS |
232秒 |
—— |
—— |
|
Insert |
—— |
—— |
40.5秒 |
|
三十个分区分组 (参见相关语句) |
CTAS |
—— |
—— |
207.3秒 |
单分区与八个分区分组统计 (参见相关语句) |
Select |
437秒 |
67.1秒 |
56.1秒 |
CTAS |
—— |
35.8秒 |
27.7秒 |
|
Insert |
—— |
32.4秒 |
21.9秒 |
|
单分区与三十个分区分组统计 (参见相关语句) |
Select |
—— |
230.0秒 |
—— |
IP查询语句性能测试
测试项目 |
Oracle 11G |
GreenPlum 4节点 |
GreenPlum 8节点 |
IP范围查询—by 转换后 (参见相关语句) |
约1800秒 |
—— |
约2537秒 |
IP范围查询—by函数 (参见相关语句) |
约18000秒 |
—— |
约36000秒 |
IP查询 (参见相关语句) |
—— |
21秒 |
32~98秒 |
2.2.2测试结果总结
从以上的测试数据来看,大批量的数据处理,都能够在所期望的时间内以很短的时间完成执行。通过4个节点与8个节点响应的SQL测试时间的比较来看,性能与节点数量基本上呈线性关系。
GreenPlum与Oracle相比,数据查询的性能提高3倍~20倍不等。(Oracle的测试结果已做过优化,GP则为无索引状态)
基于IP范围查询的结果见补充说明
2.2.3补充说明
对于IP范围查询(包括数字和函数比较),Green Plum和Oracle的执行性能均一般,GreenPlum还要更差一些。
为了解决这个性能问题,Green Plum对IP表做了特殊处理,即把10999行的IP表拆分成1亿多条的IP明细表,采用等关联处理,即避开nestloop方式的join而使用更为快速的hash join。修正效果显著,相同的数据关联从之前的约2500秒的处理时间降低到约20秒,有了100倍左右的提升。
2.3 UPDATE、DELETE性能测试
2.3.1性能测试项目
测试项目 |
Oracle 11G |
GreenPlum 4节点 |
GreenPlum 8节点 |
Update(30个分区) |
—— |
—— |
130.7秒 |
Delete |
—— |
—— |
12秒 |
2.3.2测试结果总结
对于大批量数据的更新和删除,Green Plum的优势更加明显,Oracle还需要加以特殊处理(即分段处理)才能进行更新和删除。
Green Plum的Update有个小问题,批量增加字段会导致整个表的大小翻倍,可以通过表的在线分析进行压缩。
Green Plum测试报告相关推荐
- Green Plum 非并行备份恢复方案
Green Plum 非并行备份恢复方案 环境 centos 7 主 145.170.41.153(master) root/123456 145.170.41.154(segment) root/1 ...
- Green Plum 备份恢复集成方案
Green Plum 备份恢复集成方案 前置条件 安装了gpbackup和gprestore备份恢复工具 不同的gpbackup会生成不同的时间戳,gprestore 必须通过–timestamp选项 ...
- 《Greenplum企业应用实战》一2.3 畅游Greenplum
本节书摘来自华章出版社<Greenplum企业应用实战>一书中的第2章,第2.3节,作者 何勇 陈晓峰,更多章节内容可以访问云栖社区"华章计算机"公众号查看 2.3 畅 ...
- UCan下午茶杭州站:突破困惑,为大数据商业化变现探寻出路
今天,对大数据的分析挖掘已经成为企业提升竞争力的全新支点.各行各业在大数据领域的商业进程明显加速,但如何让大数据发挥价值还面临很多困境. 除了数据的使用权.数据安全.数据存储等问题,现阶段,更多的人对 ...
- SQL PASS西雅图之行——会议篇
下午4点左右终于回到了Convention Center,这时参会人员已经陆续报到了. 报名登记结束后,从6点开始SQL-PASS会议组举办了一个欢迎仪式. 接下来是晚宴时间,我也终于找到了Tiffe ...
- plsql怎么导出几十w的数据到csv_Greenplum数据库使用总结(干货满满)初级使用
4 Greenplum 初级使用 4.1 Greenplum 常用命令列表 4.1.1 常用命令列表 进入到安装目录下的bin目录下,查看常用的使用命令: psql / clusterdb / cre ...
- 2020年开发踩坑记录
20200207 mybatis plus 自带insert插入异常 sql injection violation 解决方法: 使用逆向工程脚本时,生成的映射实体类在下面的注解会多table: 删除 ...
- 日常踩坑记录-汇总版
开发踩坑记录,不定时更新 心得 RTFM 严谨的去思考问题,处理问题 严格要求自己的代码编写习惯与风格 注意 单词拼写 20200207 mybatis plus 自带insert插入异常 sql i ...
- GreenPlum常用字符串函数
GreenPlum常用字符串函数如下: 测试代码: eda_gp=> select 'green'||'plum' as dbname;dbname -----------greenplum ( ...
最新文章
- 【NIO】IO多路复用
- Leaflet中获取两个地理坐标点之间的距离
- batchsize一定是2的幂_支付接口的幂等性设计
- C++之运算符重载(下)
- 一个程序员的全部,并不是“技术”!知道为什么只能当码农吗?
- BZOJ1968: [Ahoi2005]COMMON 约数研究
- 管能做暖气管道吗_地暖这么好,为什么大家都选暖气片?原因在于它的“隐性”成本...
- win7 mysql zip包如何安装_MySql 5.7.31 win7 Zip压缩包配置教程
- 【02】 PC端网页布局之CSS3-pink老师-2022/03
- coreldraw x5安装视频教程_免费史上最全的EndNote视频教程
- PLC网络流量异常检测的统计模型和神经网络模型的比较研究
- juc并发编程学习(一)
- 国外计算机著名核心期刊介绍(转)
- GK309协议电子工牌数据模拟器+Socket数据发送 JAVA版-源码
- matlab里的图像处理函数
- \t\t手纹里面的秘密
- js中click()与onclick()的区别
- 音频服务器未能正常启动,win7系统音频服务无法启动具体解决方法指引
- 初探PLC远程通讯技术
- 微信jsapi支付获取code_【微信支付】JSAPI支付开发者文档