前 言

为什么写作本书

阿里巴巴是国内最早使用Greenplum作为数据仓库计算中心的公司。从2009年到2012年Greenplum都是阿里巴巴B2B最重要的数据计算中心,它替换掉了之前的Oracle RAC,有非常多的优点。
Greenplum的性能在数据量为TB级别时表现非常优秀,单机性能相比Hadoop要快好几倍。
Greenplum是基于PostgreSQL的一个完善的数据库,在功能和语法上都要比Hadoop上的SQL引擎Hive好用很多,对于普通用户来说更加容易上手。
Greenplum有着完善的工具,相比Hive,整个体系都比较完善,不需要像Hive一样花太多的时间和精力进行改造,非常适合作为一些大型的数据仓库解决方案。
Greenplum能够方便地与Hadoop进行结合,可直接把数据写在Hadoop上,还可以直接在数据库上写MapReduce任务,并且配置简单。
从2010年毕业加入阿里巴巴B2B的数据仓库起,我就开始接触Greenplum数据库,并有幸维护了一年多的Greenplum数据库,积累了很多数据库的相关知识。Greenplum在国内的应用相对比较少,尤其是网上资料相当匮乏。在使用Greenplum的过程中,阿里巴巴遇到了很多困难,也积累了很多宝贵经验。
由于学习资料的匮乏,我和何勇有了将阿里巴巴使用Greenplum的一些经验技巧汇聚成书的想法,这样既总结和沉淀了自身知识,同时也可以给国内使用Greenplum的同行们提供一点帮助。

目 录 

第1章 Greenplum简介
1.1 Greenplum的起源和发展历程
1.2 OLTP与OLAP
1.3 PostgreSQL与Greenplum的关系
1.4 Greenplum特性及应用场景
1.5 小结
第2章 Greenplum快速入门
2.1 软件安装及数据库初始化
2.2 安装Greenplum的常见问题
2.3 畅游Greenplum
2.4 小结
第3章 Greenplum实战
3.1 历史拉链表
3.2 日志分析
3.3 数据分布
3.4 数据压缩
3.5 索引
3.6 小结
中篇 进 阶 篇
第4章 数据字典详解
4.1 oid无处不在
4.2 数据库集群信息
4.2.1 Gp_configuration和gp_segment_configuration
4.2.2 Gp_id
4.2.3 Gp_configuration_history
4.2.4 pg_filespace_entry
4.2.5 集群配置信息表转化
4.3 常用数据字典
4.3.1 pg_class
4.3.2 pg_attribute
4.3.3 gp_distribution_policy
4.3.4 pg_statistic和pg_stats
4.4 分区表信息
4.4.1 如何实现分区表
4.4.2 pg_partition
4.4.3 pg_partition_rule
4.4.4 pg_partitions视图及其优化
4.5 自定义类型以及类型转换
4.6 主、备节点同步的相关数据字典
4.7 数据字典应用示例
4.7.1 获取表的字段信息
4.7.2 获取表的分布键
4.7.3 获取一个视图的定义
4.7.4 查询comment(备注信息)
4.7.5 获取数据库建表语句
4.7.6 查询表上的视图
4.7.7 查询表的数据文件创建时间
4.7.8 分区表总大小
4.7.9 如何分析数据字典变化
4.7.10 获取数据库锁信息
4.8 Gp_toolkit介绍
4.9 小结

《Greenplum企业应用实战》一导读相关推荐

  1. 《用户体验设计 本质、策略与经验》一2 设计师

    本节书摘来自异步社区<用户体验设计 本质.策略与经验>一书中的第2章,第2.1节,作者[美]Robert Hoekman Jr.,更多章节内容可以访问云栖社区"异步社区" ...

  2. 《用户体验设计 本质、策略与经验》一导读

    目 录 1 简介 2 设计师 3 适应 4 理解 5 质疑 6 交流 7 劝说 8 领导 9 学习 10 不讲理

  3. 2018年用户体验设计的10个趋势

    设计和体验从未像现在这么重要.在过去的10年当中,设计不断适应着用户的新需求,发生了翻天覆地的变化.虽然我们不大可能预测太远的未来,但是我们仍然可以对明年的设计趋势有一个基本的猜测.今天的文章,我们将 ...

  4. 4点,从今天谈用户体验设计经验京东亚马逊购物

    4点意见.从今天在京东和亚马逊的购物体验谈用户体验设计 导读: 今天,想给自己买一款笔记本,货比三家.打开京东和亚马逊的首页.搜索"笔记本",在对照和购买的过程中,我有明显不同的感 ...

  5. 精美网页设计案例_用户体验设计的精美艺术

    精美网页设计案例 There are interactive experiences that simply blow you away. You know it's been a positive ...

  6. 实现线程哪种方法更好_实施数据以实现更好的用户体验设计的4种方法

    实现线程哪种方法更好 Gone are the days when design used to rely mainly on the color palettes and the creativit ...

  7. 面向对象的用户体验设计(持续更新10.29)

    注:本文为原创产品设计译文,由于原文较长,预计分为5次完成.首发PMCAFF,转载请私信,感谢捧场,欢迎交流,谢谢~ 原文:Object-Oriented UX 2012年6月,我在CNN.com工作 ...

  8. 用户体验设计和精益设计的平衡之道

    对你而言那个更重要:是制作出拥有杀手级用户体验的产品来吸引用户?还是尽快制作出能满足用户的产品并抢占大量的市场份额? 假设一款产品用户体验非常差的话,用户不会使用它,但假设作为市场上的先入者,用户也会 ...

  9. 【破茧成蝶-用户体验设计】读书笔记

    第一篇:成为用户体验设计师的信念 01.什么是用户体验设计 以用户为中心的一种设计手段,以用户需求为目标,为提升用户体验而做的设计. 用户体验设计首先是要解决用户的某个实际问题,其次是让问题变得更容易 ...

  10. 为何用户体验无法被设计,如何为用户体验设计

    近来许多设计师开始谈论用户体验(UX).我们试图取悦用户,甚至提供某种魔力,这样他们才会爱上我们的网站.应用程序和启动界面.用户体验是一个非常模糊的概念,导致许多人对它产生了错误的理解.此外,很多设计 ...

最新文章

  1. DDD分层架构最佳实践
  2. filebeat.yml配置和logstash.conf
  3. 大战设计模式【17】—— 建造者模式
  4. 数据导入和整理模块---pandas
  5. Qt使用OpenCV读取图片练习
  6. Windows命令行下的进程管理
  7. 网站图片多服务器选多大,网站上的图片一般多大合适
  8. 所有的计算机语言都必须进行多进制运算,2018职称计算机考试巩固练习及答案17...
  9. 剑指Offer面试题:16.合并两个排序的链表
  10. 干货分享,我是怎么寻找暴利赚钱项目的
  11. 代码中的时间格式问题究竟该如何处理?
  12. oracle统计每天数据增量,每天的业务数据增量导入oracle库方法讨论
  13. 最小二乘原理求解线性回归方程
  14. C++使用system( “pause “);来暂停黑窗口
  15. 深度学习神经网络画图软件汇总
  16. 写C语言代码显示一面红旗随风飘荡的动态效果
  17. 一款开源的PHP邮箱系统
  18. JS获取上周(自然周、最近七天)、上月(自然月、最近一个月)、全年的开始和结束日期
  19. 2020 操作系统 实验二 进程通信
  20. Python爬虫(一):简单小说爬取实例

热门文章

  1. Java 日志框架适配/冲突解决方案(值得收藏)
  2. 为什么要用这些框架来进行开发,直接new一个对象不香吗?
  3. 一个基于SpringBoot + Mybatis + Vue的代码生成器
  4. 通用的底层埋点都是怎么做的?
  5. 告别2019:属于深度学习的十年,那些我们必须知道的经典
  6. 细节解密:当前最佳的YOLOv4是如何炼成火眼金睛的?
  7. 提高图形匹配精度,亮风台提出「完全可训练」的图匹配方法|CVPR 2020 Oral
  8. 那些在一个公司死磕了5-10年的程序员,最后都怎么样了?
  9. 怎么才能优雅地向导师表达「这周科研没什么进展」?
  10. 2020年最火本科生专业来了!180所高校新增人工智能专业