presto背景及发展

长话短说,大数据时代,hadoop的解决方案,解决了完美的大数据存储和很好的解决了计算的问题,但是由于hadoop采用的是一套MR的解决方案,这就导致hadoop可以解决大批量的离线计算问题但是不能很好的解决AC-hoc的问题,faceBook开源了presto

presto的特点

多数据源
支持sql
支持混合查询
拓展性
混合计算
高性能
内存计算,流水线

presto的服务进程

coordinator :coordinator为整个presto的管理节点,接受客户端的查询,查询语句的解析,生成查询语句执行计划,stage和task的调度。
worker:在presto集群中存在多个work节点和一个coordinator节点,work节点处理task并执行以及进一步对task读入的spit进行一系列的操作和处理,每隔一段时间想coordinator通报自己的情况,coordinator会在存货的worker中挑选出还是worker节点去运行task

presto的模型
connectorpresto通过各种各项的connect来连接数据源,connect的信息配置在$PRESTO_HOME/etc/catalog/xxxx.properties,其中connection.name,presto就使用这个参数来确定使用那个connector来访问这个数据源。
catalog一个catalog类似一个MySQL的实例,其中xxx.properties.的文件名字就是catalog的名字,xxx.properties中描述了相关的连接信息。
schema类似一个数据库
table类似一个table
presto的执行流程
client---coordinate---多个worker---query---拆分成多个stage--中间通过exchange连接---拆分成task---一个或者多个driver
---spit--多个oprate--page(1M 16*1024数据)---多个block

presto(一) presto概述相关推荐

  1. presto 0.166概述

    presto是什么 是Facebook开源的,完全基于内存的并⾏计算,分布式SQL交互式查询引擎 是一种Massively parallel processing (MPP)架构,多个节点管道式执⾏ ...

  2. Presto学习-presto介绍

    1.presto基本概念 1.1 presto服务进程 presto集群中一共有两种服务器进程:coordinator服务进程和worker服务进程,其中coordinator服务进程的主要作用是:接 ...

  3. 【presto】presto编译报错整理(大全)

    问题一: 报错信息: 1) Explicit bindings are required and com.facebook.presto.execution.TaskManager is not ex ...

  4. Presto (一) --------- Presto 简介

    目录 一.Presto 概念 二.Presto 架构 三.Presto 优缺点 四.Presto.Impala 性能比较 一.Presto 概念 Presto 是一个开源的分布式 SQL 查询引擎,数 ...

  5. 深入理解Presto(1) : Presto的架构

    简介 Presto是一个facebook开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节.presto的架构由关系型数据库的架构演化而来.presto之所以能在各个内存计算型 ...

  6. 【presto 】presto 新版本升级详情

    一.前言 升级版本: 旧版本:0.220 → 新版本: 0.269 升级目的: 新版本对于老版本做了很多优化,提高服务稳定性. 新版本需要兼容老版本的功能,并且对业务方是透明的. 引入更为严格的内存判 ...

  7. Presto (二) --------- Presto 安装

    目录 一.Presto Server 安装 二.Presto 命令行 Client 安装 三.Presto 可视化 Client 安装 一.Presto Server 安装 A.官网地址 https: ...

  8. Presto (三) --------- Presto 优化

    目录 一.数据存储 二.查询 SQL 三.注意事项 一.数据存储 A.合理设置分区 与 Hive 类似,Presto 会根据元数据信息读取分区数据,合理的分区能减少Presto 数据读取量,提升查询性 ...

  9. 【presto】presto查询报错整理

    问题一: 报错内容: Error running query: Corrupted statistics for column "[firstcontactsname] optional b ...

最新文章

  1. 2018年人工智能将赋能所有行业,未来市场将超过400亿美元
  2. 2017瞻博网络年会隆重召开 重点发力电信和OTT两大市场
  3. oracle expdp/impdp exclude=STATISTICS
  4. 让博客园博客中的图片支持fancybox浏览
  5. asp.net ViewState详解
  6. 【HDU - 4056】Draw a Mess (并查集 or 线段树)
  7. android程序更改pdf文件格式,Android根据pdf模板生成pdf文件
  8. ue 抗锯齿 渲染序列失灵_最大的锯齿形序列
  9. 【bzoj1370】[Baltic2003]Gang团伙 并查集
  10. 经典排序之 归并排序
  11. Spss-kmeans聚类分析操作
  12. PowerDNS Authoritative Server 3.3 发布
  13. 2022-2027年中国稻壳提纯硅产品市场竞争态势及行业投资前景预测报告
  14. windows10 右下角任务栏 隐藏图标
  15. 猜大小(python)
  16. 数据挖掘与数据分析项目链家租房数据(一)数据爬虫
  17. 使用腾讯云模板发送短信验证码
  18. AE自带抠像插件解释
  19. java——配置环境变量
  20. 图片尺寸,分辨率和像素的理解

热门文章

  1. 医院三级医院信息系统验收标准
  2. 个人通讯录系统——数据库课程设计
  3. 计算机模块中的画板英文,画图板
  4. Empirical Covariance 经验协方差 sklearn
  5. 记一次lumen直接删除migration文件踩的坑
  6. 2020届秋招正式批次面试经验
  7. 记一次.Net Core程序启动失败的排查过程
  8. LTE paging注释
  9. Kaggle鱼品种识别
  10. Java JVM:垃圾回收(GC 在什么时候,对什么东西,做了什么事情)