即席查询Presto
1 Presto简介 Presto是一个开源的、分布式SQL查询引擎、数据量支持GB到PB,主要用来处理秒级查询。

虽然Presto可以解析SQL,但它不是一个标准的数据库,不是MySQL的替代品,也不能用来处理在线事务。

1.1 Prosto架构 Presto CLI :Presto客户端,将执行的SQL发送给Presto Coordinator

Presto Coordinator:Presto协调器,接受客户端发来的SQL解析成任务发送给PrestoWorker去执行

Presto Worker:执行Coordinator发来的任务,处理数据。

Catalog:数据源。

Connector:连接器,对接不同的数据源,需要不同的连接器。

只要拿到Hive的元数据信息,就能查询数据。因为Hive的元数据存储了有哪些表,表在HDFS上的路径。

获取Hive的元数据的方式有两种:1是直连Hive,2通过Hive的metastore(Presto) Kafka的话,只要拿到bootstrap server地址和topic,那就能够查询数据了

Schema:类似于mysql的数据库database

Table:表

Hive Metastore:Hive的metastore服务,启动了metastore服务,只要在Hive Connector中配置了metastore的地址,那么就能查询到元数据信息。能拿到元数据那就能查询到数据。

即席查询之Presto相关推荐

  1. #数据技术选型#即席查询Shib+Presto,集群任务调度HUE+Oozie

    郑昀 创建于2014/10/30 最后更新于2014/10/31 一)选型:Shib+Presto 应用场景:即席查询(Ad-hoc Query) 1.1.即席查询的目标 使用者是产品/运营/销售运营 ...

  2. 【电商数仓】数仓即席查询之Presto简介,安装,Presto优化之数据存储、查询SQL、一些注意事项

    文章目录 一 Presto简介 1 Presto概念 2 Presto架构 3 Presto优缺点 4 Presto.Impala性能比较 二 Presto安装 1 Presto Server安装 2 ...

  3. 数据仓库(六)---分布式SQL查询引擎---presto介绍

    我们在之前的文章中已经学习了数据仓库hive,如果要对数据仓库进行交互查询,则需要交互查询的引擎用于提高查询效率.本章介绍presto. 简介 Presto是一个开源的分布式SQL查询引擎,适用于实时 ...

  4. 即席查询Presto

    文章目录 1.Presto简介 1.1Presto概念 1.2Presto架构 1.3Presto优缺点 2.Presto安装 2.1Presto Server安装 2.2Presto命令行Clien ...

  5. 数仓即席查询---Presto

    Presto简介 presto是一个开源的分布式SQL查询引擎,数据量支持GB到PB级,主要用来处理秒级查询场景 ps:虽然presto可以解析SQL,但它不是一个标准的数据库,不是MySQL,ora ...

  6. Shib+Presto 即席查询

    1.1.即席查询的目标 使用者是产品/运营/销售运营的数据分析师: 要求数据分析师掌握查询SQL查询脚本编写技巧,掌握不同业务的数据存储在不同的数据集市里: 不管他们的计算任务是提交给 数据库 还是 ...

  7. Kylin、druid、presto、impala四种即席查询对比--(转载)

    一.什么是即席查询 即席查询是用户根据自己的需求,灵活的选择查询条件,系统根据用户的选择生成相应的统计报表.普通查应用查询是定制开发的,即席查询是用户自定义查询条件 理解:快速的执行自定义SQL(可能 ...

  8. 是选impala还是presto_Kylin、druid、presto、impala四种即席查询对比

    一.什么是即席查询 即席查询是用户根据自己的需求,灵活的选择查询条件,系统根据用户的选择生成相应的统计报表.普通查应用查询是定制开发的,即席查询是用户自定义查询条件 理解:快速的执行自定义SQL(可能 ...

  9. 即席查询——Presto

    1 Presto安装 1.1 Presto Server安装 1)导入安装包 [zhang@hadoop102 software]$ mkdir presto [zhang@hadoop102 sof ...

  10. #研发解决方案#数据开放实验室:再战即席查询和数据开放

    创建于2017/9/7 最后更新于2017/9/16 关键词:大数据,HBase,数据开放,即席查询,数据授权,HDFS,Zeppelin,Kylin, 提纲: 解决什么场景 即席查询的发展历程 五个 ...

最新文章

  1. 大厂产品专家是怎么做项目的?
  2. extern相关问题
  3. 常用面试题(对应的知识点)
  4. Online Coding开发模式 (通过在线配置实现一个表模型的增删改查功能,无需写任何代码)
  5. 输入一颗二元树,从上向下按层打印树的每个节点,同一层中,按照从左到右的顺序打印。...
  6. 当下大数据体系的4个热点,4个趋势和3个问题
  7. 为何要弃 Java、Swift 于不顾,而选择 Python?
  8. 80.简单搭建nodeJS服务,访问本地站点文件
  9. Java中的静态方法、类方法、成员方法、构造方法、非静态方法,各方法的定义以及个方法的功能详解大全
  10. 毕设 学生信息管理系统论文
  11. html双人对战源码,双人对战五子棋游戏 综合运用HTML、CSS、JavaScript实现
  12. 疑犯追踪第一季/全集Person Of Interest迅雷下载
  13. xp系统 共享文件夹服务器,WinXP如何共享文件夹?共享文件夹的方法
  14. 机器学习教程 之 SKlearn 中 PCA 算法的运用:人脸识别实例
  15. 第九章 使用结构体类型处理组合数据——用户自定义数据类型
  16. EMI+ EMC基础知识
  17. 条码生成软件如何批量生成Code39码
  18. 拒绝毒瘤:推特正试图让“回复人”闭嘴
  19. 疑难杂症篇(十三)--Java中出现“找不到符号“的错误解决方案
  20. zbbz的lisp_Github上四种Lisp方言的流行度

热门文章

  1. Excel透视表实操,只需6步就能搞定!
  2. 测试软件测显卡有啸叫,完美解决 显卡电流声!显卡啸叫!吱吱的电流声!附解决方案!...
  3. 跨考中科院计算机 学硕,【20082P】中国科学院大学心理学考研学硕认知神经科学学姐:放弃保研,跨考二战上岸...
  4. PlaySound详解
  5. 使用ImageJ软件计算信噪比(SNR)的小工具
  6. 区块链开发入门到精通
  7. 分享一位大佬开发的驱动级的虚拟键盘鼠标,支持DD键鼠接口
  8. 极点五笔的一些快捷键
  9. 安利一个excel对比
  10. 关于Linux消息队列的简单说明、使用、编码