impala的安装部署

1、软件包的上传解压
安装包大于4G,所以需要另行上传。
每个节点需要优先安装nc yum install -y nc
安装impala的节点至少需要有12G的剩余空间(5.1G 安装包,5.1G解压后的包)

2、制作网络源
将安装包解压后,配置成yum源

3、安装impala
在主节点(node03)安装
yum install -y impala impala-server impala-state-store impala-catalog impala-shell
在从节点(node01,node02)安装
yum install -y impala-server

4、修改hadoop hive的配置文件
4.1 修改hive 配置文件
vim /export/servers/hive/conf/hive-site.xml
添加

<property>
<name>hive.metastore.uris</name>
<value>thrift://node01:9083</value>
</property>

说明:该配置配置的是那个节点,最后启动metastore时,必须在这个节点启动

4.2 修改hadoop配置
在 hdfs-site.xml 添加一下配置

<property>
<name>dfs.client.read.shortcircuit</name>
<value>true</value>
</property>
<property>
<name>dfs.domain.socket.path</name>
<value>/var/run/hdfs-sockets/dn</value>
</property>
<property>
<name>dfs.client.file-block-storage-locations.timeout.millis</name>
<value>10000</value>
</property>
<property>
<name>dfs.datanode.hdfs-blocks-metadata.enabled</name>
<value>true</value>
</property>

添加成功后,将更新后的配置同步到集群所有的节点。

5、复制hadoop、hive配置文件到impala配置文件

/etc/impala/conf
[root@node01 conf]# cp /export/servers/hive-1.1.0-cdh5.14.0/conf/hive-site.xml /etc/impala/conf
[root@node01 conf]# cp /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/core-site.xml /etc/impala/conf
[root@node01 conf]# cp /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/hdfs-site.xml /etc/impala/conf
查看复制结果 ll /etc/impala/conf/

6、修改impala配置(三个节点都要操作)
6.1 编辑impala配置

vim /etc/default/impala
IMPALA_CATALOG_SERVICE_HOST=node03
IMPALA_STATE_STORE_HOST=node03

6.2 添加mysql驱动
取消MYSQL_CONNECTOR_JAR前面的注释
创建有效的软连接或配置有效的jar ln -s /export/servers/hive-1.1.0-cdh5.14.0/lib/mysql-connector-java-5.1.38.jar
/usr/share/java/mysql-connector-java.jar
7、修改bigtop配置 (三个节点都要执行)
vim /etc/default/bigtop-utils
配置JAVA_HOME
export JAVA_HOME=${JAVA_HOME}

8、重启hadoop hive 集群
hive
<value>/var/run/hdfs-sockets/dn</value>
</property>
<property>
<name>dfs.client.file-block-storage-locations.timeout.millis</name>
<value>10000</value>
</property>
<property>
<name>dfs.datanode.hdfs-blocks-metadata.enabled</name>
<value>true</value>
</property>
vim /etc/default/impala
IMPALA_CATALOG_SERVICE_HOST=node03
IMPALA_STATE_STORE_HOST=node03
nohup ./hive --service metastore &
nohup ./hive --service hiveserver2&

查看 ps -ef | grep hive

9、启动impala
在impala的主节点执行一下命令

xservice impala-state-store start
service impala-catalog start
service impala-server start

查看是否启动成功   : ps -ef | grep impala

验证

在impala 节点输入 impala-shell+回车

查看数据库

impala 基本介绍

impala 是一个SQL查询工具,提供实时的查询。基于hive并使用内存进行计算,兼顾数据仓库。

Impala与Hive关系

impala 使用hive的元数据库metadata.
兼容hive的绝大多数sql语法,若要使用impala 必须启动hive的metastore服务。

Impala与Hive异同

impala

没有使用 MapReduce进行并行计算
Impala把整个查询分成一执行计划树
C++特性
最大使用内存
采用拉的方式
内存放不下数据时,版本1.0.1是直接返回错误
使用自己调度
查询过程中,没有容错逻辑
适用于实时数据分析

hive

使用 MapReduce进行并行计算 , 一连串的MapReduce任务
采用推的方式
内存放不下所有数据,则会使用外存
调度依赖于Hadoop
容错依赖于Hadoop
适用于批处理查询任务(时效性不高)。

Impala架构

1、 Impalad 接收客户端的查询请求,读写数据,并行执行查询.返回给客户端
2、 Impala State Store :跟踪集群中的Impalad的健康状态及位置信息
3、Catalogd :从Hive Metastore等外部catalog中获取元数据信息,放到impala自己的catalog结构中
4、CLI: 查询使用的命令行工具(impala-shell)

Impala查询过程

impala-shell外部命令

impala-shell –h 可以帮助我们查看帮助手册
impala-shell –r 刷新impala元数据
impala-shell –f ``文件路径`` 执行指的的sql查询文件。
impala-shell –i 指定连接运行 impalad 守护进程的主机。
impala-shell –o 保存执行结果到文件当中去。

impala-shell内部命令

connect hostname 连接到指定的机器impalad上去执行。
refresh dbname.tablename 增量刷新,刷新某一张表的元数据,主要用于刷新hive当中数据表里面的数据改变的
情况。
invalidate metadata 全量刷新,性能消耗较大,主要用于hive当中新建数据库或者数据库表的时候来进行刷新。
quit/exit``命令 从Impala shell中弹出``
explain ``命令`` 用于查看sql语句的执行计划。

Review impala相关推荐

  1. 如何在团队中做好Code Review

    一.Code Review的好处 想要做好Code Review,必须让参与的工程师充分认识到Code Review的好处 1.互相学习,彼此成就 无论是高手云集的架构师团队,还是以CURD为主的业务 ...

  2. git review devops过程

    自己搭建的devops环境是gitlab/gerrit/jenkins 1. 首先自己checkout一个自己的代码分支,一般不要在master上做直接修改 2. 修改后git add file,   ...

  3. impala 本年格式化时间_hive,hbase,impala之间的对比

    hbase在三者中更注重的是存储,它实现了类似mysql的double write机制,但是它是一种NoSQL的数据库,并且是可以支持列式存储的,算是比较大的一个内存Hash表.hbase也采用了类似 ...

  4. Google是如何做Code Review的?| CSDN原力计划

    作者 | 帅昕 xindoo 编辑 | 屠敏 出品 | CSDN 博客 我和几个小伙伴一起翻译了Google前一段时间放出来的Google's Engineering Practices docume ...

  5. 刚进美团,就被各种Code Review,真的有必要吗?

    点击关注公众号,Java干货及时送达 众所周知,Code Review是开发过程中一个非常重要的环节,但是很多公司或者团队是没有这一环节的,今天笔者结合自己所在团队,浅谈Code Review的价值及 ...

  6. 刚入职,就被各种 Code Review,真的有必要吗?

    点击上方蓝色"方志朋",选择"设为星标" 回复"666"获取独家整理的学习资料! 来源:juejin.cn/post/ 6882333635 ...

  7. 有必要做 Code Review 吗???

    点击上方蓝色"方志朋",选择"设为星标" 回复"666"获取独家整理的学习资料!作者:梨香 链接:https://juejin.im/pos ...

  8. 你太菜了,竟然不知道Code Review...

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试资料 作者:宝玉   来源:http://1t.click/aA4h 我 ...

  9. 从零开始 Code Review,两年实战经验分享!

    点击上方"方志朋",选择"置顶公众号" 技术文章第一时间送达! 来源:http://t.cn/RtHE14S 前几天看了<Code Review 程序员的 ...

最新文章

  1. linux基础知识-链接列表
  2. 航天总线测试系统软件,总线仿真测试平台软件
  3. ajax绑定事件页面重复提交,ajax防止用户重复提交点击事件
  4. ASP.NET Core 5 在IIS,Nginx,Caddy下的性能测试
  5. HDU-4089 Activation (概率DP求概率)
  6. Kubernetes事件离线工具kube-eventer正式开源
  7. Qt resizeEvent 控件居中设置
  8. set up BU Printer on ubuntu
  9. FIND_IN_SET使用场景
  10. 微软发布TypeScript用以改进JavaScript开发
  11. RabbitMQ消息幂等性之全局唯一ID
  12. HBase权威指南,架构:存储
  13. java项目之人事管理系统|HRM(java毕业设计Struts2、mybatis框架项目
  14. 360 android root权限获取root,360 N5 root过程详解
  15. 多个安卓设备投屏到电脑_如何将多个安卓手机投屏到电脑端
  16. HTML深海骑兵制作,深海迷航代码独眼巨人号护盾发生器 | 手游网游页游攻略大全...
  17. java小游戏之捕鱼达人,学了java,妈妈不再担心我去网吧游戏厅了!
  18. 报错:Process finished with exit code -1073741819 (0xC0000005)
  19. 记一次CVTE笔试(2018秋招)
  20. 小波在图像融合中的应用

热门文章

  1. 1823. 找出游戏的获胜者
  2. 用牛顿迭代法求方程。
  3. [Pytorch 常用函数] 激活函数Relu, Leaky Relu
  4. 世界首个拥有肌肉骨骼机器人问世(组图)
  5. fedora如何下载软件
  6. 中国医学计算机成级别像杂志,中国医学计算机成像杂志
  7. 创建视图时--ora-01731:出现循环的视图定义
  8. mysql之sql语句优化
  9. 单线程+多路IO复用 Redis6多线程
  10. Java如何使用new来创建对象