HDFS

使用方式

ENGINE = HDFS(URI, format)
  • URI:HDFS文件路径
  • format:文件格式,比如CSV、JSON、TSV

使用示例

-- 建表,hdfs上的文件夹要提前存在
CREATE TABLE hdfs_engine_table3
(emp_id     UInt16 COMMENT '员工id',name       String COMMENT '员工姓名',work_place String COMMENT '工作地点',age        UInt8 COMMENT '员工年龄',depart     String COMMENT '部门',salary     Decimal32(2) COMMENT '工资'
) ENGINE = HDFS('hdfs://mypc01:8020/chouse/hdfs_engine_table', 'CSV');-- 写入数据
INSERT INTO hdfs_engine_table3 VALUES (1,'tom','上海',25,'技术部',20000),(2,'jack','上海',26,'人事部',10000);
-- 查询数据
select * from hdfs_engine_table3;
┌─emp_id─┬─name─┬─work_place─┬─age─┬─depart─┬───salary─┐
│      1 │ tom  │ 上海       │  25 │ 技术部 │ 20000.00 │
│      2 │ jack │ 上海       │  26 │ 人事部 │ 10000.00 │
└────────┴──────┴────────────┴─────┴────────┴──────────┘vi ch.csv
--添加不同内容
3,'tom','上海',25,'技术部',20000
hdfs dfs -appendToFile ch.csv /chouse/hdfs_engine_table--再在HDFS上其对应的文件,添加几条数据,再次查看
select * from hdfs_engine_table;┌─emp_id─┬─name─┬─work_place─┬─age─┬─depart─┬───salary─┐
│      1 │ tom  │ 上海       │  25 │ 技术部 │ 20000.00 │
│      2 │ jack │ 上海       │  26 │ 人事部 │ 10000.00 │
│      3 │ tom  │ 上海       │  25 │ 技术部 │ 20000.00 │
└────────┴──────┴────────────┴─────┴────────┴──────────┘

可以看出,这种方式与使用Hive类似,我们直接可以将HDFS对应的文件映射成ClickHouse中的一张表,这样就可以使用SQL操作HDFS上的文件了。

值得注意的是:ClickHouse并不能够删除HDFS上的数据,当我们在ClickHouse客户端中删除了对应的表,只是删除了表结构,HDFS上的文件并没有被删除,这一点跟Hive的外部表十分相似。

注意:要手动先创建目录

clickhouse HDFS引擎相关推荐

  1. 16_clickhouse,HDFS引擎,JDBC引擎

    21.HDFS引擎 21.1.HDFS引擎 ClickHouse通过该引擎管理HDFS上的数据,从而与Apache Hadoop生态系统集成. 指定表引擎: ENGINE = HDFS(URI, fo ...

  2. ClickHouse表引擎之Integration系列

    ​ Integration系统表引擎主要用于将外部数据导入到ClickHouse中,或者在ClickHouse中直接操作外部数据源. 1 Kafka 1.1 Kafka引擎 ​ 将Kafka Topi ...

  3. ClickHouse表引擎到底怎么选

    引言 表引擎在ClickHouse中的作用十分关键,直接决定了数据如何存储和读取.是否支持并发读写.是否支持index.支持的query种类.是否支持主备复制等. ClickHouse提供了大约28种 ...

  4. 3、ClickHouse表引擎-MergeTree引擎

    ClickHouse系列文章 1.ClickHouse介绍 2.clickhouse安装与简单验证(centos) 3.ClickHouse表引擎-MergeTree引擎 4.clickhouse的L ...

  5. ClickHouse表引擎详解

    ClickHouse 表引擎 ClickHouse 的表引擎是 ClickHouse 服务的核心,它们决定了 ClickHouse 的以下行为: 1.数据的存储方式和位置. 2.支持哪些查询操作以及如 ...

  6. 【clickhouse】ClickHouse表引擎 MergeTree 数据生命周期

    1.概述 转载:ClickHouse表引擎 MergeTree 数据生命周期 TTL(Time To Live)表示数据的存活时间,在 Merge 中可以为某个字段或者整个表设置TTL. 如果设置列级 ...

  7. 【clickhouse】ClickHouse表引擎 MergeTree 索引与数据存储方式 一级索引 二级索引

    1.概述 转载:ClickHouse表引擎 MergeTree 索引与数据存储方式 2.一级索引 MergeTree 主键使用 primary key 定义,定义主键后,会将数据依据 index_gr ...

  8. clickhouse表引擎-合并树系列

    目录 1 clickhouse表引擎-合并树系列简介 2 MergeTree引擎 2.1 建表语法 2.2 创建最简单的MergerTree引擎表 2.3 插入数据 2.4 查看目录结构 2.5 指定 ...

  9. 大数据培训ClickHouse表引擎

    表引擎 表引擎(即表的类型)决定了: 1)数据的存储方式和位置,写到哪里以及从哪里读取数据 2)支持哪些查询以及如何支持. 3)并发数据访问. 4)索引的使用(如果存在). 5)是否可以执行多线程请求 ...

最新文章

  1. qcustomplot 游标吸附_qcustomplot游标测量功能--Apple的学习笔记
  2. 用表格落地OKR吗,OKR表格如何制定?
  3. div中加载html js,Div里面载入另一个页面的实现(Ajax取代框架)
  4. echarts 表格与 div 之间 空白的设置
  5. python模块之collections模块
  6. java spring框架 注解_详解Java的Spring框架中的注解的用法
  7. 统计学习方法的三要素
  8. wxHtml 示例:演示虚拟文件系统功能
  9. 数据中心两种常用流量模型运用mininet的实现
  10. PHP Cookie处理
  11. Java-进阶:多线程1
  12. python getchar,Linux C编程学习:getchar()和getch()
  13. Java基础笔记(二)垃圾回收机制
  14. 大整数相乘python fft_Python带你理解用于信号同步的CAZAC序列
  15. 武汉大学计算机学院c语言试题,武汉大学计算机学院C语言历年试题(48页)-原创力文档...
  16. matlab 关联矩阵,(案例)利用Matlab实践关联矩阵与邻接矩阵的转换
  17. Automation Anywhere视频教程
  18. Unity Metaverse(四)、接入环信IM SDK 实现用户登录注册
  19. Ubuntu20.04更换软件源之后apt-get update报错
  20. VC++, VC#, VB.NET 编码规范 (微软一站式示例代码库)

热门文章

  1. mpacc和计算机硕士,考MPAcc还是工作?读研三年VS工作三年对比!
  2. 22考研计算机专业课——数据结构【❤️考研复习指导❤️】
  3. linux系统安装klocwork,linux下klocwork的使用
  4. linux下备份msyql数据库
  5. php数据保存txt文件怎么打开方式_php - 利用保存在TXT文件(PHP)中的数组数据 - SO中文参考 - www.soinside.com...
  6. python异常处理_Python爬虫入门(5):URLError异常处理
  7. mysql 数据转换dataset_【转】dataset和实体类 之间的转换
  8. c++interesting转换为uint_巴西插头标准,旅行转换插头是怎样的?
  9. python写错了如何撤销-Python集成开发工具Pycharm的使用方法:复制,撤销上一步.......
  10. 怎么看so文件是哪个aar引进来的_突破微信限制,超大文件可以随便发