比如,有如下格式文件

01||zhangsan||23
02||lisi||24

hive默认情况下只支持单字节分隔符,如果数据中的分隔符是多字节的,则hive默认是处理不了的。需要使用正则Serde

create table if not exists t_regex(
id string,
uname string,
age int
)
row format serde 'org.apache.hadoop.hive.serde2.RegexSerDe'
with serdeproperties(
'input.regex'='(.*)\\|\\|(.*)\\|\\|(.*)',
'output.format.string'='%1$s %2$s %3$s'
)
stored as textfile

;
导入以及查看数据

load data local  inpath '/data/regex.txt' into table t_regex;
select *  from t_regex;

结果如下

id uname age
01 zhangsan 23
02 lisi 24

总结

  • 只要内容有规律,就可以想办法导入hive

Hive利用正则Serde导入文件相关推荐

  1. 在python中使用最小二乘法画出拟合曲线_基于jupyter notebook的python编程-----运用最小二乘法,导入文件数据模拟一元线性回归分析...

    基于jupyter notebook的python编程-----运用最小二乘法,导入文件数据模拟一元线性回归分析 用最小二乘法模拟一元线性回去曲线的目录 一.运行jupyter notebook,搭建 ...

  2. iOS开发- 文件共享(利用iTunes导入文件, 并且显示已有文件)

    layout: post #iOS开发- 文件共享(利用iTunes导入文件, 并且显示已有文件) title: iOS开发- 文件共享(利用iTunes导入文件, 并且显示已有文件) #时间配置 d ...

  3. iOS开发- 文件共享 利用iTunes导入文件 并且显示已有文件

    今天要实现一个功能, 通过iTunes导入文件到应用中, 并且在应用中对这个文件进行编辑. 类似我们平时经常使用的 PDF阅读器那样的东西, 我们可以自己导入我们的电子书. 源码下载:https:// ...

  4. 利用Hudi Bootstrap转化现有Hive表的parquet/orc文件为Hudi表

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到网站:https://www.captainai.net/dongkelun 前言 在最开始学习Hudi源码 ...

  5. 利用IDEA工具导入csv表格文件到数据库

    利用IDEA工具导入表格文件到数据库 1.ideal连接好数据库源,打开数据库表 2.根据图示选择导入文件(文件类型为csv) 其他类型文件未测试,可能出现乱码 3.对应数据库表创建数据 4.导入数据 ...

  6. 简析将shp导入Oracle并利用geoserver将导入的数据发布

    文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/. 1.环境准备 1.1 软件准备 首先要安装有支持空间数据的Oracle ...

  7. Hive几种数据导入方式

    2019独角兽企业重金招聘Python工程师标准>>> 1.从本地文件系统中导入数据到hive表 (1)数据准备(/home/sopdm/test.dat): 1,wyp,25,13 ...

  8. iOS发展- 文件共享(使用iTunes导入文件, 并显示现有文件)

    到今天实现功能, 由iTunes导入文件的应用程序, 并在此文档进行编辑的应用. 就像我们平时经常使用 PDF阅读这样的事情, 们能够自己导入我们的电子书. 源代码下载:https://github. ...

  9. sqoop动态分区导入mysql,使用sqoop import从mysql往hive含分区表中导入数据的一些注意事项...

    先看下面这条语句,它实现的功能是将特定日期的数据从mysql表中直接导入hive $ sqoop import \ --connect jdbc:mysql://192.168.xx.xx:3306/ ...

最新文章

  1. Tomcat类加载器机制
  2. 《移动项目实践》实验报告——Android Studio环境搭建
  3. OpenGL程序管道,可分离程序和着色器子例程的基本用法
  4. 在Kali上安装打印机
  5. 谁说PCB布线不能走直角。。。
  6. layui前端框架弹出框图标整理
  7. python类实例化_python基础8之类的实例化过程剖析
  8. HTTP(2)----图文解析HTTP
  9. c/c++教程 - 总集1. c基础语法
  10. 洛谷——P1867 【Mc生存】经验值
  11. Python基础教程 第六章 学习笔记
  12. dockerfile文件名_第八章 Dockerfile文件解析(二)
  13. JS下滑菜单,向下滑出二级导航
  14. 机器人走进开放源代码
  15. 古建筑数字化影像采集技术分析
  16. 紧跟步伐,何恺明新作MAE复现历程
  17. USB WDM驱动开发实例 bulkusb
  18. video标签不能自动播放的原因
  19. Java依赖注入(DI)实例详解
  20. 瑞萨单片机c语言程序,瑞萨单片机开发环境系统用户手册.pdf

热门文章

  1. JAVA提示定义常量_如何在Java中定义常量(Constant)
  2. sdhc 读写 扇区 linux,SD卡读写扇区注意事项(转)
  3. 最大子段和动态规划_动态规划解最大子段和问题
  4. 深度学习掩膜_学习资源 | NOAA连接AI与环境科学(九)—海洋环境视频和图像分析教程...
  5. windows系统bat批处理 arp扫描一个网段的IP地址
  6. 模拟生产者-消费者问题和读者-写者问题
  7. git本地项目怎么上传到仓库
  8. 韵乐x5最佳参数手动_机器学习 4 个常用超参数调试方法!
  9. python字符串_Python字符串三种格式化输出
  10. redis 计数器 java_Redis介绍