现有一份数据,是使用欧元符€作为分隔符,现在想要将数据加载到hive中。

普通的 row format delimited FIELDS TERMINATED BY '€' 并不行,百度找到一篇博客,说使用 -128作为分隔符,也不行。

解决这个问题,需要使用到org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe这个类。这个类常用于多字符分割问题,例如分隔符是这样:<|>。不过现在也能用于解决€分割符问题。

下面给一个示例:

create external table test(
id string,
name string,
status int
)
partitioned by (dt string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe'
WITH SERDEPROPERTIES ("field.delim"="€")
STORED AS TEXTFILE;
ALTER TABLE test ADD PARTITION(dt='20190403') LOCATION '/user/root/extractdata/test';

查询结果:

使用欧元符号€作为hive表的分割符相关推荐

  1. Hive - 警惕默认分割符号:^A

    一.引言 hive 执行如下 insert 插入语句后将数据从 RCFile 格式转换为 Text 并导入 Hdfs: function insertData() { hive -e " i ...

  2. hive表加载csv格式数据或者json格式数据

    先说简单的使用 CREATE TABLE `cc_test_serde`( `id` string COMMENT 'from deserializer', `name` string COMMENT ...

  3. Hive Sql 大全(hive函数,hive表)

    Hive Sql 大全 本节基本涵盖了Hive日常使用的所有SQL,因为SQL太多,所以将SQL进行了如下分类: 一.DDL语句(数据定义语句): 对数据库的操作:包含创建.修改数据库 对数据表的操作 ...

  4. Hive表操作及管理

    转载请注明出处:http://blog.csdn.net/u012842205/article/details/72765667 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映 ...

  5. MapReduce基础开发之三字段处理并输出Hive表

    1.MR设计和开发    1)设计:      输入:用户名 | 数字ip | 时间戳 |  url      MR处理:正则表达式匹配url,满足则解析url并转换ip和时间戳,      输出:用 ...

  6. hive 如何将数组转成字符串_hive 将hive表数据查询出来转为json对象和json数组输出...

    1.将hive表数据查询出来转为json对象输出apache 一.将查询出来的数据转为一行一行,并指定分割符的数据json 二.使用UDF函数,将每一行数据做为string传入UDF函数中转换为jso ...

  7. hive实战读书笔记(第4章)hive表DDL

    schema-on-read hadoop提供了存储和处理任何结构化,半结构化,非结构化数据的能力,hive允许用户在这些数据上创建一个元数据层,并使用sql接口来访问该层. hive并不是一个数据库 ...

  8. hive表中的数据导出

    将hive表中的数据导出到其他任意目录,例如linux本地磁盘,例如hdfs,例如mysql等等 一.insert导出 将查询的结果导出到本地 insert overwrite local direc ...

  9. 数据治理 - TextFile格式Hive表压缩优化实践

    背景 由于缺少统一的规范落地和平台工具支持,大部分的业务人员.技术人员在建表时并没有考虑到 Hive表 格式的重要性.随着数据量的上升,TextFile格式的存储浪费情况越来越严重 在数仓建设中,除了 ...

  10. 92课程作业,hive自定义IMFRecordReader,切分^^尖尖头及| 分割符

    92课程作业,hive自定义IMFRecordReader,切分^^尖尖头及| 分割符 代码写好了,还没有运行, 到时候在hive中测试一把 IMFInputFormat package com.dt ...

最新文章

  1. 亮度翻转_ROG幻13翻转本发布;联想IdeaPad 5G轻薄本即将上线
  2. 关于ngOptions的键值对
  3. python环境管理命令_conda管理Python环境
  4. Python format() 函数
  5. 什么是空中下载技术?学嵌入式必看!
  6. 在C#代码中应用Log4Net(五)将Log4Net正确地封装在自己的类库中并进行调用
  7. linux下添加,删除,修改,查看用户和用户组
  8. China .NET Conf 2019-.NET技术架构下的混沌工程实践
  9. UML学习(一)-----用例图
  10. react 使用 mobx_如何使用React和MobX状态树构建基于状态的路由器
  11. 数学到底有多重要?网友:道理都懂,实力不允许啊
  12. Jmeter-JDBC Request
  13. 知乎热议的Deep Peak2模型究竟是什么?答案都在这里
  14. Linux下iptables 禁止端口和开放端口
  15. 在 Eclipse 中进行 局部 、全局搜索
  16. 使用@selector模仿代理功能降低代码耦合度
  17. 体百味人生,感产品之道
  18. 社交软件红包技术解密(十):手Q客户端针对2020年春节红包的技术实践
  19. 如何转让个人股权?个人股权转让流程
  20. Spherical Harmonics Lighting

热门文章

  1. influence和effect的区别
  2. 内核问题解决方法记录
  3. 场景一:刮刮卡,大转盘等抽奖算法
  4. Spring Cloud Netflix之为上一个damo添加Ribbon(负载均衡优化)
  5. python中fn是什么意思_按Fn键Python 3
  6. 实现60fps的网易云音乐首页
  7. 企业网络安全区域划分的原则和方法
  8. Fastlane(一):用法
  9. 【html】css样式
  10. 把妹需要勇敢,心有猛虎,细嗅蔷薇