今天来说一下hive中的正则表达式,主要包含:元字符匹配、位置匹配、频率匹配

1、元字符匹配

(.)   表示匹配除换行符以外的任意字符。

(\w) 表示匹配字母、下划线、数字 (\W匹配汉字)

(\d) 表示匹配数字

(\s) 表示匹配任意的空白符(tab 换行 空格)

([ ])  表示匹配方括号中任一字符

([^匹配内容]) 表示不匹配方括号中任一字符

2、位置匹配

(^) 表示匹配字符串的开始,空值:^$

($) 表示匹配字符串的结束

(\b) 表示匹配单词的开始或结束。

(\B) 表示匹配非单词的开始或结束

3、频率匹配

(*) 表示匹配重复0次或多次

(+) 表示匹配重复一次或更多次

(?) 表示匹配重复0次或1次

({n}) 表示匹配重复n次

({n,}) 表示重复n次或更多次

({n,m}) 表示重复n到m次

正则匹配函数:regexp_extract函数

用法:

regexp_extract(string subject, string pattern, int index)

返回值: string

功能:将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。

regexp_replace(string A, string B, string C) 
返回值: string 
说明:将字符串A中的符合Java正则表达式B的部分替换为C。注意,在有些情况下要使用转义字符,类似Oracle中的regexp_replace函数。

regexp

语法: A REGEXP B 
操作类型: strings 
描述: 功能与RLIKE相同  如 xx not regexp '\\d{8}'

————————————————
版权声明:本文为CSDN博主「数据小白的进阶之路」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_37536446/article/details/81053172

hive sql 正则表达式相关推荐

  1. Hadoop Hive sql语法详解

    Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...

  2. hive hql文档_30分钟入门 Hive SQL(HQL 入门篇)

    Hive SQL 几乎是每一位互联网分析师的必备技能,相信每一位面试过大厂的童鞋都有被面试官问到 Hive 优化问题的经历.所以掌握扎实的 HQL 基础尤为重要,既能帮分析师在日常工作中"如 ...

  3. Hive Sql中六种面试题型总结

    Hive Sql中六种面试题型总结 一.常用函数 二.N日留存 1.思路分析 三.连续登陆 1.数据准备 2.思路分析一 3.思路分析二 四.Top N 1.数据准备 2.思路分析 五.行列互转 1. ...

  4. hive插入多条数据sql_30分钟入门 Hive SQL(HQL 入门篇)

    Hive SQL 几乎是每一位互联网分析师的必备技能,相信每一位面试过大厂的童鞋都有被面试官问到 Hive 优化问题的经历.所以掌握扎实的 HQL 基础尤为重要,既能帮分析师在日常工作中"如 ...

  5. Hive Sql 大全(hive函数,hive表)

    Hive Sql 大全 本节基本涵盖了Hive日常使用的所有SQL,因为SQL太多,所以将SQL进行了如下分类: 一.DDL语句(数据定义语句): 对数据库的操作:包含创建.修改数据库 对数据表的操作 ...

  6. Hive sql解析json格式

    ** hive sql解析json格式 /*方法一: select regexp_extract(input_data,'app_id\\":\\"(.*?)\\"',1 ...

  7. Hadoop Hive sql 语法详细解释

    Hive 是基于Hadoop 构建的一套数据仓库分析系统.它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,能够将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...

  8. Hive SQL 监控系统 - Hive Falcon

    1.概述 在开发工作当中,提交 Hadoop 任务,任务的运行详情,这是我们所关心的,当业务并不复杂的时候,我们可以使用 Hadoop 提供的命令工具去管理 YARN 中的任务.在编写 Hive SQ ...

  9. python调用spark和调用hive_Spark(Hive) SQL数据类型使用详解(Python)

    Spark SQL使用时需要有若干"表"的存在,这些"表"可以来自于Hive,也可以来自"临时表".如果"表"来自于Hi ...

  10. beeline执行sql语句_由“Beeline连接HiveServer2后如何使用指定的队列(Yarn)运行Hive SQL语句”引发的一系列思考...

    背景 我们使用的HiveServer2的版本为0.13.1-cdh5.3.2,目前的任务使用Hive SQL构建,分为两种类型:手动任务(临时分析需求).调度任务(常规分析需求),两者均通过我们的We ...

最新文章

  1. 多分类 数据不平衡的处理 lightgbm
  2. 什么是以太网?—Vecloud微云
  3. Asp.net 2.0 中获取控件输出的Html代码 (转)
  4. 惠普 g5 服务器 centos安装系统,hp 380G5 安装centos 7
  5. Ceph Luminous安装指南
  6. Shell脚本中函数的定义和调用笔记
  7. java虚引用作用_深入理解Java中的引用(二)——强软弱虚引用
  8. strcmp() Anyone? UVA - 11732 左孩子右兄弟Trie/计数
  9. 软件工程 第二章 可行性研究
  10. Windows socket程序演示
  11. 信息安全等级保护 实施方案
  12. Android TTS(TextToSpeech)实践
  13. android matrix 亮度,Android ColorMatrix 亮度矩阵 对比度矩阵 黑白矩阵
  14. java三色球问题_三色球问题,Java,算法
  15. MLY -- 10.Having a dev set and metric speeds up iterations
  16. 2018年度计划清单
  17. 叶公好龙——存在与逻辑
  18. 安全多方计算MPC学习笔记
  19. “无实物尝百味”通过控制微电流刺激产生味觉—4.味觉模式实现篇
  20. kali安装w3af

热门文章

  1. 关于 HenCoder
  2. 多位大厂专家鼎力推荐,44个微服务架构设计模式pdf,程序员福利
  3. java坦克大战墙_坦克大战 - java代码库 - 云代码
  4. mysql的配置文件名称是_【MySQL学生手册】MySQL的配置文件
  5. 2018年通信工程师中级传输与接入无线专业实务真题
  6. 跨境电商erp系统一套多少钱,电商erp系统多少钱一年
  7. 微软新一代系统镜像 Windows 11 系统 ISO 镜像下载 - BT 磁力 / 网盘地址
  8. Ubuntu 15.04 折腾手记
  9. Python爬虫入门:初识爬虫
  10. uuid java 36位_java 生成UUID 36位码 36位码