hive sql 正则表达式
今天来说一下hive中的正则表达式,主要包含:元字符匹配、位置匹配、频率匹配
1、元字符匹配
(.) 表示匹配除换行符以外的任意字符。
(\w) 表示匹配字母、下划线、数字 (\W匹配汉字)
(\d) 表示匹配数字
(\s) 表示匹配任意的空白符(tab 换行 空格)
([ ]) 表示匹配方括号中任一字符
([^匹配内容]) 表示不匹配方括号中任一字符
2、位置匹配
(^) 表示匹配字符串的开始,空值:^$
($) 表示匹配字符串的结束
(\b) 表示匹配单词的开始或结束。
(\B) 表示匹配非单词的开始或结束
3、频率匹配
(*) 表示匹配重复0次或多次
(+) 表示匹配重复一次或更多次
(?) 表示匹配重复0次或1次
({n}) 表示匹配重复n次
({n,}) 表示重复n次或更多次
({n,m}) 表示重复n到m次
正则匹配函数:regexp_extract函数
用法:
regexp_extract(string subject, string pattern, int index)
返回值: string
功能:将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。
regexp_replace(string A, string B, string C)
返回值: string
说明:将字符串A中的符合Java正则表达式B的部分替换为C。注意,在有些情况下要使用转义字符,类似Oracle中的regexp_replace函数。
regexp
语法: A REGEXP B
操作类型: strings
描述: 功能与RLIKE相同 如 xx not regexp '\\d{8}'
————————————————
版权声明:本文为CSDN博主「数据小白的进阶之路」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_37536446/article/details/81053172
hive sql 正则表达式相关推荐
- Hadoop Hive sql语法详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...
- hive hql文档_30分钟入门 Hive SQL(HQL 入门篇)
Hive SQL 几乎是每一位互联网分析师的必备技能,相信每一位面试过大厂的童鞋都有被面试官问到 Hive 优化问题的经历.所以掌握扎实的 HQL 基础尤为重要,既能帮分析师在日常工作中"如 ...
- Hive Sql中六种面试题型总结
Hive Sql中六种面试题型总结 一.常用函数 二.N日留存 1.思路分析 三.连续登陆 1.数据准备 2.思路分析一 3.思路分析二 四.Top N 1.数据准备 2.思路分析 五.行列互转 1. ...
- hive插入多条数据sql_30分钟入门 Hive SQL(HQL 入门篇)
Hive SQL 几乎是每一位互联网分析师的必备技能,相信每一位面试过大厂的童鞋都有被面试官问到 Hive 优化问题的经历.所以掌握扎实的 HQL 基础尤为重要,既能帮分析师在日常工作中"如 ...
- Hive Sql 大全(hive函数,hive表)
Hive Sql 大全 本节基本涵盖了Hive日常使用的所有SQL,因为SQL太多,所以将SQL进行了如下分类: 一.DDL语句(数据定义语句): 对数据库的操作:包含创建.修改数据库 对数据表的操作 ...
- Hive sql解析json格式
** hive sql解析json格式 /*方法一: select regexp_extract(input_data,'app_id\\":\\"(.*?)\\"',1 ...
- Hadoop Hive sql 语法详细解释
Hive 是基于Hadoop 构建的一套数据仓库分析系统.它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,能够将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...
- Hive SQL 监控系统 - Hive Falcon
1.概述 在开发工作当中,提交 Hadoop 任务,任务的运行详情,这是我们所关心的,当业务并不复杂的时候,我们可以使用 Hadoop 提供的命令工具去管理 YARN 中的任务.在编写 Hive SQ ...
- python调用spark和调用hive_Spark(Hive) SQL数据类型使用详解(Python)
Spark SQL使用时需要有若干"表"的存在,这些"表"可以来自于Hive,也可以来自"临时表".如果"表"来自于Hi ...
- beeline执行sql语句_由“Beeline连接HiveServer2后如何使用指定的队列(Yarn)运行Hive SQL语句”引发的一系列思考...
背景 我们使用的HiveServer2的版本为0.13.1-cdh5.3.2,目前的任务使用Hive SQL构建,分为两种类型:手动任务(临时分析需求).调度任务(常规分析需求),两者均通过我们的We ...
最新文章
- 多分类 数据不平衡的处理 lightgbm
- 什么是以太网?—Vecloud微云
- Asp.net 2.0 中获取控件输出的Html代码 (转)
- 惠普 g5 服务器 centos安装系统,hp 380G5 安装centos 7
- Ceph Luminous安装指南
- Shell脚本中函数的定义和调用笔记
- java虚引用作用_深入理解Java中的引用(二)——强软弱虚引用
- strcmp() Anyone? UVA - 11732 左孩子右兄弟Trie/计数
- 软件工程 第二章 可行性研究
- Windows socket程序演示
- 信息安全等级保护 实施方案
- Android TTS(TextToSpeech)实践
- android matrix 亮度,Android ColorMatrix 亮度矩阵 对比度矩阵 黑白矩阵
- java三色球问题_三色球问题,Java,算法
- MLY -- 10.Having a dev set and metric speeds up iterations
- 2018年度计划清单
- 叶公好龙——存在与逻辑
- 安全多方计算MPC学习笔记
- “无实物尝百味”通过控制微电流刺激产生味觉—4.味觉模式实现篇
- kali安装w3af
热门文章
- 关于 HenCoder
- 多位大厂专家鼎力推荐,44个微服务架构设计模式pdf,程序员福利
- java坦克大战墙_坦克大战 - java代码库 - 云代码
- mysql的配置文件名称是_【MySQL学生手册】MySQL的配置文件
- 2018年通信工程师中级传输与接入无线专业实务真题
- 跨境电商erp系统一套多少钱,电商erp系统多少钱一年
- 微软新一代系统镜像 Windows 11 系统 ISO 镜像下载 - BT 磁力 / 网盘地址
- Ubuntu 15.04 折腾手记
- Python爬虫入门:初识爬虫
- uuid java 36位_java 生成UUID 36位码 36位码