hive:正则:匹配中文/英文/数字(REGEXP 和 rlike)
目录
1:匹配数字
数字在0到3位
数字固定有6位
第二位为数字6的,有且只有两位数
第二位为数字6的,但不只有两位数
第二位为数字6的,后边再追加1到2位数字
手机号|邮箱中含有手机号的邮箱
2:匹配中文
纯中文(不含有英文和数字的)
含有中文的(只要含有汉字都可以)
不含有中文
3:匹配英文
只包含小写英文
不含有任何小写英文字符
任何包含英文的(大小写都包括)
不含有任何英文字符的(大小写都包括)
表达式实例介绍
数据:
Java开发工程师
Java工程师
海外BD岗
移动web研发工程师
DBA工程师
JAVA高级开发工程师
PHP开发工程师
android资深开发经理
课程顾问/sales manager
EPM
认证工程师
品牌总监
分时租赁总经理
销售总经理
硬件测试工程师
薪酬管理岗
算法工程师
大区销售总监
财务经理
研发总监
110100
110100
130100
130100
160100
200500
160100
110100
110100
110100
4849
4696
4861
4741
4593
4741
0
0
0
4523
0
0
4523
0
3720
1:匹配数字
数字在0到3位
select * from tmp.testregexp where name rlike '^\\d{0,3}$';
0
181
0
181
181
181
181
...
数字固定有6位
select * from tmp.testregexp where name rlike '^\\d{6}$';
957031
957031
957031
100014
100014
957031
...
第二位为数字6的,有且只有两位数
select * from tmp.testregexp where name rlike '^\\d[6]$';
56
26
26
26
66
26
16
...
第二位为数字6的,但不只有两位数
select * from tmp.testregexp where name rlike '^\\d[6]\\d+$';
26532
26799
26799
26495
9661
9664
26601
26978
...
第二位为数字6的,后边再追加1到2位数字
select * from tmp.testregexp where name rlike '^\\d[6]\\d{0,2}$';
8642
161
8699
165
5689
8604
5626
8669
...
qt:
输出 true:
SELECT '123456' rlike '^\\d+$';
SELECT '0' rlike '^\\d+$';
SELECT '1234567890' rlike '^\\d+$';
输出false:
SELECT '123456a' rlike '^\\d+$';
SELECT 'aa123' rlike '^\\d+$';
SELECT '中文123' rlike '^\\d+$';
SELECT 'aaff中' rlike '^\\d+$';
手机号|邮箱中含有手机号的邮箱
数据展示:
匹配的语句为:
select email from os.users where split(email,'@')[0] rlike '^0?1[3456798]\\d{9}$' limit 10
2:匹配中文
纯中文(不含有英文和数字的)
select * from tmp.testregexp WHERE name not REGEXP '[u0391-uFFE5]'
结果:
认证工程师
品牌总监
分时租赁总经理
销售总经理
硬件测试工程师
薪酬管理岗
算法工程师
大区销售总监
财务经理
研发总监
含有中文的(只要含有汉字都可以)
select * from tmp.testregexp where regexp(name,'[\\u4E00-\\u9FFF]+')
Java开发工程师
Java工程师
海外BD岗
移动web研发工程师
DBA工程师
JAVA高级开发工程师
PHP开发工程师
android资深开发经理
课程顾问/sales manager
认证工程师
品牌总监
分时租赁总经理
...
不含有中文
select * from tmp.testregexp where not regexp(name,'[\\u4E00-\\u9FFF]+')
EPM
110100
110100
130100
130100
160100
200500
160100
...
3:匹配英文
只包含小写英文
select * from tmp.testregexp where name rlike '[a-z]+'
结果:
java
python
java
...
不含有任何小写英文字符
select * from tmp.testregexp where name not rlike '[a-z]+'
结果:
海外BD岗
DBA工程师
JAVA高级开发工程师
PHP开发工程师
EPM
343434
...
任何包含英文的(大小写都包括)
select * from tmp.testregexp where name rlike '([a-z]|[A-Z])+'
结果:
Java开发工程师
Java工程师
海外BD岗
移动web研发工程师
DBA工程师
JAVA高级开发工程师
PHP开发工程师
android资深开发经理
课程顾问/sales manager
EPM
HRVP
Java
java
...
不含有任何英文字符的(大小写都包括)
select * from tmp.testregexp where name not rlike '([a-z]|[A-Z])+'
结果:
算法工程师
大区销售总监
财务经理
研发总监
110100
110100
130100
...
4.表达式实例介绍
^\d+(\.\d+)?
^ 定义了以什么开始
\d+ 匹配一个或多个数字
? 设置括号内的选项是可选的
\. 匹配 "."
可以匹配的实例:"5", "1.5" 和 "2.21"。
hive:正则:匹配中文/英文/数字(REGEXP 和 rlike)相关推荐
- python正则匹配中文/英文/数字/其它字符
匹配提取 一些字符串既包含中文.也包含英文.数字等,需要对这类字符串做提取,单个中文字符.英文单词以及数字表达等.需要采用正则匹配的方式来做 比如对于如下针对数据的描述 Android/IOS 2条装 ...
- php正则匹配中文和英文字母,PHP正则匹配中文字母数字正则的表达式
PHP正则匹配中文字母数字正则的表达式 PHP语言是一门实用性很强的语言,下面小编为大家带来了关于PHP正则匹配中文字母数字正则的'表达式,欢迎大家阅读! PHP正则匹配中文字母数字正则的表达式 代码 ...
- python2 正则匹配中文汉字数字字母
python2 re.compile匹配中文数字字母: # -*- coding: utf-8 -*- import redef chineseToUnic(ch):# 中文字符串转unicode编码 ...
- Hive 正则匹配函数 regexp_extract和 regexp_replace和rlike
介绍一下主要的功能函数. 参考:https://www.jianshu.com/p/3bcc06b1294b regexp_extract 相当于python当中的re.search: 遍历匹配,仅可 ...
- 正则匹配中文英文字符及标点
/^([\p{Han}\p{P}A-Za-z0-9])*$/u 其中 \p{Han}表示utf-8编码中的所有中文字符, \p{P}表示中英文标点, A-Z表示大写字母, a-z表示小写英文字母, ...
- 正则匹配中文英文字符、数据及标点
/^([\p{Han}\p{P}A-Za-z0-9])*$/u其中 \p{Han}表示utf-8编码中的所有中文字符, \p{P}表示中英文标点, A-Z表示大写字母, a-z表示小写英文字母, 0- ...
- 西北乱跑娃 --- python正则匹配中文以及数字和标点
很多朋友在做爬虫和数据采集的时候会遇见字符中存在很多的特殊字符,影响数据的质量.今天给大家写一段代码用于数据清洗: 方法一: info = '' str = '<@ba.rem>可以在下列 ...
- hive正则匹配:regexp_replace、regexp_extract、regexp
hive正则匹配:regexp_replace.regexp_extract.regexp 一.regexp语法介绍 regexp 语法: A REGEXP B 操作类型: strings 描述: 功 ...
- php正则判断数字和英文,PHP正则匹配中英文、数字及下划线的方法【用户名验证】...
本文实例讲述了PHP正则匹配中英文.数字及下划线的方法.分享给大家供大家参考,具体如下: 一.问题: 对于用户注册时的用户名要求由中英文.数字或下划线组成,不得含有其他字符. 二.解决方法: 针对输入 ...
最新文章
- 通过pcl 库的八叉树方法实现点云压缩与解压缩
- 智源人工智能伦理与安全中心主任曾毅任联合国教科文组织人工智能伦理特设国际专家组专家...
- 报道 | 1899篇论文、1329个机构、6012位作者,NeurIPS 2020谁在独领风骚?
- html文件用safari打开方式,如何使用openURL()读取在safari中打开的html文件 - c#代码 - 源码查...
- 登陆工行网上银行报60058017错误及输入正确网银密码提示密码不正确
- Android开发之EditText限制输入中文以及字数长度限制的标准姿势
- 工作失职的处理决定_工作失职的处理决定
- 数禾云上数据湖最佳实践
- ashx文件的几种使用
- 腾讯公司被法院强制执行25元,刚好是QQ超级会员的价格
- 蓝色清爽可用做排行的侧边列表滑动门代码
- 黑苹果oc清除nvram_小新Pro13 黑苹果/多系统心得
- MES管理端介绍,ebr二次开发产品—SIMATIC IT EBR(Opcenter Execution Pharma)
- 合宙Air720U724U722U Lua 固件更新说明
- LeetCode刷题-四因数
- 空间轨迹分析与应用(前言)Computing with Spatial Trajectories
- 【国企笔试】263、山有色:水发声 A 山河在:草木深 B 客舍青:柳色新 C 鸟飞绝:人踪灭 D 花作尘:鸟不惊
- python中bin函数如何使用?
- 计算机科学职业位置,计算机专业的职业生涯规划范文
- 运营(朋友圈内容):卖货的朋友圈,该发哪些内容?