sql正则提取固定内容
regexp_extract
语法: regexp_extract(string subject, string pattern, int index)
返回值: string
说明: 将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。
- 第一参数string subject: 要处理的字段
- 第二参数string pattern: 需要匹配的正则表达式
- 第三个参数int index:
0是显示与之匹配的整个字符串
1 是显示第一个括号里面的
2 是显示第二个括号里面的字段…
使用示例
select
regexp_extract(‘x=a3&x=18abc&x=2&y=3&x=4’,‘x=([0-9]+)([a-z]+)’,0), – x=18abc
regexp_extract(‘x=a3&x=18abc&x=2&y=3&x=4’,‘^x=([a-z]+)([0-9]+)’,0), – x=a3
regexp_extract(‘https://detail.tmall.com/item.htm?spm=608.7065813.ne.1.Ni3rsN&id=522228774076&tracelog=fromnonactive’,‘id=([0-9]+)’,0), – id=522228774076
regexp_extract(‘https://detail.tmall.com/item.htm?spm=608.7065813.ne.1.Ni3rsN&id=522228774076&tracelog=fromnonactive’,‘id=([0-9]+)’,1), – 522228774076
regexp_extract(‘http://a.m.taobao.com/i41915173660.htm’,‘i([0-9]+)’,0), – i41915173660
regexp_extract(‘http://a.m.taobao.com/i41915173660.htm’,‘i([0-9]+)’,1) – 41915173660
select regexp_extract(‘hitdecisiondlist’,‘(i)(.*?)(e)’,0) ;
结果:itde
select regexp_extract(‘hitdecisiondlist’,‘(i)(.*?)(e)’,1) ;
结果:i
select regexp_extract(‘hitdecisiondlist’,‘(i)(.*?)(e)’,2) ;
结果:td
select regexp_extract(‘x=a3&x=18abc&x=2&y=3&x=4’,‘x=([0-9]+)([a-z]+)’,2) from default.dual;
结果:abc
提取固定数字
提取没有清洗数值中的数字部分
存在没有清洗的数值value:
1、示例内容:
‘身份证号 : 0123456789876543210,完毕’
由 汉字+标点+数字+标点+汉字 组成
2、我们只想提取其中部分数字内容
select regexp_extract('身份证号 : 0123456789876543210,完毕','.*([0-9]{19}).*',1)
- .* :代表任意多次匹配任意值
- [0-9]:代表从0-9数字中匹配
- {19}:代表匹配19次
返回:
0123456789876543210
提取手机号
select regexp_extract('身份证号 : 0123456789876543210,完毕,手机号:13012341234','.*([1][35678][0-9]{9}).*$',1)
- 手机号是规则的,11位,并且1开头[35678]是第二位
- [35678]:代表手机号的第二位,也可自行修改
- [0-9]:代表匹配0-9数字
- {9}:代表剩余的9位数字匹配九次
返回:
13012341234
split_part
select split_part (‘/abc/required_string/2/’, ‘/’, 3)
返回:required string
SUBSTRING_INDEX
select
SUBSTRING_INDEX('#住宿和餐饮业#餐饮业#餐饮#河北省#保定市#雄县', '#', 2),
SUBSTRING_INDEX(SUBSTRING_INDEX('#住宿和餐饮业#餐饮业#餐饮#河北省#保定市#雄县', '#', 2), '#', -1) AS result,
SUBSTRING_INDEX('#住宿和餐饮业#餐饮业#餐饮#河北省#保定市#雄县', '#', 3),
SUBSTRING_INDEX(SUBSTRING_INDEX('#住宿和餐饮业#餐饮业#餐饮#河北省#保定市#雄县', '#',3), '#', -1) AS result2
"_c0" "result" "_c2" "result2"
"#住宿和餐饮业" "住宿和餐饮业" "#住宿和餐饮业#餐饮业" "餐饮业"
sql正则提取固定内容相关推荐
- java 正则提取$ 中内容_JAVA 使用正则从文字中提取想要的内容
有时候我们想从一段文字中提取想要的内容,如省市区地址中提取出省市,从股票的数据中提取出关键的价格信息,抓取HTML文件后提取内容等等这些场景,这时我们可以使用JAVA正则表达式帮助我们提取出想要的数据 ...
- python提取日志内容_Python正则提取日志内容
日志格式如下 [main] INFO com.jzdata.press.core.PressTest - select cs_bill_customer_sk,count(*) from catalo ...
- 正则提取文本操作集(python和js)
命理的条文在古书里面都是pdf,要自己一个个手敲,还好有了网络很多工作有人已经做了.但是直接复制下来没有什么作用,因为一条断语往往包含了多条规则,有的还包含了几个方面的断言,这个时候就使用到爬虫+正则 ...
- python正则group()的用法—正则提取括号内以及其他符号内内容
python正则提取括号内以及其他符号内内容,我以前学过一点点正则,但是学的不深,用的正则也是最笨的正则方法,只会group(0). 然而,我今天又看了下正则,发现正则的提取确实好用.无论爬虫还是文本 ...
- python用方括号提取字符中的数值_Python使用re模块正则提取字符串中括号内的内容示例...
Python使用re模块正则提取字符串中括号内的内容示例 本文实例讲述了Python使用re模块正则提取字符串中括号内的内容操作.分享给大家供大家参考,具体如下: 直接上代码吧: # -*- codi ...
- Python使用re模块正则提取字符串中括号内的内容示例
Python使用re模块正则提取字符串中括号内的内容示例 这篇文章主要介绍了Python使用re模块正则提取字符串中括号内的内容,结合实例形式分析了Python使用re模块进行针对括号内容的正则匹配操 ...
- python花括号怎么取_Python如何正则提取第三层花括号()里的内容?
举例:我想把如下字符串中第三层花括号的内容提取出来{supportedBandCombination-r10{{{bandEUTRA-r103,bandParametersUL-r10{{ca-Ban ...
- php 正则匹配内容,php读取、正则匹配邮件内容的方法
本篇文章主要介绍php读取.正则匹配邮件内容的方法,感兴趣的朋友参考下,希望对大家有所帮助. 本文实例讲述了PHP处理postfix邮件内容的方法.具体如下: //从输入读取到所有的邮件内容 $ema ...
- jmeter如何通过后置处理器提取(正则提取器、json提取器)做接口关联?
一.后置处理器-正则表达式提取器 1.添加正则表达式提取 2.正则表达式提取面板介绍: 引用名称:提取引用名称,下个请求要引用此参数名称,如填写token,下个请求中用${token} 正则表达式:( ...
最新文章
- Debian/Ubuntu 对gpg和apt-key使用代理--报错解决:gpg: keyserver receive failed: Connection timed out
- 文件到Java中的byte []
- OpenCV的minEllipse函数(求轮廓的外接椭圆)一定要判断输入点是否大于5个
- 部门换届推文文字_【校安协招新】这篇推文不要标题,只要你!
- jQuery find 和 filter 方法的区别
- 清华大学-曾鸣-《ARM微控制器与嵌入式系统》I2C总线(二)
- 百度富文本编辑器的应用技巧---在一个页面中使用多个样式不同功能不同的编辑器...
- mix2s android p功能,已升安卓P!网友:MIX2S才是亲儿子
- java assert语句未执行_Java陷阱之assert关键字
- 自动驾驶——SimpleNet的学习笔记
- 基于HEVC 的UHD(超高清 4K)视频的主观质量评价
- 手机淘宝app、xsign签名算法
- 软考 2015 年上半年 网络管理员 上午试卷
- PS3主机今日发售 附官方问答
- 自定义输入框可一键清除
- Elastix 设置呼叫转移
- 电子封装行业市场专项调查分析
- 腾讯云部署DevOps
- quartz 2D 总结
- SpringBoot+Vue中使用AES进行加解密(加密模式等对照关系)