regexp_extract

语法: regexp_extract(string subject, string pattern, int index)

返回值: string

说明: 将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。

  • 第一参数string subject: 要处理的字段
  • 第二参数string pattern: 需要匹配的正则表达式
  • 第三个参数int index:
    0是显示与之匹配的整个字符串
    1 是显示第一个括号里面的
    2 是显示第二个括号里面的字段…

使用示例
select

regexp_extract(‘x=a3&x=18abc&x=2&y=3&x=4’,‘x=([0-9]+)([a-z]+)’,0), – x=18abc

regexp_extract(‘x=a3&x=18abc&x=2&y=3&x=4’,‘^x=([a-z]+)([0-9]+)’,0), – x=a3

regexp_extract(‘https://detail.tmall.com/item.htm?spm=608.7065813.ne.1.Ni3rsN&id=522228774076&tracelog=fromnonactive’,‘id=([0-9]+)’,0), – id=522228774076

regexp_extract(‘https://detail.tmall.com/item.htm?spm=608.7065813.ne.1.Ni3rsN&id=522228774076&tracelog=fromnonactive’,‘id=([0-9]+)’,1), – 522228774076

regexp_extract(‘http://a.m.taobao.com/i41915173660.htm’,‘i([0-9]+)’,0), – i41915173660

regexp_extract(‘http://a.m.taobao.com/i41915173660.htm’,‘i([0-9]+)’,1) – 41915173660

select regexp_extract(‘hitdecisiondlist’,‘(i)(.*?)(e)’,0) ;

结果:itde

select regexp_extract(‘hitdecisiondlist’,‘(i)(.*?)(e)’,1) ;

结果:i

select regexp_extract(‘hitdecisiondlist’,‘(i)(.*?)(e)’,2) ;

结果:td

select regexp_extract(‘x=a3&x=18abc&x=2&y=3&x=4’,‘x=([0-9]+)([a-z]+)’,2) from default.dual;

结果:abc

提取固定数字

提取没有清洗数值中的数字部分

存在没有清洗的数值value
1、示例内容:
‘身份证号 : 0123456789876543210,完毕’
由 汉字+标点+数字+标点+汉字 组成
2、我们只想提取其中部分数字内容

select regexp_extract('身份证号 : 0123456789876543210,完毕','.*([0-9]{19}).*',1)
  • .* :代表任意多次匹配任意值
  • [0-9]:代表从0-9数字中匹配
  • {19}:代表匹配19次

返回:

0123456789876543210

提取手机号

select regexp_extract('身份证号 : 0123456789876543210,完毕,手机号:13012341234','.*([1][35678][0-9]{9}).*$',1)
  • 手机号是规则的,11位,并且1开头[35678]是第二位
  • [35678]:代表手机号的第二位,也可自行修改
  • [0-9]:代表匹配0-9数字
  • {9}:代表剩余的9位数字匹配九次

返回:

13012341234

split_part

select split_part (‘/abc/required_string/2/’, ‘/’, 3)
返回:required string

SUBSTRING_INDEX

select
SUBSTRING_INDEX('#住宿和餐饮业#餐饮业#餐饮#河北省#保定市#雄县', '#', 2),
SUBSTRING_INDEX(SUBSTRING_INDEX('#住宿和餐饮业#餐饮业#餐饮#河北省#保定市#雄县', '#', 2), '#', -1) AS result,
SUBSTRING_INDEX('#住宿和餐饮业#餐饮业#餐饮#河北省#保定市#雄县', '#', 3),
SUBSTRING_INDEX(SUBSTRING_INDEX('#住宿和餐饮业#餐饮业#餐饮#河北省#保定市#雄县', '#',3), '#', -1) AS result2
"_c0"  "result"  "_c2" "result2"
"#住宿和餐饮业" "住宿和餐饮业"  "#住宿和餐饮业#餐饮业" "餐饮业"

sql正则提取固定内容相关推荐

  1. java 正则提取$ 中内容_JAVA 使用正则从文字中提取想要的内容

    有时候我们想从一段文字中提取想要的内容,如省市区地址中提取出省市,从股票的数据中提取出关键的价格信息,抓取HTML文件后提取内容等等这些场景,这时我们可以使用JAVA正则表达式帮助我们提取出想要的数据 ...

  2. python提取日志内容_Python正则提取日志内容

    日志格式如下 [main] INFO com.jzdata.press.core.PressTest - select cs_bill_customer_sk,count(*) from catalo ...

  3. 正则提取文本操作集(python和js)

    命理的条文在古书里面都是pdf,要自己一个个手敲,还好有了网络很多工作有人已经做了.但是直接复制下来没有什么作用,因为一条断语往往包含了多条规则,有的还包含了几个方面的断言,这个时候就使用到爬虫+正则 ...

  4. python正则group()的用法—正则提取括号内以及其他符号内内容

    python正则提取括号内以及其他符号内内容,我以前学过一点点正则,但是学的不深,用的正则也是最笨的正则方法,只会group(0). 然而,我今天又看了下正则,发现正则的提取确实好用.无论爬虫还是文本 ...

  5. python用方括号提取字符中的数值_Python使用re模块正则提取字符串中括号内的内容示例...

    Python使用re模块正则提取字符串中括号内的内容示例 本文实例讲述了Python使用re模块正则提取字符串中括号内的内容操作.分享给大家供大家参考,具体如下: 直接上代码吧: # -*- codi ...

  6. Python使用re模块正则提取字符串中括号内的内容示例

    Python使用re模块正则提取字符串中括号内的内容示例 这篇文章主要介绍了Python使用re模块正则提取字符串中括号内的内容,结合实例形式分析了Python使用re模块进行针对括号内容的正则匹配操 ...

  7. python花括号怎么取_Python如何正则提取第三层花括号()里的内容?

    举例:我想把如下字符串中第三层花括号的内容提取出来{supportedBandCombination-r10{{{bandEUTRA-r103,bandParametersUL-r10{{ca-Ban ...

  8. php 正则匹配内容,php读取、正则匹配邮件内容的方法

    本篇文章主要介绍php读取.正则匹配邮件内容的方法,感兴趣的朋友参考下,希望对大家有所帮助. 本文实例讲述了PHP处理postfix邮件内容的方法.具体如下: //从输入读取到所有的邮件内容 $ema ...

  9. jmeter如何通过后置处理器提取(正则提取器、json提取器)做接口关联?

    一.后置处理器-正则表达式提取器 1.添加正则表达式提取 2.正则表达式提取面板介绍: 引用名称:提取引用名称,下个请求要引用此参数名称,如填写token,下个请求中用${token} 正则表达式:( ...

最新文章

  1. Debian/Ubuntu 对gpg和apt-key使用代理--报错解决:gpg: keyserver receive failed: Connection timed out
  2. 文件到Java中的byte []
  3. OpenCV的minEllipse函数(求轮廓的外接椭圆)一定要判断输入点是否大于5个
  4. 部门换届推文文字_【校安协招新】这篇推文不要标题,只要你!
  5. jQuery find 和 filter 方法的区别
  6. 清华大学-曾鸣-《ARM微控制器与嵌入式系统》I2C总线(二)
  7. 百度富文本编辑器的应用技巧---在一个页面中使用多个样式不同功能不同的编辑器...
  8. mix2s android p功能,已升安卓P!网友:MIX2S才是亲儿子
  9. java assert语句未执行_Java陷阱之assert关键字
  10. 自动驾驶——SimpleNet的学习笔记
  11. 基于HEVC 的UHD(超高清 4K)视频的主观质量评价
  12. 手机淘宝app、xsign签名算法
  13. 软考 2015 年上半年 网络管理员 上午试卷
  14. PS3主机今日发售 附官方问答
  15. 自定义输入框可一键清除
  16. Elastix 设置呼叫转移
  17. 电子封装行业市场专项调查分析
  18. 腾讯云部署DevOps
  19. quartz 2D 总结
  20. SpringBoot+Vue中使用AES进行加解密(加密模式等对照关系)

热门文章

  1. 大佬带你看DevOps
  2. 【北航软院】系统编程学习笔记
  3. 获取元素的绝对位置和相对位置
  4. 软件的各个版本和英文缩写
  5. 送给即将进入大学升造侄子的寄语
  6. pdf做成翻页电子书_如何一分钟将PDF制作成电子书?这个热门电子书刊制作软件推荐给你!...
  7. Linux虚拟机无eht0网卡解决方法
  8. 主动噪声控制中的声波方程
  9. CleanMyMac X4.11苹果电脑系统清理工具
  10. 虹科分享 | IOTA网络性能监控 | 如何有效分析VoIP问题