python电话号码对应的字符组合_Python3 在字符串中提取字母+数字组合微信账号、电话等 - pytorch中文网...
今天处理数据要提取字符串中的微信,字符串中包含中文英文Emoji,标点符号等。
python 提取字符串中的电话
提取电话相对简单,多个电话也可以提取
import re
desstr = "视频同款18588888888微信同步"
phone = re.findall('(13\d{9}|14[5|7]\d{8}|15\d{9}|166{\d{8}|17[3|6|7]{\d{8}|18\d{9})', desstr)
print(phone)
python提取微信账号
这里我使用python移除了Emoji,标点符号,换行等,完整代码如下:
import re
desstr="""视频同款Emoji Emoji
Emoji:草莓树莓是姐妹
Emoji:8888888888(注来意)
Emoji日常视频
分享全国旅行照片!
Emoji私信不回"""
# 过滤除中,英文及数字以外的其他字符
words = re.compile("[^\\u4e00-\\u9fa5^a-z^A-Z^0-9]").sub("-", desstr).replace(":","-").replace(":","-").replace("\n","-").replace("--", "-").replace("--", "-")
# 打印过滤后的数据
print(words)
# 判断是否包含中文,包含则不是账号,这里可以自行提前移除中文
def is_chinese(string):
for ch in string:
if u'\u4e00' <= ch <= u'\u9fff':
return True
return False
# 拆分字符串提取账号
keywords = re.split("-", words)
print(keywords)
for keyword in keywords:
# 微信号长度为6-20
if len(keyword) > 6 and len(keyword) < 20:
chinese = is_chinese(keyword)
if not chinese:
print(keyword)
原创文章,转载请注明 :Python3 在字符串中提取字母+数字组合微信账号、电话等 - pytorch中文网
原文出处: https://www.ptorch.com/news/264.html
问题交流群 :168117787
python电话号码对应的字符组合_Python3 在字符串中提取字母+数字组合微信账号、电话等 - pytorch中文网...相关推荐
- Python:如何从字符串中提取字母或数字?
从字符串中提取字母 s = 'cn中国520' print(''.join([i for i in s if i.encode('UTF-8').isalpha()]))# 输出:cn 注意:中文的汉 ...
- python图片显示英文字符_python如何解析字符串中出现的英文人名?
这里有四个例子,结果来自google scholar str1 = "Jakes, William C., and Donald C. Cox. Microwave mobile commu ...
- [work] python从字符串中提取所有数字到list
使用正则表达式,用法如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 ## 总结 ## ^ 匹配字符串的开始. ## $ 匹配字符串的结尾. ## \b 匹配一个单词的边界. ## ...
- Python中的函数及Python字符串中提取字母、数字
一.函数:就是对功能或动作的封装,一段有规律.重复使用的代码. 函数的定义: def 函数名(形参): 函数体 返回值(return) 函数的调用: ret=函数名(实参) 函数的返回值 return ...
- java判断字符的大小写_java 字符串中判断字母大小写方法
方法一:可利用java带有的Character.isLowerCase与Character.isUpperCase来进行判断 以下为判断字符串是否都为小写字母或都为大写字母组成的 import jav ...
- python 正则之提取字符串中的汉字,数字,字母
python 正则之提取字符串中的汉字,数字,字母 #\d 匹配一个数字字符.等价于 [0-9] #\D 匹配一个非数字字符.等价于 [^0-9]#过滤字符串中的英文与符号,保留汉字 import r ...
- c语言滤去所有非数字字符,Python: 去掉字符串中的非数字(或非字母)字符
>>> crazystring = 'dade142.;!0142f[.,]ad' 只保留数字 >>> filter(str.isdigit, crazystrin ...
- python字典里存字符_Python字典和字符串的学习
学习Python的字典还是和oc的字典进行对比学习,首先我们来创建一个字典.根据oc中字典一样,字典是无序的,根据键来进行取值. oc: oc中的字典分为可变字典和不可变字典,在对字典进行增,删的时候 ...
- 【Python 必会技巧】判断字符串是否为字母/数字/大小写/空白字符/有效标识符/可打印字符
简单来说: str.isalnum():判断所有字符是否都是数字或者字母 str.isalpha():判断所有字符是否都是字母 str.isdigit():判断所有字符是否都是数字 str.islow ...
最新文章
- 用手指触碰电子,用心灵感受震荡
- html行间距1.8em,雅黑字体下WordPress 行高与字符间距最佳实践:1.8em与0.06em
- dotNET Core 3.X 依赖注入
- 智能体行为建模与方法
- 腾讯:干掉头条,先拿抖音开刀!
- bzoj2298: [HAOI2011]problem a
- DOS批处理中对含有特殊字符的文件名的处理方法
- 改变form里面input,textarea.select等的默认样式
- 高通刷机工具使用介绍
- dosbox运行C语言,DOSBox-DOS模拟器-DOSBox下载 v0.74官方版-完美下载
- i350在linux系统刷MAC,MAC 10.14 安装教程10-基于黑果小兵大神EFI文件的修改过程
- Freertos消息队列接收源码xQueueGenericReceive分析
- 手机短信校验(前端js)
- CyanogenMod 7
- 工具——XML文件解析器
- windows和linux的icmp包,linux和windows下icmp的区别
- 输入在第一行中给出一个正整数n(1)。第二行输入n个整数,用空格分开。在一行中输出最大值及最大值的最小下标,中间用一个空格分开。
- Asp-Net-Core开发笔记:集成Hangfire实现异步任务队列和定时任务
- tsm9_Momentum_Ultimate Oscillators_MACDivergence index_Stochastic RSI_A/D Oscillator_RVI Vigor ADX
- 江苏计算机类事业单位真题解析,2012年江苏事业单位考试综合计算机类真题及解析(7)...
热门文章
- b+树阶怎么确定_你知道危险品运输是怎么包装的吗?
- 周易的含义_朱熹与《周易本义》
- micropython lcd_MicroPython动手做(05)——零基础学MaixPy之LCD液晶屏
- 创建虚机时间_云原生虚机应用托管设计篇
- 1732: 数花费(Kruscal)
- 给运维工程师的Cheatsheets! 《Shell脚本速查手册》免费下!
- 阿里云AIoT全新工业和农业云端一体机深度产品,全链路数据化实现效率提升
- 云计算基础介绍,比喻小理解!
- 创意总监分享:我是如何做一款手游地图的
- chrome 主进程cpu占用50%怎么办?