今天处理数据要提取字符串中的微信,字符串中包含中文英文Emoji,标点符号等。

python 提取字符串中的电话

提取电话相对简单,多个电话也可以提取

import re

desstr = "视频同款18588888888微信同步"

phone = re.findall('(13\d{9}|14[5|7]\d{8}|15\d{9}|166{\d{8}|17[3|6|7]{\d{8}|18\d{9})', desstr)

print(phone)

python提取微信账号

这里我使用python移除了Emoji,标点符号,换行等,完整代码如下:

import re

desstr="""视频同款Emoji Emoji

Emoji:草莓树莓是姐妹

Emoji:8888888888(注来意)

Emoji日常视频

分享全国旅行照片!

Emoji私信不回"""

# 过滤除中,英文及数字以外的其他字符

words = re.compile("[^\\u4e00-\\u9fa5^a-z^A-Z^0-9]").sub("-", desstr).replace(":","-").replace(":","-").replace("\n","-").replace("--", "-").replace("--", "-")

# 打印过滤后的数据

print(words)

# 判断是否包含中文,包含则不是账号,这里可以自行提前移除中文

def is_chinese(string):

for ch in string:

if u'\u4e00' <= ch <= u'\u9fff':

return True

return False

# 拆分字符串提取账号

keywords = re.split("-", words)

print(keywords)

for keyword in keywords:

# 微信号长度为6-20

if len(keyword) > 6 and len(keyword) < 20:

chinese = is_chinese(keyword)

if not chinese:

print(keyword)

原创文章,转载请注明 :Python3 在字符串中提取字母+数字组合微信账号、电话等 - pytorch中文网

原文出处: https://www.ptorch.com/news/264.html

问题交流群 :168117787

python电话号码对应的字符组合_Python3 在字符串中提取字母+数字组合微信账号、电话等 - pytorch中文网...相关推荐

  1. Python:如何从字符串中提取字母或数字?

    从字符串中提取字母 s = 'cn中国520' print(''.join([i for i in s if i.encode('UTF-8').isalpha()]))# 输出:cn 注意:中文的汉 ...

  2. python图片显示英文字符_python如何解析字符串中出现的英文人名?

    这里有四个例子,结果来自google scholar str1 = "Jakes, William C., and Donald C. Cox. Microwave mobile commu ...

  3. [work] python从字符串中提取所有数字到list

    使用正则表达式,用法如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 ## 总结 ## ^ 匹配字符串的开始. ## $ 匹配字符串的结尾. ## \b 匹配一个单词的边界. ##  ...

  4. Python中的函数及Python字符串中提取字母、数字

    一.函数:就是对功能或动作的封装,一段有规律.重复使用的代码. 函数的定义: def 函数名(形参): 函数体 返回值(return) 函数的调用: ret=函数名(实参) 函数的返回值 return ...

  5. java判断字符的大小写_java 字符串中判断字母大小写方法

    方法一:可利用java带有的Character.isLowerCase与Character.isUpperCase来进行判断 以下为判断字符串是否都为小写字母或都为大写字母组成的 import jav ...

  6. python 正则之提取字符串中的汉字,数字,字母

    python 正则之提取字符串中的汉字,数字,字母 #\d 匹配一个数字字符.等价于 [0-9] #\D 匹配一个非数字字符.等价于 [^0-9]#过滤字符串中的英文与符号,保留汉字 import r ...

  7. c语言滤去所有非数字字符,Python: 去掉字符串中的非数字(或非字母)字符

    >>> crazystring = 'dade142.;!0142f[.,]ad' 只保留数字 >>> filter(str.isdigit, crazystrin ...

  8. python字典里存字符_Python字典和字符串的学习

    学习Python的字典还是和oc的字典进行对比学习,首先我们来创建一个字典.根据oc中字典一样,字典是无序的,根据键来进行取值. oc: oc中的字典分为可变字典和不可变字典,在对字典进行增,删的时候 ...

  9. 【Python 必会技巧】判断字符串是否为字母/数字/大小写/空白字符/有效标识符/可打印字符

    简单来说: str.isalnum():判断所有字符是否都是数字或者字母 str.isalpha():判断所有字符是否都是字母 str.isdigit():判断所有字符是否都是数字 str.islow ...

最新文章

  1. 用手指触碰电子,用心灵感受震荡
  2. html行间距1.8em,雅黑字体下WordPress 行高与字符间距最佳实践:1.8em与0.06em
  3. dotNET Core 3.X 依赖注入
  4. 智能体行为建模与方法
  5. 腾讯:干掉头条,先拿抖音开刀!
  6. bzoj2298: [HAOI2011]problem a
  7. DOS批处理中对含有特殊字符的文件名的处理方法
  8. 改变form里面input,textarea.select等的默认样式
  9. 高通刷机工具使用介绍
  10. dosbox运行C语言,DOSBox-DOS模拟器-DOSBox下载 v0.74官方版-完美下载
  11. i350在linux系统刷MAC,MAC 10.14 安装教程10-基于黑果小兵大神EFI文件的修改过程
  12. Freertos消息队列接收源码xQueueGenericReceive分析
  13. 手机短信校验(前端js)
  14. CyanogenMod 7
  15. 工具——XML文件解析器
  16. windows和linux的icmp包,linux和windows下icmp的区别
  17. 输入在第一行中给出一个正整数n(1)。第二行输入n个整数,用空格分开。在一行中输出最大值及最大值的最小下标,中间用一个空格分开。
  18. Asp-Net-Core开发笔记:集成Hangfire实现异步任务队列和定时任务
  19. tsm9_Momentum_Ultimate Oscillators_MACDivergence index_Stochastic RSI_A/D Oscillator_RVI Vigor ADX
  20. 江苏计算机类事业单位真题解析,2012年江苏事业单位考试综合计算机类真题及解析(7)...

热门文章

  1. b+树阶怎么确定_你知道危险品运输是怎么包装的吗?
  2. 周易的含义_朱熹与《周易本义》
  3. micropython lcd_MicroPython动手做(05)——零基础学MaixPy之LCD液晶屏
  4. 创建虚机时间_云原生虚机应用托管设计篇
  5. 1732: 数花费(Kruscal)
  6. 给运维工程师的Cheatsheets! 《Shell脚本速查手册》免费下!
  7. 阿里云AIoT全新工业和农业云端一体机深度产品,全链路数据化实现效率提升
  8. 云计算基础介绍,比喻小理解!
  9. 创意总监分享:我是如何做一款手游地图的
  10. chrome 主进程cpu占用50%怎么办?