新建mytest.txt

添加内容:

或多或少的好好读书电锯惊魂20202 和水电费后是否会时候1212没收到风10.12海大富的是粉红色的和办法的1244525.000会发生的粉红色的合法化好0.01给对方会感受到发给还是干活0001还打飞机大嫁风尚蝴蝶结个房间小电风扇豆腐干很多事123,450,000.000好盛大黑色的十一万八千四百三十二的还好丁世德11万2200海大富会闪烁二十万零三

python代码如下:

# _*_coding:utf-8 _*_
import sys
import re
reload(sys)
sys.setdefaultencoding('utf8')
def numberChange(path):f = open(path,'r')s = f.read()for i in ["utf8","gb2312"]:try:data = s.decode(i)breakexcept:pass# 匹配中的 ‘u’不可少number = re.compile(ur'([一二三四五六七八九零十百千万亿]+|[0-9]+[,]*[0-9]+.[0-9]+)')pattern = re.compile(number)all = pattern.findall(data)for i in all:print '*'print i# 打印的内容# 20202# 1212# 10.12# 1244525.000# 0001# 123, 450, 000# 十一万八千四百三十二# 11# 万2200# 二十万零三f.close()
if __name__=='__main__':path='./mytest.txt'numberChange(path)

代码运行结果:

*
20202
*
1212
*
10.12
*
1244525.000
*
0001
*
123,450,000
*
十一万八千四百三十二
*
11万2200
*
二十万零三

Process finished with exit code 0

python提取文章中的中文数字相关推荐

  1. python提取字符串中的中文、数字、字母

    转载自:https://blog.csdn.net/luoganttcc/article/details/80946194 #\d 匹配一个数字字符.等价于 [0-9] #\D 匹配一个非数字字符.等 ...

  2. python 提取字符串中的中文字符

    仅仅提取汉字字符 p1='帮会建了徽信群 没在群里的加下徽信:[30109552300],晚上群里有活动通知大家,(抢资源),争地盘,谢谢配合.i love you ' pre = re.compil ...

  3. python 正则之提取字符串中的汉字,数字,字母

    python 正则之提取字符串中的汉字,数字,字母 #\d 匹配一个数字字符.等价于 [0-9] #\D 匹配一个非数字字符.等价于 [^0-9]#过滤字符串中的英文与符号,保留汉字 import r ...

  4. 正则表达式 - 去掉乱码字符/提取字符串中的中文字符/提取字符串中的大小写字母 - Python代码

    目录 1.乱码符号种类较少,用replace() 2.乱码字符种类较多,用re.sub() 3.提取字符串中的中文字符 4.提取字符串中的中文字符和数字 5.提取其他 数据清洗的时候一大烦恼就是数据中 ...

  5. 如何利用python提取字符串中的数字

    目录 一.isdigit() 函数 二.filter() 函数 三.提取一段字符串中的数字 四.匹配指定字符串开头的数字 参考资料 一.isdigit() 函数 isdigit() 函数是检测输入字符 ...

  6. Java通过正则剔除乱码_正则表达式 - 去掉乱码字符/提取字符串中的中文字符/提取字符串中的大小写字母 - Python代码...

    目录 1.乱码符号种类较少,用replace() 2.乱码字符种类较多,用re.sub() 3.提取字符串中的中文字符 4.提取字符串中的中文字符和数字 5.提取其他 数据清洗的时候一大烦恼就是数据中 ...

  7. 学点实用工作小技巧【Python】汉字转拼音、繁体字和简体字互转、提取字符串中的中文(英文)、判断是否纯中文(英文)

    大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师.欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦. 前言 又 ...

  8. python提取字符串中数字

    题目:[这是一个复杂问题的简化]如下是一个字符串列表,提取字符串中第二个数字,并判断是否大于1000,如果是,从列表中删除这一行. 1000\t1002\n .....[省略].... 代码: < ...

  9. python 替换array中的值_利用Python提取视频中的字幕(文字识别)

    我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...

最新文章

  1. popwindow下拉筛选 二级联动_职场人必备!一分钟搞定Excel二级联动下拉菜单
  2. 16、设计模式-行为型模式-命令模式
  3. 04 ORA系列:ORA-00984 列在此处不允许 SQL parse error location
  4. PHP怎么输入表达式,PHP: 表达式 - Manual
  5. Linux之Json20160705
  6. 疲劳驾驶监测方案_【Nano Energy】TENG用于驾驶员驾驶状态监测
  7. OPENSTACK重装系统失败导致虚拟机状态为error
  8. DHPST分销系统 YEP分销云主机分销系统源码
  9. 《HTML5 2D游戏编程核心技术》——第2章,第2.3节使用CSS背景
  10. 2018最新版硬盘装系统,不要U盘也能装
  11. 基于JAVA+Servlet+JSP+MYSQL的网上订餐管理系统
  12. Java-面向对象(基础知识)
  13. STM32/TMS320F2812+W5500硬软件调试总结
  14. MySQL5.7.19解压版配置
  15. Hadoop1.2.0开发笔记(九)
  16. 【论文+推导】Predictability and Prediction of Human Mobility Based on Application-Collected Location Data
  17. php 银行支付通道_基于PHP框架的聚合四方支付系统
  18. 计算机cpu基础知识ppt,计算机硬件基础知识ppt课件
  19. 企业手机装配线平衡改善研究
  20. 状态压缩dp(状压dp)

热门文章

  1. matlab 中 eps 的分析
  2. 某CTF比赛部分wp
  3. Angular 2 JIT vs AOT
  4. sqlyog表添加列_如何用数据透视表求差,而不是求和?
  5. 7360清零方法_兄弟、联想、美能达、富士施乐全系列打印机加粉清零方法
  6. 将SVG 图引入到HTML页面
  7. java返回json格式的状态码数据(二)
  8. ActiveMQ点对点通讯,生产者-消费者
  9. Jackson相关的一些注解
  10. Reducing the Dimensionality of Data with Neural Networks:神经网络用于降维