python提取文章中的中文数字
新建mytest.txt
添加内容:
或多或少的好好读书电锯惊魂20202 和水电费后是否会时候1212没收到风10.12海大富的是粉红色的和办法的1244525.000会发生的粉红色的合法化好0.01给对方会感受到发给还是干活0001还打飞机大嫁风尚蝴蝶结个房间小电风扇豆腐干很多事123,450,000.000好盛大黑色的十一万八千四百三十二的还好丁世德11万2200海大富会闪烁二十万零三
python代码如下:
# _*_coding:utf-8 _*_
import sys
import re
reload(sys)
sys.setdefaultencoding('utf8')
def numberChange(path):f = open(path,'r')s = f.read()for i in ["utf8","gb2312"]:try:data = s.decode(i)breakexcept:pass# 匹配中的 ‘u’不可少number = re.compile(ur'([一二三四五六七八九零十百千万亿]+|[0-9]+[,]*[0-9]+.[0-9]+)')pattern = re.compile(number)all = pattern.findall(data)for i in all:print '*'print i# 打印的内容# 20202# 1212# 10.12# 1244525.000# 0001# 123, 450, 000# 十一万八千四百三十二# 11# 万2200# 二十万零三f.close()
if __name__=='__main__':path='./mytest.txt'numberChange(path)
代码运行结果:
*
20202
*
1212
*
10.12
*
1244525.000
*
0001
*
123,450,000
*
十一万八千四百三十二
*
11万2200
*
二十万零三
Process finished with exit code 0
python提取文章中的中文数字相关推荐
- python提取字符串中的中文、数字、字母
转载自:https://blog.csdn.net/luoganttcc/article/details/80946194 #\d 匹配一个数字字符.等价于 [0-9] #\D 匹配一个非数字字符.等 ...
- python 提取字符串中的中文字符
仅仅提取汉字字符 p1='帮会建了徽信群 没在群里的加下徽信:[30109552300],晚上群里有活动通知大家,(抢资源),争地盘,谢谢配合.i love you ' pre = re.compil ...
- python 正则之提取字符串中的汉字,数字,字母
python 正则之提取字符串中的汉字,数字,字母 #\d 匹配一个数字字符.等价于 [0-9] #\D 匹配一个非数字字符.等价于 [^0-9]#过滤字符串中的英文与符号,保留汉字 import r ...
- 正则表达式 - 去掉乱码字符/提取字符串中的中文字符/提取字符串中的大小写字母 - Python代码
目录 1.乱码符号种类较少,用replace() 2.乱码字符种类较多,用re.sub() 3.提取字符串中的中文字符 4.提取字符串中的中文字符和数字 5.提取其他 数据清洗的时候一大烦恼就是数据中 ...
- 如何利用python提取字符串中的数字
目录 一.isdigit() 函数 二.filter() 函数 三.提取一段字符串中的数字 四.匹配指定字符串开头的数字 参考资料 一.isdigit() 函数 isdigit() 函数是检测输入字符 ...
- Java通过正则剔除乱码_正则表达式 - 去掉乱码字符/提取字符串中的中文字符/提取字符串中的大小写字母 - Python代码...
目录 1.乱码符号种类较少,用replace() 2.乱码字符种类较多,用re.sub() 3.提取字符串中的中文字符 4.提取字符串中的中文字符和数字 5.提取其他 数据清洗的时候一大烦恼就是数据中 ...
- 学点实用工作小技巧【Python】汉字转拼音、繁体字和简体字互转、提取字符串中的中文(英文)、判断是否纯中文(英文)
大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师.欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦. 前言 又 ...
- python提取字符串中数字
题目:[这是一个复杂问题的简化]如下是一个字符串列表,提取字符串中第二个数字,并判断是否大于1000,如果是,从列表中删除这一行. 1000\t1002\n .....[省略].... 代码: < ...
- python 替换array中的值_利用Python提取视频中的字幕(文字识别)
我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...
最新文章
- popwindow下拉筛选 二级联动_职场人必备!一分钟搞定Excel二级联动下拉菜单
- 16、设计模式-行为型模式-命令模式
- 04 ORA系列:ORA-00984 列在此处不允许 SQL parse error location
- PHP怎么输入表达式,PHP: 表达式 - Manual
- Linux之Json20160705
- 疲劳驾驶监测方案_【Nano Energy】TENG用于驾驶员驾驶状态监测
- OPENSTACK重装系统失败导致虚拟机状态为error
- DHPST分销系统 YEP分销云主机分销系统源码
- 《HTML5 2D游戏编程核心技术》——第2章,第2.3节使用CSS背景
- 2018最新版硬盘装系统,不要U盘也能装
- 基于JAVA+Servlet+JSP+MYSQL的网上订餐管理系统
- Java-面向对象(基础知识)
- STM32/TMS320F2812+W5500硬软件调试总结
- MySQL5.7.19解压版配置
- Hadoop1.2.0开发笔记(九)
- 【论文+推导】Predictability and Prediction of Human Mobility Based on Application-Collected Location Data
- php 银行支付通道_基于PHP框架的聚合四方支付系统
- 计算机cpu基础知识ppt,计算机硬件基础知识ppt课件
- 企业手机装配线平衡改善研究
- 状态压缩dp(状压dp)