I got a file which includes many lines of plain utf-8 text. Such as below, by the by, it's Chinese.

PROCESS:类型:关爱积分[NOTIFY] 交易号:2012022900000109 订单号:W12022910079166 交易金额:0.01元 交易状态:true 2012-2-29 10:13:08

The file itself was saved in utf-8 format. file name is xx.txt

here is my python code, env is python2.7

#coding: utf-8

import re

pattern = re.compile(r'交易金额:(\d+)元')

for line in open('xx.txt'):

match = pattern.match(line.decode('utf-8'))

if match:

print match.group()

The problematic thing here is I got no results.

I wanna get the decimal string from 交易金额:0.01元, in here, which is 0.01.

Why doesn't this code work? Can anyone explain it to me, I got no clue whatsoever.

解决方案

There are several issues with your code. First you should use re.compile(ur''). Also it is nice to add re.UNICODE flag (not sure if really needed here though). Next one is that still you will not receive a match since \d+ doesn't handle decimals just a series of numbers, you should use \d+\.?\d+ instead (you want number, probably a dot and a number). Example code:

#coding: utf-8

text = u"PROCESS:类型:关爱积分[NOTIFY] 交易号:2012022900000109 订单号:W12022910079166 交易金额:0.01元 交易状态:true 2012-2-29 10:13:08"

import re

pattern = re.compile(ur'交易金额:(\d+\.?\d+)元', re.UNICODE)

print pattern.search(text).group(1)

python正则表达式面试题,带有utf8问题的python正则表达式相关推荐

  1. python中soup_python – 使用带有UTF-8的soup.get_text()

    我需要使用BeautifulSoup从页面获取所有文本.在BeautifulSoup的文档中,它显示你可以做soup.get_text()来做到这一点.当我在reddit.com上尝试这样做时,我收到 ...

  2. python爬虫面试题-扣丁学堂解析Python爬虫工程师面试题汇总

    扣丁学堂解析Python爬虫工程师面试题汇总 2018-08-20 11:24:39 1629浏览 今天,扣丁学堂的小编来给大家总结一下Python爬虫的面试技巧,希望给参加Python培训的同学一点 ...

  3. python123m与n的数学运算_【Python数学面试题】面试问题:Python“… - 看准网

    整数类型:与数学中整数的概念一致 -可正可负,没有取值范围限制 -pow(x,y)函数:计算xy,想算多大算多大 -十进制:1010,99,-217 -二进制:以0b或0B开头:0b010,-0B10 ...

  4. 小猿圈python之python期末考试测试题(二)_小猿圈Python开发面试题(二)

    原标题:小猿圈Python开发面试题(二) 小猿圈Python老师继上一次python面试题一,接着更新python面试题二,同学们测试一做的怎么样呢?有没有把握呢,想要看答案的同学们,可以在小猿圈上 ...

  5. python经典面试题100例 面试宝典

    人生苦短 我用 Python 芝麻开门! python 进阶 1 python 经典面试题 9 python 面试 100 例 21 python 面试题总结 101 python 进阶 1 PEP8 ...

  6. 170 道 Python 爬虫面试题(2019 版)

    引言 最近在刷面试题,所以需要看大量的 Python 相关的面试题,从大量的题目中总结了很多的知识,同时也对一些题目进行拓展了,但是在看了网上的大部分面试题不是很满意,一个是有些部分还是 Python ...

  7. php获取js函数返回的值_最全最详细的PHP面试题(带有答案)

    这篇文章介绍的内容是关于最全最详细的PHP面试题(带有答案),有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 相关推荐: 八重樱:分享一波腾讯PHP面试题 八重樱:2019年PHP最新面 ...

  8. Python 爬虫面试题 170 道:2019 版

    引言 最近在刷面试题,所以需要看大量的 Python 相关的面试题,从大量的题目中总结了很多的知识,同时也对一些题目进行拓展了,但是在看了网上的大部分面试题不是很满意,一个是有些部分还是 Python ...

  9. python web面试题部分汇总

    文章目录 分布式爬虫 django的请求周期 0.深拷贝和浅拷贝的区别? 1.\*args, ** kwargs是什么意思? 2.谈一谈Python中的装饰器 3.Python的垃圾回收机制以及内存管 ...

  10. Python 爬虫 面试题

    目录 理论 笔试或面试记录题 理论 爬虫遵循的协议:robot协议 定义:网络爬虫排除标准. 作用:告诉搜索引擎哪里可以爬,哪里不可以爬. 爬虫分类 (1)通用爬虫:搜索引擎的主要组成,作用就是将互联 ...

最新文章

  1. 95 后哈佛小哥撰写《从零开始的机器学习》,入门必备,书籍资源已开放
  2. python数组不同地方
  3. adb可以连接linux设备吗,Linux通过ADB与Android设备交互
  4. Codeforces Round #663 (Div. 2)
  5. 29 Python - 字符与编码
  6. windows7更改开始菜单外观的方法
  7. RocketMQ核心架构设计思想
  8. null或空值的判断处理-java
  9. 第三方库之 - SDWebImage
  10. GPGGA \ GPRMC 格式解析
  11. 如何更改itunes备份位置_Mac怎么修改iTunes的备份路径 如何在 Mac 中修改iTunes的备份路径...
  12. android 图片轮播控
  13. 实现进程互斥需要遵循的原则
  14. python实现问卷网的自动填写详解
  15. 自动驾驶创业方向有变化?如何突破技术瓶颈?
  16. MT6771平台简要了解
  17. HC-SR501人体红外感应模块程序
  18. Scratch软件编程等级考试二级——20210320
  19. 计算机软考科目中,该怎么选择考试科目?
  20. Apache Activemq-JMS了解+mq指定JDK

热门文章

  1. python获取日期的年月日_python datetime和time的一些疑惑解答 及 获取上年同期、上月等日期...
  2. Spring MVC 常用注解
  3. backports移植rtlwifi驱动
  4. 手机圈老兵任伟光加盟联想
  5. 使用avalon2 去构建一个 app-route
  6. mysql做主从分离后插入更新过慢
  7. OSPF综合实验(有点难哦!)
  8. 十二款世界顶级杀毒软件下载,有序列号
  9. Elasticsearch 之索引创建原则
  10. 最佳实践:阿里云VPC、ECS支持IPv6啦!