# -*- coding:UTF-8 -*-
import re
import systest = "<span>上联:光换kindle不读书,穷烧耳机不听歌。"
print test
if sys.version_info < (3, 4):  #python 判断 :https://segmentfault.com/q/1010000000127878pattern = re.compile('[\x80-\xff]+')
else:pattern = re.compile('[\u4e00-\u9fa5]+')
items = re.findall(pattern,test)
for item in items:print item

第一句话表明,我们使用的是UTF8格式,所以使用

print test

输出正常。

接下来我们解析中文,因为不同的python版本,使用不同的规则,见山所述。

注意:这是针对只包含中英文字符串的匹配方法,多语言字符串中找出中文用这种方式是不行的。而且他只能输出中文,如果在中文中夹杂着英文就不行了。关于中文夹杂英文,我们见下一篇文章。

【python】解析中英文相关推荐

  1. 测试一些利用PYTHON完成中英文翻译的效果

    简 介: 测试了一些在线翻译工具的效果,利用有道翻译 可以方便对常见到的生词进行确认.对于 TEASOFT软件PYTHON功能进行改建,给出了 ?>的翻译模式功能. 关键词: 在线翻译,中英文翻 ...

  2. python解析response_python:解析requests返回的response(json格式)说明

    我就废话不多说了,大家还是直接看代码吧! import requests, json r = requests.get("http://192.168.207.160:9000/api/qu ...

  3. python解析json_python解析json文件

    概念 序列化(Serialization):将对象的状态信息转换为可以存储或可以通过网络传输的过程,传输的格式可以是JSON.XML等.反序列化就是从存储区域(JSON,XML)读取反序列化对象的状态 ...

  4. python 解析xml

    在工作中很多时候都要用到xml,使用这个时候难免会设计到解析他,然后就研究了一下python解析xml问题,看了很多东西,python有很多解析xml的包,但是也折腾我好一段时间,最后选择了这个方法. ...

  5. python 读取文件读出来是什么格式-深入学习python解析并读取PDF文件内容的方法...

    这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...

  6. python中读取文件内容-深入学习python解析并读取PDF文件内容的方法

    这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...

  7. python 命令-python解析命令行参数的三种方法详解

    这篇文章主要介绍了python解析命令行参数的三种方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 python解析命令行参数主要有三种方法: ...

  8. 【Android 逆向】使用 Python 解析 ELF 文件 ( Capstone 反汇编 ELF 文件中的机器码数据 | 完整代码示例 ) ★★★

    文章目录 一.完整代码示例 二.执行结果 三.博客资源 一.完整代码示例 使用 Python 解析 ELF 文件完整代码示例 : # coding=utf-8 # 解析 elf 文件需要导入的依赖库 ...

  9. python 解析xml格式_Python解析XML文件

    1.概述 Python有三种方法解析XML:SAX,DOM,以及ElementTree: 1.SAX (simple API for XML ) python 标准库包含SAX解析器,SAX用事件驱动 ...

  10. python解析log文件_python解析基于xml格式的日志文件

    大家中午好,由于过年一直还没回到状态,好久没分享一波小知识了,今天,继续给大家分享一波Python解析日志的小脚本. 首先,同样的先看看日志是个啥样. 都是xml格式的,是不是看着就头晕了??没事,我 ...

最新文章

  1. 关于Unicode,字符集,字符编码
  2. mysql忘记密麻麻_mysql忘记密码怎么办
  3. 基于c#的相关性分析_基于数字高程模型的城市地貌与地名相关性分析——以兰州市为例...
  4. Algorithm:树相关算法(BBT/BST/B树/R树)简介(二叉查找树、二叉查找树的插入节点、二叉查找树的删除、二叉树的遍历、平衡二叉树)C 语言实现
  5. 图的根节点-数据结构作业。。
  6. ASP.NET Core Web 应用程序系列(一)- 使用ASP.NET Core内置的IoC容器DI进行批量依赖注入(MVC当中应用)...
  7. 内存泄漏–测量频率和严重性
  8. scss-!optional
  9. 一个关于数学归纳法的悖论问题-续
  10. 用python绘制心形_python小趣味_520绘制一个心形.
  11. 关于计算机组件游戏,Windows系统运行库/游戏运行库组件怎么补全?
  12. 漏洞挖掘之通达OA2017任意文件上传(漏洞已失效)
  13. while循环是否加分号
  14. 采用HCNR200/201模拟量隔离电路分享
  15. [DEMO] 互联网广告RTB机制简介
  16. 中国的超级计算机银河号,美国突然切断GPS,是银河号的一次屈辱,中国:不会再让悲剧发生...
  17. jqgrid实现表头合并功能
  18. 教你一个快递查询单号查询物流的简单方法
  19. RelativeLayout(相对布局)
  20. pde与波长 sipm 关系_基于SiPM和TCMPC的时间分辨拉曼散射测量技术研究

热门文章

  1. java正则在线转换_java正则表达式(转)
  2. 【漏洞复现-EmpireCms-文件上传】vulfocus/empirecms-cve_2018_18086
  3. mac linux 性能测试工具,Mac/Linux压力测试神器Siege详解(附安装过程)
  4. 5.服务网关:GateWay
  5. 解决Eclipse4K屏下工具栏过小
  6. freemaker 导出自动分页word文档
  7. 蓝蓝算法06--输出链表中倒数第k个结点
  8. Apache Flink_JZZ158_MBY
  9. Python 输入、输出
  10. 激光雷达与毫米波雷达的区别