这篇文章主要为大家详细介绍了Python 将字符串的中英文分离的完整代码,具有一定的参考价值,可以用来参考一下。

感兴趣Python 将字符串的中英文分离的完整代码的小伙伴,下面一起跟随512笔记的小编罗X来看看吧。

在进行文本分析、提取关键词时,新闻评论等文本通常是中英文及其他语言的混杂,若不加处理直接分析,结果往往差强人意。

# 512笔记网 (www.512pic.com)

s = "China's Legend Holdings will split its several business arms to go public on stock markets, the group's president Zhu Linan said on Tuesday.该集团总裁朱利安周二表示,中国联想控股将分拆其多个业务部门在股市上市。"

result = "".join(i for i in s if ord(i) < 256)

print(result)

# End 512.笔记 www.512pic.com

out:

China's Legend Holdings will split its several business arms to go public on stock markets, the group's president Zhu Linan said on Tuesday.

2、unicode编码识别

# 512笔记网 (www.512pic.com)

import re

s = "China's Legend Holdings will split its several business arms to go public on stock markets, the group's president Zhu Linan said on Tuesday.该集团总裁朱利安周二表示,中国联想控股将分拆其多个业务部门在股市上市。"

uncn = re.compile(r'[\u0061-\u007a,\u0020]')

en = "".join(uncn.findall(s.lower()))

print(en)

# End 512.笔记 www.512pic.com

out:

chinas legend holdings will split its several business arms to go public on stock markets, the groups president zhu linan said on tuesday

中文的编码范围是:\u4e00-\u9fa5,相应的[^\u4e00-\u9fa5]可匹配非中文。

匹配英文时,需要将空格[\u0020]加入,不然单词之间没空格了。

注:关于Python 将字符串的中英文分离的完整代码的内容就先介绍到这里,更多相关文章的可以留意512笔记的其他信息。

关键词:中英文

python 中英文 分离_Python 将字符串的中英文分离的完整代码相关推荐

  1. Python编程,使用turtle画出漂亮的雪花--完整代码绘画实现洁白的雪绒花~~

    Python编程,使用turtle画出漂亮的雪花--完整代码实现洁白的雪绒花~~ Python中turtle库,可以方便的让你实现各种各样的功能.简单易用,有的时候能够创作出,你想像不到的漂亮图案.今 ...

  2. php 去除中英文空格,php去除字符串首尾中英文空格程序-PHP源码

    下面本文章来给各位同学总结了几种php去除字符串首尾中英文空格程序实例,这里有用正则替换与trim系列函数删除,下面我们来看看. <script>ec(2);<script> ...

  3. php 去除中英文空格,php去除字符串首尾中英文空格程序_PHP教程

    下面本文章来给各位同学总结了几种php去除字符串首尾中英文空格程序实例,这里有用正则替换与trim系列函数删除,下面我们来看看. 例1.trim函数删除空格 trim()函数用于去除字符串开始位置以及 ...

  4. php 去除中英文空格,php去除字符串首尾中英文空格程序

    下面本文章来给各位同学总结了几种php去除字符串首尾中英文空格程序实例,这里有用正则替换与trim系列函数删除,下面我们来看看. 例1.trim函数删除空格 trim()函数用于去除字符串开始位置以及 ...

  5. python单词反转_python文本 字符串逐字符反转以及逐单词反转

    python文本 字符串逐字符反转以及逐单词反转 场景: 字符串逐字符反转以及逐单词反转 首先来看字符串逐字符反转,由于python提供了非常有用的切片,所以只需要一句就可以搞定了 >>& ...

  6. python 数据分析找到老外最喜欢的中国美食【完整代码】

    一.环境及依赖 语言:python3.8 抓取:selenium 代理:ipide **注:**想要完整代码的在末尾,注意新手建议慢慢看完.在此提示一下本篇文章的编写步骤:1.获取数据.2.翻译.3. ...

  7. python print table_python 6.7 编写printTable()函数表格打印(完整代码)

    编写一个名为printTable()的函数,它接受字符串的列表的列表,将它显示在组织良好的表格中,每列右对齐.假定所有内层列表都包含同样数目的字符串 输入: tableData = [['apple' ...

  8. Python实战-新能源王者宁德时代股权穿透研究(附完整代码)

    继上一篇对贵州茅台和华能信托的股权穿透研究后,又持续对代码做了优化更新,本篇研究新能源王者宁德时代 目录 1.查找网站爱企查 2.搜索新能源王者宁德时代 2.1 company_name 参数是:宁德 ...

  9. 请用python编写一个斗地主小游戏,并给出完整代码

    很高兴为您服务!这是一个使用Python编写的斗地主小游戏的完整代码:# 导入必备模块 import random# 定义一副牌 poker = ['A', 2, 3, 4, 5, 6, 7, 8, ...

  10. Python基于tk界面的万年历+阳历阴历(附完整代码)

    一.介绍tkinter并下载 tkinter tkinter(Tk interface)是Python的标准GUl库,支持跨平台的GUl程序开发.tkinter适合小型的GUl程序编写,也特别适合初学 ...

最新文章

  1. C# 对Excel的样式操作
  2. 重没想过好好走下去----我的IT成长路
  3. matlab中print、fprintf、scanf、disp函数简要语法介绍
  4. 【渝粤教育】国家开放大学2019年春季 8042-22T养殖业基础 参考试题
  5. css选择器中:first-child与:first-of-type的区别
  6. 计算时间间隔分钟_九个小技巧,玩转Excel的时间计算
  7. odoo10在win7下的安装详细步骤
  8. TCP传输的三次握手四次挥手策略
  9. 【 Codeforces Round #552 (Div. 3) G】Minimum Possible LCM【埃氏筛】
  10. 计算机网络布线总结,网络综合布线实训总结
  11. final、finalize、finally异同,以及final关键字如何使用
  12. 基于STM32F405平台的多摩川协议编码器通讯过程(1)
  13. 编译原理(整体理解)
  14. CSS - 知识清单(自用)
  15. 用vc++穷举windows应用程序密码
  16. 图片与视频的相互转换
  17. 最新微信记录恢复工具MMRecovery的下载与使用方法
  18. SpringBoot 接口数据加解密实战
  19. FTP笔记-FTP主动模式和被动模式
  20. C语言下的重排串问题

热门文章

  1. 中级软件设计师笔记全套 看完你就过啦
  2. 【RS-422与RS-485】RS-422与RS-485串行接口标准
  3. 弘辽科技:直通车测款测图
  4. android三指截屏apk,手机也能截长图!360 OS三指截屏详解
  5. python获取中文字体点阵坐标_中文点阵字库的python自动生成程序
  6. 树莓派4B安装配置LibreELEC并连接到三星电视
  7. 阿里巴巴2017实习面试
  8. 怎么用PS为一寸证件照更换底色背景色
  9. 使用cmd命令 关机
  10. 计算机组装流程,电脑组装教程