python 中英文 分离_Python 将字符串的中英文分离的完整代码
这篇文章主要为大家详细介绍了Python 将字符串的中英文分离的完整代码,具有一定的参考价值,可以用来参考一下。
感兴趣Python 将字符串的中英文分离的完整代码的小伙伴,下面一起跟随512笔记的小编罗X来看看吧。
在进行文本分析、提取关键词时,新闻评论等文本通常是中英文及其他语言的混杂,若不加处理直接分析,结果往往差强人意。
# 512笔记网 (www.512pic.com)
s = "China's Legend Holdings will split its several business arms to go public on stock markets, the group's president Zhu Linan said on Tuesday.该集团总裁朱利安周二表示,中国联想控股将分拆其多个业务部门在股市上市。"
result = "".join(i for i in s if ord(i) < 256)
print(result)
# End 512.笔记 www.512pic.com
out:
China's Legend Holdings will split its several business arms to go public on stock markets, the group's president Zhu Linan said on Tuesday.
2、unicode编码识别
# 512笔记网 (www.512pic.com)
import re
s = "China's Legend Holdings will split its several business arms to go public on stock markets, the group's president Zhu Linan said on Tuesday.该集团总裁朱利安周二表示,中国联想控股将分拆其多个业务部门在股市上市。"
uncn = re.compile(r'[\u0061-\u007a,\u0020]')
en = "".join(uncn.findall(s.lower()))
print(en)
# End 512.笔记 www.512pic.com
out:
chinas legend holdings will split its several business arms to go public on stock markets, the groups president zhu linan said on tuesday
中文的编码范围是:\u4e00-\u9fa5,相应的[^\u4e00-\u9fa5]可匹配非中文。
匹配英文时,需要将空格[\u0020]加入,不然单词之间没空格了。
注:关于Python 将字符串的中英文分离的完整代码的内容就先介绍到这里,更多相关文章的可以留意512笔记的其他信息。
关键词:中英文
python 中英文 分离_Python 将字符串的中英文分离的完整代码相关推荐
- Python编程,使用turtle画出漂亮的雪花--完整代码绘画实现洁白的雪绒花~~
Python编程,使用turtle画出漂亮的雪花--完整代码实现洁白的雪绒花~~ Python中turtle库,可以方便的让你实现各种各样的功能.简单易用,有的时候能够创作出,你想像不到的漂亮图案.今 ...
- php 去除中英文空格,php去除字符串首尾中英文空格程序-PHP源码
下面本文章来给各位同学总结了几种php去除字符串首尾中英文空格程序实例,这里有用正则替换与trim系列函数删除,下面我们来看看. <script>ec(2);<script> ...
- php 去除中英文空格,php去除字符串首尾中英文空格程序_PHP教程
下面本文章来给各位同学总结了几种php去除字符串首尾中英文空格程序实例,这里有用正则替换与trim系列函数删除,下面我们来看看. 例1.trim函数删除空格 trim()函数用于去除字符串开始位置以及 ...
- php 去除中英文空格,php去除字符串首尾中英文空格程序
下面本文章来给各位同学总结了几种php去除字符串首尾中英文空格程序实例,这里有用正则替换与trim系列函数删除,下面我们来看看. 例1.trim函数删除空格 trim()函数用于去除字符串开始位置以及 ...
- python单词反转_python文本 字符串逐字符反转以及逐单词反转
python文本 字符串逐字符反转以及逐单词反转 场景: 字符串逐字符反转以及逐单词反转 首先来看字符串逐字符反转,由于python提供了非常有用的切片,所以只需要一句就可以搞定了 >>& ...
- python 数据分析找到老外最喜欢的中国美食【完整代码】
一.环境及依赖 语言:python3.8 抓取:selenium 代理:ipide **注:**想要完整代码的在末尾,注意新手建议慢慢看完.在此提示一下本篇文章的编写步骤:1.获取数据.2.翻译.3. ...
- python print table_python 6.7 编写printTable()函数表格打印(完整代码)
编写一个名为printTable()的函数,它接受字符串的列表的列表,将它显示在组织良好的表格中,每列右对齐.假定所有内层列表都包含同样数目的字符串 输入: tableData = [['apple' ...
- Python实战-新能源王者宁德时代股权穿透研究(附完整代码)
继上一篇对贵州茅台和华能信托的股权穿透研究后,又持续对代码做了优化更新,本篇研究新能源王者宁德时代 目录 1.查找网站爱企查 2.搜索新能源王者宁德时代 2.1 company_name 参数是:宁德 ...
- 请用python编写一个斗地主小游戏,并给出完整代码
很高兴为您服务!这是一个使用Python编写的斗地主小游戏的完整代码:# 导入必备模块 import random# 定义一副牌 poker = ['A', 2, 3, 4, 5, 6, 7, 8, ...
- Python基于tk界面的万年历+阳历阴历(附完整代码)
一.介绍tkinter并下载 tkinter tkinter(Tk interface)是Python的标准GUl库,支持跨平台的GUl程序开发.tkinter适合小型的GUl程序编写,也特别适合初学 ...
最新文章
- C# 对Excel的样式操作
- 重没想过好好走下去----我的IT成长路
- matlab中print、fprintf、scanf、disp函数简要语法介绍
- 【渝粤教育】国家开放大学2019年春季 8042-22T养殖业基础 参考试题
- css选择器中:first-child与:first-of-type的区别
- 计算时间间隔分钟_九个小技巧,玩转Excel的时间计算
- odoo10在win7下的安装详细步骤
- TCP传输的三次握手四次挥手策略
- 【 Codeforces Round #552 (Div. 3) G】Minimum Possible LCM【埃氏筛】
- 计算机网络布线总结,网络综合布线实训总结
- final、finalize、finally异同,以及final关键字如何使用
- 基于STM32F405平台的多摩川协议编码器通讯过程(1)
- 编译原理(整体理解)
- CSS - 知识清单(自用)
- 用vc++穷举windows应用程序密码
- 图片与视频的相互转换
- 最新微信记录恢复工具MMRecovery的下载与使用方法
- SpringBoot 接口数据加解密实战
- FTP笔记-FTP主动模式和被动模式
- C语言下的重排串问题