python中英文字符怎么区分-python 利用utf-8编码判断中英文字符的简单示例
这篇文章主要为大家详细介绍了python 利用utf-8编码判断中英文字符的简单示例,具有一定的参考价值,可以用来参考一下。
感兴趣python 利用utf-8编码判断中英文字符的简单示例的小伙伴,下面一起跟随512笔记的小编罗X来看看吧。包含了判断unicode是否是汉字、数字、英文或者其他字符,全角符号转半角符号,unicode字符串归一化等工作。
# 512笔记网 (www.512pic.com)
#!/usr/bin/env python
# -*- coding:GBK -*-
"""汉字处理的工具:
判断unicode是否是汉字,数字,英文,或者其他字符。
全角符号转半角符号。"""
__author__="internetsweeper "
__date__="2007-08-04"
def is_chinese(uchar):
"""判断一个unicode是否是汉字"""
if uchar >= u"一" and uchar<=u"龥":
return True
else:
return False
def is_number(uchar):
"""判断一个unicode是否是数字"""
if uchar >= u"0" and uchar<=u"9":
return True
else:
return False
def is_alphabet(uchar):
"""判断一个unicode是否是英文字母"""
if (uchar >= u"A" and uchar<=u"Z") or (uchar >= u"a" and uchar<=u"z"):
return True
else:
return False
def is_other(uchar):
"""判断是否非汉字,数字和英文字符"""
if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)):
return True
else:
return False
def B2Q(uchar):
"""半角转全角"""
inside_code=ord(uchar)
if inside_code<0x0020 or inside_code>0x7e: #不是半角字符就返回原来的字符
return uchar
if inside_code==0x0020: #除了空格其他的全角半角的公式为:半角=全角-0xfee0
inside_code=0x3000
else:
inside_code+=0xfee0
return unichr(inside_code)
def Q2B(uchar):
"""全角转半角"""
inside_code=ord(uchar)
if inside_code==0x3000:
inside_code=0x0020
else:
inside_code-=0xfee0
if inside_code<0x0020 or inside_code>0x7e: #转完之后不是半角字符返回原来的字符
return uchar
return unichr(inside_code)
def stringQ2B(ustring):
"""把字符串全角转半角"""
return "".join([Q2B(uchar) for uchar in ustring])
def uniform(ustring):
"""格式化字符串,完成全角转半角,大写转小写的工作"""
return stringQ2B(ustring).lower()
def string2List(ustring):
"""将ustring按照中文,字母,数字分开"""
retList=[]
utmp=[]
for uchar in ustring:
if is_other(uchar):
if len(utmp)==0:
continue
else:
retList.append("".join(utmp))
utmp=[]
else:
utmp.append(uchar)
if len(utmp)!=0:
retList.append("".join(utmp))
return retList
if __name__=="__main__":
#test Q2B and B2Q
for i in range(0x0020,0x007F):
print Q2B(B2Q(unichr(i))),B2Q(unichr(i))
#test uniform
ustring=u"中国 人名a高频A"
ustring=uniform(ustring)
ret=string2List(ustring)
print ret
# End 512.笔记 www.512pic.com
注:关于python 利用utf-8编码判断中英文字符的简单示例的内容就先介绍到这里,更多相关文章的可以留意512笔记的其他信息。
关键词:utf-8,中英文
python中英文字符怎么区分-python 利用utf-8编码判断中英文字符的简单示例相关推荐
- php foreach 时间,PHP利用for,while,foreach遍历时间比较的简单示例
这篇文章主要为大家详细介绍了PHP利用for,while,foreach遍历时间比较的简单示例,具有一定的参考价值,可以用来参考一下. 感兴趣的小伙伴,下面一起跟随512笔记的小玲来看看吧!这个是从别 ...
- php 递归格式化数组,PHP利用递归实现无限分类,格式化数组的简单示例
这篇文章主要为大家详细介绍了PHP利用递归实现无限分类,格式化数组的简单示例,具有一定的参考价值,可以用来参考一下. 感兴趣的小伙伴,下面一起跟随512笔记的小玲来看看吧!我们要做一个商品的无限分类 ...
- python辗转相除法求最小公倍数_Python实现利用最大公约数求三个正整数的最小公倍数示例...
Python实现利用最大公约数求三个正整数的最小公倍数示例 本文实例讲述了Python实现利用最大公约数求三个正整数的最小公倍数.分享给大家供大家参考,具体如下: 在求解两个数的小公倍数的方法时,假设 ...
- golang python扩展_Python 利用Go语言编写 CPython 扩展 goPy的简单示例
对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧! goPy 是一个新的开源项目,实现了用 Go 语言来编写 CPython 扩展. 示例代码: # ...
- python通过微信聊天记录分析_Python利用itchat对微信中好友数据实现简单分析的方法...
前言 最近在一个微信公众号上看到一个调用微信 API 可以对微信好友进行简单数据分析的一个包 itchat 感觉挺好用的,就简单尝试了一下. 库文档说明链接在这: itchat 安装 在终端中输入以下 ...
- c语言如何判断字符不是空格,C语言中如何判断一个字符是空格,下一个字符不是空格...
满意答案 NICaben 2018.11.04 采纳率:53% 等级:12 已帮助:6601人 #include #include int get_word_nums(const char *s ...
- python utf—8编码问题待解决
执行python manage. py runserver后出现错误 utf-8编码出错 (result, consumed) = self._buffer_encode(data, self.err ...
- python(40):利用utf-8编码判断中文英文字符
#!/usr/bin/env Python # -*- coding:GBK -*- """汉字处理的工具: 判断unicode是否是汉字,数字,英文,或者其他字符. 全 ...
- python英文字符表示_python利用utf-8编码判断中文英文字符(转)
下面这个小工具包含了判断unicode是否是汉字.数字.英文或者其他字符,全角符号转半角符号,unicode字符串归一化等工作. #!/usr/bin/env python # -*- coding: ...
最新文章
- 自定义结构体-相机参数数据类型
- 8086汇编复习1 - 并使用emu8086模拟器查看效果
- JZOJ 5422. 【NOIP2017提高A组集训10.25】天才绅士少女助手克里斯蒂娜
- BOOST_VMD_ASSERT_IS_TUPLE宏相关的测试程序
- PostgreSQL 优化器代码概览 1
- 怎么把打开方式改回计算机程序,电脑打开方式改变了,怎么还原
- centos usb转网口_centOS安装与配置minicom(串口转USB)
- 赛道一双周冠军分享:我不是TFboy,所以新写了baseline
- 高级Javascript调试——console.table()
- 0712 - 坚守,加强老本
- java编程艺术 高永强_Shardingsphere can not initialize xaTransaction问题
- android 平板刷机工具,小白必看,安卓平板电脑刷机教程之一键刷机
- Wind Python案例
- 模2除法——用非常直观的例子解释
- 一些货币政策及金融术语简介
- 【知识贴】战争中的数学应用
- C语言 写一个函数求两个数的较大值
- 中国现代书画家——鞠宗霖
- 编写python程序、计算账户余额_《易学Python》——第1章 为何学习Python 1.1 学习编程...
- [转]Git详解之四 服务器上的Git
热门文章
- Docker:架构分解
- 高效沟通的5个原则,解决90%的沟通问题
- 广东理工学院计算机组成原理,20年广东理工学院成人高考期末考试 计算机组成原理 复习资料(7页)-原创力文档...
- Linux rm -rf 之rm: cannot remove `linux': Device or resource busy
- 怎么设置织梦栏目html结尾,dedecms网站栏目地址url优化成.html结尾的而不是文件夹形式结尾的。请大家来帮忙。...
- EOS区块链常见错误编码代码汇总
- 问题:微信小程序开发之 --- app.js文件介绍
- 小组取什么名字好_寓意兴旺的公司名字取什么名字好
- html页面表格字体,如何在移动设备html页面的表格单元格中设置相同的字体大小...
- 大数据平台及数仓的通用架构和技术体系