这篇文章主要为大家详细介绍了python 利用utf-8编码判断中英文字符的简单示例,具有一定的参考价值,可以用来参考一下。

感兴趣python 利用utf-8编码判断中英文字符的简单示例的小伙伴,下面一起跟随512笔记的小编罗X来看看吧。包含了判断unicode是否是汉字、数字、英文或者其他字符,全角符号转半角符号,unicode字符串归一化等工作。

# 512笔记网 (www.512pic.com)

#!/usr/bin/env python

# -*- coding:GBK -*-

"""汉字处理的工具:

判断unicode是否是汉字,数字,英文,或者其他字符。

全角符号转半角符号。"""

__author__="internetsweeper "

__date__="2007-08-04"

def is_chinese(uchar):

"""判断一个unicode是否是汉字"""

if uchar >= u"一" and uchar<=u"龥":

return True

else:

return False

def is_number(uchar):

"""判断一个unicode是否是数字"""

if uchar >= u"0" and uchar<=u"9":

return True

else:

return False

def is_alphabet(uchar):

"""判断一个unicode是否是英文字母"""

if (uchar >= u"A" and uchar<=u"Z") or (uchar >= u"a" and uchar<=u"z"):

return True

else:

return False

def is_other(uchar):

"""判断是否非汉字,数字和英文字符"""

if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)):

return True

else:

return False

def B2Q(uchar):

"""半角转全角"""

inside_code=ord(uchar)

if inside_code<0x0020 or inside_code>0x7e: #不是半角字符就返回原来的字符

return uchar

if inside_code==0x0020: #除了空格其他的全角半角的公式为:半角=全角-0xfee0

inside_code=0x3000

else:

inside_code+=0xfee0

return unichr(inside_code)

def Q2B(uchar):

"""全角转半角"""

inside_code=ord(uchar)

if inside_code==0x3000:

inside_code=0x0020

else:

inside_code-=0xfee0

if inside_code<0x0020 or inside_code>0x7e: #转完之后不是半角字符返回原来的字符

return uchar

return unichr(inside_code)

def stringQ2B(ustring):

"""把字符串全角转半角"""

return "".join([Q2B(uchar) for uchar in ustring])

def uniform(ustring):

"""格式化字符串,完成全角转半角,大写转小写的工作"""

return stringQ2B(ustring).lower()

def string2List(ustring):

"""将ustring按照中文,字母,数字分开"""

retList=[]

utmp=[]

for uchar in ustring:

if is_other(uchar):

if len(utmp)==0:

continue

else:

retList.append("".join(utmp))

utmp=[]

else:

utmp.append(uchar)

if len(utmp)!=0:

retList.append("".join(utmp))

return retList

if __name__=="__main__":

#test Q2B and B2Q

for i in range(0x0020,0x007F):

print Q2B(B2Q(unichr(i))),B2Q(unichr(i))

#test uniform

ustring=u"中国 人名a高频A"

ustring=uniform(ustring)

ret=string2List(ustring)

print ret

# End 512.笔记 www.512pic.com

注:关于python 利用utf-8编码判断中英文字符的简单示例的内容就先介绍到这里,更多相关文章的可以留意512笔记的其他信息。

关键词:utf-8,中英文

python中英文字符怎么区分-python 利用utf-8编码判断中英文字符的简单示例相关推荐

  1. php foreach 时间,PHP利用for,while,foreach遍历时间比较的简单示例

    这篇文章主要为大家详细介绍了PHP利用for,while,foreach遍历时间比较的简单示例,具有一定的参考价值,可以用来参考一下. 感兴趣的小伙伴,下面一起跟随512笔记的小玲来看看吧!这个是从别 ...

  2. php 递归格式化数组,PHP利用递归实现无限分类,格式化数组的简单示例

    这篇文章主要为大家详细介绍了PHP利用递归实现无限分类,格式化数组的简单示例,具有一定的参考价值,可以用来参考一下. 感兴趣的小伙伴,下面一起跟随512笔记的小玲来看看吧!我们要做一个商品的无限分类 ...

  3. python辗转相除法求最小公倍数_Python实现利用最大公约数求三个正整数的最小公倍数示例...

    Python实现利用最大公约数求三个正整数的最小公倍数示例 本文实例讲述了Python实现利用最大公约数求三个正整数的最小公倍数.分享给大家供大家参考,具体如下: 在求解两个数的小公倍数的方法时,假设 ...

  4. golang python扩展_Python 利用Go语言编写 CPython 扩展 goPy的简单示例

    对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧! goPy 是一个新的开源项目,实现了用 Go 语言来编写 CPython 扩展. 示例代码: # ...

  5. python通过微信聊天记录分析_Python利用itchat对微信中好友数据实现简单分析的方法...

    前言 最近在一个微信公众号上看到一个调用微信 API 可以对微信好友进行简单数据分析的一个包 itchat 感觉挺好用的,就简单尝试了一下. 库文档说明链接在这: itchat 安装 在终端中输入以下 ...

  6. c语言如何判断字符不是空格,C语言中如何判断一个字符是空格,下一个字符不是空格...

    满意答案 NICaben 2018.11.04 采纳率:53%    等级:12 已帮助:6601人 #include #include int get_word_nums(const char *s ...

  7. python utf—8编码问题待解决

    执行python manage. py runserver后出现错误 utf-8编码出错 (result, consumed) = self._buffer_encode(data, self.err ...

  8. python(40):利用utf-8编码判断中文英文字符

    #!/usr/bin/env Python # -*- coding:GBK -*- """汉字处理的工具: 判断unicode是否是汉字,数字,英文,或者其他字符. 全 ...

  9. python英文字符表示_python利用utf-8编码判断中文英文字符(转)

    下面这个小工具包含了判断unicode是否是汉字.数字.英文或者其他字符,全角符号转半角符号,unicode字符串归一化等工作. #!/usr/bin/env python # -*- coding: ...

最新文章

  1. 自定义结构体-相机参数数据类型
  2. 8086汇编复习1 - 并使用emu8086模拟器查看效果
  3. JZOJ 5422. 【NOIP2017提高A组集训10.25】天才绅士少女助手克里斯蒂娜
  4. BOOST_VMD_ASSERT_IS_TUPLE宏相关的测试程序
  5. PostgreSQL 优化器代码概览 1
  6. 怎么把打开方式改回计算机程序,电脑打开方式改变了,怎么还原
  7. centos usb转网口_centOS安装与配置minicom(串口转USB)
  8. 赛道一双周冠军分享:我不是TFboy,所以新写了baseline
  9. 高级Javascript调试——console.table()
  10. 0712 - 坚守,加强老本
  11. java编程艺术 高永强_Shardingsphere can not initialize xaTransaction问题
  12. android 平板刷机工具,小白必看,安卓平板电脑刷机教程之一键刷机
  13. Wind Python案例
  14. 模2除法——用非常直观的例子解释
  15. 一些货币政策及金融术语简介
  16. 【知识贴】战争中的数学应用
  17. C语言 写一个函数求两个数的较大值
  18. 中国现代书画家——鞠宗霖
  19. 编写python程序、计算账户余额_《易学Python》——第1章 为何学习Python 1.1 学习编程...
  20. [转]Git详解之四 服务器上的Git

热门文章

  1. Docker:架构分解
  2. 高效沟通的5个原则,解决90%的沟通问题
  3. 广东理工学院计算机组成原理,20年广东理工学院成人高考期末考试 计算机组成原理 复习资料(7页)-原创力文档...
  4. Linux rm -rf 之rm: cannot remove `linux': Device or resource busy
  5. 怎么设置织梦栏目html结尾,dedecms网站栏目地址url优化成.html结尾的而不是文件夹形式结尾的。请大家来帮忙。...
  6. EOS区块链常见错误编码代码汇总
  7. 问题:微信小程序开发之 --- app.js文件介绍
  8. 小组取什么名字好_寓意兴旺的公司名字取什么名字好
  9. html页面表格字体,如何在移动设备html页面的表格单元格中设置相同的字体大小...
  10. 大数据平台及数仓的通用架构和技术体系