python判断字符串包含中文_高手接招! 小应用 用python3判断一个字符串是不是中文组成的...
在python3中,str默认是unicode编码
用 ord() 函数判断单个字符的unicode编码是否大于255即可。
一般来说,中文常用字的范围是:[\u4e00-\u9fa5]
准确点判断中文字符,可以这样比较:
>>> X,Y = ['\u4e00','\u9fa5']
>>> X<='阿'<=Y
True
例子:
>>> a = "你好";b = "
你好"
>>> def isAllZh(s):
for c in s:
if not('\u4e00' <= c <= '\u9fa5'):
return False
return True
>>> isAllZh(a)
True
>>> isAllZh(b)
False
#或者用 all()
>>> all(map(lambda c:'\u4e00' <= c <= '\u9fa5',a))
True
>>> all(map(lambda c:'\u4e00' <= c <= '\u9fa5',b))
False
既然 @依云 提出了编码范围的问题,就再补充一些~
详细的unicode分区信息可以参考这里:中日韩统一表意文字
楼主是问 判断中文的算法;很简单,就是比较字符编码的大小,落在cjk文字范围内,就是中文。
出了[\u4e00-\u9fa5]范围的汉字,多数是生僻字、异体字;如果很在意的话,可以参照下表,多加几个判断条件即可。
中文在unicode里的分区码段:
1、中日韩扩展部首[2E80-2EFF](116字)
2、康熙字典部首[2F00-2FDF](214字)
3、表意文字描述字符[2FF0-2FFF](12字)
4、中日韩笔画[31C0-31EF](37字)
5、中日韩统一表意文字扩展A区[3400-4DBF](6582字)
6、中日韩统一表意文字[4E00-9FFF](20940字)
7、私用区[E000-F8FF](896字)
8、中日韩兼容表意文字[F900-FAFF](471字)
9、中日韩统一表意文字扩展B区[20000-2A6DF](42711字)
10、中日韩统一表意文字扩展C区[2A700-2B73F](4149字)
11、中日韩统一表意文字扩展D区[2B740-2B81F](222字)
12、中日韩统一表意文字增补集[2F800-2FA1F](542字)
13、增补私用A区[F0000-FFFFF](73字)
python判断字符串包含中文_高手接招! 小应用 用python3判断一个字符串是不是中文组成的...相关推荐
- python3一个中文3个字符_高手接招! 小应用 用python3判断一个字符串是不是中文组成的...
在python3中,str默认是unicode编码 用 ord() 函数判断单个字符的unicode编码是否大于255即可. 一般来说,中文常用字的范围是:[\u4e00-\u9fa5] 准确点判断中 ...
- python类中包含类_彻底搞懂Python中的类
Python类的定义 Python 中定义一个类使用 class 关键字实现,其基本语法格式如下:class 类名: 多个(≥0)类属性... 多个(≥0)类方法... 注意,无论是类属性还是类方法, ...
- cstring判断是否包含子串_最长子串-滑动窗口
接下来我会找出LeetCode中一些比较有代表性的题,带来它的算法和讲解 很多题目,使用一般的暴力算法很多都能解出来,但时间复杂度可能是 O(n3),会比最优解慢很多,尤其是数据量变大时. 在我们实际 ...
- python怎么做彩票概率_小白学数据小抄放送 Python,R,大数据,机器学习
原标题:小白学数据小抄放送 Python,R,大数据,机器学习 大数据文摘作品,转载要求见文末 作者 | Elaine,田桂英,Aileen 导读:前段时间小白学数据专栏出了一期Python小抄表,后 ...
- linux shell 字符串替换字符,关于bash:在shell脚本中替换另一个字符串的一个子字符串...
我有"我爱苏西并结婚",我想把"苏西"改成"萨拉". #!/bin/bash firstString="I love Suzi a ...
- c语言如何用fscanf将字符串读取,在c语言中如何将文本内容 赋给一个 字符串
在c语言中如何将文本内容 赋给一个 字符串 来源:互联网 宽屏版 评论 2009-08-13 04:59:12 分类: 电脑/网络 >> 程序设计 >> 其他编程语言 问题 ...
- python策略模式包含角色_详解Python设计模式之策略模式
虽然设计模式与语言无关,但这并不意味着每一个模式都能在每一门语言中使用.<设计模式:可复用面向对象软件的基础>一书中有 23 个模式,其中有 16 个在动态语言中"不见了,或者简 ...
- python找出主力合约价格_什么是期货主力合约?如何判断主力合约是哪个?
什么是期货主力合约? 所谓期货主力合约指的是成交量最大的期货合约,因为它是市场上最活跃的合约,也是最容易成交的合约,所有投机者基本上都在参与这个合约.(主力合约之外的其他月份合约,活跃度相对较差,开仓 ...
- python写等腰三角形的性质_杨辉三角—知识点详解 - osc_8cfq8uoa的个人空间 - OSCHINA - 中文开源技术交流社区...
杨辉三角 杨辉三角(欧洲叫帕斯卡三角)是一个很奇妙的东西,它是我国数学家杨辉在1261年发现的,欧洲的帕斯卡于1654年发现,比我国的巨佬数学家杨辉晚了393年.(在此show一下我的爱国情怀) 铺垫 ...
最新文章
- function()默认参数中ReferenceError Cannot access ‘a‘ before initialization的解决方法
- 用UltraISO制作支持windows 7的U盘启动盘
- linux中查看文件指定行的数据
- Linux shell中的那些小把戏
- iis php 无法访问此网站_IIS 配置phpmanage
- Nginx 默认的日志类型
- OGRE学习笔记(一)通过例子了解场景管理器---------地形创建
- 供应链金融产品业务全揭秘
- 利用python构建马科维茨_Python_画马科维茨有效前沿
- 招投标系统源码 java招投标系统 招投标系统简介 招投标系统功能设计
- 30句瞬间使你清醒的话,别再假装糊涂下去了!
- tecplot选择变量
- ASP:KU论坛跳转页面
- python中的values函数_Pandas之排序函数sort_values()的实现
- 真肝,整理了一周的Spring面试大全【含答案】,吊打Java面试官
- 关于vs2010(C++ 工程)的异常问题(this is not a valid c/c++ file .CPP)的解决(C++ 初学者)
- 生成随机小数的函数python_哪个选项是random库中用于生成随机小数的函数?
- 密码学读书笔记系列(一):《密码故事——人类智力的另类较量》
- 学生信息管理系统(php+mysql)
- vue 微信公众号的H5支付