python判断字符串包含中文_查询字符串中是否包含中文字符(Python实现)
Unicode 是全球文字统一编码。它把世界上的各种文字的每一个字符指定唯一编码,实现跨语种、跨平台的应用。
中文用户最常接触的是汉字 Unicode 编码。中文字符数量巨大,日常使用的汉字数量有数千个,再加上生僻字,数量达到数万个。下面这个表格将中文字符集的 Unicode 编码范围列出:
字符集
字数
Unicode编码范围基本汉字
20902
4E00-9FA5
基本汉字补充
74
9FA6-9FEF
扩展A
6582
3400-4DB5
扩展B
42711
20000-2A6D6
扩展C
4149
2A700-2B734
扩展D
222
2B740-2B81D
扩展E
5762
2B820-2CEA1
扩展F
7473
2CEB0-2EBE0
扩展G
4939
30000-3134A
康熙部首
214
2F00-2FD5
部首扩展
115
2E80-2EF3
兼容汉字
477
F900-FAD9
兼容扩展
542
2F800-2FA1D
PUA(GBK)部件
81
E815-E86F
部件扩展
452
E400-E5E8
PUA增补
207
E600-E6CF
汉字笔画
36
31C0-31E3
汉字结构
12
2FF0-2FFB
汉语注音
43
3105-312F
注音扩展
22
31A0-31BA
〇
1
3007
根据上述字符范围,可以编写以下函数,识别给定字符串是否含义中文字符。
# coding=utf-8
import re
def containChinese(content):
""" 判断内容是否含有中文字符
Arguments:
content {string} -- 要检测的内容
Returns:
[bool] -- 是否包含中文
"""
zh_pattern = re.compile(
u'([\u4E00-\u9FA5]|[\u9FA6-\u9FEF]|[\u3400-\u4DB5]|[\U00020000-\U0002A6D6]|[\U0002A700-\U0002B734]|[\U0002B740-\U0002B81D]|[\U0002B820-\U0002CEA1]|[\U0002CEB0-\U0002EBE0]|[\U00030000-\U0003134A]|[\u2F00-\u2FD5]|[\u2E80-\u2EF3]|[\uF900-\uFAD9]|[\U0002F800-\U0002FA1D]|[\uE815-\uE86F]|[\uE400-\uE5E8]|[\uE600-\uE6CF]|[\u31C0-\u31E3]|[\u2FF0-\u2FFB]|[\u3105-\u312F]|[\u31A0-\u31BA]|[\u3007])+'
)
match = zh_pattern.search(content)
return match is not None
a = '中文abcs短语'
print(containChinese(a)) # True
b = 'abcd'
print(containChinese(b)) # False
python判断字符串包含中文_查询字符串中是否包含中文字符(Python实现)相关推荐
- PHP中文无法查询,php 中htmlentities导致中文无法查询问题
在php中htmlspecialchars, 将特殊字元转成 HTML 格式,而htmlentities,将所有的字元都转成 HTML 字串 了,下面我来分别简单的介绍. htmlentities用法 ...
- python 加载动图_在浏览器中使用TensorFlow.js和Python构建机器学习模型(附代码)...
大数据文摘授权转载自数据派THU 作者:MOHD SANAD ZAKI RIZVI 本文主要介绍了: TensorFlow.js (deeplearn.js)使我们能够在浏览器中构建机器学习和深度学习 ...
- python判断矩阵是否对称_矩阵的特征分解(推导+手算+python计算+对称矩阵的特征分解性质)...
1. 前言 最近几天一直在学习矩阵的知识,恶补了特征分解和SVD算法,发现网上很多资料都是不全的,所以想记录一下这里面的特征分解推导过程. 2.矩阵的进阶知识 2.1 特征分解(谱分解)=> ...
- golang 包含 数组_在 Golang 中如何快速判断字符串是否在一个数组中
在使用 Python 的时候,如果要判断一个字符串是否在另一个包含字符串的列表中,可以使用in 关键词,例如: name_list= ['pm', 'kingname', '青南'] if 'king ...
- python以下字符串合法的是_以下字符串合法的是().
[单选题]关于科学和人文的关系,说法不正确的一项是( ) [单选题]下列语句中,___________是不正确的Python语句. [多选题]以下属于人机交互方式的是(). [单选题]下面选项中,__ ...
- python字符串驼峰转换_将字符串转换为驼峰格式
输入例子: cssStyle2DomStyle('font-size') 输出例子: fontSize 题目解析 1.将输入字符串分割成字符数组 sName.split('') 2.首先判断字符数组的 ...
- mysql查询包含字符串的记录_MySQL查询字符串中包含字符的记录
REGEXP 例1.查询字段中包含非英文的数据 代码如下 复制代码 SELECT * FROM `m_user` WHERE `emp_no` REGEXP '[^ -~]' =1 列2.这样能把所有 ...
- python判断题题库_《Python程序设计》判断题1-240题
1.Python是一种跨平台.开源.免费的高级动态编程语言.(对) 2.Python 3.x完全兼容Python 2.x.(错) 3.Python 3.x和Python 2.x唯一的区别就是:prin ...
- mysql like 字符串拼接_mysql like查询字符串的实例分享
MySQL提供标准的SQL模式匹配,以及基于象Unix实用程序如vi.grep和sed的扩展正则表达式模式匹配的格式. 一.SQL模式 SQL的模式匹配允许使用"_"匹配任何单个字 ...
- java 字符串拆分技巧_在java中如何拆分一个字符串?
"004-034556"为例用String#split()方法即可: String string = "004-034556"; String[] parts ...
最新文章
- 数据库访问类(使用存储过程的)
- mysqlimport
- 使用CUrl断点续传下载Linux内核5.6.2源码
- Jupyter Notebook 快速入门(上)
- c语言图形界代码,求个用最简单的的代码来实现图形界面…
- OS / Linux / Select 调用流程
- python中argsort,sort 和 sorted,operator.itemgetter函数
- 【Java】StringBuilder类、包装类
- python工具用什么语言_Python中一些自然语言工具的使用的入门教程
- javaweb增删改查实例_JavaWeb图像可视化管理系统之后台搭建(二)用户管理与增删改查(内含代码)...
- python登陆qq邮箱_python+selenium自动化测试——QQ邮箱自动登录写信
- python function terminated un_python僵尸进程产生的原因
- 牛客多校第九场 Niuniu is practicing typing.(kmp优化)
- Mybatis Plus分页Page total始终为0
- postman tests获取cookie
- python列表(list)的遍历
- 离散数学-ch1-Introduction
- 百度指数专业版相关指标含义
- 【Google】谷歌浏览器升级后无法修改cookies信息
- linux使用光盘恢复系统,方正电脑操作系统恢复光盘linux桌面5怎么用 具体点