Unicode 是全球文字统一编码。它把世界上的各种文字的每一个字符指定唯一编码,实现跨语种、跨平台的应用。

中文用户最常接触的是汉字 Unicode 编码。中文字符数量巨大,日常使用的汉字数量有数千个,再加上生僻字,数量达到数万个。下面这个表格将中文字符集的 Unicode 编码范围列出:

字符集

字数

Unicode编码范围基本汉字

20902

4E00-9FA5

基本汉字补充

74

9FA6-9FEF

扩展A

6582

3400-4DB5

扩展B

42711

20000-2A6D6

扩展C

4149

2A700-2B734

扩展D

222

2B740-2B81D

扩展E

5762

2B820-2CEA1

扩展F

7473

2CEB0-2EBE0

扩展G

4939

30000-3134A

康熙部首

214

2F00-2FD5

部首扩展

115

2E80-2EF3

兼容汉字

477

F900-FAD9

兼容扩展

542

2F800-2FA1D

PUA(GBK)部件

81

E815-E86F

部件扩展

452

E400-E5E8

PUA增补

207

E600-E6CF

汉字笔画

36

31C0-31E3

汉字结构

12

2FF0-2FFB

汉语注音

43

3105-312F

注音扩展

22

31A0-31BA

1

3007

根据上述字符范围,可以编写以下函数,识别给定字符串是否含义中文字符。

# coding=utf-8

import re

def containChinese(content):

""" 判断内容是否含有中文字符

Arguments:

content {string} -- 要检测的内容

Returns:

[bool] -- 是否包含中文

"""

zh_pattern = re.compile(

u'([\u4E00-\u9FA5]|[\u9FA6-\u9FEF]|[\u3400-\u4DB5]|[\U00020000-\U0002A6D6]|[\U0002A700-\U0002B734]|[\U0002B740-\U0002B81D]|[\U0002B820-\U0002CEA1]|[\U0002CEB0-\U0002EBE0]|[\U00030000-\U0003134A]|[\u2F00-\u2FD5]|[\u2E80-\u2EF3]|[\uF900-\uFAD9]|[\U0002F800-\U0002FA1D]|[\uE815-\uE86F]|[\uE400-\uE5E8]|[\uE600-\uE6CF]|[\u31C0-\u31E3]|[\u2FF0-\u2FFB]|[\u3105-\u312F]|[\u31A0-\u31BA]|[\u3007])+'

)

match = zh_pattern.search(content)

return match is not None

a = '中文abcs短语'

print(containChinese(a)) # True

b = 'abcd'

print(containChinese(b)) # False

python判断字符串包含中文_查询字符串中是否包含中文字符(Python实现)相关推荐

  1. PHP中文无法查询,php 中htmlentities导致中文无法查询问题

    在php中htmlspecialchars, 将特殊字元转成 HTML 格式,而htmlentities,将所有的字元都转成 HTML 字串 了,下面我来分别简单的介绍. htmlentities用法 ...

  2. python 加载动图_在浏览器中使用TensorFlow.js和Python构建机器学习模型(附代码)...

    大数据文摘授权转载自数据派THU 作者:MOHD SANAD ZAKI RIZVI 本文主要介绍了: TensorFlow.js (deeplearn.js)使我们能够在浏览器中构建机器学习和深度学习 ...

  3. python判断矩阵是否对称_矩阵的特征分解(推导+手算+python计算+对称矩阵的特征分解性质)...

     1. 前言 最近几天一直在学习矩阵的知识,恶补了特征分解和SVD算法,发现网上很多资料都是不全的,所以想记录一下这里面的特征分解推导过程. 2.矩阵的进阶知识 2.1 特征分解(谱分解)=> ...

  4. golang 包含 数组_在 Golang 中如何快速判断字符串是否在一个数组中

    在使用 Python 的时候,如果要判断一个字符串是否在另一个包含字符串的列表中,可以使用in 关键词,例如: name_list= ['pm', 'kingname', '青南'] if 'king ...

  5. python以下字符串合法的是_以下字符串合法的是().

    [单选题]关于科学和人文的关系,说法不正确的一项是( ) [单选题]下列语句中,___________是不正确的Python语句. [多选题]以下属于人机交互方式的是(). [单选题]下面选项中,__ ...

  6. python字符串驼峰转换_将字符串转换为驼峰格式

    输入例子: cssStyle2DomStyle('font-size') 输出例子: fontSize 题目解析 1.将输入字符串分割成字符数组 sName.split('') 2.首先判断字符数组的 ...

  7. mysql查询包含字符串的记录_MySQL查询字符串中包含字符的记录

    REGEXP 例1.查询字段中包含非英文的数据 代码如下 复制代码 SELECT * FROM `m_user` WHERE `emp_no` REGEXP '[^ -~]' =1 列2.这样能把所有 ...

  8. python判断题题库_《Python程序设计》判断题1-240题

    1.Python是一种跨平台.开源.免费的高级动态编程语言.(对) 2.Python 3.x完全兼容Python 2.x.(错) 3.Python 3.x和Python 2.x唯一的区别就是:prin ...

  9. mysql like 字符串拼接_mysql like查询字符串的实例分享

    MySQL提供标准的SQL模式匹配,以及基于象Unix实用程序如vi.grep和sed的扩展正则表达式模式匹配的格式. 一.SQL模式 SQL的模式匹配允许使用"_"匹配任何单个字 ...

  10. java 字符串拆分技巧_在java中如何拆分一个字符串?

    "004-034556"为例用String#split()方法即可: String string = "004-034556"; String[] parts ...

最新文章

  1. 数据库访问类(使用存储过程的)
  2. mysqlimport
  3. 使用CUrl断点续传下载Linux内核5.6.2源码
  4. Jupyter Notebook 快速入门(上)
  5. c语言图形界代码,求个用最简单的的代码来实现图形界面…
  6. OS / Linux / Select 调用流程
  7. python中argsort,sort 和 sorted,operator.itemgetter函数
  8. 【Java】StringBuilder类、包装类
  9. python工具用什么语言_Python中一些自然语言工具的使用的入门教程
  10. javaweb增删改查实例_JavaWeb图像可视化管理系统之后台搭建(二)用户管理与增删改查(内含代码)...
  11. python登陆qq邮箱_python+selenium自动化测试——QQ邮箱自动登录写信
  12. python function terminated un_python僵尸进程产生的原因
  13. 牛客多校第九场 Niuniu is practicing typing.(kmp优化)
  14. Mybatis Plus分页Page total始终为0
  15. postman tests获取cookie
  16. python列表(list)的遍历
  17. 离散数学-ch1-Introduction
  18. 百度指数专业版相关指标含义
  19. 【Google】谷歌浏览器升级后无法修改cookies信息
  20. linux使用光盘恢复系统,方正电脑操作系统恢复光盘linux桌面5怎么用 具体点

热门文章

  1. vscode-JS代码段(JavaScript Snippet Pack)
  2. 免费复制百度文库的方法
  3. 小米游戏本bios更新_小米笔记本电脑bios升级方法图文步骤
  4. JAVA项目-学生成绩管理系统
  5. PMP考试难度以及通过率
  6. STM32 BOOT模式设置
  7. Hadoop 权威指南 第四版 中文目录
  8. php 单位食堂订餐,职工食堂微信订餐系统 单位饭卡消费系统
  9. MySQL可视化工具使用
  10. 超市称秤小票用计算机怎么算,电脑收银系统如何连接电子条码秤