python统计汉字个数是_使用 Python 统计中文字符的数量
使用 Python 统计中文字符的数量
方法一,排除法
假设只有中英文字符:
import string
def str_count(str):
'''找出字符串中的中英文、空格、数字、标点符号个数'''
count_en = count_dg = count_sp = count_zh = count_pu = 0
for s in str:
# 英文
if s in string.ascii_letters:
count_en += 1
# 数字
elif s.isdigit():
count_dg += 1
# 空格
elif s.isspace():
count_sp += 1
# 中文,除了英文之外,剩下的字符认为就是中文
elif s.isalpha():
count_zh += 1
# 特殊字符
else:
count_pu += 1
print('英文字符:', count_en)
print('数字:', count_dg)
print('空格:', count_sp)
print('中文字符:', count_zh)
print('特殊字符:', count_pu)
s = '[email protected]!# 管道·符了3 54沙3发开fs\][dj'
str_count(s)
方法二,范围判断
Unicode 中,基本中文字符处在一个范围区间,可以参考 汉字 Unicode 编码范围。写成代码就是:
def hanz_count(str):
hanz_total = 0
for s in str:
# 中文字符其实还有很多,但几乎都用不到,这个范围已经足够了
if '\u4e00' <= s <= '\u9fef':
hanz_total += 1
return hanz_total
s = '[email protected]!# 管道·符了3 54沙3发开fs\][dj'
print(hanz_count(s))
参考资料:
原文:https://www.cnblogs.com/shuoliuchina/p/12431156.html
python统计汉字个数是_使用 Python 统计中文字符的数量相关推荐
- python输入汉字的代码_基于python的汉字转GBK码实现代码
如图,"广"的编码为%B9%E3,暂且把%B9称为节编码,%E3为字符编码(第二编码). 思路: 从GBK编码页面收集汉字 http://ff.163.com/newflyff/g ...
- python把汉字转换为二进制数_在Python中,如何将8位二进制数转换为ASCII字符?
我试图从图片的蓝色像素中提取隐藏的消息,以便如果蓝色值是偶数,则它表示二进制字符串中的0,并且如果蓝色值是奇数,则它表示二进制中的1串. 8位二进制字符串表示一个字符,并且这些字符一起成为隐藏的消息. ...
- python统计中文字符_使用 Python 统计中文字符的数量
使用 Python 统计中文字符的数量 方法一,排除法 假设只有中英文字符: import string def str_count(str): '''找出字符串中的中英文.空格.数字.标点符号个数' ...
- python解析html的库_用python解析html
python中,有三个库可以解析html文本,HTMLParser,sgmllib,htmllib.他们的实现方法不通,但功能差不多.这三个库中 提供解析html的类都是基类,本身并不做具体的工作.他 ...
- python统计汉字个数是_Python入门(一):一句话统计文章不重复汉字数
[x for x in set(open("c:\\test.txt").read()) if 19968<=ord(x)<=40869] 使用Python可以实现一句 ...
- python输入一个英文句子 输出单词个数_编写程序,给出一个英文句子,统计单词个数。_学小易找答案...
[简答题]叙述pass语句的作用. [简答题]吹风机不工作,可以用万用表检测吗?在网上搜索关键词,吹风机不工作怎么办? [单选题]以下代码运行结果正确的是哪一项?() x=2 if x:print(T ...
- python统计汉字个数是_python统计中文字符数量的两种方法
方法一: def str_count(str): '''找出字符串中的中英文.空格.数字.标点符号个数''' count_en = count_dg = count_sp = count_zh = c ...
- python判断哪个数最小_怎么用python比较三个数大小
大部分初学编程的人来说刚开始都会练习判断两个数或者三个数的大小,来熟悉某种语言的特性和最基本的if,else循环,当我们学习了更高级的语法知识后,又会有不同的实现方式,比如依次接收用户输入的3个数,排 ...
- python判断汉字个数_python判断列表里数量python中文乱码问题大总结
在运行这样类似的代码:#!/usr/bin/env python s="中文" print s 最近经常遇到这样的问题: 问题一:SyntaxError: Non-ASCII ch ...
最新文章
- spring security remember me实现自动登录
- 面试官问:为什么MySQL的索引不采用Kafka的索引机制
- 【CHARINDEX】先按STATIC_VALUE排序 在按R_RECORD_CREATE_DATE排序
- 国庆中秋活动——超强AR/3D地球仪!带你领略世界风光!我们未必能环游世界,但都该有个地球仪
- 汕头市队赛 SRM16 T2
- Gateway网关鉴权
- windows10:检测windows defender是不是已经连接到了云安全中心
- Python 视频教程下载 (全阶段)
- MS08-067漏洞渗透测试
- 安装运行太极框架Android搞机操作root
- 简明Jieba中文分词教程(分词、关键词提取、词性标注、计算位置)
- R语言单因素方差分析及两两比较
- 09静态资源虚拟主机
- OB数据库大赛初赛总结
- 基于梯度下降算法自建一种短期有效的自回归模型
- 京东接口对接流程(以下举例物流接口):
- 线程调度策略SCHED_RR(轮转法)和SCHED_FIFO(先进先出)之对比
- 阅读论文《The Perception-Distortion Tradeoff》
- linux mint 让安卓手机投屏到电脑
- 以“微”知著,用友ISV生态的力量与担当