之前一直想找到一个模块,针对字符判断是什么字符集编码的库

网上有chardet的blog,发现自己的环境有这个库,于是就做了测试

>>> import chardet
>>> a = "也有".decode('gbk')
>>> a
u'\u6d94\u71b8\u6e41'
>>> a = "也有".decode('gbk').encode('gbk')
>>> a
'\xe4\xb9\x9f\xe6\x9c\x89'
>>> chardet.detect(a)
{'confidence': 0.7525, 'language': '', 'encoding': 'utf-8'}
>>> print(a)
也有>>> a = "也有".decode('gbk').encode('gbk')
>>> a = u"也有".encode('gbk')
>>> a
'\xd2\xb2\xd3\xd0'
>>> chardet.detect(a)
{'confidence': 0.7679697235616183, 'language': 'Russian', 'encoding': 'KOI8-R'}

In [5]: a = "asd算法".encode('utf-8').decode('gbk')

In [6]: import chardet

In [7]: chardet.detect(a)
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-7-45a625c5d441> in <module>()
----> 1 chardet.detect(a)

c:\python3.6.3\lib\site-packages\chardet\__init__.py in detect(byte_str)
32 if not isinstance(byte_str, bytes):
33 raise TypeError('Expected object of type bytes or bytearray, got: '
---> 34 '{0}'.format(type(byte_str)))
35 else:
36 byte_str = bytearray(byte_str)

TypeError: Expected object of type bytes or bytearray, got: <class 'str'>

In [8]: a
Out[8]: 'asd绠楁硶'

总结发现不是很准,放弃使用

转载于:https://www.cnblogs.com/renfanzi/p/10768306.html

python 字符编码判断 chardet评测相关推荐

  1. python查看字符串编码方式_Python字符编码判断方法分析

    本文实例讲述了Python字符编码判断方法.分享给大家供大家参考,具体如下: 方法一: isinstance(s, str) 用来判断是否为一般字符串 isinstance(s, unicode) 用 ...

  2. 转1:Python字符编码详解

    Python27字符编码详解 声明 一 字符编码基础 1 抽象字符清单ACR 2 已编码字符集CCS 3 字符编码格式CEF 31 ASCII初创 311 ASCII 312 EASCII 32 MB ...

  3. python 字符编码问题

    字符编码 一.字符编码的演进 ASCII GB2312    GBK1.0    GB18030 Unicode编码:国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言.跨平台 ...

  4. Python字符编码详解

    Python字符编码详解 转自http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html Python字符编码详解 本文简单介绍了各种常用的 ...

  5. python字符编码在哪里_快速入手Python字符编码

    前言 对于很多接触python的人而言,字符的处理和语言整体的温顺可靠相比显得格外桀骜不驯难以驾驭. 文章针对Python 2.7,主要因为3对的编码已经有了很大的改善并且实际原理一样,更改一下操作命 ...

  6. python字符编码是什么_python3字符编码是什么?怎么用?

    最近一直讲的是python基础方面的知识,小编一直在考虑要不要加大难度.这个问题犹豫了很久,怕一些python小白不能很好的接受知识点.但是最近小编收到不少小伙伴的强烈要求,想要学习编码这个模块的知识 ...

  7. 深入理解Python字符编码--转

    http://blog.51cto.com/9478652/2057896 不论你是有着多年经验的 Python 老司机还是刚入门 Python 不久,你一定遇到过UnicodeEncodeError ...

  8. python 字符编码处理_浅析Python 字符编码与文件处理

    Python字符编码 目前计算机内存的字符编码都是Unicode,目前国内的windows操作系统采用的是gbk. python2默认的字符编码方式是ASCII python3默认的字符编码方式是Un ...

  9. 关于python字符编码以下选项中错误的是_关于Python文件打开模式的描述,以下选项中错误的是...

    [单选题]下列Python保留字中,不用于表示分支结构的是 [单选题]下列哪项不是python中文件的读取操作 [单选题]以下程序的输出结果是: s='' ls = [1,2,3,4] for l i ...

最新文章

  1. SAP独门神器之VC变式配置,硬核整理版重磅推出!
  2. android graphic:canvas
  3. serv-u 自定义html,Serv-U架设教程_Serv-U使用教程图文版
  4. ML 04、模型评估与模型选择
  5. vijos p1659——河蟹王国(线段树)(复习)
  6. Vagrant挂载目录失败mount: unknown filesystem type ‘vboxsf’
  7. sysfs API总结
  8. python LAADS+Selenium下载MODIS数据
  9. 6.OD-Run trace /Hit trace
  10. [内核编程] 内核环境及其特殊性,驱动编程基础篇
  11. LDAP第三天 MySQL+LDAP 安装
  12. jpg图片使用pil的resize后_如何使用PIL调整图像大小并保持其纵横比?
  13. 路漫漫其修远兮,吾要上下左右前后而求索
  14. Vue.js-----轻量高效的MVVM框架(五、计算属性)
  15. 「leetcode」973. 最接近原点的 K 个点【优先级队列】详解
  16. c语言读grd文件,基于GDAL库,读取.grd文件(以海洋地形数据为例)C++版
  17. 计算机应用专业毕业感言,大学毕业感言一句话
  18. SEO中的简单代码优化
  19. Pyhton之模拟石头剪子布游戏篇
  20. W ndows 10模拟器,手机windows10模拟器

热门文章

  1. Mysql:Mysql数据库系统表之详细了解INNODB_TRX、INNODB_LOCKs、INNODB_LOCK_waits、PROCESSLIST表
  2. 【译】How Microsoft Lost the API War
  3. Android 插件化原理解析——Hook机制之AMSPMS
  4. 钱包系统推荐维金_区块链持币生息系统开发app,钱包系统搭建
  5. python 常用内置函数_python常用内置函数使用|python基础教程|python入门|python教程...
  6. JZOJ 5938. 【NOIP2018模拟10.30】分离计划
  7. Bayesian Networks
  8. Codeforces 1305F Kuroni and the Punishment (随机化)
  9. AtCoder AGC036D Negative Cycle (图论、DP)
  10. POJ 1061 BZOJ 1477 Luogu P1516 青蛙的约会 (扩展欧几里得算法)