问题一

字串前面少了u。

当遇见以下情况。

返回字符串为'\u82f9\u679c'的unicode时候。

str1 = '\u82f9\u679c' # 这里没有u,当传入参数不是unicode的时候

print str1 # 结果是 : \u82f9\u679c

print u'\u82f9\u679c' # 结果是 : 苹果

解决方法:加上u

str1 = '\u82f9\u679c'

uni_result = str1.decode("unicode-escape")

print uni_result

# 结果是 : 苹果

问题二

字串前面多了u。

aa.text的结果如下

In[190]: aa.text

Out[190]: u'\xe4\xb8\x8a\xe6\xb5\xb7A\xe8\x82\xa1'

In[191]: print aa.text

Out[191]: �海A�

In[192]: print '\xe4\xb8\x8a\xe6\xb5\xb7A\xe8\x82\xa1'

Out[192]: 上海A股

使用utf-8编码时候,出问题。打印结果不对

In[191]: aa.text.encode('utf-8')

Out[191]: '\xc3\xa4\xc2\xb8\xc2\x8a\xc3\xa6\xc2\xb5\xc2\xb7A\xc3\xa8\xc2\x82\xc2\xa1'

In[192]: print aa.text.encode('utf-8')

�海A�

解决方案:去掉u

In[193]: aa.text.encode('raw_unicode_escape')

Out[193]: '\xe4\xb8\x8a\xe6\xb5\xb7A\xe8\x82\xa1'

In[194]: print aa.text.encode('raw_unicode_escape')

上海A股

或者使用

bb = eval(repr(aa.text).lstrip('u'))

print bb

上海A股

问题三

gbk的decode问题

gbk的编码有时候在是%C2%FA99%BC%F55这种格式,需要将之转化为python里面的\xc2\xfa99\xbc\xf55这种格式。

gbk的编码如下,(中文:满99减5):

tmp_a = r'%C2%FA99%BC%F55'

tmp_a = '%C2%FA99%BC%F55'

而在python中,编码应该如下:

\xc2\xfa99\xbc\xf55

可以看出差异为,需要将%替换为\x。使用如下函数:

def transGbk2Unicode(str_v):

str_s = str_v.replace(r'%', r'\x')

res = eval(repr(str_s).replace('\\\\', '\\'))

return res.decode('gb2312')

tmp_a = r'%C2%FA99%BC%F55'

tmp_a = '%C2%FA99%BC%F55'

m = transGbk2Unicode(tmp_a)

print m

python 字符串unicode编码_python的string与Unicode转换,gbk字符串编码相关推荐

  1. python字典编码_Python列表,字典,元组,字符串操作,文件操作,字符编码

    1. 列表操作 1.1 列表的定义: names = ["wangjing", "wangjun", "hashiqi"] names[0] ...

  2. python列表字典操作_Python 列表(list)、字典(dict)、字符串(string)常用基本操作小结...

    创建列表 sample_list = ['a',1,('a','b')] Python 列表操作 sample_list = ['a','b',0,1,3] 得到列表中的某一个值 value_star ...

  3. python文件操作解码_python基础3之文件操作、字符编码解码、函数介绍

    内容概要: 一.文件操作 二.字符编码解码 三.函数介绍 一.文件操作 文件操作流程: 打开文件,得到文件句柄并赋值给一个变量 通过句柄对文件进行操作 关闭文件 基本操作: 1 #/usr/bin/e ...

  4. python isalpha函数用法_python中string模块各属性以及函数的用法

    任何语言都离不开字符,那就会涉及对字符的操作,尤其是脚本语言更是频繁,不管是生产环境还是面试考验都要面对字符串的操作. python的字符串操作通过2部分的方法函数基本上就可以解决所有的字符串操作需求 ...

  5. python实验二序列_python 学习笔记 二 序列, 列表, 元组, 字符串

    序列 序类是一个集合概念, Pthon包括六种内建序列: 列表, 元组, 字符串, Unicode字符串, buffer对象和xrange对象. 其中, 我们最长用的要数前三个. 通用序列操作 1. ...

  6. python中用于标识字符串的定界符_python学习[第六篇] 数据类型之 字符串一

    数据类型之 字符串一 字符串操作 创建及赋值 x = 'abcde'x= "abcde"x= '''abcde'''x= """abcde" ...

  7. python二进制转换为转义字符_Python字符与进制转换

    Python字符与进制转换 0b / 0B --> 二进制字符前缀 0o / 0O --> 八进制字符前缀 0x / 0X --> 十六进制字符前缀 ascii(object) 就 ...

  8. python replace函数用法_Python实现的从右到左字符串替换方法示例

    本文实例讲述了Python实现的从右到左字符串替换方法.分享给大家供大家参考,具体如下: 一 . 前言 需要用到,但是发现python没有从右边开始替换的内置方法,默认的replace只是从左边开始, ...

  9. python常用字符串处理函数_Python第10课:常用的字符串处理函数

    Python第10课:常用的字符串处理函数 时间 2019-01-17上午10:00 主讲 刘培富 地点 四楼电教室 1.字符的ascii码及其逆运算 ord("x") 求asci ...

最新文章

  1. centos ip配置_vitrualbox虚拟机下centos系统设置固定IP
  2. mysql 服务器 kill进程_mysql查询结束进程kill
  3. 【linux】用户空间(0-3G):进程私有,内核空间(3G-4G):所有进程共享
  4. mysql死锁释放时间参数_【Mysql】mysql 事务未提交导致死锁 Lock wait timeout exceeded; try restarting transaction 解决办法...
  5. php.ini配置详解 号,php INI配置文件的解析实现分析
  6. html5中figure怎么用,figure 和 figcaption 元素的正确使用方式
  7. Python之collections模块详细实例
  8. JqueryUI 引领Java开发新方式:专注UI,快速开发!(JqueryUI+jeecg结合, 升华的开发模式)
  9. 同花顺 python量化交易_开启量化第一步!同花顺iFinD数据接口免费版简易操作教程...
  10. 记一次hsql解析大json的全过程
  11. 关掉magiskhide_[讨论] Magisk隐藏root的实现
  12. html5 svg 遮罩,HTML5 SVG和CSS3超酷文字遮罩动画特效
  13. 关于平面战机射击游戏的一点小结
  14. verilog将100mhz分频为1hz_verilog—分频器设计
  15. 积分电路中并联RC的原因竟然是这个!
  16. 冯·诺依曼体系结构是什么
  17. stable_sort的用法与排序算法
  18. python实现外部静态服务器,浏览器通过HTTP与之通信2
  19. 更深、更轻量级的Transformer!Facebook提出:DeLighT
  20. 普林斯顿Stata教程(三)-Stata编程

热门文章

  1. css宽高自适应布局,实现Sticky Footer的三种布局方式
  2. Maven:repositories、distributionManagement、pluginRepositories中repository的区别
  3. 什么是 NIO? NIO 和 BIO、AIO 之间的区别是什么?NIO主要用来解决什么问题?
  4. linux电脑合盖后卡住了,解决ubuntu合盖后无法唤醒
  5. jenkins重启 linux_在Linux中,Jenkins无法启动
  6. c++数据结构队列栈尸体_数据结构-第三章:栈和队列(栈的应用、括号匹配、表达式转换)...
  7. 三相四线怎样查漏电_老电工支招!漏电保护器的接线方法
  8. 批量删除HTML链接软件,3种方法教你一次性删除word文档中的所有超链接
  9. python脚本自动消除安卓版_python脚本中appium的自启动自关闭
  10. 西南科技大学 计算机组成原理2011-2012,2011-2012学年第2学期课程教案-计算机组成原理-陈立伟.doc...