python2.7中文有限制么_python2.7
我从外部API中获得了一个字符串:
"\u4ece\u8d77\u70b9\u5411\u6b63\u5357\u65b9\u5411\u51fa\u53d1,\u884c\u9a76170\u7c73,\u76f4\u884c\u8fdb\u5165\u4e2d\u5173\u6751\u4e1c\u8def"
被传给了变量a,以utf8字节串,所以:
a
'\\u4ece\\u8d77\\u70b9\\u5411\\u6b63\\u5357\\u65b9\\u5411\\u51fa\\u53d1,\\u884c\\u9a76170\\u7c73,\\u76f4\\u884c\\u8fdb\\u5165\\u4e2d\\u5173\\u6751\\u4e1c\\u8def'
print a
\u4ece\u8d77\u70b9\u5411\u6b63\u5357\u65b9\u5411\u51fa\u53d1,\u884c\u9a76170\u7c73,\u76f4\u884c\u8fdb\u5165\u4e2d\u5173\u6751\u4e1c\u8def
这就是已经成了这样的现实状态。
我要把a变成unicode字符要怎么做?
# 把a变成:
u'\u4ece\u8d77\u70b9\u5411\u6b63\u5357\u65b9\u5411\u51fa\u53d1,\u884c\u9a76170\u7c73,\u76f4\u884c\u8fdb\u5165\u4e2d\u5173\u6751\u4e1c\u8def'
无视
a
里的那些转义
\
么?那
u'' + a
就好了……
import re
str='\\u4ece\\u8d77\\u70b9\\u5411\\u6b63\\u5357\\u65b9\\u5411\\u51fa\\u53d1\\u884c\\u9a76170\\u7c73,\\u76f4\\u884c\\u8fdb\\u5165\\u4e2d\\u5173\\u6751\\u4e1c\\u8def'
pat=re.compile('\\\\u((\d|[a-f]){4})')
def change_str(u_str):
return unichr(int(u_str.group(1),16))
tmp=pat.sub(change_str,str)
print(tmp)
弄了老半天只有这样了。。。不知道有没更好的。。
楼下的str.decode(‘unicode-escape’)直接可以
str='\\u4ece\\u8d77\\u70b9\\u5411\\u6b63\\u5357\\u65b9\\u5411\\u51fa\\u53d1\\u884c\\u9a76170\\u7c73,\\u76f4\\u884c\\u8fdb\\u5165\\u4e2d\\u5173\\u6751\\u4e1c\\u8def'
print(str.decode('unicode-escape'))
出现这个问题的主要原因是python吧Unicode编码当成了普
通的字符串,因此把原来的斜杠又加了一个斜杠进行转义
个人认为比较简单的解决方法是用 decode(‘unicode-escape’)
str = “\u4ece\u8d77\u70b9\u5411\u6b63\u5357\u65b9\u5411\u51fa\u53d1”
uni_str = str.decode(‘unicode-escape’)
print uni_str
简单粗暴
python2.7中文有限制么_python2.7相关推荐
- python2.7中文字符串_python2.7 怎样将中文字符串转为字节流?
2018-04-19 回答 唔,你也没写具体问题-- 给你个python的字符串处理汇总吧. str='python string function' 生成字符串变量str='python strin ...
- python2和python3的默认编码_python2和python3哪个版本新
Python2 还是 Python3 ? py2.7是2.x系列的最后一个版本,已经停止开发,不再增加新功能.2020年终止支持. 所有的最新的标准库的更新改进,只会在3.x的版本里出现. Pytho ...
- python2输出中文乱码各种办法都不行_Python中文全攻略 中文乱码 输出中文乱码
插入数据库时,总是空,我做了如何操作,就好了.数据是采集过来的,程序是gbk编码 person_sql="insert into analyst(education_id,alys_name ...
- python2和3的编码区别_Python2和3字符编码的区别
1. 字符编码应用程序的三个阶段Python的Python程序执行Python(我再次强调,执行的第一步必须先从硬盘读取文件内容到内存中)文件内容保存在gbk格式,内容为:第一阶段:启动Python解 ...
- python2.7 end=号报错_python2 post 上传压缩文件编码报错
python版本是2.7,使用urllib2将文件推送至微信,在上传文件时,碰到这样一个问题:上传未经压缩的文本文件,可以成功:上传经过压缩的二进制文件,则提示编码错误 代码如下 def upload ...
- python2和python3的默认编码_Python2和Python3中的字符串编码问题解决
原博文 2018-01-02 11:38 − Python2和Python3在字符串编码上是有明显的区别. 在Python2中,字符串无法完全地支持国际字符集和Unicode编码.为了解决这种限制,P ...
- python2.7安装包百度云_python2.7下载地址,最好是云(python安装教程 百度云)
python2.7下载地址,最好是云 python2.7下载地址 http://pan.baidu.com/s/1i5IKX0L Python从入门通,可以先自学 python基础视程:http:// ...
- python2 print 中文_python怎么print汉字
今天就为大家分享一篇python中使用print输出中文的方法,具有很好的参考价值,希望对大家有所帮助. 看Python简明教程,学习使用print打印字符串,试了下打印中文,不行.(推荐学习:Pyt ...
- python2和3哪个更常用_python2和3哪个更常用
语言是在20世纪90年代诞生的,算算到现在已经是25岁的大叔级的语言了(跟它同一个时代的还有一个鼎鼎大名的java是在1995发行的, 红了几十年).但是Python真正成名比java晚了很多年,其实 ...
最新文章
- 牛客题霸 [链表中环的入口节点] C++题解/答案
- PHP中关于取模运算及符号
- [JS调用]automation服务器不能创建对象
- 中文字体的英文名称 (simhei, simsun) 宋体 微软雅黑
- 三级数据库技术思维导图
- 解决Win键不能用的问题
- 近期互联网公司大量裁员,这给计算机er带来哪些启示?
- python中关于时间和日期函数的常用计算总结
- oracle failover mode,Oracle RAC FailOver配置
- Python每日一练——第10天:经典问题猴子吃桃
- 大数据分析 | 用 Python 做文本词频分析
- Java kafka监控 topic的数据量count情况,每个topic的Summed Recent Offsets(总结最近的偏移量)
- java使用Ip连接Oracle失败
- 机器视觉光源选型总结---颜色选择
- linux定时执行sh文件
- uni-app getLocation:fail 此key每日调用量已达到上限
- 速(尚)学堂第十章IO技术章末作业自写答案
- 浅谈电力通信电磁兼容问题
- 建设可持续社区离不开物业,你们小区的物业怎么样?
- linux调试内核jlink,Jlink + Vmware虚拟机调试uboot
热门文章
- 40岁“老程序员”的“辛酸”自述:
- 基于VHDL报警系统设计
- mysql数据版本控制_如何对MySQL数据模型进行版本控制和同步?
- python验证码识别接口 服务器_python验证码识别模块
- sap 发送mesage_SAP的message机制
- mfc 算方差函数_什么影响了你的工资?方差分析告诉你
- 矩阵的二范数_Python Numpy中的范数
- LINUX 对引导加密
- 数学之路(3)-机器学习(3)-机器学习算法-SVM[9]
- 哈哈,终于想着注册博客了