Python的url编码问题(ansi,utf8,gbk)。

urllib包提供了对url的编码和解码,示例如下:

>>> import urllib

>>> data = '杭州'

>>> print data

杭州

>>> data

'\xe6\x9d\xad\xe5\xb7\x9e'

>>> urllib.quote(data)

'%E6%9D%AD%E5%B7%9E'

>>> urllib.unquote('%E6%9D%AD%E5%B7%9E')

'\xe6\x9d\xad\xe5\xb7\x9e'

>>> print urllib.unquote('%E6%9D%AD%E5%B7%9E')

“丽江”单词,细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk(部分叫ANSI,导致C/C++程序员之家走了很多弯路,不过现在百度已经支持UTF8了),其他的一般网站比如google就是utf8的,示例如下:

>>> import sys,urllib

>>> s = '杭州'

>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))

%BA%BC%D6%DD

>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))

'%E6%9D%AD%E5%B7%9E'

参考资料:互联网等

python解码gbk_Python的url编码问题(ansi,utf8,gbk) | C/C++程序员之家相关推荐

  1. python没有库怎么办_python缺少依赖(ImportError)库怎么办 | C/C++程序员之家

    python缺少依赖(ImportError)库怎么办?python缺少依赖(ImportError)库?ImportError: No module named setuptools,ImportE ...

  2. python 解码gbk_Python3的url编码和解码,自定义gbk、utf-8的例子

    今天小编就为大家分享一篇python3的url编码和解码,自定义gbk.utf-8的例子,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧 因为很多时候要涉及到url的编码和解码工作,所 ...

  3. [Python学习]PycURL简单学习 - limodou的学习记录 - limodou是一个程序员,他关心的焦点是Python, DocBook, Open Source …...

    [Python学习]PycURL简单学习 - limodou的学习记录 - limodou是一个程序员,他关心的焦点是Python, DocBook, Open Source - [Python学习] ...

  4. python上传文件到onedrive_python-onedrive使用教程【linux备份至onedrive】 | C/C++程序员之家...

    python-onedrive使用教程,linux备份至onedrive,linux和onedrive.python-onedrive使用了oauth2.0验证协议,所以比较复杂,获取到code(to ...

  5. 编码之道(六):程序员的修练之道

    程序员对具体的技术的掌握的确很重要,因为程序员就是使用这些技术来编码代码的.但真正决定一个程序员的能力及未来的可朔性的,只能是编码之道. 那究竟做为一个程序员,我们要如何追求编码之道呢? 本周,继续聊 ...

  6. python3编码和解码_python3的url编码和解码,自定义gbk、utf-8的例子

    因为很多时候要涉及到url的编码和解码工作,所以自己制作了一个类,废话不多说 码上见! # coding:utf-8 import urllib.parse class Urlchuli(): &qu ...

  7. URL编码和解码 C++类URL编码和解码使用技巧

    想了解C++类URL编码和解码使用技巧的相关内容吗,在本文为您仔细讲解URL编码和解码的相关知识和一些Code实例,欢迎阅读和指正,我们先划重点:URL编码,解码,下面大家一起来学习吧. 在项目开发过 ...

  8. 最想学 Go、Python,全栈开发者紧缺!分析了 11 万条程序员数据后有了这些发现...

    整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 科技江湖众生态,技术各有千秋,但有一个定律似乎一直存在,即随着时代的推移,强大的技术未必长久不亡,长久的技术未必强大不衰.那么,就当下而言 ...

  9. 关于数据库中文乱码问题解决步骤,编码问题:UTF-8,GBK,ISO-8859-1

    存入数据库的中文可能往往会出现乱码问题,大都是由于编码问题. 乱码两种情况:字符乱码,中文显示为问号. 出现这两种情况的原因: 1.字符乱码,服务端UTF-8,项目为GBK,但是字符是ISO-8859 ...

最新文章

  1. 并行计算及GPU简介
  2. 基于SpringMVC进行REST服务开发
  3. IE9 Platform Preview 3昨天发布
  4. 光彩集团小宇智能机器人_“智能急救教学机器人”走进文惠小学集团总部文韬校区...
  5. VS2017不能打开stdio.h等文件
  6. 虚拟化系列-Citrix XenServer 6.1 网络管理
  7. python 正则表达式匹配数字或者小数点_Python 正则表达式 匹配小数
  8. 【自动控制原理】 时域分析法
  9. Excel——公式与函数基础
  10. 趣味Python — 不到20行代码制作一个 “手绘风” 视频
  11. 金仓数据库KingbaseES服务启动失败原因
  12. jpeg图片格式详解
  13. 有道云笔记迁移至语雀终极解决方案
  14. .jpeg 格式图片URL在浏览器里默认是下载
  15. Orthogonal greedy algorithm降维
  16. 教程:这两个小妙招手把手教会你白底图片怎么抠图
  17. 电压放大器的作用原理是什么
  18. 签字后被开除_开除 4 名午睡员工,海尔就能追上美的格力了?
  19. 基于FPGA的数字秒表设计(含程序)
  20. 软件设计中的“三视图”

热门文章

  1. Maven项目 springsecurity配置
  2. 仿牛客项目(持续更新)
  3. String字符串转化为int类型
  4. 降维的基本知识点总结
  5. Android Studio挂载第三方模拟器
  6. 三层架构与四大天王之——改
  7. TCP三次握手和四次挥手最通俗解释说明
  8. 开发通用资料——英文缩写
  9. 用Javascript删除HTML元素
  10. 数字电路基础知识——格雷码和二进制码的转换的算法和Verilog实现