在爬取数据是时候很多搜索的词语中在浏览器上显示的是中文,但是我们复制url到本地,中文就会出现我们看不懂的文字。
如果我们需要爬虫的时候也是一样,我们需要给浏览器传过去的也是对url中的中文进行转码之后的url地址,否则在url中的关键字直接出现中文会有问题。在python3的环境中的urllib库中 quote模块 提供了这一功能

一、URL转码

#!/usr/bin/env python
#-*- coding:utf-8 -*-from urllib.parse import quotename = '诗人李白'
url_encode_name = quote(name)
print(url_encode_name)输出:
%E8%AF%97%E4%BA%BA%E6%9D%8E%E7%99%BD

二、URL解码

#!/usr/bin/env python
#-*- coding:utf-8 -*-from urllib.parse import unquotename = '%E8%AF%97%E4%BA%BA%E6%9D%8E%E7%99%BD'
url_decode_name = unquote(name)
print(url_decode_name)输出:
诗人李白

三、使用urlencode对url转码

#!/usr/bin/env python
#-*- coding:utf-8 -*-from urllib.parse import urlencodestart_url='http://tieba.baidu.com/f?'
urldata = {'kw':'诗人李白','ie':'utf-8','pn':'100',
}print(start_url+urlencode(urldata))输出:
http://tieba.baidu.com/f?kw=%E8%AF%97%E4%BA%BA%E6%9D%8E%E7%99%BD&ie=utf-8&pn=100

URL中中文转码和解码相关推荐

  1. decode函数吗 jsp_JSP中js传递和解析URL参数以及中文转码和解码问题

    1.传递参数: var pmt = 'sensor='+ encodeURI(encodeURI(sensor))+'&device='+encodeURI(encodeURI(device) ...

  2. 使用URLEncoder、URLDecoder进行URL参数的转码与解码

    url后参数的转码与解码 import java.net.URLDecoder; import java.net.URLEncoder; String strTest = "?=abc?中% ...

  3. 利用华为短信包开发短信功能中中文转码和msgId获取经验

    1.华为短信包smproxy(20040730).jar开发短信,上行短信中文转码 中文转码非我们预期的UTF-8.GBK.GB2312,而是UTF-16BE if(8==msg_fmt){      ...

  4. 中文转码 java_URL 中中文转码

    js对文字进行编码涉及3个函数:escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decodeURIComponent 1 ...

  5. js处理url中的请求参数(编码/解码)

    在处理 a 链接跳转其他页面时,总会遇到需要传递一些当前页面的信息到其他页面,然后其他页面利用这些信息进行相关操作.利用 get 请求或 hash 传递是常见的方式. 首先,需要对传递的参数进行编码, ...

  6. java对url参数编码_对URL中的参数编码和解码

    有时,我们希望点击页面中的链接跳转其他页面,并且以get的方式传递一些参数.如果不对这些参数编码,可能会造成一些问题: 1.  参数中的空格可能会让你无法打开页面 2.  参数中的&符号会影响 ...

  7. 在URL中传递中文的解决方式

    在URL中传递中文的解决方式 2015年05月13日 17:13:55 thinkinglink 阅读数:10321 标签: URL编码中文编码乱码解决 更多 个人分类: web前端 在URL中传递中 ...

  8. URLEncoder和URLDecoder实现转码和解码

    在Java开发中,URL跳转经常遇到中文乱码问题.实际上,如果细心的话,我们会发现在访问网页时经常会在URL中看到一些16进制格式的字符串,如:http://xxx.com/s?w=%e7%bc 这其 ...

  9. url中传递中文参数时的转码与解码

    URL传递中文参数时的几种处理方式,总结如下: 1.将字符串转码:newString("xxxxx".getBytes("iso-8859-1")," ...

  10. js获取url中的参数,url中传递中文的时候通过js解码的方式

    如果传递的参数是: <a href="${pageContext.request.contextPath}/productdisplay/productDisplay_productD ...

最新文章

  1. 用云函数快速实现图片爬虫
  2. 【408预推免复习】计算机网络(谢希仁第七版)第二章——物理层
  3. linux kernel中的wait_for_completion和complete总结
  4. Java 1.8 HashMap源码探究
  5. 利用Excel VBA批量计算长时间序列植被物候动态阈值(逐像元)
  6. Unity MegaFiers 顶点动画
  7. RFID--Radio frequency Identification
  8. 系统学习深度学习(二十八)--DSD
  9. iOS 之项目中遇到的问题总结
  10. 在线常用正则表达式可视化生成与测试工具与示例 Regular Expression
  11. 用Excel和Python编程完成线性规划问题的求解
  12. phpexcel 导出phpqrcode生成的二维码和多sheet
  13. Nature杂志总编辑:如何培养一个有价值的研究者
  14. 【服务器】Facebook如何处理海量图片存储
  15. 【latex】.tex文件去tracked changes
  16. php 万网域名查询接口
  17. python中怎么把每一个字符用、隔开_python 实现将list转成字符串,中间用空格隔开...
  18. 切换svn地址报错issuer is not trusted
  19. 用Qemu搭建x86学习环境
  20. 学Linux选择什么系统比较好?

热门文章

  1. java 右对齐_字符串对齐器(左对齐、居中、右对齐)
  2. 水电缴费系统php源码_水电缴费管理系统
  3. 2019年大前端技术趋势深度解读
  4. 微信小程序报错 40125 已解决
  5. 利用python读取SEGY格式数据,主要用于对其快速解析及统计分析。
  6. matlab里面的取整函数
  7. Python常用取整函数
  8. 小米5手机刷成开发版获取root权限
  9. vue视频播放——vue-video-player
  10. 外贸企业管理系统解决方案丨汇信