我们在爬虫时,url链接中含有中文时,会自动被编码为特殊符号,因此我们需要对中文进行编码操作,同时也有可能涉及到对url编码后的中文进行解码操作。

中文转换为url格式

from urllib.request import quotex = '角色扮演'
print(quote('角色扮演'))

输出结果为:

%E8%A7%92%E8%89%B2%E6%89%AE%E6%BC%94

将编码后的中文构造成完整url,借助字符串的format方法:

url = 'https://www.taptap.com/ajax/search/tags?&kw={}&sort=hits&page=2'.format(quote(x))
print(url)

输出结果为

https://www.taptap.com/ajax/search/tags?&kw=%E8%A7%92%E8%89%B2%E6%89%AE%E6%BC%94&sort=hits&page=2

将url中编码后的中文进行解码

from urllib import parsey = '%E8%A7%92%E8%89%B2%E6%89%AE%E6%BC%94'
print(parse.unquote(y))

输出结果为:

角色扮演

Python3 中文与url格式编码的转换相关推荐

  1. 中文转url网址编码的两种方式

    from urllib.parse import urlencode keys = {'name':'cry','age':20,'皮':'搞得不丑'} param = urlencode(keys) ...

  2. 中文汉字到URL编码的转换

    在使用 Google或者 百度进行中文搜索的时候,我们会发现搜索过程中URL地址栏会变成一串格式字符串编码,我们编写程序经常也需要进行中文汉字到这类URL编码的转换,这里介绍两段相关的转换函数. 对于 ...

  3. php中文转码和中文url编码之间转换

    PHP中对于URL进行编码,可使用 urlencode() 或者 rawurlencode(),两种的区别是前者(urlencode)把空格编码为 '+',而后者(rawurlencode)把空格编码 ...

  4. data类型的Url格式及Base64编码:把小数据直接嵌入到Url中

    所谓"data"类型的Url格式,是在RFC2397中 提出的,目的对于一些"小"的数据,可以在网页中直接嵌入,而不是从外部文件载入.例如对于img这个Tag, ...

  5. python3中默认的字符编码和文件编码_python3 unicod,utf-8,gbk的编码和解码中文显示问题...

    目的: 清楚了解为什么在python3不同的编码,解码,windows,linux操作系统下,字符是否能够正确显示. 前提: 了解不同编码用不同的二级制编码和长度来表示字符. 在python3中,各种 ...

  6. python3对文件编码的转换处理

    前言: 公司同事邀我一起给SQLSERVER 2008导数, 数据来源有高斯和ORACLE, 数据文件保存格式有UTF-8和GBK. 当我在做测试导入的时候发现SQLSERVER 2008数据库的WI ...

  7. python网址编码转换_python字符串与url编码的转换实例

    python字符串与url编码的转换实例 更新时间:2018年05月10日 10:27:46 作者:Tangzongyu123 今天小编就为大家分享一篇python字符串与url编码的转换实例,具有很 ...

  8. php 文字 url编码,如何实现php中文转url编码

    如何实现php中文转url编码 发布时间:2020-08-07 10:10:03 来源:亿速云 阅读:65 作者:Leah 如何实现php中文转url编码?相信很多没有经验的人对此束手无策,为此本文总 ...

  9. python的chr可以转换中文吗,chr()在python中怎么实现编码的转换

    chr()在python中怎么实现编码的转换 发布时间:2020-12-14 09:36:42 来源:亿速云 阅读:95 作者:小新 这篇文章主要介绍chr()在python中怎么实现编码的转换,文中 ...

最新文章

  1. 《啊哈!算法》笔记_Day02
  2. 一键下载,双击上传,带你探索提升工作效率的秘密“武器”
  3. 遍历一个类中的每一个属性、方法、公共字段
  4. 并查集 - 除法求值
  5. Spider Scrapy 框架爬虫
  6. ubuntu开启SSH服务和允许root远程SSH登录
  7. LeetCode 刷题笔记 (树)
  8. shiro(1) 介绍
  9. 我的一个windows phone program
  10. 物联网大变局:LoRa 正式获批!
  11. Yann LeCun送你的春节大礼:免费学习全部2020春季深度学习课程
  12. EditPlus批量转码
  13. 【微信小程序+Python实现人脸识别】
  14. 新型城镇化3.0时代 数据交换是“智慧城市”的核心
  15. excel公式不自动计算_梯形丝杠设计计算公式及三针法测量Excel表
  16. Android Studio 解决数据库手机电脑不同步
  17. anisotropy texture filtering
  18. echarts散点图x轴和y轴在中间位置
  19. explain用法和结果的含义
  20. BYTE,WORD,DWORD

热门文章

  1. oa java开发_[原创]OA系统买JAVA开发的还是PHP开发?
  2. 一大波 ChatGPT 开源项目,诞生了!
  3. 零基础如何入门和学习软件测试?
  4. 一、遗忘在角落的小书包
  5. DETR训练自己的数据集
  6. win10下nvidia控制面板看不到
  7. 获取OpenHarmony源码:从DevEco Marketplace获取(1)
  8. bytebuffer长度_图解ByteBuffer和ByteBuf
  9. PAT甲级1007 Maximum Subsequence Sum (25 分)题解
  10. MFCWindows