python的urllib.parse用法

urllib.parse解析

url:urllib.parse.urlparse(url, scheme='', allow_fragments=True)

简单的使用：
urlparse

from urllib import request, parse2 #解析urlprint(parse.urlparse('https://movie.douban.com/'))
print(parse.urlparse('https://movie.douban.com/', scheme='http'))
print(parse.urlparse('movie.douban.com/', scheme='http'))
# 下面是结果
ParseResult(scheme='https', netloc='movie.douban.com', path='/', params='', query='', fragment='')
ParseResult(scheme='https', netloc='movie.douban.com', path='/', params='', query='', fragment='')
ParseResult(scheme='http', netloc='', path='movie.douban.com/', params='', query='', fragment='')

可以看出加了scheme参数和没加的返回结果是有区别的。而当scheme协议加了，而前面的url也包含协议，一般会忽略后面的scheme参数
既然有解析url，那当然也有反解析url，就是把元素串连成一个url

from urllib import parse
# 将列表元素拼接成url
url = ['http', 'www', 'baidu', 'com', 'dfdf', 'eddffa'] # 这里至少需要6个元素
print(parse.urlunparse(url))
# 下面是结果6http://www/baidu;com?dfdf#eddffa

urlunparse()接收一个列表的参数，而且列表的长度是有要求的，是必须六个参数以上，要不会抛出异常

urllib.parse.urljoin():这个是将第二个参数的url缺少的部分用第一个参数的url补齐

# 连接两个参数的url, 将第二个参数中缺的部分用第一个参数的补齐,如果第二个有完整的路径，则以第二个为主
print(parse.urljoin('https://movie.douban.com/', 'index'))
print(parse.urljoin('https://movie.douban.com/', 'https://accounts.douban.com/login'))
# 下面是结果
https://movie.douban.com/index6     https://accounts.douban.com/login

urlencode
urllib库里面有个urlencode函数，可以把key-value这样的键值对转换成我们想要的格式，返回的是a=1&b=2这样的字符串，比如：

>>> from urllib import urlencode
>>> data = {
...     'a': 'test',
...     'name': '魔兽'
... }
>>> print urlencode(data)
a=test&amp;name=%C4%A7%CA%DE
如果只想对一个字符串进行urlencode转换，怎么办？urllib提供另外一个函数：quote()>>> from urllib import quote
>>> quote('魔兽')
'%C4%A7%CA%DE'

urldecode
当urlencode之后的字符串传递过来之后，接受完毕就要解码了——urldecode。urllib提供了unquote()这个函数，可没有urldecode()！

>>> from urllib import unquote
>>> unquote('%C4%A7%CA%DE')
'\xc4\xa7\xca\xde'
>>> print unquote('%C4%A7%CA%DE')
魔兽

python的urllib.parse用法相关推荐

python中urllib.parse啥意思_python-urllib.parse模块简述
前言小编最近在编写接口自动化测试用例的过程中,需要将get请求url中的部分参数替换成预设的数据,将url中的具有时效性的auth替换成auth生成方法返回值.经过一番调研,最后选取了python的 ...
python补充urllib教程,Python爬虫之urllib基础用法教程
综述本系列文档用于对Python爬虫技术进行简单的教程讲解,巩固自己技术知识的同时,万一一不小心又正好对你有用那就更好了. Python 版本是3.7.4 urllib库介绍它是 Python 内 ...
python urllib.parse.quote_urllib.parse.quote
urllib.parse.quote 屏蔽特殊的字符.比如如果url里面的空格!url里面是不允许出现空格的. 在 Python2.x 中的用法是: urllib.quote(text) Python ...
Python爬虫核心知识-第二章：2.2 爬虫urllib.parse模块
Python爬虫核心知识第二章:2.2 爬虫urllib.parse模块 2.2 爬虫urllib.parse模块 Python中的urllib.parse模块中,提供了很多用来解析和重组URL的函 ...
python的parse用法_Python 里边的parser用法
2011-8-23 Python 里边的parser用法 15.5. optparse - Parser for command line options http://docs.python.org ...
python爬虫学习3：urllib.parse中urlencode()，quote()
urllib.parse 模块提供了很多解析和组建 URL 的函数,它定义了处理URL的标准接口,例如实现URL各部分的抽取.合并以及链接转换. 其中用来编码是 urlencode() 与 quote ...
Python之urllib爬虫-request模块和parse模块详解
文章目录 urllib request模块访问URL Request类其他类 parse模块解析URL 转义URL robots.txt文件 urllib urllib是Python中用来处理U ...
python parse函数_Python3的urllib.parse常用函数小结
本文实例讲述了Python3的urllib.parse常用函数.分享给大家供大家参考,具体如下: 1.获取url参数 >>> from urllib import parse > ...
利用python爬虫(part2)--urllib.parse模块
学习笔记文章目录 URL地址编码模块作用常用的方法 urllib.parse.utlencode({dict}) urllib.parse.quote(string)编码 urllib.pars ...

python的urllib.parse用法

urllib.parse解析

python的urllib.parse用法相关推荐

最新文章

热门文章