python下载百度云盘中的数据_python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情...

在网上看到的教程，但是我嫌弃那个教程写的乱（虽然最后显示我也没高明多少，哈哈），就随手写了一个

主要是嫌弃盘搜那些恶心的广告，这样直接下载下来，眼睛清爽多了。

用pyinstall 打包成EXE文件，就可以安安静静的下载东西了。。。。

#refer:http://upvup.com/html/python/2015-12-13/21.html

#!/usr/bin/python

# -*- encoding:utf-8 -*-

import requests

from bs4 import BeautifulSoup

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

def yunpan_search(key):

url='http://www.wangpansou.cn/s.php?q='+key

html=requests.get(url)

soup=BeautifulSoup(html.text,"lxml")

url_get=soup.find_all('a',{'class':'cse-search-result_content_item_top_a'})

info_get=soup.find_all('div',{'class':'cse-search-result_content_item_mid'})

f = open('baidu_source.txt','w')

for i in range(len(url_get)):

href=url_get[i]['href']

title=''

for c in url_get[i].children:

title+=c.string.strip()

information=''

for info in info_get[i].children:

information+=info.string.strip().replace('\n','')

print str(i+1)+'_'*60

print '下载地址--'+href+'\n'+'链接标题--'+title+'\n'+'链接详情--'+information+'\n\n'

f.write(str(i+1)+'. _____________________________________________________________________\n')

f.write('下载地址--'+href+'\n'+'链接标题--'+title+'\n'+'链接详情--'+information+'\n\n')

f.close()

if __name__=='__main__':

key=raw_input('please input what you want to look for:')

yunpan_search(key)

print('finish')

python下载百度云盘中的数据_python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情...相关推荐

python爬表格数据_python爬虫,爬取表格数据
python爬虫,爬取表格数据 python爬虫,爬取表格数据 python爬虫,爬取全国空气质量指数编程环境:Jupyter Notebook 所要爬取的网页数据内容如下图 python爬虫代码及 ...
python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码
本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...
beautifulsoup爬取网页中的表格_Python爬虫爬取BT之家找电影资源
一.写在前面最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在 ...
python跑一亿次循环_python爬虫爬取微博评论
原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...
python解析网页数据_python爬虫——爬取网页数据和解析数据
1.网络爬虫的基本概念网络爬虫(又称网络蜘蛛,机器人),就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序. 只要浏览器能够做的事情,原则上,爬虫都能够做到. ...
python爬取js加载的数据_Python爬虫:爬取JS加载数据的网页
比如简书: Paste_Image.png 我们来写个程序,爬取简书网站随便一个作者的所有文章,再对其所有文章进行分词统计程序运行统计的结果见文章: 我统计了彭小六简书360篇文章中使用的词语需要 ...
python爬取flash数据_python爬虫: 爬取flash播放页面的信息
我们通过查看知道flash类型的网页采取文件格式是amf类型的 AMF(Action Message Format) 是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层 ...
python 搜索网页数据_python爬虫爬取网页所有数据
技术文档主体内容:可以认为是页面最想表达的内容总和.对于内容详情页来说,主体内容指从标题开始至正文内容结束,翻页区域也被视为主体内容,文章后的评论.分享.推荐等不视为主体内容. 首屏:用户点击搜索结 ...
python调用api接口获取数据_python批量爬取NCBI基因注释并调用谷歌API批量翻译
作者:沙雕学习小组这里有视频教程:https://www.bilibili.com/video/av87724182 今天想实现这个功能: 差异分析得到了200多个基因(甚至更多) 我要一个一个把基 ...

python下载百度云盘中的数据_python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情...

python下载百度云盘中的数据_python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情...相关推荐

最新文章

热门文章