python下载百度云盘中的数据_python爬虫:爬取百度云盘资料,保存下载地址、链接标题、链接详情...
在网上看到的教程,但是我嫌弃那个教程写的乱(虽然最后显示我也没高明多少,哈哈),就随手写了一个
主要是嫌弃盘搜那些恶心的广告,这样直接下载下来,眼睛清爽多了。
用pyinstall 打包成EXE文件,就可以安安静静的下载东西了。。。。
#refer:http://upvup.com/html/python/2015-12-13/21.html
#!/usr/bin/python
# -*- encoding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
def yunpan_search(key):
url='http://www.wangpansou.cn/s.php?q='+key
html=requests.get(url)
soup=BeautifulSoup(html.text,"lxml")
url_get=soup.find_all('a',{'class':'cse-search-result_content_item_top_a'})
info_get=soup.find_all('div',{'class':'cse-search-result_content_item_mid'})
f = open('baidu_source.txt','w')
for i in range(len(url_get)):
href=url_get[i]['href']
title=''
for c in url_get[i].children:
title+=c.string.strip()
information=''
for info in info_get[i].children:
information+=info.string.strip().replace('\n','')
print str(i+1)+'_'*60
print '下载地址--'+href+'\n'+'链接标题--'+title+'\n'+'链接详情--'+information+'\n\n'
f.write(str(i+1)+'. _____________________________________________________________________\n')
f.write('下载地址--'+href+'\n'+'链接标题--'+title+'\n'+'链接详情--'+information+'\n\n')
f.close()
if __name__=='__main__':
key=raw_input('please input what you want to look for:')
yunpan_search(key)
print('finish')
python下载百度云盘中的数据_python爬虫:爬取百度云盘资料,保存下载地址、链接标题、链接详情...相关推荐
- python爬表格数据_python爬虫,爬取表格数据
python爬虫,爬取表格数据 python爬虫,爬取表格数据 python爬虫,爬取全国空气质量指数 编程环境:Jupyter Notebook 所要爬取的网页数据内容如下图 python爬虫代码及 ...
- python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码
本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...
- beautifulsoup爬取网页中的表格_Python爬虫爬取BT之家找电影资源
一.写在前面 最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在 ...
- python跑一亿次循环_python爬虫爬取微博评论
原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...
- python解析网页数据_python爬虫——爬取网页数据和解析数据
1.网络爬虫的基本概念 网络爬虫(又称网络蜘蛛,机器人),就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序. 只要浏览器能够做的事情,原则上,爬虫都能够做到. ...
- python爬取js加载的数据_Python爬虫:爬取JS加载数据的网页
比如简书: Paste_Image.png 我们来写个程序,爬取简书网站随便一个作者的所有文章,再对其所有文章进行分词统计 程序运行统计的结果见文章: 我统计了彭小六简书360篇文章中使用的词语 需要 ...
- python爬取flash数据_python爬虫: 爬取flash播放页面的信息
我们通过查看知道flash类型的网页采取文件格式是amf类型的 AMF(Action Message Format) 是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层 ...
- python 搜索网页数据_python爬虫爬取网页所有数据
技术文档 主体内容:可以认为是页面最想表达的内容总和.对于内容详情页来说,主体内容指从标题开始至正文内容结束,翻页区域也被视为主体内容,文章后的评论.分享.推荐等不视为主体内容. 首屏:用户点击搜索结 ...
- python调用api接口获取数据_python批量爬取NCBI基因注释并调用谷歌API批量翻译
作者:沙雕学习小组 这里有视频教程:https://www.bilibili.com/video/av87724182 今天想实现这个功能: 差异分析得到了200多个基因(甚至更多) 我要一个一个把基 ...
最新文章
- Android底层开发之旅—蓝牙系统分析
- Vitamio FAQ(2012-11-20 )
- .NET MessageBox 网页弹出消息框
- PHP如何使用GeoIP数据库
- Android + kernel USB host 如何判断插入的设备是高速还是低速的设备
- 6-STM32物联网开发WIFI(ESP8266)+GPRS(Air202)系统方案升级篇(远程升级STM32程序,基于Wi-Fi,同时支持升级Wi-Fi,APP控制版)...
- iec104点号_IEC104报文流程(有常用类型标识解释)
- leetcode两数之和
- 移动端实时3D目标检测,谷歌开源出品,安卓下载就能用
- android genymotion模拟器怎么使用以及和google提供的模拟器性能对比
- [转]关于jQuery性能优化
- 冰点还原精灵Deep Freeze for mac 系统还原工具
- Linux安装yum过程(超详细!)
- php怎么把两个字符转成hex,PHP字符串函数bin2hex()(将字符串转换为十六进制值)
- Java为什么要面向接口编程
- 考研日语线上笔记(五):中级日语语法总结20课(11~20)
- 我的阿里三面,四面分享给大家
- Destoon增加内容页的浏览历史记录
- 如何找到浏览器扩展的安装位置
- 【LaTeX】MikTex+TexStudio安装及配置论文写作环境
热门文章
- 解决win11 WSL下通过systemd无法启动docker的问题:改为dockerd手动启动
- openresty测试lua脚本配置示例
- Scala自动隐式转换
- Scala特质trait具备Java中类和接口的功能
- Docker创建Dockerfile脚本构建jdk1.8镜像并启动容器示例
- Python3 使用[]提取字符
- Python Django 设置/更改响应头信息
- Python Django单表查询之日期查询(大于小于范围查询)
- JVM 垃圾收集器CMS相关参数
- redis sorted_set数据类型常用命令及跳表skip_list原理