在网上看到的教程,但是我嫌弃那个教程写的乱(虽然最后显示我也没高明多少,哈哈),就随手写了一个

主要是嫌弃盘搜那些恶心的广告,这样直接下载下来,眼睛清爽多了。

用pyinstall 打包成EXE文件,就可以安安静静的下载东西了。。。。

#refer:http://upvup.com/html/python/2015-12-13/21.html

#!/usr/bin/python

# -*- encoding:utf-8 -*-

import requests

from bs4 import BeautifulSoup

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

def yunpan_search(key):

url='http://www.wangpansou.cn/s.php?q='+key

html=requests.get(url)

soup=BeautifulSoup(html.text,"lxml")

url_get=soup.find_all('a',{'class':'cse-search-result_content_item_top_a'})

info_get=soup.find_all('div',{'class':'cse-search-result_content_item_mid'})

f = open('baidu_source.txt','w')

for i in range(len(url_get)):

href=url_get[i]['href']

title=''

for c in url_get[i].children:

title+=c.string.strip()

information=''

for info in info_get[i].children:

information+=info.string.strip().replace('\n','')

print str(i+1)+'_'*60

print '下载地址--'+href+'\n'+'链接标题--'+title+'\n'+'链接详情--'+information+'\n\n'

f.write(str(i+1)+'. _____________________________________________________________________\n')

f.write('下载地址--'+href+'\n'+'链接标题--'+title+'\n'+'链接详情--'+information+'\n\n')

f.close()

if __name__=='__main__':

key=raw_input('please input what you want to look for:')

yunpan_search(key)

print('finish')

python下载百度云盘中的数据_python爬虫:爬取百度云盘资料,保存下载地址、链接标题、链接详情...相关推荐

  1. python爬表格数据_python爬虫,爬取表格数据

    python爬虫,爬取表格数据 python爬虫,爬取表格数据 python爬虫,爬取全国空气质量指数 编程环境:Jupyter Notebook 所要爬取的网页数据内容如下图 python爬虫代码及 ...

  2. python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码

    本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...

  3. beautifulsoup爬取网页中的表格_Python爬虫爬取BT之家找电影资源

    一.写在前面 最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在 ...

  4. python跑一亿次循环_python爬虫爬取微博评论

    原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...

  5. python解析网页数据_python爬虫——爬取网页数据和解析数据

    1.网络爬虫的基本概念 网络爬虫(又称网络蜘蛛,机器人),就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序. 只要浏览器能够做的事情,原则上,爬虫都能够做到. ...

  6. python爬取js加载的数据_Python爬虫:爬取JS加载数据的网页

    比如简书: Paste_Image.png 我们来写个程序,爬取简书网站随便一个作者的所有文章,再对其所有文章进行分词统计 程序运行统计的结果见文章: 我统计了彭小六简书360篇文章中使用的词语 需要 ...

  7. python爬取flash数据_python爬虫: 爬取flash播放页面的信息

    我们通过查看知道flash类型的网页采取文件格式是amf类型的 AMF(Action Message Format) 是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层 ...

  8. python 搜索网页数据_python爬虫爬取网页所有数据

    技术文档 主体内容:可以认为是页面最想表达的内容总和.对于内容详情页来说,主体内容指从标题开始至正文内容结束,翻页区域也被视为主体内容,文章后的评论.分享.推荐等不视为主体内容. 首屏:用户点击搜索结 ...

  9. python调用api接口获取数据_python批量爬取NCBI基因注释并调用谷歌API批量翻译

    作者:沙雕学习小组 这里有视频教程:https://www.bilibili.com/video/av87724182 今天想实现这个功能: 差异分析得到了200多个基因(甚至更多) 我要一个一个把基 ...

最新文章

  1. Android底层开发之旅—蓝牙系统分析
  2. Vitamio FAQ(2012-11-20 )
  3. .NET MessageBox 网页弹出消息框
  4. PHP如何使用GeoIP数据库
  5. Android + kernel USB host 如何判断插入的设备是高速还是低速的设备
  6. 6-STM32物联网开发WIFI(ESP8266)+GPRS(Air202)系统方案升级篇(远程升级STM32程序,基于Wi-Fi,同时支持升级Wi-Fi,APP控制版)...
  7. iec104点号_IEC104报文流程(有常用类型标识解释)
  8. leetcode两数之和
  9. 移动端实时3D目标检测,谷歌开源出品,安卓下载就能用
  10. android genymotion模拟器怎么使用以及和google提供的模拟器性能对比
  11. [转]关于jQuery性能优化
  12. 冰点还原精灵Deep Freeze for mac 系统还原工具
  13. Linux安装yum过程(超详细!)
  14. php怎么把两个字符转成hex,PHP字符串函数bin2hex()(将字符串转换为十六进制值)
  15. Java为什么要面向接口编程
  16. 考研日语线上笔记(五):中级日语语法总结20课(11~20)
  17. 我的阿里三面,四面分享给大家
  18. Destoon增加内容页的浏览历史记录
  19. 如何找到浏览器扩展的安装位置
  20. 【LaTeX】MikTex+TexStudio安装及配置论文写作环境

热门文章

  1. 解决win11 WSL下通过systemd无法启动docker的问题:改为dockerd手动启动
  2. openresty测试lua脚本配置示例
  3. Scala自动隐式转换
  4. Scala特质trait具备Java中类和接口的功能
  5. Docker创建Dockerfile脚本构建jdk1.8镜像并启动容器示例
  6. Python3 使用[]提取字符
  7. Python Django 设置/更改响应头信息
  8. Python Django单表查询之日期查询(大于小于范围查询)
  9. JVM 垃圾收集器CMS相关参数
  10. redis sorted_set数据类型常用命令及跳表skip_list原理