今天测试用了一下python爬取百度云网盘资源.

代码片段import urllib

import urllib.request

import webbrowser

import re

def yunpan_search(key):

keyword = key

keyword = keyword.encode('utf-8')

keyword = urllib.request.quote(keyword)

url = "http://www.wangpansou.cn/s.php?q="+keyword+"&wp=0&start=0"

#webbrowser.open(url)

req = urllib.request.Request(url, headers = {

'Connection': 'Keep-Alive',

'Accept': 'text/html, application/xhtml+xml, */*',

'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',

'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'

})

opener = urllib.request.urlopen(req)

html = opener.read()

html = html.decode('utf-8')

rex = r'https?://pan.baidu.com.*\?uk=[0-9]{10}.*[\d+?]"'

m = re.findall(rex,html)

f = open('/root/Desktop/txt.txt','w')

for i in m:

f.write(i)

f.write('\n\n')

f.close();

print("抓取成功!")

if __name__=='__main__':

print('爬取百度云盘资源快捷爬取')

key = input('输入你想搜索的资源:')

yunpan_search(key)

如果你依然在编程的世界里迷茫,可以加入我们的Python学习扣qun:784758214,看看前辈们是如何学习的!交流经验!自己是一名高级python开发工程师,从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!分享一些学习的方法和需要注意的小细节,点击加入我们的 python学习者聚集地

python开源代码百度盘_python爬取百度云网盘资源-源码相关推荐

  1. 【Python】python爬取百度云网盘资源-源码

    今天测试用了一下python爬取百度云网盘资源. 标签: <无> 代码片段 [代码][Python]代码 import urllib import urllib.request impor ...

  2. python爬取百度云网盘资源-源码

    今天测试用了一下python爬取百度云网盘资源. 代码片段 import urllib import urllib.request import webbrowser import re def yu ...

  3. 利用jsoup爬取百度网盘资源分享连接(多线程)(2)

    之前的博客 利用jsoup爬取百度网盘资源分享连接(多线程) 已经说明了怎么抓取数据,抓取完数据就是共享这些资源了,说白了就是搭建一个百度网盘资源搜索网站,我是利用WAMP搭建的. 主页面index. ...

  4. 爬取百度网盘资源报user is not authorized, hitcode:119

    爬取百度网盘资源报user is not authorized, hitcode:119 一.总结 一句话总结: 可能是百度网盘禁止非客户端环境下载大文件,所以将请求头改为客户端:'User-Agen ...

  5. python百度云盘搜索引擎_2016百度云网盘搜索引擎源码,附带Python爬虫+PHP网站+Xunsearch搜索引擎...

    品牌: 其他 语言: PHP 数据库: Mysql 源文件: 完全开源(含全部源文件) 授权: 免授权 规格: 整站源码 移动端: 无移动端 安装服务: 收费安装(另补差价) 操作系统: Window ...

  6. python 百度云搜索引擎入口_2016最新百度云网盘搜索引擎源码,附带Python爬虫+PHP网站+Xunsearch搜索引擎...

    源码简介 : 适用范围:百度云网盘 搜索引擎 源码,百度 搜索引擎 源码,网盘搜索 爬虫 源码 演示地址:(以截图为准) 运行环境:PHP.MYSQL 其他说明:分享的是一款 搜索引擎 源码,百度云盘 ...

  7. 网盘搜索引擎php源码,2016最新百度云网盘搜索引擎源码,附带Python爬虫+PHP网站+Xunsearch搜索引擎...

    源码简介 : 适用范围:百度云网盘 搜索引擎 源码,百度 搜索引擎 源码,网盘搜索 爬虫 源码 演示地址:(以截图为准) 运行环境:PHP.MYSQL 其他说明:分享的是一款 搜索引擎 源码,百度云盘 ...

  8. 利用jsoup爬取百度网盘资源分享连接(多线程)

    突然有一天就想说能不能用某种方法把百度网盘上分享的资源连接抓取下来,于是就动手了.知乎上有人说过最好的方法就是http://pan.baidu.com/wap抓取,一看果然链接后面的uk值是一串数字, ...

  9. java 多线程爬取网页,利用jsoup爬取百度网盘资源分享连接(多线程)

    突然有一天就想说能不能用某种方法把百度网盘上分享的资源连接抓取下来,于是就动手了.知乎上有人说过最好的方法就是http://pan.baidu.com/wap抓取,一看果然链接后面的uk值是一串数字, ...

最新文章

  1. 三层交换网络的各层职责
  2. 百度二次上市涨0.79%,错过移动互联网热潮后牌怎么出?
  3. Python 文件的详细操作
  4. Spring Cloud Config配置中心使用(草稿版)
  5. mysql 压缩版安装
  6. Python提取数字图片特征向量
  7. Fibonacci Knapsack
  8. OpenCV中cvLoadImage()函数和cvCreateImage()函数的异同之处!
  9. 图的简单应用(C/C++实现)
  10. 【资讯】国内 42 所一流大学综合排名出炉!清北之后谁是国内第三?
  11. [ExtJS] ExtJS颜色选择器
  12. 如何批量将 PPT 幻灯片文档转换为 XPS 格式
  13. Android中摇一摇的实现
  14. 【luogu/字符串】多项式输出(所有情况一起处理)
  15. CDN加速技术可以解决网络客户的哪些痛点问题?
  16. 小i聊天机器人自定义应用
  17. STM32F4驱动LTC2664-16驱动程序
  18. 智能文档控制——文档的智能归档、捕获、索引、访问和协作
  19. aircrack-ng 介绍、功能测试及部分源码分析
  20. 《精读 Mastering ABP Framework》教程发布

热门文章

  1. 我的世界服务器老是文件损坏,我的世界角色卡死存档损坏修复教程
  2. 微服务网关鉴权:gateway使用、网关限流使用 用户密码加密 JWT鉴权
  3. 修改系统默认软件安装路径
  4. 利用Kismet进行无线网络探测
  5. 如何提高计算机性能计算机组成原理,深入浅出计算机组成原理学习笔记:我们该从哪些方面提升“性能”(第3讲)...
  6. 计算机黑屏如何重启,电脑重启黑屏怎么办 电脑重启后黑屏的解决方法
  7. 油烟净化器能不能过环保,该怎么做?
  8. 安装最新mysql 8.0.22在windows10
  9. c# messageBox.show()应用
  10. Vue Nuxt框架 静态化部署[spa、generate] 之 Cannot read property ‘headers’ of undefined、headr外加载css