今天测试用了一下python爬取百度云网盘资源.

代码片段import urllib

import urllib.request

import webbrowser

import re

def yunpan_search(key):

keyword = key

keyword = keyword.encode('utf-8')

keyword = urllib.request.quote(keyword)

url = "http://www.wangpansou.cn/s.php?q="+keyword+"&wp=0&start=0"

#webbrowser.open(url)

req = urllib.request.Request(url, headers = {

'Connection': 'Keep-Alive',

'Accept': 'text/html, application/xhtml+xml, */*',

'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',

'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'

})

opener = urllib.request.urlopen(req)

html = opener.read()

html = html.decode('utf-8')

rex = r'https?://pan.baidu.com.*\?uk=[0-9]{10}.*[\d+?]"'

m = re.findall(rex,html)

f = open('/root/Desktop/txt.txt','w')

for i in m:

f.write(i)

f.write('\n\n')

f.close();

print("抓取成功!")

if __name__=='__main__':

print('爬取百度云盘资源快捷爬取')

key = input('输入你想搜索的资源:')

yunpan_search(key)

如果你依然在编程的世界里迷茫,可以加入我们的Python学习扣qun:784758214,看看前辈们是如何学习的!交流经验!自己是一名高级python开发工程师,从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!分享一些学习的方法和需要注意的小细节,点击加入我们的 python学习者聚集地

python开源代码百度盘_python爬取百度云网盘资源-源码相关推荐

  1. 【Python】python爬取百度云网盘资源-源码

    今天测试用了一下python爬取百度云网盘资源. 标签: <无> 代码片段 [代码][Python]代码 import urllib import urllib.request impor ...

  2. python爬取百度云网盘资源-源码

    今天测试用了一下python爬取百度云网盘资源. 代码片段 import urllib import urllib.request import webbrowser import re def yu ...

  3. 利用jsoup爬取百度网盘资源分享连接(多线程)(2)

    之前的博客 利用jsoup爬取百度网盘资源分享连接(多线程) 已经说明了怎么抓取数据,抓取完数据就是共享这些资源了,说白了就是搭建一个百度网盘资源搜索网站,我是利用WAMP搭建的. 主页面index. ...

  4. 爬取百度网盘资源报user is not authorized, hitcode:119

    爬取百度网盘资源报user is not authorized, hitcode:119 一.总结 一句话总结: 可能是百度网盘禁止非客户端环境下载大文件,所以将请求头改为客户端:'User-Agen ...

  5. python百度云盘搜索引擎_2016百度云网盘搜索引擎源码,附带Python爬虫+PHP网站+Xunsearch搜索引擎...

    品牌: 其他 语言: PHP 数据库: Mysql 源文件: 完全开源(含全部源文件) 授权: 免授权 规格: 整站源码 移动端: 无移动端 安装服务: 收费安装(另补差价) 操作系统: Window ...

  6. python 百度云搜索引擎入口_2016最新百度云网盘搜索引擎源码,附带Python爬虫+PHP网站+Xunsearch搜索引擎...

    源码简介 : 适用范围:百度云网盘 搜索引擎 源码,百度 搜索引擎 源码,网盘搜索 爬虫 源码 演示地址:(以截图为准) 运行环境:PHP.MYSQL 其他说明:分享的是一款 搜索引擎 源码,百度云盘 ...

  7. 网盘搜索引擎php源码,2016最新百度云网盘搜索引擎源码,附带Python爬虫+PHP网站+Xunsearch搜索引擎...

    源码简介 : 适用范围:百度云网盘 搜索引擎 源码,百度 搜索引擎 源码,网盘搜索 爬虫 源码 演示地址:(以截图为准) 运行环境:PHP.MYSQL 其他说明:分享的是一款 搜索引擎 源码,百度云盘 ...

  8. 利用jsoup爬取百度网盘资源分享连接(多线程)

    突然有一天就想说能不能用某种方法把百度网盘上分享的资源连接抓取下来,于是就动手了.知乎上有人说过最好的方法就是http://pan.baidu.com/wap抓取,一看果然链接后面的uk值是一串数字, ...

  9. java 多线程爬取网页,利用jsoup爬取百度网盘资源分享连接(多线程)

    突然有一天就想说能不能用某种方法把百度网盘上分享的资源连接抓取下来,于是就动手了.知乎上有人说过最好的方法就是http://pan.baidu.com/wap抓取,一看果然链接后面的uk值是一串数字, ...

最新文章

  1. HOWTO:如果检测用户是从系统的“添加/删除”中卸载软件
  2. hdu 1588 Gauss Fibonacci 较难
  3. linux中sh+$0,浅谈linux中shell变量$#,$@,$0,$1,$2的含义解释
  4. VTK:随机探针用法实战
  5. 2019,GMIS归来!杨强、吴恩达等全球重磅嘉宾共话数据智能
  6. 获取该字符串第N次出现的位置
  7. Web前端Javascript笔记(5)事件
  8. RLException: XXX is neither a launch file in package XXX nor is XXX a launch file name问题解决
  9. SpringBoot之项目实践一
  10. 2022Java最新学习路线(初学者必看)
  11. SQLSERVER存储过程实例(上)
  12. Multisim14实现逻辑函数的化简与变换
  13. java用户行为日志记录方法_简单易用的开源用户操作日志记录系统
  14. 原型工具Axure vs Mockplus ——表格对比 , 你选谁?
  15. Oracle错误——user ** lacks CREATE SESSION privilege logon denied
  16. linux网络编程——聊天室总结
  17. 《增长黑客》- 读书笔记(四)增长黑客循环
  18. ps盖印图层在哪里_盖印图层在哪
  19. PMP-总价合同、固定合同、工料合同对比
  20. Elasticsearch 7.10 之 Data tiers

热门文章

  1. sourceinsight4.0破解教程及下载
  2. 自然机器人最新发布:智能流程助手,与GPT深度融合
  3. python爬取喜马拉雅_Python爬虫实战案例之爬取喜马拉雅音频数据详解
  4. 基于JAVA家用饰品在线销售系统计算机毕业设计源码+数据库+lw文档+系统+部署
  5. 关于iOS离屏渲染的深入研究
  6. dvd加密格式:css
  7. Windows文件对象
  8. 安装Anaconda避坑指南
  9. C语言新手记:应用指针进行数组输入与输出
  10. commandArgument用于绑定一个传递的参数