Python3迅雷vip账号批量抓取导入excel中
1.抓取思路
打开迅雷粉列表页,找到最新账号
为了保证时效,选择第一个列表页进行抓取
利用正则表达式将账号密码提取
账号:([A-Za-z0-9]{6,}) 密码:([A-Za-z0-9]{6,})
将筛选出的数据利用openpyxl导入到excel中
本次教程结束,上代码
#!/usr/bin/env python
#-*-coding:utf-8-*-
__author__ = 'Qi zewen QQ群:497719008'import requests
import re
from openpyxl import Workbook
import osdef url(): #获取vip账号列表页urlget_html = requests.get('http://xlfans.com/archives/category/fenxiang') #获取网站地址urlget_html.encoding = 'utf-8' #转换编码return urlget_html.text #返回网站def relist(): #正则找到vip账号当日网页a = re.findall('<h2><a href="http://xlfans.com/archives/(\d{5})".*?</a></h2>',url())return adef urlvip(): #用正则找到连接地址打开账号密码页面m = []for i in relist():urlvip_html = 'http://xlfans.com/archives/{}'.format(i)urlvip_html_get = requests.get(urlvip_html)urlvip_html_get.encoding = 'utf-8'm.append(urlvip_html_get.text)return mdef revip(): #正则找到vip账号密码b = re.findall('账号:([A-Za-z0-9]{6,}) 密码:([A-Za-z0-9]{6,})',urlvip()[0])#注释掉部分为爬取第一页全部页面,为了保证时效性这里只抓取第一个页面# e = []# for c in urlvip():# b = re.findall('账号:([A-Za-z0-9]{6,}) 密码:([A-Za-z0-9]{6,})',c)# for d in set(b):# e.append(d)# return ereturn b#注释部分为导入txt文本文件# print(d[0],d[1])# with open('./vip.txt','a') as f : #将抓取到的内容放入记事本中# f.write(d[0]+'\t'+d[1]+'\n')def xlsx(): #使用openpyxl工具将账号密码导入到xlsx中wb = Workbook() #打开工作区ws = wb.active #创建活动工作表ws.title = '迅雷VIP账号密码' #定义工作表名称ws['A1'] = '账号' #指定行A1内容为'账号'ws['B1'] = '密码' #指定行B1内容为'密码'm = 2 #指定m用于行数累加for r in revip():ws.cell(row=m, column=1).value = r[0] #将账号信息插入行A中ws.cell(row=m, column=2).value = r[1]m = m + 1wb.save(filename='vip.xlsx') #保存工作表if __name__ == '__main__':print('下载中 loading...')xlsx()print('下载成功')os.startfile('vip.xlsx') #打开excel
Python3迅雷vip账号批量抓取导入excel中相关推荐
- JS脚本实现模拟按钮点击:批量抓取百度推广中的关键词建议
点击html5搜更精彩! JavaScript是个好东东,轻量级,好学易懂.尤其在HTML5时代,这个老朽的语言犹如凤凰涅槃,重获新生. 在Chrome浏览器中,利用小乐图客扩展中的JS代码模块(完美 ...
- php抓取带帐号密码,PHP实现抓取迅雷VIP账号的方法_PHP
本文实例讲述了PHP实现抓取迅雷VIP账号的方法.分享给大家供大家参考.具体如下: 看了@Jinn_Wei Python版本的抓取账号,于是顺手写了个PHP版本 PS1:代码没经过优化,只实现了基本的 ...
- fetch.php迅雷,PHP实现抓取迅雷VIP账号的方法
本文实例讲述了PHP实现抓取迅雷VIP账号的方法.分享给大家供大家参考.具体如下: 看了@Jinn_Wei Python版本的抓取账号,于是顺手写了个PHP版本 PS1:代码没经过优化,只实现了基本的 ...
- 迅雷7fetch.php,php基于采集类Snoopy实现抓取迅雷VIP账号的方法
本篇文章主要介绍php基于采集类Snoopy实现抓取迅雷VIP账号的方法,感兴趣的朋友参考下,希望对大家有所帮助. 具体如下: 看了@Jinn_Wei Python版本的抓取账号,于是顺手写了个PHP ...
- 采集迅雷地址php,PHP实现抓取迅雷VIP账号的方法
本文实例讲述了PHP实现抓取迅雷VIP账号的方法.分享给大家供大家参考.具体如下: 看了@Jinn_Wei Python版本的抓取账号,于是顺手写了个PHP版本 PS1:代码没经过优化,只实现了基本的 ...
- python批量读取图片并批量保存_Python爬虫:批量抓取花瓣网高清美图并保存
原标题:Python爬虫:批量抓取花瓣网高清美图并保存 昨天看到了不错的图片分享网--花瓣,里面的图片质量还不错,所以利用selenium+xpath我把它的妹子的栏目下爬取了下来,以图片栏目名称给文 ...
- Python利用bs4批量抓取网页图片并下载保存至本地
Python利用bs4批量抓取网页图片并下载保存至本地 使用bs4抓取网页图片,bs4解析比较简单,需要预先了解一些html知识,bs4的逻辑简单,编写难度较低.本例以抓取某壁纸网站中的壁纸为例.(b ...
- 京东上货助手批量抓取淘宝商品步骤
京东上传商品的不是很复杂,不过如果想要批量抓取其他平台商品到京东,京东商家就需要时间和精力来批量抓取商品上传了.一般在京东开店的商家,在淘宝.阿里等平台都会有店铺的,这个是电商商家的常态,很多商家都会 ...
- 百度站长资源平台自动批量抓取诊断工具(站长站群seo工具)
背景 百度站长资源平台抓取诊断功能提供了如下说明: 抓取诊断工具,可以让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容和预期是否一致. 每个站点每周可使用70次,抓取结果只展现百度蜘蛛可 ...
- Hibernate框架--学习笔记(下):hibernate的查询方式、多表查询、检索策略、批量抓取
一.hibernate的查询方式: 主要有五种:对象导航查询:OID查询:hql查询:QBC查询:本地sql查询. 1.对象导航查询:根据id查询某个客户,再查询这个客户里面所有的联系人. 2.OID ...
最新文章
- php 发那科,FANUC发那科CNC数据采集教程连接CNC
- scala字符串的拉链操作_在Scala中对字符串进行操作
- 幅相曲线matlab,matlab开环幅相曲线
- centos的ftp和smb被防火墙挡住了
- python竞赛试题及答案_【技术分享】用python解NOIP竞赛题
- eclipse下载主题
- 腾讯云cdn设置 php,腾讯云CDN缓存过期配置问题详解
- 你本是一个肉体,是什么驱使你前行【3】
- 【LaTeX】公式书写工具 | LaTeX转MathML(Word适用)| 公式截图转LaTeX| LaTeX学习(偏公式输入方面)
- 随机数字表法计算机分配,随机数表法.ppt
- 交流电压电流取样电路
- OSPF-LSA详解
- 通过机器学习预测电网平均总负荷
- 华三STP、RSTP、MSTP的详解
- 计算机通电后自动断电,电脑开机自动断电,详细教您电脑开机自动断电怎么解决...
- 001-SE-0011-网络编程
- 中信银行信用卡中心风险管理(非技术岗)群面
- 武汉大学甘菲课题组和南昌大学徐振江课题组联合招聘启事
- 武汉php工程师,Laravel 招聘:[武汉][10-20k][光谷][CmsTop新项目]高级PHP工程师 | Laravel China 社区...
- MIND——Modality independent neighbourhood descriptor 模态无关邻域描述符