python 爬取种子_利用python代码爬取torrentkitty上的种子
话不多说上源代码,只要把lxml的库安装下就好了
这个程序完全是解放双手,而且没有弹窗网页等困扰
__author__ = 'JianqingJiang'
# -*- coding: utf-8 -*-
import urllib2
from lxml import etree
import os
pre_url ='http://torrentkitty/search/tokyohot/'
os.chdir('/Users/JianqingJiang/Downloads/')
def steve(page_num,file_name):
url = pre_url + str(page_num)
print url
ht = urllib2.urlopen(url).read()
content = etree.HTML(ht.lower().decode('utf-8'))
mags = content.xpath("//a[@rel='magnet']")
with open(file_name,'a') as p: # '''Note''':Append mode, run only once!
for mag in mags:
p.write("%s \n \n"%(mag.attrib['href'])+"\n") ##!!encode here to utf-8 to avoid encoding
print "%s \n \n"%(mag.attrib['href'])
for page_num in range(0,10):
print (page_num)
steve(page_num, 'steve.txt')
差不多爬了10页就这样了。。。。
python 爬取种子_利用python代码爬取torrentkitty上的种子相关推荐
- python爬取股票信息_利用Python爬取网易上证所有股票数据(代码
利用Python爬取网易上证所有股票数据(代码 发布时间:2018-04-14 17:30, 浏览次数:1261 , 标签: Python import urllib.request import r ...
- python爬取音乐_利用Python对网易云音乐进行爬取!无所不爬的爬虫啊!
今天,我们利用Python 中的selenium爬取网易云音乐中林俊杰<将故事写成我们>的评论,具体界面如下: 私信小编01 获取数十套PDF!爬虫 web都有的呢! 具体代码如下: #此 ...
- python爬虫爬取音乐_利用python爬虫实现爬取网易云音乐热歌榜
利用python爬虫实现爬取网易云音乐热歌榜 发布时间:2020-11-09 16:12:28 来源:亿速云 阅读:102 作者:Leah 本篇文章给大家分享的是有关利用python爬虫实现爬取网易云 ...
- python自动排课表_利用python爬取广西科技大学教务管理信息系统班级课表
操作环境 python 3.6.1 pycharm 5.0.3 WampServer 3.0.6 windows 8(64位) 特点 1.中途退出程序或者断网之后重连再次运行不会抓取到重复的课程表 2 ...
- python爬取率_利用Python爬取OPGG上英雄联盟英雄胜率及选取率信息
一.分析网站内容 由网站界面可以看出,右侧有英雄的详细信息,以Garen为例,胜率为53.84%,选取率为16.99%,常用位置为上单 现对网页源代码进行分析(右键鼠标在菜单中即可找到查看网页源代码) ...
- python beautifulsoup抓取网页内容_利用Python和Beautiful Soup抓取网页内容
利用Python和Beautiful Soup抓取网页内容 Posted on 2012-08-09 00:08 SamWei 阅读(381) 评论(1) 编辑 收藏 Python 3中提供了url打 ...
- python制作图片墙_利用python生成照片墙的示例代码
PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了.其官方主页为:PIL. PIL历 ...
- python展示全部好友_利用Python网络爬虫抓取微信好友的签名及其可视化展示
前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所 ...
- python爬虫beautifulsoup爬当当网_利用python爬虫可视化分析当当网的图书数据!
导语 这周末就分享个小爬虫吧.利用Python爬取并简单地可视化分析当当网的图书数据. 开发工具 Python版本:3.6.4 相关模块: requests模块: bs4模块: wordcloud模块 ...
- python英语词汇读音_利用Python制作查单词小程序(一):抓取来自百度翻译的单词释义和音标...
小编在学习英语的时候,遇到不认识的英语单词,会用百度翻译来查询单词的释义和音标,并播放单词的读音.为了便于复习和记忆,需要将单词的释义和音标以复制粘贴的方式保存到本地. 这个过程非常繁琐,于是小编就想 ...
最新文章
- ThinkPHP读取数据库数据到模板文件
- python graphics画圆_求高手解答·· graphics画圆出现报错!
- 201671010103 2016-2017-2 《Java程序设计》第十二周学习心得
- JS事件冒泡与事件捕获
- 学习笔记(二)——直方图均衡化和匹配
- c语言网络编程阻塞,c语言网络编程-设置非阻塞方式
- HDU 2242 双连通分量 考研路茫茫——空调教室
- 老年手机英文改中文_不服来战:“老年人才用9键!”
- AIOps产品与架构浅析
- 编译的 Ruby 2.3.0 缺少 openssl 支持的解决方法 (已解决)
- CRM客户关系管理系统项目总结
- 景区手绘地图(电子地图、智慧导览系统)如何制作
- ESP32驱动AD7705
- 让更多的开发者听到您的声音,移动开发征文活动现已开始 | 开发者说·DTalk
- 腾讯+android+hotfix,发布到安卓平台报这个错误,xLua exception : xlua.access, no field __Hotfix0_Update...
- VPS上安装Zpanle面板
- 第四章:(1)Redis 数据类型 之 Redis 解析配置文件 redis.conf
- 基于android的智慧停车app
- oracle扩充表空间
- pandas_数据处理分析基本