python刷取CSDN博文访问量之一
1 #coding=utf-8 2 import webbrowser 3 import time 4 import urllib2 5 import re 6 import os 7 import thread 8 9 10 tabcount=1 11 12 def BlogFun(n,url,MaxVisitor): 13 visitcount = r'<span class="link_view" title="阅读次数">(\d+)人阅读</span>' 14 global tabcount 15 while True: 16 if tabcount >10: 17 os.system('taskkill /F /IM chrome.exe') 18 tabcount = 1 19 else: 20 tabcount = tabcount + 1 21 webbrowser.open(url,new=1) 22 request=urllib2.Request(url) 23 request.add_header('User-Agent','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6') 24 opener = urllib2.build_opener() 25 fblog = opener.open(request) 26 htm = fblog.read() 27 Ref=re.findall(visitcount,htm); 28 print url+": "+str(int(Ref[0]))+"人阅读" 29 if int(Ref[0])>MaxVisitor: 30 break 31 time.sleep(n) 32 33 34 if __name__=="__main__": 35 36 37 Domain="http://blog.csdn.net" 38 Blog_url = "http://blog.csdn.net/u013018721/article/details/37996979" 39 FreshSecond = 3 40 MaxVisitor = 1000 41 BlogFun(FreshSecond,Blog_url,MaxVisitor)
转载于:https://www.cnblogs.com/vpoet/p/4659564.html
python刷取CSDN博文访问量之一相关推荐
- Python自动刷取csdn文章访问量(不需安装任何组件)
整理的算法模板:ACM算法模板总结(分类详细版) 可能这是最傻最笨的方法了,消耗电脑CPU:(纯属娱乐) 就是用Python命令不断打开网页关闭网页: 注意由于一个ip连续访问同一篇文章的时候会有时间 ...
- 使用Python爬取CSDN历史博客文章列表,并生成目录
使用Python爬取CSDN历史博客文章列表,并生成目录 这篇博客将介绍如何使用Python爬取CSDN历史博客文章列表,并生成目录. 2020年 2020年04月 cv2.threshold() 阈 ...
- 实现一个go语言的简单爬虫来爬取CSDN博文(一)
http://blog.csdn.net/tyBaoErGe/article/details/50375802?hmsr=studygolang.com&utm_medium=studygol ...
- python爬取csdn上的包含整人关键词的阅读量并且存入表格里。完整代码
请注意,爬取他人网站的数据可能违反网站的条款和条件.在进行爬虫操作之前,请确保获得网站的授权. 下面是一个使用 Python 爬取 CSDN 上所有包含 "整人" 关键词文章的阅读 ...
- copy outerHTML、python爬取csdn文章、一键打包个人csdn文章保存到本地
文章目录 1copy outerHTML复制网站源码法 1.1复制源码 1.2 遇到的问题 2 python爬取CSDN博客文章(保存为html,txt,md) 2.1 安装依赖 2.2 完整代码 3 ...
- 【爬虫+数据可视化】Python爬取CSDN博客访问量数据并绘制成柱状图
以下内容为本人原创,欢迎大家观看学习,禁止用于商业及非法用途,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/article/ ...
- python爬取csdn用户头像
最近简单的学了一下Python爬虫,决定来爬一下csdn受欢迎的博客对应的博主的头像.其部分受欢迎的博客截图如下: 基本思路是:先爬取http://blog.csdn.net/ranking. ...
- 爬虫案例若干-爬取CSDN博文,糗事百科段子以及淘宝的图片
前面学习了基本的浏览器伪装的方式,现在来看三个实例: 例1 爬取CSDN首页的博文 思路很简单,伪装浏览器之后,通过正则获取对应的url链接,然后把对应的url的文章都下载下来 #!/usr/bin/ ...
- python爬取CSDN论坛
通过python爬取SCDN论坛的标题,返回请求网址 使用requests请求网址 lxml中etree请求数据 time延时 openpyxl保存再excel中 网站共有100页数据,5000个论坛 ...
最新文章
- 很幽默的讲解六种Socket IO模型
- 使用open flash chart的BarGlass时遇到的问题
- 链表表示八进制加法c语言,用单链表实现八进制加法操作,恳请大家看看Add( )函数的问题...
- [网络安全自学篇] 三十三.文件上传之绕狗一句话原理和绕过安全狗(六)
- 《剑指offer》链表中环的入口节点
- 风口上的TikTok?
- HTML+CSS制作3D步数统计界面
- install常见问题
- Linux爆本地提权漏洞 请立即更新udev程序
- 机器学习_数学基础专题
- java反射之 Field对象
- 冰冻三尺,非一日之寒。数据解析——xpath(2)
- java 卫星轨道6根数实现轨道预测
- Paul Graham:如何做好天使投资
- 详解网关和路由器的区别
- VB 快速切换wifi软件 [提供案例参考吧]
- python 证件照换背景色(蓝底->白底,蓝底->红底)
- 最全Python算法入门
- demo1:番茄时钟
- 五个不错的样机素材网站推荐
热门文章
- 机器学习系列2:从线性方程的角度看的线性回归【1】
- centos7 hive mysql_CentOS7搭建Hive1.2.2+mysql5.7
- 按位与 matlab,c# 按位与,按位或
- Spring学习3之IOC创建对象的方式
- apache 编译安装php mysql_编译安装APACHE+PHP+MYSQL
- F - 数据结构实验之排序六:希尔排序
- 【Linux】40.date设定系统时间
- Java泛型:类型擦除
- java 常用十种设计模式示例归纳 | 已打包请带走
- Java 单例模式探讨