Python爬虫 刷博客访问量
import re
import requests
from requests import RequestException
import time
import random
def get_page(url):try:headers = {'Referer': 'https://blog.csdn.net', # 伪装成从CSDN博客搜索到的文章'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36' # 伪装成浏览器}response = requests.get(url, headers=headers)if response.status_code == 200:return response.textreturn Noneexcept RequestException:print('请求出错')return None
def parse_page(html):try:read_num = int(re.compile('<span.*?read-count.*?(\d+).*?</span>').search(html).group(1))return read_numexcept Exception:print('解析出错')return None
def main():try:while 1:url = 'https://blog.csdn.net/swustzhaoxingda/article/details/84324164' # 待刷浏览量博客的urlhtml = get_page(url)if html:read_num = parse_page(html)if read_num:print('当前阅读量:', read_num)url = 'https://blog.csdn.net/swustzhaoxingda/article/details/86614225' # 待刷浏览量博客的urlhtml = get_page(url)if html:read_num = parse_page(html)if read_num:print('当前阅读量:', read_num)url = 'https://blog.csdn.net/swustzhaoxingda/article/details/86591922' # 待刷浏览量博客的urlhtml = get_page(url)if html:read_num = parse_page(html)if read_num:print('当前阅读量:', read_num)url = 'https://blog.csdn.net/swustzhaoxingda/article/details/86617054' # 待刷浏览量博客的urlhtml = get_page(url)if html:read_num = parse_page(html)if read_num:print('当前阅读量:', read_num)sleep_time = random.randint(60, 83)print('please wait', sleep_time, 's')time.sleep(sleep_time) # 设置访问频率,过于频繁的访问会触发反爬虫except Exception:print('出错啦!')
if __name__ == '__main__':main()
Python爬虫 刷博客访问量相关推荐
- 用python刷网页浏览量_python爬虫刷博客访问量教程一:直接请求
import requests import time import random # 随机获取浏览器标识 def get_UA(): UA_list = [ "Mozilla/5.0 (L ...
- python爬虫设计刷博客访问量(刷访问量,赞,爬取图片)
分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 需要准备 ...
- Python3 - 刷博客访问量脚本
Python3 - 刷博客访问量脚本 #!/usr/bin/env python # -*- coding:utf-8 -*- import urllib import urllib.request ...
- linux 定时任务 (python 爬虫统计博客数据)
linux 定时任务 (python 爬虫统计博客数据) 1. 任务目标 定时任务中,每天统计一下今日博客的各项数据,并以邮件的形式发送给自己. 2. linux 定时任务 (python) 一切复杂 ...
- python 爬取博客访问量并且统计数据成图
update by 2018-10-01: 开通了一个公众号,多数文章会围绕python写,有兴趣的朋友可以关注哟! 萌生思路 写了csdn博客已有半年之久了,虽然一直当做笔记记录自己的技术成长,但是 ...
- Python爬虫:博客被抄袭了还不知道?快来查查
文章目录 前言 1. 爬取百度文章 1.1 网页分析 1.2 代码实现 1.3 代码测试 2. 爬取微信公众号文章 2.1 网页分析 2.2 反爬分析 2.3 代码实现 2.4 代码测试 3. 模型训 ...
- Python爬虫-CSDN博客排行榜数据爬取
文章目录 前言 网络爬虫 搜索引擎 爬虫应用 谨防违法 爬虫实战 网页分析 编写代码 运行效果 反爬技术 前言 开始接触 CTF 网络安全比赛发现不会写 Python 脚本的话简直寸步难行--故丢弃 ...
- python刷今日头条访问量_Python 自动刷博客浏览量实例代码
怎么利用python爬取csdn博客访问量例子 如何使用python来爬取自己博客访问量承认吧,小编们都是在深夜里崩溃的俗人.晚安,世界. 博客网站上有访问量这个记录么 如果有就可以抓取网站下来,正则 ...
- python博客访问量_史诗级干货-python爬虫之增加CSDN访问量
AI 人工智能 史诗级干货-python爬虫之增加CSDN访问量 史诗级干货-python爬虫之增加CSDN访问量 搜索微信公众号:'AI-ming3526'或者'计算机视觉这件小事' 获取更多算法. ...
- 【爬虫+数据可视化】Python爬取CSDN博客访问量数据并绘制成柱状图
以下内容为本人原创,欢迎大家观看学习,禁止用于商业及非法用途,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/article/ ...
最新文章
- [原]关于鼠标滚轮的编程
- matlab基本运算与函数
- 企业能为员工储蓄点什么呢
- Codeforces Global Round 12 C1 C2. Errich-Tac-Toe 思维构造 好题
- flex 组建重写
- JAVA 从菜鸟成长为大牛的必经之路
- C++与QML信号交互(非Q_PROPERTY法)
- Atom飞行手册翻译: 2.5 查找和替换
- mysql是怎样运行的书籍_《Mysql是怎样运行的》读书笔记三
- 印地语自由对话语音识别数据库-200人
- java课程设计---彩票销售管理系统
- IIS下发布关于Excel导入导出时遇到的问题集锦
- [LCT BZOJ]2959: 长跑
- 51单片机LCD1602电子时钟
- 【小5聊】CSS基础之设置小箭头图标
- 苹果手机微信提示音应该怎么更换?
- 以下内容仅对你可见个性签名_微信个性签名以下内容仅对你可见模板
- App Store 评分和评论:用户评论如何影响 App Store 排名
- 想转行做数据产品经理?这份书单赶紧收藏起来
- 携手推进国产化发展,未来智安与麒麟软件完成兼容互认证
热门文章
- ios逆向工具theos tweak make编译错误集合
- 弘辽科技:拼多多店铺评分多久更新一次?怎么提高?
- MATLAB 2016b--神经网络工具箱中BP网络的实现
- 用Python完成毫秒级抢单,助你秒杀淘宝大单
- android开发动态图ae,动影ae动态图片特效制作
- 天融信EDR或企业安全终端卸载需要密码解决办法
- Nginx 重定向 80 到443
- 【VulnHub靶场】——HARRYPOTTER第一部: ARAGOG (1.0.2)
- 美国东海岸的数据中心为风暴做好准备
- 为什么宿醉那么缺水_坚决应对云的宿醉