使用python爬虫增加浏览量
纯属瞎研究,若有值得改进的地方,欢迎提出宝贵意见~
第一版
很简单的几句代码,同一个ip一分钟内频繁刷无效,时间间隔设置为60多秒。速度很慢,一分多钟才可以增加一次浏览量。
前提,安装selenium库
第一版代码:(仅供参考,不建议使用)
import time
from selenium import webdriver
import random
driver = webdriver.Chrome()
driver.maximize_window()
#driver.implicitly_wait(6)driver.get("https://blog.csdn.net/weixin_42486139/article/details/102687538") #博客链接for i in range(1000):print('第%d次刷新'%i)try: driver.refresh() # 刷新方法 refreshprint ('test pass: refresh successful')except Exception as e:print ("Exception found", format(e))driver.quit()time.sleep(60+random.randint(1,10)) #隔一分多钟刷新一次
第二版
既然这样,那我多搞几个ip呢,其他博客也有很多参考,都是基于urllib库,不知道为什么,我使用这个库,可以抓取到网页信息,但是浏览量不增加,还是在selenium上继续搞。
免费ip代理网站 :https://www.xicidaili.com/ 从这里搞几个可用的ip(不是所有的ip都可用),若不知道如何获取可用ip,请下拉至文章最后,附判断ip是否可用代码。
第二版代码:(设置了10个ip,可以6s刷一次)
# -*- coding: utf-8 -*-
"""
Created on Tue Oct 22 17:01:54 2019@author: mandy
"""
import time
from selenium import webdriver#设置selenium后台模式执行,避免多次弹窗打开网页关闭网页
option=webdriver.ChromeOptions()
option.add_argument('--headless')
option.add_argument('--no-sandbox')
option.add_argument('--start-maximized')
#driver = webdriver.Chrome(chrome_options=option)#chromeOptions = webdriver.ChromeOptions()
proxys=["--proxy-server=http://221.178.232.130:8080","--proxy-server=http://61.131.160.177:9006","--proxy-server=http://122.194.209.187:61234","--proxy-server=http://59.37.18.243:3128","--proxy-server=http://218.64.69.79:8080","--proxy-server=http://222.90.110.194:8080","--proxy-server=http://114.249.230.208:8000","--proxy-server=http://222.184.59.8:808","--proxy-server=http://27.128.187.22:3128","--proxy-server=http://113.109.249.32:808",]
j=0
for i in range(1000):for proxy in proxys:try: #try..except..保证遇到TimeoutException报错不中断option.add_argument(proxy)driver = webdriver.Chrome(chrome_options=option)driver.get("https://blog.csdn.net/weixin_42486139/article/details/102687538") #博客链接j+=1print('第%d次刷新'%j)time.sleep(6) driver.quit()except Exception as e:print(e)
虽然设置了后台模式运行,但是每次执行webdriver.Chrome()会弹出dos窗,如下:
解决方法:修改selenium包中的service.py代码第76行,改为:
ok,大功告成,在后台默默地刷新就可以了,不会影响你做其他的事情。
附
判断ip是否可用代码(可用的ip地址及端口号保存在生成的IP.txt文件中):
# -*- coding: utf-8 -*-
"""
Created on Mon Nov 4 16:17:01 2019@author: mandy
"""
import urllib.request
from urllib import request, parse
import requests# 写入获取到的ip地址到proxy
proxys = [{'https':'221.178.232.130:8080'},{'https':'61.131.160.177:9006'},{'https':'122.194.209.187:61234'},{'https':'59.37.18.243:3128'},{'https':'218.64.69.79:8080'},{'https':'222.90.110.194:8080'}, #5{'https':'222.184.59.8:808'},{'https':'218.249.69.214:1081'},{'https':'114.249.230.208:8000'},{'https':'27.128.187.22:3128'},{'https':'114.220.115.180:8118'},{'https':'116.228.44.9:8085'},{'https':'113.109.249.32:808'},{'https':'183.129.207.78:18118'},{'https':'14.20.235.117:808'},{'https':'122.136.212.132:53281'}]
# 用百度检测ip代理是否成功
url = 'https://www.baidu.com/'
# 请求头
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'
}
# 发送get请求
for proxy in proxys: try:response = requests.get(url=url,headers=headers,proxies=proxy)f=open('IP.txt','a')f.write(str(proxy)+'\n')f.close()#print(response.text)## 获取返回页面保存到本地,便于查看#with open('ip.html','w',encoding='utf-8') as f:# f.write(response.text)except:print(proxy,'无效ip!')
使用python爬虫增加浏览量相关推荐
- python爬虫实验浏览量——凉凉
我之前的一篇爬虫爬取信息练习里使用了请求头:User-Agent,让网页人为刚刚进行访问的是浏览器,所以我在想是否可以使用这种方法去增加我CSDN博客的访问量,所以我使用这篇博客进行了测试. 第一次我 ...
- 辽宁聚能合创:抖音怎么增加浏览量?
抖音上也有不少用户会发表一些视频,来提高自己抖音的粉丝量,那么如果有其他人观看视频的话,还会有浏览记录显示,那么怎么才算一次呢?跟着辽宁聚能合创小编来看看吧! 在抖音,超过75%的视频被观看:目前,抖 ...
- html怎么增加浏览量,小红书怎么增加浏览量
大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答. 小红书增加浏览量的方法: 1.内容一定要是原创的,如果不是原创的,你的文章就不会有推荐,没有推荐,你就得不到曝光量. 2.可以借鉴 ...
- 用python刷网页浏览量_如何用python 增加网站点击量?
简单一句话:就是调用你的浏览器,然后程序自动帮你打开你的网页,隔一段时间自动关闭.之后的步骤就是循环,刷访问量.下面看一篇文章: python3爬虫之访问量.点击率数据的爬取分析 1.明确问题: 通过 ...
- html怎么增加浏览量,怎么提高网站浏览量?网站点击量大大增加方法介绍
很多网友都有自己的博客或者是SEO,怎么提高网站浏览量?下面小编就为大家介绍网站点击量大大增加方法,来看看吧! 方法/步骤 不管你是网站还是博客,其实,要点击率上升,是需要你的网站或者博客有亮点,有看 ...
- 王牌流量爆刷器 流量提升工具 网站刷新 增加浏览量 王牌软件
本软件主要功能是提供网站的快速刷新功能 由于网上所谓的刷新软件都报毒{不排除加壳误报},所以作者开发此软件,方便 大家. 最常见的,刷刷某宝的浏览量.其他用途自己发觉... 如有BUG请邮件给我 cp ...
- 用python刷网页浏览量_python爬虫刷博客访问量教程一:直接请求
import requests import time import random # 随机获取浏览器标识 def get_UA(): UA_list = [ "Mozilla/5.0 (L ...
- python爬虫增加访问量
看着自己少得可怜的访问量,突然有一个想用爬虫刷访问量的想法,主要也是抱着尝试的心态,学习学习. 第一版:网上借鉴了一下 以下代码运行在 python3 import urllib. ...
- 用python刷网页浏览量_Python 刷点击量的代码详解
[Python]代码 import webbrowser as web import re import urllib import time import os def spider(url,url ...
- 用python刷网页浏览量_使用python刷文章阅读量
from bs4 import BeautifulSoup import requests import random import time # 定义变量 proxys_src = [] proxy ...
最新文章
- Ubuntu下嵌入式Qt开发环境配置全攻略
- c++ 读取一行的2个数
- 判断js变量是否定义,
- 3.spring cloud + zookeeper注册中心 + Feign调用案例
- 7-5 求前N天 (30 分)
- malloc的内存分配之 malloc(0)的内存分配情况
- 逆序输出1到4位正整数
- C# System.Windows.Forms.NumericUpDown 控件全选其中文字
- 协议簇:Ethernet Address Resolution Protocol (ARP) 解析
- php100 linux,PHP100精华:很靠谱linux经常使用命令
- Ubuntu 安装 chrome
- 60-10-015-集成-(kylin On Druid)-Build CUBE的时候每一步都做了什么
- aix Oracle 限制访问,改变AIX上使用oracle的一些限制
- Anacodna 环境迁移详解
- 从JimmyNews有感于互联网的传播能力
- 操作系统课设 Nachos 实验三:利用信号量实现线程同步
- 深入java虚拟机(圣思园)
- photoshop-CMYK色彩模式
- FineReport 参数查询
- 优秀的测试工程师应该具备哪些素质