1.应用场景

批量操作, 打开链接.

2.学习/操作

思路

获取超链接标签, 然后使用批量打开每个超链接, 从而不需要手动一个个打开链接

完善

建议用脚本实现, 然后写一个定时脚本[服务器上],每天定时执行.

环境

Chrome浏览器/其他浏览器也可以

PHP 7.3

nginx 1.15/1.16

方式一

2.1 使用 LmCjl在线工具 在线工具,抓取网页超链接[需要清洗数据,即不需要的数据去除掉即可]  --- 现在改为需要注册登录  -- 20210226 周五 家里

网站链接抓取_在线批量获取网页链接工具_链接抓取  //提取超链接在线工具

...

2.2 使用在线工具批量打开超链接

2.2.1 输入 批量打开网址、网页、网站(网址、超链接批量打开工具,如何批量一键快速打开多个网站、网页) 回车

2.2.2 注意

首次操作,点击批量打开按钮后,浏览器会在上端网址栏www.ab173.com最右端有小图标(隐蔽图标)提示拦截本站弹窗,请点击选择为允许本站所有弹窗。(不允许弹窗就是屏蔽批量打开的功能,请放心选择)若已经选择允许弹窗,并测试可以批量打开网址,请忽略以下操作。

详细信息见 批量打开网址、网页、网站(网址、超链接批量打开工具,如何批量一键快速打开多个网站、网页) 常见问题

chrome://settings/content/popups   //隐私设置和安全性 - 弹出式窗口和重定向

截图如下:

2.2.3 点击'批量打开',结果如下:

由上可知, 已经成功.

备注:

根绝个人电脑配置以及浏览器种类而定同时打开的超链接数.

这里:[作为参考]

同时开启200个tab, 是okay的.

cpu会瞬间升高, 但是稍后会降下来, 内存也会升高, 不会降下来.

//另外我这里仅仅是想执行请求, 并不是要得到响应结果,所以页面发出请求就可以关闭了.

方式二:使用爬虫获取超链接,后用循环执行打开超链接  //均使用脚本语言来处理, 即完全自己写代码来处理

php/python均可.

PHP实现

<?php

//1.数据文件[这里不是大文件]
$dataFile = dirname(__FILE__) . '/urls.txt';

//2.读取文件内容
$dataStr = file_get_contents($dataFile);

//3.清洗数据
$dataStr = preg_replace('/([\d]+-[\d]+\s)|(\r\n)/', ' ', $dataStr);
$dataArr = explode(' ', $dataStr);

//3.1 随机选取部分数据, 也可以做测试
shuffle($dataArr); //打乱
$dataArr = array_slice($dataArr, 0, 147);

//4.统计时间
$timeSum = 0;
$num = 0;
$dataTime = date('Y-m-d H:i:s', time());

//5.curl请求[循环,也可以同时发请求
$ch = curl_init();
foreach($dataArr as $url){
    if(!$url){
        continue;
    }
    curl_setopt($ch, CURLOPT_URL, trim($url));
    curl_setopt($ch, CURLOPT_HEADER, TRUE);
    curl_setopt($ch, CURLOPT_NOBODY, TRUE); // remove body[即不输出body,Will be fasters]
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
    curl_exec($ch);
    if(!curl_errno($ch)){
      $info = curl_getinfo($ch);
      $timeSum += $info['total_time'];
      $num++;
      //echo 'Took ' . $info['total_time'] . ' seconds to send a request to ' . $info['url'] . "\n\r";
    } else {
      echo 'Curl error: ' . curl_error($ch) .  " with $url \n\r";
    }
}
// $httpCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
// echo $httpCode;

echo $dataTime . ' Total took ' . $timeSum . ' seconds to send requests of ' . $num . ' urls' . "\n\r";

curl_close($ch);

邮件通知

// 提供个思路

暂时参见: Laravel 邮件_william_n的博客-CSDN博客_laravel 邮箱

实践TBD

定时脚本  // 用shell/Perl编写

shell脚本

Linux Crontab 定时任务 - 学习/实践_william_n的博客-CSDN博客  //Linux Crontab 定时任务

request_urls.sh

#!/bin/sh
cd ~/ningxiaofa/request_urls
php -q ./request_urls.php  >> ./request_urls.txt
fileSize=`ls -l  ./request_urls.txt | awk '{print $5}'`
if [ ${fileSize} -gt 51200 ]
then
     rm -rf  ./request_urls.txt
     touch ./request_urls.txts
fi

定时任务: //每31分钟执行一次

*/31 * * * * ~/crontab/request_urls.sh >> ~/ningxiaofa/request_urls.txt

修改后[将重定向输出写到shell脚本中]:

*/31 * * * * ~/crontab/request_urls.sh

最终结果:

定时脚本结果:

正常执行.

Note

这里因为会将echo 输出的内容重定向输出到request_urls.txt文本中, 可能时间长了之后, 文件较大,

建议在shell脚本中, 添加代码判断, 如果文件大小超过xxMB, 便删除该文件.然后重建文该文件[应不用TBD].

...

3.问题/补充

1.使用JavaScript能否正常实现功能? // 20201014 科学馆

TBD

4.参考

php curl批量打开网址(curl_multi类)的实现代码 -php教程-PHP中文网  //php curl批量打开网址(curl_multi类)的实现代码

在线工具大全 - 推荐_william_n的博客-CSDN博客_在线工具大全 //工具

网站链接抓取_在线批量获取网页链接工具_链接抓取  //提取超链接-在线工具
批量打开网址、网页、网站(网址、超链接批量打开工具,如何批量一键快速打开多个网站、网页)  //批量打开超链接-在线工具

Shell 编程 - 学习/实践_william_n的博客-CSDN博客 //Shell 编程

Shell脚本编写 - 学习/实践_william_n的博客-CSDN博客_shell脚本开发学习  //shell脚本编写思路

后续补充

...

批量获取/打开链接 - 实践相关推荐

  1. 批量采集html软件,在线批量获取网页链接工具 浏览器插件版-♚付涛纪实阁♚

    这两天在弄网站蜜蜂采集的时候,发现原来收藏的一个[在线批量获取网页链接工具]工具对应的网站已经不知道什么原因打不开了:在百度里面通过这个词去一搜索,一初搜索,看到百度结果里面拥有大量的匹配信息,但是经 ...

  2. 织梦批量获取文章链接

    织梦批量获取文章链接 自己做站上蜘蛛池获取文章链接,一个一个的点真的是太累了.查了好久发现织梦本身就有这个功能.去年教别人的时候,很快就找到了,今年自己用的时候找了好久,泪崩~~~所以将其写在博客中, ...

  3. 批量获取唯品会商品链接,详情页图片及视频保存技巧

    唯品会作为女性最爱逛的一个购物平台之一,深受大家的喜欢,于是很多商家纷纷入驻该平台,也有的人在里面开起了第二家.第三家店铺--其实以现在网络的发达性,我们早已可以用起辅助工具采集商品到店铺里,今天小编 ...

  4. 超囧的图片链接批量获取和下载

    以前在windows下经常去一些壁纸网站,或者是美女的QQ相册,又或者是一个激情美女图片网站下载图片,经常需要点击右键然后"另存为",要是遇见经典套图,这种重复的操作肯定会让你失去 ...

  5. 如何批量获取网页中的下载链接

    tips:下载 chrome json 正则表达式 如何批量获取网页中的下载链接 前言 打开你要下载的网页 二.获取网页的json数据 1.获取网页的源码 2.选取json 3.获取json字符串 4 ...

  6. python爬虫下载链接_【Python项目】简单爬虫批量获取资源网站的下载链接

    简单爬虫批量获取资源网站的下载链接 1 由来 自己在收集剧集资源的时候,这些网站的下载链接还要手动一个一个复制到百度云离线下载里,稍微懂了一点编程就不想做这种无意义的劳动了.于是就写了一个这样的一个小 ...

  7. pdf批量添加图章_给PDF批量添加文本链接

    为了进一步补充说明文件中的一些重要内容,PDF文件的创建者会为一些文本创建链接,方便阅读者访问相关的网站,获取更多的信息. 我们可以通过使用pdfFactory文本链接功能来实现以上需求,另外,我们还 ...

  8. Python 批量获取今日头条街拍美图

    大家好,在以前的文章中我们学了Ajax数据获取,这篇文章我们以今日头条为例,通过分析Ajax请求来抓取今日头条的街拍美图,并将图片下载到本地保存下来. 准备好没,我们现在开始!喜欢记得收藏.点赞.关注 ...

  9. Python根据域名批量获取IP地址和经纬度(2021.12.1)

    Python批量获取域名对应的IP地址和经纬度 1.DN.DNS.URL简介 1.1 域名 1.1.1 不同类型的域名 1.1.1.1 TLDs: Top-Level Domains 顶级域 1.1. ...

  10. python批量爬取小网格区域坐标系_Python爬虫实例_利用百度地图API批量获取城市所有的POI点...

    上篇关于爬虫的文章,我们讲解了如何运用Python的requests及BeautifuiSoup模块来完成静态网页的爬取,总结过程,网页爬虫本质就两步: 1.设置请求参数(url,headers,co ...

最新文章

  1. 在Windows上使用LaTeX
  2. Android开发:Handler的简单使用(一)
  3. 递归回溯最简单易懂的小例子
  4. .net odbc连接mysql数据库,下载安装MySQL数据库ODBC驱动和配置MySQL ODBC数据源
  5. jvm_垃圾收集算法讲解(一)
  6. 豆瓣9分,颠覆世界观的好书,每读一章就感叹一次:原来如此!(免费领)
  7. IDEA导入MySQL的jdbc驱动出现“java.lang.ClassNotFoundException: com.mysql.cj.jdbc.Driver”
  8. Tensorflow CTPN
  9. libcurl 发送邮件_libcurl smtp发送邮件附件大小限制问题
  10. python学习第七天--文件系统常用模块os,os.path,pickle
  11. linux 源代码gcc安装,linux下源码安装GCC
  12. Effective Java 思维导图
  13. ppt模板怎样用到html中,手把手教你怎么选用PPT模板
  14. 强联通分量:Tarjan缩点
  15. 蜜罐技术的初识以及HFish(开源蜜罐)的Docker搭建姿势
  16. 计算机专业在医院的工作,探析计算机在医院工作的应用
  17. 这下爽了,居然有人通过这个把Linux的命令提示符给整明白了
  18. 用计算机电脑怎么做ppt软件,电脑做ppt的软件叫什么
  19. 软件测试人员如何安稳度过企业试用期
  20. require.js的用法:

热门文章

  1. 看我如何抓取最新房价数据
  2. Boston波士顿房价数据下载
  3. WBE前端笔记1:HTML中一些不熟悉的标签
  4. CAPL函数 Test Node中注册事件(TestJoin xxx)函数
  5. 微信小程序笔记——处理小程序页面栈限制(小程序wx.navigateTo封装)
  6. 消灭WinRAR广告
  7. amtemu.v0.9.2-painter.exe百度网盘下载
  8. 方案展示 | 基于全志A40i的激光喷码机解决方案
  9. nxlog windows安装部署
  10. [培训-无线通信基础-6]:信道编码(分组码、卷积吗、Polar码、LDPC码、Turbo码)