php文章列表源码,抓取文章列表
跳至<?php
/**
*
* @authors HG (hg0728@qq.com)
* @date 2015-05-22 17:00:48
* @version 1.0
*/
header("Content-type:text/html;charset=utf-8");
function getCurl($url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
$result = curl_exec($ch);
curl_close($ch);
return $result;
}
function preg_list($str){//从curl获得指定内容
$regex = '/(.*?)/';
$isMatched = preg_match_all($regex, $str, $matches);
for ($i=0; $i < $isMatched; $i++) {
$str = $matches[1][$i] .' '. $matches[2][$i];
echo $matches[1][$i];
file_put_contents('blogs.txt', $str. "\n", FILE_APPEND);
}
}
for ($i=0; $i < 201; $i++) { //翻页抓取
if($i==0){
$url = 'http://www.cnblogs.com/';
$str = getCurl($url);
}
else {
$url = 'http://www.cnblogs.com/sitehome/p/'.$i;
$str = getCurl($url);
}
preg_list($str);
}
本文原创发布php中文网,转载请注明出处,感谢您的尊重!
php文章列表源码,抓取文章列表相关推荐
- uni-app云开发的网盘助手微信小程序源码抓取网盘资源引流好助手
uni-app云开发的网盘助手微信小程序源码抓取网盘资源引流好助手 这是一款uni-app开发的一款网盘小助手小程序源码 该源码主要用于用户输入关键词然后全网抓取百度网盘资源内容 另外呢该小程序还可以 ...
- 爬去微信小程序服务器代码,微信小程序反编译及源码抓取(2021最新)
网易 Mumu 模拟器安装 下载完安装包后直接安装 打开模拟器 安装 微信.RE文件管理器 设置Root 权限 打开 RE文件管理器,提示请求超级用户访问权限,选择允许 到此准备工作完成. 打开微信, ...
- 微信小程序反编译及源码抓取(2021最新)
网易 Mumu 模拟器安装 下载地址: http://mumu.163.com/360/ 下载完安装包后直接安装 打开模拟器 安装 微信.RE文件管理器 设置Root 权限 打开 RE文件管理器,提示 ...
- 网站源码抓取css.html.jss,javascript-使用WWW :: Mechanize :: Chrome使用Chrome / Chromium从服务器获取“原始” jss和css代码...
我正在尝试使用WWW :: Mechanize :: Chrome浏览器下载css / js文件.是的,还有其他获取文件的方法.但是我的要求是使用WWW :: Mechanize :: Chrome来 ...
- TiDB 源码阅读系列文章(十五)Sort Merge Join
2019独角兽企业重金招聘Python工程师标准>>> 什么是 Sort Merge Join 在开始阅读源码之前, 我们来看看什么是 Sort Merge Join (SMJ),定 ...
- DM 源码阅读系列文章(二)整体架构介绍
2019独角兽企业重金招聘Python工程师标准>>> 作者:张学程 本文为 DM 源码阅读系列文章的第二篇,第一篇文章 简单介绍了 DM 源码阅读的目的和规划,以及 DM 的源码结 ...
- TiDB 源码阅读系列文章(十九)tikv-client(下)
上篇文章 中,我们介绍了数据读写过程中 tikv-client 需要解决的几个具体问题,本文将继续介绍 tikv-client 里的两个主要的模块--负责处理分布式计算的 copIterator 和执 ...
- MyBatis 源码分析系列文章合集
1.简介 我从七月份开始阅读MyBatis源码,并在随后的40天内陆续更新了7篇文章.起初,我只是打算通过博客的形式进行分享.但在写作的过程中,发现要分析的代码太多,以至于文章篇幅特别大.在这7篇文章 ...
- MyBatis 源码分析系列文章导读
1.本文速览 本篇文章是我为接下来的 MyBatis 源码分析系列文章写的一个导读文章.本篇文章从 MyBatis 是什么(what),为什么要使用(why),以及如何使用(how)等三个角度进行了说 ...
- Spring IOC 容器源码分析系列文章导读
1. 简介 前一段时间,我学习了 Spring IOC 容器方面的源码,并写了数篇文章对此进行讲解.在写完 Spring IOC 容器源码分析系列文章中的最后一篇后,没敢懈怠,趁热打铁,花了3天时间阅 ...
最新文章
- 不再使用快捷方式打开电脑软件!如何Windows+r 来打开一个你想要打开的软件软件?
- php管理txt文件系统,PHP文件系统管理详解
- Linux Shell 下载网站指定文件
- Linux常用命令—权限管理命令—其他权限管理命令
- xml-apis-ext.jar
- 剑指 Offer II 070. 排序数组中只出现一次的数字
- aspose转pdf不显示中文_word转pdf,迫不得已服务器从linux换成了windows,不完美的完美...
- Linux重启提示A stop job is running for ...
- 火狐 ajax提交失败,Firefox下AJAX0x80040111错误的解决方法
- 如何打开剪贴板查看器?
- Ubuntu 20.04 双系统安装过程(新手)
- 官网Tomcat下载方法
- RPA之家直播公开课
- 斐波那契数列 Java实现
- 这个简笔画很值得学,哄小孩必备
- 删除无限创建的子文件夹
- 以太坊ETH源码分析(1):地址生成过程
- 每周一计-自己动手做的电源
- 2019年最新中文TTS算法实现个合成样本
- 设置暴风影音缓存文件夹位置的方法
热门文章
- MSSQL 同步两个数据库的示例
- python写入日志文件时日志内容重复写入
- bzoj 2969: 矩形粉刷 概率期望
- oc快速生成单例头文件解析
- C++重载箭头操作符的理解--c++primer这里有错误
- java 句柄无效_sql报句柄无效。 (异常来自 HRESULT:0x80070006 (E_HANDLE))
- fbeta_socre使用
- QQ帐户的申请与登陆 (25 分)(map映射)
- linux7关闭开机自启,redhat7 设置开机自启
- caffe---验证码识别