跳至<?php

/**

*

* @authors HG (hg0728@qq.com)

* @date 2015-05-22 17:00:48

* @version 1.0

*/

header("Content-type:text/html;charset=utf-8");

function getCurl($url) {

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);

curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);

$result = curl_exec($ch);

curl_close($ch);

return $result;

}

function preg_list($str){//从curl获得指定内容

$regex = '/(.*?)/';

$isMatched = preg_match_all($regex, $str, $matches);

for ($i=0; $i < $isMatched; $i++) {

$str = $matches[1][$i] .' '. $matches[2][$i];

echo $matches[1][$i];

file_put_contents('blogs.txt', $str. "\n", FILE_APPEND);

}

}

for ($i=0; $i < 201; $i++) { //翻页抓取

if($i==0){

$url = 'http://www.cnblogs.com/';

$str = getCurl($url);

}

else {

$url = 'http://www.cnblogs.com/sitehome/p/'.$i;

$str = getCurl($url);

}

preg_list($str);

}

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

php文章列表源码,抓取文章列表相关推荐

  1. uni-app云开发的网盘助手微信小程序源码抓取网盘资源引流好助手

    uni-app云开发的网盘助手微信小程序源码抓取网盘资源引流好助手 这是一款uni-app开发的一款网盘小助手小程序源码 该源码主要用于用户输入关键词然后全网抓取百度网盘资源内容 另外呢该小程序还可以 ...

  2. 爬去微信小程序服务器代码,微信小程序反编译及源码抓取(2021最新)

    网易 Mumu 模拟器安装 下载完安装包后直接安装 打开模拟器 安装 微信.RE文件管理器 设置Root 权限 打开 RE文件管理器,提示请求超级用户访问权限,选择允许 到此准备工作完成. 打开微信, ...

  3. 微信小程序反编译及源码抓取(2021最新)

    网易 Mumu 模拟器安装 下载地址: http://mumu.163.com/360/ 下载完安装包后直接安装 打开模拟器 安装 微信.RE文件管理器 设置Root 权限 打开 RE文件管理器,提示 ...

  4. 网站源码抓取css.html.jss,javascript-使用WWW :: Mechanize :: Chrome使用Chrome / Chromium从服务器获取“原始” jss和css代码...

    我正在尝试使用WWW :: Mechanize :: Chrome浏览器下载css / js文件.是的,还有其他获取文件的方法.但是我的要求是使用WWW :: Mechanize :: Chrome来 ...

  5. TiDB 源码阅读系列文章(十五)Sort Merge Join

    2019独角兽企业重金招聘Python工程师标准>>> 什么是 Sort Merge Join 在开始阅读源码之前, 我们来看看什么是 Sort Merge Join (SMJ),定 ...

  6. DM 源码阅读系列文章(二)整体架构介绍

    2019独角兽企业重金招聘Python工程师标准>>> 作者:张学程 本文为 DM 源码阅读系列文章的第二篇,第一篇文章 简单介绍了 DM 源码阅读的目的和规划,以及 DM 的源码结 ...

  7. TiDB 源码阅读系列文章(十九)tikv-client(下)

    上篇文章 中,我们介绍了数据读写过程中 tikv-client 需要解决的几个具体问题,本文将继续介绍 tikv-client 里的两个主要的模块--负责处理分布式计算的 copIterator 和执 ...

  8. MyBatis 源码分析系列文章合集

    1.简介 我从七月份开始阅读MyBatis源码,并在随后的40天内陆续更新了7篇文章.起初,我只是打算通过博客的形式进行分享.但在写作的过程中,发现要分析的代码太多,以至于文章篇幅特别大.在这7篇文章 ...

  9. MyBatis 源码分析系列文章导读

    1.本文速览 本篇文章是我为接下来的 MyBatis 源码分析系列文章写的一个导读文章.本篇文章从 MyBatis 是什么(what),为什么要使用(why),以及如何使用(how)等三个角度进行了说 ...

  10. Spring IOC 容器源码分析系列文章导读

    1. 简介 前一段时间,我学习了 Spring IOC 容器方面的源码,并写了数篇文章对此进行讲解.在写完 Spring IOC 容器源码分析系列文章中的最后一篇后,没敢懈怠,趁热打铁,花了3天时间阅 ...

最新文章

  1. 不再使用快捷方式打开电脑软件!如何Windows+r 来打开一个你想要打开的软件软件?
  2. php管理txt文件系统,PHP文件系统管理详解
  3. Linux Shell 下载网站指定文件
  4. Linux常用命令—权限管理命令—其他权限管理命令
  5. xml-apis-ext.jar
  6. 剑指 Offer II 070. 排序数组中只出现一次的数字
  7. aspose转pdf不显示中文_word转pdf,迫不得已服务器从linux换成了windows,不完美的完美...
  8. Linux重启提示A stop job is running for ...
  9. 火狐 ajax提交失败,Firefox下AJAX0x80040111错误的解决方法
  10. 如何打开剪贴板查看器?
  11. Ubuntu 20.04 双系统安装过程(新手)
  12. 官网Tomcat下载方法
  13. RPA之家直播公开课
  14. 斐波那契数列 Java实现
  15. 这个简笔画很值得学,哄小孩必备
  16. 删除无限创建的子文件夹
  17. 以太坊ETH源码分析(1):地址生成过程
  18. 每周一计-自己动手做的电源
  19. 2019年最新中文TTS算法实现个合成样本
  20. 设置暴风影音缓存文件夹位置的方法

热门文章

  1. MSSQL 同步两个数据库的示例
  2. python写入日志文件时日志内容重复写入
  3. bzoj 2969: 矩形粉刷 概率期望
  4. oc快速生成单例头文件解析
  5. C++重载箭头操作符的理解--c++primer这里有错误
  6. java 句柄无效_sql报句柄无效。 (异常来自 HRESULT:0x80070006 (E_HANDLE))
  7. fbeta_socre使用
  8. QQ帐户的申请与登陆 (25 分)(map映射)
  9. linux7关闭开机自启,redhat7 设置开机自启
  10. caffe---验证码识别