1、curl方式获取

<?php$a = 'http://www.888.com/123.html';
$ch = curl_init($a);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');
$f = curl_exec($ch);
echo $f;

地址:https://gitee.com/jianwicn/mixed/raw/master/taobao

2、file_get_contents获取

<?php$a = 'http://www.888.com/123.html';
$opts = array('http'=>array('method'=>"GET",'header'=>"Accept-language: zh-cn\r\n" ."User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; 4399Box.560; .NET4.0C; .NET4.0E)" ."Accept: *//*")
);
$ctx = stream_context_create($opts);
$x = file_get_contents($a,false,$ctx);
echo $x;

如果无法获取,需要开启allow_url_fopen参数,参考https://blog.csdn.net/sh2018/article/details/105756477

下载地址:https://gitee.com/jianwicn/mixed/raw/master/file_get_contents

更详细方法:http://www.farpay.cn/index.php/post/343.html

php爬取html内容,php抓取网页html,curl和file_get_contents通过get或post方式抓取网页内容,源代码相关推荐

  1. node.js request get 请求怎么拿到返回的数据_使用JS和NodeJS爬取Web内容

    作者 | Shenesh Perera译者 | 王强策划 | 李俊辰这些年来 Javascript 进步飞快,又引入了称为 NodeJS 的运行时,所以已经成为了最流行和使用最广泛的语言之一.不管你要 ...

  2. python爬取网页内容requests_[转][实战演练]python3使用requests模块爬取页面内容

    本文摘要: 1.安装pip 2.安装requests模块 3.安装beautifulsoup4 4.requests模块浅析 + 发送请求 + 传递URL参数 + 响应内容 + 获取网页编码 + 获取 ...

  3. python爬去新浪微博_Python爬虫爬取新浪微博内容示例【基于代理IP】

    Python爬虫爬取新浪微博内容示例[基于代理IP] 发布时间:2020-09-07 10:08:14 来源:脚本之家 阅读:120 本文实例讲述了Python爬虫爬取新浪微博内容.分享给大家供大家参 ...

  4. Python抓取视频内容

    Python抓取视频内容 Python 是一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年.Python语法简洁而清晰,具 ...

  5. python爬取微博文本_Python爬虫爬取新浪微博内容示例【基于代理IP】

    本文实例讲述了Python爬虫爬取新浪微博内容.分享给大家供大家参考,具体如下: 用Python编写爬虫,爬取微博大V的微博内容,本文以女神的微博为例(爬新浪m站:https://m.weibo.cn ...

  6. 如何轻松抓取网站内容?

    众所周知,互联网上的信息量庞大,而我们需要的却只是其中极少部分.如果手动查找这些信息,势必会耗费大量时间和精力.因此,抓取网站结构内容成为了一种高效获取所需信息的方式.本文将从以下8个方面逐步分析讨论 ...

  7. apache httpclient 工具类_Java教程分享使用HttpClient抓取页面内容

    Java教程分享使用HttpClient抓取页面内容,使用HttpClient工具来发送Http请求 1.简介 HttpClient 是 Apache Jakarta Common 下的子项目,用来提 ...

  8. 如何让搜索引擎抓取AJAX内容

    2019独角兽企业重金招聘Python工程师标准>>> 越来越多的网站,开始采用"单页面结构"(Single-page application). 整个网站只有一 ...

  9. queryList爬虫获取内容的几种方法总结 queryList给抓取的内容增加html追加元素html 代码实例...

    //简略内容: 1. $data1 = $ql->find('.two img')->map(function($item){return $item->alt; }); // 等价 ...

最新文章

  1. 9、MySQL中SQL语句的大小写规则
  2. uniapp h5页面 在移动端 使用clipboardone.js插件实现 写入剪切板 -- 安卓和ios安美适配(仅测试部分机型)
  3. C和指针之动态内存分配(读取范围在1和标准输入读取的size之前每个数据出现的次数)
  4. curl 增加header_libcurl增加HTTP header 和 POST之后获取返回数据
  5. python矩阵函数_NumPy 矩阵库函数
  6. SpringMVC(十三)异常注解
  7. c ++ helloworld
  8. TCP通信之获取本机IPV4地址
  9. java sort方法_Java排序方法sort用法详解
  10. 用Nginx作反向代理简单多了
  11. linux 韦恩图两个,如何使用R来绘制韦恩图(Venn Diagram)
  12. K8s 使用helm 安装 EFK和ELK分布式日志分析系统系列(es版本:6.7.0;)
  13. 联想式查单词-YourDict
  14. [运算放大器系列]二、电压转4 - 20MA电流电路分析
  15. 一文掌握大数据架构师需要具备的能力和格局
  16. 猪八戒网冲刺港交所:朱明跃已奋斗16年 年营收7.68亿
  17. Linux服务器搭建项目运行环境
  18. 圈的ramsey数研究
  19. 小程序源码:全新动态视频壁纸-多玩法安装简单
  20. 前端自学day04——css基础

热门文章

  1. Java接口和包(超详细)
  2. Optimizing radiotherapy plans for cancer treatment with Tensor Networks解读
  3. 【数据库实验】实验四 基于嵌入SQL的综合应用编程(基于QSqlTableModel实现)
  4. math_基本初等函数图型(幂函数/指数/对数/三角/反三角)
  5. C# asp.net 连接 Sql Server数据库 Timeout expired. 错误,怎么办?
  6. 【板栗糖GIS】CAD照片底色为黑色如何调整为白色
  7. poj 1129 四色原理DFS
  8. OpenCV中LBPH人脸识别器识别人脸实战(附Python源码)
  9. VuePress构建一个文档管理网站
  10. 【搜索算法】八数码问题的多种解法