php抓取网页数据header("Content-type: text/html; charset=utf-8");

//$url = "https://www.cnblogs.com/chenliyang/p/6554647.html";

//$html = file_get_contents($url);

如果出现中文乱码使用下面代码

$getcontent = iconv("gb2312", "utf-8",$html);

//echo "".$html.""; //获取整个内容

第一种 file_get_contents 抓取

file_get_contents() 把整个文件读入一个字符串中。

该函数是用于把文件的内容读入到一个字符串中的首选方法。如果服务器操作系统支持,还会使用内存映射技术来增强性能。$url = 'http://www.baidu.com'; //这儿填页面地址

$info=file_get_contents($url);

//preg_match('|

(.*?)|i',$info,$m);

$m1=preg_match('|

(.*?)|',$info,$m);

//var_dump($m1);

echo $m[1]; //获取标题

echo '
';

第二种 curl抓取,$url = "http://www.baidu.com";

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

$html = curl_exec($ch);

curl_close($ch);

$m1=preg_match('|

(.*?)|',$html,$ms);

//echo "".$html.""; //获取整个内容

//curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

echo $ms[1]; //获取标题

echo '
';

更多相关知识,请访问 PHP中文网!!

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

php如何抓取网页内容,php如何抓取网页数据?相关推荐

  1. 爬虫爬取黑马程序员论坛的网页数据

    #引入requests库 import requests #根据url发起请求,获取服务器响应文件 url:待抓取的url def load_page(url):#这里的请求头header可以是任意一 ...

  2. ASP.NET 抓取网页内容

    (转)ASP.NET 抓取网页内容 ASP.NET 抓取网页内容-文字 ASP.NET 中抓取网页内容是非常方便的,而其中更是解决了 ASP 中困扰我们的编码问题. 需要三个类:WebRequest. ...

  3. cookie追加数据_集算器 SPL 抓取网页数据

    [摘要] 集算器 SPL 支持抓取网页数据,根据抓取定义规则,可将网页数据下载到在本地进行统计分析.具体定义规则要求.使用详细情况,请前往乾学院:集算器 SPL 抓取网页数据! 网站上的数据源是我们进 ...

  4. java socket抓取资源_Java 通过 Socket 的形式抓取网页内容

    package com.hmw.net; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.IO ...

  5. Asp.Net 之 抓取网页内容

    一.获取网页内容--html ASP.NET 中抓取网页内容是非常方便的,而其中更是解决了 ASP 中困扰我们的编码问题. 需要三个类:WebRequest.WebResponse.StreamRea ...

  6. python beautifulsoup抓取网页内容_利用Python和Beautiful Soup抓取网页内容

    利用Python和Beautiful Soup抓取网页内容 Posted on 2012-08-09 00:08 SamWei 阅读(381) 评论(1) 编辑 收藏 Python 3中提供了url打 ...

  7. php 抓取页面图片,php 抓取网页内容与图片的方法

    这篇文章主要介绍了关于php 抓取网页内容与图片的方法,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 例子1:<?php include_once("curl.php& ...

  8. ASP.NET抓取网页内容

    原文:ASP.NET抓取网页内容 一.ASP.NET 使用HttpWebRequest抓取网页内容 这种方式抓取某些页面会失败 不过,有时候我们会发现,这个程序在抓取某些页面时,是获不到所需的内容的, ...

  9. php 抓取网页内容与图片

    例子1: <?phpinclude_once("curl.php");/*这个文件要自己配置好*/header("content-type:text/html;ch ...

最新文章

  1. 【Mysql】Mysql root 权限下无法创建数据库
  2. vonic 安装的坑
  3. matlab搜索路径
  4. 全球及中国4-氨基-3-硝基苯酚行业前景趋势与投资规模格局报告2022版
  5. DictVectorizer中的fit_transform
  6. react学习(28)---react中componentWillReceiveProps
  7. LeetCode 1733. 需要教语言的最少人数(哈希+枚举)
  8. java打印结果横向排列_Java8排列组合(6行代码实现)
  9. 首发天玑1200!Redmi电竞旗舰首曝:电池容量或超4500mAh
  10. 【写作技巧】毕业论文的目录和正文有什么讲究?
  11. 远程桌面/远程登陆中强行登陆(他人退出)与切换回话(登陆后切换到上次别的登陆)3389...
  12. 面试字节、阿里等大厂后,总结了今年的 Java 面试必问的微服务面试题(含答案)
  13. Vue warn 屏蔽
  14. php 句号,句号 - Programming Life - PHP博客
  15. Vue+H5 活动内容调用微信分享
  16. idea 一次启动多服务配置
  17. CCNA+NP学习笔记—交换网络篇
  18. anki server 错误与解决
  19. GIS教程之Cesium 基础入门教程
  20. 计算机工程学院文艺例会,西航职院 | 计算机工程学院 2019年度学生会干部第一次例会...

热门文章

  1. python中bs4_python bs4库
  2. SpringBoot的@SpringBootApplication注解和其他几个注解
  3. Python网络爬虫从入门到实践 -- chapter 1 -- 网络爬虫入门
  4. hdu 4588 Count The Carries 南京邀请赛
  5. 【解题报告】Leecode 859. 亲密字符串——Leecode每日一题系列
  6. 【已解决】Error occurred during loading data. Trying to use cache server_Python系列学习笔记
  7. HashMap中hash函数怎么是实现的?
  8. DBSAN密度聚类算法
  9. Linux系统安全与应用(二)——安全机制、安全控制、弱口令检测JR、网络扫描NMAP和控制台命令Netstat
  10. 国内网站安全测试6大步骤