PHP抓取某页面指定内容
初学php研究了好几个小时最后问了同事,得以解决;下面我就以我网站的一个详情页为例子,给大家分享一下:
直接贴代码,注释写的很清楚了

【方法一】

<?php
//添加编码格式,防止乱码
header("content-type:text/html;charset=utf-8");
//请求头
header('Access-Control-Allow-Origin:*');//取得指定地址的內容,储存至text
$text=file_get_contents('http://www.machi-machi.com/news/57.html');//取得所有img标签,储存至二维数组match   preg_match_all('/<div class="showContxt">(.*?)<\/div>/is', $text, $match);   //打印出match
print_r($match[0][0]); exit;
?>

【方法二】(CURL效率更高,推荐)

<?php//目标URL$url = 'https://xueqiu.com/P/ZH2524355'; //取得指定地址的內容,储存至webdata $webdata = curlGet($url);var_dump($webdata);//添加编码格式,防止乱码header("content-type:text/html;charset=utf-8");//请求头header('Access-Control-Allow-Origin:*');//取得所有img标签,储存至二维数组match//preg_match_all('/<div class="showContxt">(.*?)<\/div>/is', $text, $match);preg_match_all('/SNB\.cubeInfo = (.*?);/is', $webdata, $match); //打印出matchprint_r($match[0][0]); exit;?>

PHP抓取网页指定内容(推荐用CURL效率更高)相关推荐

  1. python爬虫搜特定内容的论文_python基于BeautifulSoup实现抓取网页指定内容的方法...

    python基于BeautifulSoup实现抓取网页指定内容的方法 更新时间:2015年07月09日 10:12:50 作者:光索与诺 这篇文章主要介绍了python基于BeautifulSoup实 ...

  2. PHP:抓取网页指定内容

    效果图 代码 <?php $url = "http://要抓取的网页"; $contents = file_get_contents($url); //如果出现中文乱码使用下 ...

  3. php正则抓取网页指定内容,php正则匹配获取指定url网页页面超级链接地址与抓取指定页面内容方法...

    在数据采集与页面分析中,常需要抓取给定url页面的内容,或者第二.第三层次深度页面内容. 这里是一个测试例子的实现,仅供参考. /* 匹配给定页面链接 return:array match[link, ...

  4. PHP抓取网页指定文章标题

    PHP抓取网页指定文章标题 提示:这里可以添加本文要记录的大概内容: 例如:我们想要读取网页,某个栏目下文章的标题以及超链接导入我们自己的网站 二.使用步骤 1.读入数据 代码如下(示例): < ...

  5. php抓取网指定内容,php获取网页内容方法总结

    抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容,至于如何用正则表达式过滤,在这里就不做介绍了,有兴趣的,以下就是几种常用的用php抓取网页中的内容的方法. 1.file_get_conte ...

  6. python抓取html中特定的数据库,Python抓取网页中内容,正则分析后存入mysql数据库...

    firefox+httpfox可以查看post表单 首先在http://www.renren.com/这个地址输入用户名和密码, 输入用户名和密码之后post到下面这个网址: http://www.r ...

  7. java抓取网页标题内容_[Java教程]java 网页页面抓取标题和正文

    [Java教程]java 网页页面抓取标题和正文 0 2014-07-10 09:01:30 import java.io.BufferedReader;import java.io.IOExcept ...

  8. java使用爬虫工具jsoup实现抓取网页的内容及图片并写入到word文档中

    背景: 有个朋友最近让帮忙写个小功能,需求大概是,1万个链接,让爬每个链接中的某一段文章并附一张图片,每五个链接写入到一个word文档中. 基本思路,就是先去找个爬虫框架把链接网页中内容和图片写到wo ...

  9. java网页爬虫xml_基于webmagic的java网页爬虫,抓取网页指定节点,然后使用dom4j分析xml数据...

    /* * Android数据存储之SharedPreferences * 步骤: * 一.根据Context获取SharedPreferences对象 * 二.利用edit()方法获取Editor对象 ...

最新文章

  1. mysql 查看表结构,字段的基本信息(简单明了)。
  2. 安全攻防实战:使用winlogonhack获取系统密码
  3. php函数默认参数不传值报错,php 关于函数参数的默认值
  4. Hibernate 二级缓存使用
  5. 20165301 预备作业三:Linux安装及命令入门
  6. python3中的编码与解码
  7. C++word break断字(基于单词或字符串)(附完整源码)
  8. 软件设计模式—控制反转
  9. C中静态存储区和动态存储区
  10. java保存图书每日的交易记录
  11. 季节性的分析才不简单,小心不要在随机数据中也分析出季节性...
  12. XCAP发包工具的使用
  13. springboot跨域处理
  14. 户籍管理系统php,vue实现户籍管理系统的实例解析
  15. edem合成运动教程
  16. Nginx系列 (1)--Nginx安装升级打补丁
  17. 2022年建筑架子工(建筑特殊工种)考试资料及建筑架子工(建筑特殊工种)新版试题
  18. 施努卡:机器视觉尺寸检测(机器视觉表面缺陷检测)
  19. 前端面试:经典面试题Foo与getName()
  20. 网易5天python编程课_网易云课堂上自学编程?

热门文章

  1. C++实现停车场管理系统
  2. 发电机是根据电磁感应原理运行的,属于感应电机的一种,感应电机包括电动机和发电机;
  3. springboot内嵌Tomcat启动失败
  4. 未来你家的机器人,很有可能产自这家公司
  5. C++中的结构体排序
  6. 2019年终总结-埋下的种子是讲给自己的故事
  7. Synchronized的原理及自旋锁,偏向锁,轻量级锁,重量级锁的区别
  8. halcon partion_dynamic 区域等宽分割
  9. 秋招面试总结:Java+并发+Spring+MySQL+分布式+Redis+算法+JVM等,太香了~
  10. JavaScipt设计模式初探-代理模式(三) 虚拟代理