PHP抓取网页指定内容(推荐用CURL效率更高)
PHP抓取某页面指定内容
初学php研究了好几个小时最后问了同事,得以解决;下面我就以我网站的一个详情页为例子,给大家分享一下:
直接贴代码,注释写的很清楚了
【方法一】
<?php
//添加编码格式,防止乱码
header("content-type:text/html;charset=utf-8");
//请求头
header('Access-Control-Allow-Origin:*');//取得指定地址的內容,储存至text
$text=file_get_contents('http://www.machi-machi.com/news/57.html');//取得所有img标签,储存至二维数组match preg_match_all('/<div class="showContxt">(.*?)<\/div>/is', $text, $match); //打印出match
print_r($match[0][0]); exit;
?>
【方法二】(CURL效率更高,推荐)
<?php//目标URL$url = 'https://xueqiu.com/P/ZH2524355'; //取得指定地址的內容,储存至webdata $webdata = curlGet($url);var_dump($webdata);//添加编码格式,防止乱码header("content-type:text/html;charset=utf-8");//请求头header('Access-Control-Allow-Origin:*');//取得所有img标签,储存至二维数组match//preg_match_all('/<div class="showContxt">(.*?)<\/div>/is', $text, $match);preg_match_all('/SNB\.cubeInfo = (.*?);/is', $webdata, $match); //打印出matchprint_r($match[0][0]); exit;?>
PHP抓取网页指定内容(推荐用CURL效率更高)相关推荐
- python爬虫搜特定内容的论文_python基于BeautifulSoup实现抓取网页指定内容的方法...
python基于BeautifulSoup实现抓取网页指定内容的方法 更新时间:2015年07月09日 10:12:50 作者:光索与诺 这篇文章主要介绍了python基于BeautifulSoup实 ...
- PHP:抓取网页指定内容
效果图 代码 <?php $url = "http://要抓取的网页"; $contents = file_get_contents($url); //如果出现中文乱码使用下 ...
- php正则抓取网页指定内容,php正则匹配获取指定url网页页面超级链接地址与抓取指定页面内容方法...
在数据采集与页面分析中,常需要抓取给定url页面的内容,或者第二.第三层次深度页面内容. 这里是一个测试例子的实现,仅供参考. /* 匹配给定页面链接 return:array match[link, ...
- PHP抓取网页指定文章标题
PHP抓取网页指定文章标题 提示:这里可以添加本文要记录的大概内容: 例如:我们想要读取网页,某个栏目下文章的标题以及超链接导入我们自己的网站 二.使用步骤 1.读入数据 代码如下(示例): < ...
- php抓取网指定内容,php获取网页内容方法总结
抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容,至于如何用正则表达式过滤,在这里就不做介绍了,有兴趣的,以下就是几种常用的用php抓取网页中的内容的方法. 1.file_get_conte ...
- python抓取html中特定的数据库,Python抓取网页中内容,正则分析后存入mysql数据库...
firefox+httpfox可以查看post表单 首先在http://www.renren.com/这个地址输入用户名和密码, 输入用户名和密码之后post到下面这个网址: http://www.r ...
- java抓取网页标题内容_[Java教程]java 网页页面抓取标题和正文
[Java教程]java 网页页面抓取标题和正文 0 2014-07-10 09:01:30 import java.io.BufferedReader;import java.io.IOExcept ...
- java使用爬虫工具jsoup实现抓取网页的内容及图片并写入到word文档中
背景: 有个朋友最近让帮忙写个小功能,需求大概是,1万个链接,让爬每个链接中的某一段文章并附一张图片,每五个链接写入到一个word文档中. 基本思路,就是先去找个爬虫框架把链接网页中内容和图片写到wo ...
- java网页爬虫xml_基于webmagic的java网页爬虫,抓取网页指定节点,然后使用dom4j分析xml数据...
/* * Android数据存储之SharedPreferences * 步骤: * 一.根据Context获取SharedPreferences对象 * 二.利用edit()方法获取Editor对象 ...
最新文章
- mysql 查看表结构,字段的基本信息(简单明了)。
- 安全攻防实战:使用winlogonhack获取系统密码
- php函数默认参数不传值报错,php 关于函数参数的默认值
- Hibernate 二级缓存使用
- 20165301 预备作业三:Linux安装及命令入门
- python3中的编码与解码
- C++word break断字(基于单词或字符串)(附完整源码)
- 软件设计模式—控制反转
- C中静态存储区和动态存储区
- java保存图书每日的交易记录
- 季节性的分析才不简单,小心不要在随机数据中也分析出季节性...
- XCAP发包工具的使用
- springboot跨域处理
- 户籍管理系统php,vue实现户籍管理系统的实例解析
- edem合成运动教程
- Nginx系列 (1)--Nginx安装升级打补丁
- 2022年建筑架子工(建筑特殊工种)考试资料及建筑架子工(建筑特殊工种)新版试题
- 施努卡:机器视觉尺寸检测(机器视觉表面缺陷检测)
- 前端面试:经典面试题Foo与getName()
- 网易5天python编程课_网易云课堂上自学编程?
热门文章
- C++实现停车场管理系统
- 发电机是根据电磁感应原理运行的,属于感应电机的一种,感应电机包括电动机和发电机;
- springboot内嵌Tomcat启动失败
- 未来你家的机器人,很有可能产自这家公司
- C++中的结构体排序
- 2019年终总结-埋下的种子是讲给自己的故事
- Synchronized的原理及自旋锁,偏向锁,轻量级锁,重量级锁的区别
- halcon partion_dynamic 区域等宽分割
- 秋招面试总结:Java+并发+Spring+MySQL+分布式+Redis+算法+JVM等,太香了~
- JavaScipt设计模式初探-代理模式(三) 虚拟代理