PHP抓取页面中a标签的href属性值以及a中间内容
$str = file_get_contents($zh_cn_url);
$reg1='/<a href=\"(.*?)\".*?>(.*?)<\/a>/i';//匹配所有A标签
preg_match_all($reg1,$str,$aarray);
//这个$aarray 你可以打印一下看下你具体的业务需要哪个数组
//这个$aarray 是整个抓取的核心
$reg2="/href=\"([^\"]+)/";//获取href中的值
$arr = array();
for($i=1;$i<=3;$i++){
//这里讲一下我抓取的是前三个所以只需要 1=< i <=3就可以了
//如果想取出所有需要将for改为
//for($i=0;$i<count($aarray[0][$i]);$i++)
preg_match_all($reg2,$aarray[0][$i],$hrefarray);
$reg3="/>(.*)<\/a>/";//a标签中的内容
preg_match_all($reg3,$aarray[0][$i],$acontent);
$arr[$i]['title'] = $acontent[1][0];
$arr[$i]['url'] = $server_name.$hrefarray[1][0];
}
$data = array();
foreach ($arr as $key=>$val){
$data[] = $val;
}
//为什么还要用个foreach 在放进一个新的数组里 ,这里讲一下,为了迎合我的业务逻辑需要将该数组的内容变为
//array(
// array('title'=>'a中内容1','url'=>'href属性值1'),
// array('title'=>'a中内容2','url'=>'href属性值2'),
// array('title'=>'a中内容3','url'=>'href属性值3'),
// );
return $json = json_encode($data); //返回json格式当然你也可以返回数组,直接 return $data即可
PHP抓取页面中a标签的href属性值以及a中间内容相关推荐
- php怎么获取网页内的视频教程,PHP怎样用正则抓取页面中的网址
前言 链接也就是超级链接,是从一个元素(文字.图片.视频等)链接到另一个元素(文字.图片.视频等).网页中的链接一般有三种,一种是绝对URL超链接,也就是一个页面的完整路径:另一种是相对URL超链接, ...
- 将java类转换成jsp的例子_使用 动作可以在JSP页面中得到Bean实例的属性值,并将其转换为()_学小易找答案...
[单选题]下面哪个方法当服务器关闭时被调用,用来释放Servlet所占用的资源? [多选题]非处方药的遴选原则是( ). [单选题]主控制板与门机变频器有开门.关门命令.公共端,那么主控制板应该是() ...
- 网络爬虫初步:从一个入口链接开始不断抓取页面中的网址并入库
前言: 在上一篇<网络爬虫初步:从访问网页到数据解析>中,我们讨论了如何爬取网页,对爬取的网页进行解析,以及访问被拒绝的网站.在这一篇博客中,我们可以来了解一下拿到解析的数据可以做的事件. ...
- html中a标签的target属性值iframe
<a href="xxx.html" target="iframe">使用iframe调用xxx.html页面 </a> 通过targe ...
- vue中a标签的href属性的写法
问题:vue.js a标签href里有变量,函数拼接问题 2017年05月31日 19:19:03 阅读数:19486 正确格式: <a :href ="'http://search. ...
- 获取SVG文件中use标签xlink:href的值
如<svg class="icon" aria-hidden="true"><use xlink:href="#xueshengxi ...
- php 采集邮箱,采集邮箱的php代码(抓取网页中的邮箱地址)
采集邮箱的php代码(抓取网页中的邮箱地址) 复制代码 代码如下: $url='http://www.jb51.net'; //这个网页里绝对含有邮件地址. $content=file_get_con ...
- 抓取百度页面html,百度会抓取页面代码中的注释内容吗
百度会抓取页面代码中的注释内容吗 内容导读:百度会抓取页面代码中的注释内容吗?答案是百度会抓取,但是在提取正文的时候会直接忽略掉,也就是说页面代码的注释内容不会影响到页面质量,所以大家尽管放心. 问题 ...
- php正则获取li,用正则表达式抓取网页中的ul 和 li标签中最终的值!
获取你要抓取的页面 const string URL = "http://www.hn3ddf.gov.cn/price/GetList.html?pageno=1"; ...
最新文章
- “AI赋能,驱动未来”—— 2018中国人工智能峰会(南京)圆满落幕
- python自动化测试判断方法_python接口自动化测试之根据excel中的期望结果是否存在于请求返回的响应值中来判断用例是否执行成功...
- JVM运行时数据区分析
- dtrace-stap-book
- mysql与Pdo_PDO和MySQLi区别与选择?
- 万字总结webpack实战案例配置
- python time智能等待_Python Selenium智能等待
- C++笔记-using的进一步用法
- vue-router路由的使用
- 趣味项目—MyQQ机器人(二)关于python的pandas根据索引读写指定数据的方法实现签到功能
- java静态链表_Java数据结构-线性表之静态链表
- Classloader整理
- 2对应字母权限Linux,linux中文件权限的字母含义
- 计算机专业英语形成型考核册,电大资源网《人文英语3》形成性考核册作业题目和答案2018年...
- 手机耳机插入电脑没有反应
- 比较令人惊叹的FastDB和SQLite的RAMDISK内的性能对比
- linux下的hiredis的安装和使用(一)
- 2011推荐系统论坛游记:爱的反义词不是恨
- 手机图片怎么生成二维码?手机如何创建二维码?
- MYSQL的一知半解
热门文章
- 不懂不要炒股,一定要在调整时买入股票!
- face++旷世科技实习生面试
- 新上线APP如何推广提升排名
- java 进销存 crm websocket即时聊天发图片文字 好友群组 SSM源码
- Cannot deserialize instance of `com.xxx.project.biz.domain.xxx` out of START_ARRAY token;
- 《互动教程 for Photoshop CC》已成功发布在App Store
- 台式计算机连wifi,台式电脑怎么连wifi
- CSS3 实现3D特效
- vins estimator ProjectionFactor (Td) factor
- Vins-Mono系列代码和理论解读<五>.位姿图Pose_graph理论和代码实现细节