本文介绍simple_html_dom,就是用来处理网页,可以写爬虫抓取信息;

背景:在项目中获得一个很长的html标签的长字符串,需要解析到里面所有的标签的的src地址;

用正则匹配来做比较麻烦,在朋友的推荐下使用simple_html_dom非常方便,

这个组件不光可以解析字符串,也可以直接传入文件地址和网页url;

下面举例:

<?php
$content = '';//html内容//
header("Content-type: text/html; charset=utf-8");
include('simple_html_dom.php');
$html = new simple_html_dom();
$html->load($content);
$img = $html->find('img');
foreach ($img as $value) { $src[] = $value->getAttribute('data-src');  //获取自定义属性要用getAttribute,否则无法取到
}
echo "<pre>";
var_dump($src);
echo "</pre>";
复制代码
  1. 首先要引入simple_html_dom库。git地址:github.com/samacs/simp…

  2. 参照git里面的例子使用

  3. 中文文档:microphp.us/plugins/pub…

php解析html类库simple_html_dom相关推荐

  1. php html转dom,PHP解析html类库simple_html_dom的转码bug

    这几天有在用simple_html_dom抓一些文章.不同网站的编码在国内基本上是gbk gb2312 utf-8.而以gb2312和utf-8居多. 我这一版的simple_html_dom有一个方 ...

  2. Java如何解析markdown_Java类库解析markdown文本

    Java类库解析markdown文本 朋也社区之前使用的方法是,在java代码里调用js,然后通过调用js里的方法来解析markdown的,但性能太渣,然后在github上找了找,发现 pegdown ...

  3. simple_html_dom(入门实例)

    php解析html类库simple_html_dom 本猪刚开始要做到一个月更一次博,毕竟自己也处于学习阶段,遇到好的例子在这里总结分享.今天要分享的是simple_html_dom,个人理解就是在p ...

  4. 在.net中运用HTMLParser解析网页的原理和方法

    本文介绍了.net 版的一个HTMLParser网页解析开源类库(Winista.HTMLParser)的功能特性.工作原理和使用方法.对于使用.net进行Web信息提取的开发人员进行了一次HTMLP ...

  5. 还在重复造轮子?Java开发人员必知必会的20种常用类库和API

    介绍 一个有经验的Java开发人员特征之一就是善于使用已有的轮子来造车.<Effective Java>的作者Joshua Bloch曾经说过:"建议使用现有的API来开发,而不 ...

  6. Java 必知必会的 20 种常用类库和 API

    点击上方 好好学java ,选择 星标 公众号 重磅资讯.干货,第一时间送达 今日推荐:为什么程序员都不喜欢使用switch,而是大量的 if--else if ?个人原创+1博客:点击前往,查看更多 ...

  7. Java 开发人员必知必会的 20 种常用类库和 API

    一.日志相关类库 日志库是很常见的,因为你在每一个项目中都需要他们.打印日志是服务器端应用中最重要的事情,因为日志是你了解你的程序发生了什么的唯一途径.尽管JDK附带自己的日志库,但是还是有很多更好的 ...

  8. iOS中XML解析汇总

    在时间上TBXML占优,libxml2支持了边下载边解析. 来源:http://www.codeios.com/forum.php?mod=viewthread&tid=9880&hi ...

  9. IOS学习:常用第三方库(GDataXMLNode:xml解析库)

    IOS学习:常用第三方库(GDataXMLNode:xml解析库) 解析 XML 通常有两种方式,DOM 和 SAX: DOM解析XML时,读入整个XML文档并构建一个驻留内存的树结构(节点树),通过 ...

最新文章

  1. 【从零开始的ROS四轴机械臂控制】(七)- ROS与arduino连接
  2. 雷军大秀新宠「铁蛋」!打滚握手会空翻,这个机器狗只要9999
  3. 使用postman模拟登录请求
  4. python中组合框_PyQt 组合框
  5. 细品慢酌QuickTest关键视图(4)
  6. 坐拥12亿月活流量,腾讯直播带货的底牌
  7. C# 时时监听目录文件改动
  8. [51单片机] 串口通讯 简单通信
  9. 台达b2伺服modbus通讯_台达伺服ASDA-B2使用手册-简体最新.pdf
  10. 执行Jar包报错FileNotFoundException: /home/data/t.txt (Too many open files)以及Cannot run program “/bin/bash
  11. Qt关于connect和拉姆达表达式
  12. 国王、总统、首相、总理……京城第一饭店的40春秋 | 美通社头条
  13. ug998逻辑思维导图
  14. 使用NetMHCpan进行肿瘤新抗原预测分析
  15. 如何批量查询快递的签收状态?
  16. rust外服靶场怎么进_rust 学习之旅一, rust编程环境相关
  17. 山东大学 计算机人工智能2019级 认知科学与类脑计算 期末考试
  18. AMPL IDE语法整理
  19. python小论文范文3000字_完整的论文范文3000字
  20. ibm服务器x3650m4引导,IBM X3650 M4安装win 2008 Server操作指南

热门文章

  1. Mybatis-入门
  2. mysql命令集合,MySql常用命令集合
  3. java jdom格式_Java全面解析XML格式串(JDOM解析)
  4. c++:MFC _cstring.h库常用函数
  5. 【每周NLP论文推荐】 NLP中命名实体识别从机器学习到深度学习的代表性研究
  6. 【知识星球】数据集板块重磅发布,海量数据集介绍与下载
  7. 中国无烟煤市场需求规模与未来发展形势分析报告2022版
  8. 中国中医药产业未来投资规划与前景风险预测报告2022-2027年版
  9. 从玉农业蔬菜标准化-林裕豪:致力食品安全和质量管理体系
  10. Go 转义字符及风格