php通过simple_html_dom实现抓取网页内容,获取核心网页数据,将网页数据写入本地 xxx.json 文件

其代码实现逻辑:

1. 引入simple_html_dom.php文件

 require_once 'simple_html_dom-master/simple_html_dom.php';

2. 获取远程或者本地html文件

$html = file_get_html('./imooc.html');

3. 创建要获取数据的数组

    $cases =  Array();$arrImg = Array();

4. 获取当前网页所有案例图片、标题、观看人数、等级、价格

      foreach($html->find('.shizhan-course-wrap') as $element) {$arrImg['img']  =  "http:".$element->find('.shizhan-course-img',0)->src;$arrImg['intro']  =  $element->find('.shizan-name',0)->plaintext;$arrImg['degree']  =  $element->find('.grade',0)->plaintext;$arrImg['views']  =  $element->find('.shizhan-info>span',1)->plaintext;$arrImg['desc']  =  $element->find('p.shizan-desc',0)->plaintext;$arrImg['price']  =  $element->find('div.course-card-price',0)->plaintext;$arrImg['link']  =  "http://coding.imooc.com".$element->find('a',0)->href;$cases[] = $arrImg;}

5. 生成json格式,写入本地文件imooc.json

    $json = json_encode($cases);file_put_contents('imooc.json', $json);

6. 通过其他html页面ajax调用本地json文件

~function(){function ajax(url,fn){var xhr = new XMLHttpRequest();xhr.open('get',url,true);xhr.send();xhr.onload = function(ev){fn(ev);}}ajax('./imooc.json',function(ev){var data = JSON.parse(ev.currentTarget.response);console.log(data);})
}();

7. 打印台输出内容:

8. 至于其获取元素相关的语法操作类似于jquery获取元素操作,请阅读在线网页文档:

http://simplehtmldom.sourceforge.net/manual.htm

9. 其simple_dom_html类库下载地址:

链接:https://pan.baidu.com/s/1o8mlw98 密码:im5q

php抓取网页内容,获取网页数据相关推荐

  1. python抓取内存中的网页_『爬虫四步走』手把手教你使用Python抓取并存储网页数据!...

    爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...

  2. 『爬虫四步走』手把手教你使用Python抓取并存储网页数据!

    爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...

  3. PHP抓取网页内容获得网页源代码

    1. file_get_contents获取 [php] view plain copy $url="http://www.baidu.com/"; $fh= file_get_c ...

  4. python抓取网页数据并截图_手把手教你使用python抓取并存储网页数据!

    作者:刘早起 来源:早起Python 爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Pyth ...

  5. python爬虫怎么提取网页信息_Python爬虫是如何抓取并储存网页数据的?

    以下文章来源于早起Python ,作者刘早起 早起Python 专注于Python爬虫/数据分析/办公自动化 爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想 ...

  6. 手把手教你使用 Python 抓取并存储网页数据!最详细的爬虫教程!

    爬虫是 Python 的一个重要的应用,使用 Python 爬虫我们可以轻松的从互联网中抓取我们想要的数据 本文将基于爬取 B 站视频热搜榜单数据并存储为例,详细介绍 Python 爬虫的基本流程. ...

  7. java使用xml存储数据_『爬虫四步走』手把手教你使用Python抓取并存储网页数据!

    菜鸟学Python 以下文章来源于早起Python ,作者刘早起 爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据 ...

  8. java使用xml存储数据_「爬虫四步走」手把手教你使用Python抓取并存储网页数据

    爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...

  9. 『爬虫四步走』手把手教你使用 Python 抓取并存储网页数据!

    爬虫是 Python 的一个重要的应用,使用 Python 爬虫我们可以轻松的从互联网中抓取我们想要的数据 本文将基于爬取 B 站视频热搜榜单数据并存储为例,详细介绍 Python 爬虫的基本流程. ...

  10. python抓取pc端数据_「爬虫四步走」手把手教你使用Python抓取并存储网页数据!...

    爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...

最新文章

  1. 八数码 poj 1077 广搜 A* IDA*
  2. python中统计单词出现的次数_python统计文章中单词出现次数实例
  3. 数据库-数据库设计原则-范式概念
  4. mongoDB 小练习
  5. arm ubuntu 编译boost_使用yocto工具编译qt5.9.6总结
  6. 信息学奥赛一本通(1176:谁考了第k名)——qsort 函数
  7. Mysql 查询本周的数据
  8. Apache POI学习笔记
  9. laravel 路由模型绑定
  10. java线程下载文件_使用多线程在Java下载文件
  11. 学习ectouch之文件结构
  12. 360,驱动精灵文件夹删除方法,解决管理员权限下仍无法删除的问题!
  13. Java小型综合型练习——打字小游戏
  14. Word里面怎么才能输入平方
  15. 创建主键报错:Incorrect column specifier for column ‘id‘
  16. C++实现前向欧拉法Forward Euler解决偏微分方程
  17. ant design vue时间范围(range-picker)自定义时间段范围
  18. html旅游网站作品简介,旅游网站html模板
  19. Proteus仿真Arduino MEGA开发板的GPS模块
  20. 席位预定中,第二届世界物联网安全峰会5.30-5.31

热门文章

  1. IDM 下载器破解,亲测有效,转载
  2. 使用C#调用GMap相关组件的基本步骤
  3. DNS服务转发功能参数forwarders first与forwarders only对比
  4. 图灵停机问题(The Halting Problem)------巧妙的证明
  5. 怎么将CAD图纸中的新符号导入图库?
  6. 【单片机毕业设计】【mcuclub-jj-052】基于单片机的电脑散热底座的设计
  7. 赠书五本《数据分析咖哥十话》
  8. 微信企业付款至零钱包实现详细流程Demo
  9. javaweb——初用idea创建一个三层架构的web项目(Dao,service,controller)
  10. 计算机网络七层模型(OSI)