自古网易出人才,网易评论是我每天必看的,网友的智慧是无限的,看网易评论长阅历,放松心情。刚好最近写采集 于是就分析下网易评论的数据,发现网易的数据也是json形式加载过来的。

可以采集的 评论有:

精彩跟帖  http://tie.163.com/plaza/recommend.html

精彩盖楼 http://tie.163.com/plaza/build.html

网友热议  http://tie.163.com/plaza/topVote.html

下面只以网易精彩跟帖做例子分析采集:

网易精彩跟帖 http://tie.163.com/plaza/recommend.html   有3页 90条跟帖

用chrome 打开网址 在 开发者工具 -> console 下 可以看到 网页上的数据来自 http://tie.163.com/plaza/data/1/recommend.html  这是第一页的数据

返回一个 var replyData={"totalNum":90,"finePosts":xxxx........xxxxxx}; 的js对象;

其实这个js对象 去掉 开头的 'var replyData=' 和末尾的 ';' 就是个json ;

于是php就可以用json_decode函数转化为数组了;

/*** Created by JetBrains PhpStorm.* User: keygle* From: www.cnblogs.com/keygle* Date: 13-3-14* Time: 下午10:58** 获得网易精彩跟帖  3页 90条数据*/
$conmentData = array();
for($i=1;$i<4;$i++){$conments = array();$recommend= 'http://tie.163.com/plaza/data/'.$i.'/recommend.html';$strData = @file_get_contents($recommend);$commentJson = ltrim($strData,'var replyData='); //去掉 字符串开头的 var replyData=$commentJson = rtrim($commentJson,';'); //去掉 字符串末尾的 ;$conments = json_decode($commentJson,true);foreach($conments['finePosts'] as $val):$conmentData[] = $val;endforeach;
}
//print_r($conmentData);

转载于:https://www.cnblogs.com/keygle/archive/2013/03/15/2960624.html

采集练习(八) php 获得网易精彩跟贴数据相关推荐

  1. 数据采集时总提示未登录_做电商必须学会这一招!教你用爬虫工具免费采集网易考拉商品数据...

    本文主要介绍如何使用后羿采集器的智能模式,免费采集网易考拉商品的价格.累计评价.商品图片等信息. 采集工具简介: 后羿采集器是一款基于人工智能技术的网络爬虫软件,只需要输入网址就能够自动识别网页数据, ...

  2. python爬取股票信息_利用Python爬取网易上证所有股票数据(代码

    利用Python爬取网易上证所有股票数据(代码 发布时间:2018-04-14 17:30, 浏览次数:1261 , 标签: Python import urllib.request import r ...

  3. 醉翁之意不在酒,网易“星球”意在用户数据

    [数据猿导读] 所以当个人数据变得难以获取,那么让用户主动出卖数据,心甘情愿地将自己的"数字资产"双手奉上.这才是网易"星球"的真正目的吧. 记者 | 小北 官 ...

  4. 爬取网易buff CSGO饰品数据 - 优化篇

    文章目录 思路回顾 配置优化 RawConfigParser 处理配置列表 价格取舍 价格过滤 饰品类别限定 内部实现优化:结合价格筛选和饰品类别筛选 其他限定? 命名 The End 继上周末搞了c ...

  5. 从零搭建阿里云托管版k8s集群-容器日志采集(八)

    相信很多人都知道可以自己搭建elk来方便的收集日志,查询日志.虽然搭建elk并不是十分复杂,可对于一般的开发人员来说,尤其是对linux操作不是很熟练的人,是一项相当有难度的工程.所幸现在阿里云已经为 ...

  6. 在网易有数上做数据加工和数据分析的实践

    设计方案 最近在做平台的前端性能分析报告,为了快速实现这个目标,我准备借助现有的系统完成. 本次实践涉及的网易有数产品:Hubble(数据上报).数据开发及管理.有数BI. 这些产品是私有化部署的,大 ...

  7. 八折进行中 | 2018 中国大数据技术大会(BDTC)首轮讲师阵容震撼来袭!

    暌违一载,今又相约.作为年度技术趋势与行业应用的风向标,2018 中国大数据技术大会(BDTC 2018)携主题"大数据新应用"再度强势来袭,稳踏技术时代浪潮,势将引爆今冬技术圈. ...

  8. 「数据分析」Sqlserver中的窗口函数的精彩应用之数据差距与数据岛(含答案)...

    上一篇介绍过数据差距与数据岛的背景,这里不再赘述,请翻阅上一文.此篇在Sqlserver上给大家演示1000万条记录的计算性能. 测试电脑软硬件说明 一般般的笔记本电脑,2017年7月,价格:4500 ...

  9. 网易研选大数据架构演进

    猜你喜欢 0.[免费下载]2022年1月份热门报告盘点&下载1.微信视频号实时推荐技术架构分享2.从零开始搭建创业公司后台技术栈3.全民K歌推荐系统算法.架构及后台实现4.微博推荐算法实践与机 ...

最新文章

  1. codevs 1183 泥泞的道路 二分+SPFA最长路
  2. GridView跨行合并单元格
  3. C++ 动态创建对象数组
  4. 大数据学习(1)Hadoop安装
  5. 面试 .NET 开发​,为什么也要考算法?​
  6. 管理数据库计算机网络,计算机网络与数据库管理系统.pdf
  7. bulk insert 总结
  8. android 手机格式验证,android – 使用国家/地区代码验证手机号码
  9. VMware tools 安装失败
  10. UE4 键盘控制开关灯
  11. HTML快速入门-02-css
  12. 龙讯LT8911EXB高性能MIPI转EDP分辨率1080P概述
  13. C语言复习知识点汇总2--计算机二级(C语言)
  14. 涨知识了!这9个鲜为人知的 Python 第三方库真棒!
  15. 【JavaScript】ES5和ES6面向对象
  16. 《C语言小程序篇---1》——实现一个“富婆通讯录“(超详细)
  17. 获取公众号文章小工具
  18. 猿创征文|关于胖姑姑在数据领域常用TOP5工具
  19. 树莓派4B与Android之缘——树莓派下LineageOS(Android 9)系统开机联网与远程控制
  20. 自媒体平台运营心得总结

热门文章

  1. 【RDMA】RoCEv2 帧结构|RoCE和RRoCE|Soft-RoCE
  2. 源码时代 UI干货分享 | 如何用AI制作出迪士尼电影里的毛绒文字效果!!
  3. 专升本高数第一章试题_专升本高数——第一章 函数极限与连续性
  4. 微信试行松绑外链:点对点聊天可直接访问,群聊试开放电商类外链
  5. win7虚拟机永恒之蓝漏洞复现
  6. Error: Can‘t find Python executable “python“, you can set the PYTHON env variable
  7. python的函数嵌套机制
  8. DBHelper类的使用操作
  9. Chrome主题下载网站安装简单教程
  10. 计算机网络基础(三)子网划分及子网掩码计算方法