书接上回,哈哈,昨天发表了,怎么使用Node的cheerio模块进行抓取网页的信息,那我们拿到数据肯定是有自己的用处的啊。
我昨天抓取的是一些超级诱人的糕点的图片,今天展示出来,大家一起眼馋啊,啊哈哈哈~
昨天的抓取博文,需要的请点击这个链接:Node学习之cheerio网络爬虫
好了,开始今天的展示,上代码:

var http = require("http");
var cheerio = require("cheerio");
//准备抓取的网站链接
var dataUrl = "http://www.mcake.com/shop/110/index.html#mainer_top";
http.get(dataUrl,function(res){var str = "";//绑定方法,获取网页数据res.on("data",function(chunk){str += chunk;})//数据获取完毕res.on("end",function(){//调用下方的函数,得到返回值,即是我们想要的img的srcvar data = getData(str);//console.log(data);
----------
//新添加的部分//用node搭建服务器,将内容展示在页面上var server = http.createServer(function(req,res){//定义空的字符串var html = "";//循环得到的数据,拼接在html上for(var i = 0;i<data.length;i++){html += `<div style="display: inline-block;margin: 10px;"><img src="${data[i]}" /></div>`;}//输出到页面res.write(html);res.end();})server.listen(8888);//设置服务端口号
----------})
})
//根据得到的数据,处理得到自己想要的
function getData(str){//沿用JQuery风格,定义$var $ = cheerio.load(str);//获取的数据数组var arr = $(".pro_box a:nth-child(1) img");var dataTemp = [];//遍历得到数据的src,并放入以上定义的数组中arr.each(function(k,v){var src = $(V).attr("src");dataTemp.push(src);})//返回出去return dataTemp;
}

把以上代码加进去,在浏览器的地址栏输入“localhost:8888”,就可以看到展示的页面了,哒哒哒,萍子要上那些可爱的甜点了哦,Hold住哈!O(∩_∩)O~

讲真,我本来截了一张超大的图片,无奈CSDN只能上传2M的图片,哎呀,好气啊,还是本本分分的学习吧,哈哈哈~

Node.js抓取网页信息并展示(cheerio网络爬虫)相关推荐

  1. Node.js抓取网页信息(cheerio网络爬虫)

    Node.js的学习中,可用于抓取其他网站的模块是[cheerio],这个模块并不是node的内置模块,所以首先我们需要先安装一下: 安装对应模块 安装命令: npm install cheerio ...

  2. python抓取网页数据并截图_网络爬虫-使用Python抓取网页数据

    搬自大神boyXiong的干货! 闲来无事,看看了Python,发现这东西挺爽的,废话少说,就是干 准备搭建环境 因为是MAC电脑,所以自动安装了Python 2.7的版本 添加一个 库 Beauti ...

  3. Node.js 抓取电影天堂新上电影节目单及ftp链接

    代码地址如下: http://www.demodashi.com/demo/12368.html 1 概述 本实例主要使用Node.js去抓取电影的节目单,方便大家使用下载. 2 node packa ...

  4. 使用Python抓取网页信息

    之前用C#帮朋友写了一个抓取网页信息的程序,搞得好复杂,今天朋友又要让下网页数据,好多啊,又想偷懒,可是不想用C#了,于是想到了Python,大概花了两个小时,用记事本敲的,然后在IDLE (Pyth ...

  5. node.js抓取网络图片保存到本地,node.js抓取防盗链网络图片保存到本地

    node.js抓取网络图片保存到本地,node.js抓取防盗链网络图片保存到本地 使用模块request.fs,request模块在npm里平均月下载量超过3000W次,那是相当的牛逼. node版本 ...

  6. .net抓取网页信息 - Jumony框架使用1

    往往在实际开发中,经常会用到一些如抓取网站信息之类的的操作,往往大家采用的是用一些正则的方式获取,但是有时候正则是很死板的,我们常常试想能不能使用jquery的选择器,获取符合自己要求的元素,然后进行 ...

  7. asp.net 初步入门使用正则抓取网页信息

    今天闲着没事看了看使用正则的使用,之前只是用来做验证,第一次用来抓取网页, 抓去了博客园首页几个分页的推荐文章列表.... 代码很简单就不做解释了,肯定做得不严谨,主要是熟悉下几个正则类和用于抓取网页 ...

  8. matlab抓取网页信息,如何利用Matlab抓取网页数据

    如何利用Matlab抓取网页数据 2019-01-01 %朋友需要做金融方面的分析,要求从网站上下载大量的数据,一个一个复制粘贴太费事.我写了一个简单的网络爬虫,主要用到正则表达式,可以自动下载网页源 ...

  9. Python 爬取网页信息并保存到本地爬虫爬取网页第一步【简单易懂,注释超级全,代码可以直接运行】

    Python 爬取网页信息并保存到本地[简单易懂,代码可以直接运行] 功能:给出一个关键词,根据关键词爬取程序,这是爬虫爬取网页的第一步 步骤: 1.确定url 2.确定请求头 3.发送请求 4.写入 ...

最新文章

  1. 用python画哆啦a梦的身体_用Python画一个哆啦A梦
  2. vary渲染图没了_云渲染哪个好用?云渲染平台对比
  3. ubuntu pip更新_Cubietruck开发板折腾002:安装Python管理工具pip
  4. 推荐neter常用优秀开源项目系列之一
  5. EF for Firebird
  6. 临时停车码-扫码拨号发信息HTML源码
  7. 洛谷P2606 [ZJOI2010]排列计数(数位dp)
  8. centos7搭建aria2+yaaw
  9. matlab——非线性规划
  10. 计算机桌面窗口管理器在哪,W7系统禁用dwm桌面窗口管理器的操作方法
  11. Nvidia Jetson AGX Orin 初体验
  12. 学校创客教育实施方案
  13. Linux创建软链接和硬链接的命令
  14. Java(四):高效调试之IDEA热启动
  15. 人工智能开源项目推荐
  16. “撸啊”不止能秒杀!| lua+redis实现高并发抢令牌
  17. 数学建模(一)对变化进行建模及其解
  18. 中国高科技企业在忙什么(聚焦)
  19. 【浅尝辄止】《汇编语言》入栈出栈操作
  20. 国外LEAD-自学篇-第一篇(IP代理教程)

热门文章

  1. Missing iOS Distribution signing identity问题解决
  2. Web开发技术大会演讲
  3. EXCEL下载功能在XP系统中运行是好好的,到windows2003系统上,就报错
  4. iBATIS In Action:什么是iBATIS(二)
  5. 基础知识—数据类型-第一个C++程序
  6. 斐波那契数列大数的压位c语言,HDU 1568 Fibonacci(大数前4位)
  7. go 文件服务器 搜索,golang文件服务器,可以访问任何目录
  8. 数据库周刊第十七期来啦!
  9. 华为全栈AI技术干货深度解析,解锁企业AI开发“秘籍”
  10. 【华为云技术分享】Linux内核补丁源码分析(1)