cheerio api
载入html
首选
var cheerio = require('cheerio'),$ = cheerio.load(html);
将HTML作为字符串参数传入:
$ = require('cheerio');
$('ul', html);
或者作为根结点:
$ = require('cheerio');
$('li', 'ul', html);
selector
$( selector, [context], [root] )
$('.apple')
// 选择器定位到class 为apple的目标$('ul .pear')
// 选择器定位到 ul 中 class 为 pear 的目标$('li[class=orange]')
// 选择器定位到 li 中 class 为arange的目标
attribute
get 和set
.attr(name[, value])
这个方法可以获取和设置属性,第二个参数是可选的。当第二个参数不存在时表示获取属性的值,当有带有第二个参数时,表示设置属性的值。如果设置一个属性的值设置为null ,则删除该属性。如下示例:$('ul').attr('id')
//=> fruits$('.apple').attr('id', 'favorite').html()
//=> <li class="apple" id="favorite">Apple</li>
remove
.removeAttr(name)
通过 name 移除某一个属性,同时返回被移除的这个元素。如下示例$('.pear').removeAttr('class').html();
//=> <li>Pear</li>
class操作
.hasClass(className)
判断某元素的 class 中是否包含 className 。如下示例:
$('.pear').hasClass('pear'); //=> true$('apple').hasClass('fruit'); //=> false$('li').hasClass('pear'); //=> true
.addClass(className)
给某元素添加一个名为 className 的样式名。如下示例:
$('.pear').addClass('fruit').html();
//=> <li class = "pear fruit">Pear</li>$('.apple').addClass('fruit red').html();
//=> <li class = "apple fruit red">Apple</li>
.removeClass(className)
将某元素上名为 className 的样式名移除。如果不存在 className ,则移除所有的样式名。如下示例:
$('.pear').removeClass('pear').html();
//=> <li class="">Pear</li>$('.apple').addClass('red').removeClass().html();
//=> <li class="">Apple</li>
添加 DOM
.after(content, [content, ...])
将 content 插入到某元素的后面,并作为其后面第一个兄弟节点。
$('.apple').after('<li class = "plum">Plum</li>');
$.html();
//=> <ul id = "fruits">
// <li class = "apple">Apple</li>
// <li class = "plum">Plum</li>
// <li class = "orange">Orange</li>
// <li class = "pear">Pear</li>
// </ul>
.before(content, [content, ...])
将 content 插入到某元素的前面,并作为其前面的第一个兄弟节点。
$('.apple').before('
Plum');
$.html();
//=> <ul id = "fruits">
// <li class = "plum">Plum</li>
// <li class = "apple">Apple</li>
// <li class = "orange">Orange</li>
// <li class = "pear">Pear</li>
// </ul>
删除和替换
.remove([selector])
移除某一个节点以及他们的孩子节点。
$('.pear').remove();
$.html();
//=> <ul id = "fruits">
// <li class = "apple">Apple</li>
// <li class = "orange">Orange</li>
// </ul>
.replaceWith(content)
替换匹配的节点。
var plum = $('<li class = "plum">Plum</li>');
$('.pear').replaceWith(plum);
$.html();
//=> <ul id = "fruits">
// <li class = "apple">Apple</li>
// <li class = "orange">Orange</li>
// <li class = "plum">Plum</li>
// </ul>
清空和获取 DOM
.empty()
清空一个节点,移除其所有的孩子节点。
$('ul').empty();
$.html();
//=> <ul id = "fruits"></ul>
.html([htmlString])
获取某节点的html字符串。如果传入参数,则设置该元素的html结构。
$('.orange').html(); //=> Orange$('#fruits').html('<li class = "mango">Mango</li>').html();
//=> <li class="mango">Mango</li>
.text([textString])
获取某节点的纯文本。
$('.orange').text();
//=> Orange$('ul').text();
//=> Apple
// Orange
// Pear
find
cheerio 亦可以同jQuery那样,通过某一个元素来查找它的父元素、子元素、兄弟元素,并进行操作。
.find(selector)
在某元素下查询满足选择条件的元素。
$('#fruits').find('li').length; //=> 3
.parent()
获取某元素的父元素。
$('.pear').parent().attr('id'); //=> fruits
.next()
获取某元素的下一个兄弟元素。
$('.apple').next().hasClass('orange'); //=> true
.perv()
获取某元素的上一个兄弟元素。
$('.orange').prev().hasClass('apple'); //=> true
过滤
.siblings()
获取某元素的所有同级元素。(当然除了它自己)
$('.pear').siblings().length; //=> 2
.children([selector])
获取某元素的孩子节点。可以传入参数在所有的孩子节点中进行筛选。
$('#fruits').children().length; //=> 3$('#fruits').children('.pear').text(); //=> Pear
.filter(selector) & .filter(function(index))
在cheerio对象集合中进行条件筛选。
$('li').filter('.orange').attr('class'); //=> orange$('li').filter(function(i, el) {// this === elreturn $(this).attr('class') === 'orange';
}).attr('class') //=> orange
.first()
获取cheerio集合中的第一个cheerio对象。
$('#fruits').children().first().text(); //=> Apple
.last()
获取cheerio集合中的最后一个cheerio对象。
$('#fruits').children().last().text(); //=> Pear
.eq(i)
根据索引获取cheerio集合中的某一个对象。参数可以使负数,表示从尾部开始索引。
$('li').eq(0).text(); //=> Apple$('li').eq(-1).text(); //=> Pear
遍历
.each(function(index, element){...})
和jquery类似的 each 迭代器,对每一个元素进行处理。
var fruits = [];
$('li').each(function(i, elem) {fruits[i] = $(this).text();
});
fruits.join(', '); //=> Apple, Orange, Pear
.map(function(index, element){...})
和jquery类似的 each 迭代器,对每一个元素进行处理并返回一个值。
$('li').map(function(i, el) {// this === elreturn $(this).attr('class');
}).get().join(', '); //=> apple, orange, pear
克隆和复制
.clone
对 cheerio 中的对象进行复制
var moreFruit = $('#fruits').clone();
$.root
当你需要和顶级DOM一起完成任务时,我们就用到了 $.root。如下:
$.root().append('<ul id="vegetables"></ul>').html();//=> <ul id="fruits">...</ul><ul id="vegetables"></ul>
$.contains(container, contained)
检查 container 中是否包含 contained 元素。注意,container和contained 参数都应当是DOM元素:
var c1 = $("#fruits")[0];
var c2 = $(".pear")[0];
var ret = $.contains(c1, c2);
console.log(ret); // => true
转载于:https://www.cnblogs.com/oneboi/p/8205809.html
cheerio api相关推荐
- 通读cheerio API
https://cnodejs.org/topic/5203a71844e76d216a727d2e 所谓工欲善其事,必先利其器,所以通读了cheerio的API,顺便翻译了一遍,有些地方因为知道的比 ...
- cheerio 中文文档
介绍 把HTML告诉你的服务器. const cheerio = require('cheerio'); const $ = cheerio.load('<h2 class="titl ...
- 【nodeJs】cheerio
cheerio是什么? cheerio(https://github.com/cheeriojs/cheerio ) 大家可以理解成一个 Node.js 版的 jquery,用来从网页中以 css s ...
- Node学习记录: 图片爬虫
一 const request = require('request'); request 对http进行封装的npm request(url,(err,req)=>{ let body=req ...
- node.js爬虫爬取电影天堂,实现电视剧批量下载。
2019独角兽企业重金招聘Python工程师标准>>> ###一.项目描述 引言:在电影天堂下电视剧的下伙伴有木有发现,它没有提供批量下载功能,美剧英剧还好,10集左右,我就多点 ...
- HTTP网络编程(客户端)
HTTP协议 浏览器访问过程 改文章参考相关链接:https://blog.csdn.net/m_buddy/article/details/77800998 总结起来大概的流程是这样的: 浏览器本身 ...
- 谈谈nodejs爬虫程序利器——cheerio模块
cheerio是nodejs的抓取页面模块,为服务器特别定制的,快速.灵活.实施的jQuery核心实现.适合各种Web爬虫程序. 安装方法: npm install cheerio 特性: 相似的语法 ...
- 使用sync-request和cheerio写爬虫
node.js自带的http模块是异步获取网页内容的,不过我们可以到npm上去搜索同步的http模块.sync-request就是其中一种. 首先,安装sync-request包: npm insta ...
- Node爬虫(二):使用cheerio爬取表情包
cheerio 官方在线文档 简介 cheerio是nodejs的抓取页面模块,为服务器特别定制的,快速.灵活.实施的jQuery核心实现.适合各种Web爬虫程序 安装 npm install che ...
最新文章
- Java项目:设计管理系统(java+SSM+JSP+MYSQL+layui+Maven)
- ecshop 前台个人中心修改侧边栏 和 侧边栏显示不全 或 导航现实不全
- python自动化运维书籍推荐_《Python 自动化运维:技术与最佳实践》
- WebAssembly 将成为互联网的终结?
- 彻底理解position与anchorPoint - Wonderffee's Blog(转)
- 机器学习基础(五十二)—— 朴素贝叶斯细节
- Kalman filter—直观理解
- 移动WEB开发之Safari、QQ、UC、360浏览器的私有Meta属性
- UE4编辑器工具——制作一个批量改名的小工具
- 2019CCPC湖南全国邀请赛(广东省赛、江苏省赛)重现赛
- 谁是最大的竞争对手互联网宝宝军团?
- FPGA实现和ET1100通信verilog源码。 ethercat从站方案
- markdown画图之一:流程图(flowchart)
- 《拆掉思维里的墙》感想
- 计算机中的一些基本概念(速度,比特,门,电路图)
- Linux 系统增加硬盘
- 第4章 Stata参数检验
- 【控制工程】自动控制原理和系统建模
- seo要学什么东西?
- UVA1103古代象形文字識別