载入html

首选

 var cheerio = require('cheerio'),$ = cheerio.load(html);

将HTML作为字符串参数传入:

$ = require('cheerio');
$('ul', html);

或者作为根结点:

$ = require('cheerio');
$('li', 'ul', html);

selector

$( selector, [context], [root] )

$('.apple')
// 选择器定位到class 为apple的目标$('ul .pear')
// 选择器定位到 ul 中 class 为 pear 的目标$('li[class=orange]')
// 选择器定位到 li 中 class 为arange的目标

attribute

get 和set

.attr(name[, value])

这个方法可以获取和设置属性,第二个参数是可选的。当第二个参数不存在时表示获取属性的值,当有带有第二个参数时,表示设置属性的值。如果设置一个属性的值设置为null ,则删除该属性。如下示例:$('ul').attr('id')
//=> fruits$('.apple').attr('id', 'favorite').html()
//=> <li class="apple" id="favorite">Apple</li>

remove

.removeAttr(name)


通过 name 移除某一个属性,同时返回被移除的这个元素。如下示例$('.pear').removeAttr('class').html();
//=> <li>Pear</li>

class操作

.hasClass(className)

判断某元素的 class 中是否包含 className 。如下示例:

$('.pear').hasClass('pear'); //=> true$('apple').hasClass('fruit'); //=> false$('li').hasClass('pear'); //=> true

.addClass(className)

给某元素添加一个名为 className 的样式名。如下示例:

$('.pear').addClass('fruit').html();
//=> <li class = "pear fruit">Pear</li>$('.apple').addClass('fruit red').html();
//=> <li class = "apple fruit red">Apple</li>

.removeClass(className)

将某元素上名为 className 的样式名移除。如果不存在 className ,则移除所有的样式名。如下示例:

$('.pear').removeClass('pear').html();
//=> <li class="">Pear</li>$('.apple').addClass('red').removeClass().html();
//=> <li class="">Apple</li>

添加 DOM

.after(content, [content, ...])

将 content 插入到某元素的后面,并作为其后面第一个兄弟节点。

$('.apple').after('<li class = "plum">Plum</li>');
$.html();
//=> <ul id = "fruits">
//     <li class = "apple">Apple</li>
//     <li class = "plum">Plum</li>
//     <li class = "orange">Orange</li>
//     <li class = "pear">Pear</li>
// </ul>
.before(content, [content, ...])

将 content 插入到某元素的前面,并作为其前面的第一个兄弟节点。

$('.apple').before('

Plum');

$.html();
//=> <ul id = "fruits">
//     <li class = "plum">Plum</li>
//     <li class = "apple">Apple</li>
//     <li class = "orange">Orange</li>
//     <li class = "pear">Pear</li>
// </ul>

删除和替换

.remove([selector])

移除某一个节点以及他们的孩子节点。

$('.pear').remove();
$.html();
//=> <ul id = "fruits">
//     <li class = "apple">Apple</li>
//     <li class = "orange">Orange</li>
// </ul>

.replaceWith(content)

替换匹配的节点。

var plum = $('<li class = "plum">Plum</li>');
$('.pear').replaceWith(plum);
$.html();
//=> <ul id = "fruits">
//    <li class = "apple">Apple</li>
//    <li class = "orange">Orange</li>
//    <li class = "plum">Plum</li>
// </ul>

清空和获取 DOM

.empty()

清空一个节点,移除其所有的孩子节点。

$('ul').empty();
$.html();
//=> <ul id = "fruits"></ul>

.html([htmlString])

获取某节点的html字符串。如果传入参数,则设置该元素的html结构。

$('.orange').html(); //=> Orange$('#fruits').html('<li class = "mango">Mango</li>').html();
//=> <li class="mango">Mango</li>
.text([textString])

获取某节点的纯文本。

$('.orange').text();
//=> Orange$('ul').text();
//=>  Apple
//    Orange
//    Pear

find

cheerio 亦可以同jQuery那样,通过某一个元素来查找它的父元素、子元素、兄弟元素,并进行操作。

.find(selector)

在某元素下查询满足选择条件的元素。

$('#fruits').find('li').length; //=> 3

.parent()

获取某元素的父元素。

$('.pear').parent().attr('id'); //=> fruits

.next()

获取某元素的下一个兄弟元素。

$('.apple').next().hasClass('orange'); //=> true

.perv()

获取某元素的上一个兄弟元素。

$('.orange').prev().hasClass('apple'); //=> true

过滤

.siblings()

获取某元素的所有同级元素。(当然除了它自己)

$('.pear').siblings().length; //=> 2

.children([selector])

获取某元素的孩子节点。可以传入参数在所有的孩子节点中进行筛选。

$('#fruits').children().length; //=> 3$('#fruits').children('.pear').text(); //=> Pear

.filter(selector) & .filter(function(index))

在cheerio对象集合中进行条件筛选。

$('li').filter('.orange').attr('class'); //=> orange$('li').filter(function(i, el) {// this === elreturn $(this).attr('class') === 'orange';
}).attr('class') //=> orange

.first()

获取cheerio集合中的第一个cheerio对象。

$('#fruits').children().first().text(); //=> Apple

.last()

获取cheerio集合中的最后一个cheerio对象。

$('#fruits').children().last().text(); //=> Pear

.eq(i)

根据索引获取cheerio集合中的某一个对象。参数可以使负数,表示从尾部开始索引。

$('li').eq(0).text(); //=> Apple$('li').eq(-1).text(); //=> Pear

遍历

.each(function(index, element){...})

和jquery类似的 each 迭代器,对每一个元素进行处理。

var fruits = [];

$('li').each(function(i, elem) {fruits[i] = $(this).text();
});

fruits.join(', '); //=> Apple, Orange, Pear

.map(function(index, element){...})

和jquery类似的 each 迭代器,对每一个元素进行处理并返回一个值。

$('li').map(function(i, el) {// this === elreturn $(this).attr('class');
}).get().join(', '); //=> apple, orange, pear

克隆和复制

.clone

对 cheerio 中的对象进行复制

var moreFruit = $('#fruits').clone();

$.root

当你需要和顶级DOM一起完成任务时,我们就用到了 $.root。如下:

$.root().append('<ul id="vegetables"></ul>').html();//=> <ul id="fruits">...</ul><ul id="vegetables"></ul>
$.contains(container, contained)

检查 container 中是否包含 contained 元素。注意,container和contained 参数都应当是DOM元素:

var c1 = $("#fruits")[0];
var c2 = $(".pear")[0];
var ret = $.contains(c1, c2);
console.log(ret); // => true

转载于:https://www.cnblogs.com/oneboi/p/8205809.html

cheerio api相关推荐

  1. 通读cheerio API

    https://cnodejs.org/topic/5203a71844e76d216a727d2e 所谓工欲善其事,必先利其器,所以通读了cheerio的API,顺便翻译了一遍,有些地方因为知道的比 ...

  2. cheerio 中文文档

    介绍 把HTML告诉你的服务器. const cheerio = require('cheerio'); const $ = cheerio.load('<h2 class="titl ...

  3. 【nodeJs】cheerio

    cheerio是什么? cheerio(https://github.com/cheeriojs/cheerio ) 大家可以理解成一个 Node.js 版的 jquery,用来从网页中以 css s ...

  4. Node学习记录: 图片爬虫

    一 const request = require('request'); request 对http进行封装的npm request(url,(err,req)=>{ let body=req ...

  5. node.js爬虫爬取电影天堂,实现电视剧批量下载。

    2019独角兽企业重金招聘Python工程师标准>>> ###一.项目描述   引言:在电影天堂下电视剧的下伙伴有木有发现,它没有提供批量下载功能,美剧英剧还好,10集左右,我就多点 ...

  6. HTTP网络编程(客户端)

    HTTP协议 浏览器访问过程 改文章参考相关链接:https://blog.csdn.net/m_buddy/article/details/77800998 总结起来大概的流程是这样的: 浏览器本身 ...

  7. 谈谈nodejs爬虫程序利器——cheerio模块

    cheerio是nodejs的抓取页面模块,为服务器特别定制的,快速.灵活.实施的jQuery核心实现.适合各种Web爬虫程序. 安装方法: npm install cheerio 特性: 相似的语法 ...

  8. 使用sync-request和cheerio写爬虫

    node.js自带的http模块是异步获取网页内容的,不过我们可以到npm上去搜索同步的http模块.sync-request就是其中一种. 首先,安装sync-request包: npm insta ...

  9. Node爬虫(二):使用cheerio爬取表情包

    cheerio 官方在线文档 简介 cheerio是nodejs的抓取页面模块,为服务器特别定制的,快速.灵活.实施的jQuery核心实现.适合各种Web爬虫程序 安装 npm install che ...

最新文章

  1. Java项目:设计管理系统(java+SSM+JSP+MYSQL+layui+Maven)
  2. ecshop 前台个人中心修改侧边栏 和 侧边栏显示不全 或 导航现实不全
  3. python自动化运维书籍推荐_《Python 自动化运维:技术与最佳实践》
  4. WebAssembly 将成为互联网的终结?
  5. 彻底理解position与anchorPoint - Wonderffee's Blog(转)
  6. 机器学习基础(五十二)—— 朴素贝叶斯细节
  7. Kalman filter—直观理解
  8. 移动WEB开发之Safari、QQ、UC、360浏览器的私有Meta属性
  9. UE4编辑器工具——制作一个批量改名的小工具
  10. 2019CCPC湖南全国邀请赛(广东省赛、江苏省赛)重现赛
  11. 谁是最大的竞争对手互联网宝宝军团?
  12. FPGA实现和ET1100通信verilog源码。 ethercat从站方案
  13. markdown画图之一:流程图(flowchart)
  14. 《拆掉思维里的墙》感想
  15. 计算机中的一些基本概念(速度,比特,门,电路图)
  16. Linux 系统增加硬盘
  17. 第4章 Stata参数检验
  18. 【控制工程】自动控制原理和系统建模
  19. seo要学什么东西?
  20. UVA1103古代象形文字識別

热门文章

  1. BeanUtils.copyProperties
  2. 01 c++常见面试题总结
  3. [SDOI2006] 保安站岗
  4. 浅入深出之Java集合框架(上)
  5. Modules(最小树形图)
  6. DSP using MATLAB 示例Example3.1 3.2 3.3
  7. 牛客假日团队赛2 A.买一送一
  8. android代码设置全屏
  9. nginx安装编译,动态添加模块及其各模块的作用
  10. windows下flv视频网站进度条随意拖放[转]