node-crawler

一个基于nodejs的网站采集服务器 可部署在任何服务器上远程调用

DEMO

发送请求 run npm dev POST: /scan

{"url": "http://www.charlotterusse.com/shoes/shop-all-shoes?sz=30&start=0","model": [{"find":".product-tile","child":[{"name":"name","type":"","method":[{"find":".name-link","attr":""}]},{"name":"price","type":"","method":[{"find":".price-sales","attr":""}]},{"name":"image","type":"","method":[{"find":"img","attr":"src"}]},{"name":"url","type":"","method":[{"find":"a","attr":"href"}]}]}],"oid": "7e11c4cb-0456-e9a9-65d5-b64c86d12b94"
}

部署

推荐使用 forever https://github.com/foreverjs/forever

启动服务器

forever start server.js

程序下载地址:https://u16968133.pipipan.com/fs/16968133-241391394

基于nodejs爬虫程序下载相关推荐

  1. 谈谈nodejs爬虫程序利器——cheerio模块

    cheerio是nodejs的抓取页面模块,为服务器特别定制的,快速.灵活.实施的jQuery核心实现.适合各种Web爬虫程序. 安装方法: npm install cheerio 特性: 相似的语法 ...

  2. python爬虫程序下载_Python爬虫之多线程下载程序类电子书

    近段时间,笔者发现一个神奇的网站:http://www.allitebooks.com/ ,该网站提供了大量免费的编程方面的电子书,是技术爱好者们的福音.其页面如下: ![](https://imag ...

  3. 基于nodejs爬虫

    爬接口数据 var https = require('https'); https.get('https://api.readhub.cn/topic?lastCursor=76823&pag ...

  4. 基于NodeJs的爬虫

    参考博客:手把手教你做爬虫-基于NodeJs 第一个nodejs爬虫:爬取豆瓣电影图片 引入模块 1.node 必须安装 2.http模块.fs模块都是内置的包,不需要额外添加 cheerio包,re ...

  5. 手把手教你做爬虫---基于NodeJs

    前言: 好久没更新博客了,内疚感十足,趁着北京今儿天气格外的蓝,我觉得我得干点什么,于是乎,卷起袖子,整理一下最近做爬虫的那些事儿. 目标:爬取北京大学软件与微电子学院的所有新闻,并将内容及图片存储到 ...

  6. python爬虫下载-python爬虫之下载文件的方式总结以及程序实例

    python爬虫之下载文件的方式以及下载实例 目录 第一种方法:urlretrieve方法下载 第二种方法:request download 第三种方法:视频文件.大型文件下载 实战演示 第一种方法: ...

  7. 基于libUSB的USB设备固件更新程序(下载数据)(转)

    源:基于libUSB的USB设备固件更新程序(下载数据) 本文紧接上一篇日志:基于libUSB-Win32的USB设备固件更新程序(前言),相关背景以及起因等,此处不再赘述,如感兴趣请移步. libU ...

  8. python的spider程序下载_PHPspider爬虫10分钟快速教程(内附python教程分享)

    说到做爬虫,大家都可能第一时间想到的是python,其实php也是可以用来写爬虫程序的.php一贯简洁.易用,亲测使用PHPspider框架10分钟就能写出一个简单的爬虫程序. 一.PHP环境安装 和 ...

  9. python 下载文件-python爬虫之下载文件的方式总结以及程序实例

    python爬虫之下载文件的方式以及下载实例 目录 第一种方法:urlretrieve方法下载 第二种方法:request download 第三种方法:视频文件.大型文件下载 实战演示 第一种方法: ...

最新文章

  1. blob字段乱码怎么处理_金九银十,你准备好了吗?没点Python面试题干货怎么行?(一)...
  2. In-Loop Filters in HEVC
  3. mybatis简单案例源码详细【注释全面】——Dao层接口(UserMapper.java)
  4. 【mysql】提取字符串中的数字、字母、中文,或任意组合
  5. Vivado生成bit文件报错彻底解决
  6. Mac 配置vscode调试PHP
  7. spring boot + swagger2
  8. Gcode命令【转】
  9. 红外触发蓝牙遥控器自动匹配
  10. 机器学习常用术语英语词汇
  11. 服务器主板用什么芯片,C610芯片服务器主板用什么机箱好?
  12. 费曼技巧:一张白纸提高学习效率
  13. apex 安装/使用 记录
  14. IDC机房动力环境设备维护
  15. 腾讯手游助手连接版本服务器网络错误,解决腾讯手游助手游戏战场提示网络异常更新不成功的具体操作步骤...
  16. 基于MATLAB的答题卡识别软件设计
  17. PSP上所有模拟器的使用方法
  18. 拼多多app是原生还是html,拼多多上中下截图示例
  19. 如何将CAD文件导入图新地球中,与影像地形倾斜模型准确叠加
  20. 计算机与数码产品维修工资,电子电器维修工程师月薪是多少?工资待遇及前景怎么样...

热门文章

  1. YUV与RGB格式详解
  2. 室内植物可以教给我们有关未来验证设计的知识
  3. Acwing第77场周赛题解
  4. 算法学习笔记五 斐波那契数列
  5. 0基础转行IT行业学web前端好吗?
  6. Dialog-普通对话框-列表对话框
  7. android 网络re,Gnirehtet让Android设备通过USB连接电脑上网
  8. 提炼活动创意的三大方式?研究28场刷屏级活动,百格活动为你讲解
  9. php 钱三位一个逗号,学习 PHP数字格式化,数字每三位加逗号 | LsevenTT博客-站群哥...
  10. 前端插件库之vue3使用vue3-cropper上传头像(裁剪图片、上传)