爬山虎内核引擎

爬山虎是什么

爬山虎PHPCreeper是一款基于Workerman的全新一代多进程异步驱动爬虫引擎。

爬山虎的特点

0x01、拥有workerman全部特性

由于爬山虎是基于workerman开发的,所以天然继承了workerman的一切特性,

比如:多进程、异步驱动、常驻内存、高性能等等,具体特性见其官方手册:

http://doc.workerman.net/getting-started/feature.html

0x02、有丰富人性化的开发手册

我们提供有人性化的中英文开发手册,白话文引导,极其通俗易懂,英文版手册很快开放。

0x03、支持自由定制各种插件

希望扩展额外的功能? 随你喜欢自由定制各种Plugin。

0x04、支持自由定制各种回调

希望改变程序的行为? 随你喜欢自由定制各种Callback。

0x05、支持自由定制下载器

对内置的资源下载器不满意? 随你喜欢自由定制第三方资源下载器。

0x06、支持自由定制消息中间件

对内置的消息中间件不满意? 随你喜欢自由定制第三方消息中间件。

0x07、支持自由定制分布式锁

对内置的分布式锁不满意? 随你喜欢自由定制第三方分布式锁。

0x08、支持网络限流

担心网络发生了拥挤堵塞? 引擎内置网络限流功能。

0x09、支持分布式部署

由于爬山虎基于socket模式实现,所以天然支持分布式部署。

0x10、支持分离式部署

爬山虎不仅支持分布式部署,同时也支持分离式部署,即基于worker的分离部署。

0x11、拥有彪悍性能

异步通信 + 多进程 + 分布/离式部署 + 事件驱动架构理念,保证了爬山虎彪悍的性能。

0x12、拥有强扩展性

微内核引擎 + 插件 + 分布/离式部署设计理念,保证了爬山虎强扩展性。

0x13、拥有人性化运行时控制面板

爬山虎以debug模式启动时,提供有人性化的运行时控制面板,直观展示了爬虫运行生命周期内的详细数据日志。

当然以dameon模式启动时,我们一样可以通过预先配置好的日志文件来查看详细的数据日志。

0x14、采用优雅的内容解析器

爬山虎采用PHPQuery作为内置的内容解析器,PHPQuery的语法和JQuery如出一撤,语法优雅简洁,

使用起来得心应手,最大化的帮助我们摆脱了编写枯燥正则表达式的烦恼。

0x15、支持socket编程

前面提及到爬山虎继承了workerman的一切特性,所以完美支持socket编程,

比如我们因业务需要新开个端口提供某种额外服务,那么只需启动对应协议的监听端口的业务实例就可以了,

而且支持自定义应用层协议,这也是workerman最原生的玩法。

0x16、支持多国语言环境

爬山虎支持多国语言环境,目前暂支持中文和英文运行环境。

0x17、支持敏捷开发

通过使用官方提供的配套应用框架,最终落地到开发者身上只有四件事:

进行应用业务配置

设定业务抓取规则

编写应用业务回调

启动各个业务实例

php的内核引擎,爬山虎内核引擎相关推荐

  1. MySQL内核:InnoDB存储引擎 卷1

    MySQL内核:InnoDB存储引擎卷1(MySQL领域Oracle ACE专家力作,众多MySQL Oracle ACE力捧,深入MySQL数据库内核源码分析,InnoDB内核开发与优化必备宝典) ...

  2. 操作系统与存储:解析Linux内核全新异步IO引擎io_uring设计与实现

    作者:draculaqian,腾讯后台开发工程师 引言 存储场景中,我们对性能的要求非常高.在存储引擎底层的IO技术选型时,可能会有如下讨论关于IO的讨论. http://davmac.org/dav ...

  3. 【ShoppingWebCrawler】-C#开发的基于Webkit内核开源爬虫蜘蛛引擎

    概述 在各个电商平台发展日渐成熟的今天.很多时候,我们需要一些平台上的基础数据.比如:商品分类,分类下的商品详细,甚至业务订单数据.电商平台大多数提供了相应的业务接口.允许ISV接入,用来扩展自身平台 ...

  4. http协议与https协议+UDP协议和TCP协议+WebSocket协议下服务端主动去发送信息+对称加密与非对称加密+get和post请求方式区别详解+浏览器内核以及jsj解析引擎

    TCP和UDP协议是TCP/IP协议的核心. 在TCP/IP网络体系结构中,TCP(传输控制协议,Transport Control Protocol).UDP(用户数据报协议,User Data P ...

  5. 浏览器内核、排版引擎、js引擎

    [定义] 浏览器最重要或者说核心的部分是"Rendering Engine",可大概译为"渲染引擎",不过我们一般习惯将之称为"浏览器内核" ...

  6. Yarn 源码 | 分布式资源调度引擎 Yarn 内核源码剖析

    曾有人调侃:HBase 没有资源什么事情也做不了,Spark 占用了资源却没有事情可做? 那 YARN了解一下? 01 YARN! 伴随着Hadoop生态的发展,不断涌现了多种多样的技术组件 Hive ...

  7. 浏览器内核-渲染引擎、js引擎

    一个完整的浏览器包含浏览器内核和浏览器的外壳(shell).浏览器核心--内核分成两部分:渲染引擎和js引擎.由于js引擎越来越独立,内核就倾向于只指渲染引擎. 1 浏览器组成结构 浏览器一般由七个模 ...

  8. 【前端】浅谈浏览器内核:渲染引擎、JS引擎

    浏览器内核是什么? 简而言之,浏览器内核就是把我们编写的代码转换为页面的中控件. 虽然现在大家谈起浏览器内核时,多指代渲染引擎(Rendering engine 或 layout engineer). ...

  9. 决策引擎的内核及基于Drools开源引擎讲解

    互联网时代,极速放贷.无需面签.10秒可取等词语成了招揽客户的关键词.此外,网购时平台一般都会提供分期付款.在这背后,风控平台每天收到无数笔申请贷款或分期支付的请求,是批准还是拒绝?金融借贷/支付与科 ...

最新文章

  1. 强化学习、联邦学习、图神经网络,飞桨全新工具组件详解
  2. Iframe自适应高度绝对好使的代码 兼容IE,遨游,火狐[转]
  3. 慢查询优化,我终于在生产踩到了这个坑!!
  4. 《机器人编程实战》一一第1章 究竟什么是机器人
  5. oracle 等待原因查找,oracle等待事件相关查询
  6. 入局视频会议市场 揭秘“腾讯会议”背后的创新黑科技
  7. android so文件崩溃,android 7.0 因为.so文件而崩溃事件解决
  8. 南孚电池:如何从0-1建立经营分析报表平台,助力集团转型?
  9. 成为大数据顶尖程序员,先过了这些Hadoop面试题!(附答案解析)
  10. Spring学习笔记专题一
  11. 注解描述(持续更新)
  12. Android中用URL模拟一个简单的图片加载器
  13. 230. 二叉搜索树中第K小的元素
  14. 最新网上赚钱方法,这四种最靠谱!
  15. 【转载】国医大师熊继柏:用中医思维彻底把新冠病毒中医治疗方案说清楚!值得中医人收藏
  16. 瑞士轮赛制模拟器_【入门必读】VGC综合介绍(下篇)【翻译】
  17. Uber Go 语言编程规范:使用 go.uber.org/atomic
  18. Web案例——制作简历
  19. 【2018焦作-E】Resistors in Parallel(思维+大数)
  20. Windows下Nexus 5的Android 5.0以上版本官方ROM的刷机教程

热门文章

  1. SIMD 单指令,多数据
  2. 中国科学院大学计算机研究所,武延军 - 中国科学院大学 - 计算机科学与技术学院...
  3. Python 字符串常见的语句,和练习题,字符串练习题 Python 切片函数修饰符 #精度和进制Python 字符串一些语句练课件练习题
  4. 【问题收集】slam中常见make问题错误 相关总结
  5. 更新源linux命令,Linux更新源
  6. python重构_重构Python应用程序以简化操作
  7. 游戏运营是什么?具体负责的工作有哪些?
  8. 【托业】【跨栏】TEST05
  9. 大聪明教你学Java | Spring Boot 整合 Redis 实现访问量统计
  10. 1078: 平均年龄