# QueryList简介

***

`QueryList`是一个基于`phpQuery`的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面     基本上就一句话就能搞定了。

# QueryList 安装

通过`composer`安装:

```

composer require jaeger/querylist

```

更多安装方法:[QueryList多种安装方式](https://doc.querylist.cc/site/index/doc/7)

# QueryList 使用

下面演示`QueryList`用一句代码采集百度搜索结果:

```php

//获取采集对象

$hj = QueryList::Query('http://www.baidu.com/s?wd=QueryList',array(

'title'=>array('h3','text'),

'link'=>array('h3>a','href')

));

//输出结果:二维关联数组

print_r($hj->data);

```

上面的代码实现的功能是采集百度搜索结果页面的所有搜索结果的`标题`和`链接`,然后分别以二维关联数组的格式输出。

采集结果:

```

Array

(

[0] => Array

(

[title] => QueryList|基于phpQuery的无比强大的PHP采集工具

[link] => http://www.baidu.com/link?url=IIsMhpzI2PylnmW8vPALcwIfJgHhKFu2SWXEj7yQ-6o7KStbLfmuoWGmalpx1xYE

)

[1] => Array

(

[title] => 介绍- QueryList指导文档

[link] => http://www.baidu.com/link?url=edktLqt6f9KwYJ6oip1EDXvwIXh-nHcFImVJeqRm56-VU3zIcqLRYeM83VyYQE_X

)

//省略....

)

```

## Query() 静态方法

返回值:`QueryList对象`

Query方法为`QueryList`唯一的主方法,用静态的方式调用。

**原型:**

> QueryList::Query($page,array $rules, $range = '', $outputEncoding = null, $inputEncoding = null,$removeHead = false)

**中文解释:**

```

QueryList::Query(采集的目标页面,采集规则[,区域选择器][,输出编码][,输入编码][,是否移除头部])

//采集规则

$rules = array(

'规则名' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),

'规则名2' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),

..........

[,"callback"=>"全局回调函数"]

);

//注:方括号括起来的参数可选

```

### 参数解释:

查看文档:http://doc.querylist.cc/site/index/doc/11

## QueryList 扩展

**Request 网络操作扩展**

可以实现如携带cookie、伪造来路等任意复杂的网络请求,再也不用担心QueryList内置的抓取功能太弱了。

**Login 模拟登陆扩展**

可以实现模拟登陆然后采集。

**Multi 多线程插件**

多线程(多进程)采集扩展。

**DImage图片下载扩展**

可实现简单的图片下载需求。

扩展安装以及使用教程:[QueryList扩展文档](https://doc.querylist.cc/site/index/doc/19),获取更多扩展可以关注`QueryList`社区和交流群。

## 其它说明

1.`QueryList`内置的只是简单的源码抓取方法,遇到更复杂的抓取情况,如:需要登陆

身份验证 时,请配合其它的PHP的HTTP工具(推荐使用[Guzzle](http://guzzle-cn.readthedocs.io/zh_CN/latest/))来使用,通过将辅助的HTTP类抓取到的网页源码传给`QueryList`即可。

2.采集程序请在PHP命令行模式(PHP CLI)下运行。

3.`QueryList`依赖`phpQuery`,`phpQuery`项目主页:[phpQuery文档](https://code.google.com/p/phpquery/)

## 寻求帮助?

- QueryList交流社区: [http://querylist.cc/](http://querylist.cc/)

- QueryList文档: [http://doc.querylist.cc/](http://doc.querylist.cc/)

- QueryList交流QQ群:123266961

- Git@OSC:http://git.oschina.net/jae/QueryList

- GitHub:https://github.com/jae-jae/QueryList

## Author

Jaeger

## Lisence

QueryList is licensed under the license of MIT. See the LICENSE for more details.

querylist.php下载,PHP 强大的采集工具,QueryList相关推荐

  1. 天猫php采集列表,QueryList: QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。...

    #QueryList交流社区: http://querylist.cc/ #QueryList文档: http://doc.querylist.cc/ #QueryList交流QQ群:12326696 ...

  2. QueryList 4.0 简洁、优雅、可扩展的PHP采集工具(爬虫)

    QueryList 简介 QueryList是一套简洁.优雅.可扩展的PHP采集工具(爬虫),基于phpQuery. 特性 拥有与jQuery完全相同的CSS3 DOM选择器 拥有与jQuery完全相 ...

  3. QueryList是一套简洁、优雅的PHP采集工具(爬虫),基于phpQuery。

    QueryList是一套简洁.优雅的PHP采集工具(爬虫),基于phpQuery. 特性: 拥有与jQuery完全相同的CSS3 DOM选择器 拥有与jQuery完全相同的DOM操作API 拥有通用的 ...

  4. mysql url查找_Superl-url:一款开源、强大的关键词URL采集工具

    原标题:Superl-url:一款开源.强大的关键词URL采集工具 superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集. 程 ...

  5. Keep It for Mac 1.3.4 强大的笔记本工具 破解版下载

    Keep It for Mac 是笔记本,剪贴簿和组织者,非常适合写笔记,保存网页链接,存储文档,图像或任何类型的文件,并再次找到它们.Keep It 是 Together 的继承者. Keep It ...

  6. 推荐7款实用强大的神器工具,建议你先收藏,总有一天你会用到!

    分享7个非常强大的神器工具,每一款都是精品,喜欢的话记得点赞支持哦~ 1.后羿采集器 后羿采集器是前谷歌技术团队倾力打造,基于人工智能技术,只需要输入网址就能自动识别采集内容.支持Win/Mac/Li ...

  7. put url带参数_Superlurl 一款开源关键词URL采集工具

    superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集.可自动从搜索引擎采集相关网站的真实地址与标题等信息,可保存为文件,自动去 ...

  8. superl-url,关键词URL采集工具

    superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集. 程序主要运用于安全渗透测试项目,以及批量评估各类CMS系统0DAY的影 ...

  9. Superl-url:一款开源关键词URL采集工具

    superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集.   程序主要运用于安全渗透测试项目,以及批量评估各类CMS系统0DAY ...

最新文章

  1. 链表倒置 (不额外开辟另一块空间)
  2. c++如何让字符串重复输出_python编程入门八:列表、元组、字符串的转换及补充方法...
  3. 超适合小白的python新手教程
  4. Split-Bregman迭代方式
  5. 我的世界java版联机不稳定_我的世界:你一定不会相信,时隔2年,网易这次真的“更新”了...
  6. python3 文本处理_解决python3 写入中文文本查看为乱
  7. Charles抓包:APP抓包工具配置手机代理证书
  8. ChatGPT Network Error 在使用chatGPT的过程中回答到一半显示网络错误
  9. 【案例分析】服务器数据恢复
  10. UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xca in position 358: in
  11. 做内网穿透外网远程访问群晖NAS 2-2
  12. 最新!OMNI3D:3D目标检测的大型基准和模型(Meta AI)
  13. 反光衣穿戴识别检测系统 OpenCV
  14. python风控建模实战(分类器模型+回归模型)
  15. 电商平台营销活动玩法大全
  16. 诚之和:困在数字里的蜜雪冰城,被迫IPO
  17. mysql查询星期一到星期日的数据
  18. 黑苹果隔空投送无法双向传输解决
  19. 信息与通信的数学基础——第十章 数学物理方程
  20. 进程、线程、多线程举例说明

热门文章

  1. unity3d(人机博弈,棋类相关)
  2. lol桌面图标在计算机哪找,win7系统英雄联盟桌面快捷方式不见了的解决方法
  3. 百度移动联盟服务评测
  4. mysql模糊查询实例_Mysql实例sql模糊查询实例详解
  5. 200代码写一套属于自己的事件总线(EventBus)库
  6. leetcode738 单调递增的数字
  7. 基于gan和孪生网络框架,利用双时间光学遥感图像绘制滑坡清单Landslide Inventory Mapping Using Bi-Temporal Optical Remote Sensin
  8. 视频云转码源码|php云转码系统源码双码率秒切
  9. Apache Harmony的介绍
  10. uni-app 写小程序 索引列表,仿微信通讯录