querylist.php下载,PHP 强大的采集工具,QueryList
# QueryList简介
***
`QueryList`是一个基于`phpQuery`的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。
# QueryList 安装
通过`composer`安装:
```
composer require jaeger/querylist
```
更多安装方法:[QueryList多种安装方式](https://doc.querylist.cc/site/index/doc/7)
# QueryList 使用
下面演示`QueryList`用一句代码采集百度搜索结果:
```php
//获取采集对象
$hj = QueryList::Query('http://www.baidu.com/s?wd=QueryList',array(
'title'=>array('h3','text'),
'link'=>array('h3>a','href')
));
//输出结果:二维关联数组
print_r($hj->data);
```
上面的代码实现的功能是采集百度搜索结果页面的所有搜索结果的`标题`和`链接`,然后分别以二维关联数组的格式输出。
采集结果:
```
Array
(
[0] => Array
(
[title] => QueryList|基于phpQuery的无比强大的PHP采集工具
[link] => http://www.baidu.com/link?url=IIsMhpzI2PylnmW8vPALcwIfJgHhKFu2SWXEj7yQ-6o7KStbLfmuoWGmalpx1xYE
)
[1] => Array
(
[title] => 介绍- QueryList指导文档
[link] => http://www.baidu.com/link?url=edktLqt6f9KwYJ6oip1EDXvwIXh-nHcFImVJeqRm56-VU3zIcqLRYeM83VyYQE_X
)
//省略....
)
```
## Query() 静态方法
返回值:`QueryList对象`
Query方法为`QueryList`唯一的主方法,用静态的方式调用。
**原型:**
> QueryList::Query($page,array $rules, $range = '', $outputEncoding = null, $inputEncoding = null,$removeHead = false)
**中文解释:**
```
QueryList::Query(采集的目标页面,采集规则[,区域选择器][,输出编码][,输入编码][,是否移除头部])
//采集规则
$rules = array(
'规则名' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),
'规则名2' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),
..........
[,"callback"=>"全局回调函数"]
);
//注:方括号括起来的参数可选
```
### 参数解释:
查看文档:http://doc.querylist.cc/site/index/doc/11
## QueryList 扩展
**Request 网络操作扩展**
可以实现如携带cookie、伪造来路等任意复杂的网络请求,再也不用担心QueryList内置的抓取功能太弱了。
**Login 模拟登陆扩展**
可以实现模拟登陆然后采集。
**Multi 多线程插件**
多线程(多进程)采集扩展。
**DImage图片下载扩展**
可实现简单的图片下载需求。
扩展安装以及使用教程:[QueryList扩展文档](https://doc.querylist.cc/site/index/doc/19),获取更多扩展可以关注`QueryList`社区和交流群。
## 其它说明
1.`QueryList`内置的只是简单的源码抓取方法,遇到更复杂的抓取情况,如:需要登陆
身份验证 时,请配合其它的PHP的HTTP工具(推荐使用[Guzzle](http://guzzle-cn.readthedocs.io/zh_CN/latest/))来使用,通过将辅助的HTTP类抓取到的网页源码传给`QueryList`即可。
2.采集程序请在PHP命令行模式(PHP CLI)下运行。
3.`QueryList`依赖`phpQuery`,`phpQuery`项目主页:[phpQuery文档](https://code.google.com/p/phpquery/)
## 寻求帮助?
- QueryList交流社区: [http://querylist.cc/](http://querylist.cc/)
- QueryList文档: [http://doc.querylist.cc/](http://doc.querylist.cc/)
- QueryList交流QQ群:123266961
- Git@OSC:http://git.oschina.net/jae/QueryList
- GitHub:https://github.com/jae-jae/QueryList
## Author
Jaeger
## Lisence
QueryList is licensed under the license of MIT. See the LICENSE for more details.
querylist.php下载,PHP 强大的采集工具,QueryList相关推荐
- 天猫php采集列表,QueryList: QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。...
#QueryList交流社区: http://querylist.cc/ #QueryList文档: http://doc.querylist.cc/ #QueryList交流QQ群:12326696 ...
- QueryList 4.0 简洁、优雅、可扩展的PHP采集工具(爬虫)
QueryList 简介 QueryList是一套简洁.优雅.可扩展的PHP采集工具(爬虫),基于phpQuery. 特性 拥有与jQuery完全相同的CSS3 DOM选择器 拥有与jQuery完全相 ...
- QueryList是一套简洁、优雅的PHP采集工具(爬虫),基于phpQuery。
QueryList是一套简洁.优雅的PHP采集工具(爬虫),基于phpQuery. 特性: 拥有与jQuery完全相同的CSS3 DOM选择器 拥有与jQuery完全相同的DOM操作API 拥有通用的 ...
- mysql url查找_Superl-url:一款开源、强大的关键词URL采集工具
原标题:Superl-url:一款开源.强大的关键词URL采集工具 superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集. 程 ...
- Keep It for Mac 1.3.4 强大的笔记本工具 破解版下载
Keep It for Mac 是笔记本,剪贴簿和组织者,非常适合写笔记,保存网页链接,存储文档,图像或任何类型的文件,并再次找到它们.Keep It 是 Together 的继承者. Keep It ...
- 推荐7款实用强大的神器工具,建议你先收藏,总有一天你会用到!
分享7个非常强大的神器工具,每一款都是精品,喜欢的话记得点赞支持哦~ 1.后羿采集器 后羿采集器是前谷歌技术团队倾力打造,基于人工智能技术,只需要输入网址就能自动识别采集内容.支持Win/Mac/Li ...
- put url带参数_Superlurl 一款开源关键词URL采集工具
superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集.可自动从搜索引擎采集相关网站的真实地址与标题等信息,可保存为文件,自动去 ...
- superl-url,关键词URL采集工具
superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集. 程序主要运用于安全渗透测试项目,以及批量评估各类CMS系统0DAY的影 ...
- Superl-url:一款开源关键词URL采集工具
superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集. 程序主要运用于安全渗透测试项目,以及批量评估各类CMS系统0DAY ...
最新文章
- 链表倒置 (不额外开辟另一块空间)
- c++如何让字符串重复输出_python编程入门八:列表、元组、字符串的转换及补充方法...
- 超适合小白的python新手教程
- Split-Bregman迭代方式
- 我的世界java版联机不稳定_我的世界:你一定不会相信,时隔2年,网易这次真的“更新”了...
- python3 文本处理_解决python3 写入中文文本查看为乱
- Charles抓包:APP抓包工具配置手机代理证书
- ChatGPT Network Error 在使用chatGPT的过程中回答到一半显示网络错误
- 【案例分析】服务器数据恢复
- UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xca in position 358: in
- 做内网穿透外网远程访问群晖NAS 2-2
- 最新!OMNI3D:3D目标检测的大型基准和模型(Meta AI)
- 反光衣穿戴识别检测系统 OpenCV
- python风控建模实战(分类器模型+回归模型)
- 电商平台营销活动玩法大全
- 诚之和:困在数字里的蜜雪冰城,被迫IPO
- mysql查询星期一到星期日的数据
- 黑苹果隔空投送无法双向传输解决
- 信息与通信的数学基础——第十章 数学物理方程
- 进程、线程、多线程举例说明
热门文章
- unity3d(人机博弈,棋类相关)
- lol桌面图标在计算机哪找,win7系统英雄联盟桌面快捷方式不见了的解决方法
- 百度移动联盟服务评测
- mysql模糊查询实例_Mysql实例sql模糊查询实例详解
- 200代码写一套属于自己的事件总线(EventBus)库
- leetcode738 单调递增的数字
- 基于gan和孪生网络框架,利用双时间光学遥感图像绘制滑坡清单Landslide Inventory Mapping Using Bi-Temporal Optical Remote Sensin
- 视频云转码源码|php云转码系统源码双码率秒切
- Apache Harmony的介绍
- uni-app 写小程序 索引列表,仿微信通讯录