对于通过关键词,在网页的搜索栏检索的情况,可以在软件中,通过配置关键词实现。那么,今天小编来为大家介绍:如何在前嗅ForeSpider中,配置关键词。

一,关键词配置的步骤

第一步:打开关键词采集设置
点击关键词采集按钮, “关键词采集”功能启动。

第二步:进行关键词采集配置
开启关键词配置后,在界面右下角会出现关键词配置向导,按照“关键词配置步骤”后面的提示进行操作。
在搜索关键词时,分为有验证码搜索和无验证码搜索两种方式。
(1) 无验证码
逐个单击关键词配置步骤中的按钮,根据提示一步步进行关键词配置。对于无验证码的情况,可以跳过“验证码”、“验证域”两步。
以凤凰网(http://news.ifeng.com/listpag...)为例:
① 按Ctrl+鼠标左键单击搜索栏,保存后关闭。
单击搜索栏:

②点击“完成”
③按Ctrl+鼠标左键单击“搜索按钮”。

单击搜索按钮

④配置关键词列表
在关键词列表区域添加关键词,可以用于关键词搜索。

关键词列表

(2) 有验证码
逐个单击关键词配置步骤中的按钮,根据提示一步步进行关键词配置:
①按Ctrl+鼠标左键单击搜索栏,保存后关闭。
②按Ctrl+鼠标左键单击“验证码输入框”。
③按Ctrl+鼠标左键单击“验证码图片”。
④点击“完成”。
⑤按Ctrl+鼠标左键单击“搜索按钮”。

二,关键词书写规则

1.书写规则
①关键词之间用英文“;”或回车换行隔开。
②支持组内有两个关键词,组内关键词用英文“,”隔开。
③各组的关键词排列顺序必须保持一致。

2.填写方法
①保存:填写关键词后,保存生效。
②导入:支持导入txt格式的批量关键词文档,文档不超过5M大小。
③去重:自动去除重复的关键词。
④清空:清空关键词列表。

三,关键词的高级配置方法

  1. 需要“高级配置”的情况

使用可视化配置之后,依旧无法正确采集时,说明关键词可视化配置获取到的参数信息,缺失或有误。
需要通过点击“高级配置”按钮,在弹框中手动配置关键词参数。对比表单中的参数名称,手动添加各项参数。

  1. 高级配置介绍

参数是指网页请求数据时,返回的参数信息。
关键词配置-参数编辑

(1)请求地址
①一般情况下,完成“关键词设置”后,请求地址会自动填充上。
②如果没有或者有误,可以手动进行添加。简单的请求地址可以通过观察,找到各项参数。复杂的请求地址需要借助浏览器的开发者工具。
(2)POST请求
用户根据目标网址不同,是否为POST请求,来决定是否选择POST。
(3)Cookie刷新方式
是指每采集每一条数据时,是否刷新采集地址入口页,以获取Cookie信息,可以参考开发者工具里面的Cookie看一下是哪种刷新方式。
①不刷新:无需刷新入口地址。
②首次刷新:数据采集时,只刷新一次入口地址。
③重复刷新:采集每个关键词时,都刷新一次入口地址。
(4)请求参数表
一般情况下,完成“关键词配置”后,请求参数表里的参数信息会自动填充上。如果没有填充或有误,则按照下文进行手动配置。

3.高级配置示例
以该网址为例,介绍如何手动添加参数表。http://www.soqi.cn/search.xht...
第一步:观察网址规律。
①请求地址:“?”前的地址是页面的请求地址。
②检索关键词:keywords。
③其他参数:“=”前是参数名称,“=”后是参数值。(如有验证码,参数类型中需要有“验证码”)
第二步:添加参数表。
点击添加按钮,添加参数。
添加参数表

第三步:修改参数表。
修改参数表

前嗅ForeSpider教程:配置关键词相关推荐

  1. 前嗅ForeSpider教程:创建模板

    今天,小编为大家带来的教程是:如何在前嗅ForeSpider中创建模板.主要内容有:模板的概念,模板的配置方式,模板的高级选项,具体内容如下: 一,模板的概念 模板列表的层级相当于网页跳转的层级.模板 ...

  2. 前嗅ForeSpider教程:数据建表

    今天,小编为大家带来的教程是:如何在前嗅ForeSpider中,进行数据建表操作及各注意事项.主要内容包括:快速建表,自由建表,字段参数,数据表的创建,关联与删除,以及表单变更后的配置修改. 一,如何 ...

  3. 前嗅ForeSpider教程:验证码设置

    当我们遇到某些网站,采集每一条数据都需要输入一条验证码时,就用到了验证码设置.今天,小编为大家详细介绍一下:前嗅ForeSpider中的验证码设置.具体操作如下: 当采集某些网站的数据时,每一条数据都 ...

  4. 前嗅ForeSpider教程:IP代理设置

    今天,小编主要为大家介绍一下:前嗅ForeSpider中的IP代理设置,主要内容包括:启用IP代理,静态代理设置,动态代理设置,这三大部分.具体内容如下: 一,启用IP代理 启用IP代理采集时,需要进 ...

  5. 前嗅ForeSpider教程:网站登录配置 1

    2019独角兽企业重金招聘Python工程师标准>>> 当我们在采集中碰到:所采集的网站数据需要登录,才可以看到所需信息时,则需要在软件中模拟登陆环境,采集数据,此时需要配置登录信息 ...

  6. 前嗅ForeSpider教程:网站登录配置

    当我们在采集中碰到:所采集的网站数据需要登录,才可以看到所需信息时,则需要在软件中模拟登陆环境,采集数据,此时需要配置登录信息. 今天小编就教大家:如何进行网站登录配置,具体步骤如下: 登录网站配置: ...

  7. 前嗅ForeSpider教程:采集美团网

    2019独角兽企业重金招聘Python工程师标准>>> 以美团为例,通过关键词搜索后的结果列表,由列表进入正文页采集正文数据: 第一步:新建任务 ①点击左上角"加号&quo ...

  8. 前嗅ForeSpider教程:采集图片/视频/资源文件的链接地址

    昨天为大家介绍了如何采集图片/视频/资源文件后,有小伙伴问我如何采集他们的链接地址,今天小编就为大家演示如何采集图片/视频/资源文件的链接地址,操作如下: 第一步:新建任务 ①点击左上角"加 ...

  9. 前嗅ForeSpider教程:如何创建新任务

    从今天起,小编开始教大家逐步进行可视化配置操作.首先,我们来学习第一步:创建新任务,主要包括创建新任务的操作步骤,操作中的注意事项两部分内容. 一,创建新任务操作步骤: 1.添加新任务 点击任务列表右 ...

最新文章

  1. 计算机组装与维护实例教程,计算机组装与维护案例教学-20210714101609.pdf-原创力文档...
  2. web前端学习day_03:JavaScript:如何使用/ 语法/ 方法/ NaN/ js对象分类/ BOM浏览器相关/ 事件/ DOM文档对象模型
  3. php贝叶斯,php – 将单个概率与朴素贝叶斯垃圾邮件过滤相结合
  4. ASP.NET 2.0+Atlas编写鼠标拖放程序(2)
  5. python约瑟夫环单向循环链表_约瑟夫环的单向循环链表的实现代码
  6. .netcore下的微服务、容器、运维、自动化发布
  7. redis和oracle同步方案,redis与oracle之间怎么实现数据同步?
  8. [渝粤教育] 广东-国家-开放大学 21秋期末考试市场营销10256k2
  9. java实现奇偶位交换
  10. ModuleNotFoundError: No module named 'tornado'解决办法
  11. 自动化查询及增加配置参数功能
  12. [xshell] xshell 及 xftp 官网无法下载解决
  13. CVX用户指南之求解器
  14. java语言特点概述
  15. Helix QAC/QAC++ — 软件静态测试工具
  16. 中企海外周报 | 华晨与力帆合作在乌拉圭建厂;奇瑞在沙特发布全新SUV
  17. 【转载】【PC】解决访问小米路由器外接硬盘需要密码/无密码访问小米路由器共享盘
  18. 高质量外链的十大特性
  19. HDMI转Displayport转换器支持4K分辨率
  20. 【区块链108将】BKFUND许超逸:Token为基金管理行业带来新的空白市场机会

热门文章

  1. Python + Selenium,带你分分钟搭建 Web 自动化测试框架!
  2. 计算机基础应用网络统考题库,2016年9月网络教育《计算机应用基础》统考模拟试题及答案 (1)...
  3. php redis list 长度限制,(PHP)redis List(列表)操作
  4. python判断互质_整数判断是否互质并求逆元的 python 实现
  5. 阿里测试人员:8年经验分享自学软件测试学习路线
  6. PAT甲级1019 回文数
  7. matlab虚拟现实之V-Realm Builder2使用NavigationInfo精确定位、建模
  8. php加密数据库工具,各位用php将密码存入数据库,都用什么方法进行加密的?
  9. java 中特殊的_Java中一些特殊关键字
  10. java dayofweek_Java日期时间API系列22-----Jdk8中java.time包中的新的日期时间API类,Month月份和DayOfWeek星期的计算。...