咔咔不会用python,也没打算为了爬点东西就去学python。时间成本不允许我这样做

于是咔咔使用了一款工具,火车头采集工具

这款工具学会了很简单,不会的全是问题

下来咔咔会把这个工具的从开始到结束的实现流程写出来

此篇文章用时俩天完成,咔咔也是从一个小白摸索过来的,网上的文章我是看的一头雾水,就写了一篇,希望可以帮助到大家

基础准备

1.下载火车头采集工具

火车头工具有可能需要登录,自己看

2.认识火车头web发布配置:是使用接口进行发布

web发布模块:是使用接口发布的参数,相当于是一个发布模板而已

数据库发布配置和数据库发布模块也是同理

但是经常使用的就是web发布的这俩个模块,数据库的自己试试就可以了

2-1.新建采集任务

2-2.设置网址采集规则

起始网址就是需要采集的地址

采集案例

1.配置采集规则

先用电影类型这个链接

然后查看网址规则,我们会发现这个就是我们需要的采集地址

然后将采集网址和采集规则写到配置里边

点击网址测试采集,然后这些网址就是我们需要采集的内容页网址

2.获取图片

可以看到他的图片代码是这个样子的

开始写规则

3.获取原名

这一块可以看到的是他的标签都是一样的,那么设置的采集规则也就是一致的

设置规则就如下

4.标签相同的怎么采集

这里可以看到俩个html结构都是一样的,但是我们只想要第二个结构里边的内容

采集方案:把第一个结构的结尾带着即可

5.以下就是需要采集的所有内容

基本原理差不多,只要是功能的熟悉即可

6.在简单的说一下图片下载这个问题吧!

案例网址这里就不提供了,可以跟着本案例进行一步一步操作即可

比如说我们现在需要采集这张图片

然后我们需要查看一下源码

配置规则并进行测试

查看结果,可以看到图片已经下载下来了

配置文件下载,双击唐嫣图片这个标签,然后点击文件下载

然后将这俩个选择,在测试一下

这个时候就可以看到图片已经下载到本地了

7.如何采集一个网页的多张图片以上就是采集数据的一个简单流程,具体的配置规则和使用自己多点点多测测都可以实现的

是在不行的话联系咔咔哄!

配置使用接口一边采集一边同时发布到自己的数据

1.配置发布文件

点击web发布模块

配置接口地址和数据库字段名

表单名:就是数据库字段

表单值:就是在火车头添加的获取字段

然后点击保存即可

然后到发布规则里边在把发布配置添加进去

这个就是添加完成的样子

然后在点击web发布配置就出现了咱们刚刚配置的发布文件

2.测试当前发布这一步就需要我们来写接口了

同步的还需要建立数据库

写入库接口

双击BT之家发布,然后点击测试当前发布

点击测试即可以看到我在控制器打印的123

接下来就是数据入库了,这步就不写了,自己用的什么语言就写什么代码即可

这就是火车头采集的所有流程,如有什么疑问的联系下方联系方式

博主联系方式欢迎交流

火车头php post提取内容,【火车头采集教程】轻而易举学会火车头采集(附带采集案例)...相关推荐

  1. 【火车头采集教程】轻而易举学会火车头采集(附带采集案例)

    咔咔不会用python,也没打算为了爬点东西就去学python.时间成本不允许我这样做 于是咔咔使用了一款工具,火车头采集工具 这款工具学会了很简单,不会的全是问题 下来咔咔会把这个工具的从开始到结束 ...

  2. 疯子网页采集器之提取内容教程

    疯子网页采集器之提取内容教程 第一步: 填写"链接开始",0就是第一个链接,4就是第五个链接,这里填0 填写"地址变化",比如4就会采集第1.5.9...的链接 ...

  3. 快客原创 火车头数据采集视频教程——第1讲 ecshop zencart shopex lightinthebox 网店数据批量采集教程

     (欢迎广大网友交流 qq:158393237 旺旺: q459255119) ecshop zencart shopex lightinthebox 网店数据批量采集教程 点击打开链接 快客原创视频 ...

  4. 火车头采集文章到本地-火车头采集导出各种格式导本地设置

    火车头采集文章到本地,要更好的使用火车头采集器软件,必须需要有基本的HTML基础,能看得懂网页源码,网页结构. 同时如果用到web发布或数据库发布,则对自己文章系统及数据存储结构要非常了解.当然对HT ...

  5. 火车头采集php源码不同,防火车头采集的功能

    求一个防火车头采集的功能 快两年没动代码了,最近自己弄了一个站玩. 有些资料老被火车头拖来拖去的. 求一个完整的防火车头采集的功能模块. 自己弄了半天 思路是这样的比如在某一个时间段ip多次请求 就把 ...

  6. php采集规则,php74 骑士 火车头采摘简历 接口及采集规则

    php74 骑士 火车头采集简历 接口及采集规则 研究了下骑士官方发布的火车头采集接口api并没有相关简历对应的采集接口 因此就自己写了个方法对应简历采集接口实现可查询.相关字段匹配等.和企业采集接口 ...

  7. pdfparser java_如何使用java从PDF中提取内容?

    在Java编程中,如何使用java从PDF中提取内容? 项目的目录结构如下 - Tika的工具包可从以下网址下载:http://tika.apache.org/download.html ,只下载:t ...

  8. 后羿采集器怎么导出数据_后羿采集器教程:如何采集东方财富网股票数据

    本文介绍如何使用采集器的智能模式,实时采集东方财富网行情中心新三板股票数据 采集工具简介: 后羿采集器是一款基于人工智能技术的网页采集器,只需要输入网址就能够自动识别网页数据,无需配置即可完成数据采集 ...

  9. 织梦采集-织梦采集教程-织梦采集插件下载教程

    织梦采集教程?织梦cms是一个独立的网站程序.今天给大家推荐的是织梦模板(内置5W套织梦cms织梦模板)以及免费织梦插件大全其中包括有:织梦cms采集插件.织梦cms伪原创插件.织梦cms发布插件.织 ...

最新文章

  1. Python学习笔记 - PostgreSQL的使用
  2. CLR Profiler 性能分析工具 (转)
  3. 电厂MIS,SIS简介
  4. cacti config.php,cacti监控系统的安装配置
  5. [译]Javascript数列的push和pop方法
  6. PHP/AJAX——登录页面与登录信息提示(非安全版本)
  7. HDU1561 The more, The Better
  8. Java Socket实战之四 传输压缩对象
  9. 各纬度气候分布图_欧洲气候特征:以温带气候类型为主,是海洋性气候最显著的大洲...
  10. 怎么实现hover_写CSS动效的常用套路(附demo的效果实现与源码)
  11. Redis教程:数据库
  12. CentOS7入门:使用Vi文本编辑器
  13. 说话心理学 个人笔记
  14. selenium利用cookie跳过验证码登录
  15. 有测试智商的软件不,测试智商的软件有哪些
  16. 【有利可图网】双十一“亮眼”设计大赏来了!!
  17. 浅析IDC行业的前景
  18. 折弯机使用说明书_折弯机基本操作说明
  19. 宋婷科幻作品连载 | 算力:幻想几何学(一)
  20. 朗强:画面分割器投影拼接设备与原理

热门文章

  1. 《数学建模算法与应用第二版》——chapter3. 非线性规划
  2. 诊所数字化:诊所医护人员绩效指标评估方式
  3. Python自动化第二周之数据模块
  4. 用计算机制作动画,什么是计算机动画制作
  5. Field communityMapper in com.estate.service.impl.CommunityServiceImpl required a bean of type ‘
  6. 日语基础复习 Day 4
  7. Vant Tab标签页+下拉刷新+上拉加载
  8. 算法学习之膨胀腐蚀算法
  9. 11 | 数据科学家80%时间都花费在了这些清洗任务上?
  10. JEECG报表整合方案