火车头采集的文件发布到服务器上,火车头采集器图片采集上传设置
教程总目录:
前面我们写了基础的标题和文章采集,下面介绍下图片的采集。
图片采集不是必须的,但是图片可以丰富网站的内容,具体我也不清楚对网站的SEO有什么影响。我测试采集图片和不采集图片收录没区别,我见到的一些采集站,大部分也是不采集图片的!
如果采集数据量比较大的话可以选择不采集图片。
正文开始
首先是火车头采集器上的设置。
我们以这个文章为例:https://server.zzidc.com/serverhosting/3117.html
这个里面有一张图片,并且也是前面我们教程里用做示范的网站。
声明:本人目前没使用任何景安的产品(以前用过),也对他产品印象不好。仅做教程示例,没有推荐他产品的意思。
我们直接打开前面教程创建的那个火车头采集任务。
在内容采集规则-内容-文件下载里面
选择:将相对地址补全为绝对地址、下载图片
文件地址必须包含:uploads/allimg
这个必须包含是根据不同网站来设置的,比如本文教程里文章图片地址是:
https://server.zzidc.com/uploads/allimg/191015/1-191015150925U2.png
那么除掉前面他网站域名和后面会产生变化的文件名和日期格式的目录名之外剩余的基本就是我们想要的内容,所以我这里让图片文件地址必须包含uploads/allimg。
为什么这么做?
因为他有可能在文章里加入图片广告,图片广告为了便于修改,大部分都是采用单独目录内放图片广告的方式。这样以后该广告比较容易。新老文章都能一次修改掉。
文件保存目录:i\m\g/yyyyMMdd
这个目录是你采集器的本地电脑和服务器里面要创建的目录,先存到本地然后上传到服务器里。
目录里面的\斜杠是因为默认img里面m和g会被火车头识别为内置函数(字母颜色会变绿),没办法正常解析,所以加上斜杠。正常的话是img/yyyyMMdd这样的
含义:表示保存到网站的/img目录下,然后根据年月日自动创建对应的目录。
然后是在内容的-HTML标签排除里面,我们去掉图像
然后我们进行图片的上传设置,我们采集时候顺序是,先将图片下载到本地,然后传到服务器这样一个步骤。
通过FTP的方式来上传。
先在宝塔面板上传建一个FTP账户,FTP默认目录要设置在我们网站跟目录。
采集器会根据我们上面的设置自己创建对应的目录。
注意:FTP使用的端口记得打开!21、20、39000-40000不打开端口你图片自然传不了。放行20和39000到40000这些端口是因为宝塔的FTP经常出现FTP连接错误的情况,这是另一个问题。这里不给大家解释了,不然篇幅太长了。
打开火车头采集器:其他设置、FTP文件上传、FTP上传
服务器:填写你的服务器IP地址
用户名/密码:刚才创建的FTP账户和密码
端口:默认21
文件上传根目录:/
次序:先发布数据
文件上传成功后删除本地文件:是
这里也可以选择否,选择是的话可以减少采集器所在机器磁盘的占用,而且上传成功的图片,也没必要在保留了。
设置好了之后我们点一下上传测试文件:
看下下面的框里显示的信息,有没有成功上传,并且打开网站目录内也看下有没有测试文件Test.zip被上传。
测试OK的话保存一下设置,我们测试下看看采集效果
https://server.zzidc.com/serverhosting/3117.html
把这个网址填入到网址采集规则里
因为我们测试的直接是一个内容页网址,所以网址采集规则下面我们要点一下:起始网址就是内容页网址
保存,然后清空任务采集数据
运行任务
看运行日志没问题,我们到网站上看看有没有发布上
文章正确进行了发布,4个图片都正常显示了
本章教程结束!
去看你博客原创文章,作者:去看你博客,如若转载,请注明出处:https://www.7kanni.cn/2804.html
火车头采集的文件发布到服务器上,火车头采集器图片采集上传设置相关推荐
- android 投屏截图,手机投屏到电脑上怎样截图?图片格式可以这样设置
现在的手机功能可以说太齐全了,不仅可以满足各种生活需求,办公也不在话下,手机方便归方便,真正办起公来还是电脑更顺手一些,毕竟屏幕比较大,展示的也比较清楚,手机同步电脑也可以的,但是需要连接线才行,不是 ...
- linux smb上传文件,使用Samba服务器由win平台向linux平台上传文件
1.配置yum [[email protected] /]# cd /etc/yum.repos.d/ [[email protected] yum.repos.d]# vi yum.repo --修 ...
- vue - element <upload> 组件批量上传文档,可携带其他表单数据项一同与文件 “手动提交“ 服务器(类似百度文库系统批量上传前端界面与逻辑)超详细教程示例源码,提供界面与逻辑完整源码
效果图 本示例使用的是 element 组件库,其实什么组件库都行(逻辑是一样),只要你是 vue.js 项目就能使用本教程. 本文实现了 vue + element 使用 upload 组件批量上传 ...
- 上传文件到tftp服务器,网络基础知识:TFTP协议之上传文件
原标题:网络基础知识:TFTP协议之上传文件 上传文件指的是客户端将本地上的文件上传到TFTP服务器上.下面介绍客户端如何进行文件上传,以及上传时所涉及的各类型数据包. 1.工作流程 客户端会向TFT ...
- 微信jssdk图片上传给服务器,使用微信JSSDK进行图片选择和上传
2015-04-28 2018-08-21 06:20:42 最近我在用 PHP 做某微信公众号的开发,其中用到了微信jssdk进行图片的选择和上传.在参考了微信官方提供的jssdk文档之后,大致有了 ...
- 怎样传文件到虚拟服务器,Vmware虚拟机教程之本机如何传文件到VMware 中
本机传文件到VMware 中可以使用2种方法,1.安装tools,直接拖拽过去.2.实现文件共享.在VMware中没有安装解压文件的应用时,使用tools会不再适用.这时可以选择共享文件夹的方式,直接 ...
- 工作笔记1——利用bat脚本实现批量上传文件到ftp服务器
工作笔记1--利用bat脚本实现批量上传文件到ftp服务器 问题概述 利用ftp命令实现上传文件 注意 限时功能 将共享目录映射到电脑中的某个盘符 实现断点续传 问题概述 公司中有大概225k个文件需 ...
- 打开cgi文件的网络服务器,cgi文件怎么打开 .cgi是什么文件 | 帮助信息-动天数据...
cgi文件怎么打开 .cgi是什么文件 作者:dthost | 时间:2017-12-14 | 分类:未分类 | 18,533 次阅读 cgi格式文件是"公共网关接口脚本"类型文件 ...
- 采集文章自动发布:技术与应用探索
随着信息时代的到来,互联网成为人们获取知识的重要途径.在这个大数据时代,人们需要处理大量的信息和文章.然而,手动采集和发布文章已经无法满足需求.于是,采集文章自动发布成为了一个热门话题.本文将从多个角 ...
- php 采集 京东 图片,京东商品图片采集详细教程
本文介绍采集使用八爪鱼7.0采集京东商品图片的方法:首先将京东商品搜索结果网页中图片的URL采集下来,再通过八爪鱼专用的图片批量下载工具,将采集到的图片URL中的图片,下载并保存到本地电脑中. 采集网 ...
最新文章
- 这家芯片公司98%员工学历不足本科,却要布局全产业链冲刺IPO,网友:认真的吗?...
- 团队-科学计算器-模块测试过程
- mysql中的时间函数---运维常用
- aarch64的TCR寄存器介绍
- WF(9):本地服务之事件处理
- travis-cli 使用
- java ftp 上传文件到服务器,java实现ftp上传文件到服务器
- 各大媒体优劣对比_主流酱油选购对比
- php 脚本会超时吗,PHP脚本执行超时的解决办法
- 小试牛刀之Kolla单节点部署
- 数据中心的三种布线方式(EOR/MOR/TOR)
- js切换图片会闪动_js 特效 当鼠标经过的时候 图片闪一下光
- 粘性布局 以及粘性布局失效问题
- php实现离线挂机,自动离线挂机脚本下线自动挂机脚本
- python实验过程中遇到的问题以及解决办法_20183413 2029-2020-2《Python程序设计》实验一报告...
- 3蛋白wb_99% 的实验小白都会收藏,WB、ELISA、IHC 进阶攻略
- 重装系统后必装的5大软件,让你大幅度提升工作效率
- JDK8的介绍下载和安装(附网盘地址)
- 抽象工厂模式(三):抽象工厂模式概述
- 【微信小程序】微信小程序开发学习记录
热门文章
- 360 电脑重装系统服务器,电脑如何重装系统?360快速重装电脑系统教程
- 《蛙》杂记------莫言
- 《南方周末》今日发文揭开了这场抢票插件阻击战的内幕
- nic占用率很高 Linux,linux – 许多丢弃了我的NIC数据包
- PyQt5简易入门指南02,简单图片显示程序
- Let me not Pray 让我不再祈求
- Python + 批量裁剪图片
- 个人力扣刷题笔记 LCP 03. 机器人大冒险
- 计算机四舍五函数,技巧:在Excel中四舍五入为六至五十的最佳函数算法
- [Perl] Data::Dumper模块的用法简介