主要功能

(1)定向采集目标网站内容,并直接发布。

(2)可以设置对应入库的分类。

(3)可以自定义文章的标签。

(4)可以自定义替换标题、文章内容。

(5)自动另存为图片到本地。

(6)自动删除内容中的所有链接。

(7)加入百度翻译,可以将内容翻译成英文。

(8)脚本定时自动增量功能。

插件截图如下

如何安装WordPress采集插件WP-JPost?

方法一:在后台插件中直接搜索“wp-jpost”

方法二:在WordPress插件官网下载,然后上传安装

https://wordpress.org/plugins/wp-jpost/

如何添加采集任务?

任务名命名请使用英文字母数字组合. 例:douban。

抓取目标网站域名(网址以/结束)这里填写目标网站首页的地址,以/结束。 例:https://www.douban.com

抓取目标网站列表页列表页一般都是二级页面,是栏目的具体展示页,一般是用页内跳转的链接。 例如:https://www.douban.com/group/meituikong/

入库目标分类IDWordPress 后台 -- 文章 -- 分类目录 -- 编译你想入库到的分类 -- 查看浏览器地址栏的地址。

例:/wp-admin/term.php?taxonomy=category&tag_ID=38... 这里的tag_ID=38,这个38就是我们需要填写的值。

标签WordPress 入库时,写入文章的标签值。多个标签请使用,分割(英文状态的逗号分隔) 例:WordPress,LaoJi,wp-jpost。

目标网站a链接元素列表页中到二级目录的链接地址,同jQuery选择器方法。

分页格式列表页中第二页区别列表页的地方。例: 列表页地址:https://www.douban.com/group/meituikong/

翻页后变成:https://www.douban.com/group/meituikong/discussion?start=8850

那么这里就填写:discussion?start={page} 这里的 {page} 就是翻页变化的地方。

分页最大值这里填写翻页后最后的page值。例: http://147hub.com/page/2052 这里翻页的最大值,即填写:2052

获取单页标题、目标单页获取元素 :title

内容页中标题、内容的标签值。同jQuery选择器方法。下面我们具体得讲述一下怎么选择元素。

首先我们需要使用chrome、firefox之类的浏览器。这些浏览器都具有调试等功能。我们这里以Firefox为例。

首先分析代码,以下元素标签可以是div , h3 ,title ,span , p 等。 例:...元素标签>,那么我们应该则填入:元素标签.classname。 例:...元素标签>,那么我们应该则填入:元素标签#classname。

步骤:

1、网页空白处右击 -- 查看元素 。 下面会弹出一个调试器出来。

内容搜索值 、内容替换值(可以批量多个替换)

比如标题正文中带有一些原来的字符串,我想替换成我的,或者不要了。 注意:这里如想替换成一样的值,可以直接写一个。如每个替换成不同的则需要对应填。

例:

搜索值:- 摔角资料, - 赛事新闻 - 摔角网, - 赛事战报, - 摔角网

替换值:

搜索值:搜索1,搜索2,搜索3

替换值:替换1,替换2,替换3 注意这里要一一对应。例如搜索2去要替换成空则替换值也需要留空(替换1,,替换2),否则就不能对应替换了。

wordpress php 采集器,wordpress 采集插件怎么用相关推荐

  1. wordpress采集器-wordpress采集器安装下载教程

    wordpress采集器可以批量采集伪原创发布到wordpress网站上吗?有了这款wordpress采集器我们应该怎么把企业站优化好?[附下载],网站seo基础也需要考虑,比如URL优化.因为如果U ...

  2. 火车头采集器文章翻译插件(文章标题内容中英双语对照|自动插入相关图片)

    火车头采集器文章翻译插件(文章标题内容中英双语对照|自动插入相关图片) 为了保护接口压力防止被封IP: 请把采集的间隔时间调整为10000~100000 火车头采集器文章翻译插件(文章标题内容中英双语 ...

  3. 火车头采集器php,php插件

    作者:小文 发布于:2012-3-29 10:58 Thursday 分类:软件培训 v7版本的PHP插件和2010的插件是一样的.还是只处理列表页,内容页,多页的网页源代码,保存时的标签. 在该教程 ...

  4. 火车头采集器双标题插件【完整php源码】

    最近比较流行的一种伪原创方式,火车头采集器双标题插件,功能主要如下: 1.原文标题伪原创,实现标题相关双标题: 2.文章内容伪原创,提高文章的原创度: 3.文章内容摘要提取. 废话就不多说,插件是用p ...

  5. 后羿采集器怎么导出数据_后羿采集器如何采集亚马逊评论

    很多人不清楚后羿采集器如何采集亚马逊评论以及后裔采集器有什么作用,下面就让一米软件来给大家说一说. 后羿采集器一款真免费的爬虫软件,使用后羿采集器导出数据到本地文件和数据库没有数量限制,不要钱不要积分 ...

  6. URL采集器-关键词采集

    URL采集器-关键词采集 Msray-plus,是一款采用GO语言开发的企业级综合性爬虫/采集软件. 关键词:搜索引擎结果采集.域名采集.URL采集.网址采集.全网域名采集.CMS采集.联系信息采集 ...

  7. 后羿采集器怎么导出数据_后羿采集器如何采集历史天气数据这类直接就是表格的数据?...

    感谢邀请,废话不多,直接上操作视频~八爪鱼采集器智能采集天气网https://www.zhihu.com/video/1129681164935540736 我试了一下,楼主说的问题确实存在,同时我对 ...

  8. 八爪鱼 八爪鱼采集器四大采集模式

    八爪鱼采集器四大采集模式 1.简易模式 2. 自定义采集 3.智能采集 立即使用    ----   使用智能模式采集 4.向导模式 立即使用   ---   使用向导模式采集 四个模式各有优缺点 , ...

  9. SSCMS采集,SiteServer采集插件【.NET版】,SSCMS文章采集器【采集教程】

    SSCMS采集,SiteServer(SSCMS)是中国.NET平台CMS系统创始者!同时也是唯一一款开源免费的企业级CMS系统,但是市面上很少支持SSCMS文章数据采集的采集器,有基本都是需要马内的 ...

  10. 后羿采集器怎么导出数据_免费爬虫工具:后羿采集器如何采集同花顺圈子评论数据...

    本文主要介绍如何使用后羿采集器的智能模式,免费采集同花顺圈子首页短评的发布时间.发布内容.作者及阅读量等信息. 采集工具简介: 后羿采集器是一款基于人工智能技术的网络爬虫软件,只需要输入网址就能够自动 ...

最新文章

  1. PHP二维数组去重(指定键名)
  2. Caffe自己修改训练方法
  3. 【Pytorch神经网络理论篇】 14 过拟合问题的优化技巧(一):基本概念+正则化+数据增大
  4. 文件上传java前端怎么写_做一个文件上传,前端是ajax提交数据后台是java,这个错误怎么办...
  5. 1111 复习 形状的打印
  6. 【Java】while和do-while循环比较测试案例
  7. 在libevent中使用线程池
  8. java线程的状态有几种_Java线程的几种可用状态
  9. pyqt5获取显示器的分辨率
  10. 计算机管理 网络延时打开,如何解决网络延时-如何解决局域网访问延迟问题?通过局域网访问网内机子,有时候半天没 爱问知识人...
  11. paip.项目开发效率提升之思索
  12. 字体识别在线工具-整理
  13. tpadmin的坑收集 nginx下配置tp5失败
  14. RFID技术在物联网中有哪些应用
  15. 苦才是人生的经典美言
  16. MySQL--binlog--介绍/用法
  17. 待支付取件费用是什么意思_菜鸟裹裹待支付怎么取消
  18. macOS中快速打开终端
  19. MAC VMware Fusion 克隆虚拟机
  20. 华为AC旁路二层组网直接转发示例

热门文章

  1. T-test数据分析
  2. python docx与doc 文件互相转换
  3. 对接淘宝天猫平台的第一篇
  4. C语言用循环写出新年祝福语图案,如何用C语言写新年祝福
  5. 【Linux】进程信号
  6. mini6410移植全攻略(3)--uboot移植之支持nand flansh启动(上)
  7. (ssl1458)数字金字塔(三角形)逆推法
  8. android - 【记录】三星手机(N9002)刷机、官方系统、TWRP
  9. redis实现高并发投票网站
  10. smartGit系列之长期使用批处理脚本