采集工具:火车采集器 v7.6

采集模块:新闻 News

一、编写采集入库脚本接口

新建:./api/caiji.php

/**

* 数据采集

*/

define('IS_API', basename(__FILE__, '.php')); // 项目标识

define('SELF', pathinfo(__FILE__, PATHINFO_BASENAME)); // 该文件的名称

require('../index.php'); // 引入主文件

新建:./dayrui/My/Api/Caiji.php

$this->_module_init('news'); // news 是模块目录

if ($_GET['action'] == 'category') {

// 显示栏目

foreach ($this->module['category'] as $t) {

if ($t['child'] == 0 && $t['tid'] == 1) {

echo '

'.$t['name'].'<=>'.$t['id'].'

'.PHP_EOL;

}

}

} else {

// 入库数据

$data = $_REQUEST;

// 发布者id 1

$data['uid'] = 1;

// 发布者账号 admin

$data['author'] = 'admin';

// 主表字段

$fields[1] = $this->get_cache('table-'.SITE_ID, $this->content_model->dbprefix(SITE_ID.'_'.MOD_DIR));

$cache = $this->get_cache('table-'.SITE_ID, $this->content_model->dbprefix(SITE_ID.'_'.MOD_DIR.'_category_data'));

$cache && $fields[1] = array_merge($fields[1], $cache);

// 附表字段

$fields[0] = $this->get_cache('table-'.SITE_ID, $this->content_model->dbprefix(SITE_ID.'_'.MOD_DIR.'_data_0'));

$cache = $this->get_cache('table-'.SITE_ID, $this->content_model->dbprefix(SITE_ID.'_'.MOD_DIR.'_category_data_0'));

$cache && $fields[0] = array_merge($fields[0], $cache);

// 去重复

$fields[0] = array_unique($fields[0]);

$fields[1] = array_unique($fields[1]);

$save = [];

// 主表附表归类

foreach ($fields as $ismain => $field) {

foreach ($field as $name) {

isset($data[$name]) && $save[$ismain][$name] = $data[$name];

}

}

if (!$data['catid']) {

exit('栏目为空');

}

$save[1]['uid'] = $save[0]['uid'] = $data['uid'];

$save[1]['catid'] = $save[0]['catid'] = $data['catid'];

$save[1]['url'] = '';

$save[1]['status'] = 9; //9表示正常发布,1表示审核里面

$save[1]['hits'] = 0;

$save[1]['displayorder'] = 0;

$save[1]['link_id'] = 0;

$save[1]['comments'] = 0;

$save[1]['avgsort'] = 0;

$save[1]['inputtime'] = $save[1]['updatetime'] = SYS_TIME + rand(0, 7200);

$save[1]['inputip'] = '127.0.0.1';

// 验证标题重复

if ($this->content_model->table(SITE_ID.'_'.MOD_DIR)->where('title', $save[1]['title'])->counts()) {

echo '重复';exit;

}

$rt = $this->content_model->save(0, $save);

if ($rt['code']) {

exit('成功');

} else {

exit('失败');

}

}

exit;

脚本文件中可以定义发布者等一些预定义字段默认值,如果你不会php的话可以保持默认

然后关闭系统的跨站提交验证。

二、火车采集器编写web发布规则

三、新建一个在线发布模块

四、填写获取栏目列表的参数

按照上面的格式写就ok了

五、内容发布规则参数

1 发布地址,按照上面的就ok

2 表单参数,这里是你采集的字段

3 成功标志码:成功

六、保存模块

七、然后返回web发布配置里面

按照图中的参数配置,点“获取栏目”,如果可以获取到就表示成功了一大半了

八、测试入库发布

九、后台查看采集内容

php 开源 采集,迅睿CMS 火车头内容采集相关推荐

  1. php开源搬家,迅睿CMS 网站迁移搬家

    准备:检测目标服务器环境 如果环境通过迅睿CMS运行的条件才能进行迁移 ----------------一键迁移方法---------------- 网站从服务器A迁移到服务器B时,需要做以下操作: ...

  2. php工作审批流程,审核流程_POSCMS_PHP开源_迅睿CMS系统

    审核流程的作用是将会员投稿分配给不同的管理角色组去审核,最大支持8次审核 此功能只对模块内容发布审核时有效 添加审核流程 1.每添加一级审核流程,会出现一个角色组选择框,选中角色拥有对该级的审核权限( ...

  3. php 会员 开源,会员组_POSCMS_PHP开源_迅睿CMS系统

    1.会员组管理 删除会员组时会同步删除所属等级及权限,所属组会员的会员组变为初始组(会员数据不会删除) 新加会员时,必须为他添加对于的会员等级,否则不会生效 添加之后建议更新缓存,否则有可能不会生效 ...

  4. [迅睿CMS免费开源系统v4.4.9]PHP万能建站框架+网站内容管理框架+电脑网站+手机网站+APP

    介绍 迅睿CMS免费开源系统是基于PHP7语言采用最新CodeIgniter4作为开发框架生产的网站内容管理框架,提供"电脑网站 + 手机网站 + APP 接口"一体化网站技术解决 ...

  5. 迅睿cms微信抖音小程序生成管理系统V1.0开源

    微信抖音小程序生成管理系统基于迅睿cms系统为框架,展开专用的小程序管理系统.系统将是全面开源共享,并且内置私有云市场,模板.可以根据你们自己的情况.选择性的安装. v1.0的主要功能说明 1.小程序 ...

  6. 迅睿cms免费开源系统 v4.3.14

    迅睿cms源码是基于PHP7语言采用最新CodeIgniter4作为开发框架所打造的一个网站内容管理框架,提供"电脑网站 + 手机网站 + APP 接口"一体化网站技术解决方案.它 ...

  7. CMS简数采集数据发布到迅睿CMS教程

    简介和使用教程 平台主要功能特性: 1.采集不需安装任何客户端,在线可视化点选: 2.集成智能提取引擎(国内独家),自动识别数据和规则,包括:翻页.标题,作者,发布日期,内容等,甚至不需修改即可开始采 ...

  8. 采集数据发布到迅睿CMS网站指定栏目分类

    将采集的文章数据发布到迅睿CMS(xunruicms)网站指定分类栏目,设置方法如下: 目录 1. 获取栏目ID 2. 对接网站发布 1. 获取栏目ID 在迅睿CMS后台获取对应的栏目数字ID. 在后 ...

  9. 易优cms怎么样- 迅睿CMS怎么样哪个CMS更适合优化

    易优CMS和迅睿CMS怎么样?不管是CMS都只是一个程序,重要的是网站的优化,任何一个网站建立都是为了流量,所以CMS缺不是那么重要.今天给大家推荐一款:一键建站+行业内容采集+伪原创+主动推送给搜索 ...

最新文章

  1. ora-01653表空间扩展失败产生的场景和处理方法
  2. 看完后完全了解 Vue 2.0 和 Vue 3.0 的区别
  3. Android工具HierarchyViewer 代码导读(3) -- 后台代码
  4. Silverlight学习笔记(一)——Silverlight够酷吗?
  5. 【Java】Collection集合和泛型
  6. python 怎么设置背景为白色_pycharm怎么将背景颜色设置成白色?
  7. JVM面试1 :谈谈你对Java的理解
  8. PySpark任务在YARN集群上运行python 算法
  9. 【小程序合集】来一组适合你的表情包-表情包大全
  10. 简述马尔可夫链【通俗易懂】
  11. 配置微软Azure Kinect DK 录制器k4arecorder
  12. excel 行列转换
  13. 程序员如何找对象(1)
  14. Sqoop同步任务‘ can not be represented as java.sql.Date
  15. 自动化运维工具——puppet详解(二)
  16. 数字平原cg场景制作流程
  17. 多台电脑共享上网的方法:在Windows XP中设置Internet连接共享
  18. shell批量修改文件名
  19. linux重新启动apache,如何启动,停止或重新启动Apache
  20. 使用内存安全工具提升应用质量和安全性

热门文章

  1. 超详细前端开发案例:品优购商场项目(三)
  2. 小程序开发(5)-之封装组件
  3. 递归(特别重要,小计算用)
  4. oracle怎么查语句消耗时常,Oracle 查找常见耗性能的语句
  5. BugkuCTF-Reverse题signin
  6. php是走什么协议,TCP是什么协议
  7. [Deepin - Pycharm调试记录] Pyinstaller索引系统库问题
  8. 使java代码更干净_java如何使用Lombok更优雅地编码
  9. vs2017 cmake android,CMake构建VS2017工程
  10. 台式电脑怎么找不到计算机在哪,台式机没有蓝牙怎么办