Phpcms网站管理系统目前最新版本为Phpcms v9,作为国内主流CMS系统之一,目前已有数万网站的应用规模。那么其自带的采集模块功能如何呢,来看看吧。

文章采集

Phpcms v9默认内置有文章、图片、下载3个内容模型,先来看最普通的文章采集。以采集新浪互联网频道,国内滚动新闻栏目为例http://roll.tech.sina.com.cn/internet_chinalist/index_1.shtml

1、进入后台,内容——内容发布管理——采集管理——添加采集点。(不同于Phpcms以往版本,采集管理在模块菜单内)

2、网址规则。采集项目名随便填,采集页面编码默认GBK,具体采集页面的时候可以通过查看其网页源代码。

网址采集,没有大的特色,通过查看所要采集页面的网址规则填写。分析目标页面得出是序列网址,且所要获取内容的网址都在和两个标签之间。无其他干扰链接,所以就无需定义网址中必须包含和不得包含的字符了。如果目标网站配置了Base,那么也要配置好。

网址采集配置结束,但是如果目标网站列表页用js实现上下页,或者所要获取网址深度超过2级,用此自带采集就很难实现了。

3、内容规则。phpcms是用“[内容]”作为通配符,然后设置好开始结束的字符,再过滤不要的代码来实现内容的采集。分析目标页的title标签比较有规律,可以直接如图设置。

过滤格式为“要过滤的内容[|]替换值”,如果是删除的话就替换值留空。过滤规则是支持正则表达式,系统自带了几种比较常见的标签过滤正则,要比较灵活过滤的话对于新手来说有点难度,所以新手需要先熟悉下正则表达式。

作者规则,来源规则,时间规则依照规则去获取。小编尝试了一下固定值发现无法实现,就是把某一标签设为固定值,如把“来源”设定为http://www.sina.com.cn,可是采集结果来源标签为空。

内容规则,填好开始和结束标签,我们测试的目标页比较干净,所以只需过滤掉里面的超链接和一些无用标签即可。

内容分页规则,如果内容页有分页必须填写,此处文章都没有分页,小编会在后面的图片采集来介绍这个标签。

4、自定义规则,除了系统默认的几个标签外,你还可以自定义各种标签,规则是一样的,只是有一点要注意:规则英文名一定要填写,否则自定义标签无法保存。

5、高级配置,此次可以设置下载图片、图片水印、内容分页和导入顺序。其中注意,如果需要水印记得修改好自己网站的水印图片,水印存放路径:statics/images/water

6、规则设置好了,提交回到采集管理首页,可以先通过测试来看看各标签是否准确。

7、发布内容。如果都准确,先点击采集网址,会自动采集文章地址,并过滤重复url。然后会弹出采集网址完成的消息,点击其中的“采集文章内容”

采集自动进行,并显示采集进度。

采集完成后自动回到采集管理首页,点击内容发布,进入到已采集文章列表,勾选要发布的文章,或者直接点击底部的全部导入。

进入到发布方案选择界面,新建发布方案,选择一个发布栏目,本测试选择的是文章模块的栏目“国内”,在方案新建页面可以设置自动提取摘要、自动提取缩略 图、导入文章状态、标签与数据库对应关系。其中,导入文章状态只有一个“发布”,如果站长需要状态为待审核,要先修改对应栏目的工作流为一级审核。

标签与数据库对应关系中,把采集标签和数据库字段一一对应,如果有自定义标签找不到对应字段,需要修改模型增加字段,然后通过修改模板来显示,对技术要求比较高,不适合新手。另外系统自带几个处理函数,也挺实用的。

发布方案设置完成,自动开始导入刚才选择的文章,并且下一次导入时就无需再建方案了,直接选择已建好的方案即可。

文章采集、发布完成。看看效果:

后台内容管理页

内容页

下面我们来看看图片采集

图片采集

phpcms v9自带图片模型,对图片处理也有个组图模式,方便一些站长做图片网站或者设置图片展示方式。下面来体验下用自带采集程序来采集图片,以采集http://www.4493.com/mingxingxiezhen/页面的图片为例:

网站获取规则以及内容获取规则等都和文章采集一样,最重要的一点,phpcms v9的图片采集不能只采集图片地址,而是应该采集整个标签,这样才能处理为组图。如本例:内容标签设置为

采集到的内容应该是这样的

还有个分页问题,目标站的分页如图所示:

网页代码为:

所以只需在内容分页规则处选择全部列出模式,然后填写分页标签开始和结束字符,系统就自动采集分页的内容了。

设置完规则后,采集网址,采集内容,发布内容。发布方案处要注意,小编几经尝试发现,要实现组图模式,必须内容字段和组图字段都要用上“处理为组图”函数。但是这样就无法获取第内容图片做缩略图了,所以最好自定义一个缩略图标签,直接获取一张内容图地址做缩略图。

设置好后发布。见采集效果:

栏目页

内容页

总结:细细体验下来,phpcms v9自带的采集功能还是比较全面的,满足基本的文章和图片采集。但是不够灵活,对一些高要求的站长来说还明显不足,而且门槛较高,官方对采集模块的说明和帮助文件又非常有限,不利于新手上手。

php采集cms有哪些,phpcms v9自带采集模块功能体验相关推荐

  1. php cms 源码,PHPCMS v9.6.1 UTF8

    PHPCMS v9.6.1 UTF8更新日志 修复mysqli链接异地多数据库的bug: 修复sql注入,getshell等漏洞. PHPCMS简介 PHPCMS采用PHP5+MYSQL做为技术基础进 ...

  2. php mvc cms企业站,Phpcms V9程序目录结构及MVC简析

    在之前的文章[Phpcms v9程序目录结构解析]里边详细讲解了Phpcms V9程序目录,今天CMSYOU在这里再次与大家分享一张Phpcms V9程序目录结构图,与大家再次研究Phpcms V9的 ...

  3. php多站点cms,如何实现PHPCMS V9 多站点[站群功能]子站独立域名且动态URL

    1.新建站点,配置模型 首先在PHPCMS v9后台中建立新站点.PHPCMS后台管理中心>>设置>>站点管理>>添加新站点 设置好站点域名.站点目录.模板风格,如 ...

  4. php cms建站,Phpcms v9 建站教程-网站基本设置

    三.网站基本信息设置 安装完成后打开首页我们可以看到网站标题.Logo等都是默认的官方数据,所以我们要对网站进行一些基本的设置.打开后台→设置→站点管理,点击默认站点后面的管理进入设置界面.在基本配置 ...

  5. php制作cms视频教程下载,PHPCMS V9 实战模板制作视频教程+仿站超级工具

    PHPCMS开放平台是基于PHPCMS V9系统为开发者和站长提供工具及应用的平台.开发者可以通过开放平台开发适用于PHPCMS V9软件的各种应用,并在应用审核通过后直接进入phpcms软件的应用中 ...

  6. PHPCMS v9自带截取字符串函数str_cut

    2019独角兽企业重金招聘Python工程师标准>>> 切版网除了专注于html5/css3网站切图.pc.h5手机.响应式.edm邮件等web前端外包,我们还提供比较简单的企业网站 ...

  7. php cms word导入,phpcms V9文章编辑器不能按word文档复制过来的段头缩进显示

    打开\editor\plugins\pastefromword\filter\default.js 找到文件尾大概有这么一句代码 ;CKEDITOR.cleanWord=function(h,i){i ...

  8. php cms使用视频教程,PHPCMS v9视频模块使用教程二

    三.使用 1.本地上传.前面的步骤都完成后既可以使用视频模块了,可以直接在视频库管理中添加视频,也可以在视频模型的栏目添加内容是选择上传.视频文件是直接上传到酷6服务器的,需要一段上传和审核时间.完成 ...

  9. 中英文 php cms,phpcms v9英语语言包应用详解

    phpcms英文二次开发之语言包详解 phpcms英文的语言包使其成为国际化的cms,从PHPCMS v9.1开始,发布了英文版.但很遇憾的是,到目前为止,PHPCMS还没有实现语言切换的功能,比如中 ...

  10. Phpcms v9表单向导数据PHPExcel导出模块

    Phpcms v9表单向导数据PHPExcel导出模块是CMS在实际项目中根据实际需求开发定制的Excel文档数据导出组件,能方便地导出各个表单向导不同的自定义字段数据,实现前台收集的数据导出为Exc ...

最新文章

  1. 论jquery与vuejs结合时的部分问题
  2. SQLite3中的数据类型
  3. 获取远程linux版本,远程批量获取Linux和Windos操作系统版本(内核)
  4. mysql使用已有的数据库_使用SQL操作MySQL数据库
  5. 什么是单镜头反光相机
  6. java 获取本机信息,使用Java获取系统信息的常用代码整理总结
  7. Spring Security构建Rest服务-1401-权限表达式
  8. python_文件处理模式
  9. SQL查询学生信息表中的学生记录
  10. HTML5期末大作业:我的家乡网站设计——我的家乡-绿城之都-南宁(9页) HTML+CSS+JavaScript 大学生简单个人静态HTML网页设计作品
  11. matlab如何绘制状态图,[转载]MATLAB画状态方程的向量图
  12. 华为HCNA学习笔记----第一天
  13. 打通WordPress和微信公众号
  14. TensorFlow 线性代数编译框架 XLA
  15. uniapp小程序 触底刷新(onReachBottom)加载分页
  16. 彻底删除Win7任务栏通知区域已卸载程序图标
  17. C语言中如何引用其他c文件(以VScode演示)
  18. SpringBoot使用Undertow做服务器
  19. 程序员职业思考与规划 —— Java程序员年度总结:浅谈四点心得,也许路走得更远
  20. Office2007集成SP1光盘镜像下载(简体中文专业版+企业版VOL)

热门文章

  1. IDEA打包程序与运行(windows环境)
  2. 解决FireFox(火狐浏览器)占用资…
  3. 计算机考研复试面试问题总结——数据结构篇(含答案)
  4. Mybatis——拦截器Interceptor
  5. java md5,md2,md4 加密算法
  6. 嘻游记 QVOD快播高清电影在线播放下载
  7. pmp学习资料_201912期PMP学习内容汇总表
  8. 用渐变工具绘制七色彩虹(每天一个PS小项目)
  9. linux下解压zip文件命令
  10. FPGA设计标准I2S协议音频编解码器