dedecms采集功能的详细介绍(十)

今天来给大家讲解下dedecms的采集功能,希望大家认真学习

一.采集第一要素:确定目标网站

二.路径:后台--采集--采集节点管理--添加一个新节点----普通文章和图片集--设置新增采集节点

三.下面讲解下设置详细内容和介绍

1.

节点名称:随便写下那个站的采集就可以了

编码:查看目标站的源码,头部的charse属性就知道了该怎么填写了

区域匹配模式:一般均默认字符串;而正则表达式相当于过滤的意思

内容导入顺序:这个看你想怎么做了,正着导入还是倒序导入,你就选择相应的导入方式

防盗链模式:开启(防止刷新时间:20s)

2.列表网址获取规则

来源属性:有两种方式

(1)批量生成列表网址

匹配网址:填目标站一个栏目的第一页的网址,将其中的1改成*

然后设置*为从1到n,每页递增多少页由你自己决定,呵呵

启用多栏目通配(#):list-(#)-(*).htm

#表示采集多栏目

*表示采集多列表页面的内容

(2)手工指定网址

只指定某页面的部分文章,直接输入文章内容页面的网址就可以了

3.文章网址匹配规则

(1)区域开始的html:目标站的被采集的一个列表页的源文件的采集区域的开头的一个html标签

(2)区域结束的html:目标站的被采集的一个列表页的源文件的采集区域的结束的一个html标签

(3)如果连接中含有图片

采集为缩略图:图片采集到本机

不处理:就是不采集

(4)对区域网址进行再次筛选:这个必须包含 采集网址的共同点

四.网址获取匹配规则测试

保存进入下一步设置

五.网页内容获取规则

1.文章标题

匹配规则:

2.文章来源

匹配规则:

时间:[内容]

3.文章内容

匹配规则:

[内容]

总之,这些例子就举到这里,它就是所需内容的形式,即语言的形式和 CSS 样式

4.过滤规则讲解

常用规则----随便选中一个----选择去掉中间的文字---得到如下代码

{dede:trim replace=""}{/dede:trim}

将要过滤的字放在中间就OK 了

六。采取成功后,前台不出现的原因

(1)先增加一个栏目---:核心---网站栏目管理----增加顶级栏目

(2)采集---采集节点管理---选中节点总目录---导出数据----采集管理

采集管理中有两个选项

第一个选项:默认导出栏目:选中刚才设置的栏目

第二个选项:附带选项中:选中完成后自动生成导入内容html

好了,采集功能就讲到这了,大家要在实践中操作,我在这里只是大致讲解了下dedecms采集功能设置

过程中的一些要点,重要的还是要大家去操作实践!

分享几款分页标签CSS代码(适用所有5.X版本)
dedecms

dedecms采集功能的详细介绍(十)相关推荐

  1. DedeCMS采集功能

    DedeCMS采集功能使用基本知识讲解 2010-08-09 16:58:13|  分类:dedecms学习 |  标签:采集  规则  列表  内容  页面  |字号大中小 订阅 采集是指有着确定方 ...

  2. 相册服务器位置,王者荣耀游戏相册是什么 游戏相册开放服务器以及功能使用详细介绍...

    王者荣耀游戏相册哪些服务器开放了?新功能怎么使用?对于这个新上线的功能,小伙伴们不太了解吧!没关系,下面是大麦子小编整理出来的游戏相册开放服务器以及功能使用详细介绍,希望可以帮到大家. 游戏相册灰度发 ...

  3. win10计算机管理的作用,Win10新功能的详细介绍

    Win10是现在热门的系统,因此有不少用户想要装上它,不过想要装它必须先知道它有哪些新功能,以便我们日后使用,那么Win10新功能有哪些呢?如果你不知道的话,那么赶紧来看看小编对Win10新功能的详细 ...

  4. Arduino WString.h库功能函数详细介绍

    Arduino WString.h库功能函数详细介绍 在Arduino开发框架下,String是一个很重要的数据类型.

  5. 1分钟搞懂MIL体系架构及功能模块详细介绍

    目录 MIL体系架构 MIL核心功能模块 MIL功能模块详细描述 点对点运算 统计学运算 滤波处理 形态学运算 几何变换 快速傅里叶变换 图像分割 粒子(BLOB)分析 特征计算 图像测量 校正 JP ...

  6. dedecms采集功能扩展

    dedecms是一个开源的网站管理系统,内含的采集器功能比较强大和易用.然而作为一个通用的采集器,它只能从一个列表页中选取合适的采集页,针对一个采集的对象下载一个网页,对该网页内容做分析,通过采集规则 ...

  7. Win7中语音识别功能的详细介绍

    经常你会看到现在很多人开始使用手机的语音功能来交流,而不是传统上的电话,比如苹果iPhone 里的siri,或者是语音QQ.语音输入等,你想要执行什么命令,比如打开一个网页,打开一个程序等,都可以通过 ...

  8. tiktok协议,批量采集websocket私信详细介绍

    "私域流量"简单的说就是我们自己的流量,是我们可以自由支配,可以反复使用,且几乎免费使用的流量. 讲到私域流量,第一个问题一般要问:怎样建立我的私域流量池?流量从何而来?但在问这个 ...

  9. 大江论坛服务器维护,Kangle“多节点服务器扩展”功能的详细介绍

    Kangle多节点服务器扩展功能,可用来作"负载均衡". 当前,无论是企业网.还是园区网, 业务量的发展都超出了过去,新的应用层出不穷,即使按照当时最优配置建设的网络,也会很快感到 ...

最新文章

  1. 中国剩余定理(孙子定理)的证明和c++求解
  2. Stock Market(luogu 2938)
  3. Spring+Hibernate+c3p0连接池配置-连接无法释放的问题解决方案
  4. 64位win10系统无法安装.Net framework3.5的两种解决方法
  5. 解决 项目cocoapods diff: /../Podfile.lock: No such file or directory
  6. ab和jmeter进行GET/POST压力测试的使用心得和比较(转载,在ubuntu16.04下使用ab带json对centos7压力测试验证可用)
  7. 77 行代码实现 ABAP ALV 中的双击事件处理试读版
  8. 10月Web服务器调查:Apache下降 Ngnix攀升
  9. PHP trim()函数详解
  10. 第四章 jQuery文档处理
  11. 基于HTML+CSS+JavaScript制作美食文化网站 ——卡通创意的烧烤(5个页面) html静态网页设计制作 dw静态网页成品模板素材网页 web前端网页设计与制作 div静态网页设计
  12. spring mvc 的ajax传参详解
  13. 拉文大学计算机科学,美国研究生语言双录取,这些大学有你中意的吗?
  14. Win10下蓝牙音箱无法调节音量的解决方案
  15. 远程协作从“特殊”到“常态”,你可能需要的会议平板测评
  16. 这里有一份CAD 快捷键指南,请查收~
  17. 游戏技巧-《七日杀》存档位置
  18. 嵌入式linux启动时间优化
  19. 孙鑫vc++ 第六课 笔记 菜单的工作原理及编写应用
  20. must implement OnFragmentInteractionListener/ Fragment与Activity,Fragment与Fragment之间的信息传递

热门文章

  1. 计算机毕业设计之java+ssm的洗衣店管理系统
  2. 编程实用工具大全(二)(前后端皆可用,不来看看?)
  3. 华为无线设备配置不同业务VLAN的AP间快速漫游
  4. BJTU1853 gangpener 买零食
  5. 1205: 你爱我么?
  6. 文件宝局域网传输/播放功能Windows10系统经验贴(感谢文件宝用户@卡卡罗特 和@24K 純情)...
  7. 左移寄存器vhdl_基于VHDL的移位寄存器设计
  8. 机器学习之朴素贝叶斯实现垃圾邮件过滤
  9. 自媒体从零到大v,这个方法你得知道
  10. Groovy 百度云分享下载各个版本SDK