dedecms 采集系统确实很不错,可以免去一些站长手工添加信息的麻烦,设置一下采集规则、采集点,然后点采集,OK,几百篇文章就搞定了!呵呵,确实很省事的!下面介绍几种常用的采集规则的过滤方法:

应用示例一:标题中空格的过滤
经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤

{dede:trim} {/dede:trim}

应用示例二:来源作者中连接的过滤
小龙 在采集文章的时候,有时会碰到作者混淆时,推荐采集时指定文章作者 ,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

应用示例三:文章内容中连接以及其他广告代码的过滤
这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作)
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

应用示例四:过滤GG广告代码
其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个,所以单独作为一个应用列出来:

{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

下面是在综合论坛上网友的各种正则的一个全集:

{dede:trim}
{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}

好了,上面四种应用基本上涵盖了采集的各种应用,掌握了这个,过滤基本上就不用求人了!

dedecms(织梦)采集规则规则宝典相关推荐

  1. dedecms静态页面php获取参数,DedeCms织梦TAG标签静态生成html,url拼音及分页优化的方法...

    DEDECMS自带的TAG标签是动态的,我们可以设置纯静态html,而且针对手机站也做了TAG静态化生成,非常强大,对于SEO提高收录及获取排名非常有好处,今天脚本之家小编为大家介绍织梦TAG标签伪静 ...

  2. dedecms织梦后台模板layui框架-20171126更新

    后台效果 更新日记 2017/11/26    修正gbk版后台删除文档报错问题: 2017/11/22    修正部分Linux下后台-系统-系统基本参数不正常问题: 2017/09/13    修 ...

  3. 织梦采集插件自动采集文章主动推送给搜索引擎

    为什么要用织梦采集插件?如何利用免费织梦采集插件让网站收录以及关键词排名. 新媒体.移动互联.IT技术.数字技术的最新发展,引领着互联网进行新的时代,各大搜索引擎为了互联网良性的发展,对搜索优化的要求 ...

  4. dedecms织梦系统后台验证码图片不显示的解决方法

    dedecms织梦系统后台验证码图片不显示的解决方法 参考文章: (1)dedecms织梦系统后台验证码图片不显示的解决方法 (2)https://www.cnblogs.com/afish/p/40 ...

  5. dedecms织梦专题节点列表内容怎么实现分页

    这篇文章主要介绍dedecms织梦专题节点列表内容怎么实现分页,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!  dedecms织梦专题节点列表内容怎么实现分页?  方法:  打 ...

  6. php熊掌号怎么设置json-ld,dedecms织梦系统怎么对接百度熊掌号并添加JSON_LD数据

    dedecms织梦系统怎么对接百度熊掌号并添加JSON_LD数据? 百度推出的百度熊掌号非常的不错,我的dedecms织梦系统早早就对接好了,它能对你的原创文章进行原创保护,并评出熊掌号搜索指数,熊掌 ...

  7. 织梦php网站修改教程,织梦DEDEcms织梦软件模型增加图集功能教程(含修改文件下载)...

    这篇文章主要为大家详细介绍了织梦DEDEcms织梦软件模型增加图集功能教程(含修改文件下载),具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴. 织梦DEDEcms织 ...

  8. php熊掌号怎么设置json-ld,dedecms织梦系统对接百度熊掌号并添加JSON_LD数据

    百度近期推出的百度熊掌号非常的不错,我的dedecms织梦系统早早就对接好了,它能对你的原创文章进行原创保护,并评出熊掌号搜索指数,熊掌号搜索指数是对你文章的内容质量,用户喜爱.原创能力.活跃表现.领 ...

  9. dedecms织梦模板|绿色仿下载吧网站织梦dede模板源码

    dedecms织梦模板|绿色仿下载吧网站织梦dede模板源码 下载地址: http://www.bytepan.com/iqByH47VbLn

  10. 织梦编程run=php,dedecms织梦怎么用runphp='yes'运行php

    这篇文章主要为大家详细介绍了dedecms织梦怎么用runphp='yes'运行php,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴. runphp='yes'运 ...

最新文章

  1. 域名缓存侦测(DNS Cache Snooping)技术
  2. Flink 分别读取kafka和mysql作为source
  3. 网站前端_EasyUI.基础入门.0009.使用EasyUI Layout组件的最佳姿势?
  4. 【转】c#数字图像处理(三)灰度直方图
  5. 《revolution in the valley》读后随笔--Steve jobs与Macintosh
  6. kotlin使用mapstruct(二)
  7. Fiddler-2 Fiddler抓包原理
  8. jquery自适应宽度轮播图
  9. 最简单的c语言if程序,C语言简单实用的程序-if else 嵌套式的使用例子
  10. 微软邮箱服务器出问题了,在微软邮箱登录时常见的问题有哪些
  11. 想转行学IT!0基础应该要学习哪个技术
  12. python实验报告代写_vector data作业代写、python程序设计作业调试、代做python实验作业、代写OGR python作业代做Python程序|代写Web开发...
  13. 9. 【gRPC系列学习】连接失败处理:backoff协议
  14. Json对象和string之间的转换
  15. 关于chrome、360浏览器自动填充的黄色背景处理方案
  16. 竞品分析的意义在哪?竞品分析后怎样优化店铺,竞品分析哪里找?
  17. 边缘态半无穷格林函数谱函数计算
  18. Adobe Flash Player ActiveX 不能安装
  19. 捕获海康威视IPCamera图像,转成OpenCV可以处理的图像(一)
  20. html感叹号图形代码,canvas3:绘制感叹号

热门文章

  1. PMP考试备考指南基础知识
  2. 流程图软件Microsoft Visio
  3. 淘宝面试常见问题的答案来了,你看了吗?(一面及答案)
  4. 软件测试用例最简单最常见的模板和案例(QQ登陆,手机号,126邮箱)
  5. 判断AVPlayer播放状态
  6. 出生就遇浏览器大战,亲爹还不爱,命运坎坷的JavaScript终于苦尽甘来
  7. 中国独角兽上市潮,爱奇艺优信小米值得投资吗?
  8. c语言入门-程序运行的过程
  9. 持续更新免费的 API,做一个 API 的搬运工
  10. Java输入输出流体系