DEDECMS采集常用过滤规则

DEDE采集规则中需要常用过滤的规则代码DEDECMS集合

一般在DEDE采集的过程中需要过滤或者删除再者是注释掉一些别人的信息,比如:超链接、图片等等之类的,都需要用到这些过滤规则,把不想采集过来的资源全部都注释掉这样就大大减少了采集回来的垃圾信息,占用了自己的空间。

{dede:trim}<span(.*)>{/dede:trim} 
{dede:trim}</span>{/dede:trim}        
{dede:trim}<div(.*)>{/dede:trim} 
{dede:trim}</div>{/dede:trim} 
{dede:trim}<li>{/dede:trim} 
{dede:trim}</li>{/dede:trim}
{dede:trim}<ul>{/dede:trim} 
{dede:trim}</ul>{/dede:trim} 
{dede:trim}<font(.*)>{/dede:trim} 
{dede:trim}</font>{/dede:trim} 
{dede:trim}<table(.*)>{/dede:trim} 
{dede:trim}</table>{/dede:trim} 
{dede:trim}<tbody(.*)>{/dede:trim} 
{dede:trim}</tbody>{/dede:trim} 
{dede:trim}<tr(.*)>{/dede:trim} 
{dede:trim}</tr>{/dede:trim} 
{dede:trim}<td(.*)>{/dede:trim} 
{dede:trim}</td>{/dede:trim} 
{dede:trim}<a(.*)>{/dede:trim} 
{dede:trim}</a>{/dede:trim} 
{dede:trim}<iframe(.*)</iframe>{/dede:trim}
{dede:trim}<style(.*)</style>{/dede:trim} 
{dede:trim}<script(.*)</script>{/dede:trim} 
{dede:trim}<option(.*)</option>{/dede:trim} 
{dede:trim}<select(.*)</select>{/dede:trim}

下面是过滤"视频"的代码,注意顺序

{dede:trim}<object(.*)</object>{/dede:trim}
{dede:trim}<embed(.*)>{/dede:trim} 
{dede:trim}</embed>{/dede:trim} 
{dede:trim}<param(.*)</param>{/dede:trim}

dede织梦CMS采集过滤规则相关推荐

  1. dede织梦html手机模板,dede织梦cms手机站模板制作和调用方法

    dede织梦cms电脑站制作网站模板很简单.这里说说对应的手机站模板制作方法和调用方法. 首先我们分析下手机站的模板命名方式. index_m.htm 首页模板 index_default_m.htm ...

  2. dede织梦CMS安装页面出现dir的通用安装教程

    dede织梦CMS安装页面出现dir 有些人买了的dede织梦CMS的二次开发的源码结果又遇见安装时出现dir,认为这套源码时不能安装的 ,我今天给大家带来一个这样的教程吧! 1.遇见安装页面出现di ...

  3. 织梦cms php中调用当前频道,DEDE织梦CMS模板在runphp=yes的标签中调用其他field值的方法...

    这篇文章主要为大家详细介绍了DEDE织梦CMS模板在runphp=yes的标签中调用其他field值的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴. Ded ...

  4. 织梦php如何完全卸载,DEDE织梦CMS后台精简可以删掉的不需要的文件

    织梦DEDECMS后台精简哪些可以删掉的不需要的文件呢,织梦园在这里给各位站长整理如下: 如果是一开始就不想要的话,安装版plus目录下进行如下操作. 删除:guestbook文件夹[留言板,后面我们 ...

  5. 模板上 php dede,织梦CMS模板中dede标签使用php和if判断语句的方法

    今天我们织梦模板团来说说织梦模板中dede标签使用php和if判断语句的方法: 先来看看下面这个标签: 下面来说说具体的方法: 方法一: 用个if判断语句,判断一个字段是否有东西,有就输出1,没有则就 ...

  6. dede rss.php,DeDeCMS dede 织梦cms RSS全站静态输出的实现方法

    DedeCMS自带Rss功能,在管理后台可以生成出一个Rss地图页面,默认是/data/rssmap.html:这个Html地图文件会告知用户每个栏目的rss订阅地址,这个功能很适合栏目及文章较多的网 ...

  7. dede织梦CMS常用语法整理

    // 列表展示 {dede:datalist}// 变量输出{dede:field.id/}// 判断{dede:if $fields['status'] == 0} 成功{else} 失败{/ded ...

  8. dede集成环境服务器网站设置,Dede织梦CMS服务器环境安全设置

    1.目录权限 我们不建议用户把栏目目录设置在根目录,原因是这样进行安全设置会十分的麻烦,在默认的情况下,安装完成后,目录设置如下: (1) data.templets.uploads.a或5.3的ht ...

  9. 织梦动态PHP可以删除吗,DeDe织梦cms如何全站动态化,取消静态功能

    dedecms 在开发的时候遇到缓存,修改后前台不显示,需要到后台更新缓存才能显示,怎么办? 需要以下处理: 1.全站文档改为动态化 执行以下MySQL语句: update dede_archives ...

  10. 织梦网站后台-织梦网站后台登陆方式-织梦CMS模板

    织梦网站后台登陆方式:域名/dede即可进入网站后台.织梦cms是一个独立的网站程序.今天给大家推荐的是织梦cms模板(内置5W套织梦cms模板)以及免费织梦cms插件其中包括有:织梦cms采集插件. ...

最新文章

  1. hdu 5086(dp)
  2. 建站模板论坛_【714】号称全球最快的无代码拖拽集成建站工具?
  3. 门禁卡读写器—把手机秒变门禁卡与自己复制门禁卡
  4. STM32F401的PWM输出
  5. iphone快捷指令蚂蚁森林能量_iPhone「快捷指令」怎么玩?玩法太多,别让这个功能吃灰...
  6. CPM-Nets: Cross Partial Multi-View Networks
  7. excel怎么把两个表格合成一个
  8. R语言数据对象与运算
  9. java mysql 语句中 大于 小于 等于 的写法
  10. 网站后缀名html,网页后缀名有哪些
  11. handle与HWND的差别
  12. MATLAB hilbert谱 纵坐标由归一化频率改为正常频率的方法
  13. php扩展geoIP的使用
  14. [007]爬虫系列 | 猿人学爬虫攻防大赛 | 第五题: js混淆 乱码增强(中)
  15. A=B游戏完美通关(第一章)
  16. mysql自动排课_jsp1934高校智能排课系统 mysql
  17. Git仓库如何优雅的进行备份
  18. Codeforces Round #732 (Div. 2)
  19. ***入门教程1-57集!
  20. 帕金森定律在时间上的运用—《可以…

热门文章

  1. oracle sqlcode 多条,oracle sqlerrm和sqlcode函数
  2. 实时高清渲染:全局光照(Global Illumination)[2]---漫反射/高光全局光照
  3. 在无参考数据集(比如LIME、MEF、DICM)上使用NIQE指标
  4. PhotoShop简单案例(1)——利用时间轴功能制作简单动画
  5. java基础--接口
  6. 数据结构实训之商店存货管理系统(c+html+pyhon)
  7. SpringBoot下实现PDF转word(Maven项目)
  8. 药事管理学名词解释和问答题题集
  9. 人工势场法matlab讲解,传统人工势场法(matlab)
  10. 计算机操作系统|汤小丹|第四版|习题答案(一)