dedecms(织梦)采集规则规则宝典
应用示例一:标题中空格的过滤
经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤
{dede:trim} {/dede:trim}
应用示例二:来源作者中连接的过滤
小龙 在采集文章的时候,有时会碰到作者混淆时,推荐采集时指定文章作者 ,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
应用示例三:文章内容中连接以及其他广告代码的过滤
这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作)
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}
应用示例四:过滤GG广告代码
其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个,所以单独作为一个应用列出来:
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}
下面是在综合论坛上网友的各种正则的一个全集:
{dede:trim}
{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}
好了,上面四种应用基本上涵盖了采集的各种应用,掌握了这个,过滤基本上就不用求人了!
dedecms(织梦)采集规则规则宝典相关推荐
- dedecms静态页面php获取参数,DedeCms织梦TAG标签静态生成html,url拼音及分页优化的方法...
DEDECMS自带的TAG标签是动态的,我们可以设置纯静态html,而且针对手机站也做了TAG静态化生成,非常强大,对于SEO提高收录及获取排名非常有好处,今天脚本之家小编为大家介绍织梦TAG标签伪静 ...
- dedecms织梦后台模板layui框架-20171126更新
后台效果 更新日记 2017/11/26 修正gbk版后台删除文档报错问题: 2017/11/22 修正部分Linux下后台-系统-系统基本参数不正常问题: 2017/09/13 修 ...
- 织梦采集插件自动采集文章主动推送给搜索引擎
为什么要用织梦采集插件?如何利用免费织梦采集插件让网站收录以及关键词排名. 新媒体.移动互联.IT技术.数字技术的最新发展,引领着互联网进行新的时代,各大搜索引擎为了互联网良性的发展,对搜索优化的要求 ...
- dedecms织梦系统后台验证码图片不显示的解决方法
dedecms织梦系统后台验证码图片不显示的解决方法 参考文章: (1)dedecms织梦系统后台验证码图片不显示的解决方法 (2)https://www.cnblogs.com/afish/p/40 ...
- dedecms织梦专题节点列表内容怎么实现分页
这篇文章主要介绍dedecms织梦专题节点列表内容怎么实现分页,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完! dedecms织梦专题节点列表内容怎么实现分页? 方法: 打 ...
- php熊掌号怎么设置json-ld,dedecms织梦系统怎么对接百度熊掌号并添加JSON_LD数据
dedecms织梦系统怎么对接百度熊掌号并添加JSON_LD数据? 百度推出的百度熊掌号非常的不错,我的dedecms织梦系统早早就对接好了,它能对你的原创文章进行原创保护,并评出熊掌号搜索指数,熊掌 ...
- 织梦php网站修改教程,织梦DEDEcms织梦软件模型增加图集功能教程(含修改文件下载)...
这篇文章主要为大家详细介绍了织梦DEDEcms织梦软件模型增加图集功能教程(含修改文件下载),具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴. 织梦DEDEcms织 ...
- php熊掌号怎么设置json-ld,dedecms织梦系统对接百度熊掌号并添加JSON_LD数据
百度近期推出的百度熊掌号非常的不错,我的dedecms织梦系统早早就对接好了,它能对你的原创文章进行原创保护,并评出熊掌号搜索指数,熊掌号搜索指数是对你文章的内容质量,用户喜爱.原创能力.活跃表现.领 ...
- dedecms织梦模板|绿色仿下载吧网站织梦dede模板源码
dedecms织梦模板|绿色仿下载吧网站织梦dede模板源码 下载地址: http://www.bytepan.com/iqByH47VbLn
- 织梦编程run=php,dedecms织梦怎么用runphp='yes'运行php
这篇文章主要为大家详细介绍了dedecms织梦怎么用runphp='yes'运行php,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴. runphp='yes'运 ...
最新文章
- 域名缓存侦测(DNS Cache Snooping)技术
- Flink 分别读取kafka和mysql作为source
- 网站前端_EasyUI.基础入门.0009.使用EasyUI Layout组件的最佳姿势?
- 【转】c#数字图像处理(三)灰度直方图
- 《revolution in the valley》读后随笔--Steve jobs与Macintosh
- kotlin使用mapstruct(二)
- Fiddler-2 Fiddler抓包原理
- jquery自适应宽度轮播图
- 最简单的c语言if程序,C语言简单实用的程序-if else 嵌套式的使用例子
- 微软邮箱服务器出问题了,在微软邮箱登录时常见的问题有哪些
- 想转行学IT!0基础应该要学习哪个技术
- python实验报告代写_vector data作业代写、python程序设计作业调试、代做python实验作业、代写OGR python作业代做Python程序|代写Web开发...
- 9. 【gRPC系列学习】连接失败处理:backoff协议
- Json对象和string之间的转换
- 关于chrome、360浏览器自动填充的黄色背景处理方案
- 竞品分析的意义在哪?竞品分析后怎样优化店铺,竞品分析哪里找?
- 边缘态半无穷格林函数谱函数计算
- Adobe Flash Player ActiveX 不能安装
- 捕获海康威视IPCamera图像,转成OpenCV可以处理的图像(一)
- html感叹号图形代码,canvas3:绘制感叹号