1.采集去除链接
[Copy to clipboard]CODE:
{dede:trim}]*)>([^<]*){/dede:trim}
--------------------------------

让field:title 标题突破30这个长度,修改代码的方法
找到./include/inc_arcpart_view.php
行291 :
if($titlelen=="") $titlelen = 30;
修改为
if($titlelen=="") $titlelen = 60;
就可以了,然后,你可以这样调用了
{dede:channelArtlist typeid='0' col=1 tablewidth='100%'}
{dede:arclist row="10"}
[field:title function="cn_substr('@me',38)" /]

{/dede:arclist}
{/dede:channelArtlist}

把这个延伸一下:关于inc_arcpart_view.php
function GetArcList($typeid=0,$row=10,$col=1,$titlelen=30,$infolen=160,
$imgwidth=120,$imgheight=90,$listtype="all",$orderby="default",$keyword="",
$innertext="",$tablewidth="100",$arcid=0,$idlist="")
这里的参数都可以更改你实际需要的模板元素尺寸大小.

2. 采集过虑中去掉链接保留文字的方法!

柏老大的方法是{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}
这样做会去掉<a hf.......>与</a>之间的字符!这样整个文章就少了部分字符,不完整了!

后来我多次测试,总算找到了正确的使用方法!如下:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}

做成两条采集规则就可以了!
在实际使用中好像([^<]*)([^>]*)两条一起使用才行!

3. 过滤div
{dede:trim}]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
过滤js
{dede:trim}]*)>([^<]*){/dede:trim}

过滤未知变量字符
固定(.*)固定

4.dede万能过滤代码
以下是常用的正则表达式标签
{dede:trim}<tbody(.*)>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table(.*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<tr(.*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<td(.*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<font(.*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a(.*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<param(.*)>{/dede:trim}
{dede:trim}<embed(.*)</embed>{/dede:trim}
{dede:trim}<object(.*)</object>{/dede:trim}
{dede:trim}<iframe(.*)</iframe>{/dede:trim}
{dede:trim}<form(.*)</form>{/dede:trim}
{dede:trim}<input(.*)>{/dede:trim}
{dede:trim}<script(.*)</script>{/dede:trim}
{dede:trim}<style(.*)</style>{/dede:trim}
{dede:trim}<!--(.*)-->{/dede:trim}

以下为不常用的正则表达式标签
{dede:trim}<div(.*)>{/dede:trim}
{dede:trim}</div>{/dede:trim}
{dede:trim}<center(.*)>{/dede:trim}
{dede:trim}</center>{/dede:trim}
{dede:trim}<p(.*)>{/dede:trim}
{dede:trim}</p>{/dede:trim}
{dede:trim}<span(.*)>{dede:trim}
{dede:trim}</span>{dede:trim}
{dede:trim}<img(.*)>{/dede:trim}

/

5.织梦标题不全,鼠标指向显示全部的代码:
{dede:arclist titlelen='100'}

[field:title function=' ( strlen("@me")>40 ? cn_substr("@me",40): "@me" ) '/]
{/dede:arclist}

6.dede/inc/inc_archives_functions.php第100行(flash频道远程flash本地化的BUG)
$cfg_uploaddir = $GLOBALS['media_dir'];
修改成
$cfg_uploaddir = $GLOBALS['cfg_other_medias'];

6.发布时间,来源,作者可以通过@me函数实现,如:在自定义处理接口:处输入  @me = "Azure·【博】" 就表示来源为“Azure·【博】”
7. 内容的替换:在所采集的文章内容中有多媒体,使用的是相对路径,采集的时候又不想下载,最好的办法就是将地址替换成媒体的实际地址。可以这样实现,在文章内容规则部分的自定义处理接口:处输入@me=str_replace('src="str1','src="str2',@me);
这样采集出来的文章中的所有的str1就被替换成str2!

转载于:https://www.cnblogs.com/milantgh/p/3741711.html

DEDECMS采集规则,过滤,替换文章内的部分内容相关推荐

  1. dedeCMS采集规则各大CMS采集规则通用

    dedeCMS采集器不知道大家有没有了解过,可能很多站长都没有接触过采集!采集最大的优势就是扩大网站收录增加网站排名从而获得更多的流量,相信还是有绝大部分人采集过来不收录,就放弃采集了!其实采集过来的 ...

  2. 织梦DedeCMS使用SQL批量替换文章标题内容

    在使用织梦DedeCMS的过程中,出于伪原创或者其他的原因,我们需要对文档的内容.标题.描述等等进行同义词或者其他的替换.这个就是一个简单的织梦SQL语句操作的问题,No牛网在织梦DedeCMS常用S ...

  3. php采集所有a标签,dedecms采集去除a标签代码

    dedecms采集去除a标签代码 DedeCMS采集规则-过滤-替换-技巧2009-01-14 15:491.采集去除链接 [Copy to clipboard]CODE: {dede:trim}]* ...

  4. dedeCMS采集-dedeCMS免费采集-dedeCMS自动采集插件

    网站建设的目的是留住客户,促进业务发展.由于SEO优化是一种手段而不是目的,我们如何使用dedecms采集才能在搜索引擎中获得更多的流量并进行更多的讨论?通过dedecms插件采集填充内容,根据关键词 ...

  5. vivi采集php,php源码:VIVI万能小偷程序1.5 智能采集不求人(内置2条采集规则)

    好东西介绍: Warning: curl_setopt(): CURLOPT_FOLLOWLOCATION cannot be activated when an open_basedir is se ...

  6. 免费聚合文章dedeCMS采集脚本网页采集器

    dedecms以简单.实用.开源而闻名,是国内最知名的PHP开源网站管理系统,也是使用用户最多的PHP类CMS系统,在经历多年的发展,无论是在版本还是在功能,都有了长久的发展和进步,DedeCms主要 ...

  7. 织梦php 文章采集规则,dedecms采集怎么用

    以织梦官方站为例,我们采集站长学院下的PHP教程栏目,打开列表地址http://www.dedecms.com/web-art/PHP_jiaocheng. 登录后台,进入"采集节点管理&q ...

  8. php 采集 过滤,dedecms采集过滤规则 万能采集过滤代码 常用过滤

    织梦dedecms自带的采集系统确实很不错,可以免去一些手工添加信息的麻烦,设置一下dede采集规则.采集点,然后点采集,OK,几百篇文章就搞定了! 呵呵,确实很省事的!下面介绍几种常用采集规则的过滤 ...

  9. dede文章采集管理php,dedecms采集过滤

    dede采集过程中最麻烦的莫过于采集的正则过滤函数的编写.说实在的,dede在这点上和很多ASP CMS系统比如说动易等,采集的时候直接选择几个选项就可以了,简单的完成想过滤的东西.不过他们只局限于对 ...

最新文章

  1. Flex和java开发的参考书
  2. ajax返回实体类字符串,js使用ajax传值给后台,后台返回字符串处理方法
  3. OnlineJudge在线判题系统
  4. 部署Dotnet Core应用到Kubernetes(一)
  5. C#反射技术在多语言实现中的实际用处参考,让初学者学技术有个针对性【附源码】...
  6. cpu上干硅脂怎么清理_笔记本电脑散热硅脂的正确涂法
  7. c++ *p++ (*p)++ ++(*p)详细实战解读
  8. jquery常用方法收藏 .
  9. 有感 Visual Studio 2015 RTM 简介 - 八年后回归 Dot Net,终于迎来了 Mvc 时代,盼走了 Web 窗体时代
  10. 移动固态硬盘没有连接到计算机,移动固态硬盘装个Win to go,这才是移动固态硬盘正确的打开方式...
  11. excel VBA编程入门教程
  12. 车牌自动识别在智能交通系统中的应用及前景分析
  13. 游戏建模中3DMAX里面的【烘焙规范】大盘点
  14. Android 11适配指南之系统相机拍照、打开相册
  15. 《海瑞官场笔记》有感
  16. 2022年HGAME中REVERSE的Flag Checker
  17. 神经网络与深度学习:回归问题
  18. 小米蓝牙耳机怎么串联,只有一边有声音
  19. Android——检测摄像头是否可用
  20. 多核CPU和单核的区别~

热门文章

  1. 《软件工程》第九章 面向对象方法学引论 作业
  2. 从fork面试题开始的思考
  3. 查看Linux系统的负载命令
  4. html表白earth,表白很感动的英语句子
  5. 本周不可错过的Android游戏
  6. Windows App开发之文件与数据
  7. 使用百度地图API将输入地址转化成坐标
  8. .NET项目更新支付宝证书步骤
  9. 【小米澎湃 S1 芯片、小米5c 发布】
  10. python生成随机数列表并排序_python_生成随机数与列表排序