织梦php 文章采集规则,织梦输入网址采集单个网页功能发布 不需要写采集规则一键采集...
梦搏网络一键采集不需要写采集规则,系统自动识别文章正文内容和标题,现已经集成到织梦cms,使用织梦cms的站长有福了,完全可以替换织梦后台自带的“输入网址采集单个网页>>”的功能,首先分析对比下织梦系统自带的“输入网址采集单个网页>>”和梦搏网络一键采集有什么区别?
1、织梦自带的“输入网址采集单个网页>>”需要在采集前些每个采集网站的采集规则,而且如果采集网页布局不同也无法公用,这样就导致了,采集网页非常麻烦,还有很多站长并不会写规则,这样也就无法使用这个采集单个网页的功能,编辑发布文章都需要复制标题,在复制内容来人工发布。
2、梦搏网络一键采集主要功能是,改善织梦自带的“输入网址采集单个网页>>”改善之后,只要输入网址就可以采集,支持95%以上的网页,尤其是文章类型的网站,不需要写采集规则,采集前不需要写规则,一切都是系统自动完成。采集的字段包含:标题、缩略图、简介描述、文章正文内容。
下面看下如何修改,只需要在系统的两个文件上面加几行代码就可以,绝不影响系统以后升级。
打开织梦cms的后台目录文章发布文件,默认是:dede/aticle_add.php 和 dede/templets/aticle_add.htm
dede/aticle_add.php增加如下代码/获取文章最大id以确定当前权重
$maxWright = $dsql->GetOne("SELECT COUNT(*) AS cc FROM #@__archives");
//新增加梦搏网络一键采集
$url="http://api.sinmeng.net/api/caiji/caiji.php?url={$_GET[url]}{$posturl}&key=你的key";
$caiji=json_decode(file_get_contents($url));
$caiji_lead_image_url= mb_convert_encoding($caiji->{'lead_image_url'},'gbk','utf-8');//图片
$caiji_word_count= mb_convert_encoding($caiji->{'word_count'},'gbk','utf-8');//字数
$caiji_title= mb_convert_encoding($caiji->{'title'},'gbk','utf-8');//标题
$caiji_content= mb_convert_encoding($caiji->{'content'},'gbk','utf-8');//内容
$caiji_description=preg_replace("//si","",$caiji_content);//过滤html标签
$caiji_description = mb_substr($caiji_description,0,80,'gbk');//简介
//
include DedeInclude("templets/article_add.htm");
dede/templets/aticle_add.htm 文件修改如下代码
采集单个网页-URL: 文章标题: 缩 略 图:
内容摘要: | <?php echo $description.$caiji_description; ?> |
GetEditor("body",$body.$caiji_content,450); ?> |
代码中http://api.sinmeng.net/api/caiji/caiji.php?url={$_GET[url]}{$posturl}&key=你的key 请联系http://www.sinmeng.net/ 获取你的key
织梦php 文章采集规则,织梦输入网址采集单个网页功能发布 不需要写采集规则一键采集...相关推荐
- 织梦php 文章采集规则,dedecms采集怎么用
以织梦官方站为例,我们采集站长学院下的PHP教程栏目,打开列表地址http://www.dedecms.com/web-art/PHP_jiaocheng. 登录后台,进入"采集节点管理&q ...
- 织梦php 文章采集规则,DEDE全自动采集插件
更新日志: 时间:2012-06-01 内容: 1.修正了一个当在节点参数中设置了[采集数量限制],可能会造成无法正常入库的逻辑问题. 2.修正了一个当使用插件定义的[getLitPath]函数生成预 ...
- dedecmsmip_织梦MIP文章内容页图片适配百度MIP规范
不用修改程序内核文件,不影响电脑站和手机站文章内容页的文章内容输出,增加个自定义方法来解决织梦MIP文章内容页图片适配百度MIP规范 操作步骤 width|height 去除图片宽高 style 去除 ...
- 中 自动展示链接的内容_织梦DEDECMS文章内容中的图片自动添加ALT和title属性方法...
今天下载我资源网(www.xiazaiwo.net)要说的是织梦DEDECMS文章内容中的图片自动添加ALT和title属性,如果觉得不错,请分享给大家,也给大家做个参考.一起跟随小编过来看看吧! 织 ...
- archives_do.php,织梦后台文章管理中增加批量添加tag标签功能
需求背景: 之前发布了不少文章,后来发现之前的这些文章当时发布时都没有添加tag标签,然而现在需要都添加上tag标签,然而这个在默认的织梦后台是没办法批量实现的,只能一篇篇文章去修改. 思考: 织梦原 ...
- 织梦采集-织梦采集教程-织梦采集插件下载教程
织梦采集教程?织梦cms是一个独立的网站程序.今天给大家推荐的是织梦模板(内置5W套织梦cms织梦模板)以及免费织梦插件大全其中包括有:织梦cms采集插件.织梦cms伪原创插件.织梦cms发布插件.织 ...
- 织梦DEDECMS文章、栏目页获取当前页面顶级栏目名称的方法
织梦DEDECMS文章.栏目页获取当前页面顶级栏目名称的方法 织梦DEDECMS文章.栏目页获取当前页面顶级栏目名称的方法 在用织梦做一些项目时,时常会碰到需要在当前页面调用顶级栏目名称的时候,织梦默 ...
- 新闻网站模板html4,织梦新闻文章门户网站模板,Html5响应式高权重网站织梦模板...
织梦新闻文章门户网站模板,Html5响应式高权重网站织梦模板 模板基于织梦CMSv57sp2开发.运行环境已升级并完全兼容PHP5.6. 模板结构以黄金比例分割.更加符合用户人群体验. 该门户网站模板 ...
- 织梦采集,织梦采集工具,织梦cms免费采集
织梦采集,整合了织梦DEDE发布接口,提供有织梦自动采集.织梦自动更新.织梦自动发布等强大的功能,让站长们可以轻松地建立织梦网站或者织梦CMS站群,织梦CMS作为开源的程序,能配上织梦采集管理,将会帮 ...
- 织梦tag伪静态html方式,织梦dedecms TAG标签伪静态方法(附伪静态规则)
在之前,织梦帮介绍了关于 织梦dedecms TAG 标签字数长度修改方法 ,今天就分享下dedecms织梦tag标签实现伪静态的方法,关于tags伪静态配置比其它的配置要简单的多了只需要修改几个小地 ...
最新文章
- oracle timestamp约束,java.lang.ClassCastException:oracle.sql.TIMESTAMP不能转换为java.sql.Timestamp...
- 是否有标准函数检查JavaScript中的null,undefined或空白变量?
- 外链起到引导、推广排名的作用
- 一文了解Linux 网络 I/O 模型
- python中的if not语句_python中使用if not x 语句用法
- PortraitFCN算法详解
- Winform控件扩展
- 华为云VSS漏洞扫描服务之开源组件漏洞检测能力
- 这位29岁MIT美女博士究竟是如何“造”出人类史上首张黑洞照片的?
- 简书bug(已修复):简友圈含英文时误删空格
- HTML简单登录界面的实现
- 码云推送代码后不显示贡献度
- Mysql 分表分区
- 基于Visual Studio 2003/2005的Office插件开发FAQ
- TensorFlow Estimator 官方文档之----内置Estimator
- SonTek -Argonaut-SL500流量计适配调试说明
- Navicat Premium v12 破解教程(转)
- 新买了个redmi红米ax6s网速超快刷openwrt
- 多级分销系统(代理商佣金管理模块)设计概要(要求和数据库设计)
- 在国内如何使用gmail_如何在Gmail中更快地键入电子邮件