前些天用火车头从一个列表页采集一些网址,源码简化如下:

<div> <a href="1" mce_href="1">111</a> </div> <div> <a href="2" mce_href="2">222</a> <img src="" /> </div> <div> <a href="3" mce_href="3">333</a> </div>

我要采集到第二个链接,就是链接后指定有个IMG的,这个常用来采集热门帖子等,当时写的网址采集规则:

<a href="[参数]" mce_href="[参数]">(*)</a> <img src="" />

却发现怎么都采集不对,最后想到原因:火车头从源码的前面开始匹配,每个链接都有<a href=”[参数]“>这个特征,所以就匹配到了第一个链接上面,怎么解决呢?花了10块钱,一个兄弟帮我写了个规则:

<a href="[参数]" mce_href="[参数]">[参数]</a> <img src="" />

就是把模糊匹配(*)给换成了[参数],隐隐约约的有些明白了。

火车头采集指定特征的网址、图片 src相关推荐

  1. 如何使用VB批量采集指定网站上的图片文件以及网页内文字等资源素材

    做自媒体的,可能需要到采集网络上的图片及文章等素材,手动一张张去右键下载效率当然太低 了.还有的朋友不喜欢动脑筋,喜欢到网上搜索一些工作总结啊,或是看小说啊那些文字看得到复制不了,要是能有个小工具来帮 ...

  2. 全自动苹果CMS火车头采集器,苹果CMS火车头发布插件

    苹果CMS火车头采集器,苹果CMS影视建站系统有着丰富和强大的可定制性,做为CMS系统使用,更方便的管理和扩展您的网站.很多站长问我如何苹果CMS火车头采集指定网站或者全网文章关键词泛采集.批量伪原创 ...

  3. 火车头怎么采集图片-火车头采集图片并保存本地化

    火车头怎么采集图片?首先我们一起来了解一下火车头采集器,火车头采集器抓取数据取是决于您的规则.要获取某个网页的所有内容,您需要先获取此网页的网址.程序按规则抓取列表页面,分析其中的URL,然后写规则获 ...

  4. 火车头采集器采集图片文章详细 教程

    火车头采集器怎么采集带图片文章?首先要更好的使用火车头采集器软件,必须需要有基本的HTML基础,能看得懂网页源码,网页结构. 同时如果用到web发布或数据库发布,则对自己文章系统及数据存储结构要非常了 ...

  5. 火车头采集下载图片的位置和URL地址的更换

    火车头采集下载图片的位置和URL地址的更换 1: 先明白, img 标签里面有一个 src 地址 2: 明白下面这图片的内容 下载图片勾选,是必须的 文件保存目录 它代表了2个意思 1是下载的位置[ ...

  6. 火车头采集器 页面图片等信息采集

    火车头采集器 页面图片等信息采集 有些采集的页面中有图片或者其他内容如链接的word文档等等,如果采集下来,并保持链接呢. 火车头采集器中给了较好的操作. 在内容采集中,选择内容下载,如果仅仅是图片, ...

  7. 火车头采集器文章翻译插件(文章标题内容中英双语对照|自动插入相关图片)

    火车头采集器文章翻译插件(文章标题内容中英双语对照|自动插入相关图片) 为了保护接口压力防止被封IP: 请把采集的间隔时间调整为10000~100000 火车头采集器文章翻译插件(文章标题内容中英双语 ...

  8. linux用命令下载图片,Linux命令行中采集指定页面的图片地址及图片下载

    获取指定页面中的图片地址: curl news.baidu.com | grep -Eio '(http|ftp|https)://[A-Za-z0-9_./]+(.jpg|.png|.gif)' 复 ...

  9. 【火车头采集教程】轻而易举学会火车头采集(附带采集案例)

    咔咔不会用python,也没打算为了爬点东西就去学python.时间成本不允许我这样做 于是咔咔使用了一款工具,火车头采集工具 这款工具学会了很简单,不会的全是问题 下来咔咔会把这个工具的从开始到结束 ...

最新文章

  1. linux下find命令的使用和总结
  2. python实现md5加密_Python实现md5加密验证访问接口总结
  3. Visual Studio 2013软件安装教程
  4. 计算未来轻沙龙 | 对抗攻击、强化学习,你关心的都在这里!
  5. 在Eclipse中编写servlet时出现The import javax.servlet cannot be resolved 问题解决办法
  6. vue.js中的组件是什么?
  7. leetcode —— 979. 在二叉树中分配硬币
  8. Linux软件安装的几种方法 (三)—— 源码安装
  9. 细数被程序员吐糟的9大困难(转)
  10. 一个程序通过窗体句柄控制另一个窗体
  11. mysql 原理 ~ 并行复制
  12. 2022年自考专业(工商企业管理)电子商务概论练习题
  13. 关键帧、时间重映射、文本工具
  14. 大数据服务器环境准备(三台服务)
  15. 【银行】2016年中国银行信息科技岗 笔试+面试经验汇总。。。。《转》
  16. BarChart使用详解及详细属性
  17. python第三方库——xlrd和xlwt操作Excel文件学习
  18. 内核小碎碎-第四集 解析dtb
  19. 搜索中的 Query 理解及应用
  20. 德国:一个中国人在德国生活的真实感受

热门文章

  1. 两阶段鲁棒优化模型 多场景 采用matlab编程两阶段鲁棒优化程序
  2. Casinos and travel[智力和快速幂]
  3. 用户余额充值、提现操作。
  4. java 设计模式之解释器模式(十九)
  5. 学习笔记:INA219电流采集方案实现
  6. Python爬取英雄联盟职业比赛数据
  7. 如何将电子海图的航线导到gps上_海图雷达( Chart Radar)在航海中的应用.pdf
  8. 自适共振神经网络算法 ART 算法 代码实现
  9. 图像3尺度全小波包分解matlab,小波分析理论与图像降噪处理
  10. 在dos中分析线程死锁堆栈消息的案例----用Thread简单Demo,教会你如何分析堆栈消息