最全的用正则批量去除Teleport Pro整站下载文件冗余代码
有时候我们用Teleport Pro整站下载系统,批量下载一个网站的内容时,里面会加入一些冗余代码,而且大多都不一样,这时候我们就只好用正则表达式来替换了
tppabs
html原文件中tppabs标记是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。但可以通过element.getAttribute("tppabs")在JS中读取这个属性。
如我们手动清除的话,那将是一个无法估计的工作量,需要批量清除。利用DreamWeaver正则表达式批量清除tppabs标签更加容易、快捷。
[在新窗口打开图片]
方法如下:
使用DW替换功能:
查找范围:整个当前本地站点
搜索:源代码
查找:\btppabs="h[^"]*"
替换:(为空)
勾选:使用正则表达式
点替换全部按钮即可
[在新窗口打开图片]
匹配javascript代码:
<a href="javascript: if(confirm('http://www.xxx.com \n\n文件并未依 Teleport Pro 取回,因为服务器报告错误导致无法读取。 \n\n你要从服务器上打开它吗?'))window.location='http: //www.xxx.com'" >
方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:href="javascript:if\(confirm\('htt[^"]*"
替换:href=www.xxx.com
勾选:使用正则表达式
点替换全部按钮
注:如果该表达式中含有不同的网址,可使用if\(confirm\('htt[^"]*\)(注意其他代码是否使用此类语法表达)匹配不带网址的部分,替换成空。
css文件有一些类似/*tpa=http://www.xxx.com/test.gif*/代码
方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:\/\*tpa=http://[^\s]*\/
替换:空
勾选:使用正则表达式
点替换全部按钮
字符 匹配 示例
^ 输入或行的起始部分。 ^T 匹配“This good earth”中的“T”,但不匹配“Uncle Tom's Cabin”中的“T”。
$ 输入或行的结尾部分。 h$ 匹配“teach”中的“h”,但是不匹配“teacher”中的“h”
* 0 个或多个前置字符。 um* 匹配“rum”中的“um”、“yummy”中的“umm”以及“huge”中的“u”
+ 1 个或多个前置字符。 um+ 匹配“rum”中的“um”和“yummy”中的“umm”,但在“huge”中没有任何匹配项
? 前置字符最多出现一次(即,指示前置字符是可选的)。 st?on 匹配“Johnson”中的“son”和“Johnston”中的“ston”,但在“Appleton”和“tension”中没有任何匹配项
. 除换行符外的任何单字符。 .an 匹配短语“bran muffins can be tasty”中的“ran”和“can”
x|y x 或 y。 FF0000|0000FF 匹配 bgcolor=”#FF0000” 中的“FF0000”和 font color=”#0000FF” 中的“0000FF”
{n} 恰好 n 个前置字符。 o{2} 匹配“loom”中的“oo”和“mooooo”中的前两个“o”,但在“money”中没有任何匹配项
{n,m} 至少 n 个、至多 m 个前置字符。 F{2,4} 匹配“#FF0000”中的“FF”和“#FFFFFF”中的前四个“F”
[abc] 用括号括起来的字符中的任何一个字符。用连字符指定某一范围的字符(例如, [a-f] 等效于 [abcdef])。 [e-g] 匹配“bed”中的“e”、“folly”中的“f”和“guard”中的“g”
[^abc] 未在括号中括起来的任何字符。用连字符指定某一范围的字符(例如,[^a-f] 等效于[^abcdef])。 [^aeiou] 最初匹配“orange”中“r”、“book”中的“b”和“eek!”中的“k”
\b 词边界(例如空格或回车符)。 \bb 匹配“book”中的“b”,但在“goober”和“snob”中没有任何匹配项
\B 词边界之外的任何内容。 \Bb 匹配“goober”中的“b”,但在“book”中没有任何匹配项
\d 任何数字字符。等效于 [0-9]。 \d 匹配“C3PO”中的“3”和“apartment 2G”中的“2”
\D 任何非数字字符。等效于 [^0-9]。 \D 匹配“900S”中的“S”和“Q45”中的“Q”
\f 换页符。
\n 换行符。
\r 回车符。
\s 任何单个空白字符,包括空格、制表符、换页符或换行符。 \sbook 匹配“blue book”中的“book”,但在“notebook”中没有任何匹配项
\S 任何单个非空白字符。 \Sbook 匹配“notebook”中的“book”,但在“blue book”中没有任何匹配项
\t 制表符。
\w 任何字母数字字符,包括下划线。等效于 [A-Za-z0-9_]。 b\w* 匹配“the barking dog”中的“barking”以及“the big black dog”中的“big”和“black”
\W 任何非字母数字字符。等效于 [^A-Za-z0-9_]。 \W 匹配“Jake&Mattie”中的
转载于:https://blog.51cto.com/unity3d168/1334832
最全的用正则批量去除Teleport Pro整站下载文件冗余代码相关推荐
- 使用Teleport pro整站下载相关问题
1.如页面样式问题,比如居中的却没生效,但服务器上却可以居中,查看到样式文件也下了,路径也对上了,还是没法实现该有的样式,这时看一下源文件的html开始标签,可能出现两个<HTML>标签, ...
- teleport ultra整站下载工具
teleport ultra: http://www.tenmax.com/teleport/ultra/download.htm
- python批量下载文件只有1kb_Python 实现批量从不同的Linux服务器下载文件
基于Python实现批量从不同的Linux服务器下载文件 by:授客 QQ:1033553122 实现功能 批量从不同的Linux服务器下载指定文件 测试环境 Win7 64位 Python 3.3. ...
- Python 实现批量从不同的Linux服务器下载文件
基于Python实现批量从不同的Linux服务器下载文件 by:授客 QQ:1033553122 实现功能 1 测试环境 1 使用方法 1 1. 编辑配置文件conf/file_for_downl ...
- python批量下载网页文件夹_Python实现批量从不同的Linux服务器下载文件
基于Python实现批量从不同的Linux服务器下载文件 by:授客 实现功能 批量从不同的Linux服务器下载指定文件 测试环境 Win7 64位 Python 3.3.2 pscp 64位 下载地 ...
- 【WebGIS全栈】从0到1开发整站——旅游足迹地图网站
介绍 本专栏起初定位群体为初学者,目标是认识 WebGIS,以及快速上手 WebGIS 前端开发,Demo 也是比较基础的,为了能进阶学习,现在计划提升一下Demo的难度,开发一个完整的足迹网站. 专 ...
- 远洋整站下载器不能用https_这可能是最全最好的爆破百度文库下载指南了!
日常生活中,无论各行各业,我相信,你一定用过某下载文档资料的平台,比如说,百度文库. 有时候,为了赶交一篇论文或者下载一些考试真题,百度搜了半天资料,刚刚找到一个觉得蛮不错的打算下载,结果... 要么 ...
- linux批量远程多服务器FTP并下载文件的脚本
#!/bin/bash time=`date +%Y%m` day=`date -d '-1 days' +%Y%m%d` localDir="/DBBackup/GameDB" ...
- 最新彩虹易支付全解版疑似hack易支付整站源码打包
介绍: 今天给大家带来的是好多人都想要的易支付源码 这次的源码百分之九十九解码,监测无后门可正常运营! 易支付大家都知道是一个很赚钱的活,前阵子h**k易支付不干了的消息相信有的人听说过,不幸的是我余 ...
最新文章
- 慕了!北京大学新校区来了!
- wdlinux 安装apc扩展
- 【小白学习C++ 教程】十、C++中指针和内存分配
- node.js第一步
- java 的对象类用_java基础(第零篇)对象与类
- 2014青岛初中组第2题 洪水 详解(C++)
- 计算机网络未来的发展和趋势论文,计算机网络发展论文范文
- spring事务失效二:业务代码捕获异常
- 人工神经网络翻译的优点,神经网络机器翻译技术
- Web服务器、Web容器、Servlet容器、Spring容器、SpringMVC容器
- 李南江 html5笔记,Mr.Woo跟着李南江学习HTML5—项目总结
- PDF文件如何旋转后保存
- IntelliJ Idea 下Png图片打开方式导致编码报错
- php Guzzle源码,PHP Guzzle获取请求
- Feign - Error while extracting response for type [class java.lang.String]
- 查快递单号物流信息查询,支持多家快递
- html上外边距是,margin-top css设置对象上外边距间距(上外补白)
- 《游戏学习》 java经典纸牌类小游戏《斗地主》源码
- HTML-table单行操作
- python海水密度计算(图形界面)源代码
热门文章
- You and Your Research (Chinese)
- 骁龙660_骁龙660相当于苹果的哪款处理器?你知道吗
- cocos2d-x 游戏 之 Tiled Map Editor(地图编辑)
- Prepack详细介绍及微信小程序优化的新思路
- Java中Collections.sort()排序详解
- vscode使用xdebug3进行PHP调试
- 【Android工程师与智能家居产品的第一次接触②】给设备配网 Esp8266 wifi模块的快速配网和AP配网简介(付Android demo)
- 史上最简单的抖音吸粉方法大全
- 道路监控系统java代码_使用Java实现简单的监控系统
- git config命令详解