« 无意中,又看到一个百度网站制作的不足之处.
各大搜索引擎对cang.baidu.com快照的不同处理 »

清除整站下载文件中的冗余代码:tppabs等

 用Teleport pro下载的离线网页文件(整站下载得到)源码中,包含了大量的 

< tppabs="http://www.****.com/images/bg.gif" style="font-size:12px;">

以及

<href="javascript: if(confirm('http://www.xxx.com/bbs/  \n\n文件并未依 Teleport Pro 取回,因为 服务器报告因为错误的发生导致无法读取。  \n\n你要从服务器上打开它吗?'))window.location='http: //www.xxx.com/bbs/'" >

 

这样的代码,这些是 Teleport pro给代码加的.相当于一个说明.提示.

可以在 DreamWeaver中使用正则表达式批量清除这种代码.

具体写法如下:

匹配tppabs标签:
\btppabs="h[^"]*"

替换为

(空)

匹配javascript代码:
href="javascript:if\(confirm\('htt[^"]*"

替换为

href="../"

注意替换的时候.应该勾选 "使用正则表达式"

css文件中,还有一些类似/*tpa=http://image.39.net/cancer/images/focus_bmark_bg.gif*/这样的代码

用正则,是这样做的.

tpa=http://[^\s]*.gif

替换为

(空)

然后剩下的就是/**/ 了,可以不需要正则替换了.

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。