小弟近来使用Teleport Pro软件下载一个纯html的静态网站(嗯,不知道称呼它为静态网站是否合适,先这样将就着吧).下载下来之后,发现里面多了好多的冗余信息,例如下面的片断…
使用DreamweaverMX 2004的站点搜索替换功能。就是它,里面还有一个我们不会注意强大功能,使用正则表达式。呵呵,好了,我们的工具浮出水面,接下来就看怎么使用了!
下表列出了在正则表达式中使用的特殊字符、其含义和用法示例。若要搜索包含该表中某一特殊字符的文本,请在特殊字符前面附加一个反斜杠,令其“转义 ”。例如,若要在 some conditions apply* 短语中搜索实际的星号,您的搜索模式应类似于:apply*。如果您没有令星号转义,您将找到“apply”的所有匹配项(以及“appl”、 “applyy”和“applyyy”的所有匹配项),而不只是后面跟有星号的那些匹配项。
然后进行搜索替换操作就OK了!呵呵…有时很不起眼的功能,往往能很大程度上地为我们节省时间,提高工作效率。我希望这文可以引玉,大家多多试验,相信一定会为您的开发和使用带来无尽的便利。
这是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片标签内插入tppabs标签以记录该图片的原始地址。因为这个标签不是合法标 签,所以普通浏览器会忽略它。你可以通过element.getAttribute("tppabs")在JS中读取这个属性。
可以在 DreamWeaver中使用正则表达式批量清除这种代码.
用Teleport pro下载的离线网页文件(整站下载得到)源码中,包含了大量的
< tppabs="/u/info_img/2009-05/31/bg.gif" style="font-size:12px;">
以及
<a href="javascript: if(confirm('http://www.xxx.com/bbs/ nn文件并未依 Teleport Pro 取回,因为 服务器报告因 为错误的发生导致无法读取。 nn你要从服务器上打开它吗?'))window.location='http: //www.xxx.com/bbs/'" >
这样的代码,这些是 Teleport pro给代码加的.相当于一个说明.提示.
可以在 DreamWeaver中使用正则表达式批量清除这种代码.
具体写法如下:
匹配tppabs标签:
btppabs="h[^"]*"
替换为
(空)
匹配javascript代码:
href="javascript:if(confirm('htt[^"]*"
替换为
href="../"
注意替换的时候.应该勾选 "使用正则表达式"
css文件中,还有一些类似/*tpa=/u/info_img/2009-05/31/focus_bmark_bg.gif*/这样的代码
用正则,是这样做的.
tpa=
替换为
(空)
然后剩下的就是/**/ 了,可以不需要正则替换了.