Recientemente utilicé el software Teleport Pro para descargar un sitio web estático HTML puro (bueno, no sé si es apropiado llamarlo sitio web estático, así que nos conformamos con él. Después de descargarlo, descubrí que había un). contiene mucha información redundante, como los siguientes fragmentos...
tppabs="/u/info_img/2009-05/31/thirdkind1.gif" class="style4">
La parte roja del tutorial básico son datos redundantes. Ahora quiero que todo en toda la página comience con tppabs= y elimine los atributos con el primer "" como terminador, pero la operación manual es demasiado lenta, ineficiente y propensa a errores.
Mi primer pensamiento es utilizar la búsqueda y el reemplazo. pero ¿qué software puede ser el más eficiente?
Utilice DreamweaverMX La función de búsqueda y reemplazo de sitios de 2004. Eso es todo, hay otra función poderosa a la que no prestaremos atención, usando expresiones regulares Jaja, nuestra herramienta ha aparecido, veamos cómo. para usarlo
, busque lo siguiente: Las expresiones regulares son patrones que describen combinaciones de caracteres como texto. Usarlas en búsquedas de código puede ayudar a describir conceptos como "líneas que comienzan con 'var'" y "valores de atributos que contienen números"
a continuación. La tabla enumera los caracteres especiales utilizados en las expresiones regulares, sus significados y ejemplos de uso. Para buscar texto que contenga uno de los caracteres especiales en esta tabla, "escapa" el carácter especial agregándole una barra invertida ". Por ejemplo, para buscar el asterisco real en la frase se aplican algunas condiciones*, su patrón de búsqueda se vería así: aplicar* Si no omitiera el asterisco, encontraría todas las apariciones de "aplicar" (y todas las coincidencias de "aplicar"). "appl", "applyy" y "applyyy"), no solo los seguidos por un asterisco.
Ejemplo | de coincidencia de | caracteres |
^ | T coincide con "This good | " | "T" en "earth", pero no en "Uncle Tom's Cabin".
$ | Fin de entrada o línea | h$ coincide con "h" en "teach", pero no con "teacher" 'h' en 'h' |
* | 0 o más caracteres iniciales um* coincide con 'um' en 'rum', 'umm | . | ' en 'yummy' y 'u' |
+ | 1 o más en 'enorme'. carácter de prefijo | um+ coincide con "um" en "ron" y "umm" en "yummy", pero no hay ninguna coincidencia en "enorme" |
. | El carácter de prefijo puede aparecer como máximo una vez (es decir, indica que el carácter de prefijo está seleccionado). | st?on coincide con "son" en "Johnson" y "ston" en "Johnston", pero no hay ninguna coincidencia en "Appleton" y "tensión" |
. | Cualquier carácter excepto una nueva línea. | .an coincide con "ran" y "can" x|y x o y en la frase "los muffins de salvado pueden ser sabrosos |
" | . | FF0000|0000FF coincide con "FF0000" en bgcolor="#FF0000" y "0000FF" en font color="#0000FF" |
{n} | exactamente n caracteres iniciales. | o{2} coincide con "oo" en "loom" y las dos primeras "o" en "mooooo", pero no hay coincidencia en "money" |
{n,m} | al menos n y como máximo m caracteres de prefijo. |
F{2,4} coincide con cualquiera de los caracteres entre | paréntesis |
entre "FF" en "#FF0000" y los primeros cuatro caracteres "F" en "#ffffff" |
[abc]. Utilice guiones para especificar un rango de caracteres (por ejemplo, [af] equivale a [abcdef]). | [p. ej.] Coincide con la "e" en "bed", la "f" en "folly" y la "g" en "guard" |
[^abc] | Cualquier carácter que no esté entre paréntesis. Utilice guiones para especificar un rango de caracteres (por ejemplo, [^af] es equivalente a [^abcdef]). | [^aeiou] inicialmente coincide con la "r" en "orange", la "b" en "book" y la "k" en "eek!" |
b | límites de palabras (como espacios o retornos de carro). | bb coincide con la "b" en "libro", pero no hay coincidencia en "goober" y "snob" con nada |
fuera del límite de la palabra | . | Bb coincide con la "b" en "goober", pero no coincide con ningún carácter numérico en "book |
" | . Equivalente a [0-9]. | d coincide con "3" en "C3PO" y "2" en "apartamento 2G" |
DCualquier | carácter no numérico. Equivalente a [^0-9]. | D coincide con "S" en "900S" y "Q" en "Q45" |
f | carácter de avance de formulario. | |
| nCarácter de nueva línea. | |
| rCarácter de retorno de carro. | |
sCualquier | carácter de espacio en blanco, incluido el espacio, la tabulación, el avance de página o el carácter de nueva línea. |
sbook coincide con "libro" en "libro azul", pero no hay coincidencia con | ningún carácter que no sea un espacio en blanco |
en "cuaderno" |
. Sbook coincide con "libro" en "cuaderno", pero no hay coincidencia en "libro azul" |
ttab | . | |
wCualquier | carácter alfanumérico, incluido el guión bajo. Equivalente a [A-Za-z0-9_]. | bw* coincide con "ladrando" en "el perro que ladra" y "grande" y "negro" en "el gran perro negro" |
Wcualquier | carácter no alfanumérico. Equivalente a [^A-Za-z0-9_]. | W coincide con "&" en "Jake&Mattie" y "%" en "100%" |
Utilice paréntesis para separar los grupos que se citarán más adelante dentro de la expresión regular. Luego use $1, $2, $3, etc. en el campo Reemplazo para hacer referencia al primer, segundo, tercer y siguientes grupos de corchetes.
Por ejemplo: Reemplace "/main.asp?classid=286" con "class(286)"
Buscar: /main.asp?classid=(d+)
Reemplace: class($1)
Nota: En el texto "Buscar contenido" box Utilice 1, 2, 3, etc. (en lugar de $1, $2, $3) para referirse a agrupaciones de corchetes anteriores en la expresión regular.
A continuación se muestra la expresión regular que uso. Muy útil:
btppabs="h[^"]*"
Luego busque y reemplace y ¡está bien! Jaja... A veces, funciones muy discretas a menudo pueden ahorrarnos tiempo y mejorar en gran medida la eficiencia del trabajo. Espero que este artículo pueda Te inspirará. Si lo pruebas más, creo que te brindará infinitas comodidades para tu desarrollo y uso.
Esta es la huella que deja el software Teleport Pro. Este software es un navegador sin conexión. Después de descargar la página web completa, insertará la etiqueta tppabs en la etiqueta de la imagen para registrar la dirección original de la imagen. Debido a que esta etiqueta no es legal, los navegadores normales la ignorarán. Puede leer este atributo en JS a través de element.getAttribute("tppabs").
Este tipo de código se puede limpiar en lotes utilizando expresiones regulares en DreamWeaver.
El método de escritura específico es el siguiente:
Coincidir con la etiqueta tppabs:
btppabs="h[^"]*"
Reemplazar con
(nulo)
Coincidir con el código javascript:
href="javascript:if(confirmar('htt[^"]*"
Reemplazar con
href="../"
Tenga en cuenta que al reemplazar, debe marcar "Usar expresiones regulares".
Este artículo proviene de: Blog de marketing de motores de búsqueda de He Ku (http://www.heku.org.cn/) Referencia detallada de la fuente: http://www.heku.org.cn/SEO/tppabs-Teleport.html
El código fuente del archivo de la página web sin conexión descargado con Teleport pro (que se obtiene descargando el sitio completo) contiene una gran cantidad de
< tppabs ="/u/info_img/2009-05/31/bg.gif" style ="font- size:12px;" >
y
< a href ="javascript: if(confirm('http://www.xxx.com/bbs/ nnEl archivo no se recuperó según Teleport Pro porque el servidor informó que podía no se puede leer debido a un error.nn¿Quieres abrirlo desde el servidor? '))window.location='http://www.xxx.com/bbs/'" >
Teleport pro agrega dicho código al código. Es equivalente a una descripción.
Puede utilizar expresiones regulares en DreamWeaver para borrar este tipo de código en lotes.
El método de escritura específico es el siguiente:
Haga coincidir la etiqueta tppabs. :
Reemplace
btppabs="h[^"]*"
con
código javascript coincidente
(vacío)
:
Reemplace
href="javascript:if(confirm('htt[^"]*"
con
href="../"
al reemplazar. Debe marcar "Usar expresiones regulares"
en el archivo css, y hay algunas similares / *tpa=/u/info_img/2009-05/31/focus_bmark_bg.gif*/Así es como el código
usa expresiones regulares
Reemplace
tpa=
con
(vacío)
y el resto es /**/ , lo cual está bien. No es necesario. reemplazo regular.