Recentemente, usei o software Teleport Pro para baixar um site estático em HTML puro (bem, não sei se é apropriado chamá-lo de site estático, então vamos nos contentar com isso. Depois de baixá-lo, descobri que havia um). contém muitas informações redundantes, como os seguintes trechos...
tppabs="/u/info_img/2009-05/31/thirdkind1.gif" class="style4">
A parte vermelha do tutorial básico são dados redundantes. Agora quero que tudo na página inteira comece com tppabs= e exclua os atributos com o primeiro "" como terminador, mas a operação manual é muito lenta, ineficiente e propensa a erros.
Meu primeiro pensamento é usar a pesquisa e substituição, mas qual software pode ser o mais eficiente?
Use DreamweaverMX A função de busca e substituição de sites de 2004. É isso, tem outra função poderosa que não vamos prestar atenção, usando expressões regulares Haha, nossa ferramenta apareceu, vamos ver como. para usá-lo
!, encontre o seguinte: Expressões regulares são padrões que descrevem combinações de caracteres como texto. Usá-los em pesquisas de código pode ajudar a descrever conceitos como "linhas começando com 'var'" e "valores de atributos contendo números"
abaixo.
. A tabela lista os caracteres especiais usados em expressões regulares, seus significados e exemplos de uso. Para pesquisar texto que contém um dos caracteres especiais nesta tabela, "escape" do caractere especial anexando-o com uma barra invertida. Por exemplo, para procurar o asterisco real na frase algumas condições se aplicam*, seu padrão de pesquisa seria semelhante a: aplicar*. Se você não escapasse do asterisco, encontraria todas as ocorrências de "aplicar" (e todas as correspondências de "aplicar-se"). "appl", "applyy" e "applyyy"), não apenas aqueles seguidos por um asterisco
Exemplo | de correspondência | de caracteres |
^ | T corresponde a "This good | " | em "earth", mas não em "Uncle Tom's Cabin".
$ | Fim da entrada ou linha. | h$ corresponde a "h" em "teach", mas não a "teacher" 'h' em 'h' |
* | 0 | ou mais caracteres iniciais. | ' em 'gostoso' e 'u' |
+ | 1 ou mais em 'enorme' caractere de prefixo | um+ corresponde a "um" em "rum" e "umm" em "gostoso", mas não há correspondência em "enorme" |
? | O caractere de prefixo pode aparecer no máximo uma vez (ou seja, indica que o caractere de prefixo está selecionado). | st?on corresponde a "son" em "Johnson" e "ston" em "Johnston", mas não há correspondência em "Appleton" e "tensão" |
. | Qualquer caractere único, exceto uma nova linha. | .an corresponde a "correu" e "pode" x|y x ou y na frase "muffins de farelo podem?ser saborosos |
" | . | FF0000|0000FF corresponde a "FF0000" em bgcolor="#FF0000" e "0000FF" em font color="#0000FF" |
{n} | exatamente n caracteres iniciais. | o{2} corresponde a "oo" em "loom" e aos dois primeiros "o"s em "mooooo", mas não há correspondência em "money" |
{n,m} | pelo menos n e no máximo m caracteres de prefixo. |
F{2,4} corresponde a qualquer um dos caracteres entre | parênteses |
entre "FF" em "#FF0000" e os primeiros quatro caracteres "F" em "#ffffff" |
[abc]. Use hífens para especificar um intervalo de caracteres (por exemplo, [af] é equivalente a [abcdef]). | [por exemplo] Corresponde ao "e" em "cama", ao "f" em "folly" e ao "g" em "guard" |
[^abc] | Qualquer caractere não colocado entre parênteses. Use hífens para especificar um intervalo de caracteres (por exemplo, [^af] é equivalente a [^abcdef]). | [^aeiou] inicialmente corresponde ao "r" em "laranja", ao "b" em "livro" e ao "k" em "eek!" |
b | limites de palavras (como espaços ou retornos de carro). | bb corresponde ao "b" em "book", mas não há correspondência em "goober" e "snob" com nada |
fora do limite da palavra | . | Bb corresponde ao "b" em "goober", mas não há correspondência para nenhum caractere numérico em "book |
" | . Equivalente a [0-9]. | d corresponde a "3" em "C3PO" e "2" em "apartamento 2G" |
DAqualquer | caractere não numérico. Equivalente a [^0-9]. | D corresponde a "S" em "900S" e "Q" em "Q45" |
f | caractere formfeed. | |
| nCaractere de nova linha. | |
rCaractere | de retorno de carro. | |
sQualquer | caractere de espaço em branco, incluindo espaço, tabulação, feed de formulário ou caractere de nova linha. |
sbook corresponde a "book" em "blue book", mas não há correspondência para | nenhum caractere que não seja espaço em branco |
em "notebook" |
. Sbook corresponde a "book" em "notebook", mas não há correspondência em "blue book" |
ttab | . | |
wQualquer | caractere alfanumérico, incluindo sublinhado. Equivalente a [A-Za-z0-9_]. | bw* corresponde a "latido" em "o cachorro latindo" e "grande" e "preto" em "o cachorro preto grande" |
WAqualquer | caractere não alfanumérico. Equivalente a [^A-Za-z0-9_]. | W corresponde ao "&" em "Jake&Mattie" e ao "%" em "100%" |
. Use parênteses para separar grupos a serem citados posteriormente na expressão regular. Em seguida, use $1, $2, $3, etc. no campo Substituição para se referir ao primeiro, segundo, terceiro e grupos de colchetes subsequentes.
Por exemplo: Substitua "/main.asp?classid=286" por "class(286)"
Pesquisa: /main.asp?classid=(d+)
Substitua: class($1)
Nota: No texto "Localizar conteúdo" box Use 1, 2, 3, etc. (em vez de $1, $2, $3) para se referir a agrupamentos de colchetes anteriores na expressão regular.
Abaixo está a expressão regular que uso. Muito útil:
btppabs="h[^"]*"
Então pesquise e substitua e está tudo bem! Haha... Às vezes, funções muito discretas podem nos poupar tempo e melhorar muito a eficiência do trabalho. Espero que este artigo possa inspirar você. Se você tentar mais, acredito que trará comodidade infinita ao seu desenvolvimento e uso.
Esta é a marca deixada pelo software Teleport Pro. Este software é um navegador offline. Após baixar a página inteira, ele inserirá a tag tppabs na tag da imagem para registrar o endereço original da imagem. Como esta tag não é legal, os navegadores comuns irão ignorá-la. Você pode ler este atributo em JS através de element.getAttribute("tppabs").
Esse tipo de código pode ser limpo em lotes usando expressões regulares no DreamWeaver.
O método de escrita específico é o seguinte:
Corresponder à tag tppabs:
btppabs="h[^"]*"
Substitua por
(nulo)
Combine o código javascript:
href="javascript:if(confirm('htt[^"]*"
Substitua por
href="../"
Observe que ao substituir, você deve marcar "Usar expressões regulares"
Este artigo vem de: Blog de Search Engine Marketing de He Ku (http://www.heku.org.cn/) Referência detalhada da fonte: http://www.heku.org.cn/SEO/tppabs-Teleport.html
O código-fonte do arquivo da página da web offline baixado com o Teleport pro (obtido baixando o site inteiro) contém um grande número de
< tppabs ="/u/info_img/2009-05/31/bg.gif" style ="font- size:12px;" >
e
< a href ="javascript: if(confirm('http://www.xxx.com/bbs/ nnO arquivo não foi recuperado de acordo com o Teleport Pro porque o servidor relatou que poderia não pode ser lido devido a um erro.nnDeseja abri-lo no servidor '))window.location='http://www.xxx.com/bbs/'" >
Esse código é adicionado ao código pelo Teleport pro. É equivalente a uma descrição.
Você
pode usar expressões regulares no DreamWeaver
para
limpar esse tipo de código em lotes.
:
Substitua
btppabs="h[^"]*"
pelo
código javascript correspondente
(vazio)
:
Substitua
href="javascript:if(confirm('htt[^"]*"
por
href="../"
ao substituir. Você deve marcar "Usar expressões regulares"
no arquivo css, e há alguns / *tpa=/u/info_img/2009-05/31/focus_bmark_bg.gif*/ É assim que o código
usa expressões regulares.
Substitua
tpa=
por
(vazio)
e o resto é /**/ , o que é bom. Não há necessidade de substituição regular.