-
Linux wget é uma ferramenta para download de arquivos, que é usada na linha de comando. É uma ferramenta essencial para usuários Linux, especialmente para administradores de rede, que muitas vezes precisam baixar algum software ou restaurar backups de servidores remotos para servidores locais. Se usarmos um host virtual, para lidar com tal transação, só podemos baixá-lo do servidor remoto para o disco do nosso computador e, em seguida, usar a ferramenta FTP para carregá-lo no servidor. Isso é uma perda de tempo e energia e não há nada que você possa fazer a respeito. Quando se trata de Linux VPS, ele pode ser baixado diretamente para o servidor sem passar pela etapa de upload. A ferramenta wget é pequena, mas possui funções completas. Suporta função de download de ponto de interrupção, suporta métodos de download FTP e HTTP, suporta servidores proxy e é conveniente e simples de configurar. Abaixo explicamos como usar o wget na forma de exemplos.
1. Use wget para baixar um único arquivo
O exemplo a seguir baixa um arquivo da Internet e o salva no diretório atual
wget http://cn.WordPRess.org/wordpress-3.1-zh_CN.zip
Durante o processo de download, uma barra de progresso será exibida, incluindo (porcentagem de conclusão do download, bytes baixados, velocidade atual de download, tempo restante de download).
2. Use wget -O para fazer download e salvá-lo com um nome de arquivo diferente.
Por padrão, o wget usará o último caractere após "/" para comandar. Para downloads de link dinâmico, o nome do arquivo geralmente estará incorreto. Erro: O exemplo a seguir irá baixar um arquivo e salvá-lo com o nome download.php?id=1080
wget http://www.zhumaohai.com/download?id=1
Mesmo que o arquivo baixado esteja no formato zip, ele ainda termina com o comando download.php?id=1080. Correto: Para resolver este problema, podemos usar o parâmetro -O para especificar um nome de arquivo:
wget -O wordpress.zip http://www.zhumaohai.com/download.php?id=1080
3. Use wget --limit -rate para limitar a velocidade de download
Quando você executa o wget, ele ocupará todos os downloads de largura de banda possíveis por padrão. Mas quando você vai baixar um arquivo grande e também precisa baixar outros arquivos, é necessário limitar a velocidade.
wget --limit-rate=300k http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
4. Use wget -c para retomar o upload de um ponto de interrupção
Use wget -c para reiniciar o download de um arquivo interrompido:
wget -c http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
É muito útil quando baixamos um arquivo grande e ele é interrompido repentinamente devido à rede e outros motivos. Podemos continuar baixando em vez de baixar novamente um arquivo. Você pode usar o parâmetro -c quando precisar continuar um download interrompido.
5. Use o download em segundo plano wget -b
Ao baixar arquivos muito grandes, podemos usar o parâmetro -b para download em segundo plano.
wget -b http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
Continuando em segundo plano, pid 1840.
A saída será gravada em `wget-log'.
Você pode usar o seguinte comando para verificar o progresso do download
tail -f wget-log
6. Download do nome do agente disfarçado
Alguns sites podem negar sua solicitação de download julgando que o nome do proxy não é um navegador. Mas você pode disfarçar isso através do parâmetro --user-agent.
wget --user-agent = "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, como Gecko) Chrome/10.0.648.204 Safari/534.16" Link para download
7. Use wget --spider para testar o link de download
Ao planejar realizar downloads agendados, você deve testar se o link de download é válido no horário agendado. Podemos adicionar o parâmetro --spider para verificar.
URL wget --spider
Se o link de download estiver correto, ele será exibido
URL wget --spider
Modo Spider ativado. Verifique se o arquivo remoto existe.
Solicitação HTTP enviada, aguardando resposta. 200 OK Comprimento: não especificado [text/html] O arquivo remoto existe e pode conter outros links, mas a recursão está desativada - não está sendo recuperada.
Isso garante que o download continuará no horário agendado, mas se você fornecer o link errado, o seguinte erro será exibido
wget --spiderurl
Modo aranha ativado.
Verifique se existe arquivo remoto solicitação HTTP enviada, aguardando resposta. . 404 Não encontrado O arquivo remoto não existe – link quebrado! ! !
Você pode usar o parâmetro spider nas seguintes situações:
7.1 Verifique antes do download agendado
7.2 Verifique se o site está disponível em intervalos
7.3 Verifique links inativos nas páginas do site
8. Use wget --tries para aumentar o número de novas tentativas
Também poderá falhar se houver problemas de rede ou se você baixar um arquivo grande. Por padrão, o wget tenta novamente 20 vezes para conectar e baixar arquivos. Se necessário, você pode usar --tries para aumentar o número de novas tentativas.
wget --tries=40 URL
9. Use wget -i para baixar vários arquivos
Primeiro, salve um arquivo de link de download
gato>lista de arquivos.txt url1 url2 url3 url4
Então use este arquivo e o parâmetro -i para baixar
wget -i lista de arquivos.txt
10. Use wget --mirror para espelhar o site
O exemplo abaixo baixa todo o site para local.
wget --mirror -p --convert-links -P ./URL LOCAL
--miror: Download do espelho de abertura de conta
-p: Baixe todos os arquivos para exibição normal da página HTML
--convert-links: Após o download, converta-o em links locais
-P ./LOCAL: Salve todos os arquivos e diretórios no diretório local especificado
11. Use wget --reject para filtrar downloads em formatos especificados
Você deseja baixar um site, mas não deseja baixar imagens, pode usar o seguinte comando.
wget --rejeitar=url do gif
12. Use wget -o para armazenar as informações de download no arquivo de log
Se você não deseja que as informações de download sejam exibidas diretamente no terminal, mas em um arquivo de log, você pode usar o seguinte comando:
URL wget -o download.log
13. Use wget -Q para limitar o tamanho total do arquivo de download
Quando o arquivo que você deseja baixar ultrapassar 5M e sair do download, você pode usar o seguinte comando:
wget -Q5m -i lista de arquivos.txt
Nota: Este parâmetro não funciona para downloads de arquivo único, mas apenas para downloads recursivos.
14. Use wget -r -A para baixar o arquivo de formato especificado
Este recurso pode ser usado nas seguintes situações
Baixe todas as imagens de um site
Baixe todos os vídeos de um site
Baixe todos os arquivos PDF de um site
url wget -r -A.pdf
15. Use o download wget FTP
Você pode usar o wget para concluir o download do link FTP. Download FTP anônimo usando wget
wget ftp-url
Download FTP usando autenticação de nome de usuário e senha wget
wget --ftp-user=NOME DE USUÁRIO --ftp-password=URL da SENHA
Fonte do artigo: http://www.zhumaohai.com/ Mantenha os direitos autorais para reimpressão
Obrigado a Zhu Maohai pela sua contribuição