-
Linux wget es una herramienta para descargar archivos, que se utiliza en la línea de comandos. Es una herramienta esencial para los usuarios de Linux, especialmente para los administradores de red, que a menudo necesitan descargar algún software o restaurar copias de seguridad desde servidores remotos a servidores locales. Si usamos un host virtual, para manejar dicha transacción, solo podemos descargarlo desde el servidor remoto al disco de nuestra computadora y luego usar la herramienta ftp para cargarlo en el servidor. Esto es una pérdida de tiempo y energía y no hay nada que puedas hacer al respecto. Cuando se trata de VPS Linux, se puede descargar directamente al servidor sin pasar por el paso de carga. La herramienta wget es de tamaño pequeño pero tiene funciones completas. Admite la función de descarga de puntos de interrupción, admite métodos de descarga FTP y HTTP, admite servidores proxy y es conveniente y simple de configurar. A continuación explicamos cómo utilizar wget en forma de ejemplos.
1. Utilice wget para descargar un solo archivo
El siguiente ejemplo descarga un archivo de Internet y lo guarda en el directorio actual.
wget http://cn.WordPRess.org/wordpress-3.1-zh_CN.zip
Durante el proceso de descarga, se mostrará una barra de progreso que incluye (porcentaje de finalización de la descarga, bytes descargados, velocidad de descarga actual, tiempo de descarga restante).
2. Utilice wget -O para descargarlo y guardarlo con un nombre de archivo diferente.
De forma predeterminada, wget utilizará el último carácter después de "/" para realizar el comando. Para descargas de enlaces dinámicos, el nombre del archivo normalmente será incorrecto. Error: el siguiente ejemplo descargará un archivo y lo guardará con el nombre download.php?id=1080
wget http://www.zhumaohai.com/download?id=1
Aunque el archivo descargado está en formato zip, aún termina con el comando download.php?id=1080. Correcto: Para resolver este problema, podemos usar el parámetro -O para especificar un nombre de archivo:
wget -O wordpress.zip http://www.zhumaohai.com/download.php?id=1080
3. Utilice wget --limit -rate para limitar la velocidad de descarga
Cuando ejecute wget, ocupará todas las descargas de ancho de banda posibles de forma predeterminada. Pero cuando vas a descargar un archivo grande y también necesitas descargar otros archivos, es necesario limitar la velocidad.
wget --limit-rate=300k http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
4. Utilice wget -c para reanudar la carga desde un punto de interrupción.
Utilice wget -c para reiniciar la descarga de un archivo interrumpido:
wget -c http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
Es muy útil cuando descargamos un archivo grande y de repente se interrumpe debido a la red y otras razones. Podemos continuar descargando en lugar de volver a descargar un archivo. Puede utilizar el parámetro -c cuando necesite continuar una descarga interrumpida.
5. Utilice la descarga en segundo plano de wget -b
Al descargar archivos muy grandes, podemos usar el parámetro -b para la descarga en segundo plano.
wget -b http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
Continuando en segundo plano, pid 1840.
La salida se escribirá en `wget-log'.
Puede utilizar el siguiente comando para comprobar el progreso de la descarga.
cola -f wget-log
6. Descarga del nombre del agente disfrazado
Algunos sitios web pueden rechazar su solicitud de descarga al considerar que el nombre del proxy no es un navegador. Pero puedes disfrazarlo mediante el parámetro --user-agent.
wget --user-agent="Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, como Gecko) Chrome/10.0.648.204 Safari/534.16" Enlace de descarga
7. Utilice wget --spider para probar el enlace de descarga.
Cuando planee realizar descargas programadas, debe probar si el enlace de descarga es válido a la hora programada. Podemos agregar el parámetro --spider para verificar.
wget --spider URL
Si el enlace de descarga es correcto, se mostrará
wget --spider URL
Modo araña habilitado. Compruebe si existe un archivo remoto.
Solicitud HTTP enviada, esperando respuesta 200 OK Longitud: sin especificar [texto/html] El archivo remoto existe y podría contener más enlaces, pero la recursividad está deshabilitada, no se recupera.
Esto garantiza que la descarga se realizará a la hora programada, pero si proporciona el enlace incorrecto, se mostrará el siguiente error
wget --dirección araña
Modo araña habilitado.
Compruebe si existe un archivo remoto. Solicitud HTTP enviada, esperando respuesta. . 404 No encontrado El archivo remoto no existe: ¡enlace roto! ! !
Puede utilizar el parámetro araña en las siguientes situaciones:
7.1 Verificar antes de la descarga programada
7.2 Comprobar si el sitio web está disponible a intervalos
7.3 Verificar enlaces inactivos en las páginas del sitio web
8. Utilice wget: intenta aumentar el número de reintentos.
También puede fallar si hay problemas de red o si descargas un archivo grande. De forma predeterminada, wget reintenta 20 veces conectarse y descargar archivos. Si es necesario, puede utilizar --tries para aumentar el número de reintentos.
wget --tries=40 URL
9. Utilice wget -i para descargar varios archivos
Primero, guarde un archivo de enlace de descarga.
gato>listadearchivos.txt url1 url2 url3 url4
Luego use este archivo y el parámetro -i para descargar
wget -i lista de archivos.txt
10. Utilice wget --mirror para reflejar el sitio web
El siguiente ejemplo descarga el sitio web completo a local.
wget --mirror -p --convert-links -P ./URL LOCAL
--miror: Descarga del espejo de apertura de cuenta
-p: descarga todos los archivos para la visualización normal de la página html
--convert-links: después de la descarga, conviértalo a enlaces locales
-P ./LOCAL: guarda todos los archivos y directorios en el directorio local especificado
11. Utilice wget --reject para filtrar descargas en formatos específicos
Quieres descargar un sitio web, pero no quieres descargar imágenes, puedes usar el siguiente comando.
wget --reject=URL gif
12. Utilice wget -o para almacenar la información de descarga en el archivo de registro.
Si no desea que la información de descarga se muestre directamente en la terminal sino en un archivo de registro, puede utilizar el siguiente comando:
wget -o URL de descarga.log
13. Utilice wget -Q para limitar el tamaño total del archivo de descarga.
Cuando el archivo que desea descargar supere los 5 M y salga de la descarga, puede usar el siguiente comando:
wget -Q5m -i lista de archivos.txt
Nota: Este parámetro no funciona para descargas de un solo archivo, sino solo para descargas recursivas.
14. Utilice wget -r -A para descargar el archivo de formato especificado
Esta característica se puede utilizar en las siguientes situaciones
Descargar todas las imágenes de un sitio web
Descargar todos los vídeos de un sitio web
Descargar todos los archivos PDF de un sitio web
wget -r -A.pdf URL
15. Utilice la descarga FTP de wget
Puede utilizar wget para completar la descarga del enlace ftp. Descarga ftp anónima usando wget
wget ftp-url
Descarga FTP usando autenticación de nombre de usuario y contraseña de wget
wget --ftp-user=NOMBRE DE USUARIO --ftp-contraseña=URL DE CONTRASEÑA
Fuente del artículo: http://www.zhumaohai.com/ Conserve los derechos de autor para la reimpresión
Gracias a Zhu Maohai por su contribución.