-
Linux wget ist ein Tool zum Herunterladen von Dateien, das auf der Befehlszeile verwendet wird. Es ist ein unverzichtbares Tool für Linux-Benutzer, insbesondere für Netzwerkadministratoren, die häufig Software herunterladen oder Backups von Remote-Servern auf lokalen Servern wiederherstellen müssen. Wenn wir zur Abwicklung einer solchen Transaktion einen virtuellen Host verwenden, können wir sie nur vom Remote-Server auf die Festplatte unseres Computers herunterladen und sie dann mit dem FTP-Tool auf den Server hochladen. Das ist Zeit- und Energieverschwendung und Sie können nichts dagegen tun. Wenn es um Linux VPS geht, kann es direkt auf den Server heruntergeladen werden, ohne den Upload-Schritt durchlaufen zu müssen. Das Wget-Tool ist klein, verfügt aber über umfassende Funktionen. Es unterstützt die Breakpoint-Download-Funktion, unterstützt FTP- und HTTP-Download-Methoden, unterstützt Proxy-Server und ist bequem und einfach einzurichten. Im Folgenden erklären wir anhand von Beispielen die Verwendung von wget.
1. Verwenden Sie wget, um eine einzelne Datei herunterzuladen
Das folgende Beispiel lädt eine Datei aus dem Internet herunter und speichert sie im aktuellen Verzeichnis
wget http://cn.WordPRess.org/wordpress-3.1-zh_CN.zip
Während des Download-Vorgangs wird ein Fortschrittsbalken angezeigt, der Folgendes enthält: Download-Abschlussprozentsatz, heruntergeladene Bytes, aktuelle Download-Geschwindigkeit, verbleibende Download-Zeit.
2. Verwenden Sie wget -O, um es herunterzuladen und unter einem anderen Dateinamen zu speichern.
Standardmäßig verwendet wget das letzte Zeichen nach „/“ für den Befehl. Bei dynamischen Link-Downloads ist der Dateiname normalerweise falsch. Fehler: Das folgende Beispiel lädt eine Datei herunter und speichert sie unter dem Namen download.php?id=1080
wget http://www.zhumaohai.com/download?id=1
Obwohl die heruntergeladene Datei im ZIP-Format vorliegt, endet sie dennoch mit dem Befehl download.php?id=1080. Richtig: Um dieses Problem zu lösen, können wir mit dem Parameter -O einen Dateinamen angeben:
wget -O wordpress.zip http://www.zhumaohai.com/download.php?id=1080
3. Verwenden Sie wget --limit -rate, um die Download-Geschwindigkeit zu begrenzen
Wenn Sie wget ausführen, belegt es standardmäßig alle möglichen Bandbreiten-Downloads. Wenn Sie jedoch eine große Datei herunterladen und auch andere Dateien herunterladen müssen, ist es notwendig, die Geschwindigkeit zu begrenzen.
wget --limit-rate=300k http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
4. Verwenden Sie wget -c, um den Upload von einem Haltepunkt aus fortzusetzen
Verwenden Sie wget -c, um den Download einer unterbrochenen Datei neu zu starten:
wget -c http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
Dies ist sehr hilfreich, wenn wir eine große Datei herunterladen und diese aufgrund von Netzwerk- oder anderen Gründen plötzlich unterbrochen wird. Wir können den Download fortsetzen, anstatt eine Datei erneut herunterzuladen. Sie können den Parameter -c verwenden, wenn Sie einen unterbrochenen Download fortsetzen müssen.
5. Verwenden Sie den Hintergrund-Download „wget -b“.
Beim Herunterladen sehr großer Dateien können wir den Parameter -b für das Herunterladen im Hintergrund verwenden.
wget -b http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
Fortsetzung im Hintergrund, Pid 1840.
Die Ausgabe wird in „wget-log“ geschrieben.
Mit dem folgenden Befehl können Sie den Download-Fortschritt überprüfen
tail -f wget-log
6. Download des Namens des Tarnagenten
Einige Websites können Ihre Download-Anfrage ablehnen, indem sie davon ausgehen, dass der Proxy-Name kein Browser ist. Sie können es jedoch durch den Parameter --user-agent verschleiern.
wget --user-agent="Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, wie Gecko) Chrome/10.0.648.204 Safari/534.16" Download-Link
7. Verwenden Sie wget --spider, um den Download-Link zu testen
Wenn Sie planen, geplante Downloads durchzuführen, sollten Sie testen, ob der Download-Link zum geplanten Zeitpunkt gültig ist. Zur Überprüfung können wir den Parameter --spider hinzufügen.
wget --spider URL
Wenn der Download-Link korrekt ist, wird er angezeigt
wget --spider URL
Spider-Modus aktiviert. Überprüfen Sie, ob eine Remote-Datei vorhanden ist.
HTTP-Anfrage gesendet, wartet auf Antwort. 200 OK Länge: nicht angegeben [text/html] Remote-Datei existiert und könnte weitere Links enthalten, aber die Rekursion ist deaktiviert – kein Abruf.
Dadurch wird sichergestellt, dass der Download zum geplanten Zeitpunkt fortgesetzt wird. Wenn Sie jedoch den falschen Link angeben, wird die folgende Fehlermeldung angezeigt
wget --spider URL
Spider-Modus aktiviert.
Überprüfen Sie, ob eine Remote-Datei vorhanden ist. Die gesendete HTTP-Anfrage wartet auf eine Antwort. . 404 Nicht gefunden Remote-Datei existiert nicht – defekter Link! ! !
Sie können den Spider-Parameter in den folgenden Situationen verwenden:
7.1 Vor dem geplanten Download prüfen
7.2 Überprüfen Sie in regelmäßigen Abständen, ob die Website verfügbar ist
7.3 Überprüfen Sie tote Links auf Website-Seiten
8. Verwenden Sie wget --tries, um die Anzahl der Wiederholungsversuche zu erhöhen
Es kann auch fehlschlagen, wenn Netzwerkprobleme vorliegen oder Sie eine große Datei herunterladen. Standardmäßig versucht wget 20 Mal, eine Verbindung herzustellen und Dateien herunterzuladen. Bei Bedarf können Sie --tries verwenden, um die Anzahl der Wiederholungsversuche zu erhöhen.
wget --tries=40 URL
9. Verwenden Sie wget -i, um mehrere Dateien herunterzuladen
Speichern Sie zunächst eine Download-Link-Datei
cat>filelist.txt url1 url2 url3 url4
Verwenden Sie dann diese Datei und den Parameter -i zum Herunterladen
wget -i filelist.txt
10. Verwenden Sie wget --mirror, um die Website zu spiegeln
Das folgende Beispiel lädt die gesamte Website auf lokal herunter.
wget --mirror -p --convert-links -P ./LOKALE URL
--miror: Spiegel zur Kontoeröffnung herunterladen
-p: Laden Sie alle Dateien für die normale HTML-Seitenanzeige herunter
--convert-links: Konvertieren Sie es nach dem Herunterladen in lokale Links
-P ./LOCAL: Alle Dateien und Verzeichnisse im lokal angegebenen Verzeichnis speichern
11. Verwenden Sie wget --reject, um Downloads in bestimmten Formaten zu filtern
Wenn Sie eine Website herunterladen möchten, aber keine Bilder herunterladen möchten, können Sie den folgenden Befehl verwenden.
wget --reject=gif-URL
12. Verwenden Sie wget -o, um die Download-Informationen in der Protokolldatei zu speichern
Wenn Sie möchten, dass die Download-Informationen nicht direkt im Terminal, sondern in einer Protokolldatei angezeigt werden, können Sie den folgenden Befehl verwenden:
wget -o download.log-URL
13. Verwenden Sie wget -Q, um die Gesamtgröße der Download-Datei zu begrenzen
Wenn die Datei, die Sie herunterladen möchten, größer als 5 MB ist und der Download abgebrochen wird, können Sie den folgenden Befehl verwenden:
wget -Q5m -i filelist.txt
Hinweis: Dieser Parameter funktioniert nicht für einzelne Datei-Downloads, sondern nur für rekursive Downloads.
14. Verwenden Sie wget -r -A, um die angegebene Formatdatei herunterzuladen
Diese Funktion kann in den folgenden Situationen verwendet werden
Laden Sie alle Bilder von einer Website herunter
Laden Sie alle Videos von einer Website herunter
Laden Sie alle PDF-Dateien einer Website herunter
wget -r -A.pdf URL
15. Verwenden Sie den FTP-Download von wget
Sie können wget verwenden, um den Download des FTP-Links abzuschließen. Anonymer FTP-Download mit wget
wget FTP-URL
FTP-Download mit wget-Benutzername und Passwort-Authentifizierung
wget --ftp-user=BENUTZERNAME --ftp-password=PASSWORT-URL
Quelle des Artikels: http://www.zhumaohai.com/ Bitte behalten Sie sich das Urheberrecht für den Nachdruck vor
Vielen Dank an Zhu Maohai für seinen Beitrag