L'exemple de cet article décrit la méthode d'implémentation d'une simple exploration de pages Web en Java. Partagez-le avec tout le monde pour votre référence. L’analyse spécifique est la suivante :
Introduction au contexte
Une introduction à TCP
1 TCP réalise une transmission point à point sur le réseau
2 La transmission se fait via des ports et des prises
Les ports fournissent différents types de transmission (par exemple, le port http est 80)
1) Les sockets peuvent être liées à des ports spécifiques et fournir des fonctions de transmission
2) Un port peut se connecter à plusieurs prises
2. Introduction à l'URL
Une URL est une représentation concise de l'emplacement et de la méthode d'accès d'une ressource pouvant être obtenue sur Internet. Il s'agit de l'adresse d'une ressource standard sur Internet.
Chaque fichier sur Internet possède une URL unique, qui contient des informations indiquant l'emplacement du fichier et ce que le navigateur doit en faire.
Pour résumer, ce que nous voulons explorer le contenu de la page Web est essentiellement d'explorer le contenu de la page Web via l'URL.
Java propose deux méthodes :
La première consiste à lire la page Web directement à partir de l'URL
La première consiste à lire la page Web via URLConnection
Parmi eux, URLConnection est une classe avec http comme noyau et fournit de nombreuses fonctions de connexion à http.
Cet article donnera un exemple de code basé sur URLConnection.
Avant cela, examinons les exceptions concernant l'url. Si vous ne comprenez pas le mécanisme d'exception Java, veuillez vous référer au billet de blog précédent.
L'exception MalformedURLException se produit lors de la construction d'une URL : la chaîne de l'url est vide ou un protocole méconnaissable
Conditions de l'exception IOException lors de l'établissement d'URLConnection : openConnection a échoué. Notez que le code ne s'est pas encore connecté à la télécommande pendant openConnection, mais se prépare simplement à se connecter à la télécommande.
Pour résumer, le code final est le suivant :
Copiez le code comme suit : import java.io.BufferedReader ;
importer java.io.IOException ;
importer java.io.InputStreamReader ;
importer java.net.HttpURLConnection ;
importer java.net.MalformedURLException ;
importer java.net.URL ;
importer java.net.URLConnection ;
classe publique SimpleNetSpider {
public static void main (String[] arguments) {
essayer{
URL u = nouvelle URL("http://docs.oracle.com/javase/tutorial/networking/urls/");
Connexion URLConnection = u.openConnection();
HttpURLConnection htCon = (HttpURLConnection) connexion ;
int code = htCon.getResponseCode();
si (code == HttpURLConnection.HTTP_OK)
{
System.out.println("trouver le site Web");
BufferedReader in=new BufferedReader(new InputStreamReader(htCon.getInputStream()));
Chaîne d'entréeLine ;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
joindre();
}
autre
{
System.out.println("Impossible d'accéder au site Web");
}
}
catch (MalformedURLException e)
{
System.out.println("URL incorrecte");
}
capture (IOException e)
{
System.out.println("Connexion impossible");
}
}
}
J'espère que cet article sera utile à la programmation Java de chacun.