contour:
Introduction
1. Termes liés aux documents XML
2. Termes liés à la DTD
Introduction
La chose la plus difficile pour les débutants dans l'apprentissage de XML est qu'il y a beaucoup de nouveaux concepts terminologiques à comprendre. Étant donné que XML lui-même est également une toute nouvelle technologie, il se développe et évolue constamment. Les organisations et les grandes sociétés de réseaux (Microsoft, IBM, SUN, etc.) introduisent constamment leurs propres connaissances et normes. Il n'est donc pas surprenant que de nouveaux concepts apparaissent. volent partout. Il n'existe aucune institution ou organisation faisant autorité en Chine pour nommer officiellement ces termes. La plupart des manuels chinois que vous voyez sur XML sont traduits sur la base de la propre compréhension de l'auteur. Certains sont corrects et d'autres sont faux, ce qui entrave encore davantage le développement de XML. compréhension et apprentissage de ces concepts.
Les explications des termes XML que vous verrez ci-dessous sont également la propre compréhension et traduction de l'auteur. Ajie est basé sur la spécification standard XML1.0 publiée par l'organisation W3C et la documentation officielle associée. On peut garantir que ces interprétations sont fondamentalement correctes, du moins pas fausses. Si vous souhaitez lire et comprendre davantage, j'ai répertorié les sources et les liens vers des ressources pertinentes à la fin de cet article, auxquelles vous pouvez accéder directement. Bon, passons aux choses sérieuses :
1. Termes liés aux documents XML
Qu'est-ce qu'un document XML ? Vous connaissez le fichier de code source HTML ? Un document XML est un fichier de code source XML écrit avec des balises XML. Les documents XML sont également des fichiers texte brut ASCII que vous pouvez créer et modifier à l'aide du Bloc-notes. Le suffixe des documents XML est .XML, par exemple monfichier.xml. Vous pouvez également ouvrir directement le fichier .xml à l'aide des navigateurs IE5.0 ou supérieurs, mais ce que vous voyez est le « code XML original » et le contenu de la page ne sera pas affiché. Vous pouvez essayer d'enregistrer le code suivant sous myfile.xml :
<?xml version="1.0" encoding="GB2312"?>
<monfichier>
<title>Manuel d'apprentissage facile XML</title>
<auteur>ajie</auteur>
<email>[email protected]</email>
<date>20010115</date>
</monfichier>
Les documents XML contiennent trois parties :
1. Une déclaration de document XML ;
2. Une définition du type de document ;
3. Marquez le contenu créé avec XML.
Exemple:
<?xml version="1.0"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
<liste de fichiers>
<monfichier>
<title>DÉMARRAGE RAPIDE DE XML</title>
<auteur>ajie</auteur>
</monfichier>
...
</liste de fichiers>
La première ligne <?xml version="1.0"?> est la déclaration d'un document XML. La deuxième ligne indique que ce document utilise filelist.dtd pour définir le type de document. La troisième ligne ci-dessous est la partie principale du contenu.
Comprenons les termes pertinents dans les documents XML :
1.Élément :
Nous connaissons déjà l'élément en HTML. C'est la plus petite unité qui compose un document HTML, et c'est la même chose en XML. Un élément est défini par un identifiant, comprenant un identifiant de début et de fin et son contenu, comme ceci : <author>ajie</author>
La seule différence est : en HTML, la balise est fixe, mais en XML, la balise doit être créée par vous.
2.Étiquette (logo)
Les identifiants sont utilisés pour définir des éléments. En XML, les balises doivent apparaître par paires, entourant les données. Le nom de l'identifiant est le même que le nom de l'élément. Par exemple, un élément comme celui-ci :
<auteur>ajie</auteur>
Où <author> est l'identifiant.
3.Attribut :
Que sont les propriétés ? Regardez ce code HTML :<font color="red">word</font>. Parmi eux, la couleur est l’un des attributs de la police.
Les attributs sont des descriptions et des explications supplémentaires du logo. Un logo peut avoir plusieurs attributs, tels que l'attribut de police et la taille. Les attributs en XML sont les mêmes que les attributs en HTML. Chaque attribut a son propre nom et sa propre valeur. L'attribut fait partie de l'identifiant. Exemple:
<auteur sex="female">ajie</auteur>
Les attributs en XML sont également définis par eux-mêmes. Nous vous recommandons d'essayer de ne pas utiliser d'attributs et de modifier les attributs en sous-éléments. Par exemple, le code ci-dessus peut être modifié comme suit :
<auteur>ajie
<sexe>femme</sexe>
</auteur>
La raison en est que les attributs ne peuvent pas être facilement étendus et manipulés par les programmes.
4.Déclaration
Dans la première ligne de tous les documents XML se trouve une déclaration XML. Cette déclaration indique que ce document est un document XML et quelle spécification de version XML il suit. Une instruction de déclaration XML ressemble à ceci :
<?xml version="1.0"?>
5.DTD (définition du type de fichier)
La DTD est utilisée pour définir des éléments, des attributs et des relations entre les éléments dans les documents XML.
Le fichier DTD peut être utilisé pour détecter si la structure du document XML est correcte. Mais la création d'un document XML ne nécessite pas nécessairement un fichier DTD. Les descriptions détaillées des fichiers DTD seront répertoriées séparément ci-dessous.
6. XML bien formé (XML bien formé)
Un document qui respecte les règles de syntaxe XML et adhère aux spécifications XML est appelé « bien formé ». Si tout votre balisage respecte strictement la spécification XML, votre document XML n'a pas nécessairement besoin d'un fichier DTD pour le définir.
Un document bien formé doit commencer par une déclaration XML, telle que :
<?xml version="1.0" standalone="yes" encoding="UTF-8"?>
Parmi eux, vous devez indiquer la version XML à laquelle le document est conforme, qui est actuellement 1.0 ; deuxièmement, expliquer que le document est « indépendant » et qu'il ne nécessite pas de fichier DTD pour vérifier si l'identification qu'il contient est valide ; , vous devez indiquer le codage de langue utilisé dans le document. La valeur par défaut est UTF-8. Si vous utilisez le chinois, vous devez le définir sur GB2312.
Un document XML bien formé doit avoir un élément racine, qui est le premier élément créé immédiatement après la déclaration. Tous les autres éléments sont des éléments enfants de cet élément racine et appartiennent à un groupe d'éléments racine.
Le contenu d'un document XML bien formé doit être rédigé dans le respect de la syntaxe XML. (Nous expliquerons la syntaxe XML en détail dans le chapitre suivant)
7. XML valide (XML valide)
Un document XML conforme aux règles de syntaxe XML et aux spécifications du fichier DTD correspondantes est appelé un document XML valide. Notez que nous comparons "XML bien formé" et "Valide
XML", la plus grande différence entre eux est que l'un est entièrement conforme à la spécification XML, tandis que l'autre possède sa propre "Définition de type de document (DTD)".
Le processus de comparaison d'un document XML avec son fichier DTD pour voir s'il est conforme aux règles DTD est appelé validation. Ce processus est généralement géré par un logiciel appelé analyseur.
Un document XML valide doit également commencer par une déclaration XML, par exemple :
<?xml version="1.0" standalone="no" encode="UTF-8"?>
Contrairement à l'exemple ci-dessus, dans l'attribut autonome (indépendant), "no" est défini ici car il doit être utilisé avec la DTD correspondante. Le fichier DTD est défini comme suit :
<!DOCTYPE type-of-doc SYSTEM/PUBLIC "nom-dtd">
dans:
"!DOCTYPE" signifie que vous souhaitez définir un DOCTYPE ;
"type-of-doc" est le nom du type de document, défini par vous, généralement identique au nom du fichier DTD ;
N'utilisez qu'un des deux paramètres "SYSTEM/PUBLIC". SYSTEM fait référence à l'URL du fichier DTD privé utilisé par le document, tandis que PUBLIC fait référence à l'URL du fichier DTD public utilisé par le document.
"nom-dtd" est l'URL et le nom du fichier DTD. Tous les fichiers DTD portent le suffixe « .dtd ».
Nous utilisons toujours l'exemple ci-dessus, il doit s'écrire ainsi :
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
2. Termes liés à la DTD
Qu'est-ce que la DTD, nous l'avons brièvement mentionné ci-dessus. La DTD est une méthode efficace pour garantir que le format du document XML est correct. Vous pouvez comparer le document XML et le fichier DTD pour voir si le document est conforme à la spécification et si les éléments et les balises sont utilisés correctement. Un document DTD contient : les règles de définition des éléments, les règles de définition des relations entre éléments, les attributs pouvant être utilisés par les éléments, et les règles des entités ou symboles pouvant être utilisés.
Le fichier DTD est également un fichier texte ASCII avec le suffixe .dtd. Par exemple : monfichier.dtd.
Pourquoi utiliser des fichiers DTD ? Je crois comprendre que cela répond au partage réseau et à l'interaction des données. Le plus grand avantage de l'utilisation de DTD est le partage de fichiers DTD. (Il s'agit de l'attribut PUBLIC dans l'instruction de description DTD ci-dessus). Par exemple, si deux personnes du même secteur et de régions différentes utilisent le même fichier DTD comme spécification de création de document, leurs données peuvent être facilement échangées et partagées. Si d'autres personnes sur Internet souhaitent ajouter des données, il leur suffit de créer un document conformément à la spécification DTD publique, et elles peuvent s'y joindre immédiatement.
Actuellement, il existe déjà un grand nombre de fichiers DTD écrits disponibles. Ciblant différentes industries et applications, ces fichiers DTD ont établi des règles communes en matière d'éléments et d'étiquettes. Vous n'avez pas besoin de les recréer vous-même, ajoutez simplement les nouveaux logos dont vous avez besoin en fonction de ceux-ci.
Bien entendu, si vous le souhaitez, vous pouvez créer votre propre DTD, qui pourra correspondre plus parfaitement à votre document. Créer votre propre DTD est également très simple. Généralement, il vous suffit de définir 4 à 5 éléments.
Il existe deux manières d'appeler un fichier DTD :
1. DTD contenue directement dans le document XML
Tout ce que vous avez à faire est d'insérer des instructions spéciales dans la déclaration DOCTYPE, comme ceci :
Nous avons un document XML :
<?xml version="1.0" encoding="GB2312"?>
<monfichier>
<title>Manuel d'apprentissage facile XML</title>
<auteur>ajie</auteur>
</monfichier>
On insère simplement le code suivant après la première ligne :
<!DOCTYPE monfichier [
<!ELEMENT titre (#PCDATA)>
<!ELEMENT auteur (#PCDATA)>
<!ENTITY copyright "Copyright 2001, Ajie.">
]>
2. Appelez un fichier DTD indépendant
Enregistrez le document DTD en tant que fichier .dtd, puis appelez-le dans la ligne de déclaration DOCTYPE. Par exemple, enregistrez le code suivant sous myfile.dtd.
<!ELEMENT monfichier (titre, auteur)>
<!ELEMENT titre (#PCDATA)>
<!ELEMENT auteur (#PCDATA)>
Appelez-le ensuite dans le document XML en insérant après la première ligne :
<!DOCTYPE monfichier SYSTEM "monfichier.dtd">
Nous pouvons voir que les appels à js dans les documents DTD et HTML sont similaires. Concernant la façon d'écrire des documents DTD, nous les présenterons avec la syntaxe des documents XML dans le chapitre suivant.
Découvrons la terminologie liée à la DTD :
1.Schéma (Planification)
Le schéma est une description des règles de données. Le schéma fait deux choses :
a. Il définit le type de données de l'élément et la relation entre les éléments ;
b. Il définit le type de contenu que l'élément peut contenir.
DTD est un schéma pour les documents XML.
2.Arborescence des documents
Nous avons déjà évoqué « l'arborescence du document » au chapitre 2. Il s'agit d'une représentation image de la structure hiérarchique des éléments du document. Une arborescence de structure de document contient l'élément racine, qui est l'élément de niveau supérieur (c'est-à-dire le premier élément qui suit immédiatement l'instruction de déclaration XML). Regardez l'exemple :
<?xml version="1.0"?>
<liste de fichiers>
<monfichier>
<titre>...</titre>
<auteur>...</auteur>
</monfichier>
</liste de fichiers>
L'exemple ci-dessus est organisé selon une structure à trois niveaux sous la forme d'un « arbre », dans lequel <filelist> est l'élément racine. Dans les fichiers XML et DTD, le premier élément défini est l'élément racine.
3.Élément parent/élément enfant
Un élément parent est un élément qui contient d'autres éléments et l'élément contenu est appelé son élément enfant. Regardez "l'arborescence de structure" ci-dessus, où <myfile> est l'élément parent, <title>, <author> sont ses éléments enfants et <myfile> est l'élément enfant de <filelist>. Les éléments de dernier niveau qui ne contiennent aucun élément enfant comme <title> sont également appelés « éléments de page ».
4.Parser (logiciel d'analyse)
Parser est un outil logiciel qui vérifie si les documents XML sont conformes aux spécifications DTD.
Les analyseurs XML ont été développés en deux catégories : l'une est "l'analyseur de non-confirmation", qui détecte uniquement si le document est conforme aux règles de syntaxe XML et si l'arborescence du document est établie avec des identifiants d'éléments. L'autre est le "confirmation class paeser", qui détecte non seulement la syntaxe et l'arborescence du document, mais compare et analyse également si les identifiants d'éléments que vous utilisez sont conformes aux spécifications du fichier DTD correspondant.
Parser peut être utilisé indépendamment ou dans le cadre d’un logiciel d’édition ou d’un navigateur. Dans la liste suivante de ressources connexes, j'ai répertorié certains des analyseurs actuellement populaires.
D'accord, grâce à l'étude du chapitre 3, nous avons appris quelques termes de base de XML et de DTD, mais nous ne savons toujours pas comment écrire ces fichiers et quel type de syntaxe doit être suivi. Dans le prochain chapitre, nous nous concentrerons. sur l'écriture XML et la syntaxe des documents DTD. Veuillez continuer à naviguer, merci !