Chapitre 4 Syntaxe XML
contour:
1. Règles de syntaxe XML 2. Syntaxe des éléments 3. Syntaxe des commentaires 4. Syntaxe CDATA 5. Syntaxe des espaces de noms 6. Syntaxe des entités 7. Syntaxe DTD
En étudiant les trois chapitres précédents, nous comprenons déjà ce qu'est XML, ses principes de mise en œuvre et la terminologie associée. Ensuite, nous commencerons à apprendre les spécifications syntaxiques de XML et à écrire nos propres documents XML.
1.Règles de syntaxe XML
Les documents XML sont similaires aux codes HTML originaux et utilisent également des balises pour identifier le contenu. Les règles importantes suivantes doivent être respectées lors de la création de documents XML :
Règle 1 : Il doit y avoir une instruction de déclaration XML Nous l'avons déjà mentionné dans le chapitre précédent. La déclaration est la première phrase du document XML et son format est le suivant :
Le but de la déclaration est d'indiquer au navigateur ou autre programme de traitement que ce document est un document XML. La version dans l'instruction de déclaration indique la version de la spécification XML à laquelle le document est conforme ; autonome indique si le document est livré avec un fichier DTD, si c'est le cas, le paramètre encoding indique le codage de langue utilisé dans le document, et le paramètre encoding est non ; la valeur par défaut est UTF-8.
Règle 2 : Existe-t-il un fichier DTD ? Si le document est un « document XML valide » (voir chapitre précédent), alors le document doit avoir un fichier DTD correspondant et respecter strictement les spécifications fixées par le fichier DTD. L'instruction de déclaration du fichier DTD suit l'instruction de déclaration XML au format suivant :
dans:
"!DOCTYPE" signifie que vous souhaitez définir un DOCTYPE ;
"type-of-doc" est le nom du type de document, défini par vous, généralement identique au nom du fichier DTD ;
N'utilisez qu'un des deux paramètres "SYSTEM/PUBLIC". SYSTEM fait référence à l'URL du fichier DTD privé utilisé par le document, tandis que PUBLIC fait référence à l'URL du fichier DTD public utilisé par le document.
"nom-dtd" est l'URL et le nom du fichier DTD. Tous les fichiers DTD portent le suffixe « .dtd ».
Nous utilisons toujours l'exemple ci-dessus, il doit s'écrire ainsi :
Règle 3 : Faites attention à vos majuscules Dans les documents XML, il existe une différence entre les majuscules et les minuscules.
et
sont des identifiants différents. Notez que lors de l'écriture des éléments, la casse des identifiants avant et arrière doit rester la même. Par exemple :
Vous feriez mieux de prendre l'habitude d'utiliser soit des majuscules, soit des minuscules, soit de mettre la première lettre en majuscule. Cela réduit les erreurs de documentation causées par des incohérences de cas.
Règle 4 : Ajouter des guillemets aux valeurs d'attribut. Dans le code HTML, les valeurs d'attribut peuvent être citées ou non. Par exemple : word et word peuvent tous deux être interprétés correctement par le navigateur.
Cependant, en XML, il est stipulé que toutes les valeurs d'attribut doivent être entre guillemets (peuvent être des guillemets simples ou des guillemets doubles), sinon cela sera considéré comme une erreur.
Règle 5 : Toutes les balises doivent avoir une balise de fermeture correspondante. En HTML, les balises ne peuvent pas apparaître par paires, comme ?lt;br>. En XML, il est stipulé que toutes les balises doivent apparaître par paires. S'il existe une balise de début, il doit y avoir une balise de fin. Sinon, cela sera considéré comme une erreur.
Règle 6 : Toutes les balises vides doivent également être fermées. Une balise vide est une balise sans contenu entre les paires de balises. Par exemple,
, et d'autres balises. En XML, il est stipulé que toutes les balises doivent avoir une balise de fin. Pour de telles balises vides, la méthode de traitement en XML consiste à ajouter / à la fin de la balise d'origine, et c'est tout. Par exemple:
doit être écrit comme
;
doit être écrit sous la forme ;
doit être écrit sous la forme
Chapitre 4 Syntaxe XML
2. Syntaxe des éléments
Un élément est constitué d'une paire d'identifiants et de leur contenu. Comme ça : ajie. Le nom de l'élément et le nom de l'identifiant sont identiques. Les identités peuvent être décrites plus en détail à l'aide d'attributs.
En XML, il n'y a pas de mots réservés, vous pouvez donc utiliser n'importe quel mot comme nom d'élément. Toutefois, les réglementations suivantes doivent également être respectées :
1. Le nom peut contenir des lettres, des chiffres et d’autres lettres ;
2. Le nom ne peut pas commencer par un chiffre ou par « _ » (trait de soulignement) ;
3. Le nom ne peut pas commencer par les lettres xml (ou XML ou Xml ..)
4. Le nom ne peut pas contenir d'espaces.
5. Le nom ne peut pas contenir ":" (deux-points)
Pour rendre les éléments plus faciles à lire, à comprendre et à manipuler, nous avons quelques suggestions supplémentaires :
1. N'utilisez pas "." dans le nom. Parce que dans de nombreux langages de programmation, "." est utilisé comme attribut d'un objet, par exemple : font.color. Pour la même raison, il est préférable de ne pas utiliser le "-". S'il doit être utilisé, remplacez-le par "_" ;
2. Gardez le nom aussi court que possible.
3. Essayez d'utiliser la même norme pour la capitalisation et la capitalisation des noms.
4. Le nom peut utiliser des caractères non anglais, tels que le chinois. Mais certains logiciels peuvent ne pas le prendre en charge. (IE5 prend actuellement en charge les éléments chinois.)
De plus, ajoutez une petite explication sur les propriétés. En HTML, les attributs peuvent être utilisés pour définir le format d'affichage des éléments. Par exemple : mot affichera le mot en rouge. En XML, les attributs ne sont que des descriptions d'identifiants et n'ont rien à voir avec l'affichage du contenu des éléments. Par exemple, la même phrase : mot n'affichera pas le mot en rouge. (Ainsi, certains internautes se demanderont : Comment afficher du texte en rouge en XML ? Cela nécessite l'utilisation de CSS ou XSL, que nous décrirons en détail ci-dessous.)
3. Syntaxe des commentaires
Des commentaires sont ajoutés au document XML pour faciliter la lecture et la compréhension, et ne seront pas interprétés par le programme ni affichés par le navigateur.
La syntaxe des commentaires est la suivante :
Comme vous pouvez le voir, c'est la même chose que la syntaxe des commentaires en HTML, qui est très simple. Développer de bonnes habitudes de commentaire rendra vos documents plus faciles à conserver, à partager et à paraître plus professionnels.
4. Syntaxe de CDATA
Le nom complet de CDATA est constitué de données de caractères, qui sont traduites par données de caractères. Lorsque nous écrivons des documents XML, nous devons parfois afficher eux-mêmes des lettres, des chiffres et d'autres symboles, tels que "<". En XML, ces caractères ont déjà des significations particulières. Cela nécessite l'utilisation de la syntaxe CDATA. Le format de syntaxe est le suivant :
Par exemple:
ajie]]>
Le contenu affiché sur la page sera "
Chapitre 4 Syntaxe XML
5. Syntaxe des espaces de noms
Les espaces de noms se traduisent par espace de noms. À quoi sert l'espace de noms ? Lorsque nous utilisons des fichiers DTD d'autres personnes ou plusieurs fichiers DTD dans un document XML, il y aura une telle contradiction : comme les identifiants en XML sont créés par nous-mêmes, dans différents fichiers DTD, les noms d'identifiant peuvent être les mêmes mais avoir des significations différentes. provoquer une confusion dans les données.
Par exemple, dans un document