Kapitel 4 XML-Syntax
Gliederung:
1. XML-Syntaxregeln 2. Elementsyntax 3. Kommentarsyntax 4. CDATA-Syntax 5. Namespaces-Syntax 6. Entitätssyntax 7. DTD-Syntax
Durch das Studium der vorherigen drei Kapitel haben wir bereits ein Verständnis dafür, was XML ist, seine Implementierungsprinzipien und die damit verbundene Terminologie. Als Nächstes lernen wir die Syntaxspezifikationen von XML kennen und schreiben unsere eigenen XML-Dokumente.
1. XML-Syntaxregeln
XML-Dokumente ähneln HTML-Originalcodes und verwenden außerdem Tags zur Identifizierung von Inhalten. Bei der Erstellung von XML-Dokumenten müssen folgende wichtige Regeln beachtet werden:
Regel 1: Es muss eine XML-Deklarationsanweisung vorhanden sein. Wir haben dies bereits im vorherigen Kapitel erwähnt. Die Deklaration ist der erste Satz des XML-Dokuments und hat das folgende Format:
<?xml version="1.0" standalone="yes/no"kodierung="UTF-8"?>
Der Zweck der Deklaration besteht darin, dem Browser oder einem anderen Verarbeitungsprogramm mitzuteilen, dass es sich bei diesem Dokument um ein XML-Dokument handelt. Die Version in der Deklarationsanweisung gibt die Version der XML-Spezifikation an, der das Dokument entspricht. Wenn ja, gibt der Parameter „no“ die im Dokument verwendete Sprachcodierung an Der Standardwert ist UTF-8.
Regel 2: Ob eine DTD-Datei vorhanden ist. Wenn es sich bei dem Dokument um ein „gültiges XML-Dokument“ handelt (siehe vorheriges Kapitel), muss das Dokument über eine entsprechende DTD-Datei verfügen und den durch die DTD-Datei festgelegten Spezifikationen strikt entsprechen. Die Deklarationsanweisung der DTD-Datei folgt der XML-Deklarationsanweisung im folgenden Format:
<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">
In:
„!DOCTYPE“ bedeutet, dass Sie einen DOCTYPE definieren möchten;
„type-of-doc“ ist der von Ihnen definierte Name des Dokumenttyps, normalerweise derselbe wie der DTD-Dateiname;
Verwenden Sie nur einen der beiden Parameter „SYSTEM/PUBLIC“. SYSTEM bezieht sich auf die URL der privaten DTD-Datei, die vom Dokument verwendet wird, während PUBLIC sich auf die URL der öffentlichen DTD-Datei bezieht, die vom Dokument verwendet wird.
„dtd-name“ ist die URL und der Name der DTD-Datei. Alle DTD-Dateien haben das Suffix „.dtd“.
Wir verwenden immer noch das obige Beispiel, es sollte wie folgt geschrieben werden:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
Regel 3: Achten Sie auf die Groß- und Kleinschreibung. In XML-Dokumenten gibt es einen Unterschied zwischen Groß- und Kleinschreibung. <P> und <p> sind unterschiedliche Bezeichner. Beachten Sie, dass beim Schreiben von Elementen die Groß-/Kleinschreibung der vorderen und hinteren Bezeichner gleich bleiben sollte. Zum Beispiel: <Author>ajie</Author>, es ist falsch, <Author>ajie</author> zu schreiben.
Gewöhnen Sie sich besser an, entweder nur Groß- und Kleinschreibung zu verwenden oder den ersten Buchstaben groß zu schreiben. Dies reduziert Dokumentationsfehler, die durch Fallinkongruenzen verursacht werden.
Regel 4: Fügen Sie Anführungszeichen zu Attributwerten hinzu. Im HTML-Code können Attributwerte in Anführungszeichen gesetzt werden oder nicht. Beispiel: <font color=red>word</font> und <font color="red">word</font> können beide vom Browser korrekt interpretiert werden.
In XML ist jedoch festgelegt, dass alle Attributwerte in Anführungszeichen gesetzt werden müssen (es können einfache oder doppelte Anführungszeichen sein), andernfalls wird dies als Fehler betrachtet.
Regel 5: Alle Tags müssen ein entsprechendes Schluss-Tag haben. In HTML dürfen Tags nicht paarweise vorkommen, wie zum Beispiel?lt;br>. In XML ist festgelegt, dass alle Tags paarweise erscheinen müssen. Wenn es ein Start-Tag gibt, muss es ein End-Tag geben. Andernfalls wird es als Fehler gewertet.
Regel 6: Alle leeren Tags müssen ebenfalls geschlossen werden. Ein leeres Tag ist ein Tag ohne Inhalt zwischen den Tag-Paaren. Zum Beispiel <br>, <img> und andere Tags. In XML ist festgelegt, dass alle Tags ein End-Tag haben müssen. Bei solchen leeren Tags besteht die Verarbeitungsmethode in XML darin, am Ende des Original-Tags ein / hinzuzufügen. Zum Beispiel:
<br> sollte als <br /> geschrieben werden;
<META name="keywords" content="XML, SGML, HTML"> sollte als <META name="keywords" content="XML, SGML, HTML" /> geschrieben werden;
<IMG src= "cool.gif"> sollte als <IMG src= "cool.gif" /> geschrieben werden
Kapitel 4 XML-Syntax
2. Syntax von Elementen
Ein Element besteht aus einem Paar von Bezeichnern und deren Inhalt. So: ajie. Der Name des Elements und der Name des Bezeichners sind identisch. Identitäten können durch Attribute weiter beschrieben werden.
In XML gibt es keine reservierten Wörter, sodass Sie jedes beliebige Wort als Elementnamen verwenden können. Folgende Regelungen sind jedoch zusätzlich zu beachten:
1. Der Name kann Buchstaben, Zahlen und andere Buchstaben enthalten;
2. Der Name darf nicht mit einer Zahl oder „_“ (Unterstrich) beginnen;
3. Der Name darf nicht mit den Buchstaben xml (oder XML oder Xml ..) beginnen.
4. Der Name darf keine Leerzeichen enthalten.
5. Der Name darf kein „:“ (Doppelpunkt) enthalten.
Um das Lesen, Verstehen und Bearbeiten von Elementen zu erleichtern, haben wir einige weitere Vorschläge:
1. Verwenden Sie nicht „.“ im Namen. Denn in vielen Programmiersprachen wird „.“ als Attribut eines Objekts verwendet, zum Beispiel: font.color. Aus dem gleichen Grund ist es am besten, „-“ nicht zu verwenden. Wenn es verwendet werden muss, ersetzen Sie es durch „_“.
2. Halten Sie den Namen so kurz wie möglich.
3. Versuchen Sie, für die Groß- und Kleinschreibung von Namen denselben Standard zu verwenden.
4. Der Name kann nicht-englische Zeichen verwenden, z. B. Chinesisch. Einige Software unterstützt dies jedoch möglicherweise nicht. (IE5 unterstützt derzeit chinesische Elemente.)
Fügen Sie außerdem eine kleine Erläuterung zu den Eigenschaften hinzu. In HTML können Attribute verwendet werden, um das Anzeigeformat von Elementen zu definieren. Beispiel: <font color="red">word</font> zeigt das Wort in Rot an. In XML sind Attribute lediglich Beschreibungen von Bezeichnern und haben nichts mit der Anzeige von Elementinhalten zu tun. Beispielsweise wird derselbe Satz: <font color="red">word</font> das Wort nicht in Rot anzeigen. (Einige Internetnutzer werden sich also fragen: Wie zeige ich Text in XML in Rot an? Dazu ist die Verwendung von CSS oder XSL erforderlich, was wir weiter unten im Detail beschreiben werden.)
3. Syntax von Kommentaren
Kommentare werden zum XML-Dokument hinzugefügt, um das Lesen und Verstehen zu erleichtern, und werden vom Programm nicht interpretiert oder vom Browser angezeigt.
Die Syntax für Kommentare lautet wie folgt:
<!-- Hier sind die Kommentarinformationen-->
Wie Sie sehen, entspricht es der Kommentarsyntax in HTML, was sehr einfach ist. Durch die Entwicklung guter Kommentargewohnheiten lassen sich Ihre Dokumente einfacher pflegen und teilen und sehen professioneller aus.
4. Syntax von CDATA
Der vollständige Name von CDATA sind Zeichendaten, die als Zeichendaten übersetzt werden. Wenn wir XML-Dokumente schreiben, müssen wir manchmal Buchstaben, Zahlen und andere Symbole selbst anzeigen, z. B. „<“. In XML haben diese Zeichen bereits eine besondere Bedeutung. Dies erfordert die Verwendung der CDATA-Syntax. Das Syntaxformat ist wie folgt:
<![CDATA[Platzieren Sie die hier anzuzeigenden Zeichen]]>
Zum Beispiel:
<![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>
Der auf der Seite angezeigte Inhalt lautet „<AUTHOR sex="female">ajie</AUTHOR>“
Kapitel 4 XML-Syntax
5. Syntax von Namespaces
Namespaces bedeutet Namespace. Was macht der Namespace? Wenn wir in einem XML-Dokument die DTD-Dateien anderer Personen oder mehrere verwenden, entsteht ein solcher Widerspruch: Da die Bezeichner in XML von uns selbst erstellt werden, können die Bezeichnernamen in verschiedenen DTD-Dateien gleich sein, aber unterschiedliche Bedeutungen haben Datenverwirrung verursachen.
Beispielsweise stellt <table> in einem Dokument <table>wood table</table> eine Tabelle dar.
In einem anderen Dokument <table>namelist</table> stellt <table> eine Tabelle dar. Wenn ich an beiden Dokumenten gleichzeitig arbeiten muss, entsteht ein Namenskonflikt.
Um dieses Problem zu lösen, haben wir das Konzept der Namespaces eingeführt. Namespaces unterscheiden diese Bezeichner mit demselben Namen, indem sie dem Bezeichnernamen eine URL hinzufügen.
Namespaces müssen außerdem am Anfang des XML-Dokuments deklariert werden. Die Syntax der Deklaration lautet wie folgt:
<document xmlns:yourname='URL'>
Dabei ist IhrName der Name des von Ihnen definierten Namespaces und URL die URL des Namespace.
Unter der Annahme, dass das obige Dokument „Tabelle <Tabelle>“ von http://www.zhuozi.com stammt, können wir es als deklarieren
<document xmlns:zhuozi='http://www.zhuozi.com'>
Verwenden Sie dann den definierten Namespace in nachfolgenden Tags:
<zhuozi:table>Holztisch</table>
Dies unterscheidet die beiden <table>s. Hinweis: Das Festlegen der URL bedeutet nicht, dass dieses Logo wirklich von dieser URL gelesen werden muss, es ist lediglich ein Zeichen der Unterscheidung.
6. Entitätssyntax
Entität wird mit „Entität“ übersetzt. Seine Funktion ähnelt dem „Makro“ in Word und kann auch als Vorlage in DW verstanden werden. Sie können eine Entität vordefinieren und sie dann mehrmals in einem Dokument aufrufen oder dieselbe Entität in mehreren Dokumenten aufrufen.
Entity kann Zeichen, Text usw. enthalten. Die Vorteile der Verwendung von Entity sind: 1. Es können Fehler reduziert werden, bei denen mehrere identische Teile im Dokument nur einmal eingegeben werden müssen. 2. Es verbessert die Wartungseffizienz. Wenn Sie beispielsweise über 40 Dokumente verfügen, die alle urheberrechtlich geschützte Einheiten enthalten, müssen Sie nicht alle Dateien ändern, wenn Sie diese urheberrechtlich geschützten Einheiten ändern müssen. Sie müssen nur die ursprünglich definierte Entitätsanweisung ändern.
XML definiert zwei Arten von Entitäten. Eine davon ist die gewöhnliche Entität, von der wir hier sprechen und die in XML-Dokumenten verwendet wird. Die andere ist die Parameterentität, die in DTD-Dateien verwendet wird.
Die Definitionssyntax der Entität lautet:
<!DOCTYPE Dateiname [
<!ENTITY Entitätsname „Entitätsinhalt“
]
>
Ich möchte beispielsweise eine Copyright-Information definieren:
<!DOCTYPE Copyright [
<!ENTITY Copyright „Copyright 2001, Ajie. Alle Rechte vorbehalten“
]
>
Wenn meine Urheberrechtsinformationsinhalte in einer XML-Datei mit anderen geteilt werden, kann ich auch die externe Aufrufmethode verwenden. Die Syntax ist wie folgt:
<!DOCTYPE Copyright [
<!ENTITY copyright SYSTEM "http://www.sample.com/copyright.xml">
]
>
Die Referenzsyntax der definierten Entität im Dokument lautet: &entity-name;
Beispielsweise werden die oben definierten Copyright-Informationen beim Aufruf als „?copyright;“ geschrieben.
Das vollständige Beispiel sieht wie folgt aus. Sie können es kopieren und als copyright.xml speichern, um das Beispiel anzuzeigen:
<?xml version="1.0"kodierung="GB2312"?>
<!DOCTYPE Copyright [
<!ENTITY Copyright „Copyright 2001, Ajie. Alle Rechte vorbehalten“>
]>
<meineDatei>
<title>XML</title>
<author>ajie</author>
<email>[email protected]</email>
<date>20010115</date>
©right;
</meineDatei>
Kapitel 4 XML-Syntax
7. DTD-Syntax
DTD ist eine notwendige Datei für ein „gültiges XML-Dokument“. Wir verwenden DTD-Dateien, um die Regeln und gegenseitigen Beziehungen von Elementen und Bezeichnern im Dokument zu definieren. Wie erstelle ich eine DTD-Datei? Lasst uns gemeinsam lernen:
1. Elemente festlegen
Elemente sind die Grundbausteine von XML-Dokumenten. Sie müssen ein Element in der DTD definieren und es dann im XML-Dokument verwenden. Die Definitionssyntax eines Elements lautet: <!ELEMENT BESCHREIBUNG (#PCDATA, DEFINITION)*>
veranschaulichen:
„<!ELEMENT“ ist eine Deklaration eines Elements und gibt an, dass Sie ein Element definieren möchten.
„DESCRIPTION“ nach der Anweisung ist der Name des Elements;
„(#PCDATA, DEFINITION)*>“ ist die Verwendungsregel dieses Elements. Regeln definieren, welche Elemente enthalten können und wie sie zueinander in Beziehung stehen. In der folgenden Tabelle sind die Regeln für Elemente aufgeführt:
2. Elementregeltabelle: