Kapitel 4 XML-Syntax
Gliederung:
1. XML-Syntaxregeln 2. Elementsyntax 3. Kommentarsyntax 4. CDATA-Syntax 5. Namespaces-Syntax 6. Entitätssyntax 7. DTD-Syntax
Durch das Studium der vorherigen drei Kapitel haben wir bereits ein Verständnis dafür, was XML ist, seine Implementierungsprinzipien und die damit verbundene Terminologie. Als Nächstes lernen wir die Syntaxspezifikationen von XML kennen und schreiben unsere eigenen XML-Dokumente.
1. XML-Syntaxregeln
XML-Dokumente ähneln HTML-Originalcodes und verwenden außerdem Tags zur Identifizierung von Inhalten. Bei der Erstellung von XML-Dokumenten müssen folgende wichtige Regeln beachtet werden:
Regel 1: Es muss eine XML-Deklarationsanweisung vorhanden sein. Wir haben dies bereits im vorherigen Kapitel erwähnt. Die Deklaration ist der erste Satz des XML-Dokuments und hat das folgende Format:
Der Zweck der Deklaration besteht darin, dem Browser oder einem anderen Verarbeitungsprogramm mitzuteilen, dass es sich bei diesem Dokument um ein XML-Dokument handelt. Die Version in der Deklarationsanweisung gibt die Version der XML-Spezifikation an, der das Dokument entspricht. Wenn ja, gibt der Parameter „no“ die im Dokument verwendete Sprachcodierung an Der Standardwert ist UTF-8.
Regel 2: Ob eine DTD-Datei vorhanden ist. Wenn es sich bei dem Dokument um ein „gültiges XML-Dokument“ handelt (siehe vorheriges Kapitel), muss das Dokument über eine entsprechende DTD-Datei verfügen und den durch die DTD-Datei festgelegten Spezifikationen strikt entsprechen. Die Deklarationsanweisung der DTD-Datei folgt der XML-Deklarationsanweisung im folgenden Format:
In:
„!DOCTYPE“ bedeutet, dass Sie einen DOCTYPE definieren möchten;
„type-of-doc“ ist der von Ihnen definierte Name des Dokumenttyps, normalerweise derselbe wie der DTD-Dateiname;
Verwenden Sie nur einen der beiden Parameter „SYSTEM/PUBLIC“. SYSTEM bezieht sich auf die URL der privaten DTD-Datei, die vom Dokument verwendet wird, während PUBLIC sich auf die URL der öffentlichen DTD-Datei bezieht, die vom Dokument verwendet wird.
„dtd-name“ ist die URL und der Name der DTD-Datei. Alle DTD-Dateien haben das Suffix „.dtd“.
Wir verwenden immer noch das obige Beispiel, es sollte wie folgt geschrieben werden:
Regel 3: Achten Sie auf die Groß- und Kleinschreibung. In XML-Dokumenten gibt es einen Unterschied zwischen Groß- und Kleinschreibung.
und
sind unterschiedliche Bezeichner. Beachten Sie, dass beim Schreiben von Elementen die Groß-/Kleinschreibung der vorderen und hinteren Bezeichner gleich bleiben sollte. Zum Beispiel:
Gewöhnen Sie sich besser an, entweder nur Groß- und Kleinschreibung zu verwenden oder den ersten Buchstaben groß zu schreiben. Dies reduziert Dokumentationsfehler, die durch Fallinkongruenzen verursacht werden.
Regel 4: Fügen Sie Anführungszeichen zu Attributwerten hinzu. Im HTML-Code können Attributwerte in Anführungszeichen gesetzt werden oder nicht. Beispiel: word und word können beide vom Browser korrekt interpretiert werden.
In XML ist jedoch festgelegt, dass alle Attributwerte in Anführungszeichen gesetzt werden müssen (es können einfache oder doppelte Anführungszeichen sein), andernfalls wird dies als Fehler betrachtet.
Regel 5: Alle Tags müssen ein entsprechendes Schluss-Tag haben. In HTML dürfen Tags nicht paarweise vorkommen, wie zum Beispiel?lt;br>. In XML ist festgelegt, dass alle Tags paarweise erscheinen müssen. Wenn es ein Start-Tag gibt, muss es ein End-Tag geben. Andernfalls wird es als Fehler gewertet.
Regel 6: Alle leeren Tags müssen ebenfalls geschlossen werden. Ein leeres Tag ist ein Tag ohne Inhalt zwischen den Tag-Paaren. Zum Beispiel
, und andere Tags. In XML ist festgelegt, dass alle Tags ein End-Tag haben müssen. Bei solchen leeren Tags besteht die Verarbeitungsmethode in XML darin, am Ende des Original-Tags ein / hinzuzufügen. Zum Beispiel:
sollte als
geschrieben werden;
sollte als geschrieben werden;
sollte als geschrieben werden
Kapitel 4 XML-Syntax
2. Syntax von Elementen
Ein Element besteht aus einem Paar von Bezeichnern und deren Inhalt. So: ajie. Der Name des Elements und der Name des Bezeichners sind identisch. Identitäten können durch Attribute weiter beschrieben werden.
In XML gibt es keine reservierten Wörter, sodass Sie jedes beliebige Wort als Elementnamen verwenden können. Folgende Regelungen sind jedoch zusätzlich zu beachten:
1. Der Name kann Buchstaben, Zahlen und andere Buchstaben enthalten;
2. Der Name darf nicht mit einer Zahl oder „_“ (Unterstrich) beginnen;
3. Der Name darf nicht mit den Buchstaben xml (oder XML oder Xml ..) beginnen.
4. Der Name darf keine Leerzeichen enthalten.
5. Der Name darf kein „:“ (Doppelpunkt) enthalten.
Um das Lesen, Verstehen und Bearbeiten von Elementen zu erleichtern, haben wir einige weitere Vorschläge:
1. Verwenden Sie nicht „.“ im Namen. Denn in vielen Programmiersprachen wird „.“ als Attribut eines Objekts verwendet, zum Beispiel: font.color. Aus dem gleichen Grund ist es am besten, „-“ nicht zu verwenden. Wenn es verwendet werden muss, ersetzen Sie es durch „_“.
2. Halten Sie den Namen so kurz wie möglich.
3. Versuchen Sie, für die Groß- und Kleinschreibung von Namen denselben Standard zu verwenden.
4. Der Name kann nicht-englische Zeichen verwenden, z. B. Chinesisch. Einige Software unterstützt dies jedoch möglicherweise nicht. (IE5 unterstützt derzeit chinesische Elemente.)
Fügen Sie außerdem eine kleine Erläuterung zu den Eigenschaften hinzu. In HTML können Attribute verwendet werden, um das Anzeigeformat von Elementen zu definieren. Beispiel: word zeigt das Wort in Rot an. In XML sind Attribute lediglich Beschreibungen von Bezeichnern und haben nichts mit der Anzeige von Elementinhalten zu tun. Beispielsweise wird derselbe Satz: word das Wort nicht in Rot anzeigen. (Einige Internetnutzer werden sich also fragen: Wie zeige ich Text in XML in Rot an? Dazu ist die Verwendung von CSS oder XSL erforderlich, was wir weiter unten im Detail beschreiben werden.)
3. Syntax von Kommentaren
Kommentare werden zum XML-Dokument hinzugefügt, um das Lesen und Verstehen zu erleichtern, und werden vom Programm nicht interpretiert oder vom Browser angezeigt.
Die Syntax für Kommentare lautet wie folgt:
Wie Sie sehen, entspricht es der Kommentarsyntax in HTML, was sehr einfach ist. Durch die Entwicklung guter Kommentargewohnheiten lassen sich Ihre Dokumente einfacher pflegen und teilen und sehen professioneller aus.
4. Syntax von CDATA
Der vollständige Name von CDATA sind Zeichendaten, die als Zeichendaten übersetzt werden. Wenn wir XML-Dokumente schreiben, müssen wir manchmal Buchstaben, Zahlen und andere Symbole selbst anzeigen, z. B. „<“. In XML haben diese Zeichen bereits eine besondere Bedeutung. Dies erfordert die Verwendung der CDATA-Syntax. Das Syntaxformat ist wie folgt:
Zum Beispiel:
ajie]]>
Der auf der Seite angezeigte Inhalt lautet „
Kapitel 4 XML-Syntax
5. Syntax von Namespaces
Namespaces bedeutet Namespace. Was macht der Namespace? Wenn wir in einem XML-Dokument die DTD-Dateien anderer Personen oder mehrere verwenden, entsteht ein solcher Widerspruch: Da die Bezeichner in XML von uns selbst erstellt werden, können die Bezeichnernamen in verschiedenen DTD-Dateien gleich sein, aber unterschiedliche Bedeutungen haben Datenverwirrung verursachen.
Beispielsweise stellt