Gliederung:
Einführung
1. Begriffe im Zusammenhang mit XML-Dokumenten
2. Begriffe im Zusammenhang mit DTD
Einführung
Das Schwierigste für Anfänger beim Erlernen von XML ist, dass es viele neue Terminologiekonzepte zu verstehen gilt. Da es sich bei XML selbst um eine brandneue Technologie handelt, entwickelt und verändert sich die Technologie ständig. Organisationen und große Netzwerkunternehmen (Microsoft, IBM, SUN usw.) führen ständig ihre eigenen Erkenntnisse und Standards ein, sodass es nicht verwunderlich ist, dass neue Konzepte entstehen fliegen überall hin. Es gibt in China keine maßgebliche Institution oder Organisation, die diese Begriffe offiziell benennt. Die meisten chinesischen Lehrbücher, die Sie sehen, basieren auf dem eigenen Verständnis des Autors, was die Entwicklung von XML weiter behindert Verständnis und Erlernen dieser Konzepte.
Die Erklärungen der XML-Begriffe, die Sie unten sehen, sind ebenfalls das eigene Verständnis und die Übersetzung des Autors. Ajie basiert auf der von der W3C-Organisation veröffentlichten XML1.0-Standardspezifikation und der zugehörigen offiziellen Dokumentation. Es kann sichergestellt werden, dass diese Auffassungen grundsätzlich richtig, zumindest aber nicht falsch sind. Wenn Sie weiterlesen und verstehen möchten, habe ich am Ende dieses Artikels die Quellen und Links zu relevanten Ressourcen aufgelistet, auf die Sie direkt zugreifen können. Okay, kommen wir zur Sache:
1. Begriffe im Zusammenhang mit XML-Dokumenten
Was ist ein XML-Dokument? Kennen Sie die HTML-Quellcodedatei? Ein XML-Dokument ist eine mit XML-Tags geschriebene XML-Quellcodedatei. XML-Dokumente sind ebenfalls reine ASCII-Textdateien, die Sie mit Notepad erstellen und ändern können. Der Suffixname von XML-Dokumenten ist .XML, zum Beispiel myfile.xml. Sie können die .xml-Datei auch direkt mit Browsern von IE5.0 oder höher öffnen, aber was Sie sehen, ist der „XML-Originalcode“ und der Seiteninhalt wird nicht angezeigt. Sie können versuchen, den folgenden Code als myfile.xml zu speichern:
<?xml version="1.0"kodierung="GB2312"?>
<meineDatei>
<title>XML Easy Learning-Handbuch</title>
<author>ajie</author>
<email>[email protected]</email>
<date>20010115</date>
</meineDatei>
XML-Dokumente bestehen aus drei Teilen:
1. Eine XML-Dokumentdeklaration;
2. Eine Definition des Dokumenttyps;
3. Markieren Sie den erstellten Inhalt mit XML.
Beispiel:
<?xml version="1.0"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
<Dateiliste>
<meineDatei>
<title>SCHNELLER EINFÜHRUNG IN XML</title>
<author>ajie</author>
</meineDatei>
...
</filelist>
Die erste Zeile <?xml version="1.0"?> ist die Deklaration eines XML-Dokuments. Die zweite Zeile gibt an, dass dieses Dokument filelist.dtd verwendet, um den Dokumenttyp zu definieren.
Lassen Sie uns die relevanten Begriffe in XML-Dokumenten verstehen:
1.Element:
Wir kennen das Element bereits in HTML. Es ist die kleinste Einheit, aus der ein HTML-Dokument besteht, und in XML ist es dasselbe. Ein Element wird durch einen Bezeichner definiert, einschließlich eines Start- und Endbezeichners und seines Inhalts, wie folgt: <author>ajie</author>
Der einzige Unterschied besteht darin: In HTML ist das Tag festgelegt, in XML muss das Tag jedoch von Ihnen erstellt werden.
2.Tag (Logo)
Bezeichner werden zur Definition von Elementen verwendet. In XML müssen Tags paarweise die Daten umgebend erscheinen. Der Name des Bezeichners ist derselbe wie der Name des Elements. Zum Beispiel ein Element wie dieses:
<author>ajie</author>
Dabei ist <Autor> die Kennung.
3.Attribut:
Was sind Eigenschaften? Schauen Sie sich diesen HTML-Code an:<font color="red">word</font>. Unter diesen ist die Farbe eines der Attribute der Schriftart.
Attribute sind weitere Beschreibungen und Erläuterungen zum Logo. Ein Logo kann mehrere Attribute haben, beispielsweise das Schriftattribut und die Schriftgröße. Attribute in XML sind dieselben wie Attribute in HTML. Jedes Attribut hat seinen eigenen Namen und Wert. Das Attribut ist Teil des Bezeichners. Beispiel:
<author sex="female">ajie</author>
Attribute in XML werden auch selbst definiert. Wir empfehlen, dass Sie versuchen, keine Attribute zu verwenden und Attribute in Unterelemente zu ändern. Der obige Code kann beispielsweise wie folgt geändert werden.
<Autor>ajie
<Geschlecht>weiblich</Geschlecht>
</Autor>
Der Grund dafür ist, dass Attribute von Programmen nicht einfach erweitert und manipuliert werden können.
4.Erklärung
In der ersten Zeile aller XML-Dokumente befindet sich eine XML-Deklaration. Diese Deklaration gibt an, dass es sich bei diesem Dokument um ein XML-Dokument handelt und welcher XML-Versionsspezifikation es folgt. Eine XML-Deklarationsanweisung sieht folgendermaßen aus:
<?xml version="1.0"?>
5.DTD (Dateitypdefinition)
DTD wird verwendet, um Elemente, Attribute und Beziehungen zwischen Elementen in XML-Dokumenten zu definieren.
Anhand der DTD-Datei lässt sich erkennen, ob die Struktur des XML-Dokuments korrekt ist. Für die Erstellung eines XML-Dokuments ist jedoch nicht unbedingt eine DTD-Datei erforderlich. Detaillierte Beschreibungen der DTD-Dateien werden unten separat aufgeführt.
6. Wohlgeformtes XML (wohlgeformtes XML)
Ein Dokument, das den XML-Syntaxregeln und den XML-Spezifikationen entspricht, wird als „wohlgeformt“ bezeichnet. Wenn sich Ihr gesamtes Markup strikt an die XML-Spezifikation hält, benötigt Ihr XML-Dokument nicht unbedingt eine DTD-Datei, um es zu definieren.
Ein wohlgeformtes Dokument muss mit einer XML-Deklaration beginnen, wie zum Beispiel:
<?xml version="1.0" standalone="yes"kodierung="UTF-8"?>
Darunter müssen Sie angeben, mit welcher XML-Version das Dokument kompatibel ist (aktuell 1.0); zweitens müssen Sie erklären, dass das Dokument „unabhängig“ ist und drittens keine DTD-Datei erforderlich ist, um zu überprüfen, ob die darin enthaltene Identifikation gültig ist; , müssen Sie die im Dokument verwendete Sprachkodierung angeben. Der Standardwert ist UTF-8. Wenn Sie Chinesisch verwenden, müssen Sie ihn auf GB2312 einstellen.
Ein wohlgeformtes XML-Dokument muss ein Wurzelelement haben, das das erste Element ist, das unmittelbar nach der Deklaration erstellt wird. Alle anderen Elemente sind untergeordnete Elemente dieses Wurzelelements und gehören zu einer Gruppe von Wurzelelementen.
Der Inhalt eines wohlgeformten XML-Dokuments muss in Übereinstimmung mit der XML-Syntax geschrieben werden. (Wir werden die XML-Syntax im nächsten Kapitel ausführlich erläutern)
7.Gültiges XML (gültiges XML)
Ein XML-Dokument, das den XML-Syntaxregeln und den entsprechenden DTD-Dateispezifikationen entspricht, wird als gültiges XML-Dokument bezeichnet. Beachten Sie, dass wir „Wohlgeformtes XML“ und „Valid“ vergleichen
XML“ besteht der größte Unterschied darin, dass eines vollständig der XML-Spezifikation entspricht, während das andere über eine eigene „Document Type Definition (DTD)“ verfügt.
Der Vorgang des Vergleichens eines XML-Dokuments mit seiner DTD-Datei, um festzustellen, ob es den DTD-Regeln entspricht, wird als Validierung bezeichnet. Dieser Prozess wird normalerweise von einer Software namens Parser durchgeführt.
Ein gültiges XML-Dokument muss außerdem mit einer XML-Deklaration beginnen, zum Beispiel:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
Anders als im obigen Beispiel wird hier im Standalone-Attribut (unabhängig) „no“ festgelegt, da es mit der entsprechenden DTD verwendet werden muss. Die DTD-Datei ist wie folgt definiert:
<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">
In:
„!DOCTYPE“ bedeutet, dass Sie einen DOCTYPE definieren möchten;
„type-of-doc“ ist der von Ihnen definierte Name des Dokumenttyps, normalerweise derselbe wie der DTD-Dateiname;
Verwenden Sie nur einen der beiden Parameter „SYSTEM/PUBLIC“. SYSTEM bezieht sich auf die URL der privaten DTD-Datei, die vom Dokument verwendet wird, während PUBLIC sich auf die URL der öffentlichen DTD-Datei bezieht, die vom Dokument verwendet wird.
„dtd-name“ ist die URL und der Name der DTD-Datei. Alle DTD-Dateien haben das Suffix „.dtd“.
Wir verwenden immer noch das obige Beispiel, es sollte wie folgt geschrieben werden:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
2. DTD-bezogene Begriffe
Was DTD ist, haben wir oben kurz erwähnt. DTD ist eine effektive Methode, um sicherzustellen, dass das XML-Dokumentformat korrekt ist. Sie können das XML-Dokument und die DTD-Datei vergleichen, um zu sehen, ob das Dokument der Spezifikation entspricht und ob die Elemente und Tags korrekt verwendet werden. Ein DTD-Dokument enthält: die Definitionsregeln von Elementen, die Definitionsregeln von Beziehungen zwischen Elementen, die Attribute, die von Elementen verwendet werden können, und die Regeln von Entitäten oder Symbolen, die verwendet werden können.
Die DTD-Datei ist ebenfalls eine ASCII-Textdatei mit der Endung .dtd. Zum Beispiel: meineDatei.dtd.
Warum DTD-Dateien verwenden? Mein Verständnis ist, dass es Netzwerkfreigabe und Dateninteraktion erfüllt. Der größte Vorteil der Verwendung von DTD ist die gemeinsame Nutzung von DTD-Dateien. (Dies ist das PUBLIC-Attribut in der obigen DTD-Beschreibungsanweisung). Wenn beispielsweise zwei Personen in derselben Branche und in verschiedenen Regionen dieselbe DTD-Datei als Dokumenterstellungsspezifikation verwenden, können ihre Daten problemlos ausgetauscht und gemeinsam genutzt werden. Wenn andere Personen im Internet Daten hinzufügen möchten, müssen sie lediglich ein Dokument gemäß der öffentlichen DTD-Spezifikation erstellen und können sofort beitreten.
Derzeit ist bereits eine große Anzahl geschriebener DTD-Dateien verfügbar. Diese DTD-Dateien richten sich an unterschiedliche Branchen und Anwendungen und haben gemeinsame Element- und Beschriftungsregeln festgelegt. Sie müssen sie nicht selbst neu erstellen, sondern fügen einfach die neuen Logos hinzu, die Sie auf der Grundlage dieser Logos benötigen.
Wenn Sie möchten, können Sie natürlich auch Ihre eigene DTD erstellen, die möglicherweise besser zu Ihrem Dokument passt. Auch das Erstellen einer eigenen DTD ist sehr einfach. Im Allgemeinen müssen Sie nur 4-5 Elemente definieren.
Es gibt zwei Möglichkeiten, eine DTD-Datei aufzurufen:
1. DTD direkt im XML-Dokument enthalten
Sie müssen lediglich einige spezielle Anweisungen wie diese in die DOCTYPE-Deklaration einfügen:
Wir haben ein XML-Dokument:
<?xml version="1.0"kodierung="GB2312"?>
<meineDatei>
<title>XML Easy Learning-Handbuch</title>
<author>ajie</author>
</meineDatei>
Wir fügen einfach den folgenden Code nach der ersten Zeile ein:
<!DOCTYPE meine Datei [
<!ELEMENT title (#PCDATA)>
<!ELEMENT Autor (#PCDATA)>
<!ENTITY Copyright „Copyright 2001, Ajie.“>
]>
2. Rufen Sie eine unabhängige DTD-Datei auf
Speichern Sie das DTD-Dokument als .dtd-Datei und rufen Sie es dann in der DOCTYPE-Deklarationszeile auf. Speichern Sie beispielsweise den folgenden Code als myfile.dtd
<!ELEMENT myfile (Titel, Autor)>
<!ELEMENT title (#PCDATA)>
<!ELEMENT Autor (#PCDATA)>
Rufen Sie es dann im XML-Dokument auf und fügen Sie nach der ersten Zeile Folgendes ein:
<!DOCTYPE myfile SYSTEM "myfile.dtd">
Wir können sehen, dass die Aufrufe von js in DTD-Dokumenten und HTML ähnlich sind. Was das Schreiben von DTD-Dokumenten betrifft, werden wir sie im nächsten Kapitel zusammen mit der Syntax von XML-Dokumenten vorstellen.
Erfahren Sie mehr über die Terminologie im Zusammenhang mit DTD:
1.Schema (Planung)
Schema ist eine Beschreibung von Datenregeln. Schema macht zwei Dinge:
a. Es definiert den Elementdatentyp und die Beziehung zwischen Elementen.
b. Es definiert den Inhaltstyp, den das Element enthalten kann.
DTD ist ein Schema für XML-Dokumente.
2.Dokumentenbaum
Den „Dokumentenbaum“ haben wir bereits in Kapitel 2 erwähnt. Es handelt sich um eine bildliche Darstellung der hierarchischen Struktur von Dokumentelementen. Ein Dokumentstrukturbaum enthält das Stammelement, das das Element der obersten Ebene ist (d. h. das erste Element, das unmittelbar auf die XML-Deklarationsanweisung folgt). Schauen Sie sich das Beispiel an:
<?xml version="1.0"?>
<Dateiliste>
<meineDatei>
<title>...</title>
<Autor>...</Autor>
</meineDatei>
</filelist>
Das obige Beispiel ist in einer dreistufigen Struktur in Form eines „Baums“ angeordnet, wobei <filelist> das Stammelement ist. In XML- und DTD-Dateien ist das erste definierte Element das Stammelement.
3.Übergeordnetes Element/untergeordnetes Element
Ein übergeordnetes Element ist ein Element, das andere Elemente enthält, und das enthaltene Element wird als sein untergeordnetes Element bezeichnet. Schauen Sie sich den „Strukturbaum“ oben an, wobei <myfile> das übergeordnete Element, <title>, <author> die untergeordneten Elemente und <myfile> das untergeordnete Element von <filelist> ist. Die Elemente der letzten Ebene, die keine untergeordneten Elemente wie <title> enthalten, werden auch „Seitenelemente“ genannt.
4.Parser (Parsing-Software)
Parser ist eine Tool-Software, die prüft, ob XML-Dokumente den DTD-Spezifikationen entsprechen.
XML-Parser wurden in zwei Kategorien unterteilt: Die eine ist der „Nicht-Bestätigungs-Parser“, der nur erkennt, ob das Dokument den XML-Syntaxregeln entspricht und ob der Dokumentbaum mit Elementbezeichnern erstellt wird. Der andere ist der „Confirmation Class Paeser“, der nicht nur die Dokumentsyntax und den Strukturbaum erkennt, sondern auch vergleicht und analysiert, ob die von Ihnen verwendeten Elementbezeichner den Spezifikationen der entsprechenden DTD-Datei entsprechen.
Parser kann unabhängig oder als Teil einer Bearbeitungssoftware oder eines Browsers verwendet werden. In der folgenden Liste verwandter Ressourcen habe ich einige der derzeit beliebtesten Parser aufgelistet.
Okay, durch das Studium von Kapitel 3 haben wir einige grundlegende Begriffe von XML und DTD gelernt, aber wir wissen immer noch nicht, wie man diese Dateien schreibt und welche Art von Syntax befolgt werden muss. Im nächsten Kapitel werden wir uns darauf konzentrieren zum Schreiben von XML und zur Syntax von DTD-Dokumenten. Bitte stöbern Sie weiter, vielen Dank!