describir:
Introducción
1. Términos relacionados con documentos XML
2. Términos relacionados con la DTD
Introducción
Lo más problemático para los principiantes al aprender XML es que hay muchos conceptos terminológicos nuevos que comprender. Dado que XML en sí también es una tecnología completamente nueva, se desarrolla y cambia constantemente. Las organizaciones y las principales empresas de redes (Microsoft, IBM, SUN, etc.) introducen constantemente sus propios conocimientos y estándares, por lo que no es sorprendente que aparezcan nuevos conceptos. están volando por todas partes. No existe ninguna institución u organización autorizada en China para nombrar oficialmente estos términos. La mayoría de los libros de texto chinos que ve sobre XML están traducidos según la comprensión del propio autor. Algunos son correctos y otros incorrectos, lo que dificulta aún más el desarrollo de XML. comprensión y aprendizaje de estos conceptos.
Las explicaciones de los términos XML que verá a continuación también son interpretación y traducción del propio autor. Ajie se basa en la especificación estándar XML1.0 publicada por la organización W3C y la documentación oficial relacionada. Se puede garantizar que estas interpretaciones sean básicamente correctas, al menos no erróneas. Si desea leer y comprender más, he enumerado las fuentes y los enlaces a recursos relevantes al final de este artículo, a los que puede acceder directamente. Bien, pongámonos manos a la obra:
1. Términos relacionados con documentos XML
¿Qué es un documento XML? ¿Conoce el archivo de código fuente HTML? Un documento XML es un archivo de código fuente XML escrito con etiquetas XML. Los documentos XML también son archivos de texto sin formato ASCII que puede crear y modificar utilizando el Bloc de notas. El nombre del sufijo de los documentos XML es .XML, por ejemplo, myfile.xml. También puede abrir directamente el archivo .xml usando navegadores IE5.0 o superiores, pero lo que ve es el "código original XML" y el contenido de la página no se mostrará. Puedes intentar guardar el siguiente código como myfile.xml:
<?xml versión="1.0" codificación="GB2312"?>
<miarchivo>
<title>Manual de aprendizaje sencillo de XML</title>
<autor>ajie</autor>
<correo electrónico>[email protected]</correo electrónico>
<fecha>20010115</fecha>
</miarchivo>
Los documentos XML contienen tres partes:
1. Una declaración de documento XML;
2. Una definición del tipo de documento;
3. Marque el contenido creado con XML.
Ejemplo:
<?xml versión="1.0"?>
<!DOCTYPE lista de archivos SISTEMA "listadearchivos.dtd">
<lista de archivos>
<miarchivo>
<title>INICIO RÁPIDO DE XML</title>
<autor>ajie</autor>
</miarchivo>
...
</lista de archivos>
La primera línea <?xml version="1.0"?> es la declaración de un documento XML. La segunda línea indica que este documento usa filelist.dtd para definir el tipo de documento. La tercera línea a continuación es la parte principal del contenido.
Entendamos los términos relevantes en los documentos XML:
1.Elemento:
Ya conocemos el elemento en HTML. Es la unidad más pequeña que conforma un documento HTML, y ocurre lo mismo en XML. Un elemento se define mediante un identificador, incluido un identificador de inicio y fin y su contenido, como este: <autor>ajie</autor>
La única diferencia es: en HTML, la etiqueta es fija, pero en XML, la etiqueta debe ser creada por usted.
2.Etiqueta (logotipo)
Los identificadores se utilizan para definir elementos. En XML, las etiquetas deben aparecer en pares, rodeando los datos. El nombre del identificador es el mismo que el nombre del elemento. Por ejemplo, un elemento como este:
<autor>ajie</autor>
Donde <autor> es el identificador.
3.Atributo:
¿Qué son las propiedades? Mire este código HTML:<font color="red">palabra</font>. Entre ellos, el color es uno de los atributos de la fuente.
Los atributos son descripciones y explicaciones adicionales del logotipo. Un logotipo puede tener múltiples atributos, como el atributo de fuente y el tamaño. Los atributos en XML son los mismos que los atributos en HTML. Cada atributo tiene su propio nombre y valor. El atributo es parte del identificador. Ejemplo:
<autor sexo="female">ajie</autor>
Los atributos en XML también se definen por sí mismos. Le recomendamos que intente no utilizar atributos y cambiarlos en subelementos. Por ejemplo, el código anterior se puede cambiar a esto:
<autor>ajie
<sexo>mujer</sex>
</autor>
La razón es que los programas no pueden expandir ni manipular fácilmente los atributos.
4.Declaración
En la primera línea de todos los documentos XML hay una declaración XML. Esta declaración indica que este documento es un documento XML y qué especificación de versión XML sigue. Una declaración de declaración XML se ve así:
<?xml versión="1.0"?>
5.DTD (definición de tipo de archivo)
DTD se utiliza para definir elementos, atributos y relaciones entre elementos en documentos XML.
El archivo DTD se puede utilizar para detectar si la estructura del documento XML es correcta. Pero la creación de un documento XML no requiere necesariamente un archivo DTD. Las descripciones detalladas de los archivos DTD se enumerarán por separado a continuación.
6.XML bien formado (XML bien formado)
Un documento que cumple con las reglas de sintaxis XML y las especificaciones XML se denomina "bien formado". Si todo su marcado cumple estrictamente con la especificación XML, entonces su documento XML no necesita necesariamente un archivo DTD para definirlo.
Un documento bien formado debe comenzar con una declaración XML, como por ejemplo:
<?xml versión="1.0" standalone="yes" codificación="UTF-8"?>
Entre ellos, debe indicar la versión XML que cumple el documento, que actualmente es 1.0, en segundo lugar explicar que el documento es "independiente", y en tercer lugar no requiere un archivo DTD para verificar si la identificación en el mismo es válida; , deberá indicar la codificación del idioma utilizado en el documento. El valor predeterminado es UTF-8. Si usa chino, debe configurarlo en GB2312.
Un documento XML bien formado debe tener un elemento raíz, que es el primer elemento creado inmediatamente después de la declaración. Todos los demás elementos son elementos secundarios de este elemento raíz y pertenecen a un grupo de elementos raíz.
El contenido de un documento XML bien formado debe escribirse respetando la sintaxis XML. (Explicaremos la sintaxis XML en detalle en el próximo capítulo)
7.XML válido (XML válido)
Un documento XML que cumple con las reglas de sintaxis XML y cumple con las especificaciones del archivo DTD correspondientes se denomina documento XML válido. Tenga en cuenta que comparamos "XML bien formado" y "XML válido".
XML", la mayor diferencia entre ellos es que uno cumple totalmente con la especificación XML, mientras que el otro tiene su propia "Definición de tipo de documento (DTD)".
El proceso de comparar un documento XML con su archivo DTD para ver si cumple con las reglas DTD se llama validación. Este proceso suele ser manejado por un software llamado analizador.
Un documento XML válido también debe comenzar con una declaración XML, por ejemplo:
<?xml versión="1.0" standalone="no" codificar="UTF-8"?>
A diferencia del ejemplo anterior, en el atributo independiente (independiente), aquí se establece "no" porque debe usarse con el DTD correspondiente. El archivo DTD se define de la siguiente manera:
<!DOCTYPE tipo de documento SISTEMA/PÚBLICO "nombre-dtd">
en:
"!DOCTYPE" significa que desea definir un DOCTYPE;
"tipo-de-doc" es el nombre del tipo de documento, definido por usted, normalmente el mismo que el nombre del archivo DTD;
Utilice sólo uno de los dos parámetros "SYSTEM/PUBLIC". SISTEMA se refiere a la URL del archivo DTD privado utilizado por el documento, mientras que PÚBLICO se refiere a la URL del archivo DTD público utilizado por el documento.
"dtd-name" es la URL y el nombre del archivo DTD. Todos los archivos DTD tienen el sufijo ".dtd".
Seguimos usando el ejemplo anterior, debería escribirse así:
<?xml versión="1.0" standalone="no" codificar="UTF-8"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
2. Términos relacionados con DTD
Qué es DTD, lo hemos mencionado brevemente anteriormente. DTD es un método eficaz para garantizar que el formato del documento XML sea correcto. Puede comparar el documento XML y el archivo DTD para ver si el documento se ajusta a la especificación y si los elementos y etiquetas se utilizan correctamente. Un documento DTD contiene: las reglas de definición de elementos, las reglas de definición de relaciones entre elementos, los atributos que pueden usar los elementos y las reglas de entidades o símbolos que pueden usarse.
El archivo DTD también es un archivo de texto ASCII con el sufijo .dtd. Por ejemplo: miarchivo.dtd.
¿Por qué utilizar archivos DTD? Tengo entendido que cumple con el intercambio de redes y la interacción de datos. El mayor beneficio de usar DTD es compartir archivos DTD. (Este es el atributo PUBLIC en la declaración de descripción de DTD anterior). Por ejemplo, si dos personas de la misma industria y de diferentes regiones utilizan el mismo archivo DTD como especificación de creación de documentos, sus datos se pueden intercambiar y compartir fácilmente. Si otras personas en Internet quieren agregar datos, solo necesitan crear un documento de acuerdo con la especificación DTD pública y pueden unirse inmediatamente.
Actualmente, ya hay disponibles una gran cantidad de archivos DTD escritos. Dirigidos a diferentes industrias y aplicaciones, estos archivos DTD han establecido reglas de etiquetas y elementos comunes. No es necesario que los vuelva a crear usted mismo, simplemente agregue los nuevos logotipos que necesite en función de ellos.
Por supuesto, si lo desea, puede crear su propia DTD, que puede coincidir mejor con su documento. Crear su propia DTD también es muy sencillo. Generalmente, sólo necesita definir 4-5 elementos.
Hay dos formas de llamar a un archivo DTD:
1. DTD contenido directamente en el documento XML
Todo lo que necesitas hacer es insertar algunas instrucciones especiales en la declaración DOCTYPE, como esta:
Tenemos un documento XML:
<?xml versión="1.0" codificación="GB2312"?>
<miarchivo>
<title>Manual de aprendizaje sencillo de XML</title>
<autor>ajie</autor>
</miarchivo>
Simplemente insertamos el siguiente código después de la primera línea:
<!DOCTYPE miarchivo [
<!Título del ELEMENTO (#PCDATA)>
<!Autor del ELEMENTO (#PCDATA)>
<!ENTITY copyright "Copyright 2001, Ajie.">
]>
2. Llame a un archivo DTD independiente
Guarde el documento DTD como un archivo .dtd y luego llámelo en la línea de declaración DOCTYPE. Por ejemplo, guarde el siguiente código como myfile.dtd.
<!ELEMENT miarchivo (título, autor)>
<!Título del ELEMENTO (#PCDATA)>
<!Autor del ELEMENTO (#PCDATA)>
Luego llámalo en el documento XML, insertando después de la primera línea:
<!DOCTYPE miarchivo SISTEMA "miarchivo.dtd">
Podemos ver que las llamadas a js en documentos DTD y HTML son similares en cuanto a cómo escribir documentos DTD, los presentaremos junto con la sintaxis de documentos XML en el próximo capítulo.
Conozcamos la terminología relacionada con DTD:
1.Esquema (planificación)
El esquema es una descripción de las reglas de datos. El esquema hace dos cosas:
a. Define el tipo de datos del elemento y la relación entre elementos;
b. Define el tipo de contenido que puede contener el elemento.
DTD es un esquema para documentos XML.
2.Árbol de documentos
Ya hemos mencionado el "árbol de documentos" en el Capítulo 2. Es una representación visual de la estructura jerárquica de los elementos del documento. Un árbol de estructura de documento contiene el elemento raíz, que es el elemento de nivel superior (es decir, el primer elemento que sigue inmediatamente a la declaración XML). Mira el ejemplo:
<?xml versión="1.0"?>
<lista de archivos>
<miarchivo>
<título>...</título>
<autor>...</autor>
</miarchivo>
</lista de archivos>
El ejemplo anterior está organizado en una estructura de tres niveles en forma de "árbol", en el que <filelist> es el elemento raíz. En archivos XML y DTD, el primer elemento definido es el elemento raíz.
3.Elemento principal/elemento secundario
Un elemento padre es un elemento que contiene otros elementos y el elemento contenido se denomina elemento hijo. Mire el "árbol de estructura" de arriba, donde <myfile> es el elemento principal, <title>, <author> son sus elementos secundarios y <myfile> es el elemento secundario de <filelist>. Los elementos del último nivel que no contienen ningún elemento secundario como <título> también se denominan "elementos de página".
4.Parser (software de análisis)
Parser es una herramienta de software que comprueba si los documentos XML cumplen con las especificaciones DTD.
Los analizadores XML se han desarrollado en dos categorías: una es el "analizador sin confirmación", que sólo detecta si el documento cumple con las reglas de sintaxis XML y si el árbol del documento está establecido con identificadores de elementos. El otro es el "paeser de clase de confirmación", que no solo detecta la sintaxis del documento y el árbol de estructura, sino que también compara y analiza si los identificadores de elementos que utiliza cumplen con las especificaciones del archivo DTD correspondiente.
El analizador se puede utilizar de forma independiente o como parte de un software de edición o navegador. En la siguiente lista de recursos relacionados, he enumerado algunos de los analizadores populares actualmente.
Bien, a través del estudio del Capítulo 3, hemos aprendido algunos términos básicos de XML y DTD, pero todavía no sabemos cómo escribir estos archivos y qué tipo de sintaxis se debe seguir. En el próximo capítulo, nos centraremos. sobre escritura XML y sintaxis de documentos DTD. Por favor continúa navegando, ¡gracias!