Capítulo 4 Sintaxis XML
describir:
1. Reglas de sintaxis XML 2. Sintaxis de elementos 3. Sintaxis de comentarios 4. Sintaxis CDATA 5. Sintaxis de espacios de nombres 6. Sintaxis de entidades 7. Sintaxis DTD
Al estudiar los tres capítulos anteriores, ya comprendemos qué es XML, sus principios de implementación y la terminología relacionada. A continuación, comenzaremos a aprender las especificaciones de sintaxis de XML y a escribir nuestros propios documentos XML.
1.Reglas de sintaxis XML
Los documentos XML son similares a los códigos originales HTML y también utilizan etiquetas para identificar el contenido. Se deben seguir las siguientes reglas importantes al crear documentos XML:
Regla 1: Debe haber una declaración de declaración XML. Ya lo mencionamos en el capítulo anterior. La declaración es la primera frase del documento XML y su formato es el siguiente:
<?xml versión="1.0" standalone="sí/no" codificación="UTF-8"?>
El propósito de la declaración es indicarle al navegador u otro programa de procesamiento que este documento es un documento XML. La versión en la declaración de declaración indica la versión de la especificación XML que cumple el documento; de forma independiente, indica si el documento viene con un archivo DTD; de ser así, el parámetro codificación es no, indica la codificación del idioma utilizado en el documento y el El valor predeterminado es UTF-8.
Regla 2: si existe un archivo DTD. Si el documento es un "documento XML válido" (consulte el capítulo anterior), entonces el documento debe tener un archivo DTD correspondiente y cumplir estrictamente con las especificaciones establecidas por el archivo DTD. La declaración del archivo DTD sigue la declaración XML en el siguiente formato:
<!DOCTYPE tipo de documento SISTEMA/PÚBLICO "nombre-dtd">
en:
"!DOCTYPE" significa que desea definir un DOCTYPE;
"tipo-de-doc" es el nombre del tipo de documento, definido por usted, normalmente el mismo que el nombre del archivo DTD;
Utilice sólo uno de los dos parámetros "SYSTEM/PUBLIC". SISTEMA se refiere a la URL del archivo DTD privado utilizado por el documento, mientras que PÚBLICO se refiere a la URL del archivo DTD público utilizado por el documento.
"dtd-name" es la URL y el nombre del archivo DTD. Todos los archivos DTD tienen el sufijo ".dtd".
Seguimos usando el ejemplo anterior, debería escribirse así:
<?xml versión="1.0" standalone="no" codificar="UTF-8"?>
<!DOCTYPE lista de archivos SISTEMA "listadearchivos.dtd">
Regla 3: Preste atención a las mayúsculas En los documentos XML, existe una diferencia entre mayúsculas y minúsculas. <P> y <p> son identificadores diferentes. Tenga en cuenta que al escribir elementos, el caso de los identificadores frontal y posterior debe seguir siendo el mismo. Por ejemplo: <Author>ajie</Author>, está mal escribir <Author>ajie</author>.
Será mejor que adquiera el hábito de utilizar todo en mayúsculas, minúsculas o poner la primera letra en mayúscula. Esto reduce los errores de documentación causados por discrepancias de casos.
Regla 4: agregue comillas a los valores de los atributos. En el código HTML, los valores de los atributos se pueden citar o no. Por ejemplo: <font color=red>word</font> y <font color="red">word</font> pueden ser interpretados correctamente por el navegador.
Sin embargo, en XML se estipula que todos los valores de los atributos deben estar entre comillas (pueden ser comillas simples o dobles); de lo contrario, se considerará un error.
Regla 5: Todas las etiquetas deben tener una etiqueta de cierre correspondiente. En HTML, las etiquetas no pueden aparecer en pares, como?lt;br>. En XML, se estipula que todas las etiquetas deben aparecer en pares. Si hay una etiqueta de inicio, debe haber una etiqueta de fin. En caso contrario se considerará un error.
Regla 6: todas las etiquetas vacías también deben estar cerradas. Una etiqueta vacía es una etiqueta sin contenido entre los pares de etiquetas. Por ejemplo, <br>, <img> y otras etiquetas. En XML, se estipula que todas las etiquetas deben tener una etiqueta final. Para etiquetas vacías, el método de procesamiento en XML es agregar / al final de la etiqueta original, y eso es todo. Por ejemplo:
<br> debe escribirse como <br />;
<META name="keywords" content="XML, SGML, HTML"> debe escribirse como <META name="keywords" content="XML, SGML, HTML" />;
<IMG src= "cool.gif"> debe escribirse como <IMG src= "cool.gif" />
Capítulo 4 Sintaxis XML
2. Sintaxis de elementos
Un elemento consta de un par de identificadores y su contenido. Así: ajie. El nombre del elemento y el nombre del identificador son iguales. Las identidades se pueden describir con más detalle utilizando atributos.
En XML no hay palabras reservadas, por lo que puedes utilizar cualquier palabra como nombre de elemento. Sin embargo, también se deben observar las siguientes normas:
1. El nombre puede contener letras, números y otras letras;
2. El nombre no puede comenzar con un número o "_" (guión bajo);
3. El nombre no puede comenzar con las letras xml (o XML o Xml ..)
4. El nombre no puede contener espacios.
5. El nombre no puede contener ":" (dos puntos)
Para que los elementos sean más fáciles de leer, comprender y manipular, tenemos algunas sugerencias más:
1. No utilice "." en el nombre. Porque en muchos lenguajes de programación, "." se utiliza como atributo de un objeto, por ejemplo: font.color. Por la misma razón, es mejor no usar "-". Si es necesario, reemplácelo con "_";
2. Mantenga el nombre lo más breve posible.
3. Intente utilizar el mismo estándar para las mayúsculas y el uso de mayúsculas en los nombres.
4. El nombre puede utilizar caracteres que no sean ingleses, como el chino. Pero es posible que algún software no lo admita. (IE5 actualmente admite elementos chinos).
Además, añade una pequeña explicación sobre las propiedades. En HTML, los atributos se pueden utilizar para definir el formato de visualización de los elementos. Por ejemplo: <font color="red">word</font> mostrará la palabra en rojo. En XML, los atributos son sólo descripciones de identificadores y no tienen nada que ver con la visualización del contenido del elemento. Por ejemplo, la misma frase: <font color="red">palabra</font> no mostrará la palabra en rojo. (Entonces, algunos internautas se preguntarán: ¿Cómo mostrar texto en rojo en XML? Esto requiere el uso de CSS o XSL, que describiremos en detalle a continuación).
3. Sintaxis de comentarios
Los comentarios se agregan al documento XML para facilitar la lectura y la comprensión, y no serán interpretados por el programa ni mostrados por el navegador.
La sintaxis de los comentarios es la siguiente:
<!-- Aquí está la información del comentario-->
Como puedes ver, es la misma que la sintaxis de los comentarios en HTML, lo cual es muy sencillo. Desarrollar buenos hábitos para comentar hará que sus documentos sean más fáciles de mantener, compartir y lucirán más profesionales.
4. Sintaxis de CDATA
El nombre completo de CDATA es datos de caracteres, que se traduce como datos de caracteres. Cuando escribimos documentos XML, a veces necesitamos mostrar letras, números y otros símbolos, como "<". En XML, estos caracteres ya tienen significados especiales. Esto requiere el uso de la sintaxis CDATA. El formato de sintaxis es el siguiente:
<![CDATA[Coloque aquí los caracteres que se mostrarán]]>
Por ejemplo:
<![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>
El contenido mostrado en la página será "<AUTHOR sex="female">ajie</AUTHOR>"
Capítulo 4 Sintaxis XML
5. Sintaxis de espacios de nombres
Los espacios de nombres se traducen en espacios de nombres. ¿Qué hace el espacio de nombres? Cuando utilizamos archivos DTD de otras personas o múltiples en un documento XML, habrá tal contradicción: debido a que los identificadores en XML los creamos nosotros mismos, en diferentes archivos DTD, los nombres de los identificadores pueden ser los mismos pero tener significados diferentes. causar confusión en los datos.
Por ejemplo, en un documento <table>mesa de madera</table>, <table> representa una tabla.
En otro documento <table>namelist</table>, <table> representa una tabla. Si necesito trabajar en ambos documentos al mismo tiempo, se producirá un conflicto de nombres.
Para resolver este problema, introdujimos el concepto de espacios de nombres. Los espacios de nombres distinguen estos identificadores con el mismo nombre agregando una URL al nombre del identificador.
Los espacios de nombres también deben declararse al principio del documento XML. La sintaxis de la declaración es la siguiente:
<documento xmlns:tu nombre='URL'>
Donde yourname es el nombre de los espacios de nombres definidos por usted y URL es la URL del espacio de nombres.
Suponiendo que el documento "tabla <tabla>" anterior proviene de http://www.zhuozi.com, podemos declararlo como
<documento xmlns:zhuozi='http://www.zhuozi.com'>
Luego use el espacio de nombres definido en etiquetas posteriores:
<zhuozi:table>mesa de madera</table>
Esto distingue las dos <table>. Nota: Establecer la URL no significa que este logotipo realmente deba leerse desde esa URL, es solo una señal de distinción.
6. Sintaxis de entidad
Entidad se traduce como "entidad". Su función es similar a la "macro" en Word y también puede entenderse como una plantilla en DW. Puede predefinir una entidad y luego llamarla varias veces en un documento, o llamar a la misma entidad en varios documentos.
La entidad puede contener caracteres, texto, etc. Los beneficios de utilizar la entidad son: 1. Puede reducir los errores. Solo es necesario ingresar varias partes idénticas en el documento una vez. 2. Mejora la eficiencia del mantenimiento. Por ejemplo, si tiene 40 documentos que contienen entidades de derechos de autor, si necesita modificar estos derechos de autor, no necesita modificar todos los archivos. Solo necesita cambiar la declaración de entidad definida originalmente.
XML define dos tipos de entidades. Una es la entidad ordinaria de la que estamos hablando aquí, utilizada en documentos XML; la otra es la entidad paramétrica, utilizada en archivos DTD.
La sintaxis de definición de entidad es:
<!DOCTYPE nombre de archivo [
<!ENTITY nombre-entidad "contenido-entidad"
]
>
Por ejemplo, quiero definir una parte de la información de derechos de autor:
<!DOCTYPE derechos de autor [
<!ENTITY copyright "Copyright 2001, Ajie. Todos los derechos reservados"
]
>
Si el contenido de mi información de derechos de autor se comparte con otras personas en un archivo XML, también puedo usar el método de llamada externa. La sintaxis es la siguiente:
<!DOCTYPE derechos de autor [
<!ENTIDAD SISTEMA de derechos de autor "http://www.sample.com/copyright.xml">
]
>
La sintaxis de referencia de la entidad definida en el documento es: &entity-name;
Por ejemplo, la información de derechos de autor definida anteriormente se escribe como "derechos de autor" cuando se llama.
El ejemplo completo es el siguiente, puedes copiarlo y guardarlo como copyright.xml para ver el ejemplo:
<?xml versión="1.0" codificación="GB2312"?>
<!DOCTYPE derechos de autor [
<!ENTITY copyright "Copyright 2001, Ajie. Todos los derechos reservados">
]>
<miarchivo>
<título>XML</título>
<autor>ajie</autor>
<correo electrónico>[email protected]</correo electrónico>
<fecha>20010115</fecha>
©derecho;
</miarchivo>
Capítulo 4 Sintaxis XML
7. Sintaxis DTD
DTD es un archivo necesario para un "documento XML válido". Utilizamos archivos DTD para definir las reglas y relaciones mutuas de elementos e identificadores en el documento. ¿Cómo crear un archivo DTD? Aprendamos juntos:
1. Establecer elementos
Los elementos son los componentes básicos de los documentos XML. Debe definir un elemento en la DTD y luego usarlo en el documento XML. La sintaxis de definición de un elemento es: <!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>
ilustrar:
"<!ELEMENT" es una declaración de un elemento, indicando que lo que se quiere definir es un elemento;
"DESCRIPCIÓN" después de la declaración es el nombre del elemento;
"(#PCDATA, DEFINITION)*>" es la regla de uso de este elemento. Las reglas definen qué elementos pueden contener y cómo se relacionan entre sí. La siguiente tabla describe las reglas para los elementos:
2. Tabla de reglas de elementos: