Capítulo 4 Sintaxe XML
contorno:
1. Regras de sintaxe XML 2. Sintaxe de elemento 3. Sintaxe de comentário 4. Sintaxe CDATA 5. Sintaxe de namespaces 6. Sintaxe de entidade 7. Sintaxe DTD
Ao estudar os três capítulos anteriores, já entendemos o que é XML, seus princípios de implementação e a terminologia relacionada. A seguir, começaremos a aprender as especificações de sintaxe do XML e a escrever nossos próprios documentos XML.
1. Regras de sintaxe XML
Os documentos XML são semelhantes aos códigos originais HTML e também usam tags para identificar o conteúdo. As seguintes regras importantes devem ser seguidas ao criar documentos XML:
Regra 1: Deve haver uma declaração XML. Já mencionamos isso no capítulo anterior. A declaração é a primeira frase do documento XML e seu formato é o seguinte:
<?xml version="1.0" standalone="yes/no" encoding="UTF-8"?>
O objetivo da declaração é informar ao navegador ou outro programa de processamento que este documento é um documento XML. A versão na declaração indica a versão da especificação XML que o documento está em conformidade, indica se o documento vem com um arquivo DTD, em caso afirmativo, o parâmetro encoding indica a codificação da linguagem usada no documento, e o parâmetro encoding é no; o padrão é UTF-8.
Regra 2: Se existe um arquivo DTD Se o documento for um "documento XML válido" (veja o capítulo anterior), então o documento deve ter um arquivo DTD correspondente e cumprir rigorosamente as especificações definidas pelo arquivo DTD. A instrução de declaração do arquivo DTD segue a instrução de declaração XML no seguinte formato:
<!DOCTYPE tipo de documento SYSTEM/PUBLIC "dtd-name">
em:
"!DOCTYPE" significa que você deseja definir um DOCTYPE;
"type-of-doc" é o nome do tipo de documento, definido por você, geralmente igual ao nome do arquivo DTD;
Utilize apenas um dos dois parâmetros "SYSTEM/PUBLIC". SYSTEM refere-se à URL do arquivo DTD privado usado pelo documento, enquanto PUBLIC refere-se à URL do arquivo DTD público usado pelo documento.
"dtd-name" é o URL e o nome do arquivo DTD. Todos os arquivos DTD possuem o sufixo ".dtd".
Ainda usamos o exemplo acima, ele deve ser escrito assim:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE lista de arquivos SYSTEM "filelist.dtd">
Regra 3: Preste atenção ao uso de letras maiúsculas Em documentos XML, há uma diferença entre letras maiúsculas e minúsculas. <P> e <p> são identificadores diferentes. Observe que ao escrever elementos, a caixa dos identificadores dianteiro e traseiro deve permanecer a mesma. Por exemplo: <Author>ajie</Author>, é errado escrever <Author>ajie</author>.
É melhor você adquirir o hábito de usar letras maiúsculas, minúsculas ou colocar a primeira letra em maiúscula. Isso reduz erros de documentação causados por incompatibilidades de casos.
Regra 4: Adicione aspas aos valores dos atributos No código HTML, os valores dos atributos podem ser citados ou não. Por exemplo: <font color=red>word</font> e <font color="red">word</font> podem ser interpretados corretamente pelo navegador.
Porém, em XML, é estipulado que todos os valores dos atributos devem ser colocados entre aspas (podem ser aspas simples ou duplas), caso contrário será considerado um erro.
Regra 5: Todas as tags devem ter uma tag de fechamento correspondente. Em HTML, as tags não podem aparecer em pares, como?lt;br>. Em XML, é estipulado que todas as tags devem aparecer em pares. Se houver uma tag inicial, deverá haver uma tag final. Caso contrário, será considerado um erro.
Regra 6: Todas as tags vazias também devem ser fechadas. Uma tag vazia é uma tag sem conteúdo entre os pares de tags. Por exemplo, <br>, <img> e outras tags. Em XML, é estipulado que todas as tags devem ter uma tag de finalização. Para essas tags vazias, o método de processamento em XML é adicionar / no final da tag original e pronto. Por exemplo:
<br> deve ser escrito como <br />;
<META name="keywords" content="XML, SGML, HTML"> deve ser escrito como <META name="keywords" content="XML, SGML, HTML" />;
<IMG src= "cool.gif"> deve ser escrito como <IMG src= "cool.gif" />
Capítulo 4 Sintaxe XML
2. Sintaxe dos elementos
Um elemento consiste em um par de identificadores e seu conteúdo. Assim: ajie. O nome do elemento e o nome do identificador são iguais. As identidades podem ser descritas posteriormente usando atributos.
Em XML, não há palavras reservadas, portanto você pode usar qualquer palavra como nome de elemento. No entanto, os seguintes regulamentos também devem ser observados:
1. O nome pode conter letras, números e outras letras;
2. O nome não pode começar com número ou “_” (sublinhado);
3. O nome não pode começar com as letras xml (ou XML ou Xml..)
4. O nome não pode conter espaços.
5. O nome não pode conter ":" (dois pontos)
Para facilitar a leitura, compreensão e manipulação dos elementos, temos mais algumas sugestões:
1. Não use "." no nome. Porque em muitas linguagens de programação, "." é usado como atributo de um objeto, por exemplo: font.color. Pelo mesmo motivo, é melhor não usar "-". Se for necessário, substitua-o por "_";
2. Mantenha o nome o mais curto possível.
3. Tente usar o mesmo padrão para letras maiúsculas e letras maiúsculas de nomes.
4. O nome pode usar caracteres que não sejam do inglês, como o chinês. Mas alguns softwares podem não suportar isso. (O IE5 atualmente oferece suporte a elementos chineses.)
Além disso, adicione uma pequena explicação sobre as propriedades. Em HTML, atributos podem ser usados para definir o formato de exibição dos elementos. Por exemplo: <font color="red">word</font> exibirá a palavra em vermelho. Em XML, os atributos são apenas descrições de identificadores e não têm nada a ver com a exibição do conteúdo do elemento. Por exemplo, a mesma frase: <font color="red">word</font> não exibirá a palavra em vermelho. (Então, alguns internautas perguntarão: Como exibir texto em vermelho em XML? Isso requer o uso de CSS ou XSL, que descreveremos em detalhes a seguir.)
3. Sintaxe dos comentários
Comentários são adicionados ao documento XML para facilitar a leitura e compreensão, e não serão interpretados pelo programa nem exibidos pelo navegador.
A sintaxe para comentários é a seguinte:
<!-- Aqui estão as informações do comentário-->
Como você pode ver, é igual à sintaxe de comentários em HTML, o que é muito fácil. Desenvolver bons hábitos de comentários tornará seus documentos mais fáceis de manter, compartilhar e parecer mais profissionais.
4. Sintaxe de CDATA
O nome completo de CDATA é dados de caracteres, que é traduzido como dados de caracteres. Quando escrevemos documentos XML, às vezes precisamos exibir letras, números e outros símbolos, como "<". Em XML, esses caracteres já possuem significados especiais. Isso requer o uso da sintaxe CDATA. O formato da sintaxe é o seguinte:
<![CDATA[Coloque aqui os caracteres a serem exibidos]]>
Por exemplo:
<![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>
O conteúdo exibido na página será "<AUTHOR sex="female">ajie</AUTHOR>"
Capítulo 4 Sintaxe XML
5. Sintaxe de Namespaces
Namespaces se traduz em namespace. O que o namespace faz? Quando usamos arquivos DTD de outras pessoas ou vários arquivos DTD em um documento XML, haverá uma grande contradição: como os identificadores em XML são criados por nós mesmos, em diferentes arquivos DTD, os nomes dos identificadores podem ser iguais, mas têm significados diferentes. causar confusão de dados.
Por exemplo, em um documento <table>mesa de madeira</table>, <table> representa uma mesa.
Em outro documento <table>namelist</table>, <table> representa uma tabela. Se eu precisar trabalhar nos dois documentos ao mesmo tempo, ocorrerá um conflito de nomes.
Para resolver este problema, introduzimos o conceito de namespaces. Os namespaces distinguem esses identificadores com o mesmo nome adicionando uma URL ao nome do identificador.
Os namespaces também precisam ser declarados no início do documento XML. A sintaxe da declaração é a seguinte:
<documento xmlns:seunome='URL'>
Onde yourname é o nome dos namespaces definidos por você e URL é a URL do namespace.
Supondo que o documento "table <table>" acima venha de http://www.zhuozi.com, podemos declará-lo como
<documento xmlns:zhuozi='http://www.zhuozi.com'>
Em seguida, use o namespace definido nas tags subsequentes:
<zhuozi:table>mesa de madeira</table>
Isso distingue os dois <table>s. Nota: Definir o URL não significa que este logotipo realmente precise ser lido nesse URL, é apenas um sinal de distinção.
6. Sintaxe da entidade
Entidade é traduzida como "entidade". Sua função é semelhante à "macro" do Word, e também pode ser entendida como um modelo no DW. Você pode pré-definir uma entidade e depois chamá-la várias vezes em um documento, ou chamar a mesma entidade em vários documentos.
A entidade pode conter caracteres, texto, etc. Os benefícios de usar entidade são: 1. Pode reduzir erros. Múltiplas partes idênticas no documento só precisam ser inseridas uma vez. 2. Melhora a eficiência da manutenção. Por exemplo, se você tiver 40 documentos contendo entidades de direitos autorais, se precisar modificar esses direitos autorais, não será necessário modificar todos os arquivos. Você só precisará alterar a declaração da entidade originalmente definida.
XML define dois tipos de entidades. Uma é a entidade comum da qual estamos falando aqui, usada em documentos XML; a outra é a entidade de parâmetro, usada em arquivos DTD;
A sintaxe de definição de entidade é:
<!DOCTYPE nome do arquivo [
<!ENTITY nome-da-entidade "conteúdo-da-entidade"
]
>
Por exemplo, quero definir uma informação de direitos autorais:
<!DOCTYPE direitos autorais [
<!ENTITY copyright "Copyright 2001, Ajie. Todos os direitos reservados"
]
>
Se meu conteúdo de informações de direitos autorais for compartilhado com outras pessoas em um arquivo XML, também posso usar o método de chamada externa. A sintaxe é assim:
<!DOCTYPE direitos autorais [
<!ENTITY copyright SYSTEM "http://www.sample.com/copyright.xml">
]
>
A sintaxe de referência da entidade definida no documento é: &entity-name;
Por exemplo, as informações de copyright definidas acima são escritas como ?copyright quando chamadas.
O exemplo completo é o seguinte, você pode copiá-lo e salvá-lo como copyright.xml para visualizar o exemplo:
<?xml versão="1.0" codificação="GB2312"?>
<!DOCTYPE direitos autorais [
<!ENTITY copyright "Copyright 2001, Ajie. Todos os direitos reservados">
]>
<meuarquivo>
<título>XML</título>
<autor>ajie</autor>
<e-mail>[email protected]</email>
<data>20010115</data>
©certo;
</meuarquivo>
Capítulo 4 Sintaxe XML
7. Sintaxe DTD
DTD é um arquivo necessário para "documento XML válido". Usamos arquivos DTD para definir as regras e relacionamentos mútuos de elementos e identificadores no documento. Como criar um arquivo DTD? Vamos aprender juntos:
1. Definir elementos
Os elementos são os blocos básicos de construção de documentos XML. Você precisa definir um elemento no DTD e então usá-lo no documento XML. A sintaxe de definição de um elemento é: <!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>
ilustrar:
"<!ELEMENT" é uma declaração de um elemento, indicando que o que você deseja definir é um elemento;
“DESCRIÇÃO” após a instrução é o nome do elemento;
"(#PCDATA, DEFINITION)*>" é a regra de uso deste elemento. As regras definem quais elementos podem conter e como eles se relacionam entre si. A tabela a seguir descreve as regras para elementos:
2. Tabela de regras do elemento: