contorno:
Introdução
1. Termos relacionados a documentos XML
2. Termos relacionados ao DTD
Introdução
A coisa mais problemática para iniciantes aprenderem XML é que há muitos novos conceitos de terminologia para entender. Como o próprio XML também é uma tecnologia totalmente nova, ele está em constante desenvolvimento e mudança. As organizações e as principais empresas de rede (Microsoft, IBM, SUN, etc.) estão constantemente introduzindo seus próprios insights e padrões, por isso não é surpreendente que novos conceitos. estão voando por toda parte. Não existe nenhuma instituição ou organização autorizada na China para nomear oficialmente esses termos. A maioria dos livros chineses que você vê sobre XML são traduzidos com base no entendimento do próprio autor. Alguns estão corretos e outros estão errados, o que dificulta ainda mais o desenvolvimento do XML. compreensão e aprendizagem desses conceitos.
As explicações dos termos XML que você verá abaixo também são de compreensão e tradução do próprio autor. Ajie é baseado na especificação padrão XML1.0 lançada pela organização W3C e na documentação oficial relacionada. Pode-se assegurar que estes entendimentos estão basicamente corretos, pelo menos não errados. Se você quiser ler e entender mais, listei as fontes e links para recursos relevantes no final deste artigo, que você pode acessar diretamente. Ok, vamos ao que interessa:
1. Termos relacionados a documentos XML
O que é um documento XML? Você conhece o arquivo de código-fonte HTML? Um documento XML é um arquivo de código-fonte XML escrito com tags XML. Documentos XML também são arquivos de texto simples ASCII que você pode criar e modificar usando o Bloco de Notas. O nome do sufixo dos documentos XML é .XML, por exemplo, myfile.xml. Você também pode abrir diretamente o arquivo .xml usando navegadores IE5.0 ou superiores, mas o que você vê é o "código XML original" e o conteúdo da página não será exibido. Você pode tentar salvar o seguinte código como myfile.xml:
<?xml versão="1.0" codificação="GB2312"?>
<meuarquivo>
<title>Manual de aprendizagem fácil de XML</title>
<autor>ajie</autor>
<e-mail>[email protected]</email>
<data>20010115</data>
</meuarquivo>
Os documentos XML contêm três partes:
1. Uma declaração de documento XML;
2. Uma definição do tipo de documento;
3. Marque o conteúdo criado com XML.
Exemplo:
<?xml versão="1.0"?>
<!DOCTYPE lista de arquivos SYSTEM "filelist.dtd">
<lista de arquivos>
<meuarquivo>
<title>INÍCIO RÁPIDO DO XML</title>
<autor>ajie</autor>
</meuarquivo>
...
</filelist>
A primeira linha <?xml version="1.0"?> é a declaração de um documento XML. A segunda linha indica que este documento usa filelist.dtd para definir o tipo de documento.
Vamos entender os termos relevantes em documentos XML:
1.Elemento:
Já conhecemos o elemento em HTML. É a menor unidade que compõe um documento HTML, e é o mesmo em XML. Um elemento é definido por um identificador, incluindo um identificador inicial e final e seu conteúdo, como este: <author>ajie</author>
A única diferença é: em HTML a tag é fixa, mas em XML a tag precisa ser criada por você.
2.Tag (logotipo)
Identificadores são usados para definir elementos. Em XML, as tags devem aparecer em pares, circundando os dados. O nome do identificador é igual ao nome do elemento. Por exemplo, um elemento como este:
<autor>ajie</autor>
Onde <autor> é o identificador.
3. Atributo:
O que são propriedades? Veja este código HTML:<font color="red">palavra</font>. Dentre eles, a cor é um dos atributos da fonte.
Atributos são descrições e explicações adicionais do logotipo. Um logotipo pode ter vários atributos, como o atributo da fonte e o tamanho. Os atributos em XML são iguais aos atributos em HTML. Cada atributo tem seu próprio nome e valor. Exemplo:
<author sex="female">ajie</author>
Os atributos em XML também são definidos por si próprios. Recomendamos que você tente não usar atributos e transformá-los em subelementos. Por exemplo, o código acima pode ser alterado para isto:
<autor>ajie
<sexo>feminino</sexo>
</autor>
A razão é que os atributos não podem ser facilmente expandidos e manipulados pelos programas.
4.Declaração
Na primeira linha de todos os documentos XML existe uma declaração XML. Esta declaração indica que este documento é um documento XML e qual especificação de versão XML ele segue. Uma instrução de declaração XML se parece com isto:
<?xml versão="1.0"?>
5.DTD (definição de tipo de arquivo)
DTD é usado para definir elementos, atributos e relacionamentos entre elementos em documentos XML.
O arquivo DTD pode ser usado para detectar se a estrutura do documento XML está correta. Mas a criação de um documento XML não requer necessariamente um arquivo DTD. Descrições detalhadas dos arquivos DTD serão listadas separadamente abaixo.
6.XML bem formado (XML bem formado)
Um documento que obedece às regras de sintaxe XML e às especificações XML é chamado de "bem formado". Se toda a sua marcação estiver estritamente de acordo com a especificação XML, então o seu documento XML não precisará necessariamente de um arquivo DTD para defini-lo.
Um documento bem formado deve começar com uma declaração XML, como:
<?xml version="1.0" standalone="yes" encoding="UTF-8"?>
Dentre eles, deve-se indicar a versão XML que o documento atende, que atualmente é 1.0, em segundo lugar, explicar que o documento é “independente”, e em terceiro lugar não necessita de arquivo DTD para verificar se a identificação nele contida é válida; , você deve indicar a codificação do idioma utilizado no documento. O padrão é UTF-8. Se você usar chinês, será necessário configurá-lo para GB2312.
Um documento XML bem formado deve ter um elemento raiz, que é o primeiro elemento criado imediatamente após a declaração. Todos os outros elementos são elementos filhos deste elemento raiz e pertencem a um grupo de elementos raiz.
O conteúdo de um documento XML bem formado deve ser escrito em conformidade com a sintaxe XML. (Explicaremos a sintaxe XML em detalhes no próximo capítulo)
7.XML válido (XML válido)
Um documento XML que esteja em conformidade com as regras de sintaxe XML e com as especificações de arquivo DTD correspondentes é chamado de documento XML válido. Observe que comparamos "XML bem formado" e "XML válido
XML", a maior diferença entre eles é que um atende totalmente à especificação XML, enquanto o outro possui sua própria "Definição de Tipo de Documento (DTD)".
O processo de comparar um documento XML com seu arquivo DTD para verificar se ele está em conformidade com as regras do DTD é chamado de validação. Esse processo geralmente é controlado por um software chamado analisador.
Um documento XML válido também deve começar com uma declaração XML, por exemplo:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
Diferente do exemplo acima, no atributo standalone (independente), "no" é definido aqui porque deve ser usado com o DTD correspondente. O arquivo DTD é definido da seguinte forma:
<!DOCTYPE tipo de documento SYSTEM/PUBLIC "dtd-name">
em:
"!DOCTYPE" significa que você deseja definir um DOCTYPE;
"type-of-doc" é o nome do tipo de documento, definido por você, geralmente igual ao nome do arquivo DTD;
Utilize apenas um dos dois parâmetros "SYSTEM/PUBLIC". SYSTEM refere-se à URL do arquivo DTD privado usado pelo documento, enquanto PUBLIC refere-se à URL do arquivo DTD público usado pelo documento.
"dtd-name" é o URL e o nome do arquivo DTD. Todos os arquivos DTD possuem o sufixo ".dtd".
Ainda usamos o exemplo acima, ele deve ser escrito assim:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
2. Termos relacionados ao DTD
O que é DTD, mencionamos brevemente acima. DTD é um método eficaz para garantir que o formato do documento XML esteja correto. Você pode comparar o documento XML e o arquivo DTD para ver se o documento está em conformidade com a especificação e se os elementos e tags são usados corretamente. Um documento DTD contém: as regras de definição de elementos, as regras de definição de relacionamentos entre elementos, os atributos que podem ser usados pelos elementos e as regras de entidades ou símbolos que podem ser usados.
O arquivo DTD também é um arquivo de texto ASCII com o sufixo .dtd. Por exemplo: meuarquivo.dtd.
Por que usar arquivos DTD? Meu entendimento é que ele atende ao compartilhamento de rede e à interação de dados. O maior benefício do uso do DTD é o compartilhamento de arquivos DTD. (Este é o atributo PUBLIC na instrução de descrição do DTD acima). Por exemplo, se duas pessoas no mesmo setor e em regiões diferentes usarem o mesmo arquivo DTD como especificação de criação de documento, seus dados poderão ser facilmente trocados e compartilhados. Se outras pessoas na Internet quiserem adicionar dados, elas só precisam criar um documento de acordo com a especificação pública do DTD e podem aderir imediatamente.
Atualmente, já existe um grande número de arquivos DTD escritos disponíveis. Visando diferentes indústrias e aplicações, esses arquivos DTD estabeleceram elementos comuns e regras de rótulo. Você não precisa recriá-los sozinho, basta adicionar os novos logotipos necessários com base neles.
Claro, se quiser, você pode criar seu próprio DTD, que pode corresponder mais perfeitamente ao seu documento. Criar seu próprio DTD também é muito simples. Geralmente, você só precisa definir de 4 a 5 elementos.
Existem duas maneiras de chamar um arquivo DTD:
1. DTD contido diretamente no documento XML
Tudo que você precisa fazer é inserir algumas instruções especiais na declaração DOCTYPE, como esta:
Temos um documento XML:
<?xml versão="1.0" codificação="GB2312"?>
<meuarquivo>
<title>Manual de aprendizagem fácil de XML</title>
<autor>ajie</autor>
</meuarquivo>
Apenas inserimos o seguinte código após a primeira linha:
<!DOCTYPE meuarquivo [
<!ELEMENT título (#PCDATA)>
<!ELEMENT autor (#PCDATA)>
<!Direitos autorais da ENTIDADE "Copyright 2001, Ajie.">
]>
2. Chame um arquivo DTD independente
Salve o documento DTD como um arquivo .dtd e chame-o na linha de declaração DOCTYPE. Por exemplo, salve o código a seguir como myfile.dtd.
<!ELEMENT meuarquivo (título, autor)>
<!ELEMENT título (#PCDATA)>
<!ELEMENT autor (#PCDATA)>
Em seguida chame-o no documento XML, inserindo após a primeira linha:
<!DOCTYPE meuarquivo SYSTEM "meuarquivo.dtd">
Podemos ver que as chamadas para js em documentos DTD e HTML são semelhantes. Em relação a como escrever documentos DTD, iremos apresentá-las junto com a sintaxe dos documentos XML no próximo capítulo.
Vamos aprender sobre a terminologia relacionada ao DTD:
1. Esquema (Planejamento)
Esquema é uma descrição de regras de dados. O esquema faz duas coisas:
a. Define o tipo de dados do elemento e o relacionamento entre os elementos;
b. Define o tipo de conteúdo que o elemento pode conter.
DTD é um esquema para documentos XML.
2.Árvore de Documentos
Já mencionamos a “árvore de documentos” no Capítulo 2. É uma representação de imagem da estrutura hierárquica dos elementos do documento. Uma árvore de estrutura de documento contém o elemento raiz, que é o elemento de nível superior (ou seja, o primeiro elemento imediatamente após a instrução de declaração XML). Veja o exemplo:
<?xml versão="1.0"?>
<lista de arquivos>
<meuarquivo>
<título>...</título>
<autor>...</autor>
</meuarquivo>
</filelist>
O exemplo acima está organizado em uma estrutura de três níveis em formato de "árvore", na qual <filelist> é o elemento raiz. Em arquivos XML e DTD, o primeiro elemento definido é o elemento raiz.
3.Elemento Pai/Elemento Filho
Um elemento pai é um elemento que contém outros elementos, e o elemento contido é chamado de elemento filho. Observe a "árvore de estrutura" acima, onde <myfile> é o elemento pai, <title>, <author> são seus elementos filhos e <myfile> é o elemento filho de <filelist>. Os elementos de último nível que não contêm elementos filhos como <title> também são chamados de "elementos de página".
4.Parser (software de análise)
Parser é uma ferramenta de software que verifica se os documentos XML estão em conformidade com as especificações DTD.
Os analisadores XML foram desenvolvidos em duas categorias: uma é o "analisador de não confirmação", que detecta apenas se o documento está em conformidade com as regras de sintaxe XML e se a árvore do documento é estabelecida com identificadores de elementos. O outro é o "paeser de classe de confirmação", que não apenas detecta a sintaxe do documento e a árvore de estrutura, mas também compara e analisa se os identificadores de elemento usados atendem às especificações do arquivo DTD correspondente.
O analisador pode ser usado de forma independente ou como parte de um software de edição ou navegador. Na lista de recursos relacionados a seguir, listei alguns dos analisadores atualmente populares.
Ok, através do estudo do Capítulo 3, aprendemos alguns termos básicos de XML e DTD, mas ainda não sabemos como escrever esses arquivos e que tipo de sintaxe precisa ser seguida. No próximo capítulo, focaremos. na escrita de XML e sintaxe de documentos DTD. Continue navegando, obrigado!