<p>これは段落です。<br>
XML では、終了タグを省略することはできません。すべての要素には終了タグが必要です。
<?xml バージョン="1.0" エンコーディング="UTF-8" ?>
<p>これは段落です。</p>
注:上記の例から、XML の最初の行の宣言に終了タグがないことに気づいたかもしれません。これはエラーではありません。宣言は XML ドキュメント自体の一部ではなく、終了タグ。
XML タグでは大文字と小文字が区別されます。タグ <Message> はタグ <message> とは異なります。
開始タグと終了タグは同じ大文字と小文字を使用して記述する必要があります。
<メッセージ>これは間違っています</メッセージ><メッセージ>これは正しい</メッセージ>
注:開始タグと終了タグは、多くの場合、開始タグと終了タグと呼ばれます。どちらの用語を好む場合でも、コンセプトは同じです。
HTML では、正しくネストされていない要素がよく見られます。
<b><i>このテキストは太字で斜体です</b></i>
XML では、すべての要素が相互に適切にネストされている必要があります。
<b><i>このテキストは太字で斜体です</i></b>
上の例では、正しい入れ子とは、 <i> 要素が <b> 要素内で開かれているため、 <b> 要素内で閉じる必要があることを意味します。
XML ドキュメントには、他のすべての要素の親となる要素が 1 つ必要です。この要素はルート要素と呼ばれます。
<ルート><子><サブ子>....</サブ子></子></ルート>
HTML と同様に、XML 要素は属性 (名前と値のペア) を持つことができます。
XML では、XML 属性値を引用符で囲む必要があります。
次の 2 つの XML ドキュメントを学習してください。 1 つ目は間違っていますが、2 つ目は正しいです。
<note date=12/11/2007><to>トーベ</to><from>ジャニ</from></note>
<note date="12/11/2007"><to>トーベ</to><from>ジャニ</from></note>
最初の文書のエラーは、note 要素の date 属性が引用符で囲まれていないことです。
XML では、一部の文字には特別な意味があります。
XML 要素内に文字「<」を入れると、パーサーはそれを新しい要素の始まりとして扱うため、エラーが発生します。
これにより、XML エラーが生成されます。
<message>給与 < 1000 の場合</message>
このエラーを回避するには、「<」文字の代わりにエンティティ参照を使用します。
<メッセージ>給与<の場合1000 なら</message>
XML には、5 つの事前定義されたエンティティ参照があります。
<; | < | 未満 |
> | > | より大きい |
& | & | アンパサンド |
' | ' | アポストロフィ |
「 | 」 | 引用符 |
注: XML では、文字 "<" と "&" のみが実際に不正です。大なり記号は使用できますが、実体参照に置き換えることをお勧めします。
XML でコメントを記述するための構文は、HTML の構文と非常によく似ています。
<!-- これはコメントです -->
ヒント: 「HTML<!--...-->コメント タグ」についても学習できます。
HTML は、複数の連続するスペース文字を 1 つにトリミング (マージ) します。
HTML: | こんにちは、トーベ |
出力: | こんにちは、トーベ |
XML では、ドキュメント内の空白は削除されません。
Windows アプリケーションでは、改行は通常、キャリッジ リターン (CR) とライン フィード (LF) のペアの文字として保存されます。
Unix および Mac OSX では、LF を使用して新しい行を保存します。
古い Mac システムでは、新しい行を保存するために CR が使用されます。
XML は改行を LF に格納します。
上記は、XML を使用するときに注意する必要がある文法規則です。正しい XML ドキュメントを作成するには、これらの規則に従ってください。