第四章XML語法
提綱:
一.XML語法規則二.元素的語法三.註解的語法四.CDATA的語法五.Namespaces的語法六.entity的語法七.DTD的語法
透過前面三章的學習,我們已經對什麼是XML,它的實現原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規範,動手寫自己的XML文件。
一.XML語法規則
XML的文檔和HTML的原始碼類似,也是用識別來識別內容。建立XML文件必須遵守下列重要規則:
規則1:必須有XML宣告語句這一點我們在上一章學習時已經提到過。聲明是XML文件的第一句,其格式如下:
<?xml version="1.0" standalone="yes/no" encoding="UTF-8"?>
聲明的作用是告訴瀏覽器或其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文件遵守的XML規範的版本;standalone表示文件是否附帶DTD文件,如果有,參數為no;encoding表示文件所使用的語言編碼,預設為UTF-8。
規則2:是否有DTD文件如果文檔是一個"有效的XML文檔"(見上一章),那麼文檔一定要有相應DTD文件,並且嚴格遵守DTD文件製定的規範。 DTD檔案的聲明語句緊接在XML聲明語句後面,格式如下:
<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">
其中:
"!DOCTYPE"是指你要定義一個DOCTYPE;
"type-of-doc"是文件類型的名稱,由你自己定義,通常於DTD檔名相同;
"SYSTEM/PUBLIC"這兩個參數只用其一。 SYSTEM是指文件所使用的私有DTD檔案的網址,而PUBLIC則指文件呼叫一個公用的DTD檔案的網址。
"dtd-name" 就是DTD檔案的網址和名稱。所有DTD檔案的後綴名為".dtd"。
我們還是用上面的例子,應該寫成這樣:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
規則3:注意你的大小寫在XML文件中,大小寫是有差別的。 <P>和<p>是不同的標識。注意在寫入元素時,前後標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。
你最好養成一種習慣,或全部大寫,或全部小寫,或大寫第一個字母。這樣可以減少因為大小寫不符合所產生的文件錯誤。
規則4:給屬性值加引號在HTML程式碼裡面,屬性值可以加引號,也可以不加。例如:<font color=red>word</font>和<font color="red">word</font>都可以被瀏覽器正確解釋。
但在XML中則規定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。
規則5:所有的標識必須有對應的結束標識在HTML中,標識可能不是成對出現的,比?lt;br>。而在XML中規定,所有標識必須成對出現,有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。
規則6:所有的空標識也必須關閉空標識就是標識對之間沒有內容的標識。如<br>,<img>等標識。在XML中,規定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最後加/,就可以了。例如:
<br>應寫成<br />;
<META name="keywords" content="XML, SGML, HTML">應寫成<META name="keywords" content="XML, SGML, HTML" />;
<IMG src= "cool.gif">應寫為<IMG src= "cool.gif" />
第四章XML語法
二.元素的語法
元素由一對標識以及其中的內容組成。就像這樣:ajie。元素的名稱和識別的名稱是一樣的。標識可以用屬性來進一步描述。
在XML中,沒有任何保留字,所以你可以隨心所欲的用任何字眼來當作元素名稱。但也必須遵守下列規範:
1.名稱中可以包含字母、數字以及其它字母;
2.名稱不能以數字或"_" (底線)開頭;
3.名稱不能以字母xml(或XML 或Xml ..)開頭
4.名稱中不能包含空格
5.名稱中間不能包含":"(冒號)
為了使元素更容易閱讀理解和操作,我們還有一些建議:
1.名稱中不要使用"."。因為在很多程式語言中,"."是作為物件的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替;
2.名稱盡量簡短。
3.名稱的大小寫盡量採用同一標準。
4.名稱可以使用非英文字符,例如用中文。但是有些軟體可能不支援。 (IE5目前是支援中文元素的。)
另外,補充一點關於屬性的說明。在HTML中,屬性可以用來定義元素的顯示格式,例如:<font color="red">word</font>將把word顯示為紅色。而在XML中,屬性只是對標識的描述,與元素內容的顯示無關。例如同樣一句:<font color="red">word</font>,並不會將word顯示為紅色。 (那麼,有網友會問:如何在XML中將文字顯示為紅色呢?這就需要使用CSS或XSL,我們在下面詳細講述。)
三.註釋的語法
註釋是為了便於閱讀和理解,在XML文件中添加的附加信息,將不會被程式解釋或則瀏覽器顯示。
註解的語法如下:
<!-- 這裡是註解資訊-->
可以看到,它和HTML中的註解語法是一樣的,非常容易。養成良好的註解習慣將使你的文件更加便於維護,共享,看起來也更專業。
四.CDATA的語法
CDATA全名為character data,翻譯為字元資料。我們在寫XML文件時,有時需要顯示字母,數字和其它的符號本身,例如"<",而在XML中,這些字元已經有特殊的含義,我們該怎麼辦呢?這就需要用到CDATA語法。文法格式如下:
<![CDATA[這裡放置需要顯示的字元]]>
例如:
<![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>
頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>"
第四章XML語法
五.Namespaces的語法
Namespaces翻譯為名字空間。名字空間有什麼作用呢?當我們在一個XML文件中使用他人的或多個DTD文件,就會出現這樣的矛盾:因為XML中標識都是自己創建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數據混亂。
例如在一個文件<table>wood table</table>中<table>表示桌子,
而在另一個文件<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發生名字衝突。
了解決這個問題,我們引進了namespaces這個概念。 namespaces透過為識別名稱加一個網址(URL)定位的方法來區分這些名稱相同的識別。
Namespaces同樣需要在XML文件的開頭部分聲明,聲明的語法如下:
<document xmlns:yourname='URL'>
其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。
假設上面的"桌子<table>"文件來自http://www.zhuozi.com,我們就可以聲明為
<document xmlns:zhuozi='http://www.zhuozi.com'>
然後在後面的標誌中使用定義好的名字空間:
<zhuozi:table>wood table</table>
這樣就將這兩個<table>區分開來。注意的是:設定URL並不是說這個標識真的要到那個網址去讀取,只是作為一種區別的標誌而已。
六.entity的語法
entity翻譯為"實體"。它的作用類似word中的"宏",也可以理解為DW中的摸板,你可以預先定義一個entity,然後在一個文檔中多次調用,或者在多個文檔中調用同一個entity。
entity可以包含字符,文字等等,使用entity的好處是:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。 2.它提高維護效率。例如你有40個文件都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改原先定義的entity語句就可以了。
XML定義了兩種類型的entity。一種是我們在這裡說的普通entity,在XML文件中使用;另一種是參數entity,在DTD文件中使用。
entity的定義語法為:
<!DOCTYPE filename [
<!ENTITY entity-name "entity-content"
]
>
例如我要定義一段版權資訊:
<!DOCTYPE copyright [
<!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"
]
>
如果我的版權資訊內容和他人共享一個XML文件,也可以使用外部呼叫的方法,語法像這樣:
<!DOCTYPE copyright [
<!ENTITY copyright SYSTEM "http://www.sample.com/copyright.xml">
]
>
定義好的entity在文件中的引用語法為:&entity-name;
例如,上面定義的版權訊息,調用時寫作?copyright;
完整的例子如下,你可以copy下來存成copyright.xml觀看實例:
<?xml version="1.0" encoding="GB2312"?>
<!DOCTYPE copyright [
<!ENTITY copyright "Copyright 2001, Ajie. All rights reserved">
]>
<myfile>
<title>XML</title>
<author>ajie</author>
<email>[email protected]</email>
<date>20010115</date>
©right;
</myfile>
第四章XML語法
七.DTD的語法
DTD是"有效XML文檔"的必須文件,我們透過DTD文件來定義文檔中元素和標識的規則及相互關係。如何建立一個DTD檔呢?讓我們一起來學習:
1.設定元素
元素是XML文件的基本組成部分。你要在DTD中定義一個元素,然後在XML文件中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>
說明:
"<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素;
宣告後面的"DESCRIPTION",是元素的名稱;
"(#PCDATA, DEFINITION)*>"則是該元素的使用規則。規則定義了元素可以包含的內容以及相互的關係。下面的表格概要列出了元素的規則:
2.元素規則表: