作者:馬曉寧
xml(可擴展標記語言)看起來可能像某種w3c標準-現在沒有什麼實際影響,即使以後能派上用場,也是很久以後的事。但實際上,它現在已經被應用了。所以,不要等到xml已經被加進了你最愛的html編輯器才開始使用它。現在它就可以解決各種內部問題和b2b系統問題。
在sparks.com,我們使用xml來標準化從java物件到html資料顯示等不同系統之間的資料表示。
特別要指出的是,我們發現,只要以非常基本的xml結構來實現標準化,就可以更容易共享和操作資料。在這過程中,我們發現了許多使用xml的有效方法。以下詳細介紹我們現在的應用。
標準化在使用xml之前,建立與你要使用的資訊不同的xml資料格式。
產生動態xml
從資料庫產生html並不新鮮,但產生xml卻很新鮮。這裡我們介紹具體的生成步驟。
用xsl當模板語言
xsl(可擴充樣式表語言)是定義xml資料顯示格式的好方法,如果寫成幾個靜態範本會更有效。
產生html
xml加上xsl等於html。這聽起來似乎不對,但使用者所見的我們的html頁面其實就是xml和xsl共同產生的效果。
一、標準化
xml的能力來自於它的彈性。但不幸的是,它有時太靈活了,以至於你會面對一個空白的頁面,煩惱該怎麼解決問題。
在任何xml的專案中,第一步工作都是建立標準的資料格式。為此你要做出以下決定:
• 要涉及哪些數據
• 是否要使用dtd(檔案類型定義)
• 是否要使用dom(文檔物件模型)或sax(xml的簡化api)解析
確定資料:
因為沒有標準的xml格式,開發者可以自由地發展自己的格式。然而,如果你的格式只能被一個應用程式識別,那麼你只能執行這個程式來使用該格式。如果還有其他程式也能讀懂你的xml格式,那顯然會更有幫助。如果某個xml格式被修改,則使用它的系統可能也需要被修改,所以你應該要建立盡可能完整的格式。因為大多數系統忽略它們無法識別的標籤,所以改變一個xml格式的最安全的方法是添加標籤,而不是修改標籤。
點擊此處查看xml資料格式實例
在sparks.com,我們查看了不同的產品展示所需的所有產品資料。儘管並不是所有的頁面都使用全部數據,但我們還是由此開發出適用於所有數據的非常完整的xml數據格式。例如,我們的產品明細資訊頁面顯示的資料比產品瀏覽頁面多。然而,我們在這兩種情況下仍然使用相同的資料格式,因為每個頁面的xsl模板都只使用它所需的欄位。
是否使用dtd
在sparks.com,我們使用組織良好的xml,而不使用只是正確的xml,因為前者不需要dtd。 dtd在使用者點擊和看到頁面之間加入了一個處理層。我們發現這一層需要太多的處理。當然,以xml格式與其他公司通訊時,使用dtd還是很不錯的。因為dtd能在發送和接受時能保證資料結構正確。
選擇解析引擎現在,可以使用的解析引擎有好幾個。選擇哪一個幾乎完全取決於你的應用需求。如果你決定使用dtd,那麼這個解析引擎必須能讓你的xml被dtd驗證。你可以將驗證另放到一個進程中,但那樣會影響效能。
sax和dom是兩個基本的解析模型。 sax是基於事件,所以在xml被解析時,事件被傳送給引擎。接下來,事件與輸出檔案同步。 dom解析引擎為動態xml資料和xsl樣式表建立層次樹狀結構。透過隨機存取dom樹,可以提供xml數據,就像由xsl樣式表決定一樣。 sax模型上的爭論主要集中在對dom結構的記憶體降低過度和加快xsl樣式表解析時間縮短方面。
然而,我們發現使用sax的許多系統並沒有充分發揮它的能力。這些系統用它來建立dom結構並透過dom結構來發送事件。用這種方法,在任何xml處理之前必須從樣式表建立dom,所以效能會下降。
二、產生動態xml
一旦建立了xml格式,我們就需要一種能夠將其從資料庫動態移植的方法。
產生xml文件相對來說比較簡單,因為它只需要一個可以處理字串的系統。我們建立了一個使用java servlet、enterprise javabean server、jdbc和rdbms(關係型資料庫管理系統)的系統。
• servlet透過把產生xml文件的任務交給enterprise javabean (ejb)來處理產品資訊請求。
• ejb使用jdbc從資料庫查詢所需的產品詳細資料。
• ejb產生xml檔並把它傳遞給servlet。
•servlet呼叫解析引擎,從xml檔和靜態的xsl樣式表建立html輸出。
(有關xsl應用的其他信息,請參閱用xsl作為模板語言。)
生成xml的例子在java中創建xml文檔字符串的真正代碼可以分成幾個方法和類別。
啟動xml產生過程的程式碼放在ejb方法裡。這個實例會立即建立一個stringbuffer,以便儲存產生的xml字串。
stringbuffer xml = new stringbuffer();
xml.append(xmlutils.begindocument("/browse_find/browse.xsl", "browse", request));
xml.append(product.toxml());
xml.append(xmlutils.enddocument("browse");
out.print(xml.tostring());
後面的三個xml.append()變元本身就是對其他方法的呼叫。
產生檔案頭第一個附加方法呼叫xmlutils類別來產生xml檔案頭。我們的java servlet中的程式碼如下:
public static string begindocument(string stylesheet, string page)
{
stringbuffer xml = new stringbuffer();
xml.append("<?xml version="1.0"?>n")
.append("<?xml-stylesheet href="")
.append(stylesheet).append(""")
.append(" type ="text/xsl"?>n");
xml.append("<").append(page).append(">n");
return xml.tostring();
}
這段程式碼產生了xml檔頭。 <?xml>標籤把本文件定義為支援1.0版本的xml檔。第二行程式碼指向使用以顯示資料的正確樣式表的位置。最後包含進去的是項目級標籤(本實例為<browse>)。在檔案末尾,只有<browse>標籤需要被關閉。
<?xml version="1.0"?> <?xml-stylesheet href="/browse_find/browse.xsl" type="text/xsl"?> <browse>
填入產品資訊完成了檔案頭後,控制方法會呼叫java物件來產生它的xml。本例中呼叫的是product物件。 product物件使用兩個方法來產生它的xml表示。第一個方法toxml()透過產生<product>和</product>標籤來建立product節點。然後它會呼叫internalxml(),這樣就能提供產品xml所需的內容。 internalxml()是一系列的stringbuffer.append()呼叫。 stringbuffer也被轉換成字串並傳回給控制方法。
public string toxml()
{
stringbuffer xml = new stringbuffer("<product>n");
xml.append(internalxml());
xml.append("</product>n");
return xml.tostring();
}
public string internalxml()
{
stringbuffer xml = new
stringbuffer("t")
.append(producttype).append("n");
xml.append("t").append(idvalue.trim())
.append("n");
xml.append("t").append(idname.trim())
.append("n");
xml.append("t").append(page.trim())
.append("n");
厖?
xml.append("t").append(amount).append("n");
xml.append("t").append(vendor).append("n");
xml.append("tn");
xml.append("t").append(pubdesc).append("n");
xml.append("t").append(vendesc).append("n";
厖?
return xml.tostring();
}
關閉檔案最後,xmlutils.enddocument()方法被呼叫。這個呼叫關閉xml標籤(本例中為),最後完成架構好的xml檔。來自控制方法的整個stringbuffer也轉換成字串,並傳回給處理最初http請求的servlet。
三、用xsl當模板語言
為了得到html輸出,我們把產生的xml檔和控制xml資料如何表示的xsl模板結合。我們的xsl模板由精心組織的xsl和html標籤組成。
開始建模板我們的xsl模板開始部分與下面這段程式碼類似。第一行程式碼為必要程式碼,將本檔案定義為xsl樣式表。 xmlns:xsl=屬性引用本檔案所使用的xml名稱空間,而version=屬性則定義名稱空間的版本號。在文件的末尾,我們關閉標籤。
由<xsl:template>開始的第二行程式碼確定了xsl模板的模式。 match屬性是必需的,在這裡指向xml標籤<basketpage>。在我們的系統裡,<basketpage>標籤裡包含<product> 標籤,這使得xsl模板可以存取嵌在<product>標籤內的產品資訊。我們又一次必須在檔案結尾關閉<xsl:template>標籤。
接下來,我們來看看組織良好的html。由於它將被xml解析引擎處理,所以必須符合組織良好的xml的所有規則。從本質上來講,這意味著所有的開始標籤必須有對應的結束標籤。例如,通常不被結束的<p>標籤,必須用</p>關閉。
<xsl:stylesheet xmlns:xsl=" http://www.w3.org/1999/xsl/transform "
version="1.0">
<xsl:template match="basketpage">
<html>
<head>
<title>shopping bag / adjust quantity</title>
</head>
<body bgcolor="#cccc99" bgproperties="fixed" link="#990000" vlink="#990000">
<br>
?br> </xsl:template>
</xsl:stylesheet>
在模板的主體內,有許多xsl標籤被用來為資料表示提供邏輯。下面解釋兩個常用的標籤。
choose
<xsl:choose>標籤類似於傳統程式語言中if-then-else結構的開始部分。在xsl中,choose標籤表示在程式碼進入的部分中,賦值會觸發動作的發生。擁有賦值屬性的<xsl:when>標籤跟在choose標籤後面。如果賦值是正確的,位於<xsl:when>的開始和結束標籤之間的內容將會被使用。如果賦值錯誤,就使用<xsl:otherwise>的開始和結束標籤之間的內容。整個部分用</xsl:choose>來結束。
在這個例子裡,when標籤會為quantity標籤檢查xml。如果quantity標籤裡含有值為真的error屬性,quantity標籤將會顯示列在下面的表格單元。如果屬性的值不為真,xsl將會顯示otherwise標籤間的內容。在下面的實例裡,如果error屬性不真,則什麼都不會被顯示。
<xsl:choose>
<xsl:when test="quantity[@error='true']">
<td bgcolor="#ffffff"><img height="1" width="1" src="