孟憲會
由於XML(可擴展標記語言:eXtensible Markup Language)真正的平台無關性,它正在逐漸成為資料傳輸的主要媒體。 XML是一種自我描述的語言,資料本身就已經包含了元數據,也就是關於資料本身的資訊。例如:「孟子E章1757281793923net_lover1807581793923」這組數據,從字面很難看出它代表什麼意思,也不清楚它有幾個數據段組成,但是,如果用XML來做如下的描述,我們就可以清楚地看到每個資料段所代表的含義:
<姓名>孟子E章姓名>
<身高>175身高>
<體重>72體重>
<電話>81793923電話>
<姓名>net_lover姓名>
<身高>180身高>
<體重>75體重>
<電話>81793923電話>
從上面的一段XML中,我們不但可以清楚地看到每一個資料代表的是什麼意思了,而且還可以知道資料的分割位置。在我們平常的應用中,我們得到的結果可能是陣列、集合或記錄集的表現形式,我們該如何把它們轉換成自描述的XML格式的資料呢?從資料形式來看,XML是簡單的純字串的文字格式,字串在傳遞時是非常簡單、快速且是容易的,數組在透過引用進行傳遞時有時是很慢的,而且處理起來很麻煩,而集合和記錄集都是對象,在處理時會導致計算機性能的下降, 而這些對像都是與特定的平台相關聯的,這就要求平台有內建的處理機制來處理對象的操作。 XML已經是W3C的標準,是平台無關的,我們的電腦的唯一要求就是能夠處理簡單的XML字串,即XML解析器,它能夠解析XML字串,能夠透過一種介面很容易地把資料分解成一個獨立的資料段,以便我們能夠進行存取。 XML解析器都很小,效能也很好,在每種平台上都可以找到。一旦我們接收到XML資料並把它解析成上面的範例的樣式後,我們就可以透過XSLT (eXstensible Stylesheet Language Transformations)把他們轉換成不同的表現形式。利用XML的資料格式進行資料傳輸,將使我們編寫應用程式程式碼的工作更簡單輕鬆,而且具有良好的可擴展性。
下面,我們就來看看如何來轉換我們的資料。我們的例子是在Microsoft Windows 2000,IIS5,MSXML3和ADO2.6下編寫的,範例資料採用Microsoft SQL Server7.0自帶的Northwind範例資料庫。之所以採用SQL Server7而不採用支援XML的SQL Server2000,是考慮到通用性的原則,我們的目的是:處理不同類型的資料來源所得到的記錄集,而不僅僅是像SQL Server2000那樣的支援XML輸出的資料來源。使用ADO,是因為它形式多樣,可以處理不同類型的資料來源;使用XML,因為它能夠快速傳輸和解析。但本例的處理方法也適合在任何具有Micrsoft XML解析器,ADO2.5以上版本的Windows,IIS,SQL Server的環境中。
為簡單起見,我們只選擇單價小於等於20美圓,庫存大於等於20,產品名稱小於等於6個字元的產品:
<%
Dim objRecordset
Set objRecordset = Server.CreateObject("ADODB.Recordset")
objRecordset.open _
"SELECT ProductName, UnitPrice, UnitsInStock " _
& "FROM Products " _
& "WHERE UnitPrice <= 20 " _
& "AND UnitsInStock >= 20 " _
& "AND LEN(ProductName) <= 6 " _
& "ORDER BY ProductName", _
"Provider=SQLOLEDB;" _
& "Data Source=SomeSQLServer;" _
& "Initial Catalog=Northwind;" _
& "User ID=MyUserName;" _
& "Password=MyPassword;"
%>
現在,我們就用3種方式把我們得到的記錄集轉換成XML格式。
首先,我們可以遍歷整個記錄集,採用XML DOM(Document Object Model),建立XML節點樹:
<%
Dim objXMLDOM, objRootNode, objNode
Set objXMLDOM = Server.CreateObject("MSXML2.DOMDocument")
Set objRootNode = objXMLDOM.createElement("xml")
objXMLDOM.documentElement = objRootNode
Do While NOT objRecordset.EOF
Set objRowNode = objXMLDOM.createElement("row")
Set objNode = objXMLDOM.createElement("ProductName")
objNode.text = objRecordset.Fields.Item("ProductName").Value
objRowNode.appendChild(objNode)
Set objNode = objXMLDOM.createElement("UnitPrice")
objNode.text = objRecordset.Fields.Item("UnitPrice").Value
objRowNode.appendChild(objNode)
Set objNode = objXMLDOM.createElement("UnitsInStock")
objNode.text = objRecordset.Fields.Item("UnitsInStock").Value
objRowNode.appendChild(objNode)
objRootNode.appendChild(objRowNode)
objRecordset.MoveNext
Loop
Set objNode = Nothing
Set objRowNode = Nothing
Set objRootNode = Nothing
Set objRecordset = Nothing
%>
現在,我們就得到了一個XML DOM物件。這種方法對於記錄集很大時效能並不理想,因為系統記憶體中要同時保存ADO記錄集物件和XML DOM物件。
第二個辦法,遍歷記錄集,直接產生XML字串本身:
<%
Dim strXML
strXML = "
objRecordset.MoveFirst
Do While NOT objRecordset.EOF
strXML = strXML & "
strXML = strXML & "
& objRecordset.Fields.Item("ProductName").Value _
& "
strXML = strXML & "
& objRecordset.Fields.Item("UnitPrice").Value _
& "
strXML = strXML & "
& objRecordset.Fields.Item("UnitsInStock").Value _
& "
strXML = strXML & "
objRecordset.MoveNext
Loop
strXML = strXML & "
Set objRecordset = Nothing
%>
但是,以上兩種方法最大的缺陷是無法能夠重複使用程式碼,我們把節點的名字都寫死了,如果我們進行不同欄位的查詢,我們還必須手動更改我們的程式碼,以滿足不同節點的需要。我們下面的方法將變得更加通用。
第三種方法:可重複使用的方法。
<%
Dim strXML
strXML = "
objRecordset.MoveFirst
Do While NOT objRecordset.EOF
strXML = strXML & "
For Each varItem In objRecordset.Fields
strXML = strXML _
& "<" & varItem.name & ">" _
& varItem.value _
& "" & varItem.name & ">"
Next
strXML = strXML & "
objRecordset.MoveNext
Loop
strXML = strXML & "
Set objRecordset = Nothing
%>
一個更有效的方法,我們可以直接利用記錄集內建的save方法,它能夠自動地把記錄集的內容轉換成XML格式,我們呼叫save方法後,我們就可以立即釋放記憶體中的記錄集物件實例。 save方法有兩個參數:一個是XML要保存的地方,一個是指示符,標明資料以何種格式儲存。我們可以把資料保存成XML DOM物件(ADO STREAM物件),也可以直接儲存成ASP RESPONSE對象,為通用起見,我們儲存成XML DOM,第二個參數用adPersistXML ADO常數。方法如下:
<%
Const adPersistXML = 1
Dim objXMLDOM
Set objXMLDOM = Server.CreateObject("MSXML2.DOMDocument.3.0")
objRecordset.save objXMLDOM, adPersistXML
Set objRecordset = Nothing
%>
這種方法方便快捷,而且不容易出錯,對不同的查詢,也不用手動更改節點名字。但是,這種方法產生的XML不夠簡潔,看看它產生的結果:
xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882"
xmlns:rs="urn:schemas-microsoft-com:rowset"
xmlns:z="#RowsetSchema">
content="eltOnly"
rs:CommandTimeout="30">
rs:number="1"
rs:writeunknown="true">
dt:maxLength="40"
rs:maybenull="false"/>
rs:number="2"
rs:nullable="true"
rs:writeunknown="true">
rs:dbtype="currency"
dt:maxLength="8"
rs:precision="19"
rs:fixedlength="true"/>
rs:number="3"
rs:nullable="true"
rs:writeunknown="true">
dt:maxLength="2"
rs:precision="5"
rs:fixedlength="true"/>
UnitPrice="18"
UnitsInStock="39"/>
UnitPrice="6"
UnitsInStock="24"/>
UnitPrice="23.25"
UnitsInStock="35"/>
ADO 自動產生的XML包含了schema訊息,它描述這個XML裡允許有什麼節點和屬性以及採用何種資料類型,而且資料節點也增加了名稱空間。 schema資訊在需要資料驗證的地方或進行更複雜的處理或許很有用,但是,大多數情況下,我們使用的是瘦客戶機,我們不需要schema資訊。我們可以利用XSLT來分離出我們想要的訊息,去掉多餘的訊息。因此,我們寫下面的「 DataCleaner.xsl」:
xmlns:s="uuid:BDC6E3F0-6DA3-11d1-A2A3-00AA00C14882"
xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882"
xmlns:rs="urn:schemas-microsoft-com:rowset"
xmlns:z="#RowsetSchema">
這個XSLT具有可重複使用的特性,對於不同的查詢結果都適用,以下就是如何使用這個XSLT的範例:
<%
Dim strCleanXML, objXMLDOM_XSLT
Set objXMLDOM_XSLT = CreateObject("MSXML2.DOMDocument")
objXMLDOM_XSLT.load(Server.MapPath("DataCleaner.xsl"))
strCleanXML = objXMLDOM.transformNode(objXMLDOM_XSLT)
Set objXMLDOM = Nothing
Set objXMLDOM_XSLT = Nothing
%>
經過上面的處理以後,strClaenXML就是我們所想要的XML字串了。
上面這種格式的XML字串是我們經常見到的節點集的樣式,如果您不想把字段處理成節點,而把它處理成屬性節點,那麼我們只需對DataCleaber.xsl稍加改動即可:
xmlns:s="uuid:BDC6E3F0-6DA3-11d1-A2A3-00AA00C14882"
xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882"
xmlns:rs="urn:schemas-microsoft-com:rowset"
xmlns:z="#RowsetSchema">
以下是採用了新樣式的結果,它比用節點表示欄位的長度要短的多了。傳輸起來速度會更快:
到目前為止,我們介紹了從ADO 記錄集得到XML格式資料的幾種方法,也得到了最簡化的字串。但有幾個問題你還是需要注意,有些字段值還有XML裡不支持的字符,比如:"'< >&,象P&G寶潔公司的名稱,Chef Anton's Gumbo Mix產品名字等,在做轉換時要進行編碼處理。 savw;3,當保存分級的記錄集( data shapes)有兩個限制:不能保存參數化和含有未解決的更新的記錄集。
為了更進一步提升效能,你可以把轉換工作放到COM/COM+元件中, ASP程式碼只進行資料的最終表現即可。把業務層、資料層和表現層分開,ASP只需要呼叫資料元件,資料組件呼叫資料庫的預存過程,把結果轉換成XML,最後只把簡單的XML字元環串回到ASP程式裡,ASP就可以用XSLT把XML轉換,把結果送到瀏覽器。