出處:寶玉BLOG
一、無元件上傳的原理我還是一點一點用一個實例來說明的吧,客戶端HTML如下。要瀏覽上傳附件,我們透過<input type="file">元素,但一定要注意必須設定form的enctype屬性為"multipart/form-data":
<form method="post" action="upload.asp" enctype="multipart/form-data">
<label>
<input type="file" name="file1" />
</label>
<br />
<input type="text" name="filename" value="default filename"/>
<br />
<input type="submit" value="Submit"/>
<input type="reset" value="Reset"/>
</form>
在後台asp程式中,以前取得表單提交的ASCII 數據,非常的容易。但如果需要取得上傳的文件,就必須使用Request物件的BinaryRead方法來讀取。 BinaryRead方法是對目前輸入流進行指定位元組數的二進位讀取,有點需要注意的是,一旦使用BinaryRead 方法後,就再也不能使用Request.Form 或Request.QueryString 集合了。結合Request物件的TotalBytes屬性,可以將所有表單提交的資料全部變成二進位,不過這些資料都是經過編碼的。首先讓我們來看看這些資料是如何編碼的,有無什麼規律可循,編段程式碼,在程式碼中我們將BinaryRead讀取的二進位轉換為文本,輸出出來,在後台的upload.asp中(注意該範例不要上傳大文件,否則可能會造成瀏覽器死掉):
<%
Dim biData, PostData
Size = Request.TotalBytes
biData = Request.BinaryRead(Size)
PostData = BinaryToString(biData,Size)
Response.Write "<pre>" & PostData & "</pre>" '使用pre,原樣輸出格式
' 借助RecordSet將二進位流轉換成文字
Function BinaryToString(biData,Size)
Const adLongVarChar = 201
Set RS = CreateObject("ADODB.Recordset")
RS.Fields.Append "mBinary", adLongVarChar, Size
RS.Open
RS.AddNew
RS("mBinary").AppendChunk(biData)
RS.Update
BinaryToString = RS("mBinary").Value
RS.Close
End Function
%>
簡單起見,上傳一個最簡單的文字檔案(G:homepage.txt,內容為"寶玉:http: //www.webuc.net ")來試驗一下,文字方塊filename中保留預設值"default filename",提交看看輸出結果:
-----------------------------7d429871607fe
Content-Disposition: form-data; name="file1"; filename="G:homepage.txt"
Content-Type: text/plain
寶玉: http://www.webuc.net
-----------------------------7d429871607fe
Content-Disposition: form-data; name="filename"
default filename
-----------------------------7d429871607fe--
可以看出來對於表單中的項目,是用過"----- ------------------------7d429871607fe"這樣的邊界來分隔成一塊一塊的,每一塊的開始都有一些描述訊息,例如:Content- Disposition: form-data; name="filename",在描述資訊中,透過name="filename"可以知道表單項目的name。如果有filename="G:homepage.txt"這樣的內容,表示是上傳的文件,如果是上傳的文件,那麼描述訊息就會多一行Content-Type: text/plain來描述文件的Content-Type 。描述資訊和主體資訊之間是透過換行來分隔的。
嗯,基本上清晰了,根據這個規律我們就知道該怎麼來分離數據,再對分離的數據進行處理了,不過差點忽略一個問題,就是邊界值(上例中的"------- ----------------------7d429871607fe")是怎麼知道的?每次上傳這個邊界值是不一樣的,還好還好asp中可以透過Request.ServerVariables( "HTTP_CONTENT_TYPE")來獲之,例如上例中HTTP_CONTENT_TYPE內容為:"multipart/form-data; boundary=-- -------------------------7d429871607fe",有了這個,我們不僅可以判斷客戶端的form中有無使用enctype="multipart/form- data"(如果沒有使用,那麼下面就沒必要執行啦),還可以取得邊界值boundary=--------------------------- 7d429871607fe。 (注意:這裡取得的邊界值比上面的邊界值開頭要少"--",最好補充上。)
至於如何分析資料的過程我就不多贅述了,無非就是藉助InStr,Mid等這樣的函數來分離出來我們想要的數據。
二、分塊上傳,記錄進度要即時反映進度條,實質就是要即時知道目前伺服器取得了多少資料?再回想我們實作上傳的過程,我們是透過Request.BinaryRead(Request.TotalBytes)來實現的,在Request的過程中我們無法得知目前伺服器取得了多少資料。所以只能透過變通的方法了,如果我們可以將取得的資料分成一塊一塊的,然後根據已經上傳的區塊數我們就可以算出目前上傳了多大了!也就是說,如果我1K為1塊,那麼上傳1MB的輸入流就分成1024塊來獲取,例如我目前已經獲取了100塊,那麼就表明當前上傳了100K。當我提出分塊的時候很多人覺得不可思議,因為他們都忽略BinaryRead方法不僅是可以讀取指定大小,而且可以連續讀取的。
寫個例子來驗證一下分塊讀取的完整性,在剛才的例子基礎上(注意該示例不要上傳大文件,否則可能會造成瀏覽器死掉):
<%
Dim biData, PostData, TotalBytes, ChunkBytes
ChunkBytes = 1 * 1024 ' 分塊大小為1K
TotalBytes = Request.TotalBytes ' 總大小
PostData = "" ' 轉換為文字類型後的數據
ReadedBytes = 0 ' 初始化為0
' 分塊讀取
Do While ReadedBytes < TotalBytes
biData = Request.BinaryRead(ChunkBytes) ' 目前區塊
PostData = PostData & BinaryToString(biData,ChunkBytes) ' 將目前區塊轉換為文字並拼接
ReadedBytes = ReadedBytes + ChunkBytes ' 記錄已讀取大小
If ReadedBytes > TotalBytes Then ReadedBytes = TotalBytes
Loop
Response.Write "<pre>" & PostData & "</pre>" ' 使用pre,原樣輸出格式
' 將二進位流轉換成文本
Function BinaryToString(biData,Size)
Const adLongVarChar = 201
Set RS = CreateObject("ADODB.Recordset")
RS.Fields.Append "mBinary", adLongVarChar, Size
RS.Open
RS.AddNew
RS("mBinary").AppendChunk(biData)
RS.Update
BinaryToString = RS("mBinary").Value
RS.Close
End Function
%>
試驗上傳剛才的文字文件,輸出結果證明這樣分塊讀取的內容是完整的,並且在While循環中,我們可以在每次循環時將當前狀態記錄到Application中,然後我們就可以通過造訪該Application動態取得上傳進度條。
另:上例中是透過字串拼接的,如果是要拼接二進位數據,可以透過ADODB.Stream物件的Write方法,範例程式碼如下:
Set bSourceData = createobject("ADODB.Stream")
bSourceData.Open
bSourceData.Type = 1 'Binary
Do While ReadedBytes < TotalBytes
biData = Request.BinaryRead(ChunkBytes)
bSourceData.Write biData ' 直接使用write方法將目前檔案流寫入bSourceData中
ReadedBytes = ReadedBytes + ChunkBytes
If ReadedBytes > TotalBytes Then ReadedBytes = TotalBytes
Application("ReadedBytes") = ReadedBytes
Loop
三、保存上傳的檔案透過Request.BinaryRead取得提交數據,分離出上傳檔案後,根據數據類型的不同,保存方式也不同:
對於二進位數據,可以直接透過ADODB.Stream物件的SaveToFile方法,將二進位流保存成為文件。
對於文字數據,可以透過TextStream物件的Write方法,將文字資料儲存到檔案中。
對於文字資料和二進位數據,是可以方便的相互轉換的,對於上傳小檔案來說,兩者基本上沒什麼差別。但是兩種方式保存時還是有一些差別的,對於ADODB.Stream對象,必須將所有數據全部裝載完才可以保存成文件,所以使用這種方式如果上傳大文件將很佔用內存,而對於TextStream對象,可以在檔案建立好後,一次Write一部分,分多次Write,這樣的好處是不會佔用伺服器記憶體空間,結合上面分析的分塊取得資料原理,我們可以每取得一塊上傳資料就將之Write到文件中。我曾做過試驗,同樣本機上傳一個200多MB的文件,使用第一種方式內存一直在漲,到最後直接提示計算機虛擬內存不足,最可恨是即使進度條表示文件已經上傳完,但是最終文件還是沒有儲存上。而使用後一種方法,上傳過程中記憶體基本上無什麼變化。
四、未解決的難題我在博客園上看到Bestcomy描述他的Asp.Net上傳組件是可以和Sever.SetTimeOut無關的,而在Asp中我是沒能做到,對於上傳大文件,就只有將Server.SetTimeOut設定為一個很大的值才可以。不知道有沒有比較好的解決方法。
如果我們在儲存檔案時,使用TextStream物件的Write方法,那麼如果使用者上傳時中斷了檔案傳輸,已經上傳的那部分檔案還是在的,如果可以斷點續傳就好了。關鍵問題是Request.BinaryRead方法雖然可以分塊讀取,但是卻不能跳過某一段讀取!
五、結束語原理基本上是說清楚了,但是實際代碼要比這複雜的多,要考慮很多問題,最麻煩在分析數據那部分,對於每一塊獲取的數據,要分析是不是屬於描述信息,是表單項目還是上傳的文件,文件是否已經上傳結束…
相信根據上面的描述,您也可以開發出您自己功能強大的無組件上傳組件。我想更多的人關心的只是程式碼,而不會自己動手寫的,也許沒有時間,也許水平還不夠,更多的只是已經成為了一種習慣……我在CSDN上見過太多技術八股文——一段說明,然後全是代碼。授人以魚不若授人以漁,給你一個代碼,也許你並不會去思考為什麼,直接拿去用,當下次碰到類似的問題的時候,還是不知道為什麼,希望此文能讓更多人學到點什麼,最重要是「悟」到點什麼!