ASP+FSO產生的網頁檔案預設編碼格式以及轉換成UTF-8編碼方法

作者：Eve Cole 更新時間：2025-01-23 20:12:02

有一個客人的網站想做一個俄文版，前台後台，我統一用utf-8編碼，但透過資料庫產生的靜態俄文資訊是亂碼。如果用GB2312顯示，透過資料庫產生的靜態俄文資訊正確顯示，但模板檔俄文是亂碼。

具體特徵如下：

1.透過模板實現俄文正常。

2.透過後台資料庫產生的靜態俄文訊息，後台顯示正常，前台亂碼。

3.英文正常。

和該主題相關的類似或不同表達

FSO寫UTF-8編碼文件

FSO怎麼才能產生utf-8編碼的文件

FSO產生的檔案預設是什麼編碼格式

如何轉換成UTF-8編碼

FSO產生靜態網頁的問題

ASP中用FSO產生檔碼如下

複製代碼代碼如下:

function createfile(sfilename,scontent)

set fso=server.CreateObject("scripting.filesystemobject")

set f1=fso.opentextfile(sfilename,2,true,-1)

f1.write(scontent)

f1.close

set fso=nothing

end function

fso.opentextfile(sfilename,2,true,-1) 最後一個參數-1是指定編碼格式為Unicode，編碼格式為Unicode在網頁顯示的是UTF-16 little-endian。

OpenTextFile方法

建立指定檔案並傳回TextStream對象，該物件可用於讀取或寫入所建立的檔案。

object.OpenTextFile(filename[, iomode[, create[, format]]])

參數object，必選項。應為FileSystemObjec或Folder物件的名稱。這裡是fso。

filename，必選項。字串表達式，指明要建立的檔案。這裡是sfilename。

iomode，可選參數，表示該檔案是用來讀、寫還是追加，預設為1表示讀取，2表示寫入操作，8表示追加操作。

create，可選參數，如果檔案不存在是否創建，預設為false，如果希望進行創建，則設為true。

format，參數可為下列設定之一，預設為ASCII格式，並沒有我們想要的utf-8：

TristateUseDefault -2 以系統預設格式開啟檔案。

TristateTrue -1 以Unicode格式開啟檔案。

TristateFalse 0 以ASCII格式開啟檔案。

FSO的編碼屬性只有三種，系統默認，Unicode，ASCII，並沒有我們想要的utf-8，所以一般中文系統上使用FSO元件產生的檔案都是gb2312編碼格式。

解決方法一

GB2312編碼包含俄語字母，如果頁面設定為簡體中文GB2312，那麼俄文能夠正常顯示，但由於中文預設「宋體」顯示，在「宋體」中俄語會顯示為全角字符，很難看，所以要採用外文字體，如“新羅馬”或“Arial”等。中國客戶那裡可以交差，但真正的俄國人瀏覽頁面時，就需要下載和安裝中文，很不理想，很可能導致放棄瀏覽網頁。

解決方法二

ASP由於是一種古老的語言，它的一些功能對UTF-8支援非常差。 FSO不支援直接產生UTF-8格式的文件，因為它無法指定需要的文件格式，例如，想產生一個UTF-8格式的文件，使用常用的Scripting.FileSystemObject物件就不行。必須換個思路，用Adodb.Stream，目前一些blog程式就是這樣實作的，如zblog。

Scripting.FileSystemObject 物件建立檔案的函數，是下面方式：

FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]])

其中的unicode屬性是這樣描述的：

可選項。 Boolean值指明是否以Unicode或ASCII檔案格式建立檔案。如果以Unicode文件格式建立文件，則該值為True；如果以ASCII文件格式建立文件，則該值為False。如果省略此部分，則假定建立ASCII檔案。

鮮然，無法用這個函數來建立UTF-8格式檔案。

使用ADODB.Stream對象，使用方法見下面：

複製代碼代碼如下:

Set objStream = Server.CreateObject("ADODB.Stream")

With objStream

.Open

.Charset = "utf-8"

.Position = objStream.Size

.WriteText=str

.SaveToFile server.mappath("/sitemap.xml"),2

.Close

End With

Set objStream = Nothing

附錄：ASCII、Unicode、UTF-8介紹

ASCII是一種字元集，包括大小寫的英文字母、數字、控製字元等，它以一個位元組表示，範圍是0-127。

由於ASCII表示的字元非常有限，各國或地區在此基礎上提出了自己的字元集，例如在中國應用非常廣泛的GB2312，它為漢字提供了編碼，用兩個位元組表示。

這些字符集之間互不相容，相同的數字可能表示不同的字符，為資訊交流帶來了麻煩。

Unicode是一種字元集，它將世界上的所有字元映射成一個唯一的數字(code point)，例如字母a對應的數字0x0041。目前Unicode還在發展中，它所包容的字元越來越多。

在將Unicode表示的字元進行儲存時，還需要一定的編碼方式，例如UCS-2，它用兩個位元組來表示Unicode編碼的字元。而UTF-8是Unicode字元集的另一個編碼方式，它是變長度的，最多6個位元組，小於127的字元用一個位元組表示，與ASCII字元集的結果一樣，因而具有非常好的相容性，ASCII編碼下的英語文本不需要修改就可以當作UTF-8編碼進行處理，應用非常廣泛。