有一個客人的網站想做一個俄文版,前台後台,我統一用utf-8編碼,但透過資料庫產生的靜態俄文資訊是亂碼。如果用GB2312顯示,透過資料庫產生的靜態俄文資訊正確顯示, 但模板檔俄文是亂碼。
具體特徵如下:
1.透過模板實現俄文正常。
2.透過後台資料庫產生的靜態俄文訊息,後台顯示正常, 前台亂碼。
3.英文正常。
和該主題相關的類似或不同表達
FSO寫UTF-8編碼文件
FSO怎麼才能產生utf-8編碼的文件
FSO產生的檔案預設是什麼編碼格式
如何轉換成UTF-8編碼
FSO產生靜態網頁的問題
ASP中用FSO產生檔碼如下
複製代碼代碼如下:
function createfile(sfilename,scontent)
set fso=server.CreateObject("scripting.filesystemobject")
set f1=fso.opentextfile(sfilename,2,true,-1)
f1.write(scontent)
f1.close
set fso=nothing
end function
fso.opentextfile(sfilename,2,true,-1) 最後一個參數-1是指定編碼格式為Unicode,編碼格式為Unicode在網頁顯示的是UTF-16 little-endian。
OpenTextFile方法
建立指定檔案並傳回TextStream對象,該物件可用於讀取或寫入所建立的檔案。
object.OpenTextFile(filename[, iomode[, create[, format]]])
參數object,必選項。應為FileSystemObjec或Folder物件的名稱。 這裡是fso。
filename,必選項。字串表達式,指明要建立的檔案。 這裡是sfilename。
iomode,可選參數,表示該檔案是用來讀、寫還是追加,預設為1表示讀取,2表示寫入操作,8表示追加操作。
create,可選參數,如果檔案不存在是否創建,預設為false,如果希望進行創建,則設為true。
format,參數可為下列設定之一,預設為ASCII格式,並沒有我們想要的utf-8:
TristateUseDefault -2 以系統預設格式開啟檔案。
TristateTrue -1 以Unicode格式開啟檔案。
TristateFalse 0 以ASCII格式開啟檔案。
FSO的編碼屬性只有三種,系統默認,Unicode,ASCII,並沒有我們想要的utf-8,所以一般中文系統上使用FSO元件產生的檔案都是gb2312編碼格式。
解決方法一
GB2312編碼包含俄語字母,如果頁面設定為簡體中文GB2312, 那麼俄文能夠正常顯示, 但由於中文預設「宋體」顯示,在「宋體」中俄語會顯示為全角字符,很難看,所以要採用外文字體,如“新羅馬”或“Arial”等。中國客戶那裡可以交差, 但真正的俄國人瀏覽頁面時, 就需要下載和安裝中文,很不理想, 很可能導致放棄瀏覽網頁。
解決方法二
ASP由於是一種古老的語言,它的一些功能對UTF-8支援非常差。 FSO不支援直接產生UTF-8格式的文件,因為它無法指定需要的文件格式,例如,想產生一個UTF-8格式的文件,使用常用的Scripting.FileSystemObject物件就不行。必須換個思路,用Adodb.Stream,目前一些blog程式就是這樣實作的,如zblog。
Scripting.FileSystemObject 物件建立檔案的函數,是下面方式:
FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]])
其中的unicode屬性是這樣描述的:
可選項。 Boolean值指明是否以Unicode或ASCII檔案格式建立檔案。如果以Unicode文件格式建立文件,則該值為True;如果以ASCII文件格式建立文件,則該值為False。如果省略此部分,則假定建立ASCII檔案。
鮮然,無法用這個函數來建立UTF-8格式檔案。
使用ADODB.Stream對象,使用方法見下面:
複製代碼代碼如下:
Set objStream = Server.CreateObject("ADODB.Stream")
With objStream
.Open
.Charset = "utf-8"
.Position = objStream.Size
.WriteText=str
.SaveToFile server.mappath("/sitemap.xml"),2
.Close
End With
Set objStream = Nothing
附錄:ASCII、Unicode、UTF-8介紹
ASCII是一種字元集,包括大小寫的英文字母、數字、控製字元等,它以一個位元組表示,範圍是0-127。
由於ASCII表示的字元非常有限,各國或地區在此基礎上提出了自己的字元集,例如在中國應用非常廣泛的GB2312,它為漢字提供了編碼,用兩個位元組表示。
這些字符集之間互不相容,相同的數字可能表示不同的字符,為資訊交流帶來了麻煩。
Unicode是一種字元集,它將世界上的所有字元映射成一個唯一的數字(code point),例如字母a對應的數字0x0041。目前Unicode還在發展中,它所包容的字元越來越多。
在將Unicode表示的字元進行儲存時,還需要一定的編碼方式,例如UCS-2,它用兩個位元組來表示Unicode編碼的字元。而UTF-8是Unicode字元集的另一個編碼方式,它是變長度的,最多6個位元組,小於127的字元用一個位元組表示,與ASCII字元集的結果一樣,因而具有非常好的相容性,ASCII編碼下的英語文本不需要修改就可以當作UTF-8編碼進行處理,應用非常廣泛。