Remarque: l'ASP mentionné ici
ASP prend en charge UTF-8 en raison de certaines fonctions.
Par exemple, vous souhaitez générer un fichier au format UTF-8, et il n'est pas possible d'utiliser l'objet Scripting.FileSystemObject couramment utilisé.
Scripting.FileSystemObject La fonction de création de fichiers est la manière suivante:
FileSystemObject.CreateTextFile (FileName [, écraser [, Unicode]])
L'attribut Unicode est décrit comme ceci:
Options. La valeur booléenne indique s'il faut créer des fichiers au format de fichier Unicode ou ASCII. Si le fichier est créé dans le format de fichier Unicode, la valeur est vraie; si le fichier est créé dans le format de fichier ASCII, la valeur est fausse. Si cette pièce est omise, il est supposé que le fichier ASCII est créé.
Nous ne pouvons pas utiliser cette fonction pour créer des fichiers de format UTF-8.
Pour le moment, nous pouvons utiliser l'objet Adodb.stream.
Définir ObjStream = Server.CreateObject (Adodb.Stream)
Avec objstream
.Opeen
.Charset = UTF-8
.Position = Objstream.Size
.WriteText = Str
.SavetoFile Server.Mappath (/SiteMap.xml), 2
.Fermer
Se terminer avec
Définir objstream = rien
Ci-joint::
ASCII, Unicode, UTF-8 Introduction:
ASCII est un jeu de caractères, y compris les lettres anglaises, les chiffres, les caractères de contrôle, etc. du cas.
Parce que l'ASCII représente des caractères très limités, divers pays ou régions ont proposé leurs propres jeux de caractères, tels que GB2312, qui est largement utilisé en Chine, qui fournit des codes pour les caractères chinois et est représenté par deux octets.
Ces caractères ne sont pas compatibles les uns avec les autres.
Unicode est un jeu de caractères qui mappe tous les caractères du monde en un nombre unique (point de code), comme le numéro 0x0041 correspondant à la lettre A. À l'heure actuelle, Unicode est toujours en cours de développement, et il est de plus en plus tolérant.
Lors du stockage des caractères représentés par Unicode, une certaine méthode de codage est requise, comme UCS-2, qui utilise deux octets pour représenter le caractère codé par Unicode. Et UTF-8 est une autre méthode d'encodage du jeu de caractères Unicode. Le texte anglais codé par ASCII peut être traité comme un codage UTF-8 sans modification, et l'application est très large.