최초의 컴퓨터는 ASCII 문자만 사용할 수 있었지만 컴퓨터 응용 프로그램이 확장됨에 따라 많은 국가에서는 중국의 GB2312와 같이 자국 및 국가의 문자와 문자를 컴퓨터에서 표시하고 처리할 수 있도록 컴퓨터용 특수 문자 집합을 설계했습니다. 암호. 이후 인터넷이 등장하면서 전 세계를 연결하게 되었고, 하나의 컴퓨터, 심지어는 하나의 인터페이스에서 여러 나라와 민족의 언어를 표시하는 것이 현실이 되었습니다. 국제기구에서는 언어 간, 플랫폼 간 텍스트 변환 및 처리에 대한 요구 사항을 충족하기 위해 Universal Character Set의 약어인 유니코드(Unicode)라고 하는 세계의 모든 텍스트와 기호를 수용할 수 있는 문자 인코딩 체계를 1994년부터 출시했습니다. 지속적으로 확장하여 이제 버전 10에 도달했습니다.
https://www.unicode.org/ 웹사이트에 접속하시면 최신 버전의 코드표 다운로드를 포함한 자세한 정보를 확인하실 수 있습니다.
웹 페이지를 디자인할 때 유니코드 문자 집합을 사용할 수 있습니다. HTML, CSS, JavaScript인지에 따라 사용 방법이 다릅니다.
그 중 dddd는 4자리 10진수 값을 나타내고, hhhh는 4자리 16진수 값을 나타냅니다. 두 가지 형식은 각각 &#과 &#x라는 접두사가 붙으며 10진수 코드 또는 16진수 유니코드 코드로 표현됩니다. 앞에는 &# 및 &#x가 와야 합니다. 세미콜론은 접미사입니다. 현재 4자리 16진수 코드를 사용하는 유니코드 문자는 비교적 잘 지원됩니다. 대부분은 웹 페이지에서 정상적으로 표시될 수 있지만, 사용되는 컴퓨터 플랫폼이 아직 개발되지 않았기 때문에 다른 유니코드 문자는 표시되지 않는 경우가 많습니다. . 예:
<p>유니코드 문자 표시--∰</p>
수학 기호가 표시되며 유니코드 코드는 2230입니다. "∰" 또는 "∰"를 사용하여 이 특수 문자를 출력한 후 페이지에 표시할 수 있습니다.
유니코드 문자는 CSS에서 거의 사용되지 않지만 가끔 사용됩니다. 일반적으로 백슬래시가 앞에 붙은 4자리 16진수 유니코드 코드로 표시됩니다.
JavaScript 코드는 그리스 문자, 로마 숫자 등을 사용하여 요소의 온도 또는 각도 문자를 출력하는 등 특수 문자를 출력하는 데 자주 사용됩니다. 4자리 유니코드 16진수 앞에 접두사 "u"만 추가하면 됩니다. 코드입니다. 예:
document.body.innerHTML="u25D0";
유니코드 코드 25D0이 사용되는 기하학적 도형표에서는 반달처럼 흰색으로 채워지고 반은 검은색으로 채워지는 원형 패턴입니다.
물론 중국인이 유니코드 코드를 사용하는 가장 일반적인 경우는 한자입니다. 더 많은 한자를 표시하기 위해 한자 라이브러리가 먼저 GB2312에서 GBK로 확장되었고 이제는 GB18030으로 확장되었습니다. GB18030의 최신 버전에는 다양한 소수 민족 문자와 일부 특수 문자를 포함하여 70,000개 이상의 한자가 포함되어 있습니다. 이 표준은 유니코드 코드 방법과 일치합니다. 물론 일부 컴퓨터에는 완전히 새로운 버전의 지원 소프트웨어가 설치되어 있지 않을 수 있으므로 종종 문자의 일부만 표시될 수 있습니다.
한자의 유니코드 코드를 얻으려면 JavaScript 함수 charCodeAt()를 사용할 수 있습니다. 예를 들면 다음과 같습니다.
var ucode="Zhao".charCodeAt();
이렇게 하면 변수 ucode에 한자 "趙"의 유니코드 코드가 저장되는데, 그 유니코드 코드는 10진수 유니코드 코드인 36213으로 구할 수 있다. toString(16) 메서드를 사용하여 이 10진수 코드를 16진수 코드로 변환할 수 있습니다.
var ucode="Zhao".charCodeAt().toString(16);
이렇게 얻은 것은 한자 "Zhao"의 16진수 형태의 유니코드 코드이고, 얻은 값은 8d75이다.
일반적으로 한자를 출력할 때 한자가 포함된 문자열을 직접 출력할 수 있다. 또한 한자의 유니코드 코드를 사용하여 해당 한자 또는 기타 문자를 출력할 수도 있습니다.
String.fromCharCode(36213);
이런 식으로 10진수 유니코드 코드 36213을 갖는 문자가 문자열로 변환되고, 그 문자열이 출력될 때 한자 "Zhao"가 표시됩니다. 입력방식을 이용하면 한자를 직접 얻을 수 있기 때문에 일부 특수문자를 출력할 때 이 방식을 사용하는 경우가 많다.
이것은 유니코드 인코딩이며 인코딩 프로세스는 다음과 같습니다.
예를 들어, "Yang"을 인코딩하려면 새 메모장을 만들고 "Yang"을 입력하고 저장할 때 유니코드 인코딩으로 저장하도록 선택한 다음 파일의 처음 2바이트 FF와 FE가 유니코드입니다. 인코딩 파일 헤더 표시 및 다음 2바이트 68 67은 "Yang"의 유니코드 인코딩입니다. 계산기를 사용하여 26472인 10진수로 변환합니다. 이제 HTML 파일에 "Yang"을 쓸 수 있으며 IE는 표시합니다. 열었을 때 "양"이라는 단어.
물론 일반 ASCII 코드의 경우 유니코드 인코딩이 ASCII 인코딩과 일치하므로 A에서는 대문자 "A"를 표시할 수 있습니다.
&# 인코딩을 문자로 변환
함수 uncode(str) { return str.replace(/&#(x)?([^&]{1,5});?/g, 함수 (a, b, c) { return String.fromCharCode(parseInt(c, b ? 16 : 10)); }); }
문자를 &# 인코딩으로 변환
함수 인코딩(str) { var a = [], i = 0; for (; i < str.length ;) a[i] = str.charCodeAt(i ++); return "&#" + a.join(";&#") + ";"; }
이것으로 웹 페이지의 유니코드 문자(&#, u 등) 도입에 대한 기사를 마칩니다. 더 많은 관련 유니코드 콘텐츠를 보려면 downcodes.com에서 이전 기사를 검색하거나 아래의 관련 기사를 계속 찾아보시기 바랍니다. 앞으로 downcodes.com을 더 많이 지원할 예정입니다!