선택할 수 있는 경우 UTF-8을 사용해야 합니다.
실제로 윈도우 시스템 자체 프로그램은 유니코드로 전면 전환됐고, GBK는 중국 표준에 대응하기 위한 임시방편일 뿐이다.
GBK의 텍스트 인코딩은 더블바이트로 표현됩니다. 즉, 중국어와 영어 문자 모두 더블바이트로 표현됩니다. 그러나 중국어를 구별하기 위해 최상위 비트를 1로 설정합니다.
UTF-8 인코딩은 국제 문자를 해결하는 데 사용되는 멀티바이트 인코딩으로, 영어의 경우 8비트(즉, 1바이트), 중국어의 경우 24비트(3바이트)를 사용합니다. 영어 문자가 많은 포럼의 경우 공간을 절약하기 위해 UTF-8이 사용됩니다.
GBK에는 모든 한자가 포함되어 있습니다.
UTF-8에는 전 세계 모든 국가에서 필요한 문자가 포함되어 있습니다.
GBK는 국가표준인 GB2312를 기반으로 확장하여 GB2312와 호환되는 표준이다(아직 국가표준은 아닌 것으로 보인다)
UTF-8로 인코딩된 텍스트는 UTF8 문자 집합을 지원하는 다양한 국가의 다양한 브라우저에 표시될 수 있습니다.
예를 들어 UTF8 인코딩인 경우 IE의 중국어 지원 패키지를 다운로드할 필요 없이 외국인의 영어 IE에서도 중국어를 표시할 수 있습니다.
따라서 영어가 많은 포럼의 경우 GBK를 사용하면 각 문자가 2바이트를 차지하지만 UTF-8 영어를 사용하면 1바이트만 차지합니다.
참고: UTF-8 버전은 국제 호환성이 좋지만 중국어 버전은 GBK/BIG5 버전보다 50% 더 많은 데이터베이스 저장 공간이 필요하므로 권장되지 않으며 국제 호환성을 위해 특별한 요구 사항이 있는 사용자만 사용할 수 있습니다.
간단히 말해서:
한자가 많은 포럼의 경우 GBK 인코딩을 사용하여 데이터베이스 공간을 절약하는 것이 적절합니다.
영어가 많은 포럼에서는 데이터베이스 공간을 절약하기 위해 UTF-8을 사용하는 것이 적합합니다.
gbk와 gb2312의 차이점은 무엇입니까?
우선 gb2312가 무엇인지 모두가 이해해야 겠죠? 물론, 다양한 종류의 문자 인코딩이 있다는 것을 알아야 합니다.
문자 인코딩은 다음과 같이 이해될 수 있습니다.
컴퓨터에 저장되는 것은 0과 1의 이진값이다.
8비트는 1바이트에 해당하며 일반적으로 16진수로 표시됩니다.
그렇다면 다양한 숫자 0과 1 대신 컴퓨터에 표시하려는 문자를 보려면 어떻게 해야 할까요?
여기서는 컴퓨터가 저장한 해당 16진수 값을 영어, 중국어 등 다른 언어의 문자를 포함하여 해당 문자로 변환한 다음 화면에 출력하도록 해야 합니다.
따라서 인코딩은 어떤 값이 어떤 문자에 해당하는지 지정하는 일련의 규칙을 정의하는 것을 의미합니다.
그런 다음 문자 인코딩은 컴퓨터에 저장된 수많은 값 중 어떤 값이 컴퓨터 화면에 표시되는 문자에 해당하는지 지정하는 일련의 규칙을 정의합니다.
요약하면 GBK와 GB2312가 문자 인코딩이라는 것을 모든 사람이 이해할 수 있어야 합니다.
아래에서 차이점과 유사점에 대해 자세히 설명하겠습니다.
비슷한 점:
1. GBK와 GB2312는 모두 16비트입니다!
2. 일반적으로 웹페이지의 메타 태그 내에서 사용됩니다.
차이점:
1. GBK 문자 인코딩은 중국어 간체와 중국어 번체를 지원합니다!
GBK의 전체 이름은 "중국 내부 코드 확장 사양"입니다(GBK는 "국가 표준" 및 "확장" 중국어 병음의 첫 글자, 영어 이름: 중국어 내부 코드 사양), 인민 공화국 국가 정보 기술 표준화 기술 위원회 중국, 1995년 12월 1일 1995년 12월 15일 제정, 국가기술감독국 표준화부와 전자공업부 과학기술품질 감독부가 공동으로 12월 15일 기술감독서를 발행했다. 1995. 229에서는 이를 기술사양 지침서로 정의하고 있다.
2. GB2312는 중국어 간체만 지원합니다!
"정보 교환을 위한 중국어 코드 문자 집합"은 1980년 중국 국가 표준 관리국에서 발표하고 1981년 5월 1일에 시행한 국가 표준 집합입니다. 표준 번호는 GB 2312-1980입니다.
GB 2312 표준에는 1급 한자 3755자, 2급 한자 3008자를 포함하여 총 6763자가 포함됩니다. 동시에 GB 2312에는 라틴 문자, 그리스 문자, 일본어 히라가나 및 가타카나 문자, 러시아어 키릴 문자가 포함됩니다. 문자 682자.
귀하의 웹페이지가 주로 중국어를 사용하는 중국인을 대상으로 하는 경우 GB2312 및 GBK를 사용하는 것이 매우 좋으며 텍스트 저장 용량이 작아야 하며 몇 가지 장점이 있습니다. 웹페이지를 전 세계에 공개하고 GB2312 및 GBK를 웹페이지 인코딩으로 사용하는 경우 일부 컴퓨터 브라우저에는 이 인코딩이 없으므로 웹페이지의 한자 콘텐츠가 인식할 수 없는 왜곡된 문자가 됩니다.