إذا كان لديك الخيار، فلا يزال يتعين عليك استخدام UTF-8
في الواقع، تحولت برامج نظام Windows بالكامل إلى Unicode، ويعد GBK مجرد إجراء مؤقت للتعامل مع المعايير الصينية.
يتم تمثيل ترميز النص لـ GBK بالبايتات المزدوجة، أي أن الأحرف الصينية والإنجليزية يتم تمثيلها بالبايتات المزدوجة، ومع ذلك، من أجل التمييز بين اللغة الصينية، يتم تعيين أعلى بت على 1.
أما بالنسبة لترميز UTF-8 فهو ترميز متعدد البايت يستخدم لحل الأحرف الدولية ويستخدم 8 بت (أي بايت واحد) للغة الإنجليزية و24 بت (ثلاث بايت) للغة الصينية. بالنسبة للمنتديات التي تحتوي على العديد من الأحرف الإنجليزية، يتم استخدام UTF-8 لتوفير المساحة.
GBK يحتوي على كافة الأحرف الصينية،
يحتوي UTF-8 على الأحرف التي تحتاجها جميع دول العالم.
GBK هو معيار متوافق مع GB2312 بعد توسيعه بناءً على المعيار الوطني GB2312 (يبدو أنه ليس معيارًا وطنيًا حتى الآن)
يمكن عرض النص المشفر UTF-8 على متصفحات مختلفة في بلدان مختلفة تدعم مجموعة أحرف UTF8.
على سبيل المثال، إذا كان ترميز UTF8، فيمكن أيضًا عرض اللغة الصينية على متصفح IE باللغة الإنجليزية للأجانب دون الحاجة إلى تنزيل حزمة دعم اللغة الصينية الخاصة بـ IE.
ولذلك، بالنسبة للمنتديات التي تحتوي على قدر كبير من اللغة الإنجليزية، فإن كل حرف يستهلك 2 بايت عند استخدام GBK، ولكنه يستهلك بايتًا واحدًا فقط عند استخدام UTF-8 English.
يرجى ملاحظة: على الرغم من أن إصدار UTF-8 يتمتع بتوافق دولي جيد، إلا أن الإصدار الصيني يتطلب مساحة تخزين قاعدة بيانات أكبر بنسبة 50% من إصدار GBK/BIG5، لذلك لا يوصى به ولا يمكن استخدامه إلا من قبل المستخدمين الذين لديهم متطلبات خاصة للتوافق الدولي.
ببساطة:
بالنسبة للمنتديات التي تحتوي على العديد من الأحرف الصينية، فمن المناسب استخدام تشفير GBK لتوفير مساحة قاعدة البيانات.
بالنسبة للمنتديات التي تحتوي على الكثير من اللغة الإنجليزية، فمن المناسب استخدام UTF-8 لتوفير مساحة قاعدة البيانات.
ما هي الاختلافات بين gbk و gb2312
بادئ ذي بدء، يحتاج الجميع إلى فهم ما هو gbk؟ ما هو gb2312؟ نحتاج إلى معرفة أن جميعها عبارة عن نوع من ترميز الأحرف. بالطبع، هناك أنواع عديدة من ترميز الأحرف.
يمكن فهم ترميز الأحرف على النحو التالي:
ما يتم تخزينه في الكمبيوتر هو القيم الثنائية 0 و 1.
8 بتات تتوافق مع البايت، ويتم التعبير عنها عادة بالنظام الست عشري.
فماذا لو أردنا رؤية الأحرف التي نريدها معروضة على الكمبيوتر بدلاً من الأرقام المختلفة 0 و1؟
نحن هنا بحاجة إلى جعل الكمبيوتر يقوم بتحويل القيم السداسية العشرية المقابلة التي يخزنها إلى أحرف مقابلة، بما في ذلك الأحرف في لغات أخرى مثل الإنجليزية والصينية، ومن ثم إخراجها إلى الشاشة.
لذا فإن التشفير يعني تحديد مجموعة من القواعد لتحديد القيم التي تتوافق مع أي أحرف.
ثم يحدد ترميز الأحرف مجموعة من القواعد التي تحدد القيمة من بين العديد من القيم المخزنة في الكمبيوتر التي تتوافق مع الحرف الذي يتم عرضه على شاشة الكمبيوتر.
خلاصة القول، يجب أن يكون الجميع قادرين على فهم أن GBK وGB2312 هما ترميزان للأحرف.
دعونا نتحدث عن الاختلافات والتشابهات بينهما بالتفصيل أدناه:
نقاط مماثلة:
1. GBK وGB2312 كلاهما 16 بت!
2. يتم استخدامها عادةً ضمن العلامات الوصفية لصفحات الويب.
الاختلافات:
1. يدعم ترميز أحرف GBK اللغة الصينية المبسطة والصينية التقليدية!
الاسم الكامل لـ GBK هو "مواصفات توسيع الكود الداخلي الصيني" (GBK هو الحرف الأول من "المعيار الوطني" و"الموسع" الصيني بينيين، الاسم الإنجليزي: مواصفات الكود الداخلي الصيني)، اللجنة الفنية الوطنية لتقييس تكنولوجيا المعلومات لجمهورية الصين الشعبية الصين، 1 ديسمبر 1995، تمت صياغته في 15 ديسمبر 1995، وأصدرت إدارة التقييس التابعة لمكتب الدولة للرقابة الفنية وإدارة العلوم والتكنولوجيا ومراقبة الجودة بوزارة الصناعة الإلكترونية خطاب إشراف فني مشترك في 15 ديسمبر، 1995. 229، وتعريفها بأنها وثيقة توجيه المواصفات الفنية.
2. GB2312 يدعم اللغة الصينية المبسطة فقط!
"مجموعة الأحرف الصينية المشفرة لتبادل المعلومات" هي مجموعة من المعايير الوطنية التي نشرتها إدارة الدولة للمعايير الصينية في عام 1980 وتم تنفيذها في 1 مايو 1981. الرقم القياسي هو GB 2312-1980.
يحتوي معيار GB 2312 على إجمالي 6763 حرفًا صينيًا، بما في ذلك 3755 حرفًا صينيًا من المستوى الأول و3008 حرفًا صينيًا من المستوى الثاني، وفي الوقت نفسه، يتضمن GB 2312 الحروف اللاتينية والأحرف اليونانية وأحرف الهيراجانا والكاتاكانا اليابانية والسيريلية الروسية. 682 حرفًا بالعرض الكامل.
إذا كانت صفحة الويب الخاصة بك مخصصة بشكل أساسي للأشخاص الصينيين الذين يتحدثون الصينية، فمن الجيد جدًا استخدام GB2312 وGBK، ويجب أن يكون حجم تخزين النص صغيرًا، وهو ما له بعض المزايا. إذا كانت صفحة الويب الخاصة بك مفتوحة للعالم، وكنت تستخدم GB2312 وGBK كتشفير لصفحة الويب، فإن بعض متصفحات الكمبيوتر لا تحتوي على هذا التشفير، وسيصبح محتوى الأحرف الصينية لصفحة الويب الخاصة بك أحرفًا مشوهة لا يمكن التعرف عليها.