現有漢字編碼
GB 2312-1980(信息交換用漢字編碼字元集 基本集)
GBK-1995(漢字內碼擴展規範)
GB13000.1-1993(信息技術 通用多八位編碼字元集(UCS)第一部分:體系結構與基本多文種平面(idt ISO/IEC 10646.1-1993))
GB18030-2000(信息交換用漢字編碼字元集 基本集的擴充)
不同標準間的相互關係
GB 18030完全兼容GBK、GB2312,並且是後二者的替代標準,也將是今後唯一的字元集國家標準。
GB 18030和GB13000.1的關係:在字彙上兼容,碼錶則不兼容。例如,兩個標準中都會有“啊”字,但兩個標準中,“啊”的內碼是不同的。
GB13000.1和ISO10646為同一體系,與工業標準Unicode3.1是兼容的。
GB18030
該標準分為兩個部分:雙位元組部分和四位元組部分。
雙位元組部分和GBK基本完全相同。
四位元組部分到目前為止,比GBK多了6582個漢字(27484-20902),0x8139ef30~0x82358738。對應GB13000.1則為0x3400~0x4db5。
目前支持GB18030標準的OS
2001年9月1日後的Windows 2000 的補丁版;
GB18030存在的問題
由於GB18030中包括了4位元組編碼漢字,和目前Windows平台中普遍使用的2位元組編碼的GBK和Unicode3.1有較大區別,因此在使用中出現了很多問題。例如微軟的Windows XP中實際上只支持Unicode3.1編碼,並不支持GB18030的4位元組編碼漢字。
