GB 2312:GB2312碼是中華人民共和國國家漢字信息交換用編碼，全 -百科知識中文網

簡介

GB 2312
GB 2312或GB 2312-80是一個簡體中文字元集的中國國家標準，全稱為《信息交換用漢字編碼字元集·基本集》，又稱為GB0，由中國國家標準總局發布，1981年5月1日實施。GB2312編碼通行於大陸；新加坡等地也採用此編碼。幾乎所有的中文系統和國際化的軟體都支持GB 2312。
GB 2312標準共收錄6763個漢字，其中一級漢字3755個，二級漢字3008個；同時，GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內的682個全形字元。
GB 2312的出現，基本滿足了漢字的計算機處理需要，它所收錄的漢字已經覆蓋99.75%的使用頻率。
對於人名、古漢語等方面出現的罕用字，GB 2312不能處理，這導致了後來GBK及GB 18030漢字字元集的出現。

基本信息

《信息交換用漢字編碼字元集》是由我國國家標準總局1980年發布，1981年5月1日開始實施的一套國家標準，標準號是GB2312—1980。它是計算機可以識別的編碼，適用於漢字處理、漢字通信等系統之間的信息交換。基本集共收入漢字6763個和非漢字圖形字元682個。整個字元集分成94個區，每區有94個位。每個區位上只有一個字元，因此可用所在的區和位來對漢字進行編碼，稱為區位碼。
這個碼是唯一的，不會有重碼字。把換算成十六進制的區位碼加上2020H，就得到國標碼。國標碼加上8080H，就得到常用的計算機機內碼。1995年又頒布了《漢字編碼擴展規範》（GBK）。GBK與GB2312—1980國家標準所對應的內碼標準兼容，同時在字彙一級支持ISO/IEC10646—1和GB13000—1的全部中、日、韓（CJK）漢字，總計20902字。信息交換用漢字編碼字元集和漢字輸入編碼之間的關係是，根據不同的漢字輸入方法，通過必要的設備向計算機輸入漢字的編碼，計算機接收之後，先轉換成信息交換用漢字編碼字元，這時計算機就可以識別並進行處理；漢字輸出是先把機內碼轉成漢字編碼，再傳送到輸出設備。

分區表示

GB 2312中對所收漢字進行了“分區”處理，每區含有94個漢字/符號。這種表示方式也稱為區位碼。
01-09區為特殊符號。
16-55區為一級漢字，按拼音排序。
56-87區為二級漢字，按部首/筆畫排序。
10-15區及88-94區則未有編碼。
舉例來說，“啊”字是GB2312之中的第一個漢字，它的區位碼就是1601。

位元組結構

在使用GB2312的程式中，通常採用EUC儲存方法，以便兼容於ASCII。
每個漢字及符號以兩個位元組來表示。第一個位元組稱為“高位位元組”，第二個位元組稱為“低位位元組”。
“高位位元組”使用了0xA1-0xF7(把01-87區的區號加上0xA0)，“低位位元組”使用了0xA1-0xFE(把01-94加上0xA0)。漢字區的“高位位元組”的範圍是0xB0-0xF7，“低位位元組”的範圍是0xA1-0xFE，佔用的碼位是72*94=6768。其中有5個空位是D7FA-D7FE。
例如“啊”字在大多數程式中，會以0xB0A1儲存。（與區位碼對比：0xB0=0xA0+16,0xA1=0xA0+1）。

GB2312簡體中文編碼表（部分）

code+0+1+2+3+4+5+6+7+8+9+A+B+C+D+E+F
A1A0、。·ˉˇ¨〃々—～‖…‘’
A1B0“”〔〕〈〉《》「」『』〖〗【】
A1C0±×÷∶∧∨∑∏∪∩∈∷√⊥∥∠
A1D0⌒⊙∫∮≡≌≈∽∝≠≮≯≤≥∞∵
A1E0∴♂♀°′″℃＄¤￠￡‰§№☆★
A1F0○●◎◇◆□■△▲※→←↑↓〓
code+0+1+2+3+4+5+6+7+8+9+A+B+C+D+E+F
A2A0ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ?????
A2B0?⒈⒉⒊⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖
A2C0⒗⒘⒙⒚⒛⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽⑾
A2D0⑿⒀⒁⒂⒃⒄⒅⒆⒇①②③④⑤⑥⑦
A2E0⑧⑨⑩??一二三四五六七八九十?
A2F0?ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ??
code+0+1+2+3+4+5+6+7+8+9+A+B+C+D+E+F
A3A0！＂＃￥％＆＇（）＊＋，－．／
A3B0０１２３４５６７８９：；＜＝＞？
A3C0＠ＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯ
A3D0ＰＱＲＳＴＵＶＷＸＹＺ［＼］＾＿
A3E0｀ａｂｃｄｅｆｇｈｉｊｋｌｍｎｏ
A3F0ｐｑｒｓｔｕｖｗｘｙｚ｛｜｝
……

GB 2312

簡介

基本信息

分區表示

位元組結構

GB2312簡體中文編碼表（部分）

相關詞條

建築鋼材速查手冊

GB2312-80

仿宋_GB2312

衝壓模具排樣工藝圖冊（多工位級進模）

信息交換用漢字編碼字元集

1976年2月4日

中華字型檔

相關搜尋

熱門詞條