GB碼

GB碼即"國標"的漢語拼音縮寫,國標編碼就是中華人民共和國信息交換漢字編碼標準(GB2312-80)。

GB 即"國標"的漢語拼音縮寫,為中華人民共和國國家標準的意思.
國標編碼就是中華人民共和國信息交換漢字編碼標準(GB2312-80),
在此標準中制定了每一個漢字及非漢字元號的編碼。規定將漢字字元分為87個區,
每個區有94個漢字(94位),因此共制定了87x94=8178個漢字、字元。
每一個字元的編碼由2個位元組(Byte, 一個位元組有8位--Bit, 可以有256種不同表示)構
成(分別稱為高位元組和低位元組),其值分別為其區位碼值各加上32(既16進制的
20H),方便起見把這稱作國標碼,則國標碼所覆蓋的範圍為2121H-777EH,
如中國的“中”字位於54區48位,其國標碼就是5650H。當想在由西方人發明的
計算機中使用漢字時,由於國標碼的範圍與計算機中使用的 ASCII 碼(American Standard
Code for Information Interchange,美國信息交換標準碼,只用了一個位元組中的低7位,
範圍是32-126這95個)重疊,無法分出哪個是中文哪個是西文,於是規定將國標碼的高低
位元組的最高位均置1(Set the MSB,相當於加上128--16進制的80H),來使之區分於
ASCII 碼。這樣,在計算機中使用的漢字編碼實際上是真正的國標碼的高位置1後的變形
碼(以後稱此碼為 GB 碼),編碼範圍是0A1A1H-0F7FEH,前面的“中”字
的 GB 碼就是0D6D0H。
在國標中規定:
1區是標點符號及下列以外的各種符號
2區是各種各樣的數字元號
3區是全形西文字元(英文字母,數字,符號等)
4區是日文平假名
5區是日文片假名
6區是希臘字母表
7區是俄文字母表
8區是中文拼音字母表
9區是制表符
10區-15區目前空著備用,
16區-55區是按拼音字母排序的常用漢字(一級漢字)
56區-87區是按部首筆畫排序的非常用漢字(二級漢字)
(區位碼錶)
HZ碼是中國留學生為了使漢字信息能在網路上直接傳送而產生的。因目前大多數
(西方)網路系統為7位,最高位被禁止掉,因此 GB 碼無法被直接傳輸,HZ 碼規定
一個~緊接著一個{標誌著從此開始的代碼是國標碼,一直到遇到一個~後緊接著一個},
或本行結束為止。既利用國標碼高位元組(區)中沒有的~(7EH),形成進入(Escape in)
--~{,及退出(Escape out)--~}標誌,以達到在7位網路系統中直接傳遞漢字信息的目的。
此時真正的一個的~及後接{符號由兩個連續的~~及後接{來表示。
Big5 碼是在台灣和香港等地廣為使用的計算機漢字編碼方案,使用的是繁體字,
因最高位被置1,所以也不能直接在7位的網路系統中傳輸。
JIS 既 Japan Industry Standard(日本工業標準--同 GB 意思一樣),
但目前在日本的計算機中使用的編碼系統較為混亂,常用的有 JIS 碼(與 HZ 碼類似,
採用進入-退出標誌方式),Shift-JIS 碼(NEC個人計算機,即NEC98系列均採用此
種編碼)和 EUC 編碼(與 GB 碼一樣,採用高低位元組最高位均置1來區別於 ASCII 碼)
等幾種方式,日本的網路系統規定在其上傳輸電子郵件用 JIS 編碼。

相關詞條

相關搜尋

熱門詞條

聯絡我們