中國信息交換標準代碼

中國信息交換標準代碼是針對 美國信息交換標準代碼 而言的, 信息交換代碼。 目前還沒有被國家信息產業部正式頒布,僅僅只關於“漢字數位化”的一種預測。

簡介

中國信息交換標準代碼將是一種重新定義位元組長度的信息模式,一個位元組占用至少16位二進制,如果順利的話,使用32位甚至64位也可以。

16位長度的位元組,可以有 65536 種組合方式,能夠將中文常用字全部包含進去,用作數決運算,將比傳統的8位位元組精確很多。

32位長度的位元組,可以有 4294967296 種組合方式,能夠將中文全部字全部包含進去,並且可以照顧當前大多數的CPU的運算能力。

64位長度的位元組,可以有 18446744073709551616種組合方式,能夠將人類全部的文字和聲音包含進去,並為現在和將來的各種數據類型留足使用空間。

新的標準,兼容舊有的標準是很不難辦到的,但是,改造人們習慣是困難的。軟體的改造和標準的訂立是相對容易的,但是,沒有高效的硬體基礎是不能發揮軟體的最大能量。

與新標準相適應的輸入設備還沒有被開發出來。可能您現在使用的就是qwert鍵盤,它是為了不讓機械時代的打字機卡殼而設計出來的,打英文就很低效,更別說是用於中文了。任何一種隨機的組合都比這個好。

新的輸入設備是讓漢字進入計算機核心的硬體鑰匙。它應該是一樣能夠自由定義鍵碼內容和順序的鍵盤,自帶一個小容量的Flash存儲器來存放對鍵位的設等和輸入法程式。符合人機學的外觀形態是必須的。

在最初的使用過程當中,大量的個性化的設定將出現。經過幾年,甚至十幾年的積累,最最佳化的輸入設定將被自然優選出來,並成為被大量的生產固定模式。最高效的計算機控制器將由此產生。

漢字編碼國家標準

較常見的國家漢字標準代碼列表GB 2312 - 80信息交換用漢字編碼字元集 基本集(又稱為GB0)GB 13000 - 93信息技術 通用多八位編碼字元集(UCS)第一部分GB 18030 - 2000信息技術 信息交換用漢字編碼字元集 基本集的擴充其他中華人民共和國發布有關漢字標準代碼列表:GB/T 12345 - 90信息交換用漢字編碼字元集 第一輔助集(又稱為GB1)GB/T 7589 - 87信息交換用漢字編碼字元集 第二輔助集(又稱為GB2)GB 13131 - 91信息交換用漢字編碼字元集 第三輔助集(又稱為GB3)GB/T 7590 - 87信息交換用漢字編碼字元集 第四輔助集(又稱為GB4)GB 13132 - 91信息交換用漢字編碼字元集 第五輔助集(又稱為GB5)GB/T 16500 - 1998信息交換用漢字編碼字元集 第七輔助集國家推薦標準以 "/T" 來表示並非強制執行。由於GB 2312-80隻收錄了6763個漢字,未能覆蓋繁體中文字、部分人名、方言、古漢語等方面出現的罕用字,所以發布了以上的輔助集。其中,GB/T 12345-90輔助集是GB 2312-80基本集的繁體字版本;GB 13131-91是GB/T 7589-87的繁體字版本;GB 13132-91是GB/T 7590-87的繁體字版本。而GB/T 16500-1998是繁體字版本,它並無對應的簡體字版本。鑒於第二輔助集及第四輔助集,有不少漢字均是“類推簡化漢字”,實用性不高,因而較少人採用。中華人民共和國國家標準總局於2000年推出強制性的GB 18030-2000標準。於2001年8月31日後發布或出廠的產品,必須符合GB 18030-2000的相關要求。 相關標準列表(按首次出版時間排列) 標準號名稱別名漢字數備註GB 2312-80信息交換用漢字編碼字元集 基本集GB /GB 06763GB 6345.1-86 等字模集有附錄對 GB 2312-80 之修訂,但 GB 2312 本身一直未有更新,詳見 GB 2312 條目GB/T 7589-87信息交換用漢字編碼字元集 第二輔助集GB27237向 ISO 10646 提交時使用繁體字版本GB/T 7590-87信息交換用漢字編碼字元集 第四輔助集GB47039向 ISO 10646 提交時使用繁體字版本GB 8565.2-88信息處理文本通訊用編碼字元集 第二部分無636主要用於電訊;GB2漢字520個、GB4漢字92個、來自《第一批異體字整理表》之異體字23個及“囉”字。此字元集補充了 GB 2312,使之能包括整個《現代漢語通用字表》GB/T 12345-90信息交換用漢字編碼字元集 第一輔助集GB16866GB 2312 繁體版,增補103字GB 13131-91信息交換用漢字編碼字元集 第三輔助集GB37237GB/T 7589 繁體版GB 13132-91信息交換用漢字編碼字元集 第五輔助集GB57039GB/T 7590 繁體版ISO-IR-165通訊用中文多位元組字元集 8464集合 GB 2312-80(包括 GB 6345.1-86 新增之字元及調整)及 GB 8565.2-88GB 13000.1-93信息技術 通用多八位編碼字元集(UCS)第一部分 20902另有302個兼容漢字(當中十二個:U+FA0E, U+FA0F, U+FA11, U+FA13, U+FA14, U+FA1F, U+FA21, U+FA23, U+FA24, U+FA27, U+FA28 及 U+FA29 有獨立形音義,統一碼聯盟建議不要視之為兼容漢字GBK漢字擴展內碼規範 21003除了來自 ISO 10646-1 / GB 13000.1 之20902字,另有 ISO 10646-1 / GB 13000.1 中21個兼容漢字(包括上述十二個有獨立形音義兼容字),以方便和 Big5、CNS11643、JIS 及 IBM 檔案雙向轉換、未收入 ISO 10646 的《簡化字總表》漢字52個、《康熙字典》及《辭海》漢字部件28個;後80字暫時對應 Unicode 編碼之私人使用區(Private Use Area),新版 Unicode 已全部收納。Microsoft Code Page 936 收入21個兼容漢字,未收後80字GB/T 15564-1995圖文電視廣播用漢字編碼字元集 香港子集 111所有字皆來自 GB 13000.1GB/T 16500-1998信息交換用漢字編碼字元集 第七輔助集 3778其他 GB 未收錄之 GB13000.1 漢字GB 18030-2005信息技術 中文編碼字元集 70244首版本 GB 18030-2000

相關詞條

相關搜尋

熱門詞條

聯絡我們