漢字作業系統

漢字作業系統是具有漢字處理能力的作業系統。它是計算機漢化軟體的核心,是人機對話的界面,具有控制和管理計算機系統資源的功能,為用戶提供漢字輸入、漢字輸出、漢字造字等界面,支持中文軟體運行。

一、漢字作業系統簡介

漢字作業系統是具有漢字處理能力的作業系統。它是計算機漢化軟體的核心,是人機對話的界面,具有控制和管理計算機系統資源的功能,為用戶提供漢字輸入、漢字輸出、漢字造字等界面,支持中文軟體運行。

二、漢字作業系統產生的背景

漢字處理是國內包括稅務系統常規信息處理的重要內容。MS-DOS是西文作業系統,不具有輸入/輸出漢字的能力,因此,若要進行漢字處理,必須改造和擴充西文DOS的能力。 早在70年代,我國就開始對漢字信息處理技術進行研究並取得了一定成果。進入80年代後,由於微機的發展,促使漢字信息處理有了重大突破,並研製成功了第一個漢字作業系統,定名為CCDOS。這是由原電子工業部第六研究所在PC-DOS的基礎上為IBM-PC及其兼容機開發的作業系統。
隨著計算機的發展,漢字系統已經歷了三代,最早的CCDOS漢字系統,其基本滿足漢字信息處理的要求,但處理速度慢,點陣字模不美觀等。發展到第二代,出現了UCDOS、SUPER-CCDOS 2.13等,它們在處理速度上有了很大提高,也有了較為精美的漢字字型檔。到了第三代,漢字系統已能支持直接寫屏,如UCDOS 5.0、CXDOS 6.0、天匯 3.0等。這樣,對西文軟體無須漢化便能處理漢字了。另外,WINDOWS除了使用中文WINDOWS之外,也可用西文WINDOWS再在其上運行漢字系統解決漢字問題,如中文之星、四通立方RichWin for Windows系列等。這些漢字系統字型檔更精美、更繁多,功能更強大,使中文信息處理更加迅捷便利。

三、漢字作業系統的組成

(1)鍵盤管理模組。鍵盤管理模組是負責管理計算機鍵盤的功能模組。它的主要功能有兩項:

a、外部輸入法的接口,將漢字外碼轉換為內碼;

b、解釋系統功能鍵並調用相應的系統服務功能。

(2)顯示管理模組。顯示管理模組負責解釋所要顯示的漢字內碼或ASCII字元,並將它們顯示在計算機螢幕上。

(3)字模管理模組。字模管理模組負責提供螢幕顯示和列印所需要的漢字點陣。它根據要求對漢字字模的原始信息進行加工、處理,最終提供相應的輸出點陣。

(4)列印管理模組。列印管理模組是支持漢字列印的列印驅模組。他接收需要列印的漢字內碼和列印屬性,再通過字模管理是提取相應的點陣,最後通過印表機的圖形方式控制印表機,使漢字從印表機上輸出。

(5)系統服務模組。系統服務模組是漢字系統服務性支持模組。提供系統使用工具(如漢字字模器、系統配置管理)、中斷調用及應用程式編程接口API。

四、漢字作業系統如何處理漢字的輸入、存儲和輸出

1.漢字的輸入
要進行漢字輸入首先要解決漢字的編碼問題,主要是漢字在機內如何表示。通常每個西文字元只占一個位元組的存儲區。但由於漢字的數目眾多(屬於大字元集),因此需要採取不同的表示方法。
為統一標準,1981年我國公布了《通信漢字字元集及其漢字交換標準》(GB2312-80)。在此方案中,共收錄了6763個常用漢字,其中較常用的3755個漢字組成一級字型檔,按拼音順序排列;其餘3007個漢字組成二級字型檔,按部首順序排列。有了這個基本集,就可對這一定數量漢字集內的每個漢字編成相應的一組英文或數字代碼,使其能直接使用西文鍵盤輸入漢字。
當前,漢字輸入編碼已經“出台”的方案有上百種,實際使用的也有幾十種,根據編碼方案設計時所依據的不同漢字屬性,可將它們分成:形碼,音碼,音形碼,區位碼。
形碼:根據漢字的字形結構來編碼。它的優點是:碼長(所謂碼長是一個漢字編碼的字元個數)較短、重碼(所謂重碼是指同一編碼對應多個漢字)率低、直觀,不受操作者文化程度高低、是否識字和各地方言不同的影響,只要看到字形,就能按規則擊鍵輸入。缺點是:有一套漢字的拆分規則要掌握,字根(若干筆畫複合連線交叉,形成相對不變的結構)在鍵盤上的分布歸率要記憶。
音碼:根據漢字的讀音進行編碼。它的優點是:一般學過漢語拼音的人就可以輸入漢字,易學,直觀,不受字型變化的影響。缺點是:碼長較長,重碼率高,不會讀或發音不準確的字無法用拼音輸入。
音形碼:兼顧了漢字的字音、字形(或字義)而構成的漢字輸入編碼。優點是:吸取了音碼和形碼的長處,重碼率低。缺點是:編碼規則複雜難於學習和記憶。
區位碼:根據漢字在漢字集中的位置而進行編碼。優點是:漢字與碼組有嚴格的對應關係,不需進行二次選擇。缺點是難於記憶。
現在,我們常見的輸入法有。拼音輸入法,自然碼輸入法,表形碼輸入法,五筆字形輸入法等。其方法各異,各有其特點。在眾多漢字輸入法中還廣泛採用了一些輔助手段,如:詞組輸入,聯想輸入等,以提高漢字輸入的速度。
2.漢字的存儲
在實際漢字系統中,都是用兩個位元組來表示一個漢字,也即一個漢字對應兩個位元組的二進制碼,也就是說,用兩個位元組對漢字進行編碼,這樣即可將我們採用的漢字編入標準漢字代碼中,輸入時,我們輸入進計算機的就是這兩個位元組的漢字代碼,存儲亦然。
3.漢字的輸出
確定了漢字的機內碼僅僅決定了每個漢字在國標字元集中的位置,但並不能說明每個漢字的形狀。因此,要完成漢字的輸出任務還需要字型數據。在微機上,大多數的文字或圖形的形狀都是用“點”來描述的。存儲這些點由1和0來實現,輸出時,計算機把1解釋成“寫點”,把0解釋為“不寫點”。這樣,漢字的點陣數據就與螢幕上的圖形對應起來。為了能夠顯示漢字,在國標集中的每個漢字都需要事先確定其點陣形狀,然後點陣轉換成對應的數據,一般以檔案形式存放到計算機中,就構成了漢字的字型庫或簡稱為字型檔。
漢字的顯示一般需要一系列的步驟。例如,首先將用戶從鍵盤輸入的漢字編碼(輸入碼)轉化成機內碼,然後根據內碼從字型檔中查找到該字的字模數據,再將字模寫到螢幕或輸出到印表機。

相關詞條

熱門詞條

聯絡我們