漢語書面理解系統

漢語書面理解系統是指人和計算機之間用漢語書面對話的系統。

漢語書面理解系統

正文

指人和計算機之間用漢語書面對話的系統。這方面的研究起步較晚,20世紀70年代後期才開始。80年代初期取得成果,建立了幾個實驗模型。
中國科學院心理研究所和中國科學院北京自動化研究所合作,於1981年建成“機器理解漢語──實驗 I”,這是一個人機問答系統,以動物常識為主題,貯存單詞70餘條,句型20多個,用漢語拼音輸入輸出。這個系統採用M.R.奎連1968年提出的“語義記憶”網路,加以修改,屬於心理學模型。計算機能正確回答問題,並具有一定的推理能力。例如人問:"麻雀、燕子和鴕鳥都是鳥嗎?"機答:"它們都是鳥。"人:"麻雀燕子鴕鳥都有翅膀嗎?"機:"它們都有翅膀。"人:“它們都會飛嗎?”機:“麻雀和燕子都會飛,鴕鳥不會飛。”人:“既然鴕鳥有翅膀,為什麼它不會飛?”機:“雖然鴕鳥有翅膀,可是它的翅膀是退化的,沒有飛的功能,所以不會飛。”
此後心理研究所從事計算機理解古漢語的研究,以“鄭人買履”、“刻舟求劍”兩個小故事進行實驗,於1982年取得成功,稱為“一個古漢語機器理解系統──ACLUS ”,能分析句法,把整篇故事譯成現代漢語,並回答問題。例如人問:“‘先度其足’中的‘度’字是什麼意思?”機答:“‘度’是動詞,是測量某種東西的尺寸的意思。”人:“‘吾忘持度’中的‘度’字是什麼意思?"機:"‘度’是名詞, 是尺寸的意思。"還能區別同一代詞所指的不同事物,例如"先度其足而置之其坐,至之市而忘操之”,計算機能理解首尾兩個“之”字指的是“腳的尺寸”而不是“腳”。為擴大ACLUS 理解古漢語的功能,心理研究所近年來在修改和補充句法規則,特別對虛詞的用法作了較詳細的探索。
中國社會科學院語言研究所於1981年建成“RJD-80型漢語人機對話系統”(簡稱RJD-80),是人和計算機直接對話的一個問答系統。以中國文學作品常識為對話的主要內容,貯存單詞250餘條,句型30多個。人用鍵盤輸入問題,計算機螢幕顯示回答,隨問隨答,回答一個問題只需1~30秒,輸入輸出都採用漢語拼音。可查詢25個作家的120多種作品,任何人無需學習計算機,只要懂漢語拼音,都能自由使用。
RJD-80屬於語言學模型,著重套用現代語言學理論和方法,以N.喬姆斯基生成語法和W.A.伍茲的ATN為基礎,吸收C.菲爾莫爾的格語法、韓禮德系統語法的合理核心,根據漢語特點制定句法、語義規則。計算機具有句法分析、語義解釋、知識檢索、言談分析、邏輯推理、根據語義成分生成語句和排除非法輸入的功能。語句輸入,計算機分析句法,螢幕顯示深層結構表達式,語義規則根據深層結構作出語義解釋,查詢知識庫求得答案輸出。例如人問:“《茶館》的作者是曹禺嗎?"(輸入不用標點,全憑句法形式判斷)機答:“不是,是老舍。”(輸出用標點)人:“曹禺有小說嗎?”機:“沒有。"人:“巴金有哪些著作?”機:“《家》、《春》、《秋》。”人:"《背影》是什麼?"機:“散文,作者朱自清。" 按深層結構解釋語義,可以對形式不同而語義相同的句子統一處理。例如"巴金有劇本嗎?","巴金有沒有劇本?",“巴金有劇本沒有?"3種不同句式的深層結構相同,語義相同,答案也相同。RJD-80具有一定的言談分析(上下文關係)和邏輯推理的功能。例如人問:“你知道艾青嗎?”機答:“不知道。”人:“他寫過很多詩?”機:“ 喔,他是詩人。"人:"你還知道誰是詩人?"機:“郭沫若。”人:“他是劇作家,怎么又是詩人?”機:“他寫過詩歌,又寫過劇本,所以既是詩人,又是劇作家。"人:"老舍呢?”機:“老舍既是小說家,又是劇作家。”RJD-80還能輸入某些語義成分,並指定某一成分做主語,令計算機造句輸出。此外,凡輸入句中有不符合貯存的辭彙和句法、語義規則時,能加以排除,顯示“辭彙不合”、“句法不合”或“語義不合”。
1984 年語言研究所又完成“TK-84漢語人機對話實驗”(簡稱TK-84),以鐵路客運諮詢為主題,貯存單詞200餘條,句型30多個。內容包括北京至東北某幾條鐵路線客運快車的到站、中途站、開點、到點、車次、車種、車組等,也是一個人機直接對話的問答系統。例如人問:"從北京到大連有特快嗎?"機答:"沒有特快,只有直快。"人:"有哪幾次直快?"機:"101/104,129/132。"又如“153次經過唐山嗎?"機:"153次走京坨線到瀋陽,不經過唐山。"再如“開往瀋陽的快車都有臥鋪嗎?”機:“11次沒有臥鋪,其他都有。”人:"11次為什麼沒有臥鋪?"機:“11次8點從北京開,18點49分到瀋陽,臥鋪沒有必要。”TK-84根據漢語特點,提出了一種新的句法、語義分析方法──"語義短語語法"。詞和語義成分構成語義短語,如介詞短語(PP)"從〈處所〉"表示起點,動詞短語(VP)"到〈處所〉"表示去處,動詞短語“有〈車種〉"表示存在某種車運行。〈 〉中是語義成分,內容由用戶自行定義。設〈處所〉定義為"北京、瀋陽、大連……”,〈車種〉定義為“特快、直快、快車……”,即可用於本系統。某些語義短語能組合成句,某些不能;短語組合又有不同序列,有的成句,有的不成句;成句的短語序列還往往不止一種,有的語義相同,有的不同,據此建立句法、語義規則。例如"從北京到大連有特快嗎?"(PP+VP1+VP2),“從北京有特快到大連嗎?”(PP+VP2+VP1),"有特快從北京到大連嗎?"(VP2+PP+VP1),3種短語序列語義相同,計算機輸出同一回答。TK-84對上下文中的省略句和輸出回答時語句生成的規則也作了進一步探索,取得一定成效(見自然語言書面理解系統)。

配圖

相關連線

相關詞條

相關搜尋

熱門詞條

聯絡我們