言語理解

言語理解

言語理解是用計算機系統來識別和理解某一言語或其成分的技術。主要套用的技術是將通過傳聲器輸入的語音信號同存儲於機內有限辭彙中每一個詞的聲學模式相比較,根據某種距離準則尋求最佳匹配。

基本信息

技術原理

用言語作為人機之間的通信手段,較書面語更直接、更自然,也更快速。不經常使用計算機的人只要經過很少的訓練便可運用複雜的計算機系統。使用者的手可以騰出來從事其他操作,這一優點在航天活動中尤為重要。並完成獲取互動行為信息的感知處理、判斷用戶互動意圖的認知處理和回饋互動結果的回響處理等一系列計算過程,最終運用其輸出機制以用戶界面所定義的特定形式輸出其計算結果。

主要特點

言語理解言語理解

言語中詞與詞之間的界限是含糊的,語句的重音、語調、節奏等整體現象都會使原來為孤立詞設定的聲學模式失效,因此不能簡單地將連續言語信號和孤立詞語音信號的時間序列等同起來。在這種情況下,簡單的匹配技術不再適用,必須在新的原理指引下尋求新的方法。人在聽懂對方一句話時,除了聲學信號外往往利用其他信息來估計話的內容,而並不需要聽清每一個詞的發音。從單純依靠孤立詞聲學模式的匹配技術到綜合運用語言學各類知識來解釋聲學信號,是方法論上的轉變,這標誌著從言語識別轉入言語理解的新的研究階段(見語音識別)。現代言語理解的實驗系統往往採用自底向上和自頂向下相結合的方法。所謂自底向上就是利用語音學知識將輸入語音信號同儲存的聲學模式匹配。而自頂向下則是運用其他類型語言學知識(包括語法、語義和語用等)對說話人言語中可能出現的詞提出構想,以指引識別的方向;有時還需要在識別和理解言語後作出實時回響;如果這種回響也要求以言語形式作出,則還要運用言語合成技術。

發展歷史

言語理解的研究工作是從60年代研究孤立詞識別系統開始的。主要套用的技術是將通過傳聲器輸入的語音信號同存儲於機內有限辭彙中每一個詞的聲學模式相比較,根據某種距離準則尋求最佳匹配。能以相當高的精度識別100以上孤立詞的實用系統已經問世,但識別包含詞組或整個句子的連續言語信號所遇到的困難則比預計大得多。

1976年開始出現幾種能接收受限領域正常口述語句(連續言語)並能在合理時間內作出回響的實驗性言語理解系統。辭彙量規定為1000,回響誤差小於10%。為了實現這一要求,言語理解系統需要運用包括語音學、音位學、詞素學、韻律學、句法學、語義學和語用學等方面的多層次的知識。

對類型不同的大量知識綜合運用,是知識工程的重大技術課題。為了解決這一問題,hearsay系統提出了知識源和黑板結構。每一類型(屬於不同層次)的知識就是一個知識源,構成總知識庫的一個分庫。黑板結構是一種多級網路結構,構成新形式的全局資料庫。各知識源之間的協作是通過黑板結構進行的。各知識源在黑板上寫上自已對言語組成的構想,這一構想可被其他知識源肯定或否定,結論由系統的控制部分作出。HEARSAY系統的體系結構對所有知識型系統均有借鑑意義。圖2為言語理解系統的工作過程。

相關詞條

相關搜尋

熱門詞條

聯絡我們