PDP模型

PDP模型

PDP模型:英文全稱是paralleldistributed processing,中文稱之為並行分布模型。該模型是Rumelhart,McClelland以及PDP研究組在1986年首先提出的。這個模型把我們的心靈堪稱是“大規模並行的”,可以同時處理大量信息。並行分布模式同串列分布模式是相對的。

並行分布和串列分布是語言信息處理的中心話題。串列處理(serial processing)指的是幾個處理過程,按次序一個個的進行;並行處理(parallel processing)指的是這些過程同時進行。過去25年來,串列處理模型在語言和認知研究中很有影響,部分的原因是很多語言處理模型以電子計算機為基礎,而目前的計算機大多數均以串列方式運作。

運行機制

PDP模型電子計算機

假定要建立一個語言產生的模型,首先需要把說話人要傳遞的意念作為出發點,而終點便是把意念說出來。那么在兩點之間發生了一些什麼東西呢?一個串列處理模型可以把這個過程分為不同的階段:一個階段是建立句子的短語結構;另一個階段則是提取準備安插到結構里的詞項:還有一個階段則是決定這些詞項的正確發音。並且認為一組加工一次只發生一個,也就是系列加工。串列處理模型假定這些階段一個接著一個進行,一次只發生一個,不會有重疊。假定首先認為這些階段是同時發生的,該模型就是並行處理模型。這也就是說,我們可以一邊發出一個詞的聲音,一邊檢索一個詞。也可以說,在句子結構一湧現時,這兩個過程同時發生。在過去的二十五年中,系列模型在語言和認知研究中有了很大的影響,部分原因是很多模型都基於電子計算機,而電子計算機傾向於以系列方式快速地執行加工。

以下圖為參考:

PDP模型並行分布模型解釋圖該圖顯示了一些兩可的例子。注意第二行顯示了3個兩可的字母,他們之間相互約束。第3、4、5行中各存一個字母是兩可的,在其他上下文裡就會被辨認為其他的字母。該圖的目的是用來考察傳性思維模式同塗髒了英語詞的辨認之間的關係。
並行分布模型解釋圖

語言實例

PDP模型單詞辨認與思維密切相關
上圖顯示了一些語言實例。第一個例子中,我們把前一個單詞中間那個字母理解成"h”,而在後一個單詞中理解成"a”,儘管它在兩個單詞中的形式其實是一樣的。其餘四個例子中有一個或者多個字母被玷污了。在每個例子中要辨認出單詞並不困難。乍一看,這似乎是矛盾的。好像有理由說我們使用了上下文來幫助我們決定模糊字母的識別。然而上下文是單詞,而我們一般首先辨認字母然後再辨認單詞。我們又怎么能用單詞來幫助我們辨認字母呢?Rumelhart和McClelland認為答案是因為並行處理。他們認為我們在辨認單獨的字母同時也主動地試圖將這些字母與可能出現的不同單詞相匹配。一些已經辨認的字母使我們能夠將單詞識別為我們熟悉的單詞,於是我們從拼寫單詞的知識中辨認出被玷污的字母。因此我們同時處理了單詞和字母。並行處理(ParallelProcessing)原本是計算機系統中能同時執行兩個或更多個處理機的一種計算方法。處理機可同時工作於同一程式的不同方面。並行處理的主要目的是節省大型和複雜問題的解決時間。為使用並行處理,首先需要對程式進行並行化處理,也就是說將工作各部分分配到不同處理機中。而主要問題是並行是一個相互依靠性問題,而不能自動實現。此外,並行也不能保證加速。但是一個在n個處理機上執行的程式速度可能會是在單一處理機上執行的速度的n倍。只有部分應用程式在滿足以下條件的情況下可利用並行處理:具有充足的能充分利用多處理機的應用程式;並行化目標應用程式或用戶需進行新的編碼來利用並行程式。將並行處理運行機制套用到對人腦使用語言的複雜過程中,是研究人腦以及語言的一個有效的方法和手段。

產生

PDP模型大腦神經系統分布示意圖

並行分布加工模型被認為是受神經學激發而產生的,因為它們使用了腦而不是計算機作為主要的隱喻。腦中會同時出現很多神經活動。人的思維有邏輯性和直觀性兩種不同的基本方式。 邏輯性的思維是指根據邏輯規則進行推理的過程;它先將信息化成概念,並用符號表示,然後,根據符號運算按串列模式進行邏輯推理;這一過程可以寫成串列的指令,讓計算機執行。然而,直觀性的思維是將分散式存儲的信息綜合起來,結果是忽然間產生想法或解決問題的辦法。這種思維方式的根本之點在於以下兩點:1.信息是通過神經元上的興奮模式分布儲在網路上;2.信息處理是通過神經元之間同時相互作用的動態過程來完成的。
人工神經網路就是模擬人思維的第二種方式。這是一個非線性動力學系統,其特色在於信息的分散式存儲和並行協同處理。雖然單個神經元的結構極其簡單,功能有限,但大量神經元構成的網路系統所能實現的行為卻是極其豐富多彩的。

我們知道一些神經網路的特性,我們知道神經元能以一種興奮的方式影響相鄰神經元(導致相鄰神經元的活動,或“激活”)或者以一種抑制方式(減少相鄰神經元活動的可能性)影響相鄰神經元。Rumelhart和McClelland按照相同的路線建立了認知模型理論——一個巨大的信息節點互動網路,各節點與其他每個節點之間通過大量的毗鄰節點相互影響。現在PDP是對系列模型的一種重要的替換模型。

神經網路工作原理

PDP模型神經網路
人工神經網路首先要以一定的學習準則進行學習,然後才能工作。現以人工神經網路對手寫"A"、"B”兩個字母的識別為例進行說明,規定當"A”輸入網路時,應該輸出"1”,而當輸入為"B”時,輸出為"0”。所以網路學習的準則應該是:如果網路作出錯誤的的判決,則通過網路的學習,應使得網路減少下次犯同樣錯誤的可能性。首先,給網路的各連線權值賦予(0,1)區間內的隨機值,將"A”所對應的圖象模式輸入給網路,網路將輸入模式加權求和、與門限比較、再進行非線性運算,得到網路的輸出。在此情況下,網路輸出為"1”和“0”的機率各為50%,也就是說是完全隨機的。這時如果輸出為"1”(結果正確),則使連線權值增大,以便使網路再次遇到"A”模式輸入時,仍然能作出正確的判斷。
如果輸出為"0”(即結果錯誤),則把網路連線權值朝著減小綜合輸入加權值的方向調整,其目的在於使網路下次再遇到"A”模式輸入時,減小犯同樣錯誤的可能性。如此操作調整,當給網路輪番輸入若干個手寫字母"A”、"B”後,經過網路按以上學習方法進行若干次學習後,網路判斷的正確率將大大提高。這說明網路對這兩個模式的學習已經獲得了成功,它已將這兩個模式分布地記憶在網路的各個連線權值上。當網路再次遇到其中任何一個模式時,能夠作出迅速、準確的判斷和識別。一般說來,網路中所含的神經元個數越多,則它能記憶、識別的模式也就越多。
人工神經網路是由大量的簡單基本元件——神經元相互聯接而成的自適應非線性動態系統。每個神經元的結構和功能比較簡單,但大量神經元組合產生的系統行為卻非常複雜。
人工神經網路反映了人腦功能的若干基本特性,但並非生物系統的逼真描述,只是某種模仿、簡化和抽象。
與數字計算機比較,人工神經網路在構成原理和功能特點等方面更加接近人腦,它不是按給定的程式一步一步地執行運算,而是能夠自身適應環境、總結規律、完成某種運算、識別或過程控制。
人工神經元的研究起源於腦神經元學說。19世紀末,在生物、生理學領域,Waldeger等人創建了神經元學說。人們認識到複雜的神經系統是由數目繁多的神經元組合而成。大腦皮層包括有100億個以上的神經元,每立方毫米約有數萬個,它們互相聯結形成神經網路,通過感覺器官和神經接受來自身體內外的各種信息,傳遞至中樞神經系統內,經過對信息的分析和綜合,再通過運動神經發出控制信息,以此來實現機體與內外環境的聯繫,協調全身的各種機能活動。
神經元也和其他類型的細胞一樣,包括有細胞膜細胞質細胞核。但是神經細胞的形態比較特殊,具有許多突起,因此又分為細胞體、軸突和樹突三部分。細胞體內有細胞核,突起的作用是傳遞信息。樹突是作為引入輸入信號的突起,而軸突是作為輸出端的突起,它只有一個。
樹突是細胞體的延伸部分,它由細胞體發出後逐漸變細,全長各部位都可與其他神經元的軸突末梢相互聯繫,形成所謂“突觸”。在突觸處兩神經元並未連通,它只是發生信息傳遞功能的結合部,聯繫界面之間間隙約為(15~50)×10米。突觸可分為興奮性與抑制性兩種類型,它相應於神經元之間耦合的極性。每個神經元的突觸數目正常,最高可達10個。各神經元之間的連線強度和極性有所不同,並且都可調整、基於這一特性,人腦具有存儲信息的功能。利用大量神經元相互聯接組成人工神經網路可顯示出人的大腦的某些特徵。下面通過人工神經網路與通用的計算機工作特點來對比一下:
若從速度的角度出發,人腦神經元之間傳遞信息的速度要遠低於計算機,前者為毫秒量級,而後者的頻率往往可達幾百兆赫。但是,由於人腦是一個大規模並行與串列組合處理系統,因而,在許多問題上可以作出快速判斷、決策和處理,其速度則遠高於串列結構的普通計算機。人工神經網路的基本結構模仿人腦,具有並行處理特徵,可以大大提高工作速度。
人腦存貯信息的特點為利用突觸效能的變化來調整存貯內容,也即信息存貯在神經元之間連線強度的分布上,存貯區與計算機區合為一體。雖然人腦每日有大量神經細胞死亡(平均每小時約一千個),但不影響大腦的正常思維活動。

套用

神經網路的研究內容相當廣泛,反映了多學科交叉技術領域的特點。目前,主要的研究工作集中在以下幾個方面:
(1)生物原型研究。從生理學、心理學、解剖學、腦科學、病理學等生物科學方面研究神經細胞、神經網路、神經系統的生物原型結構及其功能機理。(2)建立理論模型。根據生物原型的研究,建立神經元、神經網路的理論模型。其中包括概念模型、知識模型、物理化學模型、數學模型等。(3)網路模型與算法研究。在理論模型研究的基礎上構作具體的神經網路模型,以實現計算機饃擬或準備製作硬體,包括網路學習算法的研究。這方面的工作也稱為技術模型研究。(4)人工神經網路套用系統。在網路模型與算法研究的基礎上,利用人工神經網路組成實際的套用系統,例如,完成某種信號處理或模式識別的功能、構作專家系統、製成機器人等等。
縱觀當代新興科學技術的發展歷史,人類在征服宇宙空間、基本粒子,生命起源等科學技術領域的進程中歷經了崎嶇不平的道路。我們也會看到,探索人腦功能和神經網路的研究將伴隨著重重困難的克服而日新月異。

PDP模型大腦運行模式與記憶關係密切
並行分布模型是在大腦神經網路系統的啟發下提出的,其基本原則是信息以分散式表征保存在記憶里,體現為單位之間的連線強度。學習正是通過連線強度的變化而產生的。該模型現已被成功地到原型學習、詞辨認的啟動效應、失憶病人的殘餘技能學習等方面的研究。PDP模型的出現提供了一個跨學科的交匯點,使得人工智慧研究者認知心理學家心理語言學家神經心理學家神經生物學家能夠互相交換意見,以發展更強有力的新記憶理論。

相關詞條

參考文獻

《心理學》 南開大學出版社

《語言心理學》 華東師範大學出版社

《新編心理語言學》 上海外語教育出版社

相關詞條

相關搜尋

熱門詞條

聯絡我們