函式式編程

函式式編程

函式式編程是種編程典範,它將電腦運算視為函式的計算。函式程式語言最重要的基礎是 λ 演算(lambda calculus)。而且λ演算的函式可以接受函式當作輸入(參數)和輸出(返回值)。和指令式編程相比,函式式編程強調函式的計算比指令的執行重要。和過程化編程相比,函式式編程里,函式的計算可隨時調用。

基本信息

歷史

雖然 λ 演算並非設計來於計算機上執行,但可視為第一個函式式程式語言。1980年代末期,Haskell發布,企圖集合很多函式式編程研究里的想法。

速度和空間上的顧慮

函式式編程常被認為嚴重耗費在CPU和記憶體資源。主因有二:

早期的函式式程式語言實現時並無考慮過效率問題。

非函式式程式語言為求提升速度,會在某些部分放棄邊界檢查或垃圾回收等功能。

緩式評估亦為語言如Haskell增加了額外的管理工作。

函式式程式語言

純函式式的程式沒有變數和副作用。

函式式編程經常使用遞歸。

純函式式程式語言

因為純函式式程式設計語言沒有變數,函式沒有副作用,編寫出的程式可以利用memorization、common subexpression elimination和平行計算在運行時和編譯時得到大量最佳化。

定義

簡單說,"函式式編程"是一種"編程範式"(programmingparadigm),也就是如何編寫程式的方法論。

它屬於"結構化編程"的一種,主要思想是把運算過程儘量寫成一系列嵌套的函式調用。

例子

函式式編程中最古老的例子莫過於1958年被創造出來的LISP了,透過 LISP,可以用精簡的人力。較現代的例子包括Haskell、Clean、Erlang和Miranda等。

特性

在經常被引用的論文 “Why Functional Programming Matters”(請參閱 參考資料) 中,作者 John Hughes 說明了模組化是成功編程的關鍵,而函式編程可以極大地改進模組化。在函式編程中,編程人員有一個天然框架用來開發更小的、更簡單的和更一般化的模組, 然後將它們組合在一起。函式編程的一些基本特點包括:

支持閉包和高階函式。支持懶惰計算(lazy evaluation)。使用遞歸作為控制流程的機制。加強了引用透明性。沒有副作用。我將重點放在在 Java 語言中使用閉包和高階函式上,但是首先對上面列出的所有特點做一個概述。

閉包和高階函式

函式編程支持函式作為第一類對象,有時稱為 閉包或者 仿函式(functor)對象。實質上,閉包是起函式的作用並可以像對象一樣操作的對象。與此類似,FP 語言支持 高階函式。高階函式可以用另一個函式(間接地,用一個表達式) 作為其輸入參數,在某些情況下,它甚至返回一個函式作為其輸出參數。這兩種結構結合在一起使得可以用優雅的方式進行模組化編程,這是使用 FP 的最大好處。

懶惰計算

除了高階函式和仿函式(或閉包)的概念,FP 還引入了 懶惰計算的概念。在懶惰計算中,表達式不是在綁定到變數時立即計算,而是在求值程式需要產生表達式的值時進行計算。延遲的計算使您可以編寫可能潛在地生成無窮輸出的函式。因為不會計算多於程式的其餘部分所需要的值,所以不需要擔心由無窮計算所導致的 out-of-memory 錯誤。一個懶惰計算的例子是生成無窮 Fibonacci 列表的函式,但是對 第 n 個Fibonacci 數的計算相當於只是從可能的無窮列表中提取一項。

遞歸

FP 還有一個特點是用遞歸做為控制流程的機制。例如,Lisp 處理的列表定義為在頭元素後面有子列表,這種表示法使得它自己自然地對更小的子列表不斷遞歸。

引用透明性

函式程式通常還加強 引用透明性,即如果提供同樣的輸入,那么函式總是返回同樣的結果。就是說,表達式的值不依賴於可以改變值的全局狀態。這使您可以從形式上推斷程式行為,因為表達式的意義只取決於其子表達式而不是計算順序或者其他表達式的副作用。這有助於驗證正確性、簡化算法,甚至有助於找出最佳化它的方法。

副作用

副作用是修改系統狀態的語言結構。因為 FP 語言不包含任何賦值語句,變數值一旦被指派就永遠不會改變。而且,調用函式只會計算出結果 ── 不會出現其他效果。因此,FP 語言沒有副作用。

優點

1.代碼簡潔,開發快速

函式式編程大量使用函式,減少了代碼的重複,因此程式比較短,開發速度較快。

PaulGraham在《黑客與畫家》一書中寫道:同樣功能的程式,極端情況下,Lisp代碼的長度可能是C代碼的二十分之一。

如果程式設計師每天所寫的代碼行數基本相同,這就意味著,"C語言需要一年時間完成開發某個功能,Lisp語言只需要不到三星期。反過來說,如果某個新功能,Lisp語言完成開發需要三個月,C語言需要寫五年。"當然,這樣的對比故意誇大了差異,但是"在一個高度競爭的市場中,即使開發速度只相差兩三倍,也足以使得你永遠處在落後的位置。"

2.接近自然語言,易於理解

函式式編程的自由度很高,可以寫出很接近自然語言的代碼。

前文曾經將表達式(1+2)*3-4,寫成函式式語言:

subtract(multiply(add(1,2),3),4)

對它進行變形,不難得到另一種寫法:

add(1,2).multiply(3).subtract(4)

這基本就是自然語言的表達了。再看下面的代碼,大家應該一眼就能明白它的意思吧:

merge([1,2],[3,4]).sort().search("2")

因此,函式式編程的代碼更容易理解。

3.更方便的代碼管理

函式式編程不依賴、也不會改變外界的狀態,只要給定輸入參數,返回的結果必定相同。因此,每一個函式都可以被看做獨立單元,很有利於進行單元測試(unittesting)和除錯(debugging),以及模組化組合。

4.易於"並發編程"

函式式編程不需要考慮"死鎖"(deadlock),因為它不修改變數,所以根本不存在"鎖"執行緒的問題。不必擔心一個執行緒的數據,被另一個執行緒修改,所以可以很放心地把工作分攤到多個執行緒,部署"並發編程"(concurrency)。

請看下面的代碼:

vars1=Op1();

vars2=Op2();

vars3=concat(s1,s2);

由於s1和s2互不干擾,不會修改變數,誰先執行是無所謂的,所以可以放心地增加執行緒,把它們分配在兩個執行緒上完成。其他類型的語言就做不到這一點,因為s1可能會修改系統狀態,而s2可能會用到這些狀態,所以必須保證s2在s1之後運行,自然也就不能部署到其他執行緒上了。

多核CPU是將來的潮流,所以函式式編程的這個特性非常重要。

5.代碼的熱升級

函式式編程沒有副作用,只要保證接口不變,內部實現是外部無關的。所以,可以在運行狀態下直接升級代碼,不需要重啟,也不需要停機。Erlang語言早就證明了這一點,它是瑞典愛立信公司為了管理電話系統而開發的,電話系統的升級當然是不能停機的。

顧慮

函式式編程常被認為嚴重耗費在CPU和存儲器資源。主因有二:

早期的函式式程式語言實現時並無考慮過效率問題。

有些非函式式程式語言為求提升速度,不提供自動邊界檢查或自動垃圾回收等功能。

惰性求值亦為語言如Haskell增加了額外的管理工作。

相關詞條

相關搜尋

熱門詞條

聯絡我們