統計檢驗

統計檢驗

統計檢驗是將抽樣結果和抽樣分布相對照而作出判斷的工作。取得抽樣結果,依據描述性統計的方法就足夠了。抽樣分布則不然,它無法從資料中得到,非利用機率論不可。根據具體需要,確定特定問題的統計檢驗應該採用哪種分布的數學用表。把所有可能的結果分成兩類:一類是不大可能的結果;另一類人們預料這些結果很可能發生。統計檢驗的應該就是選取有代表性的樣本,然後去節省人力、物力的前提下,去推斷總體的一些性質、是否有差異的等。

基本信息

建立假設

統計檢驗是將抽樣結果和抽樣分布相對照而作出判斷的工作。取得抽樣結果,依據描述性統計的方法就足夠了。抽樣分布則不然,它無法從資料中得到,非利用機率論不可。而不對待概括的總體和使用的抽樣程式做某種必要的假設,這項工作將無法進行。

求抽樣分布

統計檢驗統計檢驗
在做了必要的假設之後,我們就能用數學推理過程來求抽樣分布了。由於數學上已經取得的成果,實際上統計工作者要做的這項工作往往並不是真的去求抽樣分布的數學形式,而是根據具體需要,確定特定問題的統計檢驗應該採用哪種分布的數學用表。

選擇機率分布

有了與問題相關的抽樣分布,我們便可以把所有可能的結果分成兩類:一類是不大可能的結果;另一類人們預料這些結果很可能發生。既然如此,如果我們在一次實際抽樣中得到的結果恰好屬於第一類,我們就有理由對機率分布的前提假設產生懷疑。在統計檢驗中,這些不大可能的結果稱為否定域。如果這類結果真的發生了,我們將否定假設;反之就不否定假設。機率分布的具體形式是由假設決定的,假設肯定不止一個。在統計檢驗中,通常把被檢驗的那個假設稱為零假設(或稱原假設,用符號H0表示),並用它和其他備擇假設(用符號H1表示)相對比。值得注意的是,假設只能被檢驗,從來不能加以證明。統計檢驗可以幫助我們否定一個假設,卻不能幫助我們肯定一個假設。為了使檢驗更嚴格、更科學,還需要更多的東西。首先,我們必須確定甘冒犯第一類和第二類錯誤的風險的程度;其次,要確定否定域是否要包含抽樣分布的兩端。第一類錯誤是,零假設H0實際上是正確的,卻被否定了。第二類錯誤則是,H0實際上是錯的,卻沒有被否定。第二類錯誤是,零假設H0實際上是錯誤的,卻沒有被否定。遺憾的是,不管我們如何選擇否定域,都不可能完全避免第一類錯誤和第二類錯誤,也不可能同時把犯兩類錯誤的危險壓縮到最小。對任何一個給定的檢驗而言,第一類錯誤的危險越小,第二類錯誤的機率就越大;反之亦然。一般來講,不可能具體估計出第二類錯誤的機率值。第一類錯誤則不然,犯第一類錯誤的機率是否定域內各種結果的機率之和。由於犯第一類錯誤的危險和犯第二類錯誤的危險呈相背趨向,所以統計檢驗時,我們必須事先在甘冒多大第一類錯誤的風險和多大第二類錯誤的風險之間作出權衡。被我們事先選定的可以犯第一類錯誤的機率,叫做檢驗的顯著性水平(用α表示),它決定了否定域的大小。如果抽樣分布是連續的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和顯著性水平的要求一致起來(後面的正態檢驗就如此)。如果抽樣分布是非連續的,就要用累計機率的方法找出一組構成否定域的結果。即在已知機率分布表上,從兩端可能性最小的機率開始向中心累計,直至機率之和略小於選定的顯著性水平為止。在許多場合,我們能預測偏差的方向,或只對一個方向的偏差感興趣。每當方向能被預測的時候,在同樣顯著性水平的條件下,單側檢驗比雙側檢驗更合適。因為否定域被集中到抽樣分布更合適的一側,可以得到一個比較大的尾端。這樣做,可以在犯第一類錯誤的危險不變的情況下,減少了犯第二類錯誤的危險。

計算統計量

完成了上述工作之後,接下來就是做一次與理想試驗儘量相同的實際抽樣(比如實際做一次重複拋擲硬幣的試驗),並從獲取的樣本資料算出檢驗統計量。檢驗統計量是關於樣本的一個綜合指標,但與第九章參數估計中將要討論的統計量有所不同,它不用作估測,而只用作檢驗。

判定

假設檢驗系指拒絕或保留零假設的判斷,又稱顯著性檢定。在選擇否定域並計算檢驗統計量之後,完成最後一道手續,即根據試驗或樣本結果決定假設的取與舍。如果結果落在否定域內,將在已知犯第一類錯誤機率的條件下,否定零假設。反之,如果結果落在否定域外,則不否定零假設,與此同時,就有了犯第二類錯誤的危險。

相關詞條

相關搜尋

熱門詞條

聯絡我們