機率分布

機率分布

機率分布(英語:probability distribution)或簡稱分布,是機率論的一個概念。為了使用的方便,根據隨機變數所屬類型的不同,機率分布取不同的表現形式。有時,主要是為了理論研究的方便,還需要有一種表述隨機變數與隨機向量取值的機率規律的更一般的形式。表列舉了機率論與數理統計學中常用的機率分布(包括取整數值的離散型分布及連續型分布),它們的名稱與標準記號,分布列或密度函式表達式及部分密度函式的圖形,相應的數學期望與方差(如果存在),以及相應的特徵函式。附表1隻對於-4.99≤u

事件

必然與隨機

在自然界與生產實踐和科學試驗中,人們會觀察到各種各樣的現象,把它們歸納起來,大體上分為兩大類:一類是可預言其結果的,即在保持條件不變的情況下,重複進行試驗,其結果總是確定的,必然發生(或必然不發生)。例如,在標準大氣壓下,水加熱到100℃必然沸騰;步行條件下必然不可能到達月球等。這類現象稱為必然現象(inevitablephenomena)或確定性現象(definitephenomena)。另一類是事前不可預言其結果的,即在保持條件不變的情況下,重複進行試驗,其結果未必相同。例如,擲一枚質地均勻對稱的硬幣,其結果可能是出現正面,也可能出現反面;孵化6枚種蛋,可能“孵化出0隻雛鳥”,也可能“孵化出1隻雛鳥”,……,也可能“孵化出6隻雛鳥”,事前不可能斷言其孵化結果。這類在個別試驗中其結果呈現偶然性、不確定性現象,稱為隨機現象(random phenomena)或不確定性現象(indefinite phenomena)。

人們通過長期的觀察和實踐並深入研究之後,發現隨機現象或不確定性現象,有如下特點:在一定的條件實現時,有多種可能的結果發生,事前人們不能預言將出現哪種結果;對一次或少數幾次觀察或試驗而言,其結果呈現偶然性、不確定性;但在相同條件下進行大量重複試驗時,其試驗結果卻呈現出某種固有的特定的規律性——頻率的穩定性,通常稱之為隨機現象的統計規律性。例如,對於一頭臨產的妊娠母牛產公犢還是產母犢是事前不能確定的,但隨著妊娠母牛頭數的增加,其產公犢、母犢的比例逐漸接近1:1的性別比例規律。機率論與數理統計就是研究和揭示隨機現象統計規律的一門科學。

隨機試驗

隨機試驗 通常我們把根據某一研究目的,在一定條件下對自然現象所進行的觀察或試驗統稱為試驗(trial)。而一個試驗如果滿足下述三個特性,則稱其為一個隨機試驗(random trial),簡稱試驗:

(1)試驗可以在相同條件下多次重複進行

(2)每次試驗的可能結果不止一個,並且事先知道會有哪些可能的結果

(3)每次試驗總是恰好出現這些可能結果中的一個,但在一次試驗之前卻不能肯定這次試驗會出現哪一個結果。

如在一定孵化條件下,孵化6枚種蛋,觀察其出雛情況;又如觀察兩頭臨產妊娠母牛所產犢牛的性別情況,它們都具有隨機試驗的三個特徵,因此都是隨機試驗。

隨機事件

隨機事件隨機試驗的每一種可能結果,在一定條件下可能發生,也可能不發生,稱為隨機事件(random event),簡稱事件(event),通常用A、B、C等來表示。

(1)基本事件我們把不能再分的事件稱為基本事件(elementary event),也稱為樣本點(sample point)。例如,在編號為1、2、3、…、10的十頭豬中隨機抽取1頭,有10種不同的可能結果:“取得一個編號是1”、“取得一個編號是2”、…、“取得一個編號是10”,這10個事件都是不可能再分的事件,它們都是基本事件。由若干個基本事件組合而成的事件稱為複合事件(compound event)。如“取得一個編號是2的倍數”是一個複合事件,它由“取得一個編號是2”、“是4”、“是6、“是8”、“是10”5個基本事件組合而成。

(2)必然事件我們把在一定條件下必然會發生的事件稱為必然事件(certain event),用Ω表示。例如,在嚴格按妊娠期母豬飼養管理的要求飼養的條件下,妊娠正常的母豬經114天左右產仔,就是一個必然事件。

(3)不可能事件我們把在一定條件下不可能發生的事件稱為不可能事件(impossible event),用ф表示。例如,在滿足一定孵化條件下,從石頭孵化出雛雞,就是一個不可能事件。

必然事件與不可能事件實際上是確定性現象,即它們不是隨機事件,但是為了方便起見,我們把它們看作為兩個特殊的隨機事件。

機率

統計定義

研究隨機試驗,僅知道可能發生哪些隨機事件是不夠的,還需了解各種隨機事件發生的可能性大小,以揭示這些事件的內在的統計規律性,從而指導實踐。這就要求有一個能夠刻劃事件發生可能性大小的數量指標,這指標應該是事件本身所固有的,且不隨人的主觀意志而改變,人們稱之為機率(probability)。事件A的機率記為P(A)。下面我們先介紹機率的統計定義。

在相同條件下進行n次重複試驗,如果隨機事件A發生的次數為m,那么m/n稱為隨機事件A的頻率(frequency);當試驗重複數n逐漸增大時,隨機事件A的頻率越來越穩定地接近某一數值p,那么就把p稱為隨機事件A的機率。這樣定義的機率稱為統計機率(statistics probability),或者稱後驗機率(posterior probability)。

例如為了確定拋擲一枚硬幣發生正面朝上這個事件的機率,歷史上有人作過成千上萬次拋擲硬幣的試驗。在表4—1中列出了他們的試驗記錄。

表4—1 拋擲一枚硬幣發生正面朝上的試驗記錄

實驗者 投擲次數 發生正面朝上的次數 頻率( m/n )
蒲豐 4040 2048 0.5069
k 皮爾遜 12000 6019 0.5016
k 皮爾遜 24000 12012 0.5005

從表4-1可看出,隨著實驗次數的增多,正面朝上這個事件發生的頻率越來越穩定地接近0.5,我們就把0.5作為這個事件的機率。

在一般情況下,隨機事件的機率p是不可能準確得到的。通常以試驗次數n充分大時隨機事件A的頻率作為該隨機事件機率的近似值。

即P(A≈m/n(n充分大) (4-1)

古典定義

上面介紹了機率的統計定義。但對於某些隨機事件,用不著進行多次重複試驗來確定其機率,而是根據隨機事件本身的特性直接計算其機率。

有很多隨機試驗具有以下特徵:

1.試驗的所有可能結果只有有限個,即樣本空間中的基本事件只有有限個

2.各個試驗的可能結果出現的可能性相等,即所有基本事件的發生是等可能的;

3.試驗的所有可能結果兩兩互不相容。

具有上述特徵的隨機試驗,稱為古典概型(classical model)。對於古典概型,機率的定義如下:

設樣本空間由n個等可能的基本事件所構成,其中事件A包含有m個基本事件,則事件A的機率為m/n,即

P(A(4-2)

這樣定義的機率稱為古典機率(classical probability)或先驗機率(prior probability)。

【例4.1】在編號為1、2、3、…、10的十頭豬中隨機抽取1頭,求下列隨機事件的機率。

(1)A=“抽得一個編號≤4”

(2)B=“抽得一個編號是2的倍數”。

因為該試驗樣本空間由10個等可能的基本事件構成,即n=10,而事件A所包含的基本事件有4個,既抽得編號為1,2,3,4中的任何一個,事件A便發生,即mA=4,所以

P(A)=mA/n=4/10=0.4

同理,事件B所包含的基本事件數mB=5,即抽得編號為2,4,6,8,10中的任何一個,事件B便發生,故P(B)=mB/n=5/10=0.5。

【例4.2】在N頭奶牛中,有M頭曾有流產史,從這群奶牛中任意抽出n頭奶牛,試求:

(1)其中恰有m頭有流產史奶牛的機率是多少?

(2)若N=30,M=8,n=10,m=2,其機率是多少?

我們把從有M頭奶牛曾有流產史的N頭奶牛中任意抽出n頭奶牛,其中恰有m頭有流產史這一事件記為A,因為從N頭奶牛中任意抽出n頭奶牛的基本事件總數為,事件A所包含的基本事件數為,因此所求事件A的機率為

=

將N=30,M=8,n=10,m=2代入上式,得

= = 0.0695

即在30頭奶牛中有8頭曾有流產史,從這群奶牛隨機抽出10頭奶牛其中有2頭曾有流產史的機率為6.95%。

機率性質

根據機率的定義,機率有如下基本性質:

1.對於任何事件A,有0≤P(A)≤1

2.必然事件的機率為1,即P(Ω)=1

3.不可能事件的機率為0,即P(ф)=0。

小機率事件

小機率事件實際不可能性原理

隨機事件的機率表示了隨機事件在一次試驗中出現的可能性大小。若隨機事件的機率很小,例如小於0.05、0.01、0.001,稱之為小機率事件。小機率事件雖然不是不可能事件,但在一次試驗中出現的可能性很小,不出現的可能性很大,以至於實際上可以看成是不可能發生的。在統計學上,把小機率事件在一次試驗中看成是實際不可能發生的事件稱為小機率事件實際不可能性原理,亦稱為小機率原理。小機率事件實際不可能性原理是統計學上進行假設檢驗(顯著性檢驗)的基本依據。

正文

機率論的基本概念之一,用以表述隨機變數取值的機率規律。為了使用的方便,根據隨機變數所屬類型的不同,機率分布取不同的表現形式。

離散型分布與分布列

只取有限個或可列個實數值的隨機變數稱為離散型隨機變數。例如,1000件產品中有50件次品,從中隨意抽取100件,則其中的次品數

就是一個只取 0到50之間的整數值的離散型隨機變數。又如一個電話交換台每天收到的呼叫次數

就是一個可取全部非負整數值的離散型隨機變數。設離散型隨機變數

所取的全部值為{

,

,…,

,…},記事件{

=

}的機率

P

(

=

)=

,

=1,2,…,

,…,於是二元序列{(

,

),

=1,2,…,

,…}表述了

取值的機率規律。這個二元序列稱為分布列。可用分布列來表述的離散型隨機變數取值的機率規律稱為離散型分布。由機率的基本性質可知,任一分布列必然滿足條件:

≥0,

機率分布機率分布

(若隨機變數只取

個值,則有

機率分布機率分布

)。

上述表達形式也適用於隨機向量的情形,這只須把

理解為

維隨機向量

=(

,

,…,

),

理解為

維向量值

機率分布機率分布

,事件{

=

}的機率

理解為

機率分布機率分布
機率分布機率分布

。相應的分布列所表述的機率規律稱為

維離散型分布。

分布函式與邊緣分布函式

對於那些取值充滿一個區間【

,

】、 甚至充滿整個實數軸

=(-∞,∞)的隨機變數,就不可能用分布列的形式來表述它取值的機率規律,一般可統一用分布函式來表述。設

是一個隨機變數,

是任一實數,事件{

}的機率

P

(

)=

(

),

,稱為

的分布函式;在數理統計學中也稱為累積分布函式。由機率的性質知道,任何分布函式

(

)都滿足以下三個條件:

① 單調非降,即當

<

時,

(

)≤

(

);

② 右連續,即

機率分布機率分布

,其中

表示

>

且趨近於

機率分布機率分布

機率分布機率分布

。反之,任一滿足這三個條件的函式,必是某一隨機變數的分布函式。用分布函式可以表示

落入某個區間的機率,例如當

<

時,

P

(

<

)=

(

)-

(

),

P

(

)=

(

)-

機率分布機率分布

(

)=

(

)-

(

-)。圖1畫出了一個分布函式的圖像。

機率分布機率分布
機率分布機率分布

如果

是一個離散型隨機變數,它的分布列為{(

,

),

=1,2,…,

,…},那么由機率的可列可加性知道,

的分布函式可以表為

機率分布機率分布

其中右邊的求和式表示對滿足

的一切下標

求和。圖2畫了一個這種類型的分布函式。

分布函式的定義也容易推廣到隨機向量的情形。設

=(

,

,…,

)是一個

維隨機向量,

=(

,

,…,

)是任一

維實向量,令

機率分布機率分布
機率分布機率分布

,則函式

(

,

,…,

)稱為

維分布函式,或稱為

個隨機變數

,

,…,

的聯合分布函式。

維分布函式也有與一維情形相應的充分必要條件,但敘述較為複雜。

利用

,…,

的聯合分布函式

(

,…,

),可以求出其中任何一部分隨機變數的分布函式,後者稱為前者的邊緣分布函式。以兩個隨機變數

為例,設它們的聯合分布函式為

(

,

),則

,

的兩個邊緣分布函式分別為

連續型分布與密度函式

實際中最常遇到的隨機變數的類型除離散型以外,還有連續型隨機變數。如果存在一非負實函式

(

),使隨機變數

的分布函式

(

)可以表成:

,

則稱

為連續型隨機變數,

(

)稱為

的密度函式,它一定滿足條件

可以用密度函式來表述的隨機變數取值的機率規律稱為連續型分布。連續型隨機變數

取任何一個實數值的機率等於0;當實數

<

時,可以用密度函式在區間【

,

】上的積分計算事件{

}的機率,即:

,

這個機率又可以用圖3中陰影部分的面積來表示。

機率分布機率分布

如果存在一個

元實函式

(

,

,…,

),使

維隨機向量

=(

,

,…,

)的分布函式

(

,

,…,

)可以表示成

,

(

,

,…,

)稱為隨機向量

維密度函式,或稱為

個隨機變數

,

,…,

的聯合密度函式。若兩個隨機變數

,

有聯合密度函式

(

,

),則

自身也分別有密度函式

(

)和

(

),且可以由下式算出:

,

(

),

(

)分別稱為

(

,

)的邊緣密度函式。類似地,可以考慮

維密度函式的邊緣密度函式。

機率分布的測度形式

有時,主要是為了理論研究的方便,還需要有一種表述隨機變數與隨機向量取值的機率規律的更一般的形式。對給定的正整數

,用

表示全體

維實向量構成的集,稱為

維實空間,對於

=(

,…,

)

機率分布機率分布

,用符號(

,

】表示

中如下的超長方體:(

,

】={

:

=(

,

,…,

),

<

(

=1,2,…,

),又用B表示由

中的一切超長方體產生的

域,稱為

維波萊爾域,B中的成員稱為

中的波萊爾集。由隨機變數的公理化定義可知,若

為機率空間(

,F,

P

)上的

維隨機向量,則對任一

∈B有{X∈

B

}∈F。對每一

B

∈B,定義

P

(

B

)=

P

(X∈

B

),則

P

是可測空間(

,B)上的一個機率測度(見機率)。這個機率測度

P

一般也稱為隨機向量

的機率分布。

實際上,對於不同類型的隨機變數

,它的機率分布

P

分別被它的分布列、密度函式和分布函式完全確定。以一維情形(

=1)為例,對於任一

B

∈B,其

P

(

B

)分別為:

式中最後一個積分是勒貝格-斯蒂爾傑斯積分。

隨機變數的函式的分布

一個或多個隨機變數的連續函式或初等函式(甚至更一般的波萊爾可測函式)仍然是隨機變數,而且後者的分布由前者的分布完全確定。這一事實無論在理論上或實際計算上都是重要的。例如,設隨機變數

的分布函式為

(

),

(>0)及

是二實數,則

=

也是隨機變數,它的分布函式

又如隨機變數

,

有聯合密度函式

(

,

),則

=

=

/

也是隨機變數(在後者中,假定

≠0)),它們分別有密度函式

數學期望

見數學期望。

方差

見方差。

中位數與分位數

是隨機變數,同時滿足

P

}≥1/2及

P

}≥1/2二式的實數

,稱為

的中位數,記作

。中位數對於任何隨機變數都是存在的,但可能不惟一。它是反映隨機變數取值中心的一個數值。在理論上,特別對數學期望不存在的情形,它可以起到類似於數學期望的作用。它與期望相比,主要優點是受極端值的影響較小,因此在某些套用統計問題中,用它代替平均數作為一個主要指標。

將中位數的概念推廣,可以引進數理統計學中常用的分位數的概念。給定0<

<1 ,隨機變數

的上

分位數是指同時滿足下列兩條件的數

P

}≥1-

P

}≥

。中位數就是1/2分位數。

又稱為

的下

分位數。

特徵函式

傅立葉變換是數學分析中非常重要而有效的工具,將它套用於機率論,對分布函式作傅立葉-斯蒂爾傑斯變換,就得到特徵函式。由於它具有很好的性質,因此在研究隨機變數之和及其機率分布時起著十分重要的作用。在P.萊維於1919年至1925年系統地建立機率論中的特徵函式性質以後的15年間,它被用來完整地解決了普遍極限定理(見中心極限定理),並深入地研究了獨立增量過程。

(

)是隨機變數

的分布函式,則稱

(

)為

(

)或

的特徵函式。特別,若分布是具有密度函式

(

)的連續型分布,則

若分布為

P

(

=

)=

(

=1,2,…),的離散型分布,則

特徵函式的重要性質有:①

(0)=1;②│

(

)│≤1,

;③

(

)在

上一致連續且具有非負定性,即對任意正整數

,任意實數

,

,…,

,及任意複數

,

,…,

,有

機率分布機率分布

;④若

階絕對矩有窮,則對一切正整數

,它的特徵函式的

階導數存在,且

機率分布機率分布

因而有

機率分布機率分布

在特徵函式已知的情況下,用這類公式來求各階矩往往是方便的。如果隨機變數

,

,…,

是獨立的,則

+…+

的特徵函式等於

,

,…,

各自的特徵函式的乘積。這一性質使特徵函式在研究極限定理(見中心極限定理)時起著重大的作用。

特徵函式與分布函式相互惟一決定,因而可以把求分布函式的問題轉化為求特徵函式的問題。不僅如此,在特徵函式序列與分布函式序列的收斂性之間也存在對應關係。稱分布函式序列{

(

),

≥1}弱收斂(見機率論中的收斂)於分布函式

(

),如果在

(

)的每一連續點

上,都有

機率分布機率分布

。於是,成立如下的定理:設分布函式序列{

(

)}弱收斂於分布函式

(

),則相應的特徵函式序列{

(

)}收斂於

(

)的特徵函式

(

),而且在

的任一有限區間上收斂是一致的。反之,設特徵函式序列收斂於一個在

=0處連續的函式

(

),則

(

)是特徵函式,而且相應的分布函式序列弱收斂於以

(

)為特徵函式的分布函式

(

)。這是解決中心極限問題時的一個關鍵性的定理。套用它,還可以證明:

上的復值函式

(

)為特徵函式的充分必要條件是

(

)連續、非負定且

(0)=1。這是特徵函式的一個判定條件,而且在證明平穩過程協方差函式的譜表示時需要用到這個定理。

上述有關一維機率分布的特徵函式的概念與結果,都可以推廣到多維的情形。

半不變數

設隨機變數

具有

階絕對矩,則它的特徵函式

(

)

次連續可微,令

它稱為

階半不變數。因此有

式中符號

(

)表示當

→0時比

高階的無窮小量,即

機率分布機率分布

的前幾階半不變數是:

…………。給定前兩階半不變數

,其最簡單的特徵函式是exp

機率分布機率分布

,即常態分配

(

,

)的特徵函式。

母函式

它是代替特徵函式專門用於研究非負整值隨機變數的一個有用的數學工具,歷史上,它的引進比特徵函式更早。設

是只取非負整數值的離散型隨機變數,

P

(

=

)=

,

=0,1,…,則稱

或其機率分布的母函式。由冪級數的求導性質知,

P

(

)在(-1,1)中有任意階導數,且

=

機率分布機率分布

(0)/

!,

=0,1,…,因此,母函式與取非負整值的離散型分布相互惟一決定。母函式還具有如下的重要性質:當

的數學期望存在時,EX=

P

′(1);當

的方差有窮時,

機率分布機率分布
機率分布機率分布

;任意

個獨立的非負整值隨機變數之和的母函式,是這

個隨機變數的母函式的乘積;設

,

,…是一列獨立的非負整值隨機變數,而且

,

,…有相同的機率分布,其共同的母函式為

(

),

的母函式為

(

),則隨機變數

機率分布機率分布

的母函式為

(

P

(

));此外,若E

及E

存在,則E

=E

·E

常用機率分布表

表列舉了機率論與數理統計學中常用的機率分布(包括取整數值的離散型分布及連續型分布),它們的名稱與標準記號,分布列或密度函式表達式及部分密度函式的圖形,相應的數學期望與方差(如果存在),以及相應的特徵函式。另外,還加了若干有用的附註。表中的

(

)表示隨機變數

服從期望為

、方差為

的常態分配。

機率分布機率分布
機率分布機率分布
機率分布機率分布
機率分布機率分布

常態分配

常態分配是一種很重要的連續型隨機變數的機率分布。生物現象中有許多變數是服從或近似服從常態分配的,如家畜的體長、體重、產奶量、產毛量、血紅蛋白含量、血糖含量等。許多統計分析方法都是以常態分配為基礎的。此外,還有不少隨機變數的機率分布在一定條件下以常態分配為其極限分布。因此在統計學中,常態分配無論在理論研究上還是實際套用中,均占有重要的地位。

機率計算

關於常態分配的機率計算,我們先從標準常態分配著手。這是因為,一方面標準常態分配在常態分配中形式最簡單,而且任意常態分配都可化為標準常態分配來計算;另一方面,人們已經根據標準常態分配的分布函式編製成常態分配表(附表1)以供直接查用。

標準分布

標準常態分配機率計算

標準常態分配機率計算標準常態分配機率計算

設u服從標準常態分配,則u在[u1,u2]內取值的機率為:

而Φ(u1)與Φ(u2)可由附表1查得。

附表1隻對於-4.99≤u<4.99給出了Φ(u)的數值。表中,u值列在第一列和第一行,第一列列出u的整數部分及小數點後第一位,第一行為u的小數點後第二位數值。例如,u=1.75,1.7放在第一列,0.05放在第一行。在附表1中,1.7所在行與0.05 所在列相交處的數值為0.95994,即Φ(1.75)=0.95994。有時會遇到給定Φ(u)值,例如Φ(u)=0.284,反過來查u值。這隻要在附表1中找到與0.284最接近的值0.2843,對應行的第一列數-0.5, 對應列的第一行數值0.07,即相應的u值為u=-0.57,亦即Φ(-0.57)=0.284。如果要求更精確的u值,可用線性插值法計算。

表中用了象。02336,.97674這種寫法,分別是0.0002326和0.9997674的縮寫,0表示連續3個0,9表示連續3個9。

由(4-11) 式及常態分配的對稱性可推出下列關係式,再藉助附表1,便能很方便地計算有關機率:

P(0≤u

相關詞條

相關搜尋

熱門詞條

聯絡我們