離群點

離群點,是指一個時間序列中,遠離序列的一般水平的極端大值和極端小值。

離群點是指一個時間序列中,遠離序列的一般水平的極端大值和極端小值。因此,也稱之為歧異值,有時也稱其為野值。
概括的說,離群點是由於系統受外部干擾而造成的。但是,形成離群點的系統外部干擾是多種多樣的。首先可能是採樣中的誤差,如記錄的偏誤,工作人員出現筆誤,計算錯誤等,都有可能產生極端大值或者極端小值。其次可能是被研究現象本身由於受各種偶然非正常的因素影響而引起的,例如。在人口死亡序列中,由於某年發生了地震,使該年度死亡人數劇增,形成離群點;在股票價格序列中,由於受某項政策出台或某種謠傳的刺激,都會出現極增,極減現象,變現為序列中的離群點。
不論是何種原因引起的離群點對以後的時間序列分析都會造成一定的影響。從造成分析的困難來看,統計分析人員說不希望序列中出現離群點,離群點會直接影響模型的擬合精度,甚至會得到一些虛偽的信息。例如,兩個相距很近的離群點將在譜分析中產生許多虛假的頻率。因此,離群點往往被分析人員看作是一個“壞值”。但是,從獲得信息來看,離群點提供了很重要的信息,它不僅提示我們認真檢查採樣中是否存在差錯,在進行時間序列分析前,認真確認序列,而且,當確認離群點是由於系統受外部突發因素刺激而引起的時候,他會提供相關的系統穩定性,靈敏性等重要信息。
在時間序列分析中通常把離群點分為四種類型進行處理。第一類是加性離群點。造成這種離群點的干擾,只影響該干擾發生的那一時刻T上的序列值,即XT而不影響該時刻以後的序列值;第二種是更新離群點,造成離群點的干擾不僅作用於XT,而且影響T時刻以後序列的所有觀察值,它的出現意味著一個外部干擾作用於系統的開始,並且其作用方式與系統的動態模型有關;第三種樹水平位移離群點,造成這種離群點的干擾素在某一時刻T,系統的結構發生了變化,並持續影響T時刻以後的所有行為,在數列上往往變現為T時刻前後的序列均值發生水平位移;第四種是暫時變更離群點,造成這種離群點的干擾是在T時刻干擾發生時具有一定初始效應,以後隨時間根據衰減因子的大小呈指數衰減的一類干擾事件。

相關詞條

相關搜尋

熱門詞條

聯絡我們