告警狀態

告警狀態

告警狀態指把被管對象的狀態描述為一個或多個告警事件結果的屬性。

基本信息

定義

在網路管理領域,故障被定義為產生功能異常的原因,是產生告警事件的原因。告警是在特定事件發生時被管對象發出的通報構成的一種事件報告,用於傳遞告警信息。它是生產廠商定義好的,並且是通過網路中的設備產生的,是一個系統發出的訊息,表示其發生了某種事情或異常,最終被網路管理人員觀察到。

理想的告警信息應包含有關故障設備名稱、故障症狀、發生部位、發生時間、發生原因等信息。但絕大部分告警都只有有關經歷故障的設備名稱、故障症狀、發生時間等數據域,而沒有提供識別故障必須的故障發生的詳細地點和發生原因等數據域。

告警狀態變化

告警狀態的變化是由於接收到相關的事件和操作所致。如當接收到一個告警觸發訊息則產生一條未恢復未確認的告警,隨後又收到該告警的恢復訊息,則這條告警就從未恢復未確認狀態自動轉為己恢復未確認狀態(網管監控人員未對該告警作確認操作),同時從當前告警庫轉入歷史告警庫。

告警狀態分類

告警分為五級:緊急告警( critical )、主要告警(major)、次要告警(minor)、警告告警( warning )、不確定告警( indeterminate )。如動力環境的交流停電告警為緊急告警,數據的設備CPU利用率超過門限值告警為重要告警,動力環境的風扇故障為次要告警,門禁、門開告警為警告告警。

告警邏輯與關聯

信息通信網路具有複雜、層次化的組網和全程端到端等特點,以SDH傳輸網為例,其網元的基本類型有終端復用器、分插復用器、再生中繼器、同步數字交叉連線設備等,這些網元的出現在物理和邏輯上都存在一定的關聯性,網路中的獨立網元故障將導致關聯網元的“一點告警、多點傳播”效應,而這些告警之間存在著發生時間和名稱邏輯上的關聯。在關聯分析中,首先將干擾告警進行人工剔除,如將大量信號類告警(信號劣化指示、輸出信號丟失等告警)中的非相關告警(如門禁開啟、主備單板版本不匹配等告警)剔除。在此篩選過程中,要兼顧重複告警可能由不同時間段的不同故障引起,不可盲目將重複告警刪除,而應該結合實際故障情況進行分析甄別。因此,將此類告警進行關聯歸類合併處理,將大大提高集中監控效能。

網路設備內的告警邏輯相關性分類如下:

1.壓縮處理,將多個具有同屬性(同小區、同網元、同光路等)且同時發生的告警壓縮成一條告警;

2.過濾機制,剔除不符合屬性相關性條件的告警;

3.累計計算,將一定數量同時發生的告警轉換為新名稱的告警;

4.告警抑制禁止,當高優先權告警產生時,則抑制低優先權告警;

5.布爾運算,將符合一定布爾運算規則的告警合稱為一個告警;

6.告警泛化.通過更籠統的告警信息替換網元生成告警信息;

7.告警特化通過更詳細的告警信息替換網元生成告警信息;

8.時序關係不同的告警按照一定的時間順序生成。

告警狀態 告警狀態

網路設備間的告警關聯分類方式有:衍生關聯,基於告警間的產生關係劃分為根告警和衍生告警;拓撲關聯,基於網元拓撲連線關係,構成本端告警與對端告警;時間關聯,同一故障點產生告警,具有同時間點觸發特性;因果關聯,由於A告警發生導致B告警觸發,如光纜阻斷導致EMS網元脫管;鏈路關聯,匯聚線路出現故障,觸發整個路徑網元設備告警並形成歸一化派單。網路設備內部、網路設備之間的告警邏輯關係如圖1所示:

算法

告警關聯性分析算法包括神經網路算法、模糊邏輯算法、基於規則方法、數據挖掘算法等。

數據挖掘算法中,關聯規則的核心算法是Agrawal R等人提出的Aproiri算法,Mannila H等人對關聯規則發現算法進行理論推廣,提出了時間序列中的頻繁情節發現算法,即WINEPI算法。告警關聯研究和套用在此基礎上已取得了一些研究成果,如凌緒雄通過頻繁模式(Apriori算法、FP-Growth算法、NHTFPG算法)和序列模式(WINEPI算法)挖掘系統,比較了算法性能並分析了愛立信MSC,MGW ,BSC網元告警之間的相關性;安歡結合置信度分析了關聯模型(Apriori算法)和序列模型挖掘告警信息的價值,但在根據告警重要程度賦予權值大小和實時分析方而仍有待研究;徐前方等人基於圖論思想,利用相關度和置信度框架構建告警關聯關係,結合電信網路告警測試MTAP算法,得出其在壓縮比、規則數量方而具有更高的有效性;吳簡等人將動態模糊關聯規則挖掘(IDFARM)算法套用於光網路故障管理.進一步縮短故障分析判斷的時長。

熱門詞條

聯絡我們