Správa poruch - Fault management - Wikipedia

v správa sítě, správa poruch je sada funkcí, která detekuje, izoluje a opravuje poruchy v telekomunikační síti, kompenzuje změny prostředí a zahrnuje údržbu a zkoumání chyba protokoly, přijímání a reakce na oznámení o detekci chyb, sledování a identifikace poruch, provádění sekvencí diagnostických testů, oprava chyb, hlášení chybových stavů a ​​lokalizace a sledování poruch zkoumáním a manipulací databáze informace.[1]

Když dojde k poruše nebo události, síťová součást často pošle oznámení provozovateli sítě pomocí protokolu, jako je SNMP. Výstraha je trvalá indikace poruchy, která se odstraní pouze po vyřešení spouštěcí podmínky. Aktuální seznam problémů vyskytujících se na síťové součásti je často veden ve formě aktivního seznamu alarmů, jak je definován v RFC 3877, alarm MIB. Většina vymazaných poruch také udržuje seznam odstraněných poruch správa sítě systémy.[2]

Systémy pro správu poruch mohou používat složité filtrační systémy k přiřazování alarmů úrovním závažnosti. Mohou se pohybovat od závažnosti od ladění po nouzové, jako v syslog protokol.[3] Alternativně by mohli použít pole vnímané závažnosti funkce ITU X.733 Alarm Reporting Function. Tím se získají hodnoty očištěné, neurčité, kritické, hlavní, vedlejší nebo varování. Všimněte si, že nejnovější verze konceptu protokolu syslog vyvíjeného v rámci IETF zahrnuje mapování mezi těmito dvěma různými sadami závažnosti. Za dobrou praxi se považuje zasílání oznámení nejen v případě, že došlo k problému, ale také v případě jeho vyřešení. Druhé oznámení by bylo jasné.

Konzola pro správu poruch umožňuje a správce sítě nebo operátor systému sledovat události z více systémů a provádět akce na základě těchto informací. V ideálním případě by systém správy poruch měl být schopen správně identifikovat události a automaticky jednat, a to buď spuštěním programu nebo skriptu, který provede nápravná opatření, nebo aktivací oznamovacího softwaru, který umožňuje člověku provést řádný zásah (tj. Odeslat e-mailem nebo SMS text do a mobilní telefon ). Některé oznamovací systémy mají také pravidla eskalace, která upozorní řetězec jednotlivců na základě dostupnosti a závažnosti poplachu.

Typy

Existují dva hlavní způsoby, jak provádět správu poruch - jsou aktivní a pasivní. Pasivní správa poruch se provádí sběrem alarmů ze zařízení (obvykle přes SNMP pasti), když se v zařízeních něco stane. V tomto režimu systém správy poruch ví pouze to, zda je monitorované zařízení dostatečně inteligentní na to, aby vygenerovalo chybu a nahlásilo ji nástroji pro správu. Pokud však monitorované zařízení zcela selže nebo se zablokuje, nevyvolá alarm a problém nebude detekován. Aktivní správa poruch řeší tento problém aktivním sledováním zařízení pomocí nástrojů, jako je ping k určení, zda je zařízení aktivní a odpovídá. Pokud zařízení přestane reagovat, aktivní monitorování vyvolá alarm, který ukazuje, že zařízení není k dispozici, a umožňuje proaktivní nápravu problému.

Správa chyb zahrnuje všechny nástroje nebo postupy pro testování, diagnostiku nebo opravu sítě v případě poruchy.

Viz také

Poznámky

  1. ^ „Co je správa chyb? - Definice z WhatIs.com“. Citováno 2015-10-06.
  2. ^ „Co je správa chyb? Definiční a úvodní průvodce“. Analýza, správa a prohlížeč protokolů XpoLog. 2020-04-07. Citováno 2020-11-15.
  3. ^ RFC 3164

Reference