Metodologia
Jak monitorujemy awarie?
StatusUslugi.pl nie opiera się na domysłach. Nasz system łączy masowe raporty od użytkowników z precyzyjną analizą statystyczną, aby eliminować fałszywe alarmy.
Analiza Baseline
System dynamicznie oblicza "normalny" poziom raportów dla każdej minuty dnia, bazując na danych z ostatnich 30 dni. Dopiero gwałtowne odchylenie od tej normy generuje alert.
Weryfikacja Krzyżowa
Każdy raport przechodzi przez system TrustScore. Analizujemy techniczne parametry zgłoszenia, aby odróżnić rzeczywiste błędy od problemów z lokalnym łączem użytkownika.
Klastry Geograficzne
Grupujemy raporty według regionów. Jeśli usterka występuje masowo w jednym węźle (np. Warszawa), system precyzyjnie oznacza zakres terytorialny problemu.
Jak czytać nasze dane?
Każda usługa w naszym serwisie posiada wykres aktywności. Niebieska linia reprezentuje aktualne zgłoszenia, natomiast szara strefa to bezpieczny poziom oczekiwany.
Alert: Odchylenie > 300% normy
Monitoring: Interwał co 60 sekund
Cykl życia incydentu
Detekcja anomalii
Algorytm wykrywa wzrost liczby raportów. System automatycznie sprawdza czas odpowiedzi serwerów HTTP monitorowanej usługi w 5 różnych lokalizacjach.
Klasyfikacja błędu
Raporty są dzielone na kategorie: logowanie, płatności, aplikacja mobilna. Pozwala to na precyzyjne określenie, który podsystem danej marki uległ awarii.
Publikacja i archiwizacja
Dane trafiają na stronę główną i podstronę usługi. Po ustąpieniu usterki, incydent jest zapisywany w historii jako archiwalny raport stabilności.