Zarządzanie incydentami dla dynamicznych zespołów
Czym jest docelowy poziom świadczenia usług (SLO)? SLO vs SLA vs SLI
Stworzenie pozytywnego środowiska użytkownika jest niezbędne, gdy świadczysz jakąś usługę, a pierwszym krokiem do tego jest poczucie odpowiedzialności. Twoim zadaniem jako usługodawcy jest upewnienie się, że klienci otrzymują usługi o jakości, jakiej oczekują od Twojej firmy.
Kiedy składasz obietnicę klientowi, musisz znaleźć sposób, aby mierzyć swoje osiągnięcia i ustalić, czy udało Ci się dotrzymać tego zobowiązania. Tutaj do gry wkraczają różne poziomy świadczonych usług, w szczególności SLO.
Być może terminy SLO, SLA i SLI obiły Ci się o uszy, ale czym dokładnie jest SLO? Odkryj znaczenie SLO oraz to, jak może pomóc Ci zapewnić klientom możliwie najlepszą usługę.
Czym jest SLO?
Docelowy poziom świadczenia usług (SLO) to wewnętrzny cel, który wyznaczasz, aby się upewnić, że świadczone usługi spełniają oczekiwania klientów. Oczekiwania te są przedstawione w umowach o poziomie świadczonych usług (SLA) zawartych między Tobą a klientem.
Pewnie zastanawiasz się, jak SLO wygląda w praktyce. Użyjmy usługi przesyłania strumieniowego jako przykładu. Jeśli świadczysz usługę przesyłania strumieniowego wideo za pośrednictwem swojej witryny, w umowach SLA możesz zapisać 99,9% czasu sprawności. Oznacza to, że usługa przesyłania strumieniowego może nie działać tylko przez około 43,2 minuty miesięcznie.
SLO odgrywają tutaj kluczową rolę, pozwalając wyznaczać wewnętrzne cele będące odzwierciedleniem obietnic składanych klientom. Kiedy masz SLO, zespoły mogą odpowiadać za zgłoszenia oraz je identyfikować i rozwiązywać, zanim wpłyną na środowisko klienta.
Komponenty SLO
SLO zawiera trzy podstawowe komponenty: wskaźnik, cel i ramy czasowe. Wskaźnik jest mierzalną liczbą, taką jak czas przestoju lub opóźnienie, podczas gdy celem jest konkretna liczba, którą próbujesz osiągnąć, na przykład 99,9% czasu dostępności. Ramy czasowe wskazują, ile czasu, od miesiąca do roku, zajmuje pomiar wskaźnika.
Gdy masz cel i wskaźnik, który śledzisz przez określony czas, możesz konkretnie zmierzyć swoje wyniki. Przyspiesza to proces reakcji na incydenty, umożliwiając rozwiązanie potencjalnych problemów z usługami, zanim odczują je klienci.
SLO vs SLA vs SLI
Wyzwania związane z umowami SLA
SLO, SLA i SLI różnią się od siebie, ale są ze sobą ściśle powiązane. Proces zaczyna się od umowy SLA uzgodnionej przez Ciebie z klientem. Możesz się na przykład zobowiązać się do odpowiadania na zapytania do działu wsparcia klienta w ciągu 24 godzin.
Aby spełnić to zobowiązanie, możesz zdefiniować SLO jako: „odpowiadanie na zapytania do działu wsparcia klienta w ciągu 24 godzin w danym okresie, takim jak 90% czasu w danym miesiącu”.
Twoim celem jest SLI, czyli czas reakcji działu wsparcia klienta w tym przykładzie.
Docelowy poziom świadczenia usług (SLO)
SLO (docelowy poziom świadczenia usług) definiuje wartość docelową określonego wskaźnika w danym okresie. Praktycznym przykładem SLO jest 99,99% czasu dostępności przez 30 dni. W rezultacie należałoby zmierzyć przestoje w świadczeniu usługi w ciągu miesiąca, aby się upewnić, że jest to mniej niż 4,32 minuty.
Umowa o gwarantowanym poziomie świadczenia usług (SLA)
Umowa o poziomie świadczonych usług (SLA) to umowa między usługodawcą a klientem określająca wymierne wskaźniki, takie jak czas dostępności, szybkość reakcji i konkretne obowiązki.
Umowy te są zwykle tworzone przez zespoły prawne i biznesowe firmy. Zawierają one formalne zobowiązania wobec klientów i konsekwencje niedotrzymania tych obietnic. Typowe konsekwencje to kara finansowa, przyznanie środków na usługę lub przedłużenie licencji.
SLI to docelowy wskaźnik w SLO będący wewnętrznym celem, który ustalasz i mierzysz, aby śledzić swoje wyniki. Tworzysz te SLO po to, aby spełnić wymogi umów SLA zawartych między Twoją usługą a klientami, którzy z niej korzystają.
W Jira Service Management możesz szybko tworzyć SLA, które pozwalają określić wewnętrzne cele na podstawie tych umów.
Wskaźnik poziomu usług (SLI)
SLI (wskaźnik poziomu usług) mierzy rzeczywistą zgodność z SLO. Przykładowo jeśli Twoja umowa SLA gwarantuje 99,95% czasu dostępności, Twój SLO może odzwierciedlać ten sam cel. Twój SLI jest więc rzeczywistym pomiarem czasu dostępności, który może wynosić 99,9% lub 99,95%. W celu zachowania zgodności z warunkami umowy SLA wskaźnik SLI nie może być niższy od wartości obietnic zawartych w tym dokumencie.
Budżety błędów
Budżety błędów są kluczowe w SLO, ponieważ nie można skupiać się wyłącznie na zapewnianiu ciągłej dostępności usługi. Chociaż czas dostępności jest istotny, trzeba znaleźć też czas na wprowadzanie innowacji i aktualizacji do swojego produktu. Twój budżet błędów mówi Ci, ile masz miejsca na błędy, dzięki czemu wiesz, w jakim stopniu możesz eksperymentować i wprowadzać innowacje.
Jeśli Twój SLO wynosi 99,99% czasu dostępności w ciągu 30 dni, masz około 4 minut dopuszczalnego przestoju w ciągu tych 30 dni. To umożliwia zespołom Agile wprowadzanie innowacji bez uszczerbku dla umów serwisowych.
Jak działają SLO?
Przyjrzyjmy się prostemu przykładowi SLO, aby ułatwić zrozumienie, jak one działają.
Zacznij od zidentyfikowania najważniejszych wskaźników, które chcesz śledzić. Czas dostępności to zwykle jeden z najważniejszych wskaźników, ale możesz również używać innych, takich jak czas zarządzania incydentami, poprawność i przepustowość. W tym przykładzie jako kluczowego wskaźnika użyjemy czasu przestojów.
Jeśli Twoja umowa SLA obejmuje gwarantowany czas dostępności wynoszący 99,9%, Twój SLO powinien to odzwierciedlać. Dążenie do 99,9% czasu dostępności w ciągu 30 dni oznacza, że Twój limit przestojów wynosi 43,2 minuty w ciągu miesiąca. Możesz korzystać z usług monitorowania czasu dostępności w celu śledzenia czasu dostępności i przestojów w ciągu miesiąca.
Pod koniec miesiąca możesz stwierdzić, czy udało Ci się osiągnąć swój SLO. Jeśli nie, musisz przeprowadzić analizę i usunąć przyczynę problemu. Odbije się to również na Twoim budżecie błędów, chociaż wpływ będzie się różnić w zależności od poziomu istotności incydentu.
Dlaczego SLO są ważne?
SLO mają kluczowe znaczenie dla zapewnienia klientom najlepszej usługi. Ich efektem jest nie tylko lepsze środowisko klienta; poprawiają również wydajność, usprawniają współpracę i upraszczają planowanie.
Skupienie zespołów wokół celów
Praca zespołowa jest niezbędna do świadczenia klientom najlepszych usług. Gdy określisz jasne oczekiwania za pomocą SLO, Twoje zespoły produktowe, inżynierskie i biznesowe mają wspólne cele, na których mogą się skupić. Dzięki wspólnemu punktowi odniesienia, do którego wszyscy mogą razem dążyć, zespoły pozostają zgodne i koncentrują się na jednym celu — zapewnieniu klientom lepszej usługi.
Udoskonalenie produktów i środowiska klienta
Gdy dostarczasz produkt lub usługę, najważniejsze jest środowisko klienta. Innowacyjne firmy wykorzystują SLO, aby dostarczać klientom lepsze produkty i usługi, niezależnie od tego, czy wiąże się to z minimalizacją przestojów w usłudze przesyłania strumieniowego, czy też z poprawą komunikacji dotyczącej incydentów i czasu reakcji. Poziomy SLO pomagają również identyfikować problemy z usługami, zanim odczują je klienci, więc możesz je rozwiązywać, gdy ma to znaczenie.
Zwiększenie automatyzacji
Automatyzacja to jeden z głównych trendów w zarządzaniu usługami IT (ITSM). Pozwala ona firmom oszczędzać czas i pieniądze, zapewniając jednocześnie lepsze środowisko klientom. Poziomy SLO wspierają automatyczne monitorowanie i alerty, umożliwiając ciągłe śledzenie czasu dostępności i innych kluczowych wskaźników.
Bez automatyzacji nie da się konkurować w dzisiejszym świecie biznesu. Automatyzacja powtarzalnych zadań ogranicza potrzebę pracy ręcznej, oszczędzając czas i pieniądze, jednocześnie minimalizując ryzyko ludzkich błędów.
Skrócenie przestojów
Przestoje nie tylko szkodzą biznesowi — tworzą negatywne środowisko klienta, które może skłonić klientów do odejścia do konkurencji. Poziomy SLO pozwalają mierzyć niezawodność za pomocą prostych, konkretnych wskaźników, dzięki czemu możesz monitorować przestoje i rozwiązywać problemy, które je powodują. Budżety błędów pomagają zespołom równoważyć innowacyjność i niezawodność, wyjaśniając, jak duże ryzyko mogą podjąć.
Najlepsze praktyki dotyczące SLO
Chociaż SLO przynoszą korzyści, przestrzeganie kilku prostych najlepszych praktyk może pomóc uprościć DevOps i zmaksymalizować korzyści płynące z SLO. Oto kilka wskazówek:
- Wesprzyj swoją umowę SLA: poziom SLO powinien wspierać umowę SLA, aby umożliwić Ci śledzenie i optymalizację wskaźników, takich jak przestoje, w celu upewnienia się, że wypełniasz umowę serwisową zawartą z klientami.
- Zachowaj prostotę: zdefiniowanie długiej listy SLO może wydawać się dobrym pomysłem, ale lepiej zachować prostotę i skupić się na istotnych wskaźnikach.
- Dostosowuj: SLO nie są ustalone raz na zawsze, więc nie bój się dostosowywać ich do zmieniających się potrzeb klientów.
Zarządzanie poziomami SLO za pomocą Jira Service Management
Poziomy SLO to potężny zasób, jeśli wiesz, jak z nich korzystać. Tworząc SLO, które są zgodne z Twoimi umowami SLA, możesz zapewnić klientom najlepszą usługę i najlepsze środowisko. Minimalizacja przestojów i skrócenie czasu reakcji prowadzi do ogólnej poprawy jakości usługi.
W Jira Service Management można łatwo tworzyć umowy SLA i SLO dla zespołów ds. tworzenia oprogramowania i IT. Jira pozwala zespołom działać wspólnie w czasie rzeczywistym, co zwiększa ich produktywność i usprawnia współpracę. Jak Jira Service Management może pomóc Ci zacząć korzystać ze SLO.
Poznaj proces informowania o incydentach za pomocą Statuspage
W tym samouczku pokażemy, jak wykorzystać szablony dotyczące incydentów do skutecznej komunikacji w trakcie awarii. Ich elastyczny charakter pozwala na dostosowanie ich do różnego rodzaju przerw w dostawie usług.
Przeczytaj ten samouczekZnaczenie procesu analizy post-mortem incydentu
Analiza post-mortem incydentu, nazywana również przeglądem po incydencie, jest najlepszym sposobem na podsumowanie tego, co zdarzyło się w trakcie incydentu, i wyciągnięcia wniosków.
Przeczytaj ten artykuł