Gestione degli imprevisti per i team high velocity
Cos'è un obiettivo del livello di servizio (SLO)? SLA, SLO e SLI a confronto
Quando si fornisce un servizio, è essenziale creare un'esperienza utente positiva, e questo inizia con la responsabilità. In qualità di fornitore di servizi, è tuo compito assicurarti che i clienti ricevano la qualità del servizio che si aspettano dalla tua azienda.
Quando fai una promessa a un cliente, ti serve un modo per misurare le tue prestazioni e determinare se hai tenuto fede all'impegno. È qui che entrano in gioco i diversi livelli di servizio, in particolare gli SLO.
Forse hai già sentito parlare di SLO, SLA e SLI... Ma cos'è esattamente uno SLO? Scopri il significato di SLO e come può aiutarti a fornire il miglior servizio possibile ai clienti.
Che cos'è uno SLO?
Un obiettivo del livello di servizio (SLO) è un obiettivo interno che stabilisci per assicurarti che i servizi che offri soddisfino le aspettative dei clienti. Queste aspettative sono delineate negli accordi sul livello di servizio (SLA), cioè accordi tra te e il cliente.
Ti starai chiedendo cosa sia uno SLO nella pratica. Usiamo come esempio un servizio di streaming. Se fornisci un servizio di streaming video tramite il tuo sito web, potresti includere negli SLA un tempo di attività del 99,9%. Questo significa che il servizio di streaming può essere inattivo solo per circa 43,2 minuti al mese.
Gli SLO svolgono un ruolo chiave in questo caso, perché ti consentono di definire obiettivi interni che riflettano le promesse che fai ai clienti. Quando definisci uno SLO, i team possono essere responsabili dei problemi e identificarli e risolverli prima che influiscano sull'esperienza cliente.
Componenti di uno SLO
Uno SLO ha tre componenti principali: metrica, obiettivo e finestra temporale. La metrica è un numero misurabile, come il tempo di inattività o la latenza, mentre l'obiettivo è il numero specifico che stai cercando di raggiungere, ad esempio un tempo di attività del 99,9%. La finestra temporale indica quanto tempo occorre per misurare la metrica e va da un mese a un anno.
Quando monitori un obiettivo e una metrica per un determinato periodo, puoi misurare concretamente le tue prestazioni. Questo accelera il processo di risposta agli imprevisti, consentendoti di risolvere potenziali problemi di servizio prima che si ripercuotano sui clienti.
SLA, SLO e SLI a confronto
Le sfide degli SLA
SLO, SLA e SLI sono tutti diversi ma strettamente legati tra loro. Il processo inizia con uno SLA che tu e il cliente accettate. Ad esempio, potresti impegnarti a rispondere alle richieste di assistenza clienti entro 24 ore.
Per rispettare questo impegno, definiresti uno SLO come: "Rispondere alle richieste di assistenza clienti entro 24 ore per un determinato periodo, ad esempio il 90% delle volte in un determinato mese".
Vuoi raggiungere lo SLI, che in questo esempio è il tempo di risposta dell'assistenza clienti.
Obiettivo del livello di servizio (SLO)
Un SLO (obiettivo del livello di servizio) definisce un valore target per una particolare metrica in un determinato periodo di tempo. Un esempio reale di SLO è un tempo di attività del 99,99% in 30 giorni. Di conseguenza, dovresti misurare il tempo di inattività del servizio nell'arco di un mese per assicurarti che sia inferiore a 4,32 minuti.
Accordo sui livelli di servizio (SLA)
Uno SLA (accordo sul livello di servizio) è un accordo tra fornitore e cliente che definisce metriche misurabili, come tempo di attività, reattività e responsabilità.
Questi accordi sono generalmente creati dai team legali e di sviluppo aziendale e rappresentano impegni formali nei confronti dei clienti e le conseguenze nel caso in cui tali promesse non vengano mantenute. In genere, le conseguenze includono sanzioni pecuniarie, crediti di servizio o estensioni della licenza.
Lo SLI è la metrica a cui ti rivolgi nello SLO, cioè un obiettivo interno che stabilisci e misuri per monitorare le tue prestazioni. Crei questi SLO per soddisfare gli SLA, cioè accordi che hai stipulato tra il tuo servizio e i clienti che lo utilizzano.
In Jira Service Management, puoi creare rapidamente SLA, che ti consentono di stabilire obiettivi interni in base a tali accordi.
Indicatore del livello di servizio (SLI)
Uno SLI (indicatore del livello di servizio) misura l'effettiva conformità a uno SLO. Se lo SLA garantisce un tempo di attività del 99,95%, lo SLO potrebbe riflettere lo stesso obiettivo. Lo SLI è, quindi, la misura effettiva del tempo di attività, che potrebbe essere del 99,9% o del 99,95%. Per restare conforme allo SLA, lo SLI dovrà mantenere o superare le promesse fatte in quel documento.
Budget di errore
I budget di errore sono fondamentali negli SLO perché non puoi impegnarti solo a garantire che il servizio sia sempre disponibile. Sebbene il tempo di attività sia essenziale, devi trovare il tempo per innovare e aggiornare il prodotto. Il budget di errore ti dice quanto margine di errore hai, il che ti consente di sapere quanto puoi sperimentare e innovare.
Se lo SLO ha un tempo di attività del 99,99% in 30 giorni, hai circa 4 minuti di tempo di inattività consentito in quei 30 giorni. Questo consente ai team agile di innovare senza compromettere gli accordi di servizio.
Come funzionano gli SLO?
Esaminiamo un semplice esempio di SLO per spiegare meglio come funzionano.
Inizia identificando le metriche chiave da monitorare. In genere una delle metriche fondamentali è il tempo di attività, ma puoi anche usare metriche come i tempi di gestione degli imprevisti, la correttezza e il rendimento. In questo esempio, useremo il tempo di inattività come metrica chiave.
Se lo SLA include una garanzia di tempo di attività del 99,9%, lo SLO dovrebbe rispecchiarlo. Puntare a un tempo di attività del 99,9% in 30 giorni significa che hai un margine di 43,2 minuti di tempo di inattività nell'arco di un mese. Puoi utilizzare i servizi di monitoraggio del tempo di attività per tenere traccia dei tempi di attività e inattività durante il mese.
Alla fine del mese, puoi determinare se hai raggiunto o mancato lo SLO. Se manchi lo SLO, è essenziale indagare e correggere la causa del problema. Anche il budget di errore ne risentirà, sebbene l'impatto varierà a seconda dei livelli di gravità dell'imprevisto.
Perché gli SLO sono importanti?
Gli SLO sono fondamentali per garantire il miglior servizio ai clienti. Non si limitano a fornire un'esperienza migliore ai clienti, ma migliorano anche le prestazioni e la collaborazione e semplificano la pianificazione.
Allinea i team sugli obiettivi
Il lavoro di squadra è essenziale per fornire i migliori servizi ai clienti. Quando stabilisci aspettative chiare con gli SLO, i team di prodotto, di progettazione e aziendali hanno obiettivi condivisi su cui concentrarsi. Avendo un benchmark condiviso su cui collaborare, i team restano uniti e si impegnano per il raggiungimento di un unico obiettivo: fornire un servizio migliore ai clienti.
Migliora l'esperienza cliente all'interno del prodotto
Quando offri un prodotto o un servizio, ciò che conta è l'esperienza cliente. Le aziende innovative utilizzano gli SLO per fornire prodotti e servizi migliori, che si tratti di ridurre al minimo il tempo di inattività per un servizio di streaming o di migliorare la comunicazione degli imprevisti e i tempi di risposta. Gli SLO ti aiutano anche a identificare i problemi del servizio prima che abbiano un impatto sui clienti, così puoi correggerli quando serve.
Aumenta l'automazione
L'automazione è una delle principali tendenze nella gestione del servizio IT (ITSM). Permette alle aziende di risparmiare tempo e denaro e allo stesso tempo offre una migliore esperienza cliente. Gli SLO supportano il monitoraggio e gli avvisi automatici, consentendoti di monitorare costantemente il tempo di attività e altre metriche chiave.
Per competere nell'odierno mondo aziendale, l'automazione è un must. L'automazione di task ripetitivi riduce la necessità di lavoro manuale, facendoti risparmiare tempo e denaro e riducendo al minimo il rischio di errore umano.
Riduce il tempo di inattività
I tempi di inattività non sono solo negativi per le aziende, ma creano anche un'esperienza negativa per i clienti, con il rischio che si rivolgano alla concorrenza. Gli SLO ti consentono di misurare l'affidabilità con metriche semplici e concrete, in modo da poter monitorare il tempo di inattività e correggere i problemi che lo causano. I budget di errore aiutano i team a bilanciare innovazione e affidabilità chiarendo quanti rischi possono correre.
Best practice sugli SLO
Sebbene gli SLO possano essere utili, alcune semplici best practice possono aiutare a semplificare DevOps e massimizzare i vantaggi degli SLO. Ecco alcuni suggerimenti:
- Supporta lo SLA: lo SLO dovrebbe supportare lo SLA, quindi puoi monitorare e ottimizzare metriche come il tempo di inattività per assicurarti di rispettare il contratto di servizio che hai stipulato con i clienti.
- Punta alla semplicità: la definizione un lungo elenco di SLO potrebbe sembrare una buona idea, ma è meglio puntare alla semplicità e concentrarsi sulle metriche che contano.
- Adatta: gli SLO non sono scolpiti nella pietra, quindi non aver paura di adattarli per soddisfare le mutevoli esigenze dei clienti.
Gestisci gli SLO con Jira Service Management
Gli SLO sono risorse efficaci se sai come usarli. Creando SLO in linea con i tuoi SLA, puoi avere la certezza di offrire il miglior servizio e la migliore esperienza cliente. Ridurre al minimo il tempo di inattività e i tempi di risposta porta a un miglioramento complessivo del servizio.
Con Jira Service Management, puoi creare facilmente SLA e SLO per coordinare i team IT e di sviluppo software. Jira consente ai membri dei team di collaborare in tempo reale, migliorando la produttività e la collaborazione. Scopri come Jira Service Management ti aiuta ad acquisire dimestichezza con gli SLO.
Scopri di più sulla comunicazione degli imprevisti con Statuspage
In questo tutorial ti mostreremo come utilizzare i modelli di imprevisto per comunicare in modo efficace durante le interruzioni. Puoi adattarlo a molti tipi di interruzione del servizio.
Segui il tutorialL'importanza del processo di analisi retrospettiva degli imprevisti
L'analisi retrospettiva degli imprevisti, nota anche come revisione post-imprevisto, è il modo migliore per esaminare ciò che è avvenuto durante un imprevisto e fissare le lezioni apprese.
Leggi l'articolo