Close

Gerenciamento de incidentes para equipes de alta velocidade

O que é um Objetivo de Nível de Serviço (SLO)? SLO vs. SLA vs. SLI

Criar uma experiência positiva para o usuário é essencial ao prestar um serviço, e isso começa com responsabilidade. Como provedor de serviços, é sua responsabilidade garantir que os clientes recebam a qualidade de serviço que esperam da sua empresa.

Quando você faz uma promessa a um cliente, precisa de uma maneira de medir seu desempenho e determinar se cumpriu esse compromisso. É aí que os diferentes níveis de serviço, em especial os SLOs, entram em jogo.

Você já deve ter ouvido falar sobre SLOs, SLAs e SLIs, mas o que é um SLO? Descubra o significado de SLO e como ele pode ajudar você a oferecer o melhor serviço possível aos seus clientes.

O que é SLO?

Um Objetivo de Nível de Serviço (SLO) é uma meta interna que você define para garantir que os serviços oferecidos atendam às expectativas dos clientes. Essas expectativas do cliente estão descritas em acordos de nível de serviço (SLAs), entre você e o cliente.

Você deve estar se perguntando como é um SLO na prática. Vamos usar um serviço de streaming como exemplo. Se você oferece um serviço de streaming de vídeo por meio do seu site, pode incluir 99,9% de tempo de atividade nos seus SLAs. Isso significa que seu serviço de streaming só pode ficar inativo por cerca de 43,2 minutos por mês.

Os SLOs desempenham um papel fundamental aqui, permitindo que você defina metas internas que reflitam as promessas aos clientes. Com SLOs, as equipes podem se responsabilizar, identificar e resolver os problemas antes que eles afetem a experiência do cliente.

Componentes de um SLO

Um SLO tem três componentes principais: métrica, meta e janela de tempo. A métrica é um número mensurável, como disponibilidade ou latência, já a meta é o número específico que você está tentando alcançar, por exemplo, 99,9% de disponibilidade. A janela de tempo indica quanto tempo leva para medir a métrica, variando de um mês a um ano.

Quando você tem uma meta e uma métrica que está acompanhando por um período específico, pode medir seu desempenho em valores exatos. Assim, você acelera o processo de resposta a incidentes, permitindo a resolução de possíveis problemas de serviço antes que eles afetem os clientes.

SLO vs. SLA vs. SLI

O desafio dos SLAs

SLOs, SLAs e SLIs são diferentes, mas estão todos ligados. O processo começa com um SLA acordado entre você e o cliente. Por exemplo, você pode se comprometer a responder às perguntas de suporte ao cliente em até 24 horas.

Para cumprir esse compromisso, você pode definir um SLO como: “Responder às perguntas de suporte ao cliente dentro de 24 horas por um determinado período, como 90% do tempo em um determinado mês”.

Você tem como objetivo o SLI, que é o tempo de resposta do suporte ao cliente neste exemplo.

Objetivo de Nível de Serviço (SLO)

Um SLO (Objetivo de Nível de Serviço) define um valor alvo para uma métrica específica em um determinado período de tempo. Um exemplo real de um SLO é um tempo de atividade de 99,99% em 30 dias. Como resultado, você precisaria medir o tempo de inatividade do seu serviço ao longo de um mês para garantir que seja inferior a 4,32 minutos.

Acordo de Nível de Serviço (SLA)

Um SLA (acordo de nível de serviço) é um acordo entre o provedor e o cliente que descreve métricas mensuráveis, como tempo de atividade, tempo de resposta e responsabilidades específicas.

Em geral, esses acordos são criados pelas equipes jurídicas e de desenvolvimento de negócios de uma empresa e representam compromissos formais com os clientes e as consequências se você não cumprir essas promessas. As consequências incluem penalidades financeiras, créditos de serviço ou extensões de licença.

Os SLIs são a métrica buscada no seu SLO, que é um objetivo interno que você define e mede para monitorar seu desempenho. Você cria esses SLOs para cumprir os SLAs, que são acordos firmados entre o seu serviço e os clientes que o usam.

No Jira Service Management, você cria SLAs com rapidez, o que permite definir objetivos internos com base nesses contratos.

Indicador de nível de serviço (SLI)

Um SLI (indicador de nível de serviço) mede a conformidade real com um SLO. Por exemplo, se seu SLA garante 99,95% de tempo de atividade, seu SLO pode refletir a mesma meta. Então, seu SLI é a medida real do seu tempo de atividade, que pode ser de 99,9% ou 99,95%. Para manter a conformidade com seu SLA, o SLI deve cumprir ou superar as promessas feitas nesse documento.

Orçamento para erros

Os orçamentos para erros são cruciais em SLOs porque você não pode se concentrar apenas em garantir que seu serviço esteja sempre disponível. Embora o tempo de atividade seja essencial, você deve encontrar tempo para inovar e atualizar seu produto. Seu orçamento para erros indica quanto espaço para erros você tem, o que permite que você saiba o quanto você pode experimentar e inovar.

Se seu SLO é 99,99% de tempo de atividade em 30 dias, você tem cerca de 4 minutos de tempo de inatividade permitido nesses 30 dias. Isso capacita equipes ágeis a inovarem sem comprometer os acordos de serviço.

Como os SLOs funcionam?

Vamos examinar um exemplo simples de um SLO para fornecer uma compreensão mais clara de como eles funcionam.

Comece identificando as principais métricas que você quer monitorar. Em geral, o tempo de atividade é uma das métricas mais críticas, mas você também pode usar métricas como tempo de gerenciamento de incidentes, exatidão e produtividade. Neste exemplo, vamos usar o tempo de inatividade como a métrica principal.

Se seu SLA inclui uma garantia de tempo de atividade de 99,9%, seu SLO deve refletir isso. Visar um tempo de atividade de 99,9% em 30 dias significa que você está limitado a 43,2 minutos de inatividade em um mês. Você pode usar serviços de monitoramento de atividade para monitorar seus tempos de atividade e de inatividade ao longo do mês.

No final do mês, você pode determinar se cumpriu ou não seu SLO. Se não cumpriu o SLO, é essencial investigar e corrigir a causa do problema. Seu orçamento para erros também será afetado, embora o impacto varie dependendo dos níveis de gravidade do incidente.

Por que os SLOs são importantes?

Os SLOs são fundamentais para garantir que você ofereça o melhor serviço aos seus clientes. Eles não apenas geram uma melhor experiência ao cliente, os SLOs também melhoram o desempenho, aprimoram a colaboração e simplificam o planejamento.

Alinha equipes em torno de metas

O trabalho em equipe é essencial para oferecer os melhores serviços aos seus clientes. Ao definir expectativas claras com SLOs, suas equipes de produto, engenharia e negócios têm metas compartilhadas nas quais podem se concentrar. Ter uma referência compartilhada que todos possam trabalhar juntos para alcançar mantém as equipes unidas e trabalhando em prol de um único objetivo: oferecer um serviço melhor aos clientes.

Aprimora os produtos e a experiência do cliente

Quando você está fornecendo um produto ou serviço, a experiência do cliente é o que importa. Empresas inovadoras usam SLOs para fornecer os melhores produtos e serviços aos clientes, seja minimizando o tempo de inatividade de um serviço de streaming ou aprimorando os tempos de resposta e a comunicação de incidentes. Os SLOs também ajudam a identificar problemas de serviço antes que eles afetem os clientes. Assim, você consegue corrigir os problemas quando necessário.

Aumenta a automação

A automação é uma das maiores tendências no gerenciamento de serviços de TI (ITSM). Ela ajuda a economizar tempo e dinheiro para as empresas e, ao mesmo tempo, oferece uma melhor experiência ao cliente. Com os SLOs, você pode usar monitoramento e alertas automatizados, o que permite sempre acompanhar o tempo de atividade e outras métricas importantes.

Para competir no mundo empresarial de hoje, a automação é essencial. A automação de tarefas repetitivas reduz a necessidade de trabalho manual, economizando tempo e dinheiro e minimizando o risco de erro humano.

Reduz o tempo de inatividade

O tempo de inatividade não é ruim apenas para os negócios — ele cria uma experiência negativa para o cliente, o que pode levar os clientes a procurarem a concorrência. Os SLOs permitem medir a confiabilidade com métricas simples e concretas, para que você possa monitorar o tempo de inatividade e corrigir os problemas que o causam. Os orçamentos para erros ajudam as equipes a equilibrarem inovação e confiabilidade, esclarecendo quanto risco elas podem correr.

Práticas recomendadas de SLOs

Os SLOs são benéficos, mas seguir algumas práticas recomendadas simples pode ajudar a simplificar o DevOps e maximizar os benefícios dos SLOs. Aqui estão algumas dicas:

  • Ofereça suporte ao seu SLA: seu SLO deve oferecer suporte ao seu SLA, para que você possa monitorar e otimizar métricas como tempo de inatividade para garantir que está cumprindo o acordo de serviço que você fez com seus clientes.
  • Mantenha a simplicidade: estabelecer uma longa lista de SLOs pode parecer uma boa ideia, mas é melhor manter uma lista simples com foco em métricas importantes.
  • Adapte: os SLOs não são imutáveis, então não tenha medo de ajustar eles para atender às necessidades em constante mudança de seus clientes.

Gerencie SLOs com o Jira Service Management

Se você souber usar, os SLOs são um recurso poderoso. Ao criar SLOs alinhados aos seus SLAs, você garante o melhor serviço e experiência ao cliente. Minimizar o tempo de inatividade e reduzir os tempos de resposta resulta em um serviço geral aprimorado.

Com o Jira Service Management, fica fácil criar SLAs e SLOs para orientar as equipes de desenvolvimento de software e TI. O Jira até permite que as equipes colaborem em tempo real, otimizando a produtividade e a colaboração. Descubra como o Jira Service Management pode ajudar você a começar a usar SLOs.