Lentidão no recebimento de mensagens pelo Canal WhatsApp

Incident Report for Huggy

Postmortem

Sumário

Este relatório reúne informações do incidente que impactou a plataforma Huggy no dia 21 de maio de 2025.

Identificamos que um serviço utilizado pela nossa infraestrutura de nuvem passou por uma instabilidade que deixou o processamento de dados mais lento, a ponto de causar indisponibilidade no servidor devido à sobrecarga de tarefas não concluídas.

O incidente teve como impacto lentidão na troca de mensagens do canal WhatsApp, nas requisições da API, no serviço de controle de status do usuário e na entrega das notificações em tempo real.

Como solução, ampliamos a capacidade de processamento do serviço para que a plataforma esteja mais preparada para lidar com situações adversas de soluções de terceiros.

Linha do tempo

  • 📆 21/05/2025 12:15 (GMT-3): Identificação da instabilidade
  • 📆 21/05/2025 14:20 (GMT-3): Descoberta da causa raiz do incidente
  • 📆 21/05/2025 14:20 (GMT-3): Correção do sistema
  • 📆 21/05/2025 17:03 (GMT-3): Reincidência da instabilidade
  • 📆 21/05/2025 17:46 (GMT-3): Correção crítica do sistema
  • 📆 21/05/2025 18:00 (GMT-3): Normalização da plataforma

Causa raiz do incidente

Um dos serviços utilizados pela nossa infraestrutura de nuvem passou por uma instabilidade que deixou o processamento de dados mais lento, a ponto de causar indisponibilidade no servidor devido à sobrecarga de tarefas não concluídas.

Impacto

Detectamos inicialmente um impacto no envio e recebimento de mensagens do canal WhatsApp, mas os efeitos se estenderam a outros recursos da plataforma, como as requisições de API, o status dos usuários e a entrega em tempo real de notificações.

Plano de ação

Uma vez identificada a causa raiz, tentamos inicialmente reiniciar o serviço, mas pouco tempo depois houve uma nova queda no servidor.

Visando aplicar uma solução definitiva, decidimos redimensionar a capacidade de processamento do serviço, o que impediu que houvesse uma nova indisponibilidade dos recursos enquanto a instabilidade do serviço não fosse resolvida.

Nossa equipe de tecnologia continua atenta e em busca de melhorias para prevenir que situações adversas de soluções de terceiros não gerem impactos negativos no uso da plataforma Huggy.

Posted May 30, 2025 - 16:53 GMT-03:00

Resolved

A causa do problema foi identificada e a solução implementada.

Pedimos desculpas pelo ocorrido e agradecemos a sua compreensão e paciência.
Posted May 21, 2025 - 18:00 GMT-03:00

Monitoring

O incidente identificado anteriormente em alguns de nossos serviços foi resolvido.
Nossa equipe de Engenharia concluiu as ações corretivas necessárias, e os serviços afetados já operam normalmente.
Seguiremos monitorando para garantir a estabilidade do serviço.
Agradecemos pela paciência e seguimos à disposição para quaisquer esclarecimentos.
Posted May 21, 2025 - 17:46 GMT-03:00

Investigating

Identificamos, novamente, uma recorrência de instabilidade em alguns de nossos serviços, o que pode causar lentidão no processamento de mensagens.

Nossa equipe de Engenharia já está atuando na análise da causa raiz e trabalhando para solucionar o incidente o mais rápido possível.

Manteremos todos atualizados conforme avançarmos com as investigações e correções necessárias.

Agradecemos pela compreensão e permanecemos à disposição para qualquer dúvida.
Posted May 21, 2025 - 17:03 GMT-03:00

Monitoring

Identificamos um pico de demanda em alguns de nossos serviços, o que ocasionou lentidão no processamento de mensagens e instabilidade temporária no controle de status dos usuários.
Nossa equipe de Engenharia agiu rapidamente para implementar melhorias nos pontos críticos. Após a aplicação das correções e o autoescalonamento do sistema, os incidentes foram resolvidos e a operação foi totalmente normalizada.
Agradecemos pela paciência e compreensão durante esse período. Continuamos monitorando ativamente nossos serviços para assegurar a estabilidade e a qualidade contínua para todos os usuários.
Em caso de dúvidas, nossa equipe está à disposição.
Posted May 21, 2025 - 14:20 GMT-03:00

Investigating

Estamos enfrentando uma lentidão no recebimento de mensagens via WhatsApp, afetando todos os provedores.
O time de engenharia está investigando o caso com prioridade. Vale ressaltar que o envio de mensagens através do painel está funcionando normalmente.
Verificamos também que instabilidade impactou o serviço de controle de status e notificações em tempo real.
Agradecemos pela compreensão e manteremos todos atualizados sobre o andamento da resolução.
Posted May 21, 2025 - 12:15 GMT-03:00
This incident affected: Channels (WhatsApp).