Este relatório reúne informações do incidente que impactou a plataforma Huggy no dia 21 de maio de 2025.
Identificamos que um serviço utilizado pela nossa infraestrutura de nuvem passou por uma instabilidade que deixou o processamento de dados mais lento, a ponto de causar indisponibilidade no servidor devido à sobrecarga de tarefas não concluídas.
O incidente teve como impacto lentidão na troca de mensagens do canal WhatsApp, nas requisições da API, no serviço de controle de status do usuário e na entrega das notificações em tempo real.
Como solução, ampliamos a capacidade de processamento do serviço para que a plataforma esteja mais preparada para lidar com situações adversas de soluções de terceiros.
Um dos serviços utilizados pela nossa infraestrutura de nuvem passou por uma instabilidade que deixou o processamento de dados mais lento, a ponto de causar indisponibilidade no servidor devido à sobrecarga de tarefas não concluídas.
Detectamos inicialmente um impacto no envio e recebimento de mensagens do canal WhatsApp, mas os efeitos se estenderam a outros recursos da plataforma, como as requisições de API, o status dos usuários e a entrega em tempo real de notificações.
Uma vez identificada a causa raiz, tentamos inicialmente reiniciar o serviço, mas pouco tempo depois houve uma nova queda no servidor.
Visando aplicar uma solução definitiva, decidimos redimensionar a capacidade de processamento do serviço, o que impediu que houvesse uma nova indisponibilidade dos recursos enquanto a instabilidade do serviço não fosse resolvida.
Nossa equipe de tecnologia continua atenta e em busca de melhorias para prevenir que situações adversas de soluções de terceiros não gerem impactos negativos no uso da plataforma Huggy.