Instabilidade nos servidores AWS

Incident Report for Kobana

Postmortem

Data do Incidente: Segunda-feira, 19 de outubro de 2025
Duração: 11:28 AM / 17:28 AM. Seis horas totais.
Impacto: Indisponibilidade parcial/total do serviço
Status: Resolvido

No dia 19 de outubro de 2025, nosso serviço experimentou uma indisponibilidade causada por uma interrupção na infraestrutura da Amazon Web Services (AWS).
A interrupção sofrida pela AWS foi publicada em jornais, televisão e internet, uma vez que a ocorrência foi notificada por mais de 4 milhões de usuários ao redor do mundo. A falha aconteceu devido à "taxas de erro significativas" identificadas no DynamoDB, sistema de banco de dados da AWS que opera em regiões de data centers e que é voltado para aplicações que exigem alta velocidade e estabilidade.
Durante este período, nossos clientes enfrentaram dificuldades para acessar a plataforma ou experimentaram lentidão em operações realizadas na Kobana. Os impactos não foram maiores devido ao uso do servidor de backup que temos em nossa empresa.
Pedimos sinceras desculpas pelo transtorno causado. A confiabilidade do nosso serviço é nossa maior prioridade, e estamos comprometidos em garantir que incidentes como este sejam cada vez mais raros.
Reforçamos que nos mantemos constantemente em busca de melhorar nosso produto, visando aumentar e aperfeiçoar nossos backups e sistemas de failover automático.

Posted Oct 23, 2025 - 15:21 GMT-03:00

Resolved

Todos os serviços operam normalmente.
Sem ocorrências nos últimos minutos.

Estamos encerrando o incidente, mas continuaremos monitorando nas próximas horas.
Posted Oct 20, 2025 - 16:21 GMT-03:00

Update

Nossos servidores principais estão recebendo um alto volume de tráfego.

Continuaremos monitorando até a normalização total.
Posted Oct 20, 2025 - 16:16 GMT-03:00

Update

Nossos servidores principais já estão recebendo um alto volume de tráfego,
indicando que o serviço está próximo de ser normalizado.

Recomendamos aos clientes que estão utilizando nossos backups, a permanecerem utilizando os mesmos.

Assim que verificarmos a total normalização, informaremos para troca de volta aos servidores principais.
Posted Oct 20, 2025 - 15:46 GMT-03:00

Monitoring

Nosso monitoramento indica sinais de recuperação de tráfego no endereço principal.
Ainda com muita instabilidade.

Continuamos atentos e informaremos assim que houver novidades.
Posted Oct 20, 2025 - 14:34 GMT-03:00

Update

Em seu último update, a AWS informou que encontrou a causa do problema.
Informou que está trabalhando para resolver por completo a situação.

Porém, sem tempo de retorno completo informado.

Continuamos monitorando nossos serviços.

Recomendamos o uso dos nossos servidores de backup,
conforme informado acima.
Posted Oct 20, 2025 - 13:39 GMT-03:00

Identified

Identificamos uma instabilidade em nosso sistema, diretamente relacionada à instabilidade reportada junto a AWS, que já está sendo acompanhada por nossa equipe técnica.
Nosso monitoramento indica também que alguns bancos estão passando por esta instabilidade.
No momento, não temos uma estimativa de prazo de resolução.

Recomendamos a utilização do endpoint de backup: https://developers.kobana.com.br/reference/endpoints-1
Posted Oct 20, 2025 - 11:58 GMT-03:00

Update

We are continuing to investigate this issue.
Posted Oct 20, 2025 - 11:56 GMT-03:00

Investigating

Nosso sistema de monitoramento detectou um problema de lentidão ou indisponibilidade neste componente. Nosso time ja foi notificado e iniciamos uma investigação.
Posted Oct 20, 2025 - 11:45 GMT-03:00
This incident affected: Produção (WEB Produção, API Produção).