A Amazon Web Services (AWS) finalmente revelou o que causou o apagão que tirou diversos serviços do ar na última segunda-feira (20). A empresa apontou um “bug” no DynamoDB, seu sistema de banco de dados, como o responsável pela falha.
Conforme noticiado pelo VergeTech, os transtornos começaram na manhã de segunda. Embora a AWS tenha conseguido reestabelecer parte dos serviços com correções feitas ao longo do dia, a estabilidade total só foi alcançada no dia seguinte.
O Que Aconteceu no DynamoDB
Em seu comunicado oficial, a AWS explicou que a interrupção foi resultado de múltiplos bugs em seu sistema DynamoDB. Este software de automação é crucial para armazenar dados de clientes e é programado para se atualizar constantemente, otimizar o tráfego e aumentar a capacidade de armazenamento de forma autônoma.
O problema inicial foi um pico nas taxas de erro de conexão na região da Virgínia do Norte (US-East-1), onde estão localizados os principais data centers da AWS. Essa falha se propagou internamente no servidor, resultando na perda de conexão para os clientes.
A empresa descreveu o evento como “um defeito latente no sistema de gerenciamento automatizado de DNS [sistema de nomes de domínio] do serviço”. Como o bug não pôde ser corrigido automaticamente, como esperado, foi necessária a intervenção manual de um operador.
Impacto Global e Resolução
Durante a segunda-feira, a AWS manteve os clientes informados sobre o andamento dos reparos. Os serviços voltaram durante a noite do mesmo dia, mas a solução completa do problema veio apenas no dia seguinte.
No auge da instabilidade, mais de 6,5 milhões de usuários em todo o mundo reportaram falhas de acesso. Plataformas populares como Zoom, Alexa, Duolingo, Snapchat, Fortnite, Mercado Livre e Prime Video foram afetadas.
Até mesmo usuários de tecnologia doméstica sofreram as consequências: donos de colchões inteligentes da Eight Sleep relataram que seus dispositivos ficaram presos em posições inclinadas, tiveram a temperatura desregulada ou ativaram alarmes sem motivo, devido à conexão com o sistema da AWS.
A Discussão sobre a Centralização da Internet
O incidente reacendeu o debate sobre a dependência de grandes provedores de serviços em nuvem. Especialistas alertaram que a falha de um único provedor pode comprometer o funcionamento de uma vasta porção da internet, colocando em risco a experiência de milhões de usuários.
A defesa da descentralização desses serviços ganhou força, com o argumento de que a dependência de poucas empresas como a AWS é um risco. Por outro lado, o contra-argumento é que essas companhias possuem o capital e os recursos necessários para garantir operações globais seguras e resilientes.