Oferecimento

Apagão na AWS: quais as empresas afetadas e tudo o que sabemos sobre a pane da Amazon

Falha global de 16 horas nos servidores da Amazon deixou fora do ar aplicativos como Snapchat, Alexa, PayPal e Fortnite; entenda

20 out 2025 - 08h54
(atualizado às 20h21)

Uma falha no serviço de nuvem da Amazon, o AWS (Amazon Web Services), provocou um gigantesco e persistente apagão global na internet nesta segunda-feira, 20, afetando milhões de usuários e mais 1 mil empresas que dependem da plataforma. O problema durou quase 16 horas e derrubou aplicativos e serviços digitais em diversos países, inclusive no Brasil. Às 19h53, a companhia declarou que o problema estava solucionado — por volta deste horário, as reclamações no site DownDetector já apresentavam baixa acentuada.

Publicidade

Entre os afetados durante todo o dia estavam a assistente virtual Alexa, a rede social Snapchat, o serviço de pagamentos PicPay e os jogos online Fortnite e Roblox. Depois de uma melhora pela manhã, uma nova onda de instabilidade tomou conta do serviço, com novos picos de reclamação, incluindo serviços muito usados no País, como iFood, Stone, Wellhub (antigo Gympass) e OLX, além de PicPay.

O problema, então seguiu durante todo o dia. O aviso de resolução veio já na parte da noite. Às 19h53, a companhia afirmou: ". Às 19h01, todos os serviços da AWS voltaram a operar normalmente. Alguns serviços, como AWS Config, Redshift e Connect, continuam com um acúmulo de mensagens que serão processadas nas próximas horas", diz a nota.

Ao longo da manhã, a empresa parecia fazer progresso, mas às 11h14 ficou admitiu que ainda enfrentava problemas — usuários reportam que sites que voltaram a funcionar tiveram nova piora. "Podemos confirmar erros significativos na API e problemas de conectividade em vários serviços na região US-EAST-1?. Naquele momento, o status do serviço foi classificado como "em deterioração", que indica um viés negativo na evolução do problema.

À BBC, o site Downdetector, que monitora falhas em serviços online, afirmou que recebeu 6,5 milhões de notificações de usuários. Veja abaixo tudo sobre a falha, já considerada uma das maiores da história e um alerta para a concentração de infraestrutura de internet.

Publicidade
Quais os serviços afetados pelo apagão?

Segundo a BBC, mais de 1 mil empresas que usam a AWS enfrentam problemas nesta manhã, impactando sistemas de hospedagem, bancos de dados, redes de distribuição de conteúdo e processamento em nuvem. Abaixo, está uma lista de serviços que enfrentaram ou enfrentam dificuldades.

  • Amazon (incluindo Alexa e Prime Video);
  • Apple Music;
  • Blink;
  • Canva;
  • Chime;
  • Coinbase;
  • Delta;
  • Duolingo;
  • Epic Games Store;
  • Fanduel;
  • Fortnite;
  • HBO Max;
  • Hinge;
  • Hotmart;
  • Jira;
  • Life 360;
  • Lyft;
  • McDonalds app;
  • Mercado Livre;
  • Mercado Pago;
  • Microsoft Teams;
  • My Fitness Pal;
  • Nuvemshop;
  • Office 365;
  • PayPal;
  • Perplexity;
  • PicPay;
  • Pinterest;
  • PlayStation Network;
  • Pokemon Go;
  • Reddit;
  • Ring;
  • Roblox;
  • Roku;
  • Signal;
  • Slack;
  • Snapchat;
  • Square;
  • Starbucks;
  • Steam;
  • Strava;
  • Tidal;
  • TotalPass;
  • Trello;
  • Ubisoft Connect;
  • United Airlines;
  • Venmo;
  • VR Chat;
  • Wordle;
  • Xbox;
  • Xero;
  • Zoom;
  • Wellhub;
  • Verizon.
PicPay e Mercado Livre já voltaram? iFood está fora do ar?

Um dos principais serviços que afetam usuários brasileiros nesta manhã é o PicPay, que ainda registra reclamações tanto no DownDetector quanto nas redes sociais. No X, a companhia afirmou que espera ter normalizado o serviço por volta do meio-dia.

Em nota ao Estadão, o PicPay confirmou a instabilidade. "Como outras instituições financeiras e de entretenimento, o PicPay foi afetado pela instabilidade global nos serviços da AWS. Os serviços estão mais lentos que o comum. As empresas já estão trabalhando em conjunto para resolver o problema o mais rapidamente possível". No começo da tarde, usuários ainda reclamam de instabilidade.

O Mercado Livre e o Mercado Pago também estiveram fora do ar na manhã desta segunda. Procurada pela reportagem, a companhia afirma que já retomou os serviços. "O Mercado Livre e o Mercado Pago reconhecem que houve uma instabilidade em seus aplicativos. Nossos times trabalharam rapidamente para restabelecer o sistema, que já opera normalmente." No entanto, no começo da tarde, usuários também reclamam de instabilidade.

Publicidade

Procurado pela reportagem, o iFood também confirmou a instabilidade. "O iFood informa que o aplicativo segue em funcionamento, mas usuários podem perceber lentidão ou intermitências devido a instabilidades no nosso fornecedor de serviço de nuvem. A equipe técnica está acompanhando a situação e trabalhando para garantir o funcionamento da plataforma".

Por que um problema na AWS afeta tantos sites?

Um problema na AWS afeta tantos sites porque ela funciona como a principal base da internet. A AWS é o maior provedor de infraestrutura de serviço de nuvem do mundo — de acordo com a consultoria Gartner, a AWS tem 37% do marketshare global.

Isso significa que uma gigante parte da rede depende dela para funcionar, desde redes sociais e jogos até bancos e lojas online. Por isso, quando há falha nos serviços da AWS, o impacto é imediato e visível para milhões de usuários, especialmente porque a empresa está à frente de concorrentes como Microsoft Azure e Google Cloud.

O efeito se torna ainda maior porque muitas empresas compartilham os mesmos sistemas da AWS, então, mesmo que a falha dure pouco tempo, os sites e apps que dependem desses sistemas podem parar de funcionar ou ficar muito lentos.

Publicidade
Onde ficam os servidores afetados?

Segundo a AWS, a falha teve origem nos servidores da região US-EAST-1, que ficam no norte do Estado da Virgínia, nos EUA. Essa é a localidade com a maior concentração de data centers do mundo — segundo o site DataCenterMap, são quase 400 data centers na região. Especialistas estimam que grande parte dos dados processados de serviços brasileiros ocorrem na Virgínia.

"A região do norte da Virgínia tem os preços mais baixos do mundo entre todas as regiões de nuvem, não apenas da AWS. Isso se deve a uma isenção fiscal, que torna os servidores nessa região mais baratos do que em qualquer outra", explicou Julio Chaves, professor da FGV Escola de Matemática Aplicada - EMAp, ao Estadão,

"Consequentemente, essa região é muito utilizada por ser mais econômica, e, essa popularidade faz com que ela seja frequentemente alvo de indisponibilidades da AWS, devido à sobrecarga".

O que causou o problema?

Segundo a Amazon, a falha começou porque os computadores não conseguiam se conectar ao DynamoDB, banco de dados central da empresa na região leste dos EUA. Como muitos aplicativos e serviços dependem dele, a indisponibilidade provocou a paralisação de diversos sistemas hospedados na nuvem da AWS.

Publicidade

O DynamoDB é um banco de dados da empresa usado na nuvem para armazenar informações que precisam ser acessadas por aplicativos e serviços. Diferente de bancos de dados tradicionais, ele não organiza os dados em linhas e colunas, mas de forma mais flexível, permitindo armazenar grandes volumes de informações de maneira eficiente.

Por ser rápido e escalável, é usado por vários serviços da AWS para guardar dados que precisam de acesso constante, como configurações de aplicativos, dados de usuários ou registros de eventos. Uma falha nele pode afetar diversos serviços ao mesmo tempo, porque muitas aplicações dependem desse banco para funcionar.

"Essas instabilidades têm a ver com o uso do DNS para acesso de dados nesse DynamoDB. O serviço de DNS permite utilizar recursos da internet por nomes, em vez de endereços IP, que são números. Esse serviço é utilizado para diversas atividades, inclusive para acessar informações e recursos computacionais, neste caso, um banco de dados", explicou Jéferson Campos Nobre, professor do Instituto de Informática da Universidade Federal do Rio Grande do Sul, ao Estadão.

"Como o DynamoDB é usado por outras aplicações, o problema acabou afetando diferentes serviços. Considerando como funciona a nuvem, esse serviço é compartilhado por diferentes aplicações, e quando ocorre uma falha, ela gera impacto em cascata".

Publicidade

Além do DynamoDB, outros serviços da AWS foram afetados pelo apagão. O EC2 (Elastic Compute Cloud), usado para criar servidores virtuais, teve dificuldades para iniciar novas instâncias na região leste dos EUA, causando lentidão em sistemas que dependem desses servidores.

"Ao alocar um novo recurso computacional, cria uma instância ou servidor EC2. Se há falha nesse serviço, as requisições acumulam, gerando lentidão em cascata. A AWS tenta mitigar isso retardando o processamento dessas requisições, para não sobrecarregar o sistema", disse Wilson Horstmeyer Bogado, professor da Universidade Tecnológica Federal do Paraná e arquiteto de soluções da AWS, ao Estadão.

O chamado Lambda também apresentou falhas, afetando notificações, atualizações de aplicativos e integração entre serviços. "O Lambda é um serviço de computação sem servidor. Você envia o código da função e ele é executado conforme eventos ou periodicamente. Quando essas funções falham ou são requisitadas repetidamente, ocorre sobrecarga", afirmou Wilson.

Em comunicado, a AWS afirmou que os engenheiros estão trabalhando em diferentes soluções ao mesmo tempo. Isso inclui corrigir problemas nos servidores afetados, restaurar conexões com bancos de dados e garantir que os aplicativos voltassem a funcionar normalmente.

Publicidade

A origem de todos os problemas segue sendo investigada.

Qual é a linha do tempo do apagão

Os problemas começaram a ser reportados por volta das 4h12 desta segunda, informou a Amazon, com a investigação do "aumento nas taxas de erro e latências para vários serviços da AWS na região US-EAST-1?.

Às 4h51, a Amazon confirmou estar passando por um aumento das taxas de erro e latência. "Esse problema também pode estar afetando a criação de casos pelo Centro de Suporte da AWS ou pela API de Suporte". Foi quando serviços como Snapchat, Fortnite e ferramentas da gigante, como a Alexa, começaram a sair do ar.

Às 5h26, foi confirmado que o problema estava relacionado ao endpoint DynamoDB na região US-EAST-1. O erro impediu que usuários pudessem acionar o suporte ou atualizar solicitações.

Às 6h22, a empresa começou a aplicar uma correção para mitigar os erros iniciais e afirmou que "os primeiros sinais de recuperação de alguns serviços da AWS afetados" estavam sendo observados.

Publicidade

Às 7h (horário de Brasília), a AWS havia informado que seus sistemas tinham começado a estabilizar por volta das 7h.

Às 7h35, foi informado que "o problema de DNS subjacente foi totalmente mitigado" e que a maioria das operações estavam funcionando normalmente. Apesar disso, "as solicitações para iniciar novas instâncias EC2 (ou serviços que iniciam instâncias EC2, como ECS) na região US-EAST-1" ainda tinham taxas de erro aumentadas.

Às 8h48, a Amazon afirmou que ainda estava trabalhando para corrigir problemas de "novos lançamentos do EC2 em US-EAST-1".

Às 9h10, a companhia informou que havia solucionado os erros no Lambda, um serviço que executa códigos nos serviços da gigante. Uma das primeiras explicações da companhia dizia que havia detectado uma falha relacionada ao DynamoDB (um dos bancos de dados centrais da AWS). Ainda não está claro sobre o que gerou os erros na companhia.

Às 10h42, a gigante informou que "aplicou várias medidas de mitigação em várias zonas de disponibilidade (AZs) em US-EAST-1? e que ainda estava "enfrentando erros elevados para novos lançamentos de instâncias EC2?. A empresa disse que está limitando a taxa de novos lançamentos de instâncias "para ajudar na recuperação".

Publicidade

A piora do problema ficou clara às 11h14, quando a Amazon admitiu que ainda enfrentava problemas — usuários reportam que sites que voltaram a funcionar tiveram nova piora. "Podemos confirmar erros significativos na API e problemas de conectividade em vários serviços na região US-EAST-1?. A companhia classificou o status do problema como "em deterioração", que indica um viés negativo na evolução do problema.

Às 11h29, uma nova atualização da Amazon afirmou que a empresa continua investigando a causa principal do problema e confirmou que "vários serviços da AWS tiveram problemas de conectividade de rede na região US-EAST-1?.

Às 12h08, a Amazon informou que identificou que o problema se originou na rede interna do EC2. "Continuamos investigando a causa raiz dos problemas de conectividade de rede que estão afetando serviços da AWS, como DynamoDB, SQS e Amazon Connect na região US-EAST-1. Identificamos que o problema se originou na rede interna do EC2?.

Às 12h43, a Amazon afirmou: "Identificamos a origem dos problemas de conectividade de rede que afetaram os serviços da AWS. A causa principal é um subsistema interno responsável por monitorar a integridade dos nossos balanceadores de carga de rede. Estamos limitando as solicitações de lançamento de novas instâncias EC2 para auxiliar na recuperação e trabalhando ativamente nas medidas de mitigação." Balanceadores de carga são elementos que tentam dividir as demandas computacionais para evitar sobrecargas no sistema um deles — ou seja, eles tentam balancear as solicitações de rede para oferecer os serviços da nuvem entre nós diferentes.

Publicidade

Às 13h13, a companhia disse que tomou medidas adicionais de mitigação para auxiliar na recuperação do subsistema interno responsável pelo monitoramento da integridade dos balanceadores de carga de rede.

"Nossas medidas para resolver falhas de inicialização de novas instâncias EC2 continuam progredindo e estamos observando um aumento na inicialização de novas instâncias EC2 e uma diminuição nos problemas de conectividade de rede na região US-EAST-1. Também estamos observando melhorias significativas nos erros de invocação do Lambda, especialmente ao criar novos ambientes de execução", afirmou a empresa às 15h22.

Às 16h15, a companhia afirmou ter detectado melhora, ainda que não seja total: "Continuamos observando a recuperação em todos os serviços da AWS, e as inicializações de instâncias estão ocorrendo com sucesso em várias zonas de disponibilidade nas regiões US-EAST-1. Para o Lambda, os clientes podem enfrentar erros intermitentes nas funções que fazem solicitações de rede a outros serviços ou sistemas, enquanto trabalhamos para resolver os problemas residuais de conectividade de rede", diz o comunicado.

Às 17h52, a companhia afirmou que continuou a progredir em direção aos níveis anteriores ao problema. "Os serviços da AWS, como ECS e Glue, que dependem do lançamento de instâncias EC2, serão restaurados à medida que a taxa de sucesso do lançamento de instâncias melhorar. Observamos a recuperação total das invocações do Lambda e estamos trabalhando no backlog de eventos em fila, que esperamos que seja totalmente processado em aproximadamente duas horas", disse o comunicado.

Publicidade
Qual é o impacto econômico do apagão?

Ainda não é possível estimar todas as perdas globais causadas pelo incidente. No entanto, a empresa Tenscope já tem uma primeira estimativa: US$ 75 milhões por hora para as empresas afetadas. A diz que utilizou "os dados de receita disponíveis publicamente do ano passado das empresas afetadas, divididos por 8.760".

Segundo a conta da companhia, esses são alguns dos afetados:

  • Amazon: US$ 72.831.050 por hora
  • Snapchat: US$ 611.986 por hora
  • Zoom: US$ 532.580 por hora
  • Roblox: US$ 411.187 por hora
  • Fortnite: US$ 399.543 por hora
  • Canva: US$ 342.466 por hora
  • Slack: US$ 194.064 por hora
  • Reddit: US$ 148.402 por hora
O que é AWS?

A AWS é responsável por prover infraestrutura digital para milhões de empresas em todo o mundo, incluindo startups, bancos, redes sociais, plataformas de streaming e serviços de comunicação. Atualmente, a AWS corresponde a 18% da receita da Amazon. No trimestre mais recente, o serviço gerou US$ 30,87 bilhões para a gigante.

Quando foi o último grande apagão da internet?

Em julho de 2024, um apagão cibernético, provocado por um erro de atualização do software de segurança da CrowdStrike, resultou na queda de vários sistemas de bancos, aeroportos e serviços de comunicação por todo o mundo e deu tela azul em 8,5 milhões de dispositivos Windows, gerando um prejuízo estimado de US$ 5 bilhões nas companhias Fortune 500.

TAGS
É fã de ciência e tecnologia? Acompanhe as notícias do Byte!
Ativar notificações