Por que os apagões globais da internet estão mais frequentes? Entenda
Instabilidade da Cloudflare nesta terça reacende discussão sobre concentração da infraestrutura digital mundial
A instabilidade que derrubou parte da internet na manhã desta terça-feira, 18, após uma falha na Cloudflare, empresa de infraestrutura de internet, ampliou a preocupação sobre a frequência cada vez maior de apagões globais que paralisam plataformas essenciais e expõem a dependência de empresas e usuários a um número reduzido de provedores de serviços em nuvem.
Nesta manhã, plataformas como X (ex-Twitter), ChatGPT e Canva ficaram inacessíveis ou instáveis por cerca de uma hora, mas a cena não é nova. Em outubro, uma falha massiva da Amazon Web Services (AWS) derrubou centenas de serviços por quase 16 horas, no que foi considerado um dos maiores apagões recentes da internet global.
Especialistas explicaram que a repetição desses episódios (e em intervalos cada vez menores) evidencia um problema estrutural: a concentração da internet mundial em poucos provedores. Segundo eles, quando poucos grupos concentram funções essenciais, como direcionar tráfego, hospedar sites ou manter aplicativos no ar, qualquer erro em um único componente dessa estrutura pode derrubar serviços usados por milhões de pessoas ao mesmo tempo
Bob Wambach, vice-presidente de portfólio de produtos da Dynatrace, empresa de monitoramento de sistemas digitais, afirmou que esses incidentes mostram o quanto a infraestrutura digital se tornou crítica e interdependente.
"No momento em que um serviço vital sai do ar, os usuários ficam impossibilitados de acessar sites e aplicações dos quais dependem, demonstrando a rapidez com que a interrupção se espalha quando uma camada central de proteção da internet é afetada", disse. Para ele, a complexidade crescente dos sistemas digitais amplia o efeito dominó: "Quando ocorre uma falha, os efeitos em cascata podem rapidamente se espalhar por diversos setores e alcançar a vida cotidiana das pessoas".
A interrupção desta terça também reacendeu alertas de segurança. Para Fernando de Falchi, gerente de engenharia de segurança da Check Point Software Brasil, o modelo atual aumenta os riscos. "Quando uma plataforma desse porte apresenta problemas, o impacto se espalha de forma rápida e ampla, e todos sentem os efeitos ao mesmo tempo", afirmou. Ele também destacou que grandes nuvens se tornam alvos naturais, inclusive em cenários de ataque hacker: "Mesmo uma interrupção acidental gera ruído e incerteza que os atacantes poderão explorar".
A repetição dos episódios (AWS e Azure em outubro e agora Cloudflare) evidencia uma falha estrutural, segundo Jesaias Arruda, vice-presidente da Abranet, que lembrou que o cenário não se resume a falhas técnicas isoladas, mas a uma dependência crescente da nuvem. "Todo os serviços hoje estão hospedados em nuvem. Então, como está muito mais interconectado, qualquer soluço em uma estrutura dessas vai ser sentido em lugares diferentes do mundo ao mesmo tempo", afirmou ao Estadão.
Para reduzir os riscos, Arruda defende o uso de múltiplos provedores: "Em vez de ter tudo só em um único serviço em nuvem, o ideal seria distribuir as informações da minha plataforma em outros provedores".
Outro ponto central é o peso da Cloudflare no funcionamento da web. "A Cloudflare está presente em um a cada cinco sites, ou seja, 20% da internet usa Cloudflare para conseguir ter um carregamento mais rápido", explicou Gustavo Torrente, responsável pela área de soluções para empresas e pela parte técnica dos produtos da Alura e da FIAP, ao Estadão. "Quando uma dessas engrenagens falha, mesmo que por minutos, ela vai derrubar uma parte enorme da internet de uma vez só".
Esse cenário, dizem os especialistas, tende a persistir enquanto as empresas continuarem concentrando seus serviços em poucos provedores globais.
O que aconteceu no apagão da Cloudflare?
Um problema técnico na infraestrutura da Cloudflare derrubou parte da internet entre 8h e 9h desta terça-feira. O site DownDetector, de monitoramento de instabilidades online, registrou mais de 3,5 mil reclamações no período, com relatos de falhas de carregamento, mensagens de erro e lentidão.
Entre os serviços afetados estiveram X, ChatGPT, Canva, Discord e plataformas de monitoramento como o próprio DownDetector. No X, páginas não carregavam; no Canva, o editor ficava travado na tela de carregamento; no ChatGPT, usuários relatavam bloqueios, erros de conexão e dificuldade até para abrir a interface.
De acordo com a Cloudflare, havia uma manutenção programada em um de seus datacenters entre 9h e 12h (horário de Brasília). A empresa informou que, durante o procedimento, o tráfego seria redirecionado para outros pontos da rede, o que poderia aumentar a latência e instabilidade dos serviços.
Segundo especialistas, esse tipo de comportamento costuma acontecer quando há falhas na parte da internet que "aponta" para onde cada site deve ir. É como se o endereço ficasse confuso: mesmo que o servidor esteja funcionando, os usuários não conseguem chegar até ele.
De acordo com o vice-presidente da Abranet, o episódio deve ter relação com algum problema interno de endereçamento ou resolução de nomes. Segundo ele, a Cloudflare funciona como uma "ponte" entre serviços e usuários, e a interrupção teria interrompido essa rota: "Eles tiveram indisponibilidade de nomes ou dentro de algum serviço de rede que gerou a estabilidade que foi sentida hoje de manhã".
A falha desta terça foi menor que a ocorrida na AWS no mês passado, mas reforça um padrão: é o terceiro grande episódio de instabilidade global em menos de um mês, considerando também uma queda recente no Azure, da Microsoft.
Como foram os últimos apagões?
Em 20 de outubro, a AWS sofreu uma falha massiva que tirou do ar serviços de empresas no mundo inteiro, de sites e apps até sistemas corporativos que dependem da nuvem da Amazon. O problema começou após uma alteração interna de configuração que se espalhou pela rede e fez com que partes da infraestrutura parassem de responder, provocando um apagão digital.
Menos de dez dias depois, em 29 de outubro, a Microsoft enfrentou um apagão semelhante na plataforma Azure. Segundo a empresa, uma mudança de configuração feita por engano no serviço que distribui o tráfego global acabou quebrando o direcionamento para vários sistemas e, com isso, serviços como Xbox, Microsoft 365, Azure Portal e outros ficaram lentos ou completamente indisponíveis por horas.