SÃO PAULO, SP (FOLHAPRESS) – Os serviços de nuvem da Amazon voltaram a apresentar falha na manhã desta segunda-feira. O anúncio foi feito pela empresa em seu site às 11h14 (horário de Brasília). Três horas antes, a AWS (Amazon Web Services) havia informado que tinha corrigido o problema que afetou mais de 500 sites em vários países, incluindo o Brasil, desde as 3h30 desta segunda.
De acordo com a companhia, os serviços do DynamoDB (banco de dados), SQS (assistente de voz) e Amazon Connect (serviço na nuvem) estão com pane e não há previsão para retorno.
No site Downdetector (site que monitora problemas de funcionamento), as reclamações dos usuários voltaram a subir por volta das 10h20 em vários países como Brasil, EUA, Argentina, Colômbia, Canadá e México.
“Continuamos investigando a causa dos problemas de conectividade de rede que estão afetando os serviços da AWS… Continuamos investigando e identificando soluções”, disse a AWS.
A pane que começou na madrugada causou instabilidade em diversos aplicativos e programas em todo o mundo, que impactaram Fortnite, Snapchat e serviços corporativos e da própria Amazon como o PrimeVideo e a Alexa.
A AWS relatou um problema operacional que afetou múltiplos serviços em Virgínia do Norte, nos EUA, um dos seus principais data centers globais. Segundo a companhia, cerca de 500 empresas hospedados na nuvem da Amazon sofreram um apagão, em vários países. No Brasil, sites e apps como Mercado Livre, PicPay e iFood tiveram falha. Usuários reclamaram de falha no Pix, mas o Banco Central negou relação com a falha da AWS.
A mesma central de data centers em Virgínia do Norte foi a que causou as novas falhas a partir das 10h20 desta segunda, segundo a AWS. Usuários da Alexa eram informados do problema ao tentar acessar o serviço. “Desculpa, houve um erro”, respondia a assistente de voz.
Em nota, o Mercado Livre e o Mercado Pago reconhecem que houve uma instabilidade em seus aplicativos. “Nossos times trabalharam rapidamente para restabelecer o sistema, que já opera normalmente”, afirma o comunicado à imprensa.
O PicPay afirma que seus “serviços estão mais lentos que o comum”. “Como outras instituições financeiras e de entretenimento, o PicPay foi afetado pela instabilidade global nos serviços da AWS. Os serviços estão mais lentos que o comum. As empresas já estão trabalhando em conjunto para resolver o problema o mais rapidamente possível”, diz, em nota oficial.
Os usuários começaram a relatar problemas por volta das 3h30 (horário de Brasília) desta segunda. Às 7h35, a AWS informou que a “maioria das operações de serviços” voltou a funcionar, pediu aos usuários que limpassem o cache e reiniciassem os serviços impactados, mas alertou que falhas “pontuais” ainda estavam ocorrendo.
Às 9h48, a empresa divulgou que havia corrigido outro sistema que caiu, mas que alguns serviços ainda poderiam apresentar lentidão e que a AWS trabalhava para diminuir a fila de solicitações. Parte das empresas afetadas também disseram que os serviços foram restabelecidos. Mas, às 11h14, a AWS relatou a nova falha.
“Confirmamos erros significativos de API (quando os aplicativos não conseguem se conectar com o servidor) e problemas de conectividade em diversos serviços na região leste dos EUA. Estamos investigando e forneceremos mais atualizações”, disse a AWS.
A interrupção da AWS é a primeira grande perturbação da internet desde o mau funcionamento da CrowdStrike no ano passado, que paralisou sistemas tecnológicos em hospitais, bancos e aeroportos globalmente.
Entre os serviços impactados da computação em nuvem estavam empresas de diferentes ramos como jogos populares como Fortnite e Roblox, a rede social Snapchat, a corretora de criptomoedas americana Coinbase, o mecanismo de busca de inteligência artificial Perplexity, os serviços de dados do London Stock Exchange Group, o site de venda de ingressos do time inglês de futebol Tottenham e o app de transporte Lyft.
No Downdetector, usuários reclamaram da AWS em vários países pelo mundo e também reportaram problemas nos sites que têm os seus serviços veiculados à companhia.
A Ookla, proprietária do Downdetector, disse que mais de 4 milhões de usuários relataram problemas devido ao incidente.
A AWS é líder global em serviços de computação em nuvem e fornece armazenamento de dados e outros serviços digitais para empresas, governos e indivíduos. Interrupções em seus servidores podem causar falhas em sites e plataformas que dependem de sua infraestrutura em nuvem. A AWS supera os rivais do Google e da Microsoft.
A unidade de nuvem é um importante gerador de lucro para a gigante do comércio eletrônico, que investe dezenas de bilhões de dólares na expansão de data centers para treinar e implementar aplicativos com inteligência artificial.
O QUE OCORREU
Os primeiros relatos de falhas começaram por volta das 3h30 (de Brasília). Às 4h11, a AWS informou que investigava “aumento nas taxas de erro e latências” e que trabalhava para o restabelecimento.
Às 5h26, a companhia relatou que o erro impedia que os usuários abrissem ou atualizassem notificações de falhas junto ao suporte da AWS. Cerca de 30 minutos depois, a companhia relatou que a origem seria o servidor na Vírginia do Norte, nos EUA.
“Esses erros ocorrem quando os serviços da AWS não conseguem responder corretamente às requisições de outros sistemas ou aplicativos. E isso traz um impacto em diversas operações. Muitos serviços e aplicações dependem da US-EAST-1 (local onde está a central da Virgínia do Norte)”, comentou Jesaias Arruda, vice-presidente da Abranet (Associação Brasileira de Internet).
Às 6h22, a AWS instruiu os usuários a reiniciar os serviços, que já estavam voltando a funcionar. Em novo comunicado, divulgado às 7h35, a AWS disse que a “maioria das operações de serviços” voltou a funcionar e pediu os usuários que limpassem o cache e reiniciassem os serviços impactados. Porém, a empresa alertou que “falhas pontuais” ainda poderiam ocorrer, apesar de o problema que gerou o DNS (quando o servidor não responde ao pedido do usuário) ter sido corrigido.
“Serviços da AWS que dependem de SQS Lambda como atualização de políticas corporativas também podem estar apresentando lentidão”, afirmou a AWS, em comunicado às 8h48. Cerca de 20 minutos depois, a empresa divulgou que o SQS Lambda fora corrigido e que trabalhava para o restabelecimento de outro sistema que apresentou falha.
Junade Ali, engenheiro de software, especialista cibernético e membro da Instituição de Engenharia e Tecnologia, disse que o problema parecia estar em um dos sistemas de rede que a AWS usa para controlar um produto de banco de dados.
“Como esse problema geralmente pode ser resolvido de forma centralizada… a menos que haja outros problemas identificados, ele deverá ser mitigado nas próximas horas”, afirmou Ali.
A partir das 10h20, as reclamações sobre AWS e outros sites impactados pela manhã (como Mercado Livre, Mercado Pago, Alexa e outros) voltaram a ter alta no Downdetector. Às 11h14, a AWS confirmou a nova falha e não informou uma previsão para regularização.
CLIENTES IMPACTADOS
Alguns dos jogos mais populares do mundo como Fortnite, Roblox, Clash Royale e Clash of Clans ficaram fora do ar, assim como as plataformas financeiras Venmo, do Paypal, e Chime.
O CEO da Perplexity, Aravind Srinivas, postou na rede social X (antigo Twitter) e disse que o site trabalhava para resolver a falha. “O Perplexity está fora do ar no momento. A causa raiz é um problema da AWS. Estamos trabalhando para resolvê-lo”, disse, durante a madrugada.
Rival da Uber, o aplicativo de transportes Lyft também estava fora do ar para milhares de usuários nos EUA. A presidente do aplicativo de mensagens Signal, Meredith Whittaker, confirmou no X que a plataforma da empresa também foi afetada pela interrupção da AWS.
Na Inglaterra, o Lloyd Bank, o Bank of Scotland, os provedores de serviços de telecomunicações Vodafone e BT, e o site de venda de ingressos do time de futebol Tottenham ficaram fora do ar devido à instabilidade na AWS, assim como foi relatado problemas pela autoridade tributária, de pagamentos e alfandegária britânica HMRC.
Ainda na manhã de segunda, empresas como Coinbase, Perplexity, Fortnite e HMRC afirmaram que os serviços foram retomados.
O problema destaca o quão interconectados os serviços digitais cotidianos se tornaram e o quanto eles dependem agora de um pequeno número de provedores globais de nuvem, com uma falha causando estragos nos negócios e na vida cotidiana, disseram especialistas e acadêmicos.
“O principal motivo para esse problema é que todas essas grandes empresas dependem de apenas um serviço”, comentou Nishanth Sastry, Diretor de Pesquisa do Departamento de Ciência da Computação da Universidade de Surrey.