Nuvem Azure da Microsoft plataforma, seus serviços 365 amplamente usados, Xbox e Minecraft começaram a sofrer interrupções por volta do meio-dia, horário do leste, na quarta-feira, o resultado do que a Microsoft disse ser “uma mudança inadvertida de configuração”. O incidente – que marca a segunda grande interrupção de um fornecedor de serviços de nuvem em menos de duas semanas – destaca a instabilidade de uma Web construída em grande parte sobre infraestruturas geridas por alguns gigantes da tecnologia.
Os problemas da Microsoft originaram-se especificamente da rede de distribuição de conteúdo Entrance Door do Azure e surgiram poucas horas antes do anúncio de lucros programado da Microsoft. O website da empresa, incluindo a página de relações com investidores, ainda estava fora do ar na tarde de quarta-feira, e o Página de status do Azure onde a Microsoft fornece atualizações também apresentava problemas intermitentes.
A Microsoft descreveu em atualizações de standing na quarta-feira que passou por um processo de reversão sequencial de versões recentes de seu ambiente até que pudesse identificar a “última configuração válida”. Às 15h01, horário do leste dos EUA, a empresa disse que identificou e promoveu essa configuração estável e que “os clientes podem começar a ver sinais iniciais de recuperação. Atualmente, estamos recuperando nós e roteando o tráfego através de nós íntegros”.
Um porta-voz da Microsoft disse em comunicado: “Estamos trabalhando para resolver um problema que afeta o Azure Entrance Door e que está afetando a disponibilidade de alguns serviços. Os clientes devem continuar a verificar seus alertas de integridade do serviço.” A empresa não respondeu imediatamente às perguntas da WIRED sobre a natureza da mudança de configuração que causou a interrupção.
Além de ocorrer no dia dos lucros da Microsoft, a interrupção ocorre nove dias depois que a Amazon Internet Providers, rival do Azure, sofreu uma interrupção massiva que afetou websites e serviços em todo o mundo. Os principais provedores de nuvem, muitas vezes chamados de “hiperscaladores”, padronizam e muitas vezes melhoram a segurança e a confiabilidade básicas para seus clientes, mas problemas e interrupções podem fazer com que eles se tornem pontos únicos de falha para grandes populações de serviços digitais críticos.
“Até a página de standing de interrupção do Azure está fora do ar”, diz Davi Ottenheimer, gerente de conformidade e operações de segurança de longa information e vice-presidente da empresa de infraestrutura de dados Inrupt. “Outro erro de alteração de configuração: estamos na period da violação de integridade, mais do que nunca.”
O Azure impediu que os clientes fizessem alterações de configuração em suas instâncias enquanto trabalhava para resolver o problema. A empresa disse em uma atualização de standing às 15h22 horário do leste dos EUA que espera “mitigação whole” da situação até as 19h20 horário do leste dos EUA.
“As organizações podem pensar que estão isoladas pela escolha do fornecedor de nuvem, mas as dependências são mais profundas”, diz Munish Walther-Puri, membro adjunto do corpo docente da IANS Analysis e ex-diretor de risco cibernético da cidade de Nova York. “Quando os principais parceiros dependem de outros hiperscaladores, a exposição se multiplica. À medida que a IA se torna a próxima camada da infraestrutura crítica, essas interrupções demonstram a fragilidade da nossa espinha dorsal digital.”










