A Wayback Machine do Web Archive é um recurso inestimável que faz exatamente o que diz no nome da organização sem fins lucrativos: arquiva a Web. O Web Archive é responsável pelo arquivamento em torno 500 milhões de páginas da web por dia.
No entanto, houve uma mudança preocupante na plataforma nos últimos meses. De acordo com um novo relatório da Laboratório Niemana Wayback Machine do Web Archive tem arquivado muito menos certos websites ultimamente. Ainda mais preocupante: muitos desses websites são relacionados a notícias.
De acordo com o relatório do Neiman Lab, a Wayback Machine arquivou 1,2 milhão de instantâneos das páginas iniciais de 100 grandes websites de notícias entre 1º de janeiro e 15 de maio de 2025. De repente, porém, em meados de maio, isso mudou.
A Wayback Machine tirou apenas 148.628 instantâneos das páginas iniciais desses mesmos 100 websites de notícias entre 17 de maio e 1º de outubro de 2025. Isso representa uma queda colossal de 87% no número de páginas arquivadas entre os primeiros quatro meses do ano e os cinco meses anteriores.
A página inicial da CNN, por exemplo, foi arquivada pela Wayback Machine 34.524 vezes entre 1º de janeiro e 15 de maio. Desde então, apenas 1.903 instantâneos da página inicial estão na Wayback Machine.
Velocidade da luz mashável
O Web Archive acaba de se tornar uma biblioteca federal oficial dos EUA
Mashable relatou em julho que, graças a um nova designação pelo senador da Califórnia Alex Padilla, o Web Archive se juntará a uma rede de mais de 1.000 bibliotecas em todo o país encarregadas de arquivar documentos governamentais para visualização pública.
Mark Graham, diretor da Wayback Machine, disse ao Nieman Lab que “uma falha em alguns projetos de arquivamento específicos em maio… fez com que menos arquivos fossem criados para alguns websites”. De acordo com Graham, alguns dos instantâneos perdidos ainda não tiveram sua estrutura de índice construída e seriam adicionados ao arquivo da Wayback Machine em breve.
Como apontou o Nieman Lab, um atraso de cinco meses devido a problemas de índice é incomum. De acordo com Graham, o Web Archive tem sofrido atrasos devido a “vários motivos operacionais”, como “alocação de recursos”. O Web Archive não especificou nem forneceu mais informações ao Nieman Lab sobre o assunto.
Os jornais há muito são arquivados para registro histórico. No entanto, na period da Web, a maioria dos jornais, com exceção dos gigantes da mídia tradicional, foram em grande parte desarquivados recentemente. Os websites de mídia noticiosa ocuparam seu lugar como registro histórico. E, desde 1996, o Web Archive assumiu a responsabilidade de armazenar esses arquivos de páginas da net.
No entanto, a organização sem fins lucrativos tem enfrentado dificuldades nos últimos anos. Conforme relata o Nieman Lab, as despesas do Web Archive em 2023 foram de US$ 32,7 milhões. São necessários muitos recursos não apenas para rastrear a Web, mas também para armazenar os dados. A organização sem fins lucrativos gerou receita de apenas US$ 23 milhões no mesmo ano.
Além disso, o Web Archive foi vítima, em Outubro passado, de um enorme violação de dados que colocou o website, junto com a Wayback Machine, offline. Demorou semanas para que o website fosse totalmente restaurado.












