O que é Link Rot e como ele ameaça a Web?

Uma ilustração de link quebrado em um fundo azul
Arcady/Shutterstock.com

Se você esteve navegando na web e encontrou uma página de erro 404 ou um redirecionamento inesperado, você viu a podridão do link em ação. Com o tempo, os links que mantêm a web unida se rompem, ameaçando nossa história cultural compartilhada. Aqui está uma olhada por que isso acontece.

O que é Link Rot?

A podridão do link é quando os links em sites quebram ao longo do tempo, criando um link quebrado ou morto. Por “link quebrado”, queremos dizer um link que não aponta mais para o destino pretendido desde quando o link foi criado. Quando você clica em um desses links quebrados, recebe um erro 404 ou vê a página ou o site errado.

Link Rot é comum. Um estudo de Harvard de 2021 examinou hiperlinks em mais de 550.000 artigos do New York Times de 1996 a 2019 e descobriu que 25% dos links para páginas específicas eram inacessíveis, com a taxa de declínio crescendo drasticamente dependendo da idade dos links (por exemplo, cerca de 6 % dos links de 2018 estavam mortos versus 72% dos links de 1998). Outro estudo descobriu que de um conjunto de 360 ​​links reunidos em 1995, apenas 1,6% ainda funcionava em 2016.

Por que o Link Rot acontece?

A web é um meio fluido e descentralizado , sem controle centralizado, de modo que o conteúdo pode ficar indisponível a qualquer momento sem aviso prévio. Servidores vêm e vão, sites são encerrados, serviços migram para novos hosts, software recebe atualizações, publicações mudam para novas plataformas de gerenciamento de conteúdo e não migram conteúdo, domínios expiram e muito mais.

Recomendado:  Como a tecnologia TrustedServer da ExpressVPN mantém você seguro

Há outro problema relacionado na web chamado “desvio de conteúdo”, em que o link permanece funcional, mas o conteúdo do link mudou desde o link original, o que pode causar problemas porque o autor original do link pretendia apontar para informações diferentes.

O que há de tão ruim em perder sites antigos?

É da natureza do mundo que as coisas se decomponham e desapareçam. Manter a informação viva é um processo ativo que leva tempo, energia e esforço. Portanto, o principal problema com a podridão de link não é necessariamente que precisamos armazenar todas as informações para sempre, mas que as informações e referências eletrônicas se tornaram potencialmente mais frágeis e vulneráveis ​​do que as de papel usadas principalmente no passado.

Muitos autores de artigos jornalísticos , trabalhos acadêmicos e até decisões judiciais usam links da web como mecanismo de citação para fornecer fontes vitais de contexto para as informações apresentadas. Tem sido um problema com Wikipeda também. Como Jonathan Zittrain explicou em um artigo de 2021 sobre a podridão de links para o The Atlantic , “Sourcing é a cola que mantém o conhecimento da humanidade unido. É o que permite que você aprenda mais sobre o que é apenas brevemente mencionado em um artigo como este, e que outros verifiquem os fatos como eu os represento.”

Se os links quebrarem e as fontes ficarem indisponíveis, será muito mais difícil para o leitor julgar se o autor representou honesta e precisamente a fonte original de informação. E mesmo além dos links, alguns sites fornecem informações on-line que não podem ser encontradas em nenhum outro lugar. Perder essas páginas cria lacunas no conhecimento coletivo da humanidade e buracos no tecido de nossa cultura compartilhada.

Recomendado:  O que é um arquivo MP3 (e como faço para abrir um)?

Qual é a solução para Link Rot?

Especialistas consideram que a podridão de links e o desvio de conteúdo são endêmicos da web como ela é projetada atualmente. Isso significa que é uma parte da natureza fundamental da web que não desaparecerá a menos que tentemos corrigi-la ou mitigá-la ativamente.

Uma das soluções mais eficazes para o problema da rotulação de links até agora surgiu em 1996 com o Internet Archive, que mantém um arquivo público de bilhões de sites nos últimos 25 anos. Se você encontrar um link quebrado, visite Wayback Machine do Internet Archive e cole o link em sua barra de pesquisa. Se o site foi capturado, você poderá navegar pelos resultados. Ou se o site caiu recentemente, pode ser possível visualizar o conteúdo original de uma cópia em cache que o Google armazena.

Além do Internet Archive, um projeto liderado por Harvard chamado Perma.cc captura versões permanentes de sites com o objetivo de citação acadêmica e legal de longo prazo. Um consórcio de bibliotecas mantém os links, então eles devem permanecer por um tempo. O objetivo é criar links que não apodreçam — eles devem persistir enquanto o arquivo Perma.cc for mantido.

Outras soluções potenciais para a podridão de links ainda estão na vanguarda, incluindo possíveis soluções Web 3.0 e hospedagem de dados distribuídos graças a protocolos como IPFS . Embora, ironicamente, daqui a centenas de anos, é possível que os únicos sites desta época que sobrevivam sejam aqueles que as pessoas imprimiram em papel. Fique seguro lá fora!