Les documents en ligne seront-ils toujours accessibles ?

Rédigé par Agencedecom -
web archive

Actuellement, beaucoup de personnes se focalisent sur le fait de supprimer entièrement les données sur internet. Mais contrairement à cela, il y a une autre question plus préoccupante : est-ce que les documents sur internet seront toujours accessibles ?

Des documents qui disparaissent

Internet n’est plus la bibliothèque universelle accessible à tous. La preuve la plus évidente est la disparition de l’œuvre de Vaughan baptisée ‘The Crossing’ lors de la fermeture de ‘Rocky Mountain News’ et de son site internet. Pour rappel, il s’agit d’un récit sur l’accident de 1961 qui a tué 20 enfants. Cet article avait obtenu en 2008 une place en finale pour le ‘prix Pulitzer’.

Mais cet exemple n’est pas le seul, car beaucoup d’œuvres se perdent sur internet. Il y a notamment plusieurs films européens datant de 1912 à 1929 qui se sont évaporés sur la toile.

Une bibliothèque géante numérique

L’idée d’utiliser internet comme une bibliothèque géante a été pensée depuis plusieurs années. Déjà en 1965, quelques pionniers de l’Arpanet ont songé à abandonner les livres physiques et à utiliser les ordinateurs mis en réseau comme bibliothèque.

Certes, se servir d’internet comme bibliothèque universelle est une idée que tout le monde approuve, mais elle est difficile à mettre en œuvre. Si archive.org se targue de sauvegarder les documents, il est face à certains problèmes. En effet, c’est une tâche difficile vu qu’actuellement, il existe plusieurs centaines de millions de sites internet. À cela s’ajoute le fait que la plupart des pages web ne sont plus de simples documents comme autrefois, mais des pages web dynamiques.

Ainsi, il est très difficile de trouver certains contenus sur la toile. De plus, certains sites ont été mis à jour et orientent l’internaute vers d’autres documents ou n’affichent plus le contenu recherché. À titre d’exemple, l’institut de Los Alamos a publié environ 3 millions d’articles de 1997 à 2002. Aujourd’hui, 20% des liens ne sont plus accessibles.

Outre archive.org, les bibliothèques nationales font aussi de l’archivage : 9 milliards de pages pour la bibliothèque du Congrès, 6 millions pour la British Library… Mais la plupart de ces archivages se font en collaboration avec archive.org. Outre ces établissements nationaux, certains sites se mettent aussi à sauvegarder comme Wikipédia. Pour d’autres, comme Twitter, ils enregistrent les fichiers en rapport avec leur activité (messages, publications…).