Twitter s’archive à la bibliothèque du Congrès américain

Le Thomas Jefferson Building, le plus ancien des trois bâtiments qui composent la bibliothèque du Congrès américain. cliff1066™

 

La bibliothèque du Congrès américain dresse un premier bilan du projet d’archivage des messages diffusés sur Twitter depuis la création du réseau social en 2006. Bien que constituées de 140 caractères au maximum, ces archives atypiques constituent un fonds… de poids !

Le 7 décembre dernier, l’accord permettant l’archivage des messages diffusés sur Twitter, depuis sa création en 2006, par la bibliothèque du Congrès américain était enfin scellé. La plus ancienne institution culturelle fédérale des Etats-Unis avait annoncé le lancement de l’opération en avril 2010. Un état des lieux de ce projet d’archivage original vient d’être publié par l’institution de Washington.

170 milliards de messages

A raison de 400 millions de tweets publiés chaque jour sur le célèbre réseau social (contre 140 millions en février 2011), ce sont, au total, plus de 170 milliards de messages de 140 caractères qui sont archivés électroniquement par la bibliothèque du Congrès. C’est par l’intermédiaire d’une socitété du Colorado, Gnip, que Twitter a fait "don" de ses tweets, et c’est désormais en flux continu que les "petites" archives viennent remplir, chaque jour, ce fonds d’un genre nouveau... lequel pèse près de 133 000 gigaoctets !

Inaccessibles pour le moment

L’exploitation des données récoltées pose malgré tout quelques problèmes : difficiles à trier, elles supposent une indexation permanente, le concours de nombreux ingénieurs ou encore l’utilisation de plusieurs centaines de serveurs. Des contraintes onéreuses qui poussent la bibliothèque du Congrès à envisager de faire appel au soutien du secteur privé. En effet, l’institution américaine n’a, pour le moment, pas été en mesure de répondre aux demandes de chercheurs qui l’ont sollicitée depuis le début du processus d’archivage, en 2010.

Protection de la vie privée

Si les messages effacés ou protégés sont écartés du projet, il faut savoir également que les tweets archivés ne seront réellement accessibles qu’après 6 mois de publication. Si seuls vos propres messages vous intéressent, l’option lancée par Twitter en décembre dernier permettant d’archiver, cette fois-ci, uniquement ses propres tweets, pourra peut-être vous suffire !

Les podcasts d'Archimag
Êtes-vous prêt pour la réforme de la facturation électronique ? À moins de 460 jours du grand lancement, l’écosystème se prépare activement. Lors de la Journée de la Facturation Électronique qui s'est tenue le 13 mai dernier à Paris, Archimag Podcast est allé à la rencontre des acteurs incontournables de cette réforme : les Plateformes de dématérialisation partenaires, ou PDP. Ensemble, nous avons parlé de leur rôle, de leurs spécificités, de leur modèle économique et de leur secret de longévité. Dans cet épisode, nous vous dévoilons qui sont ces acteurs et ce qu'ils préparent pour accompagner la réforme.