Publicité

Open source : lancement de Software Heritage, la plus grande bibliothèque de codes source de la planète

  • tourbillon-livres.jpg

    bibliotheque-tourbillon-livres
    Selon l'Inria, "Software Heritage s’appuiera sur une infrastructure distribuée, de manière à garantir la robustesse et la disponibilité" (Visual hunt)
  • La plateforme, qui vise la préservation, le développement et la diffusion de la connaissance encodée dans le logiciel, a déjà réussi à séduire l'éditeur Microsoft, partenaire du projet. 

    "C'est une sorte de Wikipedia du logiciel open source", annonce Antoine Petit, président de l'Inria (Institut national de recherche en numérique), lors de la présentation, le 30 juin dernier, de la plateforme Software Heritage. Ses 22,8 millions de projets logiciels collectés, ses 2,7 milliards de fichiers sources uniques archivés (avec tout l'historique de leur développement) font d'elle l'archive de codes source la plus riche de la planète. 

    La bibliothèque d'Alexandrie du logiciel open source

    La mission de ce projet, présenté comme une véritable "bibliothèque d'Alexandrie du logiciel open source" et sur lequel l'Inria déclare avoir "travaillé en catimini pendans un an et demi" est la suivante : collecter, organiser, préserver et rendre accessible le code source de tous les logiciels disponibles publiquement, faisant de Software Heritage un référentiel unique du code source et un puissant instrument de recherche pour l’informatique.

    "Nous avons décidé de lancer Software Heritage il y a plus d’un an, et nous avons montré sa faisabilité, poursuit Antoine Petit ; afin de le déployer à l’échelle mondiale, il est temps maintenant d’ouvrir le projet à la contribution la plus large, nationale et internationale". 

    Software Heritage bénéficiera bientôt de mises à jour en temps réel et ambitionne ainsi de devenir "le catalogue de code de référence pour tous les utilisateurs industriels, permettant ainsi aux développeurs de nouveaux logiciels de trouver, réutiliser, et archiver de nouveaux codes source". Il y a fort à parier qu'elle permettra de grandes avancées en matière de qualité, de sûreté, de fonctionnement et de sécurité des logiciels.

    Microsoft comme partenaire

    Certes, Software Heritage a déjà bénéficié du soutien de nombreux scientifiques, industriels, instituts de recherche, fondations, organisations indépendantes et institutionnelles. Mais l'Inria, qui s'est engagé à consacrer 500 000 euros de budget annuel sur trois ans, lance un appel mondial afin de trouver de nouveaux partenaires et contributeurs (collecte, contribution au développement, préservation, partage du contenu, etc). Côté éditeurs, Microsoft est le premier acteur international à avoir rejoint le projet et héberge gratuitement  gratuitement au sein de son cloud Azure une sauvegarde de secours (site miroir) de Software Heritage. 

    "L’information numérique est fragile, a déclaré Roberto Di Cosmo, le responsable du projet ; on peut perdre des logiciels comme en perd des données. On veut éviter tous ces problèmes en créant un dépôt comme pour les archives. Le but n’est pas juste de préserver la mémoire. Nous voulons aussi tracer le code en précisant quand il a été développé, par qui, comment et pourquoi. Car l’objectif est aussi d’utiliser cette plateforme comme outil d’apprentissage pour améliorer le développement du logiciel."

     

    À lire sur Archimag
    Les podcasts d'Archimag
    La mise à disposition des décisions de justice en Open Data a vu le jour grâce à la loi pour une République numérique votée en 2016. Les articles 20 et 21 prévoient la mise en open data des quatre millions de décisions de justice produites chaque année par les tribunaux français. Camille Girard-Chanudet est chercheuse en sociologie au sein du Centre d’étude des mouvements sociaux. En 2023, elle a soutenu une thèse devant l’École des hautes études en sciences sociales (EHESS) : "La justice algorithmique en chantier, sociologie du travail et des infrastructures de l’intelligence artificielle". Dans ce cadre elle a rencontré les équipes de la Cour de cassation qui procèdent à l’anonymisation des décisions de justice.

    2025-Catalogue Dématérialisation-Serda Formation