Publicité

Open data : les Mooc d'Harvard et du MIT libèrent leurs données tout en protégeant la vie privée de leurs étudiants

  • ordinateur étudiant.jpg

    Plus d'un million d'étudiants ont suivi ces Mooc lors de l'année scolaire 2012-2013. (Pixabay/TheAngryTeddy)
  • Que les militants pour la protection des données personnelles se rassurent : les données en question ont été soumises à un rigoureux processus d'anonymisation.

    Une équipe de chercheurs de l'Université de Harvard et du MIT vient de publier l'ensemble des données d'apprentissages des étudiants relatives aux 16 Moocs (issus de la plateforme EdX) de l'année 2012-13. Le tout assorti de puissants outils open-source de visualisation interactive. "MITX et HarvardX se sont engagés à respecter la vie privée des étudiants ainsi que de faire avancer la recherche d'apprentissage, se félicite Isaac Chuang, un chercheur du MIT, dans un communiqué ; ces données sont un bien public".

    Mine de renseignements pour la recherche

    Grâce à ces données, l'ensemble des différents aspects des caractéristiques des étudiants peut être exploré. Selon les deux institutions, ces données ouvertes permettront d'aider les travaux des chercheurs en éducation. "En partageant ces données dépersonnalisées, nous espérons montrer que nous pouvons protéger les renseignements sur les personnes tout en permettant la recherche sur ce qui fonctionne dans l'apprentissage en ligne", ajoute Andrew Ho, un chercheur de l'Université de Harvard.

    Il est donc possible de télécharger le jeu de données, d'explorer les outils de visualisation de données soit pour HarvardX, soit pour le MITX, ainsi que de consulter les documents de travail basés sur la multitude de données (MITX et HarvardX) recueillies, en un an seulement, par les Moocs des deux institutions. L'équipe de chercheurs en charge de cette ouverture de données anonymes souhaite maintenant que d'autres institutions reproduisent l'initiative afin d'enrichir à nouveau ces ressources pour la recherche.

    À lire sur Archimag
    Les podcasts d'Archimag
    La mise à disposition des décisions de justice en Open Data a vu le jour grâce à la loi pour une République numérique votée en 2016. Les articles 20 et 21 prévoient la mise en open data des quatre millions de décisions de justice produites chaque année par les tribunaux français. Camille Girard-Chanudet est chercheuse en sociologie au sein du Centre d’étude des mouvements sociaux. En 2023, elle a soutenu une thèse devant l’École des hautes études en sciences sociales (EHESS) : "La justice algorithmique en chantier, sociologie du travail et des infrastructures de l’intelligence artificielle". Dans ce cadre elle a rencontré les équipes de la Cour de cassation qui procèdent à l’anonymisation des décisions de justice.