Depuis son lancement en octobre 2024 par le Ministère de la Culture, Compar:IA s’est imposé comme un véritable laboratoire d’usages pour déjouer les biais culturels générés par les IA : à partir de plus de 300 000 questions posées par les utilisateurs, plus de 130 000 préférences sur les réponses apportées par les IA ont été exprimées et recueillies. Désormais accessible en open source sur les plateformes data.gouv.fr et Hugging Face, il s’agit d’un des plus grands jeux de données de ce type en français.
Ces données offrent une ressource précieuse pour mieux comprendre les usages réels des systèmes d'IA et améliorer leur qualité. Trois volets de ces jeux ont été déclinés : les conversations anonymisées, les réactions aux réponses des modèles, ainsi que les votes des utilisateurs sur ces interactions. Les données de Compar:IA ont déjà donné lieu à un projet de datavisualisation. Au travers d’une cartographie interactive développée par Bunka.ai, une constellation permet d’explorer thématiquement les questions posées par plus de 17 000 utilisateurs à partir de 30 modèles d'IA conversationnelle, à la fois open source et propriétaires, petits et grands.
Lire aussi : Le ministère de la Culture lance son comparateur d'intelligence artificielle
Les nouvelles perspectives de Compar:IA
Parmi les nouveautés, la plateforme Compar:IA accueille désormais plusieurs modèles d’IA récents, dont Claude 3.7 Sonnet, DeepSeek V3 et la famille GPT 4.1, afin d’enrichir les possibilités de comparaison de leurs performances.
En parallèle, un dispositif inédit baptisé "Les Duels de l’IA" est en phase de test. Cette extension vise à sensibiliser au bilan environnemental des IA génératives à partir des données de Compar:IA, avec un lancement officiel prévu à la rentrée. D’autres chantiers sont en cours, notamment l’élaboration d’un classement des modèles basé sur les préférences utilisateurs et la consommation énergétique, ainsi que l’ouverture de Compar:IA à l’international pour comparer des usages multilingues.
Lire aussi : LightOn lance son modèle d’IA open source pour la recherche documentaire complexe