CET ARTICLE A INITIALEMENT ÉTÉ PUBLIÉ DANS ARCHIMAG N°386
Découvrez Le Brief de l'IT, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des data, de l'IT, de la digitalisation et de la transformation numérique !
C’est un chiffre qui donne le vertige. Chaque année, 1,5 milliard de voyageurs empruntent le réseau de la RATP (bus, métro, tramway, RER…). Depuis la création de la première ligne de "métropolitain", en 1900 pour connecter les principaux sites de l'Exposition universelle et à l’occasion des Jeux olympiques d’été, la Régie autonome des transports parisiens n’a cessé d’enrichir son offre, avec de nouveaux modes de déplacements qui desservent aujourd’hui des centaines de stations et de gares à travers la région parisienne.
Moins connus du grand public, d’autres chiffres retiennent également l’attention : on recense 270 métiers parmi les 71 000 collaborateurs de la RATP. Avec, à la clé, un gisement exceptionnel de données produites dans le cadre de l’exploitation du réseau de transport, mais aussi celles qui relèvent des ressources humaines et des finances. Les premières concernent ce que les voyageurs peuvent constater eux-mêmes : l’information sur les temps d’attente entre chaque passage de métro et, plus généralement, les conseils destinés aux voyageurs.
Les habitués de la ligne 14 du métro peuvent d’ores et déjà profiter, dans certaines stations, d’une information relative à l’affluence à bord des rames. Des écrans (actuellement en phase de démonstration à la station Châtelet - Les Halles) indiquent le niveau d’occupation grâce aux données générées par plusieurs capteurs : compteurs installés sur les portes palières, système de pesée… Combinées et analysées par des algorithmes, ces data deviennent une information très concrète pour les voyageurs, avec un taux d’affluence par mètre carré.
Maintenance prédictive
Il existe également des données relatives à la maintenance réservées aux équipes de la RATP : taux de panne sur le matériel roulant et sur les infrastructures, état des stocks des pièces de rechange… Autant de données qui permettent de faire de la maintenance prédictive.
Lire aussi : Compar:IA publie ses jeux de données sur les conversations des Français avec les IA
Avec de tels silos de données, le Groupe RATP a pris une décision en octobre 2022 : se doter d’une Data Factory. "La RATP génère énormément de données à travers ses activités, aussi bien en tant qu’opérateur de transport qu’en tant que mainteneur de systèmes de transport", explique Antoine Charpentier, responsable de la Data Factory. "Notre objectif est de faciliter la création de projets qui vont embarquer les équipes IT dans la valorisation de données."
Des fichiers collectés en mode batch
Aujourd’hui, ce sont 130 personnes qui font vivre cette unité située à la Maison de la RATP, sur les bords de la Seine, à Paris. Conçue comme un "collectif transverse", la Data Factory rassemble des profils aux compétences très variées. À commencer par les experts métiers, qui connaissent parfaitement le cœur de l’activité de la régie, mais aussi des spécialistes de la data, qui ont pour objectif de réaliser des modèles et des analyses de données. Sans oublier des chefs de projet et des informaticiens capables de concevoir des solutions techniques à la hauteur des enjeux. "Il s’agit d’une équipe pluridisciplinaire, car nous avons vocation à embarquer toute l’entreprise dans un projet de valorisation des données", souligne Antoine Charpentier.
Pour mener à bien ce projet, la Data Factory dispose de plusieurs plateformes dédiées à la collecte des données. Celles-ci collectent des fichiers en mode batch, un traitement qui consiste à exécuter des tâches répétitives (chaque jour, chaque semaine, chaque mois) contenant des volumes importants de données. Une "plateforme streaming" collecte également des données en temps réel, comme le temps d’attente entre chaque train, pour les diffuser en simultané auprès des voyageurs sur les écrans disposés dans le réseau.
Quant à la plateforme DIANE, elle fait figure de socle pour collecter et stocker les données avant de les modéliser et de proposer des indicateurs ainsi que des modèles d’intelligence artificielle (IA). Un outil jugé indispensable pour centraliser les données de façon sécurisée et travailler en transversalité.
IA générative et analyse documentaire
Autre chantier en cours, l’intégration de l’intelligence artificielle générative figure sur la feuille de route de la Data Factory. "Nous avons investi dans l’IA générative pour apporter du soutien aux agents en station grâce à des outils qui facilitent l’analyse documentaire", explique Antoine Charpentier. De façon très concrète, ces agents peuvent interroger, en langage naturel, un agent conversationnel (chatbot) pour répondre aux questions des voyageurs : quel est le tarif pour une famille de quatre personnes, dont deux enfants, pour aller à la station Charles de Gaulle - Étoile ? Combien de temps vais-je mettre pour me rendre au Parc de Sceaux en partant du métro Ledru-Rollin ? Autre cas d’usage : quelle procédure mettre en place lorsqu’un escalier mécanique ou un ascenseur tombe en panne dans une station ?
Lire aussi : Les promesses de l'IA agentique : entre automatisation et efficacité professionnelle
"Ces questions très concrètes sont le lot quotidien des agents en station. L’IA générative est en mesure d’apporter des réponses immédiates. Elle peut même proposer une série de liens vers la documentation la plus précise. Les agents peuvent également relancer le chatbot et affiner les questions pour obtenir la réponse la plus juste possible grâce à une analyse de la documentation".
En cours de déploiement dans les stations du réseau, ce chatbot a été en quelque sorte décliné au profit des activités de maintenance et des agents qui assurent l’entretien du matériel roulant et des équipements. "Nous lançons toutes ces expérimentations, car nous pensons que l’intelligence artificielle générative a beaucoup de valeur pour nos activités, notamment pour les agents qui doivent manipuler beaucoup de documentation technique".
La guerre des talents
Sous le capot, ces agents conversationnels s’appuient sur de grands modèles de langage (LLM, Large Language Model), plus particulièrement sur ChatGPT, qui a été intégré dans l’écosystème de la RATP. Et pour mener à bien tous ces projets, il faut des compétences particulièrement recherchées sur le marché du travail : data architects, data scientists, data engineers, data analysts…
La Data Factory a la chance de recevoir de nombreuses demandes de jeunes diplômés en intelligence artificielle et n’éprouve pas de difficulté pour recruter ce type de profil. "En revanche, il est plus difficile de trouver un expert métier disposant d’une expertise data", reconnaît Antoine Charpentier. "Nous sommes très actifs dans les salons professionnels et sur les réseaux sociaux, car la guerre des talents se joue sur ces terrains". Une démarche proactive jugée indispensable par la RATP, qui est aujourd’hui le troisième opérateur de transport public mondial, avec une présence dans une quinzaine de pays.