La startup française LightOn dévoile un nouvel outil d’IA spécifique à la recherche automatisée et approfondie (deep research), afin de dépasser les limites des LLM et des IA génératives. Baptisé “Reason-ModernColBERT”, ce moteur d'inférence (composant central d'un système d'IA), est capable de comprendre la subtilité des questions complexes et de dépasser la simple association lexicale ou sémantique.
Fondée en 2016, LightOn est spécialisée dans les architectures de recherche multi-vecteurs et les interactions dites « tardives » entre données et requêtes, sur la base d’un modèle open source. A l’inverse des modèles classiques, celui-ci ne compare pas toutes les données dès le départ, mais réalise une pré-sélection rapide des documents les plus pertinents pour réaliser une analyse plus approfondie sur un nombre réduit de documents.
Lire aussi : Face à la vague IA, les documentalistes juridiques entre attraction et attentisme
Un moteur d’intelligence pour la “Deep research”
Pensé pour des cas d’usage exigeants, Reason-ModernColBERT introduit une logique de raisonnement. Cela permet non seulement de croiser des données dispersées, mais aussi d’en inférer des liens implicites, notamment lorsque la requête initiale est vague, incomplète ou hautement spécialisée.
Entièrement open source et disponible sur Hugging Face, Reason-ModernColBERT s’appuie sur le kit de développement PyLate, conçu par LightOn pour une prise en main et un fine-tuning accessible (ajustement du modèle avec de nouvelles données). Le modèle, son code d'entraînement, ainsi que des jeux de données sont librement accessibles pour expérimenter, adapter ou enrichir l’outil.
LightOn a d’ailleurs fait son entrée en bourse sur les marchés publics fin 2024.
Lire aussi : ConversIA, un chatbot documentaire dopé à l'intelligence artificielle