Publicité

LightOn lance son modèle d’IA open source pour la recherche documentaire complexe

  • lighton-modele-ia-open-source-recherche-documentaire-complexe.jpg

    L'objectif de Reason-ModernColBERT est de pouvoir connecter, synthétiser et retrouver les données nécessaires dans plusieurs documents, au-delà de ce que peut proposer une requête explicite (Freepik).
  • Développé par LightOn pour la deep research, Reason-ModernColBERT est un modèle d’IA non génératif qui s’appuie sur une architecture à interaction tardive : il filtre d’abord les documents les plus pertinents avant d’en analyser le contenu.

    La startup française LightOn dévoile un nouvel outil d’IA spécifique à la recherche automatisée et approfondie (deep research), afin de dépasser les limites des LLM et des IA génératives. Baptisé “Reason-ModernColBERT”, ce moteur d'inférence (composant central d'un système d'IA), est capable de comprendre la subtilité des questions complexes et de dépasser la simple association lexicale ou sémantique.

    Fondée en 2016, LightOn est spécialisée dans les architectures de recherche multi-vecteurs et les interactions dites « tardives » entre données et requêtes, sur la base d’un modèle open source. A l’inverse des modèles classiques, celui-ci ne compare pas toutes les données dès le départ, mais réalise une pré-sélection rapide des documents les plus pertinents pour réaliser une analyse plus approfondie sur un nombre réduit de documents.

    Lire aussi : Face à la vague IA, les documentalistes juridiques entre attraction et attentisme

    Un moteur d’intelligence pour la “Deep research”

    Pensé pour des cas d’usage exigeants, Reason-ModernColBERT introduit une logique de raisonnement. Cela permet non seulement de croiser des données dispersées, mais aussi d’en inférer des liens implicites, notamment lorsque la requête initiale est vague, incomplète ou hautement spécialisée.

    Entièrement open source et disponible sur Hugging Face, Reason-ModernColBERT s’appuie sur le kit de développement PyLate, conçu par LightOn pour une prise en main et un fine-tuning accessible (ajustement du modèle avec de nouvelles données). Le modèle, son code d'entraînement, ainsi que des jeux de données sont librement accessibles pour expérimenter, adapter ou enrichir l’outil.
    LightOn a d’ailleurs fait son entrée en bourse sur les marchés publics fin 2024.

    Lire aussi : ConversIA, un chatbot documentaire dopé à l'intelligence artificielle

    À lire sur Archimag
    Les podcasts d'Archimag
    Êtes-vous prêt pour la réforme de la facturation électronique ? À moins de 460 jours du grand lancement, l’écosystème se prépare activement. Lors de la Journée de la Facturation Électronique qui s'est tenue le 13 mai dernier à Paris, Archimag Podcast est allé à la rencontre des acteurs incontournables de cette réforme : les Plateformes de dématérialisation partenaires, ou PDP. Ensemble, nous avons parlé de leur rôle, de leurs spécificités, de leur modèle économique et de leur secret de longévité. Dans cet épisode, nous vous dévoilons qui sont ces acteurs et ce qu'ils préparent pour accompagner la réforme.

    Serda Formations Data 2023