Découvrez Le Push du Veilleur, la newsletter thématique gratuite d'Archimag dédiée aux professionnels de la veille et de la documentation !
Les organisations spécialisées dans la gestion des connaissances manipulent une grande quantité de documents, ce qui complique leur classement au sein d’un système convivial, surtout si l’organisation a peu de moyens financiers et RH.
Voici le cahier des charges de départ :
- faciliter l’actualisation (ajout ou mise à jour de document) ;
- permettre de retrouver les documents, dans plusieurs langues et selon plusieurs critères ;
- gratuité (ou presque) ;
- maintenance facile (sans l’assistance d’un informaticien externe).
Lire aussi : L’Intelligence artificielle au service de la saisie de notices documentaires
Pendant longtemps, aucune solution technique n’était satisfaisante : ou bien il fallait acquérir un outil onéreux, ou bien réaliser de nombreuses tâches manuellement. Mais ces dernières années, deux révolutions technologiques ont permis de développer un système qui répond aux critères du cahier des charges décrit précédemment :
- l’apparition des outils "no-code", dédiés à un développement à la fois exigeant techniquement, mais très facile à réaliser et à maintenir. Ici, il s’agit d’Airtable, pour la base de données, et de Make, pour l’automatisation du processus ;
- l’arrivée des LLM (large language models ou grands modèles de langage), à la fois puissants et très facilement implémentables, et qui ont servi à finaliser le système. Il s’agit ici de ChatGPT.
Grâce à ces outils, il est désormais possible de :
- d’ajouter un document en un clic ;
- de créer automatiquement les métadonnées ;
- de retrouver ces données dans une interface « user friendly ».
Explorons maintenant chaque brique du système (retrouvez la vidéo de démonstration)
1 - Airtable
Airtable est un outil qui permet de gérer une base de données aussi simplement qu’avec un fichier Excel ou Google Sheets, mais avec la robustesse d’une base de données, la possibilité de connecter différentes tables entre elles (base de données relationnelle) et des fonctionnalités pour créer des applications.
La première étape a donc consisté à créer une base de données avec une seule table. Voici les principaux champs créés et les types de données associés :
Champs | Type |
---|---|
Title | Texte court |
URL | Lien internet |
File | Fichiers |
Description (FR) | Texte long (avec formatage enrichi : police, titre, lien, puce) |
Description (EN) | Texte long |
Category | Choix multiple |
Type of document | Choix multiple |
Original language | Choix multiple |
Keyword (FR) | Texte court |
Keyword (EN) | Texte court |
L’ajout d’un document dans la base peut se faire de plusieurs manières. Le plus simple étant d’utiliser le plugin du navigateur "Airtable web clipper" : d’un simple clic, le plugin détecte et envoie l’URL du document dans la base de données.
Lire aussi : Au cœur des bases de données documentaires
2 - Scenarios Make
Make est une plateforme d’automatisation qui permet de connecter des applications et services web sans compétences en codage, en utilisant simplement une interface graphique (voir schéma 1). Deux scénarios ont été créés.
Scénario n° 1
Il permet d’extraire le texte brut du document. Ce scénario est configuré pour se lancer chaque fois qu’un nouveau document est ajouté dans Airtable :
- déclenchement automatique par Airtable d’un Webhook (qui sera lu ensuite par Make) ;
- récupération des informations liées au document (à ce point, uniquement l’URL) ;
- en fonction du type de document (PDF, Google Docs ou site web)… ;
- … extraction du texte brut du document (l’extraction pour les documents PDF se fait à travers le module de PDF.co) ;
- ajout du texte brut dans Airtable ;
- envoi d’un Webhook pour lancer le deuxième scénario.
Scénario n° 2
Il a pour objectif de récupérer le texte brut, de générer les métadonnées et de les enregistrer dans Airtable. Voici les principales étapes :
- réception du Webhook du scénario n° 1 ;
- récupération du texte brut dans Airtable ;
- limitation du nombre de caractères (pour tenir dans la limite de token de ChatGPT) ;
- génération des métadonnées par ChatGPT ;
- traitement du résultat de ChatGPT (principalement pour le format, et notamment les retours à la ligne inutiles) ;
- traitement du résultat de ChatGPT sous format JSON pour obtenir les différentes données ;
- enregistrement des données dans Airtable.
Lire aussi : Documentation : pour ses 30 ans, Interdoc parle surtout d’avenir
3 - prompt ChatGPT
La vraie magie de cette application réside dans ChatGPT. Voici le prompt utilisé :
Analyse the text between three inverted commas to generate :
- Language of the text between inverted commas
- Keywords in english
- Keyword in french
- Summary in english
- Summary in english
Language can be either English or French.
Limit keywords to a maximum of 5.
Summary french and english should be 500 words each. Use bullet point.
The result of your analysis must ALWAYS takes the form of a JSON file, as in this example delimited by {}. You check the JSON is valid. The summary french and English are betwen " ".
{ "Language": "English",
"Keywords in english": ["Listen", "Woman", "support"],
"Keywords in french": ["Ecoute", "Femme", "Accompagnement"],
"Summary in english": "Presentation of a project to support women by active listenning blabla" ,
"Summary in french": "Présentation d’un projet de soutien aux femmes par l’écoute active etc."
}
« »"Texte à analyser"" »
Note : « Texte à analyser » est remplacé automatiquement dans Make par le texte du document récupéré dans Airtable.
4- Interface Airtable
Airtable propose de présenter les données sous forme d’interface graphique (voir schéma 2). Nous avons décidé d’y présenter l’ensemble des documents sous forme d’une liste (à gauche) et le détail du document sur la page principale. Un moteur de recherche permet de lancer une recherche sur tous les champs (en français et en anglais).
Améliorations futures
La principale limite actuelle réside dans la taille du contexte. Ne pouvant envoyer au LLM que 4 000 token à analyser, on ne peut résumer que le début du document. Mais d’autres LLM sont en train d’apparaître, avec des fenêtres plus larges.
Alors que nous écrivons ces lignes, OpenAI propose déjà le modèle ChatGPT-4, avec un contexte de 32 000 token (environ 24 000 mots) (NDLR L’article que vous lisez fait 1 200 mots). Le modèle ChatGPT étant plus "intelligent", on peut espérer qu’il formule de meilleurs résumés.
Une autre évolution possible serait de copier tout le contenu des documents dans la base (en utilisant la vectorisation de texte, pour produire des versions plus synthétiques et compréhensibles par les LLM).
À partir de là, il sera possible de créer des chatbots qui discuteront directement avec vos données. Par exemple, au lieu d’aller chercher quel est le document qui décrit la procédure de demande de congés de votre entreprise, vous poserez la question en toutes lettres "Comment faire pour demander des vacances ?"
Lire aussi : Mutualiser son centre de documentation : un défi humain et technique
Malgré ces limites, l’application présentée ici répond au cahier des charges initial et est actuellement en fonctionnement dans l’organisation. Elle permet de démontrer que l’on peut désormais développer des solutions puissantes et fonctionnelles avec peu de moyens et sans savoir coder. Et ceci n’est que le début, car nous pouvons imaginer utiliser le même ensemble d’outils pour analyser des candidatures d’emploi ou organiser des posts pour les réseaux sociaux, par exemple.
Combien coûtent ces outils ?
- Airtable : la version gratuite est suffisante pour tester. Ensuite, la licence coûte 20 euros/mois.
- Make : la version gratuite est suffisante pour commencer. Ensuite, prévoir un abonnement à 9 euros/mois.
- OpenAI API : le tarif varie selon le nombre de token (approximativement le nombre de mots) du texte de chaque document envoyé. Ici, nous utilisons le modèle GPT-3.5 Turbo, avec 4 000 de contexte (celui de ChatGPT gratuit que tout le monde connaît). Le coût est de 0,001 5 dollar pour 1 000 token, soit 0,006 dollar au maximum pour chaque nouveau document.
- PDF.co : la version gratuite est suffisante pour commencer. Ensuite, il faudra prévoir 17,50 dollars pour 8 750 pages à transcrire.