Article réservé aux abonnés Archimag.com

Bases de connaissances : un travail d'information documentaire

  • bases-connaissances-methode-thesaurus-synthese-documentaire.jpg

    bases-connaissances-methode-thesaurus-synthese-documentaire
    L’IA peut certainement aider à la production de hiérarchies conceptuelles pour faciliter la conception et la gestion de telles bases de connaissances. (Pixelshunter/Freepik)
  • Méthode pour l’élaboration de bases de connaissances à partir de deux outils et pratiques documentaires : le thésaurus et le résumé ou la synthèse documentaire.

    enlightened CET ARTICLE A INITIALEMENT ÉTÉ PUBLIÉ DANS ARCHIMAG N°371
    mail Découvrez Le Push du Veilleur, la newsletter thématique gratuite d'Archimag dédiée aux professionnels de la veille et de la documentation !


    Comme nous l’avons évoqué dans des articles récents, nos métiers se sont d’abord consacrés, autour de 1950 (création de l’Institut national des techniques de la documentation (INTD) date de 1950), à la gestion de documents dans les entreprises ou le secteur public.

    Dans les années 1980, nos métiers se sont avisés que se développait le traitement de l’information, avec la révolution informatique (le rapport Nora-Minc sur "L’informatisation de la société" date de 1978). L’ADBS devient alors l’Association des professionnels de l’information.

    Au tournant du siècle, cette société de l’information, forme avancée de la société de consommation où l’on ne consomme majoritairement que de l’information, découvre que cette information n’est pas une fin en soi : elle est porteuse du Graal pour l’être humain : la connaissance.

    Lire aussi : Dépasser des obstacles culturels pour le partage des connaissances

    La "société de l’information" tend à devenir la "société de la connaissance". Le fameux knowledge management (gestion de la connaissance) apparaît, devenant autant une mode, une posture, qu’une réelle technique de gestion. Aujourd’hui, il n’est pas rare de rencontrer des centres de documentation devenus des knowledge centers.

    Des métiers prédestinés pour gérer la connaissance

    Nos métiers disposaient déjà de toutes les armes pour gérer la connaissance. Juriste de formation devenu documentaliste, nous allions peu à peu en prendre conscience. Le droit n’est rien d’autre que de l’information officielle rendue obligatoire.

    Les juristes se sont donc très tôt dotés des moyens de gérer la matière juridique avec des outils documentaires de qualité (le Recueil Dalloz, célèbre revue de jurisprudence, avec ses tables analytiques et chronologiques annuelles, naît en 1832).

    Nous étions habitués à des outils documentaires papier performants, à l’exemple de ces sommes juridiques que sont les répertoires à feuillets mobiles (voir les emblématiques "Jurisclasseurs") ou ces codes de l’édition privée, qui sont déjà des ébauches de bases de connaissances, avec leurs ajouts informationnels (renvois à d’autres textes, à des études de doctrine, à des jurisprudences…).

    C’est forts de cette culture documentaire que nous avons forgé notre méthode de base de connaissances, issue des techniques documentaires.

    Lire aussi : Méthode : capitaliser les connaissances dans un mode de travail hybride

    Notion de base de connaissances

    "Base de connaissances" désigne d’abord l’outil informatique qui permet de gérer l’intelligence artificielle : c’est le recueil des règles de raisonnement d’un domaine de connaissance que l’on va formaliser pour les mettre en œuvre, avec un moteur d’inférence permettant de conduire automatiquement des raisonnements.

    Mais "base de connaissances" définit aussi toute collection de données d’information permettant de gérer directement de la connaissance. C’est sous cette acception que nous plaçons notre méthode. Et pour celle-ci, nul besoin d’informatique complexe.

    Le mariage du thésaurus et du résumé documentaire

    Notre méthode est basée sur deux outils et pratiques documentaires de base : le thésaurus et le résumé ou la synthèse documentaire. Le thésaurus est l’outil prédestiné pour organiser la connaissance. Il se définit par "la représentation structurée et hiérarchisée des concepts d’un domaine de connaissance".

    Mais au lieu de l’utiliser pour indexer des documents, celui-ci devient l’épine dorsale, la structure même de notre base. Chaque descripteur est une entrée pour une notice qui porte une définition du concept qu’il décrit, généralisant ainsi les notes d’application (NA) des thésaurus classiques.

    Cette entrée peut aussi porter tout ce qui concerne le concept en question : références, sources, développement consignant les pratiques professionnelles maison, etc. Le résumé ou la synthèse documentaire trouve ainsi son emploi pour présenter tout ce qu’il faut savoir en peu de mots.

    On peut aussi insérer des renvois à des concepts voisins (Voir aussi ou VA). De sorte que la consultation de la base de connaissances, en passant d’un concept à l’autre, permet d’enrichir ou de réviser ses connaissances, voire de se former.

    Le thésaurus des Infostratèges

    Les Infostratèges ont défini un thésaurus qui regroupe leurs grands domaines d’activité, et qui est ainsi structuré en 7 champs sémantiques. Longtemps géré en interne, structurant même nos dossiers sous Windows et le classement de nos documents numériques, ce thésaurus est enfin apparu au grand jour lorsque nous avons inauguré la version 2 de notre site en 2018.

    Lire aussi : Les règlements intérieurs des centres de documentation

    Cette version publique du thésaurus ne présente que certaines richesses qu’une base de connaissances peut contenir, mais il offre un aperçu de l’intérêt d’un tel outil. La plupart des descripteurs sont dotés d’une définition, parfois de Voir aussi renvoyant à d’autres descripteurs.

    Des liens hypertextes externes peuvent aussi exister, comme pour des définitions juridiques qui renvoient souvent aux textes officiels en ligne : le descripteur RGPD renvoie au Règlement européen.

    Sur le site, le thésaurus joue aussi son rôle classique : tout ce que nous y publions est tagué avec les termes de celui-ci. De sorte que lorsqu’il consulte le site en mode thésaurus, le lecteur peut naviguer d’un concept à l’autre avec sa définition, comme dans un dictionnaire professionnel raisonné, mais voit aussi s’afficher tous les articles et actualités publiés sur ce concept. Thésaurus vivant, nous y insérons des descripteurs à mesure que les thématiques évoluent.

    Un exemple : notre base de connaissances sur le droit de l’information

    Pour nos activités juridiques (formation, articles, ouvrages, mais aussi pour l’e-réputation et son nettoyage juridique), nous gérons une base de connaissances en droit de l’information. Bâtie sur notre thésaurus juridique, les principaux champs sémantiques sont les grands domaines traités : propriété intellectuelle et droit d’auteur - données à caractère personnel - responsabilités civiles et pénales, etc. Précision : ce type de base peut tout simplement être gérée avec un traitement de texte, aménageant l’arborescence à partir du mode plan.

    Chaque descripteur présente uniformément :

    • la règle de droit en un court résumé ;
    • la référence du ou des textes de base : lien vers Légifrance ou Eur-Lex, au besoin copie du texte essentiel ;
    • la jurisprudence autour du point de droit, avec résumé de chaque décision importante et renvoi soit à celle-ci sur internet, soit à la décision archivée par ailleurs dans une base de jurisprudence.

    Autour des descripteurs principaux, il est possible d’insérer une synthèse du point de droit, renvoyant aux divers descripteurs parents ou à d’autres ailleurs dans le thésaurus (Voir aussi). De sorte qu’on a sous la main une première vision d’ensemble de la matière. "Donnée à caractère personnel" est un exemple emblématique : une synthèse permet de repérer les principales règles telles qu’édictées par le RGPD et la loi de 1978 modifiée. On trouve aussi une table de correspondance entre les articles du RGPD et leur mention dans la loi de 1978, dont on se sert souvent.

    Lire aussi : Créer une base de gestion documentaire avec ChatGPT et des outils no-code

    Dans une perspective professionnelle (notamment en e-réputation) nous y capitalisons :

    • les cas d’usage pratique de tel point de droit, renvoyant aux divers types de missions de nettoyage juridique ;
    • des conseils pratiques ou des synthèses de la jurisprudence actuelle. C’est notamment le cas en matière de déréférencement, d’anonymisation, de désindexation de contenus sur internet pour des personnes ayant eu affaire à la justice. La Cour européenne des Droits de l’homme a rendu un certain nombre d’arrêts essentiels en faveur des personnes concernées face au droit à l’information du public. Ces jurisprudences récentes font l’objet d’une synthèse d’actualité et d’une sous-entrée pour chacun de ces grands arrêts dont nous nous servons régulièrement.

    Pour conclure

    La structuration conceptuelle d’un thésaurus, colonne vertébrale de la restitution de l’information et de la connaissance est consubstantielle à la structuration de la pensée. C’est pourquoi elle nous paraît la plus logique et la plus naturelle.

    C’est ainsi qu’elle structure aussi notre production d’actualité sur notre site et qu’elle a structuré la dernière édition de notre Dossier d’Experts "Propriété intellectuelle et droit de l’information et de la communication en pratique", présenté sous forme de fiches synthétiques hiérarchisées. Dernier point : l’IA peut certainement aider à la production de hiérarchies conceptuelles pour faciliter la conception et la gestion de telles bases de connaissances.

    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    Serda Formation Veille 2023