Article réservé aux abonnés Archimag.com

L’intelligence artificielle au service de la création de métadonnées

  • intelligence-artificielle-creation-metadonnees.jpg

    intelligence-artificielle-creation-metadonnee
    L’intérêt des métadonnées ne se limite pas simplement à faciliter l’accès aux informations ! Elles contribuent également à l’automatisation de certaines tâches, et tout particulièrement à l’indexation des contenus. (Pixabay)
  • À l’ère de la dématérialisation, les métadonnées sont indispensables pour décrire les documents ou faciliter la recherche d’information. L’intelligence artificielle (IA) permet de les enrichir, de leur donner une certaine plus-value qui se fait ressentir, in extenso, sur les portails de gestion documentaire.

    mail Découvrez Le Brief de la Démat, la newsletter thématique gratuite d'Archimag dédiée aux projets de dématérialisation et de transformation numérique !

    Si, auparavant, il était assez simple de classer ses documents et d’identifier les informations importantes, la tâche est aujourd’hui beaucoup moins aisée !

    En effet, les données essentielles peuvent être contenues dans une multitude de supports (textes, photos, vidéos, schémas, etc.), dont le volume s’accroît au sein des organisations. Recenser, à la main, les data intéressantes et les centraliser dans des tableurs est une activité largement dépassée, en plus d’être coûteuse et source d’erreurs.

    > Lire aussi : GED, Intelligence artificielle et données : où en sont les organisations ?

    Un zest d’IA dans son système de gestion de l’information

    D’où l’intérêt, pour y remédier, d’implémenter un peu d’intelligence artificielle à sa Ged ou son ECM. En effet, la technologie est parfaitement capable de se substituer à l’humain pour traiter les contenus, surtout lorsque ces derniers sont nombreux.

    Correctement utilisées, l’IA et l’automatisation peuvent aussi bien extraire des données que des métadonnées cohérentes, bien utiles pour indexer et gérer les contenus et permettre de retrouver facilement l’information dont vous avez besoin.

    > Lire aussi : Comment la recherche d'information se transforme avec l'intelligence artificielle

    Intelligence artificielle, automatisation et métadonnées : un ménage à trois qui porte ses fruits

    L’IA peut désormais lire, créer et indexer des métadonnées pour divers contenus, des documents bien entendu, mais aussi des images, des vidéos ou encore des sons.

    Pour ce faire, elle peut s’appuyer sur un large panel d’outils : reconnaissance des caractères (OCR), de visages, de formes, de lieux, de couleurs, machine learning, moteur speech-to-text (ou parole-texte), etc. Autant de leviers qui contribuent à une fabrication plus rapide des métadonnées, indispensables à la recherche et à l’exploitation de contenus au sein des organisations.

    Vers une indexation automatique des contenus

    Cependant, l’intérêt des métadonnées ne se limite pas simplement à faciliter l’accès aux informations ! Elles contribuent également à l’automatisation de certaines tâches, et tout particulièrement à l’indexation des contenus.

    En effet, les logiciels de digital asset management (Dam), par exemple, ont recours aux métadonnées pour rendre plus intelligente et plus fine l’indexation des ressources qu’ils agrègent. Par ailleurs, les métadonnées peuvent contenir des informations assurant une meilleure compréhension des contenus. Par exemple, les métadonnées relatives à un document partagé par plusieurs collaborateurs vont intégrer un historique de modifications pour fluidifier le travail collaboratif et garantir un meilleur suivi.

    > Lire aussi : Gestion des connaissances : la révolution de l’intelligence artificielle

    Le machine learning à la rescousse

    Et ce n’est pas tout, puisque le machine learning permet d’aller plus loin avec les métadonnées. En effet, en s’appuyant sur l’apprentissage en continu, les systèmes concernés peuvent anticiper les besoins des professionnels (recherche prédictive) ou les aider à prendre de meilleures décisions via des recommandations intelligentes.

    Évidemment, plus les métadonnées sont nombreuses, complètes et pertinentes, plus la technologie est efficace. Cette association révèle le vrai potentiel des outils de gestion de données, alimentés en continu par le pool de data de l’organisation et par l’intégration automatique de métadonnées, notamment à partir d’applications Saas (Hubspot, Koban, Salesforce, etc.).

    Les métadonnées sans se ruiner

    L’utilisation d’outils performants soulève cependant la question – légitime – des coûts nécessaires à la création et à l’exploitation des métadonnées. En réalité, ce processus ne nécessite généralement que deux étapes : la complétude et la validation des métadonnées, puis l’ajout de valeur. De plus en plus d’organisations s’intéressant aux métadonnées confient leurs catalogues de données à des développeurs ou intégrateurs, dont l’intervention évite aux collaborateurs en interne de perdre du temps à saisir les métadonnées manuellement. En contrepartie, ce choix est synonyme de dépenses importantes.

    Pour les structures faisant le choix de l’internalisation, la maîtrise des coûts est plus aisée. Certes, il est encore difficile de recruter des data scientists, le métier étant encore trop récent et peu répandu, mais de nombreux logiciels de gestion de contenus dopés à l’IA (Dam, ECM, IIM, etc.) sont disponibles sur le marché. Aujourd’hui, la priorité est avant tout de disposer d’un outil basé sur une IA suffisamment performante pour assurer la création et le traitement des métadonnées.

    > Lire aussi : Quand les archives font appel à l'intelligence artificielle

    De multiples outils pour répondre aux besoins des professionnels

    Les solutions pullulent sur le marché de l’IA. Difficile de faire sans les Gafam et les multiples outils qu’ils proposent : Google Vision (analyse granulaire des images basée sur le machine learning), Amazon Textract (reconnaissance et extraction de données spécifiques), Microsoft Cognitive Services (OCR et machine learning, entre autres), etc. La limite de ces solutions : elles ne proposent que des modèles génériques ne répondant pas nécessairement aux besoins métier des organisations.

    C’est ainsi que d’autres éditeurs, à l’instar de Nuxeo, se distinguent grâce à des services personnalisés et sont capables de générer des données spécifiques en adéquation avec les attentes de leurs utilisateurs. D’autres, tels qu’Informatica, développent des solutions complètes pouvant collecter les métadonnées pour renseigner les utilisateurs au mieux. Enfin, pour les contenus multimédias, il est préférable d’utiliser des outils adaptés, comme les logiciels de Dam de Wedia, Keepeek, MomaSoft, Einden, Orkis, Dalim Software et consorts qui classent automatiquement les images et vidéos en leur attribuant les métadonnées appropriées.

    > Lire aussi : Intelligence artificielle : une veille augmentée ?

    Bien choisir sa solution

    Ces exemples ne sont cependant qu’une infime partie des nombreux outils disponibles sur le marché. Pour ne pas se tromper, plusieurs caractéristiques sont déterminantes dans le choix du logiciel de gestion de contenu à retenir : intégration facilitée, interopérabilité, adaptation aux différents contenus, administration aisée, capacité à traiter des volumes importants, etc.

    Surtout, la solution doit disposer d’un machine learning adapté aux besoins de l’organisation, avec des modèles d’apprentissage pouvant évoluer et s’améliorer constamment. Par ailleurs, la technologie ne remplace pas l’humain : une intervention manuelle est toujours nécessaire pour valider les métadonnées créées. Aussi, l’outil retenu doit disposer d’une interface simple à utiliser, tenant compte de ces étapes de validation. Enfin, l’IA doit elle aussi être à la hauteur et répondre aux besoins des utilisateurs, tant en production de métadonnées que sur la recherche d’information.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    veilleurs-documentaliste-teletravail
    Deux ans après le premier confinement destiné à lutter contre la pandémie de Covid-19, comment la « vie d’après » des documentalistes et des veilleurs s’esquisse-t-elle ? Télétravaillez-vous davantage ? Dans quelles conditions ? Accédez-vous facilement à vos données et logiciels ? Cela produit-il des changements dans vos missions ? Votre place dans l’organisation reste-telle la même ? Comment le travail collaboratif s’en ressent-il ? Ces évolutions vous conviennent-elles ? Archimag vous livre les résultats de son enquête. Ils sont commentés par différentes personnalités ou observateurs reconnus. Des professionnels témoignent de leur nouveau quotidien.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.

    supplement-confiance-numerique-270500.png