Article réservé aux abonnés Archimag.com

Retranscription automatique d'entretien : le scribe 3.0 est-il un mythe ?

  • 304 3_1 Tendance Speech to texte - Photo 4 Utilisation de Dragon en entreprise CJO.jpg

    dragon-nuance-communications
    Utilisation du logiciel Dragon Professionnal en entreprise. (Nuance Communications)
  • Il faut compter six heures en moyenne pour retranscrire une heure d'enregistrement audio ! Mais certains outils de retranscription automatique peuvent aujourd'hui se charger de cette activité ingrate, chronophage et objectivement improductive. Gratuits ou payants, ils se sont considérablement améliorés ces dernières années, grâce notamment au deep learning.

    En octobre 2016, Orange annonçait que les consultants de son agence de recrutement utilisaient depuis plus d'un an le logiciel de reconnaissance vocale et de retranscription Dragon Professionnal. Les avis sont alors unanimes : les consultants affirment que le temps dédié à la rédaction et à la relecture de leurs comptes-rendus d'entretien de recrutement a été réduit de moitié. Une centaine de licences y sont actuellement en activité.

    Françoise-MohymontNuance Communications est présent sur le créneau des technologies de reconnaissance et de synthèse vocales depuis 2000. En matière de retranscription, l'éditeur a développé les solutions Dragon et NTE : si le premier permet à un seul utilisateur de piloter un ordinateur à la voix, de dicter des textes ou même d'utiliser un enregistreur qui retranscrira ensuite automatiquement le texte dicté, le second est dédié à l'indexation et l'enregistrement de conversations, notamment des centres d'appels (à des fins d'archivage, de vérification du travail d'un employé ou d'analyse des demandes client).

    « Les méthodes de deep learning ont considérablement amélioré nos outils, explique Françoise Mohymont, ingénieur chez Nuance ; par exemple, elles vont permettre de préciser au fur et à mesure le profil d'un utilisateur, d'adapter l'outil en quelques secondes à des contraintes (une voix enrouée, par exemple) et de le rendre globalement plus rapide ».

    Le deep learning a également permis à Nuance de proposer l'option d'autoponctuation à ses clients : ou bien ils précisent la ponctuation qu'ils souhaitent dans leur dictée ou bien ils laissent le logiciel s'en charger. Enfin, la possibilité de personnaliser son vocabulaire grâce à l'analyse de documents existants permet à l'outil d'extraire des mots ou des noms qu'il ne connaît pas pour les ajouter automatiquement à un profil utilisateur. Une solution idéale pour les avocats ou les médecins, par exemple. 

    Le marché auquel s'adresse Nuance est évidemment très vaste, depuis les étudiants aux grands groupes en passant par les travailleurs indépendants ou les PME. Mais il est des demandes, pourtant récurrentes, auxquelles Nuance ne peut encore répondre. C'est le cas notamment de la retranscription pure de réunions de plus de deux interlocuteurs.

    « Nous travaillons actuellement sur ce sujet, explique Françoise Mohymont ; certes, nos technologies se rapprochent de plus en plus de ce besoin, mais nous avons choisi de préparer une solution globale avec un partenaire qui combinerait notre logiciel avec du matériel de capture de son ».

    Cette solution, qui n'existe pas encore, impliquera que chaque interlocuteur ait un micro dédié, pour qu'ensuite chacune des pistes des collaborateurs soit isolée, analysée, retranscrite, puis intégrée avec les autres dans un compte-rendu unique. 

    Retranscription à la demande

    De son côté, c'est sur le créneau de la retranscription automatique à la demande, depuis une plateforme en ligne, que se positionne Authôt. Cette société française créée en 2012 par deux ingénieurs propose à ses clients d'envoyer leurs fichiers audio ou vidéo à retranscrire via sa plat....

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !

    archimag-304
    L’Iso 15489-1:2016, nouvelle version de la norme sur le records management, intègre désormais les data. C’est en soi une petite révolution conceptuelle et pour le métier de records manager.
    Acheter ce numéro  ou  Abonnez-vous

    À lire sur Archimag

    Formulaire de recherche

    Le chiffre du jour

    C'est le nombre de documents relatifs aux attentats du 13 novembre 2015 et mis en ligne sur le site des Archives municipales de Paris.

    Nous suivre

    Publicité

    Recevez l'essentiel de l'actu !

    Le Mag

    Tout Archimag, à partir de 9,50 €
    tous les mois.