publicité

Accueil Archimag > magazines > Archimag n°219 > bientôt des résumés sons et lumières

bientôt des résumés sons et lumières

patrick brébion
archimag - novembre 2008

La masse croissante d’informations numériques a motivé quelques laboratoires de recherche et sociétés à se lancer dans un défi de taille. Mettre au point des méthodes et des logiciels pour résumer des corpus de documents multimédias.

lancé depuis le début de l’année, le projet de recherche RPM2 (Résumé plurimédia multidocuments et multiopinions) vise à automatiser la création de résumés d’informations textuelles, audio et vidéo : par exemple, générer une synthèse de tous les articles de presse, podcasts ou vidéos sur un thème donné. Le résumé se doit de préserver les différentes opinions émises dans cet ensemble de documents. À partir d’un extrait de la couverture médiatique sur les Jeux olympiques, « il s’agit par exemple de résumer la perception des gens sur la participation à ces JO sans omettre de faire apparaître dans le résumé les avis minoritaires sur ce sujet  », illustre Georges Linarès, chercheur au Laboratoire d’informatique d’Avignon (Lia), l’un des partenaires du projet. À terme, les applications se déclineront dans tous les domaines professionnels. « En réponse à une question sur l’un de ses clients, un commercial aura sur un seul écran un résumé textuel des échanges d’e-mails accompagné d’un chapitrage d’une vidéo, généré à la volée, des interventions de son client lors d’un salon professionnel », pronostique Gaëlle Recourcé, responsable de Sinequa Labs, un autre partenaire du projet.

identifier le type de discours

Les partenaires ont découpé en étapes le projet RPM2, qui doit s’achever en 2010. « La première phase consiste à savoir sur quel type de corpus, sur une interview, sur un documentaire, etc. l’on travaille », explique Gaëlle Recourcé. Il est difficilement imaginable de résumer sans identifier au préalable le type de source. Les techniques de résumé à mettre en oeuvre seront différentes selon les cas, interview, donc discours spontané, présentation d’actualités, etc. Les chercheurs travaillent sur plusieurs approches parallèles pour résoudre cette question, notamment par les caractéristiques de l’audio. « On ne parle pas de la même façon lorsqu’on est spontané ou non. La prosodie de la voix est différente. Par exemple, les voyelles s’allongent. Inconsciemment, cet allongement est là pour permettre de penser à ce que l’on va dire après », explicite Georges Linarès. Les variations dans le débit de parole donnent également une indication sur le type de discours. « Dans l’absolu, les mesures ne sont pas significatives. Et ce d’autant plus que les différents segments peuvent être composites. Par exemple, un homme politique désarçonné pendant son discours par la question d’un journaliste peut passer d’un discours formaté àune parole spontanée ». Le LIA affine ses méthodes par l’analyse de corpus, par exemple sur un ensemble de bandes audio de type parole spontanée. D’autres règles, caractéristiques d’un type de contenu, sont analysées. « Pour décider que l’on est dans une interview, deux locuteurs doivent être identifiés. Le temps de parole, plus long, permettra de repérer l’interviewé. Ce que nous mesurons en tant que facteur d’interactivité », décrit Georges Linarès. Une fois identifié, chaque segment plurimédia, son, vidéo ou texte est noté en fonction de plusieurs critères du type totalement spontané à pas du tout, subjectif ou objectif, émotif ou rationnel.

résumé dynamique

Les équipes ont commencé à travailler sur la génération des résumés. Pour ce faire, le laboratoire de Sinequa utilise des technologies sémantiques et ajoute des procédés spécifiques. « L’un d’entre eux est dénommé technique de la fenêtre glissante. Pour déterminer l’homogénéité d’un texte ou d’un ensemble de textes, cette fenêtre accorde une note sémantique à un paragraphe, traitant un sujet donné, puis passe au suivant. S’ensuit une note d’hétérogénéité liée à la dispersion du vocabulaire utilisé selon les passages », explique Gaëlle Recourcé de Sinequa. Défi supplémentaire, le but est de générer des résumés dynamiques qui s’enrichissent en même temps qu’un ensemble de documents donnés. La dernière étape du projet consistera à donner une cohérence dans le résumé final à partir des informations issues des différents médias texte, image et audio. « Marier ces modalités constitue un défi à part entière, peut-être le plus ambitieux du projet », conclut Georges Linares.

plus de repères

partenaires

Projet RPM2, décembre 2007-décembre 2010
Soutenu par l’Agence nationale de la recherche

  • Laboratoire informatique d’Avignon (LIA).
  • Institut Eurecom, privé, partenaire du CNRS.
  • Wikio, fournisseur de contenu.
  • Sinequa, éditeur spécialisé sémantique.
  • Syllabs, traitement automatique des langues.

résultats attendus

Intégration dans les logiciels de Sinequa et de Wikio des méthodes et outils logiciels mis au point. Publication des méthodes par le LIA après un délai de 3 mois.

    Envoyer &agrave un ami
 

Flux RSS IT : Ajouter à Netvibes - Ajouter à Google

<

Flux RSS Métier : Ajouter à Netvibes - Ajouter à Google

<

Flux RSS livres blancs : Ajouter à Netvibes - Ajouter à Google

<

Flux RSS derniere minute : Ajouter à Netvibes - Ajouter à Google

<