Linguistique de corpus pour une Communication orale homme-machine réellement anthropocentrée

Etude des phénomènes d'extraction en français parlé sur des corpus pilote de dialogue oral finalisé

Jean-Yves Antoine

VALORIA, Université de Bretagne Sud (EA 2593)
Rue Yves Mainguy
F-56 000 Vannes
Jean-Yves.Antoine@univ-ubs.fr

La communication orale homme-machine (CHM orale) a atteint une maturité que traduit l'apparition récente d'applications réelles telles que, par exemple, le système automatique de routage téléphonique grand public mis en place par AT&T (Lokbani & White, 1998), ou encore le système de réservation ferroviaire par téléphone faisant suite au projet européen ARISE (den Os et al, 1999).

En dépit de ces réussites, force est de constater que la portée des résultats obtenus reste limitée. On remarquera ainsi que la plupart des systèmes de dialogue développés à l'heure actuelle ne concernent qu'un seul domaine applicatif, celui du renseignement aérien (ATIS) ou ferroviaire. Il s'agit là de tâches très finalisées mettant en jeu des vocabulaires de taille modeste (quelques milliers de mots). Cette spécialisation a permis la mise en œuvre d'approches très pragmatiques (Minker et al., 1999) ne reposant sur aucune analyse détaillée des énoncés oraux. Si ces techniques se sont révélées robustes face au traitement de la parole spontanée, rien ne nous garantit cependant qu'elles se révèleraient toujours aussi efficaces sur des domaines d'application plus riches. D'une manière générale, la question de la généralisation des techniques utilisées en CHM orale à d'autres domaines n'est ainsi pas tranchée (Hirschman, 1998) et laisse éventuellement la porte ouverte à des changements de paradigmes sensibles.

La question de la généralité des méthodes utilisées en CHM orale constitue ainsi une interrogation centrale du domaine (Hirschman, 1998). Aussi regrettera-t-on de ne disposer que de peu d'outils méthodologiques pour la résoudre. D'une part, les grands programmes d'évaluation initiés par le (D)ARPA américaine, basés sur des métriques relativement grossières et concernés uniquement par le domaine ATIS, ne donnent que peu d'enseignements sur les évolutions futures du domaine (Antoine et Caelen, 1999). D'autre part, notre connaissance des caractéristiques linguistiques du dialogue oral finalisé est encore relativement limitée. Ces connaissances sont encore plus parcellaires en ce qui concerne l'étude de la variabilité (influence de la tâche, du contexte d'interaction, etc.) de ces caractéristiques.

En effet, la CHM orale n'a jusqu'ici fait qu'un usage très particulier des corpus oraux de dialogue finalisé : ces ressources linguistiques sont essentiellement utilisées pour l'apprentissage des systèmes de dialogue et de leurs composants langagiers (modèle de langage, compréhension de la parole, gestion du dialogue). Cet apprentissage suit le plus souvent une procédure (automatique ou non) itérative d'amorçage (bootstrap) qui consiste à effectuer une première modélisation grossière qui sera progressivement raffinée de manière empirique au vu des erreurs constatées du système. La technique du bootstrap repose ainsi sur une approche par essai-erreur ne laissant pas de place à une analyse détaillée des usages mis en jeu dans la situation considérée. Répondant à une logique ingénierique bien maîtrisée, cette utilisation bien particulière des corpus oraux ne peut cependant initier une réflexion sur les usages langagiers nécessités par une CHM orale réellement naturelle et conviviale.

La situation actuelle de la CHM orale semble ainsi paradoxale : d'un côté, on dispose de systèmes qui sont de plus en plus efficaces sur un type de tâches bien défini. De l'autre, en adoptant une approche orientée " traitement de l'information " - qui a son intérêt - au détriment d'une approche plus linguistique, la CHM orale ignore en partie le matériau sur lequel elle travaille. Ignorant les phénomènes linguistiques qui caractérisent le langage oral en situation de dialogue homme-machine, elle est ainsi dans l'incapacité de s'interroger sur la pertinence réelle des paradigmes qu'elle a développés.

Dans cet présentation, nous souhaitons montrer comment la linguistique de corpus peut apporter une réponse à cette situation d'aveuglement paradoxale. Nous considérons en effet qu'une analyse précise, rigoureuse, qualitative mais aussi quantitative, de corpus oraux issus de diverses situations interactives (linguistique variationniste), est à même de fournir une caractérisation linguistique utile à la fois au prototypage des systèmes de dialogue et à la conduite des recherches futures dans le domaine.

À titre illustratif, nous allons nous intéresser dans cette présentation à un type de phénomène linguistique particulier. Il s'agit des extractions ou plus généralement l'ensemble des phénomènes concernant la variabilité de l'ordre des mots dans l'énoncé. Cette étude a été menée sur deux corpus de français parlé correspondant à un genre particulier, le dialogue oral finalisé, et correspondant à deux tâches différentes (réservation aérienne et renseignement touristique).

Après avoir situé le cadre de cette recherche, nous détaillerons les résultats les plus significatifs de cette étude de corpus. Nous nous interrogerons ensuite sur les implications de ces résultats sur l'ingénierie des langues appliquée à la CHM orale. En particulier, nous verrons que cette étude nous a permis :

En guise de conclusion, nous nous interrogerons sur la portée plus générale de ce travail en esquissant la direction que nous souhaitons donner à nos travaux futurs en matière de linguistique de corpus appliquée à la CHM orale. Enfin, dans l'esprit de cette journée d'étude, nous détaillerons rapidement comment un outil d'analyse de corpus tel que le logiciel LoX, développé au laboratoire DELLIC (Audibert, 2001), permet une automatisation partielle de la caractérisation de phénomènes langagiers tels que ceux étudiés au cours de cette présentation.

Bibliographie

RETOUR