Imprimer

Éric WERHLI
Responsable du projet (LATL, Université de Genève)


et Marie-Josée HAMEL
UMIST, Manchester


Intégration d’outils de TALN en EIAO : l’exemple du projet SAFRAN



1. Objectif et hypothèse de recherche

Le projet SAFRAN (Système pour l’Apprentissage du français) s’inscrit dans le paradigme des systèmes d’enseignement intelligemment assistés par ordinateur (EIAO) et a pour objectif le développement d’un système d’enseignement du français oral et écrit. L’intérêt de ce système concerne l’utilisation à des fins didactiques d’outils issus des recherches dans le domaine du traitement automatique des langues naturelles (TALN), tels que le dictionnaire électronique conceptuel, le synthétiseur vocal, les outils de conjugaison, l’analyseur syntaxique, etc. Avec SAFRAN, nous entendons montrer que certains de ces outils ont maintenant atteint un stade de développement suffisant pour être intégrés à des applications d’enseignement des langues où ils contribueront à augmenter la flexibilité de l’interface, notamment au niveau de la gestion et du traitement des ressources linguistiques ainsi qu’à enrichir les environnements d’enseignement et d’apprentissage.


2. Les systèmes d’EIAO

Les systèmes d’enseignement intelligemment assistés par ordinateur (EIAO) partagent leur architecture avec celles des tuteurs intelligents (Yazdani 1987, Frasson et Gauthier 1990). Ils ont pour mission l’intégration de techniques empruntées à l’intelligence artificielle dans les systèmes d’EAO, pour les rendre mieux adaptés au profil et aux besoins de l’apprenant. Ils comportent généralement un module expert, un module de l’apprenant, un module tutoriel et une interface usager. Le module expert emmagasine l’ensemble des connaissances sur le domaine à enseigner, c’est-à-dire les données factuelles et procédurales qui décrivent ce domaine. Le module de l’apprenant emmagasine l’ensemble des connaissances sur l’apprenant, c’est-à-dire des informations sur son profil (antécédents, style d’apprentissage, etc.) et sur l’état de ses connaissances du domaine expert. Le module de l’enseignant (tuteur) réunit des informations concernant le choix, le découpage et la reformulation des connaissances sur le domaine à enseigner, en fonction d’objectifs et de stratégies d’apprentissage déterminés à partir des connaissances sur l’apprenant. Finalement, l’interface-usager sert de canal de distribution et de collecte des connaissances, gérant ce que l’on appelle le dialogue utilisateur-machine (apprenant-expert).

Les systèmes d’EIAO sont des systèmes en principe dynamiques ; dans une application donnée, chacun des modules s’enrichit au fur et à mesure des connaissances accumulées dans les autres modules. La mise à jour des informations est par conséquent constante.


3. Outils de TALN dans les systèmes d’ELIAO

Les applications d’EIAO pour l’enseignement et l’apprentissage des langues (ELIAO) ont de particulier qu’elles intègrent une ou plusieurs composantes de TALN. C’est au niveau du module expert des applications d’ELIAO qu’on les retrouve. Le but de ce module, rappelons-le, est de modéliser le domaine des connaissances à enseigner. Quand le domaine en question est celui d’une langue, les connaissances à modéliser sont des connaissances linguistiques, définissables sur la base des niveaux de représentation suivants : phonétique, lexique, syntaxe, sémantique et pragmatique.

3.1. Fonctions des outils de TALN

Les outils de TALN se destinent à plusieurs fonctions (1), dont l’analyse et la génération automatique de segments de la langue orale et/ou de la langue écrite. Lorsqu’il s’agit de traiter de segments de la langue orale, l’outil d’analyse porte le nom de système de reconnaissance de la parole alors que celui de génération porte le nom de synthétiseur de la parole. Pour le traitement de l’écrit, l’outil d’analyse est le parseur (on dit aussi l’analyseur) ; celui de génération est le générateur de phrases et/ou de textes.

3.1.1 Traitement de l’écrit

Le parseur est l’outil de TALN qui a été privilégié jusqu’ici dans la recherche en ELIAO. On le rencontre dans des prototypes d’applications tels que LINGER (Yazdani, 1991), Alice (Lawler et Yazdani, 1987), GPARS (Loritz, 1992), STASEL (Payette et Hirst, 1992), COALA (Pieneman et Jasen, 1992), MSLE (Frederiksen, Donin et Décary, 1995), CALLE (Rypa et Feuerman, 1995) et BRIDGE (Sams, 1995). Dans ces applications, le parseur sert essentiellement d’outil d’aide au diagnostic. Sa fonction est de fournir une représentation de l’input écrit de l’apprenant (mot/phrase/texte), laquelle est ensuite comparée à une représentation produite par le système expert dans les mêmes conditions. Le résultat de la comparaison sert à établir un diagnostic, lequel en général repose sur la notion d’erreur (c.-à-d. sur l’écart qui existe entre l’input de l’apprenant et celui du système expert), mais peut aussi reposer sur la notion de compréhension du message (c.-à-d. sur ce que les représentations de l’apprenant et du système expert ont en commun).

L’intégration d’outils de génération automatique de phrases et/ou de textes dans les systèmes d’ELIAO est moins courante. Le système ILLICO (Ayache et al., 1997) en est cependant un exemple. Dans ce système, l’apprenant est invité à créer ses propres phrases aidé d’un générateur qui l’assiste au fur et à mesure dans sa composition en lui proposant des choix de mots suivant l’état des contextes syntaxique et sémantique. Le système opère dans un micro-monde (c.-à-d. un environnement linguistique fermé).

3.2. Traitement de l’oral

Du point de vue strictement TALN, on peut dire que les applications d’ELIAO sont encore silencieuses : les systèmes actuels comportent en effet peu ou pas de composantes de traitement de la parole, tant au niveau de sa reconnaissance que de sa génération. Un projet connu dans le domaine, le projet SPELL (Hiller et al., 1994), qui visait l’intégration d’un système de reconnaissance de la parole dans une interface d’ELIAO pour l’anglais, n’a pas eu de suite. Pour ce qui est des produits commerciaux qui intègrent une composante de reconnaissance de la parole (Prof de français (2), Dynamic English (3), Talk to Me (4), etc.), les résultats obtenus s’avèrent plus ou moins satisfaisants (la parole est traitée en segments non continus, les problèmes de bruits et d’accents pertubent toujours l’analyse, etc.). Il est un fait que la recherche dans le domaine de la parole est moins avancée que dans celui de l’écrit. Il faudra sans doute attendre encore quelques années avant de pouvoir penser à une intégration pleine et fiable d’outils de reconnaissance de la parole dans les systèmes d’ELIAO.

La synthèse de la parole reste la grande négligée des technologies de TALN en ELIAO. C’est d’autant plus surprenant qu’elle offre des outils utiles dans le domaine de l’enseignement des langues (Dutoit, 1997) et qui sont en fait plus fiables, plus économiques et plus accessibles que les outils de reconnaissance (Last, 1989). À notre connaissance, aucun prototype courant d’applications en ELIAO n’intègre de véritables outils de synthèse de la parole. Deux raisons majeures semblent expliquer cette lacune. La première, et la plus importante, réside dans le fait que les outils de TALN qui exploitent cette technologie sont rares donc peu disponibles. La deuxième est que ces outils, lorsqu’ils sont manifestement disponibles, n’ont parfois pas atteint la maturité nécessaire à l’ELIAO. Or la maturité tient dans la robustesse d’un outil de TALN, c’est-à-dire dans le fait qu’il offre une couverture exhaustive, fiable et constante des phénomènes linguistiques qu’il a fonction de décrire. C’est le cas, nous le pensons, des outils de TALN dans SAFRAN et, en particulier, du synthétiseur FIPSvox.


4. Les outils de TALN dans SAFRAN

Comme nous l’avons mentionné au début de cet article, notre objectif principal avec le projet SAFRAN est de montrer les avantages qu’offre pour l’enseignement des langues l’intégration d’outils de TALN. De plus, et dans la mesure du possible, nous avons cherché à réutiliser des outils développés à l’origine pour d’autres applications. C’est ainsi que l’analyseur syntaxique intégré à SAFRAN a été originellement développé pour un système de traduction automatique et le synthétiseur pour un système de lecture vocale, etc. Nous nous proposons maintenant de décrire brièvement ces outils.

4.1 Le synthétiseur vocal FIPSvox

FIPSvox est un système de synthèse vocale du français (Gaudinat et Wehrli, 1997). Construit sur la base de l’analyseur syntaxique FIPS (Laenzlinger et Wehrli, 1991), il ajoute à ce dernier une base de données phonétiques, un module de phonétisation et une sortie vocale. Très schématiquement, ce système fonctionne comme suit : le texte d’entrée est tout d’abord soumis à une analyse syntaxique détaillée, qui permet, en particulier, de lever pratiquement toutes les ambiguïtés lexicales impliquant des homographes hétérophones (mots qui ont une même orthographe mais qui possèdent des prononciations distinctes, ex. “président” : substantif ou verbe ?). Les structures analysées sont ensuite phonétisées, grâce aux informations lexicales (base de données phonétiques) et à un système expert (5) chargé de phonétiser les mots inconnus. Certaines règles d’ajustement phonétique s’appliquent ensuite, traitant la liaison, l’élision, la dénasalisation, etc. Enfin, une composante prosodique (6) intervient, chargée de déterminer les valeurs de fréquence fondamentale et de durée pour chacun des segments.

4.2 Le dictionnaire conceptuel FR-Tool

FR-Tool (FRench-Tool) (Hamel, Nkwenti-Azeh et Zahner, 1996) est un dictionnaire électronique conceptuel qui fournit pour chacune des entrées au lexique une représentation non linéarisée des connaissances linguistiques reliées au domaine de l’entrée sélectionnée. La base de données du FR-Tool est organisée à l’intérieur de champs obligatoires et de champs facultatifs. Les champs obligatoires correspondent plus ou moins aux champs des dictionnaires traditionnels (mot-vedette, catégorie lexicale, domaine du lexique, définition, traduction). Les champs facultatifs sont de deux types : champs grammaticaux (morphologie, sous-catégorisation) et champs sémantiques (syn/antonyme, hyper/hyponyme, mag/antimag, relié, dérivé, usage, idiomatique, etc.). La recherche qui entoure la définition des champs sémantiques s’inspire des travaux de Mel’cuk (1982) sur les fonctions lexicales. La base de données totalise aujourd’hui un ensemble d’environ 7 000 mots-concepts.

4.3 Le conjugueur FLEX

FLEX (FLEXion) est un système de conjugaison des verbes français qui permet la consultation de n’importe quel verbe français figurant dans le lexique, à tous les temps et tous les modes. Développé en Modula sur la base de règles de dérivations morphologiques, FLEX est capable de conjuguer, en principe, n’importe quel verbe de la langue française. Sa base de données totalise à ce jour plus de 15 000 verbes.


5. SAFRAN

Nos deux premières années d’activités de recherche ont porté sur l’élaboration d’un module destiné à l’enseignement et à l’apprentissage de la phonétique du français. Dans un premier temps, nous avons procédé à l’élaboration de contenus didactiques, contenus qui prévoyaient l’exploitation des outils de TALN que nous venons de décrire. Dans un deuxième temps, nous avons développé un environnement multimédia pour accueillir contenus et outils de TALN. Voici un bref compte rendu de nos travaux.

5.1 Élaboration de contenus didactiques

Chaque unité de leçon développée (il y en a dix) traite d’un aspect théorique de la phonétique du français et propose, en parallèle, des activités d’expérimentation et de pratique visant à une meilleure compréhension et à un renforcement de la matière enseignée. Les unités ont été prévues en fonction des besoins d’un public d’apprenants : des universitaires bulgarophones inscrits dans un programme de didactique de l’enseignement du français langue étrangère. L’aspect théorique couvre ainsi des notions qui se rapportent à la description des phénomènes segmentaux (voyelles, semi-voyelles et consonnes) et supra-segmentaux (liaison, “e” instable, prosodie) qui caractérisent la phonétique du français. La présentation de la matière comporte de nombreux rappels, définitions et illustrations. La partie expérimentale est consacrée quant à elle aux démonstrations. Elle met l’apprenant dans des situations où il doit faire appel à ses connaissances personnelles et à son intuition pour résoudre des problèmes en rapport avec des phénomènes observés (ambiguïtés catégorielles, dénasalisation, épenthèse, relation prosodie-syntaxe, etc.). Enfin, la pratique, par l’intermédiaire d’exercices variés, met l’accent sur le travail de discrimination auditive et de répétition mais aussi sur les relations qu’entretiennent entre elles les formes phonétique et graphique. Chaque unité de leçon est introduite par une série d’objectifs d’apprentissage et se termine par une synthèse présentée sous forme de graphes récapitulatifs et de mots-clés. Des conseils pour le futur enseignant ont été prévus ainsi que de courtes fiches biographiques et une bibliographie d’ouvrages consultés.

5.2 Conception d’interfaces

SAFRAN comporte trois interfaces qui gèrent le dialogue entre le système et l’usager. Ces interfaces sont : SAF-tuto, SAF-exo et SAF-dev. Elles ont été développées avec le langage de programmation Delphi.

5.2.1. SAF-tuto

SAF-tuto (SAFRAN-tutoriel) est l’interface qui interprète, sous forme de scénarios hypermédias, les unités de leçon du module de l’enseignant grâce à un système sophistiqué de liens hypermédias. Ces liens ouvrent des fenêtres secondaires, identifient des zones sensibles à l’intérieur de graphiques, font apparaître des définitions textuelles et/ou entendre des définitions sonores (avec FIPSvox) en indice sous des zones de texte, lancent des applications multimédias (animation, vidéo, audio), des programmes externes (SAF-exo, courriel, etc.). SAF-tuto s’occupe aussi de la gestion et de l’intégration des outils de TALN (FIPSvox, FR-Tool, FLEX).

5.2.2. SAF-exo

SAF-exo (SAFRAN-exercices) est l’interface qui gère les exercices du module de l’enseignant et les bases de données (phonèmes, paires minimales, mots du lexique, etc.) du module expert qui y sont associées. L’interface comporte quatre volets, chacun proposant à l’apprenant sous une forme plus ou moins ludique des activités entourant la pratique des sons du français. Le premier volet porte sur la discrimination auditive et le second sur la répétition. Le troisième, le volet graphie-phonie, porte sur la relation et le transfert de la forme graphique à la forme orale alors que le dernier volet, le volet phonie-graphie, porte, lui, sur la relation inverse, c’est-à-dire le passage de la forme orale à la forme écrite.

5.2.3. SAF-dev

SAF-dev (SAFRAN-développement) est la composante la plus récente de SAFRAN. C’est une interface qui sert à la saisie et à la gestion des bases de données de SAF-tuto et de SAF-exo. Sa fonction principale est de permettre à l’utilisateur-enseignant la mise à jour des bases de données du module expert (les lexiques) et de l’enseignant (les contenus des tutoriels et des exercices). SAF-dev permet de plus de modifier les liens hypermédias déclarés dans les contenus textuels et graphiques de SAF-tuto et de SAF-exo.


6. Intégration des outils de TALN dans SAFRAN

6.1. FIPSvox dans SAFRAN

6.1.1. Un outil de référence

FIPSvox peut synthétiser n’importe quel segment du français écrit. Dans SAFRAN, FIPSvox sert à l’apprenant d’outil de référence phonétique, car il lui permet d’entendre à tout moment la prononciation des mots ou des phrases qu’il aura lui-même sélectionnés dans l’interface de SAF-tuto. L’utilisation d’un synthétiseur tel que FIPSvox dans SAFRAN a l’avantage d’être économique puisqu’il ne demande aucun pré-enregistrement, et surtout offre une flexibilité maximale, puisque tout énoncé peut être synthétisé.

Les possibilités de synthèse de FIPSvox ont aussi permis la création d’un outil de recherche de mots par le biais de leur forme phonétique. Cet outil permet à l’apprenant de poursuivre une recherche lexicale sur un mot dont l’orthographe serait déficiente (“rancontrer”, “astronote”, “aporter”). Cette application répond en particulier à un besoin de l’apprenant bulgare lequel a du mal à gérer la correspondance entre les alphabets cyrillique et latin, ce qui lui cause entre autres des problèmes d’orthographe.

6.2.2. Un outil de démonstration et d’expérimentation

Les unités tutorielles du module de phonétique prévoient l’utilisation de FIPSvox pour illustrer, dans des situations de démonstrations, des phénomènes variés tels que la liaison, la chute du “e” instable, l’ambiguïté phonétique créée par les homographes hétérophones, les différents patrons prosodiques, etc. Les exemples entendus dans les démonstrations proviennent d’une intervention de FIPSvox sur des segments textuels rangés au niveau de la base de données de SAF-tuto. Ces segments peuvent être facilement modifiés avec SAF-dev.

L’apprenant est par ailleurs aussi invité à tester le synthétiseur en lui soumettant ses propres exemples. FIPSvox se prête bien à ce genre d’activités d’expérimentation puisque sa couverture phonétique est relativement exhaustive. En effet, à l’exception des liaisons facultatives qui sont traitées par défaut comme des liaisons défendues (ce qui de toute façon n’est pas une faute en soi), FIPSvox couvre tous les phénomènes caractérisant la phonétique du français.

6.1.3. Un outil d’aide à l’auto-évaluation et de support au diagnostic

La détection automatique d’erreurs, nous en avons parlé plus haut, est une composante importante de l’ELIAO. Or puisque nous n’utilisons pas d’outil de reconnaissance de la parole dans SAFRAN, le signal sonore de l’apprenant ne peut être analysé en tant que tel. Pour compenser, nous avons automatisé certaines tâches liées à la correction en utilisant les possibilités de FIPSvox. Dans cette perspective, nous avons cherché à fournir à l’apprenant des moyens de s’auto-évaluer.

C’est ainsi que FIPSvox intervient dans tous les volets de SAF-exo. Dans les volets discrimination, répétition et graphie-phonie, la réponse de FIPSvox sert de modèle de comparaison, modèle qui s’accompagne d’explications, s’il y a lieu. Dans le volet phonie-graphie, la gestion des réponses écrites de l’apprenant se fait par le biais d’une recherche phonétique qui s’effectue sur la réponse de l’apprenant, celle-ci étant en général un mot. À la suite de cette recherche, les équivalents lexicaux retrouvés par FIPSvox sont affichés à l’écran. L’apprenant peut ainsi comparer sa réponse à celles du synthétiseur. Dans le cas d’homonymie, tous les équivalents sont présentés.

6.2 FR-Tool et FLEX dans SAFRAN : des outils de référence

Le FR-Tool est un dictionnaire électronique conceptuel qui permet à l’apprenant d’avoir accès en ligne à des ressources lexicales riches et variées. Sa vocation première dans SAFRAN est celle d’outil de référence lexicale. Son adaptation pour ce projet a consisté à fournir une traduction bulgare pour chacun des mots-vedettes de la base de données. L’ajout d’une centaine de termes extraits du dictionnaire didactico-thématique français-bulgare de Decoo et Vessélinov (1995) a de plus permis d’élargir ce lexique conceptuel. Ces termes se rapportent à des thèmes choisis (existence, temps, espace, quantité, qualité, relations, etc.) qui font partie du programme d’études de l’apprenant bulgare.

Le rôle du conjugueur FLEX dans SAFRAN est aussi celui d’un outil de référence grammaticale. Le travail d’adaptation entourant son intégration dans SAFRAN a consisté principalement en un travail de transfert des données sur plateforme PC et de réécriture de l’interface en Delphi. Le conjugueur, quoique indépendant du lexique conceptuel, peut désormais être activé à partir de celui-ci.


7. Travaux en cours et futurs

En ce qui a trait au module de phonétique, nous nous intéressons présentement à la représentation du signal sonore. Nous visons au développement de supports visuels qui viendront se superposer, en temps réel, au signal de synthèse et à la transcription phonétique produits par FIPSvox. Le premier projet est un projet de modélisation articulatoire (animation de coupes sagittales). Le second projet concerne la représentation du signal prosodique. Tous deux utilisent comme point de départ les données résiduelles de FIPSvox (correspondance graphème-phonème, calcul de la durée et de la fréquence fondamentale des phonèmes). Comptent de plus, parmi nos projets futurs, la définition de contenus et d’exercices pour le module de grammaire de SAFRAN. Ce travail s’accompagnera d’une réflexion sur le rôle du parseur comme outil de TALN en ELIAO et veillera plus particulièrement à l’intégration de l’analyseur syntaxique FIPS dans le système SAFRAN.


Notes

(1) Comptent aussi parmi les fonctions des outils de TALN la recherche par mot-clé, l’extraction d’information. Ce sont des fonctions qui relèvent du domaine de la dictionnairique.

(2) Soft Collection, Micro Application, 20-22 Rue des Petits-Hôtels 75010