Programme Langues, apprentissage, traductologie et informatique

VOLET I - LANGUES EN SCÈNE : APPRENDRE L'ESPAGNOL PAR LE THÉÂTRE

Ce programme, développé en étroite collaboration avec des chercheurs du laboratoire des Sciences du langage de l'UTM (Octogone) vise à construire un outil numérique facilitant l'acquisition de la langue par le théâtre (et, dans le même temps, du théâtre par la langue). À partir de pièces de théâtre mises en scène dans le but d'être jouée devant un public et du travail de répétition qui préside à la représentation des spectacles, il propose une plateforme numérique d'apprentissage offrant des documents vidéo didactisés afin de servir de supports d'apprentissage de la langue espagnole et des théories critiques d'appréhension des arts de la scène, allant de la compréhension à la répétition vers la production.

Les supports de cours d'un enseignant de langue vivante se sont fortement diversifiés à partir des années 1980 avec l'entrée des approches communicatives dans l'enseignement secondaire et supérieur (Puren, 1988 ; Germain, 1983). À la suite des méthodologies audio-visuelles, ces approches ont facilité l'accès à des enregistrements sonores, des reportages vidéo et des documents authentiques (dont la création ne visait pas a priori l'utilisation en classe de langue) divers (affiches de cinéma, publicités, articles de journaux, reportages radiophoniques, extraits de films, etc.). Depuis le début des années 2000, le Cadre Européen Commun de Référence pour les Langues (désormais CECRL, Conseil de l'Europe, 2001) encourage les enseignants à sensibiliser les apprenants à la culture de la langue qu'ils sont en train d'apprendre en leur proposant des activités ancrées dans la vie réelle des locuteurs de cette langue. Ainsi, les supports de cours montrant des extraits de la culture cible (celle de la langue que l'on apprend) sont-ils à préférer. C'est dans cette démarche que s'inscrit notre projet. Nous sommes parties de pratiques théâtrales réelles en langue espagnole pour proposer des supports d'apprentissage de cette langue étrangère à des apprenants novices (niveau A1-A2 pour le CECRL) ou à des apprenants plus expérimentés (niveaux B (B1-B2) ou C (C1-C2) sachant que 6 niveaux existent).

Le propos est donc triple :

a- sensibiliser un apprenant adulte à la langue espagnole à partir de témoignages authentiques de cette langue afin qu'il se familiarise avec des formes d'expression linguistiques énoncées dans une communication réelle. De nombreuses études ont montré que l'individu habitué en situation didactique à appréhender globalement les échanges verbaux développe des stratégies de communication « programmes, potentiellement conscients, qu'un individu adopte pour résoudre ce qu'il se représente comme un problème pour atteindre un objectif communicationnel particulier» (Faerch et Kasper, 1980, p. 18) ;

b- aider à comprendre la langue étrangère en contexte en reconstituant grâce aux objets et personnes figurés le sens des énoncés. Habituer l'apprenant à émettre des hypothèses et à faire des inférences à partir d'un prélèvement d'indices pragmatiques et linguistiques développe la compétence de compréhension (Spanghero-Gaillard, 2008) ;

c- produire la langue espagnole. Développer la capacité à s'exprimer oralement est l'objectif ultime de la pédagogie engendrée par les méthodologies audio-visuelles (Besse, 1985). Nous reprenons à notre compte cette visée en proposant des exercices de répétition qui engendrent des automatismes (Bialystok, 1990). Mais nous savons aussi que la présence d'un interlocuteur expert de la langue est indispensable pour évaluer la production de l'apprenant. Ainsi, des activités en semi autonomie (l'apprenant est guidé par un enseignant) permettent-elles d'accompagner l'apprentissage de la production orale par le biais des reformulations et les explications complémentaires de l'enseignant (Spanghero-Gaillard & Arroyo, 2009).


Le projet est porté conjointement par des spécialistes de plusieurs disciplines scientifiques se situant à la croisée du théâtre, de la langue et de la culture espagnoles et de la didactique des langues étrangères. Ensemble, ils collaborent pour faire de ce projet un outil stimulant d'apprentissage de l'espagnol et, dans le même temps, une voie d'accès au théâtre espagnol contemporain.

Contact : Emmanuelle Garnier (LLA-Créatis) et Nathalie Spanghero-Gaillard
(Octogone)


Manifestations et réalisations


- Séminaire mensuel « Langues en scènes »

- La principale réalisation visée est la création d'une plateforme numérique d'apprentissage des langues par les arts et des arts par les langues.

- Le premier livrable (février 2012), autour de la pièce de théâtre La Casa de Bernarda Alba de Federico García Lorca, montée par la compagnie Les Anachroniques sous la direction de Matthieu Pouget) a fait l'objet d'un financement par l'Université Ouverte des Humanités, dans le cadre de son appel à projets annuel.

- Projet : "Langues en actes : apprendre une langue étrangère par le théâtre". Ressource numérique sur le site de l'Université Ouverte des Humanités (UOH)

VOLET II - CORRECTOOLS : TRADUCTOLOGIE ET INFORMATIQUE


Objectifs du programme

Ce programme est la suite d'un projet précédent dénommé « Transtyler », qu'il a repensé et redéfini sur des bases nouvelles. Il vise à produire des outils informatiques de correction d'erreurs textuelles, grammaticales et stylistiques, associés à des outils d'apprentissage raisonné des langues.

Initié par LLA (sous le nom de Transtyler), il s'est étendu à une collaboration très poussée entre le laboratoire et l'Institut de Recherche Informatique de Toulouse (IRIT, UPS) qui copilote à présent le programme. Depuis la fin 2008, un partenariat est également engagé avec le laboratoire CAS (EA 801) de l'UTM. Il s'agit donc d'un projet collaboratif ouvert, à fort potentiel de valorisation industrielle.

Les locuteurs produisant des documents dans une autre langue que leur langue maternelle (par exemple les Français écrivant en anglais) rencontrent souvent des difficultés d'ordre lexical, grammatical ou stylistique qui rendent leurs textes difficiles à comprendre pour des locuteurs dont la langue maternelle est la langue cible de ces documents. Dès lors, le professionnalisme et la crédibilité de ces textes en sont souvent affectés.

Le principal objectif de Correctools est de développer des procédures de corrections de ces erreurs qui ne peuvent pas (et ne pourront pas avant longtemps) être traitées par les traitements de textes les plus avancés (tels ceux de Suite Office ou Open Office ou leurs avatars). Par extension, l'objectif est également d'aider à corriger les erreurs de style devenues fréquentes dans les textes rédigés directement dans la langue maternelle du locuteur (l'un des aspects du programme étant par conséquent le travail sur le couple français incorrect/français correct).


Contrairement aux traitements de textes courants mais dans l'esprit des systèmes d'aide à l'apprentissage, le programme CorrecTools souhaite, et c'est l'une de ses spécificités, laisser à l'utilisateur le choix des corrections, lui fournissant des arguments pour/contre telle correction proposée, dans le cas où plusieurs corrections sont possibles. La dimension apprentissage du projet sera donc importante (proposition de solutions de correction, aide à la décision, et rappel des règles pouvant s'appliquer). Elle pourra soit aboutir à un logiciel indépendant, soit être implémentée comme « brique » dans un GED (Gestionnaire Electronique de Document) à l'appui de traitements de texte existant. Cette approche fondamentale (réflexion sur la grammaire) et l'aspect didactique du programme, en rupture avec les modèles existant, font l'intérêt de la démarche et la positionne de façon originale dans un champ de recherche déjà très balisé. Ainsi les évaluateurs du 3rd Linguistic Annotation Workshop (The LAW) de Singapour ont-ils pu évaluer très positivement le projet : This paper describes an attempt to richly annotate errors in language usage in text generated by native French speakers. The basic premise of the research is sound, and the resulting resource has tremendous applications in the growing field of language error correction.


Pour atteindre ces objectifs, il est nécessaire de produire un modèle de stratégies cognitives employées par les correcteurs humains (enseignants, traducteurs professionnels) lorsqu'ils détectent des erreurs. Les premières observations montrent qu'il ne peut s'agir de stratégies simples et immédiates, mais que les erreurs de diagnostic et les corrections sont souvent fondées sur un processus complexe d'analyse et de décision.


Ce projet comprend donc les composantes fondamentales et applicatives suivantes:

1. Les aspects linguistiques : le fonctionnement de la grammaire en général, et en particulier en anglais, les liens entre le lexique et la grammaire, les différents paramètres du style selon le type de document (courriels, forums, rapports et publications), la prise en compte de l'utilisateur-apprenant,

2. Les aspects cognitifs : les stratégies déployées par les experts pour identifier et analyser les erreurs et proposer une ou plusieurs corrections, les formes d'argumentation employées ainsi que les processus de décision menant à la correction effective,

3. Les aspects didactiques : les types de dialogues entre l'assistant et l'utilisateur visant à faciliter l'acquisition de compétences en langue, dans le cadre d'une théorisation de l'explication,

4. Les aspects de modélisation : le développement de modèles adaptés en particulier en traitement automatique des langues, ainsi qu'en argumentation et théorie de la décision (pour la correction) et en question-réponses (pour l'assistant intelligent et coopératif)

Les principaux langages étudiés (langues cibles et/ou sources) seront le français, l'anglais et l'espagnol.

Contacts : Emmanuelle Garnier (LLA-Créatis), Arnaud Rykner (LLA), Patrick Saint-Dizier (IRIT)


Réalisations prévues

La principale réalisation visée est la création d'un prototype pouvant se greffer sur un éditeur de textes: ce prototype fera l'objet d'une évaluation détaillée par des étudiants et des enseignants en enseignement des langues.

Le programme reposera concrètement sur :

* Des masters et thèses (plusieurs projets déjà inscrits),

* Des ateliers et séminaires réguliers, des publications internationales (plusieurs déjà publiées),

* Le développement de collaboration rapprochées avec les utilisateurs finaux (enseignants - dont enseignants de langue -, chercheurs, utilisateurs variés devant rédiger des textes en langues étrangères)

* Le dépôt d'une demande de financement auprès de l'ANR

* La recherche de partenaires industriels

Est également visée la publication des résultats obtenus lors de manifestations internationales (déjà 5 publications internationales en 2009 et 2010 ), dont C. Albert, M. Garnier, A. Rykner, P. Saint-Dizier, « Analyzing a corpus of documents produced by French writers in English: annotating lexical, grammatical and stylistic errors and their distribution », The Fifth Corpus Linguistics Conference, University of Liverpool, 20-23 juillet 2009. [Actes à paraître] ; C. Albert, M. Garnier, A. Rykner, P. Saint-Dizier, «Annotating language errors in texts: investigating argumentation and decision schémas», 3rd Linguistic Annotation Workshop (The LAW). Suntec, Singapore 6-7 août, 2009 ; C. Albert, M. Garnier, A. Rykner, P. Saint-Dizier, « Description et annotation des erreurs. Le cas des francophones s'exprimant en anglais », in Multilinguisme et traitement des langues naturelles, sous la dir. d'I. Biskri et A. Jebali, Québec, Presses de l'Université du Québec, 2010, p. 54-70.