NOMEX-CLAPI     Nouvelles méthodes d'exploitation des corpus de langue parlée en interaction

ICAR   Retour    Suite
1- Présentation génerale
 du projet

2-  Corpus: définitions   et
entités qui s'y rattachent
3-  Traitement des corpus
en vue de leur intégration
dans CLAPI
4- Questions de transcription 5- Outils de transcription et d'analyse de corpus

6- Plate-forme CLAPI 7- Analyses et requêtes

8- Perspectives Bibliographie du programme et générale Annexes Attention accès réservé aux équipes du projet


Ce programme cristallisait différents projets, activités et réflexions en cours au sein de l'UMR ICAR, autour de la question des corpus de Langue Parlée en Interaction (LPI) : archivage, numérisation, transcription et standardisation de formats informatiques, exploitation et analyse des corpus avec des méthodes qualitatives et quantitatives, articulation de cadres théoriques différents (analyse des interactions, linguistique de corpus).

Il s'agit d'une réalisation interdisciplinaire réunissant les compétences des trois équipes partenaires en informatique et en linguistique, ERIC (Lyon 2), ICAR (UMR CNRS/Lyon2), RIM (Ecole des Mines).

Son résultat majeur à ce jour est la base de données de Français Parlé en Interaction, CLAPI 2, et les outils correspondants d'analyse et de requête.

Elle a permis d'inscrire des thèses sur des problématiques apparentées au programme dans chacune des équipes.

Elle nous a également conduit à organiser des formations interdisciplinaires en interne et en externe, et a été présentée dans différentes manifestations scientifiques.

Le programme a aussi permis d'élargir le réseau interdisciplinaire de collaborations nationales et internationales.

Sur le plan national, à partir des travaux effectués dans le programme NOMEX-CLAPI, des relations se sont établies :

– avec des équipes de linguistique : Lidilem (Grenoble), DDL (Lyon), Institut Gardette (Lyon) pour la numérisation des données, ILF, Lacito (Paris);

- avec des équipes en informatique : LORIA (Nancy), LIMSI (Paris) , LIUM (Le Mans), GREYC (Caen)  ;

- avec des équipes de juristes : CECOJI (Paris). Les questions juridiques et de déontologie posées par la base de données de corpus de langue parlée en interaction conduisent aussi ICAR à participer aux travaux de la commission de pilotage « Questions juridiques et corpus oraux » de la DGLF-LF .

Sur le plan international, le programme nous a permis de poursuivre les relations de recherche avec l'IDS (Institut für Deutsche Sprache, Mannheim), qui est l'établissement de référence en Allemagne pour l'archivage et le traitement de corpus oraux.

Une collaboration est en cours avec Bruxelles (Université Libre de Bruxelles). Elle concerne la co-réalisation d'un corpus et l'hébergement d'anciens corpus de l'ULB dans CLAPI2.

Des contacts sont en cours pour une collaboration avec deux laboratoires suédois (Université d'Uppsala, Université de Stockholm).



La collaboration se concrétise dans le cadre du contrat de Plan Etat-Region, avec un projet intitulé « Valorisation et exploitation de corpus oraux », resp. J. Jayez (ICAR).

ICAR participe aux travaux de l'ILF depuis sa création, et plusieurs opérations concernant les corpus oraux ont été financées par l'ILF.

La collaboration se concrétise dans le cadre du programme PSI « Patrimoine et Archivage documentaire », avec un projet intitulé « Pour une archive des langues parlées en interaction. Statuts juridiques, formats et standards, représentativité », resp. Christian Plantin ; et dans le cadre de l'AS ASILA, resp. Anne Nicolle (GREYC), D. Luzzati (LIUM).

Dans le cadre du programme “Patrimoine et Archivage documentaire” (voir note 4).

ICAR      Retour          Suite