Pour une archive des langues parlées en interaction.
Statuts juridiques, formats et standards, représentativité
Ce projet a été lancé pour répondre à la nécessité de traiter la parole en interaction comme un objet patrimonial intéressant à la fois la communauté des citoyens et la communauté scientifique. Le recueil et l’archivage de cette parole ordinaire, qui se manifeste sous la forme d’interactions variées (conversations familiales, appels à des call centers, consultations patient-médecin, réunions de travail…), pose de nombreux problèmes théoriques, empiriques et techniques. Le projet traite notamment :
– des conditions légales de recueil et d’archivage des données ;
– de la standardisation des formats informatiques de numérisation, de conservation et d’exploitation des corpus ;
– de l’évaluation de la qualité de ces données, du point de vue de leur « naturalité », « authenticité », ainsi que de l’adéquation des prises de vue et de son pour des analyses relevant notamment de la linguistique interactionnelle.
Ces questions conduisent plus globalement à interroger les conditions à la fois ethnographiques, technologiques et juridiques qui définissent des données de « bonne qualité ».
Afin de confronter ces questions à l’empirie, des corpus prototypiques ont été crées. Ces corpus ont été appelés « multiscopes » parce que enregistrés par plusieurs caméras vidéo et rassemblés ensuite, grâce au montage, en une seule vue multiscope. Ils ont constitué un terrain exemplaire où tester des dispositifs d’enregistrement des données inédits, posant la question non seulement des équipements nécessaires mais aussi de la conception des prises de vue adéquates aux exigences d’une approche relevant de la linguistique interactionnelle.
Mots-clef
– Patrimoine oral : corpus de langue parlée en interaction ;
– Création de documents numériques multimédiaux ;
– Législation concernant les données interactionnelles vidéo/audio enregistrées en situation attestées ;
– Standards, supports, formats pour les données interactionnelles (verbales/multimodales) ;
– Evaluation de l’authenticité, représentativité et qualité des données interactionnelles.
Domaines disciplinaires
Linguistique interactionnelle, droit, informatique
Responsables scientifiques
Christian Plantin et Lorenza Mondada
Participants ICAR
Lukas Balthasar, Michel Bert, Sylvie Bruxelles, Lorenza Mondada, Christian Plantin, Véronique Traverso
Equipes partenaires
CECOJI (Isabelle de Lamberterie)
LACITO, Paris (Michel Jacobson)
LORIA, Nancy (Matthieu Quignard, Laurent Romary)
GREYC, Caen (Anne Nicolle)
LIMSI, Paris (Laurence Devillers)
LIUM, Le Mans (Daniel Luzzati)
RIM, Saint-Etienne (Jean-Jacques Girardot)
Collaborations :
Ce projet a contribué au projet initié par la DGLF de « Guide des bonnes pratiques » juridiques en linguistique.
http://www.culture.gouv.fr/culture/dglf/corpus_oraux.htm
Appel d’offre finançant le projet :
Programme interdisciplinaire Société de l’Information / CNRS
Durée : été 2003-été 2005 (valorisation été 2005- été 2006)
Réalisations
Documents consultables :
-> Rapport bref du projet
-> Rapport concernant les questions juridiques