Atelier CCC – Corpus Youtalk – C. Polo et G. Niccolai – 05 mars 2015
Claire Polo et Gerald P. Niccolai présentent un atelier intitulé « Corpus YouTalk : recueil et traitement d’interactions en classe dans 4 pays (Mexique, Etats-Unis, France, Brésil). Du « compliqué » au « complexe » : tâtonnement et systématisation d’une démarche. »
L’idée de cette présentation est de retracer les grandes étapes de construction du corpus de cafés scientifiques YouTalk constitué d’enregistrements audiovisuels de débats dans 6 écoles, au Mexique, aux Etats-Unis, en France et au Brésil, entre novembre 2011 et mai 2014. Au cœur d’un projet multipartenarial, la conception de ces cafés et les prises de données associées ont impliqué des dimensions juridiques, logistiques et techniques susceptibles de faire écho à des problématiques rencontrées pour d’autres corpus complexes.
Nous aborderons d’abord le recueil des données lui-même, puis le traitement des données brutes jusqu’à l’état actuel du corpus, en cours d’intégration à la base de données VISA. La confection du corpus YouTalk, concomitante de création de la cellule corpus complexe, a largement bénéficié des avancées progressives des savoir-faire dans ce domaine au sein de notre laboratoire. Réciproquement, elle a servi de terrain d’expérimentation de méthodes de collecte et de transformation des données. Nous souhaitons dans cet atelier vous présenter l’historique de ces tâtonnements qui ont abouti à la systématisation d’une démarche de travail utilisée pour les évènements les plus récents.