Ecole thématique Ir-Vidéo 3

Les membres de la CCC, Justine Lascar et Daniel Valero, participent à l’organisation et interviennent lors de l’école thématique IR-Vidéo3 qui se déroule du 15 au 19 octobre 2018 à Lyon.

L’école thématique  est structurée autour de deux axes de travail  : 1) Comment combiner des enregistrements filmiques avec d’autres types de données et 2)  les dispositifs de représentation des données possiblespour analyser un corpus. Dans ce cadre, J. Lascar et D. Valero effectueront de multiples interventions portant sur les logiciels d’analyses et la constitution de corpus multimodaux.

Atelier CCC – Logiciel Impact – J. Jacquin – 30 juin 2015

Jérôme Jacquin présente un atelier intitulé « IMPACT : un outil en ligne pour consulter, transcrire et commenter des sources audio-visuelles »

 

IMPACT est un outil techno-pédagogique développé depuis 2010 à l’Université de Lausanne (www.unil.ch/impact). Il s’adresse aux enseignants, aux étudiants et aux chercheurs concernés par la consultation, la transcription et le commentaire de sources audio-visuelles. Dans cet atelier, je vous propose un panorama complet de l’outil (besoins initiaux, fonctionnalités principales, enjeux pédagogiques, enjeux pour la recherche et la constitution de bases de données, comparaison avec d’autres outils existants, développements futurs) et me réjouis d’en discuter avec vous.

Atelier CCC – Corpus Presto – D. Vigier et A. Falaise – 04 juin 2015

Denis Vigier et Achille Falaise présentent un atelier intitulé « Complexités d’un corpus en diachronie du français. Le cas de Presto »

Dans le cadre du projet Presto, nous travaillons sur un corpus diachronique du français (principalement 16ème – 20ème siècles, en orthographe « d’époque »). Lors de ce séminaire, nous présenterons les difficultés rencontrées lors de la collecte de ce corpus et lors de son analyse. Comment définir la notion de « mot » de manière homogène sur 4 siècles ? Comment traiter l’orthographe changeante du français pré-classique et classique ? Que faire de ces mots qui, au fil des siècles, se jouent des frontières entre parties du discours ? Autant de questions qui dépassent le seul cadre technique, et mènent à des questionnements d’ordre linguistique.

Atelier CCC – Corpus Tweets – J.P. Magué – 07 mai 2015

Jean-Philippe Magué présente un atelier intitulé « Outille-toi toi-même »

Cette séance montrera comment quelques notions de programmation rendent possible la construction d’outils ad hoc pour l’analyse de corpus.  Sans faire un cours de programmation, nous verrons comment le langage de programmation python permet de traiter et d’analyser un corpus de Tweets

Atelier CCC – Corpus ISMAEL – C. Wigham, B. Holt et T. Debay – 02 avril 2015

Ciara Wigham, Ben Holt et Thomas Debay présentent un atelier intitulé « Corpus d’apprentissage ISMAEL (InteractionS et Multimodalité dans l’Apprentissage et l’Enseignement d’une Langue) »

Le projet ISMAEL vise à étudier le jeu de la multimodalité dans les interactions d’apprentissage d’une langue étrangère pour mieux comprendre comment un enseignant orchestre les ressources sémiotiques à sa disposition dans différentes situations d’interaction pédagogique. Le corpus principal pour ce projet s’appuie sur un ensemble de données recueillies lors d’une formation de langue à distance mettant en lien de futurs enseignants de français langue étrangère de Lyon 2 et des étudiants de français à Dublin City University. La formation a eu lieu entre octobre et décembre 2013, sur sept semaines, par le biais d’une plateforme de visioconférence dédiée. Le corpus fait actuellement l’objet d’études croisées suite à une data session avec des collègues en février 2015 en vue de la publication d’un ouvrage collectif coédité par Nicolas Guichon (ICAR) et Marion Tellier (LPL).

Dans le séminaire CCC, nous présentons les enjeux techniques ayant trait à la constitution et la structuration du corpus en vue de l’échange et du partage lors de la data session. En particulier, nous revenons sur

-des difficultés de recueil des données (captures d’écran dynamiques de la plateforme post-formation versus l’utilisation des enregistrements faits automatiquement par la plateforme),

-des problèmes d’alignement des enregistrements liés aux déconnexions de la plateforme lors des séances,

-les enjeux liés à la présentation du corpus pour des collègues qui n’ont pas participé à la formation,

– les enjeux liés à la présentation des données recueillies avec une caméra 360° lors de la data session.

Atelier CCC – Corpus Youtalk – C. Polo et G. Niccolai – 05 mars 2015

Claire Polo et Gerald P. Niccolai  présentent un atelier intitulé « Corpus YouTalk : recueil et traitement d’interactions en classe dans 4 pays (Mexique, Etats-Unis, France, Brésil). Du « compliqué » au « complexe » : tâtonnement et systématisation d’une démarche. »

L’idée de cette présentation est de retracer les grandes étapes de construction du corpus de cafés scientifiques YouTalk constitué d’enregistrements audiovisuels de débats dans 6 écoles, au Mexique, aux Etats-Unis, en France et au Brésil, entre novembre 2011 et mai 2014. Au cœur d’un projet multipartenarial, la conception de ces cafés et les prises de données associées ont impliqué des dimensions juridiques, logistiques et techniques susceptibles de faire écho à des problématiques rencontrées pour d’autres corpus complexes.
Nous aborderons d’abord le recueil des données lui-même, puis le traitement des données brutes jusqu’à l’état actuel du corpus, en cours d’intégration à la base de données VISA. La confection du corpus YouTalk, concomitante de création de la cellule corpus complexe, a largement bénéficié des avancées progressives des savoir-faire dans ce domaine au sein de notre laboratoire. Réciproquement, elle a servi de terrain d’expérimentation de méthodes de collecte et de transformation des données. Nous souhaitons dans cet atelier vous présenter l’historique de ces tâtonnements qui ont abouti à la systématisation d’une démarche de travail utilisée pour les évènements les plus récents.

Atelier CCC – Corpus salons commerciaux – V. Piccoli – 15 janvier 2015

Vanessa Piccoli présente un atelier intitulé « Un corpus plurilingue dans trois salons commerciaux : du terrain à la valorisation des données. »

La présentation suivra les différentes étapes de la constitution d’un corpus dans trois salons commerciaux internationaux : du choix du terrain et la prise de contact, aux défis liés aux contraintes spatio-temporelles jusqu’à la valorisation du corpus et à la réalisation de petits films comme retour pour les participants.