Bases et banques de données :
- CLAPI : créé au début des années 2000, comprend une banque de données multimédia de corpus enregistrés en situation réelle, dans des contextes variés: interactions professionnelles, institutionnelles ou privées, commerciales, didactiques, médicales … et un ensemble d’outils de requêtes.
- CLAPI-FLE : En collaboration avec des partenaires didacticiens, enseignants de FLE et linguistes de l’oral, l’unité a conçu des ressources pédagogiques à partir des résultats des recherches en analyse des interactions et des corpus oraux d’interactions sociales de la plateforme de recherche CLAPI, portant sur une grande variété de situations du quotidien : réunions de travail, repas entre amis, achats/ventes dans des commerces, conversations téléphoniques, … CLAPI-FLE propose un ensemble de ressources pédagogiques authentiques, prêtes à l’emploi, en accès libre et téléchargeables, à l’attention des formateurs d’enseignants, des enseignants et des apprenants de FLE (Français Langue Étrangère) et de linguistique française.
- Le projet PRESTO (L’évolution du système PREpositionnel du français. ApprochesSTatistique et textOmétrique) a pour but l’étude diachronique de l’emploi, des valeurs sémantiques et discursives des prépositions françaises à, en, par, contre, dès, devant, entre, pour, sans, sur, sous, vers, dans, de l’ancienne langue jusqu’au français contemporain. Ce corpus comporte des données étiquetées et lemmatisées, représentant toutes les périodes de l’histoire du français ainsi que différents genres discursifs et types de textes.
- ViSA est un instrument de recherche (Vidéos de situations d’enseignement et d’apprentissage) qui repose sur une base de données permettant le partage des pratiques de recherche dans le domaine de l’enseignement et l’apprentissage. ViSA vise à développer des aspects théoriques, méthodologiques, épistémologiques et éthiques dans ce domaine.
ViSA s’intéresse aux recherches mettant en jeu des enregistrements filmiques dans le domaine des apprentissages, qu’ils soient réalisés à l’école, à l’université, sur le lieu de travail ou dans la vie quotidienne. La communauté associée à ViSA est pluridisciplinaire, elle regroupe en particulier des chercheurs des sciences de l’éducation incluant les différentes didactiques, des psychologues, des sociologues.
Logiciels développés ou co-développés au sein du laboratoire ICAR :
- La plateforme TXM permet l’analyse de grands corpus de textes au moyen de composants modulaires et open-source. Elle a été conçue pour reprendre la tradition lexicométrique dans un contexte nouveau : Corpus enrichis et structurés ; développement ouvert et communautaire.
Elle se décline sous la forme d’un logiciel (TXM RCP) multiplateforme (Windows, Linux, Mac OS) et d’une version portail Web (TXM WEB).
Elle a été initiée entre 2007 et 2010 par le projet ANR Textométrie, porté par des membres d’ICAR et de laboratoires partenaires, en synergie avec les technologies de corpus et de statistique actuelles (Unicode, XML, TEI, TAL, CQP et R).
- TransICOR est un logiciel de transcription dérivé du logiciel Transcriber et adapté à la convention de transcription ICOR. Le logiciel est développé au sein du laboratoire.
- Transana est un logiciel de transcription et d’analyse de corpus multimedia. Le laboratoire ICAR a contribué au développement de certaines fonctions du logiciel dont une version en arabe.
- Transcripteur : Cet outil développé au sein de notre unité a été conçu pour répondre à un double besoin. D’une part, il permet de générer des transcriptions automatiques de corpus oraux en utilisant la technologie Open Source Whisper et, d’autre part, il autorise la vérification ainsi que la correction des transcriptions, qu’elles soient issues de notre logiciel ou qu’elles proviennent d’autres sources. Les corrections reposent sur une interface dédiée et peuvent porter sur différents aspects de la transcription comme la modification des segments de texte, l’ajout, la suppression, le regroupement de tours de parole ainsi que la gestion des locuteurs. Ces opérations sont facilitées par la mise en place d’une synchronisation temporelle (« alignement »), entre le signal audio et les segments textuels correspondants de la transcription. L’outil intègre également une visualisation du signal vidéo lorsqu’il est disponible, ainsi qu’une représentation graphique du son en « forme d’onde », qui facilite le repérage de certains phénomènes prosodiques comme les silences et les saillances intonatives.