ICAR promeut une nouvelle série de rencontres centrées sur les différentes expériences médiées par les langages et vécues en relation avec des langues et des environnements de plus en plus complexes du fait de la multiplication des médiations sémiotiques et numériques.
Les rencontres seront ouvertes à une participation à distance et enregistrées, afin de constituer un corpus réexploitable, par exemple avec des finalités de formation interne à l’unité des recherches. Le programme sera composé par des séances de 2h30 avec une cadence mensuelle, normalement le lundi ou le jeudi matin.
Intitulé de ce nouveau séminaire transversal : Environnements sémiotiques/numériques et expériences linguistiques. Rencontres de proximité transdisciplinaire
La troisième séance est organisée jeudi 21 mars 2024, de 10h30 à 13h, en salle D4.179 et en visioconférence via l’outil Zoom-CNRS.
Le lien de connexion a été transmis par Isabel Colón de Carvajal via les listes de diffusion du laboratoire, le mercredi 13 mars.
Intitulé de la troisième séance : Expériences qualitatives des données : langages et environnements numériques
Intervenant.e.s :
- Sascha Diwersy (maître de conférences, université Paul Valéry Montpellier 3, chercheur au laboratoire Praxiling)
Le Corpus de Référence du Français Contemporain (CRFC) : Perspectives d’exploration et profilage de genres textuels
Dans un premier temps, nous donnerons un bref aperçu du CRFC, l’un des premiers corpus multi-genres de grand volume conçu pour l’étude du français contemporain (Siepmann, Bürgel et Diwersy, 2017). La seconde partie de notre communication sera consacrée aux perspectives d’exploration du corpus dans le cadre de l’Analyse Multidimensionnelle (Biber, 1988 ; Biber et Conrad, 2009), et notamment aux implications méthodologiques de sa mise en œuvre, telles qu’elles se déclinent en termes de l’implémentation d’un modèle de données et de requêtes adéquats en vue de l’extraction de traits lexico-grammaticaux permettant d’établir des profils textuels soumis à un traitement par des techniques statistiques multivariées.
- Mathieu Valette (INALCO)
Transmettre l’expérience linguistique aux machines : de l’apprentissage supervisé aux grands modèles de langues
Il s’agira de discuter des relations entre l’humain et la machine dans le contexte du traitement automatique des langues (TAL), avec, pour point d’entrée, le texte comme objet culturel matérialisant l’expérience linguistique. Loin d’être rendue obsolète par les avancées de l’IA et de l’apprentissage profond, l’expérience humaine demeure nécessaire aux applications, comme l’atteste l’émergence récente du paradigme perspectiviste en TAL. Nous nous interrogerons ici sur les représentations dominantes du texte en TAL, du token à la data, et de leurs conséquences épistémologiques et éthiques, notamment en termes d’objectivation.
Contact : Pierluigi Basso et Isabel Colón de Carvajal