Chargement Évènements

« Tous les Évènements

  • Cet évènement est passé.

Prochaine séance du séminaire de l’équipe « Syntaxe, Sens et Textualités »

15 mars à 15:00 - 16:00

La prochaine séance du séminaire de l’équipe Syntaxe, Sens et Textualités est organisée.

Intervenants : Jean-Pierre Chevrot (université Grenoble Alpes, Lidilem) et Jean-Philippe Magué (ENS de Lyon, ICAR).

Intitulé de l’intervention : Les Modèles de langage fondés sur l’intelligence artificielle ont-ils des connaissances sociolinguistiques ?

Résumé partiel :Dans la base SoSweet (www.ortolang.fr/market/corpora/sosweet) comptant 658 747 413 tweets produits par 2 878 562 utilisateurs, nous avons utilisé un sous-corpus de 4 974 utilisateurs dont le genre, l’âge, et le statut économique ont été estimés par observation directe des profils et par projection des coordonnées GPS sur une carte de France des revenus (INSEE). D’une part, ce sous-corpus a permis l’examen des relations entre traits langagiers (fréquence des émojis, des graphies non-standard…) et profils sociaux des utilisateurs. D’autre part il a servi de base pour entrainer un modèle de langage (CamemBERT, Martin et al., 2020) à identifier genre, revenu et âge des utilisateurs.

Les décisions du Modèle de langage seront comparées aux jugements effectués sur le même matériel par plusieurs centaines de participants lors de deux enquêtes réalisées en ligne et utilisant plusieurs méthodes d’exploration des perceptions en sociolinguistique.

Nous centrerons notre présentation sur les divergences et les convergences dans les décisions prises par le Modèle de langage et les échantillons de locuteurs. Nous nous demanderons si ces divergences et convergences dépendent des trois catégories testées (âge, revenu, genre), d’un usage particulier de la variété de français numérique (contenu lexical, présence d’émojis…) ou du profil des répondants à l’enquête (genre, niveau de diplôme, familiarité avec les médias sociaux). Notre objectif est d’améliorer notre connaissance globale du fonctionnement de l’indexicalité.

 

La séance se déroulera vendredi 15 mars 2024, de 15h à 16h, en salle D4.179 des locaux d’ICAR.

Un lien de visioconférence sera mis à disposition après demande la veille, par courriel à jean-philippe.mague@ens-lyon.fr et denis.vigier@ens-lyon.fr

Contact : Denis Vigier
En savoir plus : résumé complet de l’intervention et calendrier global du séminaire disponibles en pièce jointe

Détails

Date :
15 mars
Heure :
15:00 - 16:00