Skip to main content
search

Prochaine séance du séminaire de l’équipe « Syntaxe, sens, textualité » (24/02/2023)

La prochaine séance du séminaire de l’équipe Syntaxe, Sens et Textualités est organisée en mode hybride vendredi 24 février 2023, à partir de 14h30. 

Intervenant : Jean-Philippe Magué (MCF ENS de Lyon, directeur adjoint du Département Éducation et humanités numériques et de l’Institut rhônalpin des systèmes complexes-IXXI).

Intitulé de l’intervention : Apprentissage profond, biais et Sociolinguistique

Les réseaux de neurones profonds ont conduit à des progrès substantiels dans le traitement automatique du langage ces dernières années, dépassant les approches précédentes dans de nombreuses tâches, sinon toutes. Il a été montré que ces avancées ont été rendues possibles par le fait que les représentations internes successives construites par ces réseaux à partir des textes qui leur sont soumis captent des relations syntaxiques et sémantiques complexes.
La question abordée par cet exposé est de savoir si ces systèmes d’IA sont également capables d’apprendre et de construire des représentations leur permettant d’inférer les caractéristiques sociales (âge, genre, statut socio-économique) portées par des variantes linguistiques.
Pour étudier cette question, nous nous appuyons sur un ensemble de données de 500 000 tweets géolocalisés en français produits par 5 000 locuteurs pour lesquels nous avons automatiquement déduit le statut socio-économique et déterminé manuellement l’âge et le sexe en fonction principalement des non-indices linguistiques (comme le prénom ou la photo du profil utilisateur). Cet ensemble de données est utilisé pour entraîner finement CamemBERT, un modèle linguistique basé sur un transformateur pour le français.

La séance se déroulera en  salle D4.179 des locaux d’ICAR et en visioconférence. Le lien de connexion a été transmis à l’ensemble du laboratoire via les listes de diffusion, le vendredi 10 février.

Contact : Jean-Philippe Magué

Close Menu
PHP Code Snippets Powered By : XYZScripts.com