Unité Mixte de Recherche 5191
CNRS / ENS de Lyon / Université Lumière Lyon 2
Directrice : Isabel Colón de Carvajal
Courriel : icar-dir@ens-lyon.fr
Site Web : http://icar.cnrs.fr
La prochaine séance du séminaire de l’équipe Syntaxe, Sens et Textualités est organisée.
Damon MAYAFFRE (BCL – CNRS – Université Côte d’Azur) 14h30 – 15h30
Cooccurrences, bigrams ou segments répétés ? Ce que génère un Transformer entraîné au discours politique
La détection d’isotopies dans les discours (ici le discours politique) est une préoccupation méthodologique centrale de l’ADT, dans la mesure où il s’agit de transformer des corrélations statistiques calculées en corpus en corrélats sémantiques interprétés en discours.
Au fond, passer des chiffres au sens, et du quantitatif au qualitatif.
Cette intervention propose une analyse synchronique des grandes isotopies structurant le discours présidentiel d’Emmanuel Macron depuis son accession au pouvoir (148 discours, 501.817 occurrences), afin d’identifier les thématiques dominantes, voire l’idéologie du président.
Le corpus est non-contrastif (uniquement Macron ; il ne s’agit pas de calculer ses spécificités lexicales par rapport à d’autres) et filtré morpho-syntaxiquement sur les seuls substantifs (réputés plus immédiatement porteurs de sens).
L’étude mobilise deux approches complémentaires. D’une part, l’analyse des profils cooccurrenciels des mots, issue de l’ADT classique (Viprey, 1997, 2006), reposant sur un traitement benzecrien (analyses factorielles des correspondances sur matrices triangulaires), permet d’identifier quatre isotopies majeures : régalienne (« France », « frontière » etc.), sociale (« santé », « retraite », etc.), économique (« budget », « dette », etc.) et sociétale (« violence » faite aux « femmes », etc.). D’autre part, l’analyse des profils attentionnels des mots, fondée sur des modèles neuronaux récents (Vanni et al., 2026) et conduite selon une démarche exploratoire comparable, confirme ces résultats tout en faisant émerger une cinquième isotopie encore à caractériser.
La discussion interroge la plus-value des modèles transformer dans l’outillage traditionnel de l’ADT. Si la centralité de la micro-distribution des mots dans la construction du sens en corpus est bien établie, la capacité des mécanismes attentionnels (self-attention) à dépasser — ou à reproduire — les calculs classiques de cooccurrence, de bi-grams ou de segments répétés doit nous interroger.
Références
Benzécri J.-P. (1973), L’Analyse des données. Tome 2 : L’Analyse des correspondances, Dunod, 1973.
Lebart L , Pincemin B. , Poudat C. (2019), Analyse des données textuelles. Québec : Presses de l’Université.
Rastier F. (2011), La mesure et le grain. Sémantique de corpus. Paris : Champion
Vanni L. et Mayaffre D. (2026), « Une autre Intelligence Artificielle est-elle possible? », dans Cahiers de sémiotique des cultures, n° 5, 2026 – 1.
Vaswani, A. et al. (2017) « Attention is all you need », in Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook, NY, USA: Curran Associates Inc. (NIPS’17), p. 6000‑6010.
Viprey J.-M. (1997). Dynamique du vocabulaire des Fleurs du mal. Paris : Champion.
Viprey J.-M. (2006). « Structure non-séquentielle des textes », Langages, 163, pp. 71-85.
Leela AZORIN (ENS Lyon / ICAR) 15h30-16h30
Catégorisation syntaxique et sémantique de la variation : étude linguistique et phonétique des contractions du semi-modal émergent BE going to/gonna
Cette présentation examine la variation et la catégorisation des formes du paradigme BE going to/gonna dans deux corpus représentatifs de l’innovation linguistique : un corpus écrit du web (Climate Change Tweets) et un corpus d’anglais oral spontané (Santa Barbara Corpus of Spoken American English). Une typologie des formes observées (gonna, gunna, gon, i’ma, etc.) permet d’interroger leur statut au sein d’un même système et leurs emplois sémantico-pragmatiques. L’analyse croise des critères syntaxiques, morphosyntaxiques, phonétiques et sémantico-pragmatiques. L’étude vise à éclairer le statut syntaxique de ces formes grammaticalisées et à montrer comment elles expriment la prédiction, sens historiquement associé à BE going to, tout en explorant dans quelle mesure les variants plus réduits traduisent un déplacement de sens ou de fonction. Les résultats invitent alors à repenser les frontières entre les concepts de variation, réduction et changement linguistique.
Contact : Denis Vigier, Jean-Philippe Magué