Projets Syntaxe, Sens, Textualité

Projets en cours 

NumIneg (2022-2023)
Responsable : Jean-Philippe Magué
Partenaires : ERIC, UOttawa
Financement : ASLAN – IXXI

GEODE 2020-2023
Responsables : Denis Vigier, Ludovic Moncla (LIRIS).
Partenaires : Benoit Crabbé, Achille Falaise (LLF, Université Paris 7), Olivier Kraif (LIDILEM, Université Grenoble Alpes)
Financement : ASLAN

Résumé
Le projet interdisciplinaire GEODE réunit des chercheurs en linguistique, informatique et géographie des laboratoires ICAR, LIRIS et EVS. Notre objectif est d’étudier dans un corpus de quatre encyclopédies françaises les changements survenus dans les discours géographiques entre 1750 et nos jours. Nous nous aiderons des méthodes de classification semi-supervisée des textes, de génération de modèles de langues et de repérage automatique de routines discursives.

MACDIT 2021-2024
Responsables : Jean-Philippe Magué, Marc Allassonnière-Tang.
Financement : ASLAN

Résumé
Le projet interdisciplinaire MACDIT réunit des chercheurs des laboratoires DDL, ICAR et Lidilem. Notre objectif est d’étudier les interactions entre les niveaux individuels et collectifs de la variation ainsi que le changement linguistique. Nous emploierons des méthodes d’analyse de données appliquées à Twitter et Wikipedia et de modélisation multi-agents pour identifier comment des innovations linguistiques apparaissent et quels facteurs leurssont favorables ou pas

Approche pluridisciplinaire de l’impact de la sensorialité de l’indice de rappel sur le souvenir 2020-2022
Responsable : Jean-Philippe Magué
Partenaires : Jane Plailly (Centre de Recherche en Neurosciences de Lyon), Alexandra Ernst (Laboratoire de Psychopathologie et Neuropsychologie), Herminie Leca (Centre de recherches en psychopathologie et psychologie clinique)
Financement : IXXI

Résumé
La mémoire autobiographique n’est pas figée et les souvenirs ne sont pas des entités fixes, ce sont des reflets changeants de notre passé ; ainsi le souvenir est influencé par la modalité sensorielle de l’indice initiant le souvenir. En particulier, la mémoire autobiographique semble avoir une relation privilégiée avec le sens de l’odorat et la dimension émotionnelle des souvenirs est au cœur de cette spécificité. Notre projet combine des approches de linguistique computationnelle, de psychologie cognitive, de psychologie clinique et de neurosciences cognitives pour étudier différentes dimensions (linguistique, phénoménologique, physiologique) d’un même objet complexe : le souvenir. L’influence de la modalité sensorielle de l’indice mnésique sera évaluée en comparant les souvenirs évoqués par des odorants à ceux évoqués par des images de sources odorantes. Notre but est d’établir un modèle cohérent intégrant les récits des souvenirs, les évaluations de la phénoménologie de l’expérience du souvenir et les réponses physiologiques, et permettant d’identifier les caractéristiques spécifiques aux souvenirs selon la modalité sensorielle de l’indice mnésique.

Archives des projets terminés entre

2016 et 2020

DISCO_LGE : le DISCours encyclOpédique dans La Grande Encyclopédie (1885-1902) 2019-2020
Responsable : Denis Vigier.
Financement : Groupement d’intérêt scientifique (GIS) CollEx-Persée, Labex ASLAN, Laboratoire ICAR

Résumé
Le projet DISCO_LGE souhaite rendre accessible aux internautes et aux chercheurs une version XML-TEI enrichie linguistiquement d’un ouvrage majeur dans l’histoire de l’encyclopédisme en France : La Grande Encyclopédie. Inventaire raisonné des sciences, des lettres et des arts par une société de savants et de gens de lettres. En termes d’outils, DISCO_LGE co-construira avec ses partenaires une chaîne de traitement automatisée pour encoder (XML-TEI) puis enrichir linguistiquement des textes encyclopédiques des textes OCRisés par la BnF. Enfin, une étude textométrique pilote sera réalisée pour identifier certaines spécificités du discours dans la LGE en la contrastant avec 3 autres encyclopédies dont  ICAR possède déjà une version  numérisée & annotée: l’Encyclopédie de Diderot & d’Alembert, l’Universalis (2018) et Wikipédia. Ce projet s’inscrit dans un réseau de collaborations nationales autour des encyclopédies et des dictionnaires.

GéoDisco : Approche GÉOmatique et linguistique du DISCours encyclOpédique des Lumières à Wikipédia. 2019-2020
Responsable : Denis Vigier.
Financement : MSH Lyon - St Etienne

Résumé
Géodisco combine système d’information géographique, traitement automatique du langage, textométrie et analyse du discours autour d’une même question : « Quelles représentations géographiques du monde les encyclopédies françaises véhiculent-elles à travers leurs discours,  et que nous disent ces représentations sur chacune des époques où ces encyclopédies ont été écrites et publiées ? » Ce projet s’inscrit dans un réseau de collaborations nationales et internationales autour des encyclopédies et des dictionnaires.

DEMOCRAT : DEscription et MOdélisation des Chaînes de Référence : outils pour l’Annotation de corpus (en diachronie et en langues comparées) et le Traitement automatique 2016-2019
Porteur : Frédéric Landragin (LaTTICe).
Participants : Laure Gardelle, Emmanuelle Prak-Derrington. Ce projet permet également de renforcer les collaborations au sein de l’équipe Cédilles, puisqu’il inclut des membres de CACTUS.

Résumé
Les objectifs du projet sont de proposer un modèle intégré et discursif de la référence et de la composition des chaînes de références, de mettre à disposition un corpus annoté, de produire un outil d’annotation et de mettre en place un système de détection automatique des coréférences.

PRESTO : L'évolution du système PRÉpositionnel du français : approche STatistique et textOmétrique 2013-2017
Responsable : Denis Vigier & Peter Blumenthal (U. Köln)
Financement : ANR/DFG (franco-allemand)

PaLaFra : Passage du Latin au Français: constitution et analyse d’un corpus numérique latino-français 2015-2017
Responsable : Céline Guillot-Barbance (ENSL-ICAR) & Maria Selig, Rembert Eufe (U. Ratisbonne)
Financement : ANR/DFG (franco-allemand) 2015-2017

Oriflamms : Recherche en ontologie, Descripteurs d'images, Analyse des formes et lettres des écritures médiévales multilingues 2013-2016
Responsable : Dominique Stutzmann (CNRS-IRHT)
Contact ICAR : Alexey Lavrentev (CNRS-ICAR)
Financement : ANR « Corpus et outils de la recherche en Sciences humaines et sociales »

2011 et 2015

Les langues et le genre (grammaires, cultures, littératures) 2013-2015
Responsable : Yannick Chevalier (U. Lyon 2)
Contact ICAR : Laure Gardelle (ENSL-ICAR) Région Rhône-Alpes (ARC 5)

Édition numérique et diachronique de textes médiévaux 2013-2014
Responsable : Céline Guillot-Barbance (ENSL-ICAR)
Financement : Fonds Recherche ENS

ORFÉO : Outils et Recherches sur le Français Écrit et Oral 2012-2015
Responsable : J.-M. Debaisieux (LATTICE)
Contact ICAR : Véronique Traverso (CNRS-ICAR)
Financement : ANR « Corpus et outils de la recherche en Sciences humaines et sociales »

GGHF : Grande grammaire historique de la langue française 2007-2015
Responsable : Sophie Prévost (CNRS-LATTICE)
Contact ICAR : Christiane Marchello-Nizia (ENSL-ICAR) et Alexey Lavrentev (CNRS-ICAR)
Financement : ILF, DGLFLF

Modélisation Contrastive et Computationnelle des Chaînes de Coréférence 2011-2012
Responsable : Frédéric Landragin (CNRS-LATTICE)
Contact ICAR : Céline Guillot-Barbance (ENSL-ICAR) PEPS CNRS

avant 2011

VECMAS : Valorisation et édition critique des manuscrits arabes subsahariens 2009-2011
Responsable : Georges Bohas (ENSL-ICAR)
Financement : ANR Blanc

SRCMF : Syntactic Reference Corpus of Medieval French 2009-2011
Responsable : Sophie Prévost (CNRS-LATTICE) & Achim Stein (U. Stuttgart)
Contact ICAR : Céline Guillot-Barbance (ENSL)
Financement : ANR/DFG (franco-allemand)

Édition numérique interactive de la Queste del saint Graal, roman en prose du XIII e siècle 2009-2010
Responsable : Céline Guillot-Barbance (ENSL-ICAR)
Financement : Région Rhône-Alpes (Cluster 13)

CoRPTeF : Corpus représentatif des premiers textes français 2008-2010
Responsable : Céline Guillot-Barbance (ENSL-ICAR)
Financement : ANR « Corpus et outils de la recherche en Sciences humaines et sociales »

Textométrie : Fédération des recherches et développements en textométrie autour de la création d’une plateforme logicielle ouverte 2007-2010
Responsable : Serge Heiden (ENSL-ICAR)
Financement : ANR « Corpus et outils de la recherche en Sciences humaines et sociales »