{"id":39,"date":"2016-11-09T15:36:16","date_gmt":"2016-11-09T14:36:16","guid":{"rendered":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/?page_id=39"},"modified":"2017-02-27T15:19:10","modified_gmt":"2017-02-27T14:19:10","slug":"axes-de-recherche","status":"publish","type":"page","link":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/axes-de-recherche\/","title":{"rendered":"Recherche"},"content":{"rendered":"<h2>Principaux axes de recherche<\/h2>\n<h3>Recherches dans le domaine de la syntaxe de l&rsquo;oral en Fran\u00e7ais parl\u00e9 dans l&rsquo;int\u00e9raction<\/h3>\n<p>Traitement et analyse des unit\u00e9s peu ou non d\u00e9crites en syntaxe<\/p>\n<p>Deux objectifs : faire \u00e9merger des syst\u00e8mes descriptifs et les mettre en application pour le TAL<\/p>\n<h3>1\u00b0 Les Non R\u00e9gis (NR)<\/h3>\n<p style=\"text-align: justify\">Description syntaxique des \u00e9l\u00e9ments non rattach\u00e9s au verbe principal de la \u00ab phrase \u00bb, pour des applications en traitement et identification automatiques : c\u2019est en examinant ce type d\u2019unit\u00e9s impossibles \u00e0 d\u00e9crire par la syntaxe traditionnelle, reli\u00e9es par des op\u00e9rations de liage d\u2019ordre s\u00e9mantique et pragmatique, que j\u2019ai pu observer les fonctionnements grammaticaux, et les contraintes distributionnelles qui conduisent \u00e0 observer, pour ces unit\u00e9s l\u00e0 aussi, des structures et des constructions syntaxiques, \u00e0 \u00e9tablir une typologie, \u00e0 proposer des classements nouveaux sur la base de propri\u00e9t\u00e9s purement formelles. Ces travaux se fondent sur l\u2019\u00e9tude et le traitement de corpus de donn\u00e9es authentiques, principalement du fran\u00e7ais parl\u00e9 en interaction, comprenant plusieurs usages de l\u2019oral, produits autour de divers types d\u2019activit\u00e9s.<\/p>\n<p style=\"text-align: justify\">De nombreux mots ou constituants (soulign\u00e9s ci-dessous) pr\u00e9sentent dans la phrase des propri\u00e9t\u00e9s diff\u00e9rentes par rapport \u00e0 ceux qui sont descriptibles par des relations grammaticales traditionnelles (en italique ci-dessous), notamment : adverbes de phrase vs <em>adverbes de verbes<\/em>, circonstants non compl\u00e9ments de verbe vs <em>compl\u00e9ments de verbe circonstanciels<\/em>, particules discursives (PDI) vs <em>pronoms\/ adjectifs\/ connecteurs\/ constructions verbales<\/em><em>canoniques, etc<\/em>. On ne peut actuellement r\u00e9soudre le probl\u00e8me de la discrimination de ces unit\u00e9s, surtout quand il s\u2019agit de formes homonymes (<em>franchement, \u00e0 partir de l\u00e0, bon, quoi, etc.<\/em>), et, pour l\u2019instant, on ne peut donc pas les traiter automatiquement.<\/p>\n<p><em>1\u00e8re phase de travail<\/em> (cf. Th\u00e8se et autres travaux de 2006, voir publications)<\/p>\n<p style=\"text-align: justify\">Apr\u00e8s une application rigoureuse des tests choisis, et une fois les prototypes s\u00e9lectionn\u00e9s, j\u2019ai pu observer, sur grands corpus d\u2019oral (donn\u00e9es attest\u00e9es), que la distribution et le placement de ces constituants dans l\u2019\u00e9nonc\u00e9 ob\u00e9issent \u00e0 un certain nombre de contraintes formelles.<br \/>\n&#8211; ce qui permet de leur donner un statut syntaxique.<br \/>\n&#8211;\u00a0ce qui fournit un certain nombre de propri\u00e9t\u00e9s codifiables en r\u00e8gles impl\u00e9mentables<br \/>\n&#8211; ce qui met \u00e0 jour des constructions non encore d\u00e9crites<\/p>\n<p><em>2\u00e8me phase<\/em> (Projets ANR + travaux 2008-2009)<\/p>\n<p style=\"text-align: justify\">Une fois d\u00e9gag\u00e9es les grandes tendances \u00e0 partir des r\u00e9gularit\u00e9s observ\u00e9es, qu\u2019il s\u2019agisse de contraintes de placements, de distribution ou de r\u00e9currences de constructions syst\u00e9matiques, il faut pouvoir<br \/>\n&#8211; Impl\u00e9menter des r\u00e8gles.<br \/>\n&#8211; Programmer un logiciel<br \/>\n&#8211; V\u00e9rifier la pr\u00e9cision de l\u2019identification par discrimination automatique.<br \/>\n&#8211; Identifier les probl\u00e8mes sources d\u2019erreurs<br \/>\n&#8211; Corriger les probl\u00e8mes de reconnaissance<br \/>\n&#8211; V\u00e9rifier l\u2019ensemble des propri\u00e9t\u00e9s retenues pour la premi\u00e8re \u00e9tude :<br \/>\n&#8211; Examiner les premiers prototypes choisis \u00e0 partir d\u2019autres corpus.<br \/>\n&#8211; Perfectionner les r\u00e8gles<\/p>\n<p><em>3\u00e8me phase<\/em> (Travaux 2005- 2007- 2010)<\/p>\n<p>En corr\u00e9lation avec la description purement syntaxique, il s\u2019agit d\u2019identifier les relations s\u00e9mantico-discursives, les valeurs pragmatiques, et les conduites interactionnelles r\u00e9guli\u00e8res que ces unit\u00e9s NR r\u00e9v\u00e8lent.<\/p>\n<h3>2\u00b0 Les Particules Discursives (PDi)<\/h3>\n<p style=\"text-align: justify\">Les Particules Discursives (PDI) poss\u00e8dent beaucoup de points communs avec les formes Non R\u00e9gies (NR) par le verbe t\u00eate d\u2019une construction ; constitu\u00e9es de diverses cat\u00e9gories, les NR comme les PDI n\u2019entrent pas dans des relations de d\u00e9pendance grammaticale, et ne s\u2019int\u00e8grent pas dans une phrase. Apr\u00e8s avoir rep\u00e9r\u00e9 sur corpus les contextes d\u2019apparition de ce type d\u2019\u00e9l\u00e9ments, et les m\u00e9canismes r\u00e9currents qui les r\u00e9gulent, on propose de les \u00e9tudier en les observant non seulement du point de vue de la syntaxe grammaticale -micro-syntaxe-, mais aussi du point de vue de la syntaxe discursive -macro-syntaxe-, et de la grammaire interactionnelle en relation avec leurs valeurs pragmatiques.<\/p>\n<h3>R\u00e9sultats<\/h3>\n<p style=\"text-align: justify\">Des premiers r\u00e9sultats ont \u00e9t\u00e9 obtenus d\u00e8s 2004 (Teston, S., et V\u00e9ronis, J. Recherche de crit\u00e8res formels pour l&rsquo;identification automatique des particules discursives. Journ\u00e9e d&rsquo;\u00e9tude de l&rsquo;ATALA \u00ab\u00a0Mod\u00e9liser et d\u00e9crire l&rsquo;organisation discursive \u00e0 l&rsquo;heure du document num\u00e9rique\u00a0\u00bb, La Rochelle). L\u2019impl\u00e9mentation des r\u00e8gles \u00e9tablies d\u2019apr\u00e8s les \u00e9tudes des corpus sur le comportement de ces unit\u00e9s a permis d\u2019effectuer avec succ\u00e8s les premi\u00e8res d\u00e9monstrations de discrimination automatique par une machine, notamment pour la forme <em>bon<\/em> (distinguer automatiquement <em>bon<\/em> adjectif de <em>bon<\/em> particule discursive). La pr\u00e9cision obtenue sur l&rsquo;ensemble des corpus a \u00e9t\u00e9 de 97.6%. L&rsquo;\u00e9tiquetage de base (baseline) qui consisterait \u00e0 attribuer \u00e0 toutes les occurrences d&rsquo;un corpus l&rsquo;\u00e9tiquette la plus fr\u00e9quente du corpus ne produirait que 91,5% d&rsquo;\u00e9tiquettes correctes. Le programme r\u00e9duit donc le nombre d&rsquo;erreurs de 72,3% par rapport \u00e0 cet \u00e9tiquetage na\u00eff, ce qui est un r\u00e9sultat honorable \u00e9tant donn\u00e9 la rusticit\u00e9 (voulue) de ce premier programme.<\/p>\n<p style=\"text-align: justify\">Les recherches sur les autres formes PDI en collaboration avec des sp\u00e9cialistes de l\u2019informatique se poursuivent, notamment au sein des projets ANR (+ Travaux sur <em>Quoi<\/em> en collaboration avec MA Morel et F. Lefeuvre, en cours de r\u00e9daction, + travaux de 2006 \u00e0 ce jour, publi\u00e9s et \u00e0 para\u00eetre).<\/p>\n<p style=\"text-align: justify\">Enfin, mes travaux sur le texte th\u00e9\u00e2tral et cin\u00e9matographique, dans le cadre d\u2019une analyse linguistique de l\u2019oral en interaction, fournissent une comparaison enrichissante entre donn\u00e9es authentiques et donn\u00e9es fictives (recr\u00e9\u00e9es) qui donne des indices essentiels sur la comp\u00e9tence des locuteurs et des scripteurs dans l\u2019utilisation et dans la r\u00e9ception des strat\u00e9gies langagi\u00e8res.<\/p>\n<p align=\"left\">Participation \u00e0 l\u2019am\u00e9lioration des outils pour le TAL :<\/p>\n<p>&#8211; Participer \u00e0 l\u2019\u00e9laboration de nouveaux outils pour l\u2019utilisation \u00ab propre \u00bb du Web.<\/p>\n<p>&#8211; Participer \u00e0 l\u2019am\u00e9lioration des outils de traitement automatique des corpus difficiles : langue parl\u00e9e et langues \u00e9crites Web et texto\u2026<\/p>\n<p>Ces th\u00e9matiques et perspectives de recherche tr\u00e8s fortement li\u00e9es aux comp\u00e9tences des chercheurs du laboratoire s\u2019int\u00e8grent et contribuent aux projets et orientations de recherche men\u00e9es par ICAR, dans l\u2019exploitation des corpus de la plate forme CLAPI.<\/p>\n<p><strong>Constitution et traitement des corpus<\/strong><\/p>\n<p>Je contribue \u00e0 l\u2019enrichissement des corpus existants, et \u00e0 la cr\u00e9ation de nouveaux corpus n\u00e9cessaires \u00e0 l\u2019\u00e9tude des diff\u00e9rents usages de la langue parl\u00e9e, dans des situations, et des contextes divers: enregistrements et filmages, traitements et fouilles, collectes de donn\u00e9es outill\u00e9es, annotations.<\/p>\n<h4><strong>\u00a0<\/strong><\/h4>\n<h3><strong>Recherches sur la syntaxe de l\u2019oral cibl\u00e9es sur les mots ou les constituants peu ou non d\u00e9crits dans une approche formelle syntaxique<\/strong><\/h3>\n<p>La description est fond\u00e9e sur des donn\u00e9es attest\u00e9es en contexte\u00a0: grands corpus de conversation, dialogues de th\u00e9\u00e2tre et de cin\u00e9ma, et nouvelles formes de communication \u00e9crite (Forum, entretiens, discours du Web, messages texto)<\/p>\n<p>&#8211; 1<sup>\u00e8re<\/sup> \u00e9tape\u00a0: inventaire des mots ou constituants posant probl\u00e8me aux descriptions traditionnelles<\/p>\n<p>&#8211; 2<sup>\u00e8me<\/sup> \u00e9tape\u00a0: choix de prototypes par sous-classes<\/p>\n<p>&#8211; 3<sup>\u00e8me<\/sup> \u00e9tape\u00a0: examen des propri\u00e9t\u00e9s syntaxiques<\/p>\n<p>&#8211; 4<sup>\u00e8me<\/sup> \u00e9tape\u00a0: typologie et valorisation dans des travaux de <strong> recherche appliqu\u00e9e avec des enjeux soci\u00e9taux forts pour une application en traitement automatique de la langue<\/strong><\/p>\n<p>\u00c9laboration de protocoles, r\u00e9alisations d\u2019exp\u00e9riences\u00a0: description, analyse et interpr\u00e9tation des r\u00e9sultats. Mise en \u0153uvre par impl\u00e9mentation. V\u00e9rification du fonctionnement. En synergie avec d\u2019autres sp\u00e9cialistes de la linguistique (informaticiens, pragmaticiens, prosodistes, sp\u00e9cialistes des sciences cognitives, praticiens cliniciens\u2026)<\/p>\n<p>Diffusion de la production scientifique, r\u00e9daction d\u2019articles et d\u2019ouvrages, interventions en colloques et s\u00e9minaires. Encadrement. Organisation d\u2019\u00e9v\u00e9nements.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Principaux axes de recherche Recherches dans le domaine de la syntaxe de l&rsquo;oral en Fran\u00e7ais parl\u00e9 dans l&rsquo;int\u00e9raction Traitement et analyse des unit\u00e9s peu ou non d\u00e9crites en syntaxe Deux objectifs : faire \u00e9merger des syst\u00e8mes descriptifs et les mettre &hellip; <a href=\"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/axes-de-recherche\/\">Continuer la lecture <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":2,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-39","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/wp-json\/wp\/v2\/pages\/39","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/wp-json\/wp\/v2\/comments?post=39"}],"version-history":[{"count":22,"href":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/wp-json\/wp\/v2\/pages\/39\/revisions"}],"predecessor-version":[{"id":205,"href":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/wp-json\/wp\/v2\/pages\/39\/revisions\/205"}],"wp:attachment":[{"href":"https:\/\/icar.cnrs.fr\/membre\/stestonbonnard\/wp-json\/wp\/v2\/media?parent=39"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}