NOMEX-CLAPI
Nouvelles méthodes d'exploitation des
corpus de langue parlée en interaction
Jusqu'au terme du contrat de l'ACI-TT, le travail
sera
conduit en poursuivant en parallèle les quatre axes
d'études actuellement
prioritaires pour la mise en place sur le Web de la plate-forme
multimédia :
Traitement des corpus
-
Bascule des données de CLAPI 1 vers CLAPI
2, ce travail
consiste entre autres, à compléter dans CLAPI 2, les
données inexistantes dans
CLAPI 1 et à intégrer les données primaires qui
n'étaient pas intégrées dans
CLAPI 1.
-
Poursuite du travail d'alimentation de la
base :
numérisation des enregistrements, bippage, et poursuite de la
réalisation de
transcriptions alignées : cet aspect concerne tant les
corpus
« internes » que les corpus externes.
- Gestion des prêts.
La poursuite du travail du Pool
Bibliothèque nécessite des
ressources humaines et matérielles importantes. Sur ce point, il
est clair que nous sommes
parvenus à la création d'une
structure qui semble opérationnelle, et qui méritera
d'être pérennisée si les
financements requis existent.
Transcription
- Développement des catégories de
transcription de
phénomènes non verbaux.
- Réflexion concernant les requêtes
sur les divers
phénomènes transcrits (en collaboration avec ANON et
ERIC).
- Réflexion sur une différenciation
de divers niveaux de
granularité dans la Convention ICOR existante (version 1.0.3).
Plate-forme
- Elaboration du prototype CLAPI2 à partir
de la maquette.
- Tests de performance sur un ensemble de corpus.
- Tests de la stratégie de
sécurisation des corpus.
- Poursuite et mise au point des requêtes
sur les
descripteurs et les transcriptions balisées (data mining).
Outils de transcription et d'analyse de corpus
CLAPI
-
Poursuite des tests de logiciels de
transcription/annotation
(vidéo).
-
Evolution du format Xi en parallèle avec
celle de la
convention ICOR.
-
Adaptation des convertisseurs, notamment :
-
NN<>Xi (NN encore à
déterminer, au choix : Anvil,
TASX, Elan, NITE)
-
Développement des outils de requête
comme NXT search.
-
Réflexion avec ERIC sur
l’intégration des corpus Xi dans
CLAPI.
-
Réflexion avec ERIC sur les requêtes
portant sur les corpus Xi
et autres dans CLAPI.2 (avec ICOR).
-
Réflexion sur les formats de corpus DDL et
Grenoble3 et sur
leur intégration dans CLAPI.2 (avec ICOR).