IHRIM : Publication de la Base de français médiéval 2019

Le laboratoire IRHIM annonce la mise en ligne de la Base de français médiéval 2019. Elle contient 170 textes intégraux écrits entre le IXe et la fin du XVe siècle (près de 4 700 000 occurrences-mots). Par rapport au corpus BFM2016, 17 textes ont été ajoutés. Le graphisme du portail BFM-TXM a été entièrement repensé et embelli pour cette nouvelle édition.

Tous les textes sont encodés selon les recommandations du consortium TEI, balisés pour le discours direct, automatiquement annotés en morphosyntaxe et lemmatisés. L’étiquetage morphosyntaxique a été vérifié pour 4 nouveaux textes (38 textes vérifiés, soit près de 1 000 000 mots) et la lemmatisation pour 18 textes (environ 400 000 mots).

Les conditions d’utilisation ont été simplifiées et tous les textes sont diffusés sous licence ouverte Etalab.

Contact : bfm@ens-lyon.fr
En savoir plus : consulter la BFM à l’adresse suivante