{"id":144,"date":"2017-02-21T18:31:43","date_gmt":"2017-02-21T17:31:43","guid":{"rendered":"http:\/\/www.icar.cnrs.fr\/sites\/corinte\/?page_id=144"},"modified":"2022-02-03T15:02:48","modified_gmt":"2022-02-03T14:02:48","slug":"numeriser","status":"publish","type":"page","link":"https:\/\/icar.cnrs.fr\/corinte\/numeriser\/","title":{"rendered":"Num\u00e9riser"},"content":{"rendered":"<h3 style=\"text-align: justify;\"><span style=\"color: #33cccc;\">Objectif<\/span><\/h3>\n<p style=\"text-align: justify;\">La num\u00e9risation des donn\u00e9es primaires et secondaires d&rsquo;un corpus permet d&rsquo;en assurer la conservation et l\u2019exploitation. Cette \u00e9tape est particuli\u00e8rement importante pour les corpus anciens dont les divers \u00e9l\u00e9ments sont souvent conserv\u00e9s sur des supports obsol\u00e8tes et menac\u00e9s de destruction. Elle est \u00e9galement indispensable pour l\u2019exploitation des corpus contemporains, puisque la num\u00e9risation permet de les traiter avec des logiciels de lecture, d\u2019alignement et d\u2019interrogation performants.<\/p>\n<h3 style=\"text-align: justify;\"><strong><span style=\"color: #33cccc;\">Principes et solutions<\/span><\/strong><\/h3>\n<p style=\"text-align: justify;\">La num\u00e9risation des diff\u00e9rents \u00e9l\u00e9ments d&rsquo;un corpus doit respecter le plus fid\u00e8lement possible les originaux, car les donn\u00e9es num\u00e9ris\u00e9es deviendront les futurs masters. En outre, pour les analyses que ces donn\u00e9es rendront ensuite possibles, il est important de veiller au maintien de la qualit\u00e9 des donn\u00e9es originales non digitales, que ce soit lors des phases de num\u00e9risation ou de <strong>compression<\/strong>.<\/p>\n<p style=\"text-align: justify;\">Alors que la plupart des transcriptions r\u00e9centes et leurs conventions sont informatis\u00e9es (Microsoft Word TM, Praat, CLAN\u2026), les plus anciennes peuvent \u00eatre manuscrites ou dactylographi\u00e9es (transcriptions tap\u00e9es \u00e0 la machine ou transcriptions publi\u00e9es et dont les originaux sont perdus). Ces donn\u00e9es sont alors num\u00e9ris\u00e9es sous forme d&rsquo;image, l&rsquo;original \u00e9tant conserv\u00e9 par la <strong>m\u00e9diath\u00e8que<\/strong>.<\/p>\n<p style=\"text-align: justify;\">De m\u00eame, de nombreuses donn\u00e9es primaires (photos, donn\u00e9es manuscrites, ouvrages utilis\u00e9s pendant l&rsquo;interaction\u2026) ou secondaires (notes du collecteur\u2026) peuvent \u00eatre num\u00e9ris\u00e9es sous forme d&rsquo;image, aux formats BMP et PICT. Dans certains cas, une partie seulement des documents est num\u00e9ris\u00e9e (par exemple quelques copies d&rsquo;\u00e9l\u00e8ves), le reste \u00e9tant stock\u00e9 dans la m\u00e9diath\u00e8que.<\/p>\n<p style=\"text-align: justify;\">Les enregistrements en format original les plus anciens posent des probl\u00e8mes de p\u00e9rennit\u00e9 (d\u00e9gradation du support, lecture impossible faute de mat\u00e9riel) qui obligent \u00e0 les transf\u00e9rer sur des supports plus contemporains.<\/p>\n<p style=\"text-align: justify;\">Les enregistrements consid\u00e9r\u00e9s comme masters\/originaux ne subissent pas de coupures, ni de montage, selon le double principe de respect de l\u2019original et de conservation de l\u2019enregistrement le plus continu possible d\u2019une interaction (qui font \u00e9viter le morcellement en clips ou en extraits discontinus).<\/p>\n<p style=\"text-align: justify;\">Les formats des donn\u00e9es informatiques ont \u00e9t\u00e9 choisis (voir <strong>conversion<\/strong>) pour assurer la compatibilit\u00e9 la plus grande avec les lecteurs et les outils d\u2019exploitation existants.<\/p>\n<p><em><span style=\"color: #00ccff;\">Enregistrements audio<\/span> : le format de stockage dans la m\u00e9diath\u00e8que est .WAV. Les donn\u00e9es audio mises en ligne sont au format .mp3 pour minimiser le poids des fichier et faciliter leurs acc\u00e8s (par streaming ou par t\u00e9l\u00e9chargement).<\/em><\/p>\n<p><em><span style=\"color: #00ccff;\">Enregistrements video<\/span> : les donn\u00e9es vid\u00e9o originales sont conserv\u00e9es sous forme de cassettes DV ou sous la forme de fichiers DV-natifs lorsqu\u2019elles ont \u00e9t\u00e9 captur\u00e9es directement sur disque dur. Diverses compressions sont effectu\u00e9es, afin de stocker des fichiers de qualit\u00e9 et de poids diff\u00e9rents, r\u00e9pondant \u00e0 diff\u00e9rentes exigences d\u2019analyse et de traitement. Le format adopt\u00e9 est g\u00e9n\u00e9ralement Quicktime (.MOV) ou AVI (Audio Video Interleave)<\/em><\/p>\n<p style=\"text-align: justify;\">Pour plus d&rsquo;informations sur la num\u00e9risation et la compression des donn\u00e9es, consultez le documents suivants :<br \/>\n<span style=\"color: #33cccc;\"><strong>Acquisition et la compression des donn\u00e9es vid\u00e9o (Pr\u00e9sentation Powerpoint)<\/strong><\/span><br \/>\n<span style=\"color: #33cccc;\"><strong>Tableau comparatif des algorithmes de compression<\/strong><\/span><\/p>\n<p style=\"text-align: justify;\">Les formats de l&rsquo;audio et de la video d\u00e9pos\u00e9s dans CLAPI vont d\u00e9pendre du lieu d\u00e9finitif d&rsquo;h\u00e9bergement de la base et du mode de streaming (lecture des fichiers audio\/video en ligne) utilis\u00e9 par l&rsquo;h\u00e9bergeur. Les donn\u00e9es primaires ou secondaires num\u00e9ris\u00e9es d\u00e9pos\u00e9es dans CLAPI et pouvant \u00eatre t\u00e9l\u00e9charg\u00e9es sont anonymis\u00e9es ; par contre une version sans anonymisation est conserv\u00e9e dans la m\u00e9diath\u00e8que.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Objectif La num\u00e9risation des donn\u00e9es primaires et secondaires d&rsquo;un corpus permet d&rsquo;en assurer la conservation et l\u2019exploitation. Cette \u00e9tape est particuli\u00e8rement importante pour les corpus anciens dont les divers \u00e9l\u00e9ments&#8230;<\/p>\n","protected":false},"author":28,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"inline_featured_image":false,"footnotes":""},"class_list":["post-144","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/icar.cnrs.fr\/corinte\/wp-json\/wp\/v2\/pages\/144","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/icar.cnrs.fr\/corinte\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/icar.cnrs.fr\/corinte\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/icar.cnrs.fr\/corinte\/wp-json\/wp\/v2\/users\/28"}],"replies":[{"embeddable":true,"href":"https:\/\/icar.cnrs.fr\/corinte\/wp-json\/wp\/v2\/comments?post=144"}],"version-history":[{"count":3,"href":"https:\/\/icar.cnrs.fr\/corinte\/wp-json\/wp\/v2\/pages\/144\/revisions"}],"predecessor-version":[{"id":1009,"href":"https:\/\/icar.cnrs.fr\/corinte\/wp-json\/wp\/v2\/pages\/144\/revisions\/1009"}],"wp:attachment":[{"href":"https:\/\/icar.cnrs.fr\/corinte\/wp-json\/wp\/v2\/media?parent=144"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}