Atelier : La numérisation et la compression d’images
par Daniel Valero (Assistant ingénieur CNRS)
Vous trouverez dans ce document quelques informations utiles à l'acquisition et la compression des données multimedia.
Accès aux différentes sections :
- Numérisation et compression des données (diaporama au format Powerpoint)
- Présentation des codecs
- Logiciels
- Sites de téléchargement
- Glossaire
DivX :
Version actuelle (janvier 2005) : 5.2.1
Origine : Société Divx Networks.
Codec très populaire sur Internet, disponible gratuitement pour une utilisation personnelle. Ce codec permet d'obtenir des vidéos compressées de bonne qualité avec un encombrement très réduit. .
http://www.divx.comXVID : implémentation "open source" (libre de droits) du codec DIVX.
Version actuelle : 1.0.3
Origine : développement « open source »
Equivalent du DIVX en termes de qualité mais avec la particularité d’être complètement gratuit
http://www.xvid.orgWindows Media Video (WMV)
Version actuelle : 9
Origine : Microsoft
Remarque : ce codec est intégré à Windows Movie Maker. On peut l'utiliser à partir d'autres logiciels à 2 conditions :
1) que le logiciel soit compatible avec cette technologie (c'est le cas par exemple de Virtual Dub 1.6.2, d'Adobe Première... mais pas Quicktime)
2) si l'on ne possède pas Windows Movie Maker (livré avec Windows XP), il vous faudra télécharger et installer "Windows Media Video VCM" disponible à l'adresse suivante :
« http://www.microsoft.com/downloads/search.aspx?displaylang=en" et effectuer une recherche sur les termes "Windows Media Video VCM".
3ivx
Version actuelle 4.5.1
Origine : Société 3ivx Technologies Pty. Ltd.
Autre Codec basée sur le MPEG 4. Gratuit pour une utilisation privée. Bien que généralement considéré comme moins performant que ses homologues (Divx et XVID), 3ivx présente l’avantage de fonctionner avec QuickTime.MPEG 1
Origine : développé par le comité Motion Picture Experts Group, groupe international d'experts à la base de la publication des normes de compression audio et vidéo MPEG-1, 2, 4 et 7)
Le MPEG 1 ainsi que la plupart des codecs vidéos, repose en partie sur la détection et l'encodage de la redondance des informations entre différentes images qui se suivent (ou se précédent)
Il existe 3 types d'images dans un flux MPEG.
- type I : Image complète, similaire à une image JPEG peu compressée
- type P : Image prédite à partir de l'image précédente
- type B : Image prédite (bidirectionnelle) à partir des images précédentes et suivantes.Les compresseurs MPEG 1 se présentent généralement sous-forme de plug-ins disponible pour les logiciels de montage vidéo tel que Adobe Première. On en trouve également sous forme de programme autonome à l'image de "TMPGEnc" (gratuit pour une utilisation personnelle) disponible sur le site : http://www.tmpgenc.net/fr/f_main.html
Les codecs divx, xvid... ont comme base commune, la norme mpeg 4.
Lame MP3 (codec MP3 de qualité et gratuit)
Ogg Vorbis (très bon codec gratuit)Tableau comparatif d'une sélection de formats audios et vidéos
Format 1 seconde (Ko) * 15s en Mo 1mn Mo 1 heure (Mo) Sur 1 CD 700 (en mn) Evaluation Qualité/Poid de 1 à 5 Points faibles Audio Son 44Khz, 16bits, Stereo (qualité CD audio non compressé) 150 2,2 8,8 527 80 5 Son 44Khz, Stereo (qualité CD audio compressé MP3, 128 kbits) 16 0,9 56 747 4,5 Audio + Video Format DV (Video et Son) 3600 54,3 217,2 13032 3 5 encombrement Format MPEG (Pal : 352*288 + Audio 224 Kbits) 170 2,5 10,0 600 70 XVID debit 900 Kbits (Son MP3 128 Kbits) 100 1,5 6,0 360 117 4,5 aucun DIVX debit 900 Kbits (Son MP3 128 Kbits) 100 1,5 6,0 360 117 4,5 codec sous licence (apparition d'un logo en bas à droite durant les premières secondes) Quicktime (DSL/Cable "élevé"; 320*240), 25ips 100 1,5 6,0 360 117 2,5 taille (320*240) Quicktime (Mpeg 4, 25ips, 720*576, 1image clef pour 100 images, debit 150Ko, qualité optimale son Mpeg4) 165 2,3 9,2 552 76 3,5 encombrement, rendu durant des séquences de mouvement Windows Media Video (video pour réseau local 1Mbits) 125 1,8 7,2 432 97 4,5 Format propriétaire (Microsoft)
- VirtualDub : outil gratuit permettant d'effectuer de la capture, des montages
vidéos simples et de la compression au format AVI.
Disponible sur
PC uniquement.
- Imovie : Logiciel gratuit de capture et de montage
vidéo édité par
la société Apple. Imovie se distingue par la qualité de
son ergonomie.
Disponible sur Macintosh uniquement
- Quicktime : Boite à outils et lecteur multimedia
(Player en anglais). Permet de lire et de compresser des flux multimédias
dans différents format.
Quicktime présente la particularité d'installer et d'utiliser ses
propres codecs (MPEG 4, H263...). Quicktime peut-être utilisé de 2
manières
; Soit directement par le biais de son interface, soit par le biais d’un programme
capable de « dialoguer » avec lui (ex : Adobe Première,
Sony Vegas…)
Disponible sur MAC et PC.
- Windows Movie Maker : Logiciel gratuit de capture
et de montage vidéo édité par
la société Microsoft.
Disponible uniquemetn sur Windows XP et versions ultérieures
- Media Player Classic : excellent "clone" de Windows Media Player permettant de lire des vidéos dans de nombreux formats. Il a la particularité d'être très léger et de fonctionner sur la plupart des systèmes windows. Il est également capable de lire des videos Quicktime (si ce dernier est installé). Il est souvent livré avec les packs de codec (par ex. dans k-lite codec pack)
- VLC (ex VideoLan) : Très bon lecteur multimedia. Existe sur MAC et PC
- GSSpot : il indique les codecs utilisés pour un fichier donné.
- STOIK Video Converter 2.0 (Freeware) : Logiciel permettant de convertir des fichiers WMV en AVI ou DV
- http://www.free-codecs.com/ : ce site propose en téléchargement de très nombreux codecs gratuits. Les codecs peuvent être récupérés soit sous forme de pack (ex "k-lite Codec Pack Full version), soit sous forme de programme d'installation propre à chaque codec (ex : Koepi's XviD, DivX Free 5.2.1, LAME MP3...)
- http://www.telecharger.com ou http://www.clubic.com : sites de téléchargement généralistes très complets
- http://www.quicktime.com : site officiel de Quicktime. Il est conseillé de télécharger la version "Standalone" de Quicktime Player. Cette version se présente sous forme d'un logiciel d'installation autonome qui à l'inverse de la version "standard", ne nécessite pas d'être connecté sur Internet pour effectuer l'installation.
Capture : processus permettant de transférer le contenu d'un support analogique ou numérique (par ex une cassette dv ou VHS) sur un ordinateur. On parle également de numérisation ou d'acquisition.
CBR (Constant Bit Rate) : Le débit d’encodage est constant. Du coup il peut être défini avant la compression (ex 128 Kbits). S'oppose au VBR (Variable Bit Rate)
CoDEc (COmpression/DECompression) : Codeur/décodeur : Matériel ou logiciel qui encode et décode un signal.
Connectique analogique ; les connecteurs les plus utilisés sont :
| Type de connecteurs utilisés dans le domaine du son et de la vidéo | |
| Connecteur RCA : Le fil jaune transporte le signal vidéo (signal composite),
le rouge l'audio gauche et le jaune l'audio droit. Sur le cable vidéo composite (jaune), les différents constituants du signal vidéo sont "mixés" ce qui conduit à une perte de qualité et de précison de l'image. |
![]() |
| Connecteur S-Video (également connue sous les noms S-VHS, Y/C ou Ushiden). Ce type de connecteur ne gère que le signal vidéo. Il transporte sur des fils différents les informations de chrominance et luminance ce qui lui permet de mieux restituer le signal vidéo (par rapport au signal composite). | ![]() ![]() |
| Connecteur Jack (3,5 mn ou 6,25 mn). Généralement utilisé pour transporter le son. Il peut dans certains cas transporté un signal vidéo composite grâce à une broche supplémentaire . | ![]() |
| Le XLR. Connecteur utilisé dans les milieux professionnels. Il est très résistant aux perturbations électromagnétiques et peut être utilisé sur des longueurs allant jusqu'à 100m. | ![]() |
Compression : opération qui consiste à réduire la taille occupée par des données numériques. Le principe générale de la compression consiste à éliminer les informations redondantes ou non significatives des données.
On peut classer les méthodes de compression en 2 catégories selon
qu'elles soient destructives ou pas :
- La compression sans pertes (lossless) également appelée compression
non destructive. On applique dans ce cas des algorithmes qui vont réduire
la taille du média sans altérer sa qualité (aucune perte d'informations).
.
- Dans le cas d'une compression "dégradante" ou compression destructive,
on cherche à éliminer définitivement les informations non "représentatives".
Par exemple dans le cas d'un extrait audio on essaiera du supprimer les fréquences
non perceptibles par l'oreille humaine, les silences....
Il existe plusieurs techniques de compression basées sur des algorithmes
mathématiques plus ou moins complexes. Une des plus utilisée consiste à décrire
un ensemble d'informations homogènes (par exemple un fond de couleur unie)
en tant que bloc. Sans compression, il faudrait décrire chaque élément
constituant le fond (les pixels) de manière individuelle.
Ainsi il est plus court d’écrire : les 120 premiers pixels de l'image
sont blancs que :
Le 1 pixel est blanc, de 2ième pixel est blanc, le 3ième pixel est
blanc…
Débit ou Bitrate en anglais : quantité d'informations nécessaire pour encoder une seconde de flux audio et/ou vidéo. Il est généralement exprimé en bits ou kilobits par seconde
Décompression : La décompression est la tâche effectuée par le codec qui consiste à reconstituer l'information audio et/ou vidéo préalablement codée pour en permettre la lecture.
DV (Digital Video) : Format d’enregistrement
numérique utilisé par
la plupart des caméscopes numériques. Le format DV utilise une définition
d'image de 720x576 points et un débit fixe de 3,6 Mo/s.
DVCAM : Variante professionnelle de SONY du format DV.
DVCPRO : Variante professionnelle de PANASONIC du format DV.
Firewire (également nommée IEEE 1394 ou Ilink) : Norme de cablage et de transmission de données audio/vidéo numériques. Elle permet de connecter sur un ordinateur des appareils tels que les camescopes DV, disque durs externes... Necessite la présence sur l'ordinateur de ports à cette norme.
| Les différents types de cable IEEE1394 : | |
Câble IEEE 1394 6/4 (généralement utilisé pour la connexion d'un |
![]() |
| Câble IEEE 1394 6/6 (généralement utiilisé pour
la connexion de disques durs externes sur un ordinateur. Permet également de relier 2 appareils à la norme firewire) |
![]() |
| Câble IEEE 1394 4/4 (utilisé pour relier un ordinateur portable à un camescope numérique à la norme DV) | ![]() |
Fréquence d'échantillonnage : Nombre de mesures effectuées par seconde lors de la numérisation d'un signal audio. Pour être numérisé, le signal vidéo ou audio analogique doit d'abord être découpé selon des intervalles de temps précis. Ainsi, le CD audio utilise une fréquence d’échantillonnage de 44,1 Khz. C’est également la fréquence recommandée lors d’une compression audio.
Hertz : Unité de mesure de la fréquence. Correspondant au nombre de cycle par seconde.
Image-clé (keyframe en anglais) : Terme utilisé pour la compression des vidéos. Une image-clé est une image peu compressée qui va servir de référence à la compression des images qui la suivent (ou qui la précédent) . Dans la mesure ou elle est peu compressée, ce type d'image alourdit le fichier final.
Mini DV : format d'enregistrement dérivé du DV qui utilise des supports de taille inférieure.
Multiplexage : étape qui consite à rassembler différente flux audios ou vidéos dans un seul fichier
Numérisation (digitisation en anglais) : Action qui consiste à transformer un signal analogique sous forme numérique.
NTSC (National Television System Committee) : Norme de télédiffusion employée aux Etats-Unis et au Japon. L'affichage se fait en 30 images par seconde.
PAL (Phase Alternate Line) : Norme de télédiffusion utilisé essentiellement en Europe. L'affichage se fait en 625 lignes entrelacées à raison de 25 images par seconde.
Pixel : (Picture Element) : Le plus petit élément d'information d’une image numérique. Correspond également à la plus petite surface exploitable électroniquement pour restituer une image sur un écran. Le nombre maximal de pixels d'un écran permet de définir sa résolution.
SECAM (Séquentiel Couleur A Mémoire) : Norme de télédiffusion utilisée en France et dans quelques pays africains. L'affichage se fait sur 625 lignes entrelacées (comme pour le PAL ou le NTSC) et en 25 images par seconde.
Trame : synonyme d'image.
VBR (Variable BitRate) : débit d’encodage/décodage variable. Il fluctue selon la qualité du signal. Permet généralement d’obtenir des fichiers moins volumineux.
-------------------
Exercices :
Avec Virtual Dub :
- Ouvrir le fichier Untitled2.avi (se trouvant sur le bureau dans le dossier « extraits ») avec VirtualDub
- encoder un premier segment d'environ 5 secondes en 3ivx avec les paramètres suivants : 1 pass - Bitrate de 960 Kbits- encoder le 2ième segment en Windows Media Video
- Comparer le résultat à l'aide de Windows Media Classic (ne pas confondre avec Windows Media Player)
Avec Quicktime Pro :
- Ouvrir le fichier Untitled.mov (se trouvant sur le bureau dans le dossier « extraits »)
- Supprimer les 5 dernières secondes de la séquence vidéo
- Encoder le fichier avec les paramètres suivants : Codec MPEG 4, 15 images par secondes, Débit de 100 Ko, Taille 720*576 ; Audio MPEG 4