|
Samedi 31 juillet
|
|
|
|
|
Wuza.com > Articles > Détail
|
 |
|
La vidéo en informatique et l'entrelacement
Publié le 20/09/2004 par Chan (5320 hits)
|
 Version imprimable
|
|
|
Préambule
Du fait de la quantité d'évolutions technologiques qui ont marquées leurs histoires, la réunion des mondes de l'informatique (numérique par essence) et de la vidéo (analogique à l'origine) est complexe pour l'utilisateur non averti, et une bonne compréhension de leur fonctionnement est un plus pour celui qui voudrai mettre sur la toile, à la disposition du plus grand nombre, les films qu'il a réalisé.
Les problèmes les plus souvent rencontrés concernent le format des vidéos, leur entrelacement et les formats de fichier et de compression utilisés lors de l'export.
Cette série d'article a pour but de synthétiser tout ce qu'il est utile de savoir pour ne plus être perdu dans la jungle des formats vidéos ;)
"Définition" et images par seconde
Trois grands formats se partagent le monde l'encodage vidéo analogique. Le NTSC (National Television Standards Committee), le SECAM (Système Electronique Couleur Avec Mémoire) et le PAL (Phase Alternating Line). Le premier est surtout utilisé en Amérique du Nord et au Japon, le second dans les pays francophones ou liés à la France et le troisième partout ailleurs. En NTSC on enregistre 29.97 (et non 30) images par seconde sur 525 lignes chacune, alors qu'en PAL/SECAM on enregistre 25 images par seconde sur 625 lignes chacune.
Vous aurez remarqué qu'en analogique il n'y a pas la notion de colonne et, a fortiori, de pixels comme en numérique. Les nombres d'images par seconde (en anglais on parle de framerate, ou fps) est tout simplement la moitié (car le signal est entrelacé, voir plus bas) de la fréquence de l'électricité du réseau des pays concernés (50 Hz en France et 59.94 Hz aux USA).
Le PAL et le SECAM sont très proches, seule la manière de stocker le signal couleur est différente, c'est pour cela qu'un signal PAL passé sur un appareil SECAM (ou le contraire) produit une image en noir et blanc. Le SECAM n'est guère plus utilisé que pour la transmission hertzienne d'image, la plupart des appareils modernes compatibles SECAM fonctionnant en interne en PAL et ayant donc la double compatibilité. Depuis longtemps les caméras (analogiques et numériques) ne fonctionnent qu'en PAL ou en NTSC, selon le marché auquel elles sont destinées.
Plus d'infos sur les formats analogiques ici :
http://www.ee.surrey.ac.uk/Contrib/WorldTV/compare.html
Le pendant numérique du NTSC enregistre 29.97 fps avec une définition de 720x480 pixels, celui du PAL enregistre 25 fps avec une définition de 720x576 pixels. Pour simplifier on ne parlera plus que du PAL dans la suite de ces articles.
Entrelacement
Pour des raisons liées à leur histoire et aux technologies disponibles lors de leur avènement, les diffusions télévisées et à fortiori les flux vidéos analogiques en général sont diffusées entrelacé. C'est à dire qu'au lieu d'enregistrer 25 images complètes par seconde on enregistre en fait 50 moitiés d'images par seconde. Ces demi-images sont appelées des champs (field en anglais) et sont composées alternativement des lignes paires et impaires du capteur de la caméra, ou de l'écran du téléviseur.
Cette technique s'oppose à celle dite "progressive" utilisée en cinéma et dans les vidéos diffusée sur Internet, où chaque image stockée est une image complète, à la manière d'une succession de photographies.
Contrairement à ce que l'on pourrai croire, le format numérique Mini-DV (issu du format pro DV-Cam) de nos caméras n'est pas adapté à une diffusion informatique mais bien à une diffusion télévisée. Ainsi, chacune des 25 images par seconde enregistrées sur la bande d'une cassette Mini-DV est composée en réalité des deux champs successifs qui la composent, avec le décalage temporel d'un 50e de seconde qui les sépare. D'où l'effet de "peigne" que l'on peut observer sur les images composant un enregistrement DV.

+

=

Si l'on ne veut diffuser une vidéo que sur cassette Mini-DV ou sur DVD on n'a pas à se préoccuper de l'entrelacement. Tout au plus sera-t-on éventuellement gêné par la faible qualité de pré-visualisation dans le logiciel de montage (si celui-ci ne désentrelace pas automatiquement à l'affichage). Par contre pour diffuser la vidéo informatiquement, c'est à dire le plus souvent en MPEG4, il faut la désentrelacer car non seulement ces formats ne supportent en général pas correctement la notion d'entrelacement, mais les logiciels de lecture encore moins.
Il existe 4 grandes techniques pour désentrelacer un flux vidéo. Le discard, le blend, le bob, le motion-based.
La première technique est la plus simple, elle consiste à ne conserver qu'un champ sur deux et à doubler les lignes du champ restant. On se retrouve ainsi avec une vidéo d'une définition réelle deux fois moins élevée que la vidéo d'origine, mais comportant 25 "vraies" images par seconde.
La seconde technique double les lignes de chaque champ puis fusionne les deux images ainsi obtenues. Ceci élimine l'effet de peigne mais produit un effet de flou sur toute les parties mouvantes de l'image résultante.
La troisième technique, le "bob" est la seule qui n'est pas destructive. Elle sépare les champs les uns des autres de manière à produire un flux vidéo de 50 images par seconde. Cette technique est utilisée automatiquement par les logiciels de montage vidéo sur les plans passés au ralenti.
La dernière technique ne double pas les lignes mais désentrelace par interpolation les parties mobiles de l'image, les parties fixes n'étant pas modifiées et donc conservent la définition réelle originale à ces endroits.
Dans tous les cas ce sont les algorithmes "motion-based" qui produisent les meilleurs résultats. A défaut, on préferera la technique du "blend". Le "bob" n'est jamais utilisé pour du stockage de vidéo car du fait du doublement du nombre d'images par seconde la taille du fichier final est augmenté d'autant, à moins de diviser la définition verticale par deux, ce que la plupart des logiciels de lecture ne sauront pas gérer correctement. Par contre cette technique est utilisée par les logiciels de lecture de DVD et certains logiciels de lecture multimédia avancés, tel que VLC, pour afficher des vidéos stockées entrelacées.
Certaines caméras Mini-DV savent enregistrer en progressif. Les avantages sont la conservation d'une qualité d'image optimale lors de la conversion pour la diffusion sur Internet ainsi que la possibilité d'extraire des images de bonne qualité des vidéos. Un inconvénient est un moins bon rendu des ralentis, car il n'y a que 25 images enregistrées par seconde au lieu de 50. Un autre inconvénient est une qualité d'affichage potentiellement moins bonne (mouvements plus saccadés) sur les téléviseurs car ils sont adapté aux flux entrelacés.
Plus d'explications avec exemples à l'appui:
- http://www.100fps.com/index.htm
Des filtres de désentrelaçement avancés (motion-based ou équivalent):
- Smart Deinterlace (pour VirtualDub)
- Deinterlace - Area based (pour VirtualDub)
- TomsMoComp (pour Avisynth et DScaler)
|
|
|
|
| |
|