Archive for February, 2011

Progressif, entrelacé

Wednesday, February 2nd, 2011

Lorsque j’avais acheté ma caméra Canon HV30i en été 2008, un des critères que j’avais considéré comme déterminant était la présence d’un mode 25p, c’est-à-dire la possibilité de filmer en haute définition à 25 images/secondes en mode progressif.

Pendant plus de 2 ans, faute de temps, je n’avais pas exploité cette possibilité, me contentant de filmer en entrelacé. Mais il y a quelques mois, j’ai enfin pris le temps d’approfondir le sujet et de mettre en place dans Final Cut Pro les réglages nécessaires pour gérer ce fameux mode 25p.

Je ne le regrette pas !

Progressif, entrelacé, kesako ?

Avant d’aller plus en avant, il faut tout d’abord bien comprendre ce qu’est le mode entrelacé et en quoi il diffère du mode progressif.

Revenons donc aux principes de base de l’animation : pour reproduire une illusion de mouvement, celui-ci doit être décomposé en une succession d’images fixes. Ces images fixes seront ensuite diffusées les unes après les autres à une vitesse suffisante pour que le cerveau ait l’illusion de mouvement.

Au moment de la restitution du mouvement, trois problèmes doivent être surmontés : la finesse de l’image (sa résolution), le scintillement, et la fréquence de restitution (le nombre de fois par seconde qu’une image différente est affichée)[1].

Finesse de l’image

C’est le niveau de détail (la résolution, ou encore la définition) de l’image. Plus la définition est faible, moins l’image comportera des détails. En informatique, on parle souvent de pixel pour identifier le plus petit élément constituant une image. La définition standard découpe l’image en 576 lignes de 768 pixels. La haute-définition découpe l’image, par exemple, en 1080 lignes de 1920 pixels (il y a d’autres formats considérés comme haute-définition).
1080 lignes 576 lignes 288 lignes

Le scintillement

Grâce à la persistance rétinienne, au moment où une image n’est plus affichée, l’œil continue de la percevoir encore quelques millisecondes.
Toutefois, si une nouvelle image n’est pas réaffichée après 10 à 25 millisecondes (cela dépend de l’intensité lumineuse de l’image), l’œil perçoit une baisse d’intensité lumineuse, qui débouche sur une sensation de scintillement.
Pour que ce scintillement disparaisse complètement, il faudrait qu’une image soit affichée 80 fois par seconde (80 Hz). Dans certaines conditions (pièce sombre), 40 Hz est acceptable.

La fréquence de restitution

C’est la vitesse de défilement des images. Aux débuts du cinéma, la fréquence minimale pour restituer une illusion de mouvement a été établie à 12 images par seconde. Dans le but de garantir un confort de vision acceptable, la fréquence de 16 images par seconde s’imposa comme un minimum. Actuellement, le cinéma traditionnel utilise une fréquence de 24 images par seconde (cette fréquence avait été choisie pour garantir une qualité sonore suffisante de la bande son). Bien qu’acceptable cette fréquence ne permet pas de reproduire les mouvements avec une fluidité parfaite. Pour y parvenir, il faudrait une fréquence d’au moins 50 images par seconde.

Résolution de ces problèmes au cinéma

Le cinéma restitue 24 images complètes par seconde. Pour éviter le scintillement, chaque image est projetée deux fois[2] [3]. Il y a donc chaque seconde 48 projections d’image, mais avec 24 images différentes.
La résolution de l’image dépend de la pellicule et de la qualité de la copie. Par exemple, une pellicule 35 mm peut reproduire une résolution de 1536 lignes de 2048 pixels[4].

Résolution de ces problèmes en télévision

L’arrivée de la télévision dans le milieu du XXe siècle change considérablement la façon de restituer une image et à fortiori le mouvement.

Contrairement au cinéma où l’image est affichée instantanément dans son intégralité, sur un écran à tube cathodique, l’image est produite par un faisceau d’électrons qui balaye la surface de l’écran afin d’en allumer certains points (les photophores). L’image est donc affichée point par point, par un mouvement rapide en Z du faisceau.

De plus, des contraintes techniques ont imposé que la vitesse de balayage de ce faisceau doive être synchronisée sur la fréquence du réseau électrique (contrainte technique de l’époque découlant de problèmes de parasitage par l’électronique[5] [6]. La fréquence du réseau électrique en Europe (50 Hz) impliquait donc 50 images par seconde. Toutefois, avec les techniques de l’époque (dans les années 30), il n’était pas possible d’afficher beaucoup plus que 200 lignes en 1/50e de seconde[7].

D’ailleurs, même s’il avait été possible de transmettre une image de plus de 400 lignes 50 fois par seconde, cela aurait été beaucoup trop gourmand en bande passante.

Un autre problème serait survenu lorsqu’une image complète était affichée ligne par ligne : avec les photophores de l’époque, le haut de l’image aurait commencé à s’estomper alors que le bas de l’image n’était pas encore affiché, ce qui aurait rendu le phénomène de scintillement inacceptable[8].

L’idée a donc été de découper une image (faite donc de plusieurs lignes) en deux demi-images (deux trames), constituée pour la première des lignes impaires de l’image complète et pour la deuxième des lignes paires. Cette solution résolvait plusieurs problèmes : la bande passante nécessaire était acceptable, la restitution du mouvement suffisante (25 images complètes par seconde), la fréquence de 50 Hz limitait la perception du scintillement et l’affichage de l’image complète en deux passages réduisait l’impact de la diminution d’intensité des photophores.

À noter que, bien que la plupart du temps, la première trame (demi-image) est constituée des lignes impaires (on parle également de trame supérieure, ou encore de UFF pour upper field first), certains formats (particulièrement le format DV) utilisent pour la première image les lignes paires (on parle également de trame inférieure ou encore de LFF pour lower field first).

Aux États-Unis (ainsi que dans certains autres pays), la fréquence du réseau électrique est de 60 hertz. Le faisceau d’électrons affiche donc 60 demies-images par seconde, soit 30 images complètes par seconde. Cette fréquence légèrement plus élevée atténue d’ailleurs encore d’avantage le phénomène de scintillement.

Lorsqu’une image complète est formée de deux demies-images, on parle d’un affichage entrelacé (interlaced en anglais). Si 50 demi-images sont affichées par seconde, on parle d’un format 50i. Si ce sont 60 demi-images qui sont affichées chaque seconde, on parle d’un format 60i.

Lorsqu’une image complète est formée d’une image pleine, on parle d’affichage progressif (progressive en anglais). Si 25 images complètes sont affichées chaque seconde, on parle d’un format 25p. Le format du cinéma traditionnel est donc noté 24p.

Pour en savoir plus, je recommande l’excellent site VSB, véritable mine d’informations.

Capture vidéo

À l’époque où les caméras vidéo se sont démocratisées, l’immense majorité des téléviseurs étaient à tube cathodique et n’étaient capable que de diffuser une image entrelacée. Les caméras se sont donc basées sur ce système pour la capture des images et le stockage sur cassettes vidéo.

Pour illustrer cela, prenons la séquence d’un train qui se déplace. Cette séquence présente 4 images, chacune d’une durée de 1/50e de seconde.

à 1/50e à 2/50e à 3/50e à 4/50e
Mouvement de base
capture 50i
capture 25p

Un avantage d’une capture 50i apparaît immédiatement : il y a plus d’images par secondes qu’en 25p, ce qui semble préférable lors d’un mouvement rapide. Par contre, c’est au détriment de la résolution verticale : ce sont bel et bien des demi-images et non pas des images complètes.

Montage non-linéaire

Quel que soit le mode (50i ou 25p), les logiciels de montage non-linéaire travaillent sur une base de temps de 25 images par secondes (en Europe), afin de manipuler des images complètes.

En 50i, une image complète est donc formée de deux demi-images qui ont été filmées à un moment différent (20 ms les sépare). Un objet en mouvement sera alors à une certaine position sur la première demi-image, et un peu plus loin sur la deuxième. Lorsque ces deux demi-images sont affichées simultanément, il en résulte un effet de peigne bien visible sur l’exemple ci-dessous.

à 1/25e à 2/25e
50i
25p

Note : Souvent, en 50i, cet effet n’est pas visible dans le logiciel de montage du simple fait que l’image n’est pas affichée à la bonne échelle. Elle est en effet souvent réduite en taille afin d’avoir sur le même écran l’image et les autres fenêtres graphiques du logiciel de montage (par exemple la ligne de temps et les chutiers). Pour que l’effet soit observable, il est donc important que l’image soit affichée à 100% de sa taille.

Image filmée en 50i, mais affichée à 40% : l’effet de peigne est invisible.
Image filmée en 50i, affichée à 100% : l’effet de peigne est visible.
Image filmée en 25p, affichée à 40%
Image filmée en 25p, affichée à 100%

Cet effet de peigne est révélateur du problème des images entrelacées : une image pleine est faite de demi-images. Les effets de montage (ralenti, fondu, floutage, etc.) devront donc être calculés sur des demi-images. La compression est également faite sur des demi-images.

Cela complique les choses, mais reste nécessaire si le film obtenu a pour but d’être diffusé sur un appareil reproduisant uniquement des images entrelacées (sur de tels appareils, l’effet de peigne est d’ailleurs inexistant).

Par contre, si le film peut être diffusé sur un support reproduisant des images de façon progressive, alors toute la complexité amenée par l’entrelacement disparaît.

En l’occurrence, depuis quelques années, une grande partie des supports de diffusion de films travaillent en mode progressif, en particulier  les écrans d’ordinateur et les téléviseurs modernes (plasma, LCD, etc). D’ailleurs, la diffusion d’un film entrelacé sur un appareil progressif est médiocre, car l’effet de peigne est flagrant (à moins que le dispositif soit capable de désentrelacer la source).

Car pour éviter l’effet de peigne à partir d’une image entrelacée, il faut la désentrelacer. Selon la performance du logiciel utilisé, ce désentrelacement sera de plus ou moins bonne qualité, le but étant d’essayer tant bien que mal de reconstituer des images complètes à partir de deux demi-images décalées dans le temps.

Différence de qualité d’image

J’ai déjà mentionné plus haut que lors du traitement des images, il est plus facile de travailler sur des images entières que sur des demi-images entre autres pour les effets spéciaux.

Mais, en terme de qualité d’image, y a-t-il une différence ? Comparons :

image extraite d’une vidéo entrelacée
image extraite d’une vidéo progressive

Bien que la différence soit minime, on perçoit tout de même une meilleure finesse verticale avec une image progressive. Le visage du personnage est révélateur :

détail d’une image entrelacée
détail d’une image progressive

On constate d’ailleurs que la compression provoque moins d’artefacts sur l’image progressive que sur l’image entrelacée.

Mais ma plus grande surprise a été la différence de sensibilité en basse lumière.

image extraite d’une vidéo entrelacée
image extraite d’une vidéo progressive

C’est peut-être difficile à croire, mais les deux images ci-dessus ont été réalisées sous des conditions d’éclairage strictement identiques !

Voici une vidéo qui illustre et compare ce qu’on vient de voir.

Finalement, voici en guise de dernière comparaison un cas extrême : une image faite de lignes de un pixel. C’est le cas le pire pour une vidéo entrelacée, car ces lignes n’apparaissent qu’une trame sur deux et provoquent donc un effet de scintillement très désagréable.

vidéo entrelacée vidéo progressive
télécharger la vidéo originale télécharger la vidéo originale

À noter que les vidéos originales (encodées avec l’Apple Intermediate Codec) ont été converties en MP4. On voit d’ailleurs que la vidéo entrelacée complique la tâche de la conversion/compression en MP4. Il en résulte d’ailleurs des artefacts indésirables.

Du progressif de bout en bout

Il semble donc évident qu’à l’heure actuelle, si une vidéo à pour but d’être visionnée sur un ordinateur ou sur un téléviseur moderne, l’idéal est de travailler en progressif de bout en bout : de la capture en passant par le montage, jusqu’à la diffusion.

La capture

La capture reste la première difficulté majeure pour obtenir du progressif : la plupart des caméscopes grand public capturent une image entrelacée (mais je suis sûr qu’au fur et à mesure que cet article deviendra âgé, cette affirmation sera de moins en moins exacte).

D’après mes constatations, Canon est un des premiers constructeurs à proposer le 25p (sans doute à cause de son historique orienté appareils photos, monde dans lequel l’entrelacement n’existe pas). La plupart de ses caméscopes HD proposent donc le mode 25p.

Dans ce mode, la capture est donc progressive, mais encore souvent (en particulier sur les caméscopes à cassettes) l’enregistrement est fait en entrelacé. C’est le cas de la Canon HV30i.

Le principe est simple : l’image complète est découpée en deux trames, qui sont enregistrées comme si ces trames avaient été capturées de façon entrelacée.

Le montage

Notre clip vidéo, filmé en mode progressif, a donc été “laminé” pour être enregistré comme un clip entrelacé.

Lors de son importation dans Final Cut Pro, si rien de particulier n’est fait, le clip sera importé comme un clip entrelacé et manipulé également comme tel. Il faut donc indiquer à Final Cut Pro que le clip en question a été filmé en mode progressif et qu’il faut le traiter comme tel. Cela peut se faire directement dans la fenêtre Navigateur si l’affichage a en mode liste, en cliquant avec le bouton de droite sur la colonne Priorité de trame du clip (ou des clips) sélectionné(s).

Il est également possible d’ajuster la priorité de trame clip par clip, par le menu contextuel du clip (Propriétés de l'élément→Format).

Une fois la priorité de trame ajustée pour tous les clips, il est bien sûr primordial de les utiliser dans une séquence également configurée pour le mode progressif (menu contextuel de la séquence→Réglages).

La manipulation est donc toute simple, encore faut-il ne pas oublier de la faire.

Ainsi, l’entrelacement n’est plus qu’un mauvais souvenir hérité des premières méthodes de diffusion et de reproduction d’images animées !


  1. [1] Persistance rétinienne et illusion de mouvement, Wikipédia, la vision
  2. [2] Avancement du film et projection, Wikipédia, Projection cinématographique
  3. [3] Les principes du cinéma, VSB, Vidéo numérique : les bases
  4. [4] Cinéma numérique, 2K, Guide de la haute définition, partie 3, page 37
  5. [5] Lines and refresh rates, Wikipedia, NTSC
  6. [6] Contraintes dues au secteur, Supélec, Choix de la fréquence trame ou image
  7. [7] Interlaced video : history, Wikipedia, Interlaced video
  8. [8] L’image entrelacée de la télévision, VSB, Vidéo numérique : les bases