Le multimédia
Images et audiovisuels
Stéphane Paris
Lavoisier
Préface
11
Avant-propos
13
Chapitre 1. Introduction
19
1.1. Les images numériques19
1.2. Les audiovisuels numériques20
Première partie. Compression et représentation d'images
21
Chapitre 2. GIF, PNG, LossLess-JPEG et JPEG-LS
25
2.1. GIF : Graphic Interchange Format26
2.1.1. Version GIF89a29
2.1.2. Synthèse du format GIF30
2.2. PNG : Portable Network Graphics30
2.2.1. Les espaces de couleurs31
2.2.2. Les modes d'entrelacement32
2.2.3. L'algorithme de compression33
2.2.3.1. La prédiction adaptative34
2.2.3.2. La déflation/inflation36
2.2.4. Synthèse du format PNG39
2.3. LossLess JPEG39
2.3.1. Synthèse du format LossLess JPEG41
2.4. JPEG-LS42
2.4.1. Le contraste et les modes44
2.4.2. La prédiction44
2.4.3. Le contexte45
2.4.4. La correction du biais47
2.4.5. Algorithme de Golomb48
2.4.6. Mode par plage50
2.4.7. Quasi sans perte52
2.4.8. Synthèse du format JPEG-LS52
2.5. Synthèse53
Chapitre 3. JPEG : Joint Photographic Expert Group
55
3.1. Le mode séquentiel57
3.1.1. La mise en forme57
3.1.2. La transformation60
3.1.3. La quantification61
3.1.4. Le codage64
3.2. Le mode progressif65
3.3. Le mode hiérarchique67
3.4. Synthèse69
Chapitre 4. JPEG2000
71
4.1. Les prétraitements75
4.1.1. Structuration75
4.1.1.1. Les sous-images77
4.1.1.2. Les pavés78
4.1.1.3. Intérêt80
4.1.2. Le centrage des échantillons80
4.1.3. Les espaces multicomposantes81
4.1.3.1. La transformation réversible : RCT81
4.1.3.2. La transformation irréversible : ICT81
4.2. Les transformées en ondelettes82
4.2.1. La transformée irréversible82
4.2.2. La transformée réversible83
4.3. La quantification83
4.3.1. Le mode irréversible84
4.3.2. Le mode réversible86
4.4. Tier-1 : codage87
4.4.1. Organisation des échantillons88
4.4.2. Codage en plans binaires fractionnés91
4.4.2.1. Pourquoi un codage fractionné ?91
4.4.2.2. En quoi le codage est embarqué ?92
4.4.3. Les variables d'état92
4.4.4. L'algorithme général92
4.4.5. Codage arithmétique binaire93
4.5. Tier-295
4.5.1. Tag-Tree100
4.6. Synthèse101
Deuxième partie. Compression et représentation de vidéos
103
Chapitre 5. MPEG1
107
5.1. La partie système108
5.2. La partie vidéo109
5.2.1. Codage des images intra (I-images)113
5.2.2. Codage des images prédites (P-images)115
5.2.3. Codage des images bidirectionnelles (B-images)117
5.3. La partie audio118
5.3.1. L'analyse fréquentielle121
5.3.2. Le modèle psychoacoustique122
5.3.3. La quantification, le codage et le débit binaire variable122
5.3.4. Les spécificités de la couche III123
5.4. Synthèse124
Chapitre 6. MPEG2
127
6.1. La partie système128
6.1.1. Le flux de transport129
6.1.2. Le contrôle d'erreurs131
6.2. La partie vidéo131
6.2.1. La compensation de mouvement134
6.2.2. Prédiction en trames135
6.2.2.1. La prédiction en trames des P-images136
6.2.2.2. La prédiction en trames des B-trames137
6.2.2.3. La prédiction en trames des B-images137
6.2.3. La prédiction 16 x 8137
6.2.4. La prédiction dual prime138
6.2.5. La granularité139
6.2.6. Les niveaux et profils143
6.2.6.1. Les niveaux143
6.2.6.2. Les profils143
6.3. La partie audio144
6.3.1. Le mode BC144
6.3.2. Le mode AAC146
6.4. La partie DSM-CC147
6.4.1. Le modèle de référence148
6.4.2. Le contrôle des sessions et des ressources réseaux149
6.4.3. La configuration d'un client150
6.4.4. Le téléchargement vers un client150
6.4.5. Le contrôle de type VCR du flux vidéo151
6.4.6. Les services génériques pour les applications interactives151
6.4.7. Les services génériques pour les applications de télédiffusion152
6.5. Synthèse154
Chapitre 7. MPEG 4
157
7.1. Codage des données synthétiques159
7.2. Généralités sur les objets vidéo160
7.2.1. Profils et niveaux163
7.2.1.1. Catégorie 1163
7.2.1.2. Catégorie 2163
7.2.1.3. Catégorie 3164
7.2.1.4. Catégorie 4165
7.2.1.5. Catégorie 5165
7.2.1.6. Compabilité entre objets vidéo et profils165
7.3. Le codage des formes rectangulaires166
7.3.1. I-VOP166
7.3.1.1. Le mode intra de la prédiction168
7.3.2. P-VOP170
7.3.3. B-VOP170
7.3.3.1. Mode silence172
7.3.4. Le profil Simple172
7.3.4.1. L'option 4MV (4 Motion Vectors)172
7.3.4.2. L'option UMV (Unrestricted Motion Vectors)173
7.3.4.3. Les «paquets vidéo»174
7.3.4.4. Le regroupement174
7.3.4.5. Le codeur à longueur variable réversible (RVLC)174
7.3.5. Le profil Advanced Simple175
7.3.5.1. La quantification alternative175
7.3.5.2. La compensation globalde mouvement (GMC)175
7.3.6. Le profil Advanced Real-Time Simple176
7.3.6.1. La conversion dynamique de résolution177
7.3.6.2. Assigner une nouvelle prédiction177
7.4. Le codage des formes quelconques177
7.4.1. Le codage des masques alpha binaires (BAB)180
7.4.2. Le codage des macroblocs extérieurs et intérieurs180
7.4.3. Le codage des macroblocs contours180
7.4.4. La prédiction de mouvement181
7.4.4.1. Le remplissage d'un macrobloc contour de référence182
7.4.4.2. Le remplissage d'un macrobloc extérieur de référence182
7.4.5. Le profil Core182
7.4.5.1. La granularité temporelle en P-VOP184
7.4.6. Le profil Main184
7.4.6.1. Les composantes alpha184
7.4.6.2. Les panoramas186
7.4.7. Le profil Advanced Coding Efficiency188
7.4.7.1. La DCT adaptée aux formes189
7.4.8. Le profil N-Bit189
7.5. Le codage granulaire190
7.6. Le codage des images fixes192
7.6.1. L'outil VTC194
7.6.1.1. Le codage de la sous-bande d'approximation194
7.6.1.2. Le codage des sous-bandes des détails194
7.6.2. Les profils Scalable Texture et Advanced Scalable Texture195
7.7. Le codage professionnel196
7.7.1. Le profil Simple Studio197
7.7.2. Le profil Core Studio197
7.8. MPEG4 Advanced Video Coding (AVC)198
7.8.1. Macroblocs et bandes199
7.8.2. Fonctionnement général201
7.8.3. Prédiction inter202
7.8.4. Prédiction intra203
7.8.4.1. Le mode I_PCM203
7.8.4.2. Le mode Intra_4x4203
7.8.4.3. Le mode Intra_16x16205
7.8.5. Transformée et quantification205
7.8.6. Le profil Baseline206
7.8.6.1. Les bandes redondantes206
7.8.6.2. Les images IDR207
7.8.7. Le profil Main207
7.8.8. Le profil eXtended208
7.8.8.1. Les SP-bandes et SI-bandes208
7.8.8.2. Le regroupement des données211
7.9. Synthèse212
Chapitre 8. Conclusion
213
Annexes
215
A. Compléments : JPEG2000215
A.1. Variables d'état215
A.2. Propagation des valeurs significatives : SPP216
A.3. Affinage du module : MRP218
A.4. Nettoyage : CUP219
B. Complément : MPEG1221
B.1. Les critères de dissimilitude221
B.1.1. La moyenne des différences absolues221
B.1.2. La moyenne des différences quadratiques222
B.1.3. La fonction de corrélation222
B.1.4. La fonction de classification des différences absolues223
B.1.5. Comparaison223
B.2. L'algorithme de recherche du macrobloc de référence223
B.2.1. Recherche en trois sauts224
B.2.2. Recherche logarithmique227
C. Compléments : MPEG2229
C.1. Contrôle de redondance de cycles229
D. Compléments : MPEG4231
D.1. L'estimation de mouvement231
D.1.1. Estimation de mouvement au demi-pixel231
D.1.2. Estimation de mouvement au quart de pixel232
D.2. L'algorithme EZW233
D.2.1. Etiquetage234
D.2.2. Affinage234
D.2.3. Marquage235
D.2.4. Exemple235
Bibliographie
239
Notations
243
Glossaire
245
Index
249