Tema 7: Compresión de datos

Anuncio
Tema 7: Compresión de datos
Introducción.
 Métodos estadísticos.
 Métodos de diccionario.
 Compresión multimedia:




Bibliografía
[SAL10] “Handbook of Data
Compression”
Imagen
Vídeo
Audio
Arquitectura de Redes y Servicios de Telecomunicación (ARST)
Arquitectura de Redes y Servicios de Telecomunicación
Introducción

Enciclopedia

Almacenamiento
500.000 páginas de texto (2 Kb/pág.)
3.000 imágenes (640x480x24 bits)
500 mapas (640x480x16 bits)
60 minutos de audio (176 Kb/s)
30 animaciones de 2 minutos
(640x320x16 bitsx16 frames/s)
 50 vídeos de 1 minuto de media
(640x480x24 bitsx30 frames/s)






~
~
~
~
1 Gb (2:1 compres.)
2,77 Gb (15:1)
0,31 Gb (10:1)
0,63 Gb (6:1)
~ 23,59 (50:1)
~ 82,94 (50:1)
Se necesitan 111,24 Gb // Con compresión 2,95 Gb
2
Arquitectura de Redes y Servicios de Telecomunicación
Introducción

Cámara de fotos (7 megapíxeles)







Resolución: 3072x2304 pix. = 7.077.888 píxeles
Color: 24 bits / píxel = 169.869.312 bits
169.869.312 bits = 21.233.664 bytes = 21,2 MB / foto
100 fotos = 2,12 GB
En realidad cada foto suele ocupar ~ 1,4 MB
Tasa de compresión ~ 15:1
2,12 GB ~ 1.500 fotos
3
Arquitectura de Redes y Servicios de Telecomunicación
Introducción

Vídeo Full-HD (1080p)




Resolución: 1920x1080 pix. = 2.073.600 pix. / frame
Color: 12 bits / píxel = 24.883.200 bits / frame
Tasa: 50 frames / segundo = 1.244.160.000 bits / seg
¿ Cuántos GigaBytes ocuparía una película de 90
minutos?
¡¡¡840 GigaBytes!!!
4
Arquitectura de Redes y Servicios de Telecomunicación
Introducción

Ventajas de la compresión




Se necesita menos espacio para almacenar los datos
Se necesita menos ancho de banda para transmitirlos (el
ancho de banda de las redes no crece tan rápidamente
como el tamaño de los discos duros, tarjetas de memoria, .
. .)
El almacenamiento “en la nube” se beneficia de ambas
ventajas
Desventajas de la compresión


Necesitan tiempo de procesamiento para comprimir y para
descomprimir
Tiempo real vs. “off-line”
5
Arquitectura de Redes y Servicios de Telecomunicación
Introducción

Clasificación de los métodos de compresión

Lossless (sin pérdidas)
 Permiten recuperar exactamente la información original a partir de
los datos comprimidos
 Eliminan la redundancia (no es información necesaria)
 p.ej. WinRAR, WinZIP

Lossy (con pérdidas)
 No recuperan exactamente la información original
 Dependiendo de la tasa de compresión, la pérdida puede ser
inapreciable por los sentidos
 p.ej. MP3, JPEG
6
Arquitectura de Redes y Servicios de Telecomunicación
Introducción

Clasificación de los métodos de compresión

Basados en la entropía (Entropy Coding)
Entropía es la cantidad de información contenida en un mensaje
(marca el límite de la compresión)
Son de propósito general
Son codificadores sin pérdidas (p.ej. Huffman)

Basados en la fuente (Source Coding)
Se tienen en cuenta qué tipo de datos se están codificando y se
comprimen basándose en sus características
Son de propósito específico (p.ej. codecs de vídeo)
Suelen ser con pérdidas y consiguen altas tasas de compresión
7
Tema 7: Compresión de datos

Introducción.

Métodos estadísticos.
Métodos de diccionario.
 Compresión multimedia:




Bibliografía
[SAL10] “Handbook of Data
Compression”
Imagen
Vídeo
Audio
Arquitectura de Redes y Servicios de Telecomunicación (ARST)
Arquitectura de Redes y Servicios de Telecomunicación
Métodos Estadísticos

Métodos de compresión estadísticos



Utilizan VLC (Variable-Length Codes) – Códigos de
Longitud Variable
Asignan los códigos más cortos a los símbolos o
grupos de símbolos que aparecen con mayor
frecuencia en los datos originales
La probabilidad de un símbolo viene dada por el
número de ocurrencias del símbolo dividido entre el
número total de símbolos de los datos originales
9
Arquitectura de Redes y Servicios de Telecomunicación
Métodos Estadísticos

Codificación Huffman



Representa los símbolos con un número de bits
inversamente proporcional a su frecuencia
Se construye un árbol binario {0,1} de abajo hacia
arriba agrupando los símbolos de menor frecuencia y
asignando la suma de probabilidades de ambos al nodo
padre del árbol
Cada símbolo original corresponde a una hoja del árbol
y su código son los bits recorridos desde la raíz
10
Arquitectura de Redes y Servicios de Telecomunicación
Métodos Estadísticos

Codificación Huffman

Ejemplo
Codificar “TRES TRISTES TIGRES”
Solución…
19
T
R
E
S
=
=
=
=
=
I =
G =
4
3
3
4
2
2
1
0
00
100
101
01
110
1110
1111
1
11
0
1
5
0
8
0
1
6
1
0
3
1
T(4) S(4) R(3) E(3)
0
(2) I(2)
1
G(1)
11
Arquitectura de Redes y Servicios de Telecomunicación
Métodos Estadísticos

Codificación Aritmética

Identifica una secuencia de símbolos asignándole una
representación binaria de un intervalo de longitud inferior
a la unidad [0, 1)
Es más eficiente (en tasa de compresión) que la codificación
Huffman
Se acerca mucho (incluso puede llegar a coincidir) con la entropía
Es computacionalmente eficiente (aunque menos que Huffman)
Está sujeto a patentes (una gran parte son de IBM)
12
Arquitectura de Redes y Servicios de Telecomunicación
Métodos Estadísticos

Codificación Aritmética

Ejemplo
Símbolos
A
B C
D
Probabilidad 0,2 0,5 0,2 0,1
Codificar la secuencia: CBAD
0
0.2
0.7
A
B
0.7
C
0.74
0.74
A
0.76
0.88 0.9
C
0.81
B
0.754
B
D
B
A
0.744
1
0.84
A
0.74
0.9
D
0.83 0.84
C
D
0.758 0.76
C
D
Cualquier valor de dicho intervalo [0.758, 0.76] representa a CBAD
Elegimos 0,759765625 (en binario 0,110000101)
13
Arquitectura de Redes y Servicios de Telecomunicación
Métodos Estadísticos

Codificación Aritmética

Ejemplo
A
B C
D
0,2 0,5 0,2 0,1
Símbolos
Probabilidad
Decodificación de 0,759765625 (sabiendo que longitud=4)
0
0.2
A
0.7
B
0.9
C
1
D
0,7 < 0,759765625 < 0,9  letra C
(0,759765625 – 0,7) / 0,2 = 0,298828125  letra B
(0,298828125 – 0,2) / 0,5 = 0,19765625  letra A
(0,19765625 – 0) / 0,2 = 0,98828125  letra D
Resultado de la decodificación: CBAD
14
Tema 7: Compresión de datos
Introducción.
 Métodos estadísticos.


Métodos de diccionario.

Compresión multimedia:



Bibliografía
[SAL10] “Handbook of Data
Compression”
Imagen
Vídeo
Audio
Arquitectura de Redes y Servicios de Telecomunicación (ARST)
Arquitectura de Redes y Servicios de Telecomunicación
Métodos de Diccionario

Métodos de compresión basados en diccionario




Estos métodos no usan un modelo estadístico ni generan
códigos de longitud variable
Seleccionan cadenas de símbolos y codifican cada
cadena con un elemento de un diccionario
El diccionario puede ser estático (se mantiene la
correspondencia entre elementos y cadenas) o dinámico
(adaptativo)
Lo más habitual es ir creando el diccionario con los
patrones que se van encontrando en los datos
16
Arquitectura de Redes y Servicios de Telecomunicación
Métodos de Diccionario: LZW

LZW




1984 Terry Welch
Es una versión mejorada del LZ78 (Lempel-Ziv)
No utiliza la ventana de desplazamiento como
diccionario
En su lugar se va creando el diccionario con
los símbolos/cadenas que se van encontrado en
el texto
17
Arquitectura de Redes y Servicios de Telecomunicación
Métodos de Diccionario: LZW

LZW

Compresión
El diccionario se inicializa con los valores de todos los símbolos del
alfabeto de entrada (p.e. texto)
Se crea una cadena C con la primera letra del texto a codificar
Como dicha cadena C sí se encuentra en el diccionario entonces le
concatenamos a C la siguiente letra del texto
Se busca C en el diccionario y como no se encuentra (ya que C
tiene ahora 2 letras) entonces se almacena C en el diccionario como
una nueva entrada.
La cadena C menos la última letra añadida sí estaba en el
diccionario por lo que la salida del codificador será el índice
(posición) donde se encontró C sin la última letra añadida
Ahora se guarda en C únicamente la última letra añadida
Si C está en el diccionario se le añade la siguiente letra del texto y
se vuelve a hacer la búsqueda
18
Arquitectura de Redes y Servicios de Telecomunicación
Métodos de Diccionario: LZW

LZW

Compresión
 Mientras se vaya encontrando C en el diccionario se le concatenará
una letra más
 En el momento que al añadir una letra a C, ésta no se encuentre,
entonces se añadirá una entrada al diccionario y se enviará la
posición (índice) de la cadena que hasta el momento sí se había
encontrado
 Descompresión
Se parte del mismo diccionario inicial y se van leyendo los símbolos
del texto codificado
Cuando al concatenar varios símbolos la cadena resultante no
exista en el diccionario entonces se añade una nueva entrada
El diccionario se va llenando idénticamente a como se hace en el
proceso de compresión por lo que tendremos disponibles las
entradas nuevas del diccionario cuando sean necesarias.
19
Arquitectura de Redes y Servicios de Telecomunicación
Métodos de Diccionario: LZW
Texto: “TO BE OR NOT TO BE OR TO BE OR NOT”

LZW: Ejemplo compresión
20
Arquitectura de Redes y Servicios de Telecomunicación
Métodos de Diccionario: LZW

LZW: Ejemplo descompresión
21
Arquitectura de Redes y Servicios de Telecomunicación
Métodos de Diccionario: LZW

LZW

Limitaciones
Tenemos un número limitado de entradas en el diccionario (según
el número de bits usados para el índice) por lo que el diccionario se
puede “llenar”
Las cadenas del diccionario se incrementan en un solo símbolo cada
vez (el “llenado” es lento)
La búsqueda en el diccionario puede ralentizar el tiempo de
compresión
 Existen variaciones e implementaciones del LZW que solucionan
estos aspectos y que crean diccionarios donde las búsquedas e
inserciones sean eficientes
22
Arquitectura de Redes y Servicios de Telecomunicación
Métodos de Diccionario: LZW

Más métodos de compresión basados en
diccionario


LZ78, LZSS, LZPP, LZX, LZFG, LZRW1, LZRW4, LZC,
LZMW, LZAP, LZJ, LZY, LZP, LZMA, ...
RAR (WinRAR), GIF, XMill, QIC-122, Gzip, 7-zip, PNG, ...
23
Tema 7: Compresión de datos
Introducción.
 Métodos estadísticos.
 Métodos de diccionario.


Bibliografía
[SAL10] “Handbook of Data
Compression”
Compresión multimedia:
 Audio


Imagen
Vídeo
Arquitectura de Redes y Servicios de Telecomunicación (ARST)
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Audio

Audio digital



Señal de audio = onda acústica = variaciones de presión
del aire
Un micrófono transforma las variaciones de presión del
aire en señales eléctricas (señal unidimensional)
PCM (Pulse Code Modulation) – dicha señal
(analógica) se muestrea con una frecuencia y con un
número de bits/muestra (error implícito)
Teorema de Nyquist: para señales cuya frecuencia máxima sea
f, la frecuencia de muestreo debe ser 2f

Rango de frecuencias audibles: 20Hz – 20KHz
25
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Audio

Codificación diferencial

DPCM (Differential Pulse Code Modulation)
Explota la redundancia temporal de la señal de audio
Se envía la diferencia entre muestras (bastante menor)
Problema con las frecuencias altas: necesitan más bits de lo
normal ya que la diferencia puede ser mayor que la muestra

ADPCM (Adaptive Differential Pulse Code
Modulation)
Codifica la diferencia entre la muestra actual y una estimación
basada en las últimas n muestras
Para altas frecuencias aumenta n y para bajas frecuencias
disminuye n (adaptativo)
64 Kbps  32 Kbps
26
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Audio

Codificadores con pérdidas

Características
Utilizan la psico-acústica para eliminar o reducir aquella
información que nuestro sistema auditivo no puede percibir.
– Frequency masking (o auditory masking): un sonido fuerte
en una determinada frecuencia sube el umbral mínimo de
intensidad para las frecuencias adyacentes por lo que podría
enmascarar a otros sonidos (y podríamos eliminarlos)
– Temporal masking: un sonido fuerte puede enmascarar a
otros sonidos temporalmente cercanos (y podríamos
eliminarlos)
El umbral de intensidad mínimo que podemos percibir
depende de la frecuencia del mismo. Si un sonido (con una
determinada frecuencia) no alcanza el umbral mínimo, se
puede eliminar sin que el audio pierda calidad.
27
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Audio

Codificadores MPEG

MPEG-1 (1993)
 Coding of moving pictures and associated audio for
digital storage media at up to about 1,5 Mbit/s
Consta de 5 partes
Parte 2: Vídeo
Parte 3: Audio (2 canales de audio)
– Layer I  .mp1 / .m1a
– Layer II  .mp2 / .m2a
– Layer III  .mp3
– Frecuencias de muestreo soportadas: 32, 44.1, 48 KHz
– Tasas de bits: 32, 48, 56, 64, 80, 96, 112, 128, 160,
192, 224, 256, 320, 384 Kbps
28
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Audio

Codificadores MPEG

MPEG-2 (1995)
 Generic coding of moving pictures and associated audio
 Consta de 11 partes
Parte 2: Vídeo  DVD, DVB- (-C/cable, -S/satélite, -T/TDT)
Parte 3: Audio (5.1 canales de audio: 5+1 de efectos)
– Layer I / Layer II / Layer III (extensiones de MPEG-1)
– Frecuencias de muestreo: MPEG-1 + 16, 22.05, 24 KHz
– Tasas de bits: MPEG-1 + 8, 16, 24, 40, 48, 144 Kbps
Parte 7: AAC – Advanced Audio Coding
– Mejor calidad que MP3 a las mismas tasas de compresión
– Soporta hasta 48 canales de audio
– iPhone, iPod, iPad, Nintendo DSi, iTunes, PlayStation 3, Wii,
Sony Ericsson, Nokia, Android, BlackBerry, Flash Player, ...
29
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Audio

Codificadores MPEG

MPEG-4 (1998)
 Coding of audio-visual objects
 Consta de 29 partes
Parte 2: Vídeo (MPEG-4 Part 2 = MPEG-4 Visual)  DivX
Parte 3: Audio  AAC – Advanced Audio Coding (extensión de
MPEG-2 Parte 7) (.mp4/.m4a/.m4p)
– Frecuencias de muestreo: de 8 a 96 KHz
– Tasas de bits: de 24 a 256 Kbps (96 Kbps)
Parte 10: AVC – Advanced Video Coding (H.264 / AVC)
Parte 14: MP4 File Format (formato contenedor)
30
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Audio

Otros codificadores

Lossless (sin pérdidas)
FLAC, ALAC, DST, MPEG-4 SLS, ATRAC Advanced Lossless, WMA
Lossless, OSQ, Dolby TrueHD, Monkey’s Audio, ...

Lossy (con pérdidas)
OGG Vorbis, Microsoft WMA, Dolby AC-3, Musepack, ATRAC, ...
31
Tema 7: Compresión de datos
Introducción.
 Métodos estadísticos.
 Métodos de diccionario.


Bibliografía
[SAL10] “Handbook of Data
Compression”
Compresión multimedia:

Audio
 Imagen

Vídeo
Arquitectura de Redes y Servicios de Telecomunicación (ARST)
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Imagen digital

Características de la imagen
Las imágenes que percibimos están compuestas de ondas
electromagnéticas (: 250nm - 780nm)
A diferentes longitudes de onda, diferentes sensaciones de
color
Mezclando tres colores (R, G, B) podemos obtenerlos todos
Una cámara fotográfica digital utiliza un CCD (ChargeCoupled Device) para la captura analógica de la imagen
– El CCD tiene pequeños diodos sensibles a la luz que la
convierten en impulsos eléctricos
– A cada diodo se le añade un filtro (R ó G ó B) para
obtener la intensidad de color por componentes
33
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Imagen digital: Espacio de color RGB
34
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Imagen digital: Espacio de color YCbCr
35
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Compresión de imagen

Proceso de compresión
Eliminar (reducir) la redundancia espacial (p.ej. fondos
uniformes) basándose en source coding (mediante una
transformada)
Codificar los datos obtenidos en el paso anterior mediante
entropy coding
Para conseguir altas tasas de compresión el proceso se
realiza con pérdidas (lossy)
36
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Codificación JPEG

Estándar JPEG (1992)
Método desarrollado para comprimir imágenes del mundo real
(fotografía digital)
Compresión con pérdidas (tiene también un modo lossless)
Sistema de codificación simétrico
.jpg, .jpeg, .jpe, .jfif, .jif
Ampliamente usado en cámaras digitales, en la web, ...
Un fichero .mp3 puede llevar incrustado una imagen JPEG
como carátula
Su sucesor: JPEG2000
37
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Codificación JPEG

Esquema estándar JPEG
Codificación fuente
Imagen
original (RGB)
Prep. de
bloques
DCT
Cuantiz.
Codificación entrópica
Run
Length
Tabla

Huffman
Imagen
codificada
Tabla
Paso 1: Preparación de bloques
Se convierte la imagen a YCbCr con subsampling 4:1:1
– p.ej. RGB 640x480 (VGA)  Y (640x480) Cb y Cr (320x240)
Se divide la imagen en bloques de 8x8 píxeles
– p.ej. 4800 bloques Y, 1200 bloques Cb, 1200 bloques Cr
38
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Paso 2: Transformada Discreta del Coseno (DCT)




Transforma los datos (amplitudes) del dominio espacial al
dominio de la frecuencia
Se aplica la transformada a cada bloque de 8x8
El componente (0,0) DC es el valor de la media del bloque
El resto indican el valor de las frecuencias encontradas
Coeficiente
DCT
Amplitud
x
y
Transformada
DCT
Fx
Fy
39
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Paso 3



Cuantización (quantization) mediante la división por una
tabla (luminancia y crominancia usan tablas distintas)
Se eliminan los coeficientes menos significativos
Se pueden escalar las tablas con el parámetro Q (que
permite así ajustar la tasa de compresión)
150
88
21
4
1
0
0
0
70
56
34
6
0
1
0
0
38
22
12
3
5
0
0
0
16
32
4
7
0
0
0
0
4
2
0
0
2
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
Coeficientes DCT
0
0
0
0
0
0
0
0
/
1
1
2
4
8
16
32
64
1
1
2
4
8
16
32
64
2
2
2
4
8
16
32
64
4
4
4
4
8
16
32
64
8
8
8
8
8
16
32
64
16
16
16
16
16
16
32
64
32
32
32
32
32
32
32
64
64
64
64
64
64
64
64
64
Tabla de cuantización
=
150
88
10
1
0
0
0
0
70
56
17
1
0
0
0
0
19
11
6
1
0
0
0
0
4
8
1
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Coeficientes cuantizados
40
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Paso 4: Codificación componente DC

Codificación DPCM de los componentes DC (0,0) de cada
bloque
Los bloques sucesivos tienen un valor medio muy similar

Paso 5: Codificación RLE coeficientes DCT

150
88
10
1
0
0
0
0
Se recorre el bloque en zig-zag para agrupar los valores nulos
70
56
17
1
0
0
0
0
19
11
6
1
0
0
0
0
4
8
1
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
150-70-88-10-56-19-4-11-17-1-0-1-6-8-0-0-0-1-1-0-0-0-0-0-2-..(39 0’s)
150-70-88-10-56-19-4-11-17-1-0-1-6-8-A0/3-A1/2-A0/5-2-A0/39
41
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Paso 6: Codificación Huffman (VLC)
El resultado del paso anterior se codifica mediante Huffman
 Los datos obtenidos son la imagen codificada


Decodificación JPEG

Se decodifica aplicando los pasos inversos
Inverse
Quantization
Zig-zag
ordering
Run-length
decoder
Inverse
DCT
Huffman
decoder
110001110011100010…..
42
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Imagen

Codificación JPEG

Comparación tasas de compresión
2,6:1
46:1
15:1
23:1
144:1
43
Tema 7: Compresión de datos
Introducción.
 Métodos estadísticos.
 Métodos de diccionario.


Bibliografía
[SAL10] “Handbook of Data
Compression”
Compresión multimedia:


Audio
Imagen
 Vídeo
Arquitectura de Redes y Servicios de Telecomunicación (ARST)
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Video

Video digital




Vídeo = secuencias de imágenes
Vídeo entrelazado (líneas impares / líneas pares)
Vídeo progresivo (imágenes completas)
Características del vídeo
Redundancia espacial (en cada cuadro)
– Técnicas de compresión de imágenes aisladas
Redundancia temporal (cuadro a cuadro)
– Motion estimation / Motion compensation
45
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Video

Compresión de vídeo (MPEG)

Cuadro auto-contenido (intracoded frame)
No se construye a partir de ningún otro

Cuadro de referencia (reference frame)
Se utilizan para construir otros frames (intercoded frame)

Macrobloque (macroblock)
16x16 píxeles (6 bloques de 8x8  4 Y, 1 Cb, 1 Cr)
F1
F2
F3
46
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Video

Compresión de vídeo (MPEG)

Vectores de movimiento (motion vectors)
Identifican el desplazamiento de un macrobloque en el cuadro actual
respecto a la posición que tenía en el cuadro de referencia
Vector de movimiento
Δx = -20, Δy = 0
Cuadro de referencia
Macrobloques
idénticos
F1
F2
47
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Video

Compresión de vídeo (MPEG)

Búsqueda de macrobloques
Se buscan los macrobloques del cuadro actual en el cuadro
de referencia
Si se encuentra exactamente, sólo se codifica el vector de
movimiento
Si no, se elige el más parecido y se codifica el vector de
movimiento y la “diferencia” de macrobloques igual que JPEG
(DCT, cuantización, RLE+VLC en zigzag) (macrobloque
INTER)
Si no se encuentra ninguno parecido entonces se codifica
como JPEG (macrobloque INTRA)
48
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Video

Compresión de vídeo (MPEG)

Tipos de cuadros
Tipo I (intracoded frames) (poca compresión)
– Cuadro autocontenido usando JPEG
Tipo P (predictive frames) (más compresión)
– Cuadro basado en las diferencias con un cuadro anterior
Tipo B (bidirectional frames) (mayor compresión)
– Interpolación con un cuadro anterior y otro posterior
Cuadro de tipo I
autocontenido
F1
Macrobloque
encontrado!!
Cuadro de tipo B
basado en F1 y F3
F2
Cuadro de tipo P
basado en F1
Macrobloque
encontrado!!
F3
49
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Video

Secuencias de cuadros (Group Of Pictures)


Los cuadros de tipo I son los menos comprimidos, a
continuación los de tipo P y por último los que más
compresión obtiene son los de tipo B.
Secuencias típicas:
IBBBPBBBI
IBBPBBPBBI (PAL)
IBBPBBPBBPBBI (NTSC)
I
B
B
P
B
B
P
B
B
I
50
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: Video

La importancia de los cuadros de tipo I.

En un sistema de vídeo es habitual el usar los controles de
avance, retroceso, pausa, etc.
Si queremos detener la secuencia de vídeo, necesitamos encontrar
el último cuadro I para reconstruir el cuadro donde se ha detenido
la imagen.



Sirven como puntos de sincronización.
Se estima que deben aparecer al menos un cuadro I cada
300-400 ms.
Si se está difundiendo una secuencia de vídeo comprimida
(TV broadcast, videoconferencia, etc)
Permite “engancharse” rápidamente y recuperarse ante la
recepción de algún cuadro dañado.
51
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: MPEG Video
MPEG: Conjunto de estándares ISO para la
grabación y transmisión digital de audio y vídeo.
 Varias versiones MPEG:


MPEG-1 (ISO 11172) (‘91):
CD-ROM vídeo (1,5 Mbps).

MPEG-2 (ISO 13818) (‘93):
TV Broadcast (4-6 Mbps).
HDTV (25-34 Mbps).

MPEG-4 (ISO 14496) (‘99):
Originalmente: Videoconferencia (4,8 a 64 Kbps).
Enfoque universal de tratamiento de elementos multimedia.


MPEG-7 (‘04): Descripción de contenido multimedia (videodb)
MPEG-21 (01-?): Uso transparente de contenido multimedia
entre redes y usuarios heterogéneos.
52
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: MPEG Video

MPEG-1 (ISO 11172) (‘91)



MPEG-Vídeo (IS 11172-2)
MPEG-Audio (IS 11172-3) (Tema siguiente)
MPEG-System (IS 11172-1):
Multiplexado y sincronización.

MPEG-Conformance Testing (IS 11172-4)
Patrones de prueba, medida de calidad, etc

MPEG-Software Coding (IS 11172-5)
Directrices para la codificación de los algoritmos.

Propósito de MPEG-1

Almacenamiento en CD-ROM de audio (calidad CD) y vídeo
(calidad VCR) sincronizado (1,5 Mbps).
53
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: MPEG Video
MPEG-2 (ISO 13818) (‘93)
 Propósito:




Aplicación:


Mejorar la calidad de imagen respecto al anterior sin
incrementar excesivamente la tasa de bits requerida
Calidad de vídeo profesional (studio-quality) y HDTV
Difusión de señales de TV, HDTV, VOD, DVD
La codificación/decodificación es muy similar a la
de MPEG-1 salvo algunas diferencias:



No se incluyen cuadros de tipo D.
Permite bloques de 16x8 para vídeo entrelazado.
Otras mejoras (permite DC de hasta 10 bits, cuantización no
lineal, nuevas tablas VLC, escalabilidad SNR y multiresolución)
54
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: MPEG Video
MPEG-4 (ISO 14496) (‘99)
 Propósito:



Diseño de aplicaciones multimedia interactivas distribuidas.
Aplicación:

Televisión digital, DVD, HDTV.
Compatibilidad con MPEG-2 (backware compatibility)

Aplicaciones multimedia interactivas
El usuario puede interaccionar con los objetos multimedia de la
sesión.

Distribución de información multimedia (i.e. WWW)
A través de una red, se permitirá el acceso y distribución a
información multimedia, facilitando su diseño y presentación.
55
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: ITU Video

H.261 pertenece al conjunto de estándares
H.320 de ITU dedicados a videoconferencia
sobre RDSI (‘98)








H.320: Definición de la familia de estándares
H.221: Multiplexado, sincronización sobre uno o varios
canales RDSI y empaquetamiento (framming).
H.242/H.230: Establecimiento y control de sesión.
H.224/H.281: Control remoto de cámaras.
H.233 y H.234: Cifrado y autenticación de los datos.
T.120: Soporte para aplicaciones (transferencia de
imágenes, anotaciones compartidas, etc.)
G.711, G.72x ...: Algoritmos de compresión de audio
H.261: Compresión de vídeo (conocido como px64).
56
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: ITU Video

H.263 (‘96): Mejora, amplía y sustituye al H.261







H.264 (´98): Mejora la eficiencia en codificación


De propósito general (no sólo para videoconferencia)
Incluye compensación de movimiento de “medio-píxel”
Soporta cinco resoluciones (SQCIF, QCIF, CIF, 4CIF y 16CIF)
Permite estimación de movimiento bidireccional y sin
restricción en el tamaño de la ventana de búsqueda
Escalabilidad SNR, espacial y temporal
Predicción de los valores de los coeficientes de la DCT
DCT con enteros (bloque 4x4), compensación de movimiento
con bloques de tamaño variable, etc.
H.265/HEVC (‘12): Evolución natural del H.264

Mayor número de modos de predicción tanto INTRA como
INTER, bloques de tamaño variable hasta 64x64, mejoras
generales en las etapas del codificador.
57
Arquitectura de Redes y Servicios de Telecomunicación
Compresión multimedia: ITU Video
Comparación subjetiva H.264 vs HEVC
58
Descargar