Tema 3. Gestión de proyectos de desarrollo multimedia y sistemas

Anuncio
Tema 3. Gestión de proyectos de desarrollo
multimedia y sistemas web.
Elementos de diseño.
Contenido dinámico
30258- Diseño Centrado en el Usuario.
Diseño para la Multimedia
Dra. Sandra Baldassarri
Objetivos
Desarrollo de proyectos multimedia y sistemas web
utilizando técnicas de diseño centrado en el usuario.
• Características de las aplicaciones multimedia y web
• Definición de elementos multimedia:
–
–
–
–
Texto
Imagen / Gráficos
Audio
Video / Animaciones
• Algunas consideraciones prácticas:
– Diseño para web. Guías de estilo.
Aplicaciones Multimedia
Multimedia o hipermedia (no sólo texto):
• Sistemas hipertexto + medios adicionales
– Ilustraciones, fotografías, videos, sonidos, etc…
• Enlaces y “hotspots” pueden formar parte de los
medios
– Áreas de imágenes
– Tiempos y ubicaciones en los videos
• El contenido puede ser:
– Estático
– Dinámico (basado en tiempo)
30258 – Diseño Centrado en el Usuario –
Diseño para la Multimedia
Contenido Dinámico: Audio
Existen dos tipos fundamentales de sonido:
- Habla
- Otros sonidos
El tratamiento digital del habla cubre tres aspectos:
 Codificación del habla: para la comunicación entre
personas, relacionado con la conversión A/D y la
compresión de la señal digital.
 Síntesis del habla: para la comunicación entre máquina y
persona
 Reconocimiento y comprensión del habla: para la
comunicación entre persona y máquina
Audio
Otros sonidos:
El sonido audible consiste en ondas sonoras que se
producen cuando las oscilaciones de la presión del
aire se convierten en vibraciones detectadas por el
oído humano. Estas vibraciones se convierten en
impulsos nerviosos que son percibidos por el cerebro.
El oído humano detecta frecuencias de sonido entre
20Hz y 20kHz.
Audio: digitalización
Conversión
Analógico/Digital
A sound wave, in red, represented digitally, in blue
(aftersampling and 4-bit quantization).
Audio: digitalización
• A partir de micrófono, sintetizador, grabaciones en
cinta, emisiones en vivo de radio y TV, CDs y discos.
• Los sonidos digitalizados son muestras de sonido.
Cada enésima fracción de segundo se toma una
muestra y se guarda como información en bits o
bytes.
Audio: digitalización
• Velocidad de muestreo: frecuencia con que se
toman las muestras. Las velocidades de muestreo
más usadas son: Calidad CD 44.1 kHz, 22.05 kHz y
11.025 kHz.
• Tamaño de la muestra: cantidad de información
almacenada de cada muestra. Los tamaños de
muestras más usados son: 8 y 16 bits.
Audio: digitalización
El valor de cada muestra se redondea al entero más
próximo (cuantización) y si la amplitud es más grande
que el intervalo disponible se hace un recorte
(clipping) de la parte alta o baja de la onda .
Audio: digitalización
El ruido en la cuantización se puede suavizar mediante
el dithering agregando ruido al azar para suavizar
transiciones.
Audio digital
• Representación real de un sonido, almacenado en
forma de miles de números individuales llamados
muestras.
• Los datos digitales representan la amplitud
instantánea (volumen) de un sonido en períodos
pequeños de tiempo.
• Ocupan mucho espacio, pero no son dependientes
del dispositivo.
MIDI
• Estándar de comunicaciones para instrumentos
musicales electrónicos y computadoras (1980).
• Permite la comunicación entre la música y los
sintetizadores de sonido de diferentes fabricantes
enviando mensajes.
• Protocolo para pasar descripciones detalladas de
una partitura musical como notas, secuencias de
notas e instrumentos.
• Lista de órdenes de grabaciones de acciones
musicales que, cuando se envían a un dispositivo de
reproducción MIDI, produce sonido. No es sonido
digitalizado.
MIDI
QuickTime incorpora una funcionalidad “tipo-MIDI”.
Las pistas de MIDI se pueden combinar con audio, con
video u otro tipo de medios suportados por QuickTime.
Compresión de audio
El sonido es más difícil de comprimir que las imágenes,
especialmente utilizando métodos de compresión sin
pérdidas.
A grandes rasgos, la compresión de audio puede hacerse:
– Dominio del tiempo: más fáciles de implementar pero requieren
más de 10 bits de muestra
– Dominio de frecuencias: utilizan 3 bits por muestra y se basan en
la percepción auditiva y en el enmascaramiento psicoacústico.
Existen numerosas técnicas de compresión, con y sin
pérdidas, las más comunes son las que se basan en la
codificación diferencial.
Compresión de audio
Hay tres esquemas de codificación diferencial:
• DPCM
• Modulación delta
• ADPCM
Compresión de audio
DPCM = Simple Differential Pulse Code Modulation
Se toma como valor siguiente la diferencia con el valor
de la señal en el instante anterior.
señal inicial
señal codificada mediante DPCM
amplitud
amplitud
T
tiempo
se necesitan menos bits
para codificar la diferencia
tiempo
Modulación Delta
Modulación delta
Es una forma particular de codificación DPCM en la cual la
diferencia entre el valor actual y el valor siguiente se codifica
con un solo bit. Este bit indica si el valor de la señal se
incrementa o se decrementa en un “quantum”. Esta técnica es
adecuada para señales cuyos valores no cambian muy
rápidamente para una frecuencia de muestreo dada.
señal inicial
señal codificada mediante
delta modulation
amplitud
amplitud
T
tiempo
tiempo
ADPCM
ADPCM = Adaptive Differential Pulse Code Modulation
Es una versión sofisticada del método DPCM. En lugar
de usar una función de predicción constante, la
estimación varía adaptándose a las características de
la señal. El valor siguiente se obtiene extrapolando
los valores anteriores de la señal.
Compresión de audio
LPCM (Linear PCM):
• Variante de PCM que realiza compresión lineal. Se
utiliza en el formato WAV.
Mnidisc:
• Variante de ADPCM que elimina ciertos componentes
que no son audibles porque quedan enmascarados
mu-law/A-law:
• Sistema de compresión no lineal que permite utilizar
resolución a 8 bits pero ofrece una calidad sonora
próxima a 14 bits. Más rápido que ADPCM. Se utiliza en
telefonía.
MPEG1 Layer 3 (mp3)
• En 1997 el Instituto Fraunhofer ideó un codec capaz
de comprimir audio sin pérdida de calidad apreciable.
En 1992 MPEG aprobó la tecnología y nació el MP3
(MPEG-1 Audio Layer 3).
• Permite compresiones de 12:1 y superiores.
• No pierde calidad de sonido de forma apreciable (por
un oído no entrenado).
• mp3 utiliza unos cuantos trucos para comprimir el
sonido, aprovechando la manera en la que el oído
humano percibe el sonido.
MPEG1 Layer 3 (mp3)
• Se basa en las limitaciones del oído humano, que sólo es
capaz de captar las frecuencias entre 20Hz y 20 kHz y es
más sensible entre 2 y 4 kHz. De esta forma elimina las
frecuencias inaudibles conservando la esencia del sonido.
• Al obtener un MP3 se puede seleccionar la codificación y
compresión que se desea (nivel de calidad).
A 128kbits/44kHz estéreo se consigue un buen equilibrio
entre calidad y compresión. Es el nivel por defecto en los
compresores disponibles en la red.
• Se han realizado estudios de percepción para verificar la
calidad obtenida.
MPEG1 Layer 3 (mp3)
• Umbral mínimo de audición
– No es lineal, el margen de percepción real es menor que el teórico
 Cualquier sonido fuera no es necesario codificarlo
• Efecto máscara
– Los sonidos fuertes no dejan oír los débiles  éstos se filtran
– Existe máscara temporal cuando no se percibe un sonido antes o
después de un sonido más fuerte
• Reserva de bytes
– Partes más comprimidas dejan espacio a las menos comprimibles
para mantener el flujo constante (VBR)
• Fusión de estéreo
– En determinadas frecuencias el oído no percibe el punto de
emisión del sonido
MPEG1 Layer 3 (mp3)
• Su utilidad:
– En un CD de 80 minutos caben 80 minutos de música en formato
CD-Audio y 700 minutos de música en formato MP3 (unos 11
CD’s de audio) - estéreo con calidad 16 bits a 44hHz codificada
en MP3 a 128kb/seg.
• Programas reproductores:
– WinAmp, RealOne Player, Music Match Jukebox, Windows
Media Player, Quicktime, Flash,…
• Para generar MP3 a partir de CD-Audio:
– Musicmatch Jukebox, Real Jukebox, EasyMP3,...
• Un CD con MP3 sólo se podrá escuchar en equipos
reproductores compatibles.
Formatos de audio
Dolby Digital
• AC-3: es la versión más común, con 6 canales: 5.1
– 5 canales de ancho de banda completa (20 Hz a 20 kHz) +1
canal exclusivo para los sonidos de baja frecuencia (subwoofer)
– Compresión perceptual
• Dolby Digital EX / DD Sorround EX: 6.1
• Dolby Digital Live (DDL): 5.1, tiempo real, videojuegos,
…
• Dolby Digital Plus (E-AC-3): 13.1
• Dolby TrueHD: hasta 14 canales para HD DVD y Blu-ray
Formatos de audio
AAC (MPEG-4 Advanced Audio Coding)
• Este códec está orientado a usos de banda ancha y se
basa en la eliminación de redundancias de la señal
acústica, así como en compresión mediante la
transformada de coseno discreta modificada (MDCT), y
en utilizar VRB, muy parecido a MP3.
– Produce una mejor calidad que MP3 en archivos pequeños y
requiere menos recursos del sistema para codificar y
descodificar.
• Formato elegido por Apple para iPods y para iTunes.
También es utilizado por Ahead Nero, Winamp y
Nintendo DSi.
Formatos de audio
AAC (MPEG-4 Advanced Audio Coding)
Formatos de audio
AAC (MPEG-4 Advanced Audio Coding)
• Ventajas con respecto a MP3
– El formato AAC soporta sonido multicanal lo cual resulta un códec de
audio apropiado para el sonido envolvente de 6 o más altavoces. MP3
sólo permite, en su formato base, sonido estéreo.
– Puede alcanzar una frecuencia de muestreo de 96khz, utilizado en
estudios de grabación. MP3 está diseñado sólo para la reproducción y
para alcanzar hasta 48khz.
– La calidad de sonido es considerablemente superior al mismo bitrate.
Un archivo de audio en AAC-HC codificado a 64kbps puede ofrecer una
calidad similar a un MP3 codificado a 128kbps.
– Incluso a bitrates muy bajos (<32kbps) el sonido sufre poca pérdida en
comparación con el MP3 (útil para codificar ficheros de audio de
tamaño muy pequeño o para codificar diálogos)
Formatos de audio
WAV: Formato Waveform
• Es el más usado y soportado por plataformas Windows.
• Almacena información sobre el número de pistas (mono o
estéreo), frecuencia de muestreo, profundidad de bits,
igualmente que datos raw de audio no comprimidos.
• La codificación más usual utiliza el formato “Linear Pulse
Code Modulation” (LPCM)
• La calidad depende de la combinación de parámetros
seleccionada:
– resolución o tamaño de la muestra (8, 16, 20, 24 bit, etc), frecuencia de
muestreo (e.g. 8000, 11025, 16000, 22050, 24000, 32000, 44100,
48000 Hz / “muestras por segundo", etc), signo (con o sin), número de
canales (monaural, estéreo, cuadrafónico, etc), orden de los bits (little
endian, big endian).
Formatos de audio
Otros formatos
• AU: Formato NeXT/Sun. Multiplataforma
• VOX: Útil para grabaciones de voz. Alto grado de
compresión (50:1) pero con baja calidad.
• AIFF: Formato Audio Interchange Format, de Apple.
Sin compresión.
• TSP: Formato TrueSpeech de DSP. Muy buena
calidad, compresión 15:1
Formatos de audio
Otros formatos
• GSM: Esquema de compresión para voz,
originalmente para teléfonos celulares, que ha
ganado uso en aplicaciones de telefonía en Internet.
• RA: Formato Progressive Networks Real Audio. Muy
popular. Compresión 20:1.
• OGG Vorbis (GNU). Basado en streaming. Muy
buena calidad (mejor que mp3). Las películas con
audio OGG llevan extensión OGM.
• WMA (Windows Media Audio). Sonido Sorround.
También basado en streaming.
Audio: Herramientas de Autor
Son numerosas las herramientas que permiten trabajar
con sonido digital:
• Plataformas Windows: Cool Edit, Goldware,
WaveEdit, Stereo Studio FX
• Plataformas Mac: Sound Edit Pro, Alchemy y Audio
Track
• Profesionales: Sonic Foundry’s Sound Fong (PC),
Digidesign’s Pro Tools (Mac)
• Y otros como: FreeAmp, WinAmp, PhatNoise,
FreeRIP MP3
Audio: Herramientas de Autor
Las operaciones básicas de edición de sonidos que se
necesitan en las producciones multimedia son:
–Recortes
–Uniones
–Ajustes de volumen
–Conversión de Formatos
–Remuestreo y muestreo a baja velocidad
–Desvanecimiento
–Ecualización
–Ajustes de tiempos
–Procesamiento digital de señales
–Sonido a la inversa
Contenido Dinámico: Vídeo
Secuencia de frames representados por imágenes en
formato de mapa de bits.
La tecnología de soporte, edición y almacenamiento
de vídeo ha evolucionado mucho en los últimos años.
Actualmente la mayor parte de los dispositivos
portátiles como móviles, ordenadores, etc. llevan
incorporadas cámaras de vídeo.
Vídeo: Estándares
Las cámaras de vídeo digital actuales deben mantener
la compatibilidad con los estándares que rigen la TV.
Aunque el alcance y adopción de la HDTV sigue en
aumento, los estándares de vídeo digital heredan
algunas características esenciales de los sistemas
broadcast de TV analógicos como: tamaño de los
frames, frame rate, etc…
Por lo tanto, es necesario conocer las bases
fundamentales de los sistemas analógicos.
Vídeo: Estándares
Fundamentos del vídeo analógico. Parámetros:
 Número de imágenes por segundo que se utilizan para
representar el movimiento.
 Relación de aspecto: número de líneas horizontales en
relación con el número de líneas verticales.
 Método de Codificación del Color o Formatos de Señal
 Métodos de codificación del color sobre la señal: ancho de
banda, modulación en amplitud, modulación en frecuencia,
modulación en fase.
Vídeo: Estándares
Los formatos de difusión estándares son: PAL, NTSC,
SECAM y HDTV.
PAL: 25 fps, 625 líneas, 4:3 ,YUV, Subp: AM.
NTSC: 30 fps, 525 líneas, 4:3, YIQ, Subp: AM.
SECAM: 25 fps, 625 líneas, 4:3, YUV, Subp: FM.
HDTV: 30 fps,1125 líneas, 16:9.
Vídeo: Estándares
Relación de aspecto:
Número de líneas horizontales en relación con el número de
verticales.
-
El formato estándar de televisión analógica es 4:3
Los televisores panorámicos y de alta definición tienen relación 16:9
En cine las relaciones de aspecto más usadas son 1.85:1 y 2.39:1.
En fotografía las proporciones más usadas son 4:3 y 3:2
Los ordenadores suelen usar relación 4:3 o 5:4 (16:10 en portátiles)
Vídeo: Estándares
PAL: 25 fps, 625 líneas, 4:3 ,YUV, Subp: AM.
Cada frame tiene 625 líneas, de las cuales 576 forman
la imagen, que se muestra en 25 frames por segundo.
NTSC: 30 fps, 525 líneas, 4:3, YIQ, Subp: AM.
Cada frame tiene 525 líneas, de las cuales 480 forman
la imagen y se muestran en 29.97 frames por
segundo.
Vídeo: Estándares
HDTV: 30 fps,1125 líneas, 16:9
Transmisión de la señal de color: YCrCb
Y = 0,299R + 0,587G + 0,114B
R-Y = 0,701 R - 0,587 G - 0,114 B
B-Y = 0,886 B - 0,299 R - 0,587 G
Resolución: 1280x720 píxeles en barrido progresivo
(720p) o 1920x1080 píxeles en barrido entrelazado
(1080i)
Recepción e interactividad: Teletexto digital basado en
XHTML y CSS. Para servicio interactivo se requiere un
canal de retorno a través de conexión a Internet.
Vídeo: Estándares
En los sistemas analógicos la codificación del color se
realiza siempre por componentes, en codificaciones
derivadas de Y/R-Y/B-Y.
Codificación YUV
Vídeo: Estándares
Los métodos de codificación del color o formado de la señal
pueden ser:
– Señal por componentes: mantiene la información del color
separada en sus tres valores (codificación RGB o Y/R-Y/B-Y)
– Señal Super-Vídeo o YC: los dos canales que llevan la
información del color se combinan en uno llamado crominancia.
– Señal de vídeo compuesto: los dos canales Y/C se combinan
en una sola señal, con lo que el ancho de banda de una de ellas
debe reducirse. Puesto que el ojo es más sensible a los
cambios en luminancia que en crominancia, se deteriora esta
última.
Vídeo: Estándares
En vídeo digital el número de colores distintos que se
pueden representar en un pixel depende del número
de bits por pixel (bpp).
Vídeo: Estándares
CCIR 601 define el estándar de muestreo de vídeo
digital, con 720 muestras de color y 2 x 360 muestras
de diferencia de color por línea:
Y CBCR con muestreo 4:2:2
Los frames de PAL son 720x576
y NTSC 720x480.
Los pixels no son cuadrados.
Vídeo digital: Estándares
DV (DVCAM, DVPRO)
• Aplica muestreo de color 4:1:1
• Comprime a un ratio constante de 25 Mbits por
segundo
• Obteniendo una proporción de compresión de 5:1.
Vídeo digital: Estándares
• MPEG define una serie de estándares y se
estudiarán en detalle en el apartado de Compresión.
• MPEG-2 se usa en DVDs, MPEG-4 soporta un rango
de datos multimedia en bitrates desde 10kbps a
300Mbps o más.
• MPEG-4 define el formato de fichero.
• MPEG-4 es un estándar Multiparte.
– La parte 2 define el codec de video,
– La parte 10 (H264/AVC) es una versión mejorada.
Vídeo digital: Estándares
• Todos los estándares MPEG definen un conjunto de
perfiles (características) y niveles (parámetros).
• En multimedia se utilizan los siguientes perfiles:
–
–
–
–
Baseline (BP): para videoconferencia y móviles
Extended (XP): streaming de vídeo
Main (MP): el más utilizado, H.264 y AVC
High (HP): para HDTV y Blu-ray
Vídeo: Compresión
Tipos de compresión:
- Sin pérdida
- Con pérdida
Compresión de vídeo:
• Evitar redundancia de datos
• Representar con menos precisión las partes de la
imagen a las que el ojo es menos sensible
• Despreciar partes de la animación menos
apreciables
Vídeo: Compresión
Compresión de una imagen:
JPEG: 10:1-40:1 0.2 seg de descompresión…
Esto no es problema en imagen estática
Compresión de vídeo:
–Usar jpeg es inviable a 15-25 fps
–Un codec no es una serie de compresiones estáticas de
imágenes individuales: permite controles como el ancho de
banda constante, obtiene ventajas del movimiento.
En consecuencia, hay dos tipos de compresión:
- Espacial: Intra-cuadro
- Temporal: Inter-cuadro
Vídeo: Compresión
Compresión espacial: intra-cuadro
Suele ser similar a la que se utiliza en imagen estática
Compresión temporal: inter-cuadro
Vídeo: Compresión
Parámetros a tener en cuenta:
- Tipo de compresor inter e intra-cuadro (codec)
- Resolución de Color
- Calidad de compresión
- Sincronización en cuadros por segundo
- Frecuencia de key-frames
- Limitación global del ancho de banda
- Parámetros adicionales:
• Compensación de movimiento
• Seguimiento de bloques
Vídeo: Compresión
El conjunto de técnicas para codificar (comprimir) y
decodificar (descomprimir) puede variar según el
método empleado, y pueden ser procesos asimétricos.
A la definición de un método para codificar y
decodificar una secuencia de vídeo se le denomina
CODEC.
Vídeo: Compresión
Un entorno de vídeo digital suele estar asociado a
unos codecs determinados.
Los entornos de vídeo digital más extendidos son:
QuickTime, Video for Windows, Real Video, Windows
Media…y cada uno de estos puede trabajar con varios
codecs.
Vídeo: Compresión
Cada codec determina el tipo de compresión inter e
intra-cuadro. No se puede elegir un método de cada
fabricante.
CODECs: RLE (RLE), Video1, Indeo 3.2 (VQ), Cinepak
(VQ), MPEG (JPEG), Fractal (IFS-VQ)
Vídeo: Compresión
• Métodos de codificación espacial (intra-cuadro):
RLE, JPEG, VQ, Wavelets, Fractal
• Métodos de compresión temporal (inter-cuadro):
Por diferencia de frames, compensación de
movimiento, seguimiento de bloques
Vídeo: Compresión
• La compresión espacial de un frame individual de
vídeo se suele realizar utilizando métodos basados
en transformadas.
• La compresión DV es puramente espacial. Extiende
la técnica JPEG permitiendo la elección del tamaño
de los bloques de las transformadas, y por “mezcla”,
para nivelar los cambios en un frame.
Vídeo: Compresión
Codificación del color
• Generalmente se aplica sub-muestreo de color antes
de cualquier método de compresión.
Vídeo: Compresión
VQ = Cuantización Vectorial
Se utiliza en compresión de la señal, codificación de
imágenes y del habla
Método:
-Divide la imagen en grupos de 8x8 pixeles
- Es de tipo recursivo / multipaso / autocorrector
- Se agrupan los bloques similares en categorías
- Se construye un bloque de referencia para cada categoría
- Se eliminan los bloques iniciales y se guarda únicamente el de referencia
de cada categoría para la descompresión
Vídeo: Compresión
VQ = Cuantización Vectorial
- Recursividad
- Una vez seleccionado un primer grupo de bloques de referencia la
imagen se descomprime y se compara con el original.
- Si hay mucha diferencia se crea un conjunto de grupos de referencia
adicionales que compensen los fallos producidos por el primer conjunto.
- Compresión
- Los bloques de referencia se guardan en una serie de tablas que son
usadas en la descompresión
- Normalmente se utiliza RLE para comprimir más la información
Vídeo: Compresión
Wavelets
- Filtrado de la imagen con filtros paso-bajo y pasoalto, con lo que se crean distintas vistas
- Así se localizan las zonas de información de alta
frecuencia/pequeña amplitud y las de baja
frecuencia/gran amplitud
- Organiza las vistas en forma de árbol desde la de
menor frecuencia a la de mayor
Vídeo: Compresión
Wavelets
- Autocorrector: una vez comprimida la primera vista la
descomprime y compara: si hay diferencias las
codifica, sino pasa al siguiente nivel
- Cuantización: una vez codificada utiliza un método
de cuantización semejante a JPEG y luego un
método de compresión sin pérdidas (Huffman)
- Es simétrico: comprime y descomprime rápidamente
Vídeo: Compresión
MPEG (Motion Pictures Expert Group)
- Estándar ISO
- Intra-cuadro (JPEG)
- Inter-cuadro: compresión temporal, diferencias entre
cuadros consecutivos
- Asimétrico
- Reducciones de 50:1 en adelante
Vídeo: Compresión
MJPEG = Motion JPEG
- Comprime cada fotograma de forma independiente
- Sucesión de cuadros JPEG (simétrico)
- 20:1 con JPEG y MJPEG sin pérdida de calidad
- Ventajas:
Acceso en tiempo real a cada frame, facilidad de edición,
imágenes individuales claras, recuperación rápida en caso
de pérdida de paquetes.
- Desventajas:
Mayor consumo de ancho de banda y de almacenamiento
con más de 5 fps, sin soporte para audio sincronizado
Vídeo: Compresión
Compresión MPEG:
Compresión espacial: JPEG
Vídeo: Compresión
¿Cómo comprime MPEG?
Hay tres tipos de cuadros en MPEG:
Intra-coded (I), son los de referencia completos, key
frames, con compresión espacial
Predictive-coded (P), se codifican con respecto al
frame anterior (I o P a su vez), con predicción
compensada de movimiento
Bidirectional predictive-coded (B), codificados con
respecto al frame anterior y al posterior (I o P)
Vídeo: Compresión
Compresión MPEG:
Se forman grupos de cuadros consecutivos
– Siempre empezados en I
– Contienen I, P y B entremezclados
– Los P o B dependen del codificador (el estándar no obliga
ni indica cuándo se pone uno u otro)
Vídeo: Compresión
Compresión MPEG:
La compensación de movimiento guarda la diferencia
relativa en el desplazamiento de los objetos como un
vector de movimiento.
En los codecs existentes la compensación de
movimiento se aplica a macrobloques, ya que no suele
ser posible identificar objetos concretos.
Vídeo: Compresión
Compresión MPEG:
La compensación de movimiento
Vídeo: Compresión
Compresión MPEG:
Las imágenes B utilizan imágenes posteriores y
anteriores como base de la compensación del
movimiento y la diferencia entre frames
Vídeo: Compresión
• Una secuencia de video se codifica como un Grupo
de Imágenes (GOP: Group of Pictures). Si se usan
B-frames, hay que reordenar un GOP para mostrarlo
en el orden de decodificación correcto.
Vídeo: Compresión
MPEG-1 (1992)
- Soporte CD
- Calidad VHS, 30 fps
- Audio CD
- 10 Mb por minuto
- Compresión vídeo: H.261 y JPEG
- Compresión de audio: MUSICAM (MPEG-1, Layer II)
Vídeo: Compresión
MPEG-2
- Soporte DVD
- Calidad vídeo-difusión (S-VHS)
- 4 a 9 Mb/seg y 15 a 20 Mb/seg para HDTV
- Permite:
–
–
–
–
Baja resolución: vídeo consumo (352x240)
Media: estudios de TV (720x480)
Alta 1440: HDTV (1440x1152)
Alta: producción (1920 x1080)
Vídeo: Compresión
MPEG-4: Estándar
Dividido en más de 20 sub-estándares diferentes:
─ System: Animación/Interactividad
─ Vídeo: Advanced Simple Profile (ASP): DivX, XviD,
…
─ Audio: Advanced Audio Coding (AAC)
─ Vídeo: Advanced Video Coding (AVC): H.264
─ Contenedor: MP4 container format (.mp4)
─ Subtítulos: Time Text Subtitle Format
Vídeo: Compresión
H.264 / MPEG-4 AVC (Advanced Video Codec)
─Buena calidad de imagen
─Orientado a vídeo de baja calidad para videoconferencia y aplicaciones
por Internet.
─Inicialmente basado en 8 bits/muestra y con muestreo 4:2:0.
─Surgen extensiones:
─ Soporte para tamaño de transformada adaptativo
─ Soporte para representación sin pérdida en regiones específicas
─ Soporte: 10 bits/muestra con 4:2:2 // 12 bits/muestra con 4:4:4
─Tipos de imágenes: I, P, B + SP (Switching P) y SI (Switching I) que
sirven para codificar la transición entre dos flujos de vídeo.
─Estructura DCT (modificada) + Compensación del Movimiento (propone
gran variedad de formas y particiones de bloques)
Vídeo: Compresión
H.264
MPEG-4
AVC
Vídeo: Compresión
• MPEG-4 Parte 2 divide la escena en objetos que se
pueden comprimir de forma separada. Para la
escena completa utiliza compensación del
movimiento global y compensación del movimiento
para mejorar la calidad de MPEG-1 y MPEG-2.
• H.264/AVC es una versión optimizada de MPEG-4
Parte 2 y agrega varias técnicas extras que incluyen
tamaño variable de los bloques y macrobloques, y
un “filtro de de-blocking” para suavizar las zonas
discontinuas entre bloques.
Vídeo: Otros codecs
OGG Theora
─ Parte del codec VP3, de On2 Technologies
─ Libre de patentes
─ Vídeo de alta definición
─ Especificaciones
–
–
–
–
Componentes cromáticos: 4:2:0, 4:2:2 y 4:4:4 (similar mpeg)
Frames I y P. Elimina B para simplificar la descompresión
Bloques 8x8
Composición de un frame:
• Tres planos de color (Y, Cr, Cb)
– Codecs como plugins
Vídeo: Otros codecs
DivX
─Calidad de Imagen: buena (próximo a MPEG 2)
─Suavidad de movimiento: buena (sin hardware específico)
─Tamaño del fichero: muy pequeño
─Posibilidad de edición: mal
─Comentario: Películas bajadas por Internet. Bueno como resultado final
de una edición, para reproducir en ordenador y reproductores de DVD.
Periódicamente aparecen nuevas versiones. Se puede descargar el
codec de http://www.divx.com/
Actualmente se usa menos:
─ la versión profesional es de pago
─ mayor uso de XviD
Vídeo: Otros codecs
XviD (similar a DivX)
─Calidad de Imagen: buena
─Suavidad de movimiento: buena
─Tamaño del fichero: muy pequeño
─Posibilidad de edición: mal
─Comentarios:
─ Ha aumentado la popularidad en el último tiempo
─ Presenta muchas posibilidades de configuración
─ Software de libre distribución en http://www.xvid.com/
Vídeo: Otros codecs
• On2 VP6 se hizo popular por su incorporación a
Flash Video. Se supone que está basado en DCT,
con compensación de movimiento (propietario).
• Windows Media 9 (estandarizado por la SMPTE
como VC-1) incorpora características similares a
H.264/AVC. Es el que se utiliza en los players BluRay.
• On2 VP6 y OGG Theora son menos potentes que
H264/AVC o Windows media 9 pero no son de pago
y están muy extendidos.
Vídeo: Otros codecs
• 3IVX: conjunto de herramientas para crear y reproducir
formatos basados en MPEG-4
• Huffyuv: codec de vídeo de compresión sin pérdida que
consume pocos recursos de procesador. Bueno para captura
de vídeo analógico en tiempo real.
• Intel I263 & I420: codecs de Intel que se suelen usar en
tarjetas capturadoras y webcams.
• TSCC: TechSmith Screen Capture Codec, de Camtasia. Se
utiliza habitualmente para la realización de video-tutoriales.
• X264 VfW: codec gratuito y libre para comprimir pistas de
vídeo usando el estándar H.264 AVC. Necesita un
descompresor x264 o h264
Vídeo: Calidad
La calidad de cada codec se mide por la capacidad
para reproducir una secuencia de vídeo original.
No es lo mismo evaluar la calidad para secuencias de
bajo movimiento y alto movimiento.
Sin embargo, todos los codecs modernos producen
una excelente calidad a 2Mbps o más.
Vídeo: Calidad
A la hora de seleccionar un codec hay que tener en
cuenta los siguientes criterios:
•
•
•
•
•
Calidad de la imagen individual
Suavidad del movimiento
Manejo de la paleta de colores (flash)
Independencia de la resolución
Equilibrio compresión/descompresión
Vídeo: Calidad
Mediciones de la calidad de vídeo:
• Objetivas: uso de métricas
– Relación señal ruido (PSNR), Similaridad estructural
(Ssim), Medidas de artefactos en bloques, Medidas en
emborronamiento (blur)
• Subjetivas: percepción por parte de los usuarios
– MSU Continuous Quality Evaluation (MSUCQE), …
• Comparaciones:
– velocidad, perfiles soportados, estrategias de control de bit
rate
Vídeo: Calidad
Vídeo: Software de tratamiento y edición
• La edición de vídeo consiste en el proceso de
construir una película completa a partir de un conjunto
de vídeo clips o de escenas, combinándolos con
sonido cuando sea necesario.
• La postproducción consiste en la realización de
cambios o en la composición del material, utilizando
operaciones similares a las que se utilizan en la
manipulación de imágenes estáticas.
Vídeo: Software de tratamiento y edición
El software de edición permite la captura,
digitalización, edición y postproducción de vídeo:
añadir efectos, transiciones, rotulación, inclusión de
animaciones, incrustaciones, chroma, sonorización,…
Ejemplos: Avid Cinema, Adobe Premiere, After Effects,
VirtualDub, Final Cut, Video Fusion, Ulead Media
Shop, …
Vídeo: Software de tratamiento y edición
Las herramientas para TDV presentan un aspecto
común de cara al usuario:
- Se basan en una representación gráfica de lo que es
una edición A/B: dos mesas de originales, pista de
secuencia final y generador de efectos de vídeo.
- Cada mesa presenta una serie de pistas de vídeo y
audio en las que se pueden cargar secuencias de
vídeo digital. Se representan como líneas de tiempo
con especificación SMPTE.
Vídeo: Software de tratamiento y edición
Herramientas:
• Cortar, copiar, pegar
• Situación de marcas
• Croma-keying (no sólo en azul), mezcla
Titulación:
• Utilización de tipos TrueType o Adobe Type1
• Antialiasing
Vídeo: Software de tratamiento y edición
Efectos especiales, transiciones, filtros:
• Dissolve, wipe, explosiones
• Definibles por el usuario
• Enchufables (terceras partes)
Sonido:
• No son editores completos de sonido, sólo ofrecen
posibilidades simples de edición: cortar, pegar, fades,
etc.
• Los más avanzados: eco, reverberación,
amplificación…
Vídeo: Software de tratamiento y edición
Ejemplo: Superposición de clips para una transición
Vídeo: Software de tratamiento y edición
Ejemplo: Filtro de color aplicado en el tiempo (postpro)
Vídeo: Software de tratamiento y edición
Salida:
• Grabación por campos para paso a VTR
• Grabación como vídeo digital (selección de codec)
• Posibilidad de salida EDL (lista de edición) para
trabajar sobre edición analógica o mezclas
posteriores.
Vídeo: Distribución
• El vídeo se puede distribuir sobre las
redes como un fichero de descarga, y
puede ser por streaming o por
descarga progresiva.
• La descarga progresiva significa que la
película comienza a mostrarse cuando
el tiempo necesario para descargar los
frames siguientes es menor que el
tiempo que tomaría visualizar la
película completa.
Vídeo: Distribución
• En streaming, cada frame se visualiza a medida que
va llegando.
• El streaming permite transmisión de video en vivo y
no requiere guardar un fichero en el disco del
usuario, pero requiere tener un ancho de banda
suficiente para entregar los frames a la velocidad
suficiente para que sean visualizados.
Vídeo: Distribución
• Comparativa
Concepto
Descarga
Streaming
Pérdida de
información
Imposible
Probable
Servidor
Servidor web estándar
Servidor específico para
streaming
Protocolo de
red
TCP/IP
UDP/IP
Protocolo de
ejecución
HTTP
RTP
Calidad de la
señal
No hay pérdida de
información. Alta calidad.
Puede sufrir pérdidas en la
señal.Calidad variable.
Inicio de la
reproducción
Comienza cuando el
archivo ha sido descargado
por completo
Casi inmediata
Vídeo: Distribución
•
•
El emisor envía la señal de vídeo a un servidor de streaming, mediante un software que recoge la señal de audio y vídeo
entrante al PC (p.ej. desde una tarjeta de sonido o desde una mesa de mezclas), codificarla al bitrate al que quiera emitir la
señal y enviar esa señal codificada a los servidores de streaming.
La audiencia se conecta al servidor de streaming para ver la emisión, para lo que necesitan tener instalado un reproductor
multimedia en el ordenador: Windows Media Player, Real Video, Flash o Quicktime
Vídeo: Distribución
Streaming: Tipos
• Bajo demanda: es el método más habitual. El contenido multimedia está
almacenado en un archivo en un servidor de streaming y a él los usuarios
pueden acceder en cualquier momento. Al acceder al fichero comienza la
reproducción, pero el usuario puede controlarla (ir hacia delante, hacia
atrás, parar...). Múltiples usuarios pueden acceder simultáneamente al
mismo contenido.
• Emisión programada: el contenido está almacenado en un servidor
streaming y su reproducción comienza en un instante determinado. Todos
los usuarios visualizan a la vez el contenido y no pueden controlar la
reproducción.
• “En vivo”: el contenido se visualiza al mismo tiempo que se genera (no
está almacenado).
Vídeo: Distribución
Servidores “streaming”: características
• Control de flujo: se intenta mantener una velocidad de
trasferencias estable, sin picos.
• Protección frente a “pérdidas” (“skip protection”): aprovecha
el exceso de banda para ir almacenando en el buffer; si
algún paquete se pierde echará mano del buffer para volver
a trasmitir sólo lo perdido.
• Adaptación al ancho de banda: optimiza la calidad del
archivo multimedia en función del ancho de banda
disponible
• Protección de datos: el contenido se reproduce pero no se
almacena con lo que se protegen los derechos de autor.
Vídeo: Distribución
Reproductores de “streaming”
• Existen tres arquitecturas principales
-
Real Media
Windows Media
Quicktime
• Los reproductores correspondientes se integran como plugins
en los navegadores Web.
• Es necesario que el archivo de vídeo o de audio esté codificado
en el formato adecuado
– Audio: ra (g2), wma, vorbis,…
– Vídeo: asf, rm, mov, vdo,…
Vídeo: Distribución
• Una arquitectura multimedia provee de un API para
la captura, ejecución y compresión; un formato
contenedor; un servidor de streaming; y
herramientas software.
• Flash Video se utiliza ampliamente para video Web.
Los ficheros FLV se deben ejecutar con un Flash
Player con un SWF que controle la visualización del
video (o con un componente extra)
Vídeo: Distribución
• QuickTime y DirectShow son las arquitecturas
multimedia que se incluyen en Mac OS X y en
Windows, respectivamente. Sus formatos de
ficheros son MOV y WMV.
• Ambos permiten el uso de diferentes codecs,
incluyendo H.264/AVC y WMV9, y permiten leer y
escribir con varios formatos adicionales de ficheros,
como MP4 y AVI.
Vídeo: Distribución
• OGG es un formato abierto, que puedes usarse con
el codec Theora para producir películas no sujetas a
restricciones o licencias.
• Web video puede necesitar que se reduzca su
tamaño de frame o frame rate antes de comprimirlo
y exportarlo en un formato adecuado (MP4 o FLV),
que puede visualizarse en la mayor parte de
sistemas.
Referencias - Multimedia
Lecturas recomendadas sobre codificación de audio
– http://en.wikipedia.org/wiki/Category:Audio_codecs
• Digital Multimedia, N. Chapman & J. Chapman,
Wiley 2013.
– Capítulos 8 (Audio)
• http://www.digitalmultimedia.org/slide_sets/8
Referencias - Multimedia
Lecturas recomendadas sobre codecs de vídeo:
– Comparativa:
http://en.wikipedia.org/wiki/Comparison_of_video_codecs
– Revisión anual, MSU Video Group:
http://www.compression.ru/video/index.htm
– Otros: http://www.doom9.org/index.html?/codecs-203-1.htm
• Digital Multimedia, N. Chapman & J. Chapman,
Wiley 2013.
– Capítulos 6 (Vídeo)
• http://www.digitalmultimedia.org/slide_sets/6
Descargar