Tema 3. Gestión de proyectos de desarrollo multimedia y sistemas web. Elementos de diseño. Contenido dinámico 30258- Diseño Centrado en el Usuario. Diseño para la Multimedia Dra. Sandra Baldassarri Objetivos Desarrollo de proyectos multimedia y sistemas web utilizando técnicas de diseño centrado en el usuario. • Características de las aplicaciones multimedia y web • Definición de elementos multimedia: – – – – Texto Imagen / Gráficos Audio Video / Animaciones • Algunas consideraciones prácticas: – Diseño para web. Guías de estilo. Aplicaciones Multimedia Multimedia o hipermedia (no sólo texto): • Sistemas hipertexto + medios adicionales – Ilustraciones, fotografías, videos, sonidos, etc… • Enlaces y “hotspots” pueden formar parte de los medios – Áreas de imágenes – Tiempos y ubicaciones en los videos • El contenido puede ser: – Estático – Dinámico (basado en tiempo) 30258 – Diseño Centrado en el Usuario – Diseño para la Multimedia Contenido Dinámico: Audio Existen dos tipos fundamentales de sonido: - Habla - Otros sonidos El tratamiento digital del habla cubre tres aspectos: Codificación del habla: para la comunicación entre personas, relacionado con la conversión A/D y la compresión de la señal digital. Síntesis del habla: para la comunicación entre máquina y persona Reconocimiento y comprensión del habla: para la comunicación entre persona y máquina Audio Otros sonidos: El sonido audible consiste en ondas sonoras que se producen cuando las oscilaciones de la presión del aire se convierten en vibraciones detectadas por el oído humano. Estas vibraciones se convierten en impulsos nerviosos que son percibidos por el cerebro. El oído humano detecta frecuencias de sonido entre 20Hz y 20kHz. Audio: digitalización Conversión Analógico/Digital A sound wave, in red, represented digitally, in blue (aftersampling and 4-bit quantization). Audio: digitalización • A partir de micrófono, sintetizador, grabaciones en cinta, emisiones en vivo de radio y TV, CDs y discos. • Los sonidos digitalizados son muestras de sonido. Cada enésima fracción de segundo se toma una muestra y se guarda como información en bits o bytes. Audio: digitalización • Velocidad de muestreo: frecuencia con que se toman las muestras. Las velocidades de muestreo más usadas son: Calidad CD 44.1 kHz, 22.05 kHz y 11.025 kHz. • Tamaño de la muestra: cantidad de información almacenada de cada muestra. Los tamaños de muestras más usados son: 8 y 16 bits. Audio: digitalización El valor de cada muestra se redondea al entero más próximo (cuantización) y si la amplitud es más grande que el intervalo disponible se hace un recorte (clipping) de la parte alta o baja de la onda . Audio: digitalización El ruido en la cuantización se puede suavizar mediante el dithering agregando ruido al azar para suavizar transiciones. Audio digital • Representación real de un sonido, almacenado en forma de miles de números individuales llamados muestras. • Los datos digitales representan la amplitud instantánea (volumen) de un sonido en períodos pequeños de tiempo. • Ocupan mucho espacio, pero no son dependientes del dispositivo. MIDI • Estándar de comunicaciones para instrumentos musicales electrónicos y computadoras (1980). • Permite la comunicación entre la música y los sintetizadores de sonido de diferentes fabricantes enviando mensajes. • Protocolo para pasar descripciones detalladas de una partitura musical como notas, secuencias de notas e instrumentos. • Lista de órdenes de grabaciones de acciones musicales que, cuando se envían a un dispositivo de reproducción MIDI, produce sonido. No es sonido digitalizado. MIDI QuickTime incorpora una funcionalidad “tipo-MIDI”. Las pistas de MIDI se pueden combinar con audio, con video u otro tipo de medios suportados por QuickTime. Compresión de audio El sonido es más difícil de comprimir que las imágenes, especialmente utilizando métodos de compresión sin pérdidas. A grandes rasgos, la compresión de audio puede hacerse: – Dominio del tiempo: más fáciles de implementar pero requieren más de 10 bits de muestra – Dominio de frecuencias: utilizan 3 bits por muestra y se basan en la percepción auditiva y en el enmascaramiento psicoacústico. Existen numerosas técnicas de compresión, con y sin pérdidas, las más comunes son las que se basan en la codificación diferencial. Compresión de audio Hay tres esquemas de codificación diferencial: • DPCM • Modulación delta • ADPCM Compresión de audio DPCM = Simple Differential Pulse Code Modulation Se toma como valor siguiente la diferencia con el valor de la señal en el instante anterior. señal inicial señal codificada mediante DPCM amplitud amplitud T tiempo se necesitan menos bits para codificar la diferencia tiempo Modulación Delta Modulación delta Es una forma particular de codificación DPCM en la cual la diferencia entre el valor actual y el valor siguiente se codifica con un solo bit. Este bit indica si el valor de la señal se incrementa o se decrementa en un “quantum”. Esta técnica es adecuada para señales cuyos valores no cambian muy rápidamente para una frecuencia de muestreo dada. señal inicial señal codificada mediante delta modulation amplitud amplitud T tiempo tiempo ADPCM ADPCM = Adaptive Differential Pulse Code Modulation Es una versión sofisticada del método DPCM. En lugar de usar una función de predicción constante, la estimación varía adaptándose a las características de la señal. El valor siguiente se obtiene extrapolando los valores anteriores de la señal. Compresión de audio LPCM (Linear PCM): • Variante de PCM que realiza compresión lineal. Se utiliza en el formato WAV. Mnidisc: • Variante de ADPCM que elimina ciertos componentes que no son audibles porque quedan enmascarados mu-law/A-law: • Sistema de compresión no lineal que permite utilizar resolución a 8 bits pero ofrece una calidad sonora próxima a 14 bits. Más rápido que ADPCM. Se utiliza en telefonía. MPEG1 Layer 3 (mp3) • En 1997 el Instituto Fraunhofer ideó un codec capaz de comprimir audio sin pérdida de calidad apreciable. En 1992 MPEG aprobó la tecnología y nació el MP3 (MPEG-1 Audio Layer 3). • Permite compresiones de 12:1 y superiores. • No pierde calidad de sonido de forma apreciable (por un oído no entrenado). • mp3 utiliza unos cuantos trucos para comprimir el sonido, aprovechando la manera en la que el oído humano percibe el sonido. MPEG1 Layer 3 (mp3) • Se basa en las limitaciones del oído humano, que sólo es capaz de captar las frecuencias entre 20Hz y 20 kHz y es más sensible entre 2 y 4 kHz. De esta forma elimina las frecuencias inaudibles conservando la esencia del sonido. • Al obtener un MP3 se puede seleccionar la codificación y compresión que se desea (nivel de calidad). A 128kbits/44kHz estéreo se consigue un buen equilibrio entre calidad y compresión. Es el nivel por defecto en los compresores disponibles en la red. • Se han realizado estudios de percepción para verificar la calidad obtenida. MPEG1 Layer 3 (mp3) • Umbral mínimo de audición – No es lineal, el margen de percepción real es menor que el teórico Cualquier sonido fuera no es necesario codificarlo • Efecto máscara – Los sonidos fuertes no dejan oír los débiles éstos se filtran – Existe máscara temporal cuando no se percibe un sonido antes o después de un sonido más fuerte • Reserva de bytes – Partes más comprimidas dejan espacio a las menos comprimibles para mantener el flujo constante (VBR) • Fusión de estéreo – En determinadas frecuencias el oído no percibe el punto de emisión del sonido MPEG1 Layer 3 (mp3) • Su utilidad: – En un CD de 80 minutos caben 80 minutos de música en formato CD-Audio y 700 minutos de música en formato MP3 (unos 11 CD’s de audio) - estéreo con calidad 16 bits a 44hHz codificada en MP3 a 128kb/seg. • Programas reproductores: – WinAmp, RealOne Player, Music Match Jukebox, Windows Media Player, Quicktime, Flash,… • Para generar MP3 a partir de CD-Audio: – Musicmatch Jukebox, Real Jukebox, EasyMP3,... • Un CD con MP3 sólo se podrá escuchar en equipos reproductores compatibles. Formatos de audio Dolby Digital • AC-3: es la versión más común, con 6 canales: 5.1 – 5 canales de ancho de banda completa (20 Hz a 20 kHz) +1 canal exclusivo para los sonidos de baja frecuencia (subwoofer) – Compresión perceptual • Dolby Digital EX / DD Sorround EX: 6.1 • Dolby Digital Live (DDL): 5.1, tiempo real, videojuegos, … • Dolby Digital Plus (E-AC-3): 13.1 • Dolby TrueHD: hasta 14 canales para HD DVD y Blu-ray Formatos de audio AAC (MPEG-4 Advanced Audio Coding) • Este códec está orientado a usos de banda ancha y se basa en la eliminación de redundancias de la señal acústica, así como en compresión mediante la transformada de coseno discreta modificada (MDCT), y en utilizar VRB, muy parecido a MP3. – Produce una mejor calidad que MP3 en archivos pequeños y requiere menos recursos del sistema para codificar y descodificar. • Formato elegido por Apple para iPods y para iTunes. También es utilizado por Ahead Nero, Winamp y Nintendo DSi. Formatos de audio AAC (MPEG-4 Advanced Audio Coding) Formatos de audio AAC (MPEG-4 Advanced Audio Coding) • Ventajas con respecto a MP3 – El formato AAC soporta sonido multicanal lo cual resulta un códec de audio apropiado para el sonido envolvente de 6 o más altavoces. MP3 sólo permite, en su formato base, sonido estéreo. – Puede alcanzar una frecuencia de muestreo de 96khz, utilizado en estudios de grabación. MP3 está diseñado sólo para la reproducción y para alcanzar hasta 48khz. – La calidad de sonido es considerablemente superior al mismo bitrate. Un archivo de audio en AAC-HC codificado a 64kbps puede ofrecer una calidad similar a un MP3 codificado a 128kbps. – Incluso a bitrates muy bajos (<32kbps) el sonido sufre poca pérdida en comparación con el MP3 (útil para codificar ficheros de audio de tamaño muy pequeño o para codificar diálogos) Formatos de audio WAV: Formato Waveform • Es el más usado y soportado por plataformas Windows. • Almacena información sobre el número de pistas (mono o estéreo), frecuencia de muestreo, profundidad de bits, igualmente que datos raw de audio no comprimidos. • La codificación más usual utiliza el formato “Linear Pulse Code Modulation” (LPCM) • La calidad depende de la combinación de parámetros seleccionada: – resolución o tamaño de la muestra (8, 16, 20, 24 bit, etc), frecuencia de muestreo (e.g. 8000, 11025, 16000, 22050, 24000, 32000, 44100, 48000 Hz / “muestras por segundo", etc), signo (con o sin), número de canales (monaural, estéreo, cuadrafónico, etc), orden de los bits (little endian, big endian). Formatos de audio Otros formatos • AU: Formato NeXT/Sun. Multiplataforma • VOX: Útil para grabaciones de voz. Alto grado de compresión (50:1) pero con baja calidad. • AIFF: Formato Audio Interchange Format, de Apple. Sin compresión. • TSP: Formato TrueSpeech de DSP. Muy buena calidad, compresión 15:1 Formatos de audio Otros formatos • GSM: Esquema de compresión para voz, originalmente para teléfonos celulares, que ha ganado uso en aplicaciones de telefonía en Internet. • RA: Formato Progressive Networks Real Audio. Muy popular. Compresión 20:1. • OGG Vorbis (GNU). Basado en streaming. Muy buena calidad (mejor que mp3). Las películas con audio OGG llevan extensión OGM. • WMA (Windows Media Audio). Sonido Sorround. También basado en streaming. Audio: Herramientas de Autor Son numerosas las herramientas que permiten trabajar con sonido digital: • Plataformas Windows: Cool Edit, Goldware, WaveEdit, Stereo Studio FX • Plataformas Mac: Sound Edit Pro, Alchemy y Audio Track • Profesionales: Sonic Foundry’s Sound Fong (PC), Digidesign’s Pro Tools (Mac) • Y otros como: FreeAmp, WinAmp, PhatNoise, FreeRIP MP3 Audio: Herramientas de Autor Las operaciones básicas de edición de sonidos que se necesitan en las producciones multimedia son: –Recortes –Uniones –Ajustes de volumen –Conversión de Formatos –Remuestreo y muestreo a baja velocidad –Desvanecimiento –Ecualización –Ajustes de tiempos –Procesamiento digital de señales –Sonido a la inversa Contenido Dinámico: Vídeo Secuencia de frames representados por imágenes en formato de mapa de bits. La tecnología de soporte, edición y almacenamiento de vídeo ha evolucionado mucho en los últimos años. Actualmente la mayor parte de los dispositivos portátiles como móviles, ordenadores, etc. llevan incorporadas cámaras de vídeo. Vídeo: Estándares Las cámaras de vídeo digital actuales deben mantener la compatibilidad con los estándares que rigen la TV. Aunque el alcance y adopción de la HDTV sigue en aumento, los estándares de vídeo digital heredan algunas características esenciales de los sistemas broadcast de TV analógicos como: tamaño de los frames, frame rate, etc… Por lo tanto, es necesario conocer las bases fundamentales de los sistemas analógicos. Vídeo: Estándares Fundamentos del vídeo analógico. Parámetros: Número de imágenes por segundo que se utilizan para representar el movimiento. Relación de aspecto: número de líneas horizontales en relación con el número de líneas verticales. Método de Codificación del Color o Formatos de Señal Métodos de codificación del color sobre la señal: ancho de banda, modulación en amplitud, modulación en frecuencia, modulación en fase. Vídeo: Estándares Los formatos de difusión estándares son: PAL, NTSC, SECAM y HDTV. PAL: 25 fps, 625 líneas, 4:3 ,YUV, Subp: AM. NTSC: 30 fps, 525 líneas, 4:3, YIQ, Subp: AM. SECAM: 25 fps, 625 líneas, 4:3, YUV, Subp: FM. HDTV: 30 fps,1125 líneas, 16:9. Vídeo: Estándares Relación de aspecto: Número de líneas horizontales en relación con el número de verticales. - El formato estándar de televisión analógica es 4:3 Los televisores panorámicos y de alta definición tienen relación 16:9 En cine las relaciones de aspecto más usadas son 1.85:1 y 2.39:1. En fotografía las proporciones más usadas son 4:3 y 3:2 Los ordenadores suelen usar relación 4:3 o 5:4 (16:10 en portátiles) Vídeo: Estándares PAL: 25 fps, 625 líneas, 4:3 ,YUV, Subp: AM. Cada frame tiene 625 líneas, de las cuales 576 forman la imagen, que se muestra en 25 frames por segundo. NTSC: 30 fps, 525 líneas, 4:3, YIQ, Subp: AM. Cada frame tiene 525 líneas, de las cuales 480 forman la imagen y se muestran en 29.97 frames por segundo. Vídeo: Estándares HDTV: 30 fps,1125 líneas, 16:9 Transmisión de la señal de color: YCrCb Y = 0,299R + 0,587G + 0,114B R-Y = 0,701 R - 0,587 G - 0,114 B B-Y = 0,886 B - 0,299 R - 0,587 G Resolución: 1280x720 píxeles en barrido progresivo (720p) o 1920x1080 píxeles en barrido entrelazado (1080i) Recepción e interactividad: Teletexto digital basado en XHTML y CSS. Para servicio interactivo se requiere un canal de retorno a través de conexión a Internet. Vídeo: Estándares En los sistemas analógicos la codificación del color se realiza siempre por componentes, en codificaciones derivadas de Y/R-Y/B-Y. Codificación YUV Vídeo: Estándares Los métodos de codificación del color o formado de la señal pueden ser: – Señal por componentes: mantiene la información del color separada en sus tres valores (codificación RGB o Y/R-Y/B-Y) – Señal Super-Vídeo o YC: los dos canales que llevan la información del color se combinan en uno llamado crominancia. – Señal de vídeo compuesto: los dos canales Y/C se combinan en una sola señal, con lo que el ancho de banda de una de ellas debe reducirse. Puesto que el ojo es más sensible a los cambios en luminancia que en crominancia, se deteriora esta última. Vídeo: Estándares En vídeo digital el número de colores distintos que se pueden representar en un pixel depende del número de bits por pixel (bpp). Vídeo: Estándares CCIR 601 define el estándar de muestreo de vídeo digital, con 720 muestras de color y 2 x 360 muestras de diferencia de color por línea: Y CBCR con muestreo 4:2:2 Los frames de PAL son 720x576 y NTSC 720x480. Los pixels no son cuadrados. Vídeo digital: Estándares DV (DVCAM, DVPRO) • Aplica muestreo de color 4:1:1 • Comprime a un ratio constante de 25 Mbits por segundo • Obteniendo una proporción de compresión de 5:1. Vídeo digital: Estándares • MPEG define una serie de estándares y se estudiarán en detalle en el apartado de Compresión. • MPEG-2 se usa en DVDs, MPEG-4 soporta un rango de datos multimedia en bitrates desde 10kbps a 300Mbps o más. • MPEG-4 define el formato de fichero. • MPEG-4 es un estándar Multiparte. – La parte 2 define el codec de video, – La parte 10 (H264/AVC) es una versión mejorada. Vídeo digital: Estándares • Todos los estándares MPEG definen un conjunto de perfiles (características) y niveles (parámetros). • En multimedia se utilizan los siguientes perfiles: – – – – Baseline (BP): para videoconferencia y móviles Extended (XP): streaming de vídeo Main (MP): el más utilizado, H.264 y AVC High (HP): para HDTV y Blu-ray Vídeo: Compresión Tipos de compresión: - Sin pérdida - Con pérdida Compresión de vídeo: • Evitar redundancia de datos • Representar con menos precisión las partes de la imagen a las que el ojo es menos sensible • Despreciar partes de la animación menos apreciables Vídeo: Compresión Compresión de una imagen: JPEG: 10:1-40:1 0.2 seg de descompresión… Esto no es problema en imagen estática Compresión de vídeo: –Usar jpeg es inviable a 15-25 fps –Un codec no es una serie de compresiones estáticas de imágenes individuales: permite controles como el ancho de banda constante, obtiene ventajas del movimiento. En consecuencia, hay dos tipos de compresión: - Espacial: Intra-cuadro - Temporal: Inter-cuadro Vídeo: Compresión Compresión espacial: intra-cuadro Suele ser similar a la que se utiliza en imagen estática Compresión temporal: inter-cuadro Vídeo: Compresión Parámetros a tener en cuenta: - Tipo de compresor inter e intra-cuadro (codec) - Resolución de Color - Calidad de compresión - Sincronización en cuadros por segundo - Frecuencia de key-frames - Limitación global del ancho de banda - Parámetros adicionales: • Compensación de movimiento • Seguimiento de bloques Vídeo: Compresión El conjunto de técnicas para codificar (comprimir) y decodificar (descomprimir) puede variar según el método empleado, y pueden ser procesos asimétricos. A la definición de un método para codificar y decodificar una secuencia de vídeo se le denomina CODEC. Vídeo: Compresión Un entorno de vídeo digital suele estar asociado a unos codecs determinados. Los entornos de vídeo digital más extendidos son: QuickTime, Video for Windows, Real Video, Windows Media…y cada uno de estos puede trabajar con varios codecs. Vídeo: Compresión Cada codec determina el tipo de compresión inter e intra-cuadro. No se puede elegir un método de cada fabricante. CODECs: RLE (RLE), Video1, Indeo 3.2 (VQ), Cinepak (VQ), MPEG (JPEG), Fractal (IFS-VQ) Vídeo: Compresión • Métodos de codificación espacial (intra-cuadro): RLE, JPEG, VQ, Wavelets, Fractal • Métodos de compresión temporal (inter-cuadro): Por diferencia de frames, compensación de movimiento, seguimiento de bloques Vídeo: Compresión • La compresión espacial de un frame individual de vídeo se suele realizar utilizando métodos basados en transformadas. • La compresión DV es puramente espacial. Extiende la técnica JPEG permitiendo la elección del tamaño de los bloques de las transformadas, y por “mezcla”, para nivelar los cambios en un frame. Vídeo: Compresión Codificación del color • Generalmente se aplica sub-muestreo de color antes de cualquier método de compresión. Vídeo: Compresión VQ = Cuantización Vectorial Se utiliza en compresión de la señal, codificación de imágenes y del habla Método: -Divide la imagen en grupos de 8x8 pixeles - Es de tipo recursivo / multipaso / autocorrector - Se agrupan los bloques similares en categorías - Se construye un bloque de referencia para cada categoría - Se eliminan los bloques iniciales y se guarda únicamente el de referencia de cada categoría para la descompresión Vídeo: Compresión VQ = Cuantización Vectorial - Recursividad - Una vez seleccionado un primer grupo de bloques de referencia la imagen se descomprime y se compara con el original. - Si hay mucha diferencia se crea un conjunto de grupos de referencia adicionales que compensen los fallos producidos por el primer conjunto. - Compresión - Los bloques de referencia se guardan en una serie de tablas que son usadas en la descompresión - Normalmente se utiliza RLE para comprimir más la información Vídeo: Compresión Wavelets - Filtrado de la imagen con filtros paso-bajo y pasoalto, con lo que se crean distintas vistas - Así se localizan las zonas de información de alta frecuencia/pequeña amplitud y las de baja frecuencia/gran amplitud - Organiza las vistas en forma de árbol desde la de menor frecuencia a la de mayor Vídeo: Compresión Wavelets - Autocorrector: una vez comprimida la primera vista la descomprime y compara: si hay diferencias las codifica, sino pasa al siguiente nivel - Cuantización: una vez codificada utiliza un método de cuantización semejante a JPEG y luego un método de compresión sin pérdidas (Huffman) - Es simétrico: comprime y descomprime rápidamente Vídeo: Compresión MPEG (Motion Pictures Expert Group) - Estándar ISO - Intra-cuadro (JPEG) - Inter-cuadro: compresión temporal, diferencias entre cuadros consecutivos - Asimétrico - Reducciones de 50:1 en adelante Vídeo: Compresión MJPEG = Motion JPEG - Comprime cada fotograma de forma independiente - Sucesión de cuadros JPEG (simétrico) - 20:1 con JPEG y MJPEG sin pérdida de calidad - Ventajas: Acceso en tiempo real a cada frame, facilidad de edición, imágenes individuales claras, recuperación rápida en caso de pérdida de paquetes. - Desventajas: Mayor consumo de ancho de banda y de almacenamiento con más de 5 fps, sin soporte para audio sincronizado Vídeo: Compresión Compresión MPEG: Compresión espacial: JPEG Vídeo: Compresión ¿Cómo comprime MPEG? Hay tres tipos de cuadros en MPEG: Intra-coded (I), son los de referencia completos, key frames, con compresión espacial Predictive-coded (P), se codifican con respecto al frame anterior (I o P a su vez), con predicción compensada de movimiento Bidirectional predictive-coded (B), codificados con respecto al frame anterior y al posterior (I o P) Vídeo: Compresión Compresión MPEG: Se forman grupos de cuadros consecutivos – Siempre empezados en I – Contienen I, P y B entremezclados – Los P o B dependen del codificador (el estándar no obliga ni indica cuándo se pone uno u otro) Vídeo: Compresión Compresión MPEG: La compensación de movimiento guarda la diferencia relativa en el desplazamiento de los objetos como un vector de movimiento. En los codecs existentes la compensación de movimiento se aplica a macrobloques, ya que no suele ser posible identificar objetos concretos. Vídeo: Compresión Compresión MPEG: La compensación de movimiento Vídeo: Compresión Compresión MPEG: Las imágenes B utilizan imágenes posteriores y anteriores como base de la compensación del movimiento y la diferencia entre frames Vídeo: Compresión • Una secuencia de video se codifica como un Grupo de Imágenes (GOP: Group of Pictures). Si se usan B-frames, hay que reordenar un GOP para mostrarlo en el orden de decodificación correcto. Vídeo: Compresión MPEG-1 (1992) - Soporte CD - Calidad VHS, 30 fps - Audio CD - 10 Mb por minuto - Compresión vídeo: H.261 y JPEG - Compresión de audio: MUSICAM (MPEG-1, Layer II) Vídeo: Compresión MPEG-2 - Soporte DVD - Calidad vídeo-difusión (S-VHS) - 4 a 9 Mb/seg y 15 a 20 Mb/seg para HDTV - Permite: – – – – Baja resolución: vídeo consumo (352x240) Media: estudios de TV (720x480) Alta 1440: HDTV (1440x1152) Alta: producción (1920 x1080) Vídeo: Compresión MPEG-4: Estándar Dividido en más de 20 sub-estándares diferentes: ─ System: Animación/Interactividad ─ Vídeo: Advanced Simple Profile (ASP): DivX, XviD, … ─ Audio: Advanced Audio Coding (AAC) ─ Vídeo: Advanced Video Coding (AVC): H.264 ─ Contenedor: MP4 container format (.mp4) ─ Subtítulos: Time Text Subtitle Format Vídeo: Compresión H.264 / MPEG-4 AVC (Advanced Video Codec) ─Buena calidad de imagen ─Orientado a vídeo de baja calidad para videoconferencia y aplicaciones por Internet. ─Inicialmente basado en 8 bits/muestra y con muestreo 4:2:0. ─Surgen extensiones: ─ Soporte para tamaño de transformada adaptativo ─ Soporte para representación sin pérdida en regiones específicas ─ Soporte: 10 bits/muestra con 4:2:2 // 12 bits/muestra con 4:4:4 ─Tipos de imágenes: I, P, B + SP (Switching P) y SI (Switching I) que sirven para codificar la transición entre dos flujos de vídeo. ─Estructura DCT (modificada) + Compensación del Movimiento (propone gran variedad de formas y particiones de bloques) Vídeo: Compresión H.264 MPEG-4 AVC Vídeo: Compresión • MPEG-4 Parte 2 divide la escena en objetos que se pueden comprimir de forma separada. Para la escena completa utiliza compensación del movimiento global y compensación del movimiento para mejorar la calidad de MPEG-1 y MPEG-2. • H.264/AVC es una versión optimizada de MPEG-4 Parte 2 y agrega varias técnicas extras que incluyen tamaño variable de los bloques y macrobloques, y un “filtro de de-blocking” para suavizar las zonas discontinuas entre bloques. Vídeo: Otros codecs OGG Theora ─ Parte del codec VP3, de On2 Technologies ─ Libre de patentes ─ Vídeo de alta definición ─ Especificaciones – – – – Componentes cromáticos: 4:2:0, 4:2:2 y 4:4:4 (similar mpeg) Frames I y P. Elimina B para simplificar la descompresión Bloques 8x8 Composición de un frame: • Tres planos de color (Y, Cr, Cb) – Codecs como plugins Vídeo: Otros codecs DivX ─Calidad de Imagen: buena (próximo a MPEG 2) ─Suavidad de movimiento: buena (sin hardware específico) ─Tamaño del fichero: muy pequeño ─Posibilidad de edición: mal ─Comentario: Películas bajadas por Internet. Bueno como resultado final de una edición, para reproducir en ordenador y reproductores de DVD. Periódicamente aparecen nuevas versiones. Se puede descargar el codec de http://www.divx.com/ Actualmente se usa menos: ─ la versión profesional es de pago ─ mayor uso de XviD Vídeo: Otros codecs XviD (similar a DivX) ─Calidad de Imagen: buena ─Suavidad de movimiento: buena ─Tamaño del fichero: muy pequeño ─Posibilidad de edición: mal ─Comentarios: ─ Ha aumentado la popularidad en el último tiempo ─ Presenta muchas posibilidades de configuración ─ Software de libre distribución en http://www.xvid.com/ Vídeo: Otros codecs • On2 VP6 se hizo popular por su incorporación a Flash Video. Se supone que está basado en DCT, con compensación de movimiento (propietario). • Windows Media 9 (estandarizado por la SMPTE como VC-1) incorpora características similares a H.264/AVC. Es el que se utiliza en los players BluRay. • On2 VP6 y OGG Theora son menos potentes que H264/AVC o Windows media 9 pero no son de pago y están muy extendidos. Vídeo: Otros codecs • 3IVX: conjunto de herramientas para crear y reproducir formatos basados en MPEG-4 • Huffyuv: codec de vídeo de compresión sin pérdida que consume pocos recursos de procesador. Bueno para captura de vídeo analógico en tiempo real. • Intel I263 & I420: codecs de Intel que se suelen usar en tarjetas capturadoras y webcams. • TSCC: TechSmith Screen Capture Codec, de Camtasia. Se utiliza habitualmente para la realización de video-tutoriales. • X264 VfW: codec gratuito y libre para comprimir pistas de vídeo usando el estándar H.264 AVC. Necesita un descompresor x264 o h264 Vídeo: Calidad La calidad de cada codec se mide por la capacidad para reproducir una secuencia de vídeo original. No es lo mismo evaluar la calidad para secuencias de bajo movimiento y alto movimiento. Sin embargo, todos los codecs modernos producen una excelente calidad a 2Mbps o más. Vídeo: Calidad A la hora de seleccionar un codec hay que tener en cuenta los siguientes criterios: • • • • • Calidad de la imagen individual Suavidad del movimiento Manejo de la paleta de colores (flash) Independencia de la resolución Equilibrio compresión/descompresión Vídeo: Calidad Mediciones de la calidad de vídeo: • Objetivas: uso de métricas – Relación señal ruido (PSNR), Similaridad estructural (Ssim), Medidas de artefactos en bloques, Medidas en emborronamiento (blur) • Subjetivas: percepción por parte de los usuarios – MSU Continuous Quality Evaluation (MSUCQE), … • Comparaciones: – velocidad, perfiles soportados, estrategias de control de bit rate Vídeo: Calidad Vídeo: Software de tratamiento y edición • La edición de vídeo consiste en el proceso de construir una película completa a partir de un conjunto de vídeo clips o de escenas, combinándolos con sonido cuando sea necesario. • La postproducción consiste en la realización de cambios o en la composición del material, utilizando operaciones similares a las que se utilizan en la manipulación de imágenes estáticas. Vídeo: Software de tratamiento y edición El software de edición permite la captura, digitalización, edición y postproducción de vídeo: añadir efectos, transiciones, rotulación, inclusión de animaciones, incrustaciones, chroma, sonorización,… Ejemplos: Avid Cinema, Adobe Premiere, After Effects, VirtualDub, Final Cut, Video Fusion, Ulead Media Shop, … Vídeo: Software de tratamiento y edición Las herramientas para TDV presentan un aspecto común de cara al usuario: - Se basan en una representación gráfica de lo que es una edición A/B: dos mesas de originales, pista de secuencia final y generador de efectos de vídeo. - Cada mesa presenta una serie de pistas de vídeo y audio en las que se pueden cargar secuencias de vídeo digital. Se representan como líneas de tiempo con especificación SMPTE. Vídeo: Software de tratamiento y edición Herramientas: • Cortar, copiar, pegar • Situación de marcas • Croma-keying (no sólo en azul), mezcla Titulación: • Utilización de tipos TrueType o Adobe Type1 • Antialiasing Vídeo: Software de tratamiento y edición Efectos especiales, transiciones, filtros: • Dissolve, wipe, explosiones • Definibles por el usuario • Enchufables (terceras partes) Sonido: • No son editores completos de sonido, sólo ofrecen posibilidades simples de edición: cortar, pegar, fades, etc. • Los más avanzados: eco, reverberación, amplificación… Vídeo: Software de tratamiento y edición Ejemplo: Superposición de clips para una transición Vídeo: Software de tratamiento y edición Ejemplo: Filtro de color aplicado en el tiempo (postpro) Vídeo: Software de tratamiento y edición Salida: • Grabación por campos para paso a VTR • Grabación como vídeo digital (selección de codec) • Posibilidad de salida EDL (lista de edición) para trabajar sobre edición analógica o mezclas posteriores. Vídeo: Distribución • El vídeo se puede distribuir sobre las redes como un fichero de descarga, y puede ser por streaming o por descarga progresiva. • La descarga progresiva significa que la película comienza a mostrarse cuando el tiempo necesario para descargar los frames siguientes es menor que el tiempo que tomaría visualizar la película completa. Vídeo: Distribución • En streaming, cada frame se visualiza a medida que va llegando. • El streaming permite transmisión de video en vivo y no requiere guardar un fichero en el disco del usuario, pero requiere tener un ancho de banda suficiente para entregar los frames a la velocidad suficiente para que sean visualizados. Vídeo: Distribución • Comparativa Concepto Descarga Streaming Pérdida de información Imposible Probable Servidor Servidor web estándar Servidor específico para streaming Protocolo de red TCP/IP UDP/IP Protocolo de ejecución HTTP RTP Calidad de la señal No hay pérdida de información. Alta calidad. Puede sufrir pérdidas en la señal.Calidad variable. Inicio de la reproducción Comienza cuando el archivo ha sido descargado por completo Casi inmediata Vídeo: Distribución • • El emisor envía la señal de vídeo a un servidor de streaming, mediante un software que recoge la señal de audio y vídeo entrante al PC (p.ej. desde una tarjeta de sonido o desde una mesa de mezclas), codificarla al bitrate al que quiera emitir la señal y enviar esa señal codificada a los servidores de streaming. La audiencia se conecta al servidor de streaming para ver la emisión, para lo que necesitan tener instalado un reproductor multimedia en el ordenador: Windows Media Player, Real Video, Flash o Quicktime Vídeo: Distribución Streaming: Tipos • Bajo demanda: es el método más habitual. El contenido multimedia está almacenado en un archivo en un servidor de streaming y a él los usuarios pueden acceder en cualquier momento. Al acceder al fichero comienza la reproducción, pero el usuario puede controlarla (ir hacia delante, hacia atrás, parar...). Múltiples usuarios pueden acceder simultáneamente al mismo contenido. • Emisión programada: el contenido está almacenado en un servidor streaming y su reproducción comienza en un instante determinado. Todos los usuarios visualizan a la vez el contenido y no pueden controlar la reproducción. • “En vivo”: el contenido se visualiza al mismo tiempo que se genera (no está almacenado). Vídeo: Distribución Servidores “streaming”: características • Control de flujo: se intenta mantener una velocidad de trasferencias estable, sin picos. • Protección frente a “pérdidas” (“skip protection”): aprovecha el exceso de banda para ir almacenando en el buffer; si algún paquete se pierde echará mano del buffer para volver a trasmitir sólo lo perdido. • Adaptación al ancho de banda: optimiza la calidad del archivo multimedia en función del ancho de banda disponible • Protección de datos: el contenido se reproduce pero no se almacena con lo que se protegen los derechos de autor. Vídeo: Distribución Reproductores de “streaming” • Existen tres arquitecturas principales - Real Media Windows Media Quicktime • Los reproductores correspondientes se integran como plugins en los navegadores Web. • Es necesario que el archivo de vídeo o de audio esté codificado en el formato adecuado – Audio: ra (g2), wma, vorbis,… – Vídeo: asf, rm, mov, vdo,… Vídeo: Distribución • Una arquitectura multimedia provee de un API para la captura, ejecución y compresión; un formato contenedor; un servidor de streaming; y herramientas software. • Flash Video se utiliza ampliamente para video Web. Los ficheros FLV se deben ejecutar con un Flash Player con un SWF que controle la visualización del video (o con un componente extra) Vídeo: Distribución • QuickTime y DirectShow son las arquitecturas multimedia que se incluyen en Mac OS X y en Windows, respectivamente. Sus formatos de ficheros son MOV y WMV. • Ambos permiten el uso de diferentes codecs, incluyendo H.264/AVC y WMV9, y permiten leer y escribir con varios formatos adicionales de ficheros, como MP4 y AVI. Vídeo: Distribución • OGG es un formato abierto, que puedes usarse con el codec Theora para producir películas no sujetas a restricciones o licencias. • Web video puede necesitar que se reduzca su tamaño de frame o frame rate antes de comprimirlo y exportarlo en un formato adecuado (MP4 o FLV), que puede visualizarse en la mayor parte de sistemas. Referencias - Multimedia Lecturas recomendadas sobre codificación de audio – http://en.wikipedia.org/wiki/Category:Audio_codecs • Digital Multimedia, N. Chapman & J. Chapman, Wiley 2013. – Capítulos 8 (Audio) • http://www.digitalmultimedia.org/slide_sets/8 Referencias - Multimedia Lecturas recomendadas sobre codecs de vídeo: – Comparativa: http://en.wikipedia.org/wiki/Comparison_of_video_codecs – Revisión anual, MSU Video Group: http://www.compression.ru/video/index.htm – Otros: http://www.doom9.org/index.html?/codecs-203-1.htm • Digital Multimedia, N. Chapman & J. Chapman, Wiley 2013. – Capítulos 6 (Vídeo) • http://www.digitalmultimedia.org/slide_sets/6