Tema 3. Gestión de proyectos de desarrollo multimedia y sistemas

Anuncio
Tema 3. Gestión de proyectos de desarrollo
multimedia y sistemas web.
Elementos de diseño.
Contenido dinámico
30258- Diseño Centrado en el Usuario.
Diseño para la Multimedia
Dra. Sandra Baldassarri
Objetivos
Desarrollo de proyectos multimedia y sistemas web
utilizando técnicas de diseño centrado en el usuario.
• Características de las aplicaciones multimedia y web
• Definición de elementos multimedia:
–
–
–
–
Texto
Imagen / Gráficos
Audio
Video / Animaciones
• Algunas consideraciones prácticas:
– Diseño para web. Guías de estilo.
Aplicaciones Multimedia
Multimedia o hipermedia (no sólo texto):
• Sistemas hipertexto + medios adicionales
– Ilustraciones, fotografías, videos, sonidos, etc…
• Enlaces y “hotspots” pueden formar parte de los
medios
– Áreas de imágenes
– Tiempos y ubicaciones en los videos
• El contenido puede ser:
– Estático
– Dinámico (basado en tiempo)
30258 – Diseño Centrado en el Usuario –
Diseño para la Multimedia
Contenido Dinámico: Audio
Existen dos tipos fundamentales de sonido:
- Habla
- Otros sonidos
El tratamiento digital del habla cubre tres aspectos:
Codificación del habla: para la comunicación entre
personas, relacionado con la conversión A/D y la
compresión de la señal digital.
Síntesis del habla: para la comunicación entre máquina y
persona
Reconocimiento y comprensión del habla: para la
comunicación entre persona y máquina
Audio
Otros sonidos:
El sonido audible consiste en ondas sonoras que se
producen cuando las oscilaciones de la presión del
aire se convierten en vibraciones detectadas por el
oído humano. Estas vibraciones se convierten en
impulsos nerviosos que son percibidos por el cerebro.
El oído humano detecta frecuencias de sonido entre
20Hz y 20kHz.
Audio: digitalización
Conversión
Analógico/Digital
A sound wave, in red, represented digitally, in blue
(aftersampling and 4-bit quantization).
Audio: digitalización
• A partir de micrófono, sintetizador, grabaciones en
cinta, emisiones en vivo de radio y TV, CDs y discos.
• Los sonidos digitalizados son muestras de sonido.
Cada enésima fracción de segundo se toma una
muestra y se guarda como información en bits o
bytes.
Audio: digitalización
• Velocidad de muestreo: frecuencia con que se
toman las muestras. Las velocidades de muestreo
más usadas son: Calidad CD 44.1 kHz, 22.05 kHz y
11.025 kHz.
• Tamaño de la muestra: cantidad de información
almacenada de cada muestra. Los tamaños de
muestras más usados son: 8 y 16 bits.
Audio: digitalización
El valor de cada muestra se redondea al entero más
próximo (cuantización) y si la amplitud es más grande
que el intervalo disponible se hace un recorte
(clipping) de la parte alta o baja de la onda .
Audio: digitalización
El ruido en la cuantización se puede suavizar mediante
el dithering agregando ruido al azar para suavizar
transiciones.
Audio digital
• Representación real de un sonido, almacenado en
forma de miles de números individuales llamados
muestras.
• Los datos digitales representan la amplitud
instantánea (volumen) de un sonido en períodos
pequeños de tiempo.
• Ocupan mucho espacio, pero no son dependientes
del dispositivo.
MIDI
• Estándar de comunicaciones para instrumentos
musicales electrónicos y computadoras (1980).
• Permite la comunicación entre la música y los
sintetizadores de sonido de diferentes fabricantes
enviando mensajes.
• Protocolo para pasar descripciones detalladas de
una partitura musical como notas, secuencias de
notas e instrumentos.
• Lista de órdenes de grabaciones de acciones
musicales que, cuando se envían a un dispositivo de
reproducción MIDI, produce sonido. No es sonido
digitalizado.
MIDI
QuickTime incorpora una funcionalidad “tipo-MIDI”.
Las pistas de MIDI se pueden combinar con audio, con
video u otro tipo de medios suportados por QuickTime.
Compresión de audio
El sonido es más difícil de comprimir que las imágenes,
especialmente utilizando métodos de compresión sin
pérdidas.
A grandes rasgos, la compresión de audio puede hacerse:
– Dominio del tiempo: más fáciles de implementar pero requieren
más de 10 bits de muestra
– Dominio de frecuencias: utilizan 3 bits por muestra y se basan en
la percepción auditiva y en el enmascaramiento psicoacústico.
Existen numerosas técnicas de compresión, con y sin
pérdidas, las más comunes son las que se basan en la
codificación diferencial.
Compresión de audio
Hay tres esquemas de codificación diferencial:
• DPCM
• Modulación delta
• ADPCM
Compresión de audio
DPCM = Simple Differential Pulse Code Modulation
Se toma como valor predecido el valor de la señal en
el instante anterior
señal inicial
señal codificada mediante DPCM
amplitud
amplitud
T
tiempo
se necesitan menos bits
para codificar la diferencia
tiempo
Modulación Delta
Modulación delta
Es una forma particular de codificación DPCM en la cual la
diferencia entre el valor actual y el valor siguiente se codifica
con un solo bit. Este bit indica si el valor de la señal se
incrementa o se decrementa en un 'quantum’. Esta técnica es
adecuada para señales cuyos valores no cambian muy
rápidamente para una frecuencia de muestreo dada.
señal inicial
señal codificada mediante
delta modulation
amplitud
amplitud
T
tiempo
tiempo
ADPCM
ADPCM = Adaptive Differential Pulse Code Modulation
Es una versión sofisticada del método DPCM. En lugar
de usar una función de predicción constante, la
estimación varía adaptándose a las características de
la señal. El valor siguiente se obtiene extrapolando
los valores anteriores de la señal.
Compresión de audio
LPCM (Linear PCM):
• Variante de PCM que realiza compresión lineal. Se
utiliza en el formato WAV.
Mnidisc:
• Variante de ADPCM que elimina ciertos componentes
que no son audibles porque quedan enmascarados
mu-law/A-law:
• Sistema de compresión no lineal que permite utilizar
resolución a 8 bits pero ofrece una calidad sonora
próxima a 14 bits. Más rápido que ADPCM. Se utiliza en
telefonía.
MPEG1 Layer 3 (mp3)
• En 1997 el Instituto Fraunhofer ideó un codec capaz
de comprimir audio sin pérdida de calidad apreciable.
En 1992 MPEG aprobó la tecnología y nació el MP3
(MPEG-1 Audio Layer 3).
• Permite compresiones de 12:1 y superiores.
• No pierde calidad de sonido de forma apreciable (por
un oído no entrenado).
• mp3 utiliza unos cuantos trucos para comprimir el
sonido, aprovechando la manera en la que el oído
humano percibe el sonido.
MPEG1 Layer 3 (mp3)
• Se basa en las limitaciones del oído humano, que sólo es
capaz de captar las frecuencias entre 20Hz y 20 kHz y es
más sensible entre 2 y 4 kHz. De esta forma elimina las
frecuencias inaudibles conservando la esencia del sonido.
• Al obtener un MP3 se puede seleccionar la codificación y
compresión que se desea (nivel de calidad). A
128kbits/44kHz estéreo se consigue un buen equilibrio
entre calidad y compresión. Es el nivel por defecto en los
compresores disponibles en la red.
• Se han realizado estudios de percepción para verificar la
calidad obtenida.
MPEG1 Layer 3 (mp3)
Umbral mínimo de audición
– No es lineal, el margen de percepción real es menor que el teórico
Cualquier sonido fuera no es necesario codificarlo
Efecto máscara
– Los sonidos fuertes no dejan oír los débiles
éstos se filtran
– Existe máscara temporal cuando no se percibe un sonido antes o
después de un sonido más fuerte
Reserva de bytes
– Partes más comprimidas dejan espacio a las menos comprimibles
para mantener el flujo constante (VBR)
Fusión de estéreo
– En determinadas frecuencias el oído no percibe el punto de
emisión del sonido
MPEG1 Layer 3 (mp3)
• Su utilidad:
– En un CD de 80 minutos caben 80 minutos de música en formato
CD-Audio y 700 minutos de música en formato MP3 (unos 11
CD’s de audio) - estéreo con calidad 16 bits a 44hHz codificada
en MP3 a 128kb/seg.
• Programas reproductores:
– WinAmp, RealOne Player, Music Match Jukebox, Windows
Media Player, Quicktime, Flash,…
• Para generar MP3 a partir de CD-Audio:
– Musicmatch Jukebox, Real Jukebox, EasyMP3,...
• Un CD con MP3 sólo podrá ser escuchado en equipos
reproductores compatibles.
Formatos de audio
Dolby Digital
• AC-3: es la versión más común, con 6 canales: 5.1
– 5 canales de ancho de banda completa (20 Hz a 20 kHz) +1
canal exclusivo para los sonidos de baja frecuencia (subwoofer)
– Compresión perceptual
• Dolby Digital EX / DD Sorround EX: 6.1
• Dolby Digital Live (DDL): 5.1, tiempo real, videojuegos,
…
• Dolby Digital Plus (E-AC-3): 13.1
• Dolby TrueHD: hasta 14 canales para HD DVD y Blu-ray
Formatos de audio
AAC (MPEG-4 Advanced Audio Coding)
• Este códec está orientado a usos de banda ancha y se
basa en la eliminación de redundancias de la señal
acústica, así como en compresión mediante la
transformada de coseno discreta modificada (MDCT), y
en utilizar VRB, muy parecido a MP3.
– Produce una mejor calidad que MP3 en archivos pequeños y
requiere menos recursos del sistema para codificar y
descodificar.
• Formato elegido por Apple para iPods y para iTunes.
También es utilizado por Ahead Nero, Winamp y
Nintendo DSi.
Formatos de audio
AAC (MPEG-4 Advanced Audio Coding)
Formatos de audio
AAC (MPEG-4 Advanced Audio Coding)
• Ventajas con respecto a MP3
– El formato AAC soporta sonido multicanal lo cual resulta un códec de
audio apropiado para el sonido envolvente de 6 o más altavoces. MP3
sólo permite, en su formato base, sonido estéreo.
– Puede alcanzar una frecuencia de muestreo de 96khz, utilizado en
estudios de grabación. MP3 está diseñado sólo para la reproducción y
para alcanzar hasta 48khz.
– La calidad de sonido es considerablemente superior al mismo bitrate.
Un archivo de audio en AAC-HC codificado a 64kbps puede ofrecer una
calidad similar a un MP3 codificado a 128kbps.
– Incluso a bitrates muy bajos (<32kbps) el sonido sufre poca pérdida en
comparación con el MP3 (útil para codificar ficheros de audio de
tamaño muy pequeño o para codificar diálogos)
Formatos de audio
WAV: Formato Waveform
• Es el más usado y soportado por plataformas Windows.
• Almacena información sobre el número de pistas (mono o
estéreo), frecuencia de muestreo, profundidad de bits,
igualmente que datos raw de audio no comprimidos.
• La codificación más usual utiliza el formato “Linear Pulse
Code Modulation” (LPCM)
• La calidad depende de la combinación de parámetros
seleccionada:
– resolución o tamaño de la muestra (8, 16, 20, 24 bit, etc), frecuencia de
muestreo (e.g. 8000, 11025, 16000, 22050, 24000, 32000, 44100,
48000 Hz / “muestras por segundo", etc), signo (con o sin), número de
canales (monaural, estéreo, cuadrafónico, etc), orden de los bits (little
endian, big endian).
Formatos de audio
Otros formatos
• AU: Formato NeXT/Sun. Multiplataforma
• VOX: Útil para grabaciones de voz. Alto grado de
compresión (50:1) pero con baja calidad.
• AIFF: Formato Audio Interchange Format, de Apple.
Sin compresión.
• TSP: Formato TrueSpeech de DSP. Muy buena
calidad, compresión 15:1
Formatos de audio
Otros formatos
• GSM: Esquema de compresión para voz,
originalmente para teléfonos celulares, que ha
ganado uso en aplicaciones de telefonía en Internet.
• RA: Formato Progressive Networks Real Audio. Muy
popular. Compresión 20:1.
• OGG Vorbis (GNU). Basado en streaming. Muy
buena calidad (mejor que mp3). Las películas con
audio OGG llevan extensión OGM.
• WMA (Windows Media Audio). Sonido Sorround.
También basado en streaming.
Audio: Herramientas de Autor
Son numerosas las herramientas que permiten trabajar
con sonido digital:
• Plataformas Windows: Cool Edit, Goldware,
WaveEdit, Stereo Studio FX
• Plataformas Mac: Sound Edit Pro, Alchemy y Audio
Track
• Profesionales: Sonic Foundry’s Sound Fong (PC),
Digidesign’s Pro Tools (Mac)
• Y otros como: FreeAmp, WinAmp, PhatNoise,
FreeRIP MP3
Audio: Herramientas de Autor
Las operaciones básicas de edición de sonidos que se
necesitan en las producciones multimedia son:
–Recortes
–Uniones
–Ajustes de volumen
–Conversión de Formatos
–Remuestreo y muestreo a baja velocidad
–Desvanecimiento
–Ecualización
–Ajustes de tiempos
–Procesamiento digital de señales
–Sonido a la inversa
Referencias - Multimedia
Lecturas recomendadas sobre codificación de audio
– http://en.wikipedia.org/wiki/Category:Audio_codecs
• Digital Multimedia, N. Chapman & J. Chapman,
Wiley 2013.
– Capítulos 8 (Audio)
• http://www.digitalmultimedia.org/slide_sets/8
Descargar