Formatos y Medios Digitales de Reproducción de Audio

Anuncio
Formatos y Medios Digitales de Reproducción de Audio
¿….CD, DTRS, MD, CD-DTS, AAC, DVD-V, VCD, SDII, DVD-A, SACD, DAT, AC3,
DTS, MP3, DASH, WAV, MPEG-2, AIFF, BWF….? Que no te vean la cara de what!
Primera Parte
La cantidad de formatos y medios digitales de reproducción de audio que existen hoy en
día es tan extensa que tanto el consumidor como el profesional se pierden en las
definiciones. Además, suele ser difícil recordar cuales son las ventajas de unos
comparados a los otros.
El propósito de este artículo es de repasar las características de cada uno de ellos y de dar
una referencia de las capacidades, ventajas y desventajas que cada formato presenta.
Lo primero es dividir los diferentes grupos existentes. Para simplificar las cosas vamos a
considerar dos grandes familias:
La de los medios físicos de reproducción de audio como un DAT o un CD, que
llamaremos Formatos Físicos, y la de los formatos de audio que no se pueden ni ver ni
tocar, como un WAV, y que llamaremos Formatos No-Físicos.
De los formatos físicos nacen cuatro categorías: los CD’s, los DVD’s, el Mini Disc y la
cinta de carrete. Dentro de los no-físicos caben otras dos: los formatos que usan
compresión “lossy", y los que usan compresión “lossless”.
Físicos
CD’s
CD
VCD
CD-DTS
SACD
DVD’s
DVD-V
DVD-A
Cintas Digitales MD
DAT
Mini Disc
DTRS
DASH
Cinta de 1/2”
No-Físicos
Lossy
AAC
MP3
MPEG-2
MPEG-1
DTS
Dolby Digital
AC3
Lossless
AIFF
WAV
BWF
SDII
MLP
Formatos Físicos
CD’s
CD-DA: mejore conocido como CD, es aún el medio más común de distribución y
reproducción de audio. El disco compacto CD reproduce audio PCM linear1 con una
resolución de 16bits/44.1kHz. Es un disco óptico de 12cm de diámetro capaz de reproducir
hasta 80 minutos de audio (en un disco de 700MB) o 74min de audio (en un disco de
650MB). La información en el disco es codificada usando una técnica llamada Velocidad
1
“audio PCM linear” se refiere a audio PCM que no lleva compresión.
Linear Constante que ofrece hasta 90dB de signal-to-noise ratio y mantiene total calidad
de reproducción sin degradación del audio. El estándar de este formato es conocido como
el Red Book. Básicamente, el Red Book es una serie de especificaciones que determinan
entre otras cosas que el CD sea un disco compacto de audio PCM 16b/44.1kHz. Un CDRom, por ejemplo, lleva el estándar Yellow Book, el cual contiene otras especificaciones.
El nombre oficial del CD es CD-DA (compact disc-digital audio).
VCD: Es un CD que puede reproducir audio y video (video-cd). Sin embargo para poder
guardar 80 minutos de video con sonido estéreo en un VCD es indispensable comprimir la
información. Para esto se usa un tipo de compresión lossy llamada MPEG (formato NoFísico que degrada la calidad del sonido). Un VCD puede ser reproducido en casi
cualquier reproductor de DVD o en cualquier computadora con un CD-ROM; puede
contener menús, capítulos, imágenes y data además del video. La calidad audio visual de
un VCD es casi tan buena como la de la VHS. La ventaja a comparación de un CD es que
el VCD puede reproducir audioy video. La desventaja es que el audio pierde calidad. Las
especificaciones contenidas en VCD son determinadas por el White Book estándar.
CD-DTS: El CD-DTS es un CD capaz de reproducir 6 canales de audio (en vez de solo 2
como un CD normal). Esto permite la reproducción y distribución de sonido Surround 5.1
en CD. Para que esto sea posible el audio es codificado usando DTS que es un tipo de
compresión lossy que degrada la calidad del sonido. Sin embargo es muy cómodo poder
guardar y reproducir mezclas Surround 5.1 en un CD. Codificadores DTS como el
SurCode CD-DTS codifican 6 canales de audio (wav o aiff - 44.1kHz) a un solo archivo
wav 5.1 que puede ser quemado a CD. Digital Theater Systems, o DTS, es un formato nofísico y será explicado en detalle en la segunda parte de este artículo.
SACD: El Super Audio CD fue desarrollado por Phillips y Sony con el afán de crear un
formato de mayor capacidad y con una calidad de audio superior a todos los demás. El
SACD usa un tipo de conversión análoga-digital llamada DSD2 la cual usa una resolución
de 1bit y una frecuencia de sampleo de 2.8MHz (64 veces la frecuencia de un CD). Este
disco es idéntico a un disco compacto CD con la diferencia que usa dos “capas” de
información. Una reproduce audio DSD y la otra reproduce audio PCM. La capa de audio
DSD puede reproducir hasta 8 canales de audio DSD; 6 canales se usan para la mezcla
Surround 5.1 y 2 para la mezcla estéreo. La capa de audio PCM solo es capaz de
reproducir audio estéreo a 16b/44.1kHz.
A los discos que usan dos capas se les dice “Híbridos”. Sin embargo no todos los SACD
so híbridos. Si usted compra un SACD se debe de fijar si el disco indica “Hybrid SACD” o
solo SACD. Si dice “Hybrid” entonces ese disco usa las dos “capas”; la capa PCM puede
ser leída por cualquier reproductor de discos compactos pero la capa DSD necesita de un
reproductor DSD. Si el disco no indica ser híbrido entonces solo contiene una capa DSD y
solo podrá ser leído por reproductores de SACD. De igual manera, no todos los SACD
2
DSD = Direct Stream Digital
traen mezclas Surround 5.1. Si el disco no indica Surround Sound 5.1 entones la mezcla
solo será en estéreo.
Algunos reproductores de DVD ya traen la posibilidad de leer DVD’s y SACD’s. Pioneer
es una de las empresas que proporcionan tales aparatos como lo es el DV-563A Universal
Disc Player. Phillips y Sony también venden sus propios reproductores de SACD.
DVD
El DVD salió al mercado en 1996 como una versión mas avanzada del CD ya que era
capaz de guardar video, audio, fotos y data para la computadora. Desde entonces varios
tipos de DVD’s han surgido. Por lo general se entiende que sus siglas en ingles significan
digital-video-disc, pero visto los avances que este formato ha dado al pasar de los años, es
probablemente más apropiado definirlo como digital-versatil-disc.
DVD-V: DVD-Video es un DVD capaz de guardar alrededor de 2 horas de video de alta
calidad (High Quality video) junto con audio estéreo y/o Surround 5.1. El audio debe de
ser codificado con Dolby Digital AC3, DTS, MPEG-1 o MPEG-2. El tiempo de audio y
video que caben en el disco dependen del tipo de codificación utilizada. En lo que
concierne el mundo de la música, los DVD-V no son la mejor opción para la reproducción
de música en Surround 5.1 ya que los 6 canales deben ser codificados usando algún tipo de
compresión lossy y la decodificación puede variar de un sistema al otro. Dado que el
DVD-V le da prioridad al video nunca se ven dvd’s de audio PCM linear con mezclas
Surround 5.1. Sin embargo esto es posible, nada mas que no se implementa. Lo que si es
recurrente es que contengan audio estéreo PCM linear a 48 o 96kHz con resoluciones de
16, 20 o 24bits. Es importante saber que un DVD-V no codifica audio que haya sido
grabado o mezclado a 44.1kHz. La menor frecuencia de sampleo posible es de 48kHz así
que si su mezcla está a 44.1kHz será necesario hacer un up-sampling3 antes de poder
ponerla en un DVD-V.
DVD-A: el DVD-Audio hizo su aparición en el 2000. Como su nombre lo indica este
formato da prioridad a la reproducción de audio y no de video. El DVD-A puede
reproducir hasta 6 canales de audio linear PCM (audio no comprimido). Tiene la gran
ventaja de poder combinar resoluciones y frecuencias de sampleo distintas. Por ejemplo,
es posible crear un DVD-A donde el primer track sea una mezcla Surround 5.1 a
24b/96kHz, el segundo sea una mezcla estéreo 24b/48k, el tercero sea estéreo
16b/44.1kHz, el cuarto sea 5.1a 24b/192kHZ, etc. Esto da gran flexibilidad al ingeniero
que desea guardar diferentes mezclas en un mismo disco sin tener que estar cambiando de
resolución o de frecuencia de sampleo.
Los DVD-A también tienen un cierta cantidad de espacio para guardar video, fotos, textos
o diseños. La diferencia con el DVD-V es que el espacio reservado a ese propósito es
3
up-sampling: conversión del audio a una frecuencia de sampleo mayor que la original.
mucho menor. Dentro de este espacio también se puede guardar audio que acompañe la
imagen pero debe de ser codificado con Dolby Digital AC3.
Hay varios programas que queman DVD-A. Dos de ellos son DiskBuilder o Minnetonka
Audio Chrome,. Estos son relativamente baratos y muy fáciles de usar. Hoy por hoy el
DVD-A es la mejor opción para distribución y reproducción de música en Surround 5.1 ya
que reproduce 6 canales audio PCM linear a resoluciones y frecuencias de sampleo
distintas.
Cinta Digital
DAT: El DAT es una cinta digital capaz de grabar y reproducir dos canales de audio PCM
linear con una resolución de 16bits y frecuencias de sampleo de 44.1kHz o 48kHz4. El
Digital Audio Tape surgió a finales de los ochenta y se volvió muy popular ya que su
tamaño es dos veces mas pequeño que el de un casete análogo5. Hoy en día el DAT sigue
siendo un formato primordial en el mundo de la grabación de sonido para cine y video, pero
en el mundo de la producción musical se le ve menos. El DAT logra tener un Bit Rate6 tan
elevado como el de un CD gracias a que usa una cabeza rotatoria similar a la de videograbadora. Esto permite que la velocidad a la cual se graba y se lee la información se
mantenga elevada no obstante el hecho que la cinta en realidad corra lentamente
(1pulgada/segundo). Gracias a esto es posible que un DAT contenga hasta 180minutos de
sonido. A esta técnica se le llama Helican Scan y es la técnica utilizada también en la
grabadoras de video-casetes.
DTRS Las cintas DTRS (Digital Tape Recording System) son cintas digitales capaces de
guardar y reproducir 8 canales de audio PCM a 16bits y 44.1 o 48kHz. El DTRS es idéntico
a un Hi8 video-casete. Estas cintas son físicamente mas grandes que un DAT o que un
casete análogo. No obstante, su tamaño es más bien pequeño y resulta mucho mas práctico
que una cinta de carrete de media pulgada. La introducción de las grabadoras Tascam
DA88 hicieron que este formato se volviera extremadamente popular tanto en el mundo de
la producción musical como en el mundo del audio para cine y video. Nuevas versiones de
estas grabadoras como la DA98 permiten grabar a 24bits. A esto se le denomina el HRMode (high resolution mode). Un DTRS que ha sido grabado a 24bits no podrá ser
reproducido en una maquina como la DA88 ya que no es de alta resolución7. La mayor
parte de las cintas DTRS pueden grabar hasta 120min de audio, incluyendo las que son
grabadas con el HR-Mode.
Cinta de 1/2” o DASH: las cintas de media pulgada (1/2”) utilizadas en grabadoras como
la Sony3348 o la Studer-D827 son también conocidas como cintas DASH. En realidad uno
se debe referir a la grabadora como una máquina DASH y no a la cinta ya que esta es
4
5
6
También se puede grabar a 32khz con una resolución de 12 bits lo cual alarga la duración de la grabación.
La cinta de un DAT es de 4mm.
Bit Rate se refiere al numero de bits que se usan por segundo para representar la señal digital. Este esta directamente
relacionado con la calidad del sonido: a mayor bit rate mayor calidad.
7
Las únicas dos grabadoras Tascam DTRS de alta resolución de son la DA-78HR y la DA-98HR.
simplemente una cinta de carrete de media pulgada. Las siglas indican la tecnología
utilizada por estas máquinas. DASH en ingles significa Digital Audio Stationary Head.
Habíamos visto que el DAT usa una cabeza rotatoria que permite que la cinta corra
lentamente mientras que la información transferida es elevada. En el caso de las máquinas
DASH la cinta debe correr mucho mas rápidamente ya que usan cabezas estacionarias.
Dependiendo del largo de la cinta se puede grabar mas o menos tiempo. Usando la
Sony3348, dentro de una cinta de media pulgada se pueden grabar 48 canales de audio
PCM linear a 16/20bits y a 44.1/48kHz. Es importante saber que la cinta también es capaz
de guardar 24 canales a 24bits. En este caso los canales 25 a 48 son usados para guardar los
4 extra bits. Sin embargo la máquina no trae convertidores de 24bits. La conversión de alta
resolución necesita hacerse antes de llegar a la grabadora.
MD
MD: El MiniDisc es un disco óptico similar al CD pero mucho mas pequeño. En este se
puede guardar cualquier tipo de información digital pero por lo general es usado para
grabación y reproducción de audio. Por lo general los discos son de 60, 74, u 80 minutos.
La ventaja del MD comparado a un CD o un DAT es que se puede regrabar un millón de
veces sin afectar la calidad del audio. La desventaja es que el MD usa compresión de tipo
lossy. En el caso de los aparatos SONY esta compresión es llamada ATRAC. Otras
empresas usan distintos algoritmos pero todos se basan en los mismos conceptos
psicoacústicos de codificación. Los nuevos MiniDisk de SONY usan una mejor compresión
llamada ATRAC3plus y que permite la grabación de hasta 300 minutos de música en un
disco de 74minutos.
La siguiente tabla muestra los distintos formatos que cada medio puede contener y las
diversas características de cada formato dependiendo del medio que lo reproduce:
MEDIO
Formato
Canales
Bit Rate
Por lo General
Compresión
PCM
Frecuencia de Resolución
Sampleo
44.1kHz
16bits
CD
2
1,411kbps
ninguna
DTS
44.1kHz
16bits
5.1
1.234Mbps
16b/44.1kHz
estéreo
1.234Mbps 5.1
PCM
44.1kHz
16bits
2
1,411kbps
DSD
2.8MHz
1bit
8
22.4Mbps
PCM
48/96kHz
16/20/24bits
8
Dolby Digital 48kHz
AC-3
DTS
48/96kHz
16/20/24bits
6.1
6,144kbps
18,432kbps
64 a 448kbps
16/20/24bits
7.1
64 a 1,536kbps
MPEG-2
48kHz
16/20bits
7.1
32 o 912kbps
754kbps
estéreo DTS lossy
1,509.25kbps 5.1
----------------------- MPEG lossy
MPEG-1
48kHz
16/20bits
2
384kbps
----------------------- MPEG lossy
DVD-A
PCM
6
9.6Mbps
DAT
PCM
4
1,411kbps
5 o 5.1 canales a
96kHz/24-bit
usando MLP
16b/48kHz estéreo
DTRS
PCM
44.1/48/88.2/ 16/20/24bits
96/176.4/192
kHz
32/44.1/48
12/16bits
kHz
44.1/48kHz
16/24bits
8
Cinta de 1/2”
PCM
44.1/48kHz
48
Mini Disc
ATRAC3plus ---------------- -----------------
5,644kbps
a 16b/48kHz estéreo ninguna
9,216kbps
33.8Mbps
a 20b/48kHz estéreo ninguna
46Mbps
256/64/48kbps ----------------------- ATRAC3 Lossy
SACD
DVD-V
16/20/24bits
2
16b/44.1kHz
estéreo
DSD 5.1 y/o
DSD estéreo
a 16b/48kHz estéreo
192kbps estéreo
DTS
ninguna
ninguna
ninguna
AC-3 lossy
MLP
(Meridiean
Lossless packing)
ninguna
En la segunda parte de este artículo veremos los Formatos No-Físicos y explicaremos en
detalle de que se trata la compresión Lossy y Lossless. Por el momento este fue un recuento
de los medios y formatos físicos que tenemos a nuestra disposición para grabar y reproducir
audio en el mundo digital.
Alejandro de Icaza es graduado de la universidad de McGill con el titulo de Maestría en Ingeniería de
Sonido y licenciatura en Música y tecnología musical. Se especializa en el audio digital y en la grabación y
mezcla de música para sonido Surround 5.1. Actualmente vive en Montreal, Canadá, donde trabaja como
ingeniero de sonido y productor independiente.
[email protected]
Descargar