Formatos y Medios Digitales de Reproducción de Audio ¿….CD, DTRS, MD, CD-DTS, AAC, DVD-V, VCD, SDII, DVD-A, SACD, DAT, AC3, DTS, MP3, DASH, WAV, MPEG-2, AIFF, BWF….? Que no te vean la cara de what! Primera Parte La cantidad de formatos y medios digitales de reproducción de audio que existen hoy en día es tan extensa que tanto el consumidor como el profesional se pierden en las definiciones. Además, suele ser difícil recordar cuales son las ventajas de unos comparados a los otros. El propósito de este artículo es de repasar las características de cada uno de ellos y de dar una referencia de las capacidades, ventajas y desventajas que cada formato presenta. Lo primero es dividir los diferentes grupos existentes. Para simplificar las cosas vamos a considerar dos grandes familias: La de los medios físicos de reproducción de audio como un DAT o un CD, que llamaremos Formatos Físicos, y la de los formatos de audio que no se pueden ni ver ni tocar, como un WAV, y que llamaremos Formatos No-Físicos. De los formatos físicos nacen cuatro categorías: los CD’s, los DVD’s, el Mini Disc y la cinta de carrete. Dentro de los no-físicos caben otras dos: los formatos que usan compresión “lossy", y los que usan compresión “lossless”. Físicos CD’s CD VCD CD-DTS SACD DVD’s DVD-V DVD-A Cintas Digitales MD DAT Mini Disc DTRS DASH Cinta de 1/2” No-Físicos Lossy AAC MP3 MPEG-2 MPEG-1 DTS Dolby Digital AC3 Lossless AIFF WAV BWF SDII MLP Formatos Físicos CD’s CD-DA: mejore conocido como CD, es aún el medio más común de distribución y reproducción de audio. El disco compacto CD reproduce audio PCM linear1 con una resolución de 16bits/44.1kHz. Es un disco óptico de 12cm de diámetro capaz de reproducir hasta 80 minutos de audio (en un disco de 700MB) o 74min de audio (en un disco de 650MB). La información en el disco es codificada usando una técnica llamada Velocidad 1 “audio PCM linear” se refiere a audio PCM que no lleva compresión. Linear Constante que ofrece hasta 90dB de signal-to-noise ratio y mantiene total calidad de reproducción sin degradación del audio. El estándar de este formato es conocido como el Red Book. Básicamente, el Red Book es una serie de especificaciones que determinan entre otras cosas que el CD sea un disco compacto de audio PCM 16b/44.1kHz. Un CDRom, por ejemplo, lleva el estándar Yellow Book, el cual contiene otras especificaciones. El nombre oficial del CD es CD-DA (compact disc-digital audio). VCD: Es un CD que puede reproducir audio y video (video-cd). Sin embargo para poder guardar 80 minutos de video con sonido estéreo en un VCD es indispensable comprimir la información. Para esto se usa un tipo de compresión lossy llamada MPEG (formato NoFísico que degrada la calidad del sonido). Un VCD puede ser reproducido en casi cualquier reproductor de DVD o en cualquier computadora con un CD-ROM; puede contener menús, capítulos, imágenes y data además del video. La calidad audio visual de un VCD es casi tan buena como la de la VHS. La ventaja a comparación de un CD es que el VCD puede reproducir audioy video. La desventaja es que el audio pierde calidad. Las especificaciones contenidas en VCD son determinadas por el White Book estándar. CD-DTS: El CD-DTS es un CD capaz de reproducir 6 canales de audio (en vez de solo 2 como un CD normal). Esto permite la reproducción y distribución de sonido Surround 5.1 en CD. Para que esto sea posible el audio es codificado usando DTS que es un tipo de compresión lossy que degrada la calidad del sonido. Sin embargo es muy cómodo poder guardar y reproducir mezclas Surround 5.1 en un CD. Codificadores DTS como el SurCode CD-DTS codifican 6 canales de audio (wav o aiff - 44.1kHz) a un solo archivo wav 5.1 que puede ser quemado a CD. Digital Theater Systems, o DTS, es un formato nofísico y será explicado en detalle en la segunda parte de este artículo. SACD: El Super Audio CD fue desarrollado por Phillips y Sony con el afán de crear un formato de mayor capacidad y con una calidad de audio superior a todos los demás. El SACD usa un tipo de conversión análoga-digital llamada DSD2 la cual usa una resolución de 1bit y una frecuencia de sampleo de 2.8MHz (64 veces la frecuencia de un CD). Este disco es idéntico a un disco compacto CD con la diferencia que usa dos “capas” de información. Una reproduce audio DSD y la otra reproduce audio PCM. La capa de audio DSD puede reproducir hasta 8 canales de audio DSD; 6 canales se usan para la mezcla Surround 5.1 y 2 para la mezcla estéreo. La capa de audio PCM solo es capaz de reproducir audio estéreo a 16b/44.1kHz. A los discos que usan dos capas se les dice “Híbridos”. Sin embargo no todos los SACD so híbridos. Si usted compra un SACD se debe de fijar si el disco indica “Hybrid SACD” o solo SACD. Si dice “Hybrid” entonces ese disco usa las dos “capas”; la capa PCM puede ser leída por cualquier reproductor de discos compactos pero la capa DSD necesita de un reproductor DSD. Si el disco no indica ser híbrido entonces solo contiene una capa DSD y solo podrá ser leído por reproductores de SACD. De igual manera, no todos los SACD 2 DSD = Direct Stream Digital traen mezclas Surround 5.1. Si el disco no indica Surround Sound 5.1 entones la mezcla solo será en estéreo. Algunos reproductores de DVD ya traen la posibilidad de leer DVD’s y SACD’s. Pioneer es una de las empresas que proporcionan tales aparatos como lo es el DV-563A Universal Disc Player. Phillips y Sony también venden sus propios reproductores de SACD. DVD El DVD salió al mercado en 1996 como una versión mas avanzada del CD ya que era capaz de guardar video, audio, fotos y data para la computadora. Desde entonces varios tipos de DVD’s han surgido. Por lo general se entiende que sus siglas en ingles significan digital-video-disc, pero visto los avances que este formato ha dado al pasar de los años, es probablemente más apropiado definirlo como digital-versatil-disc. DVD-V: DVD-Video es un DVD capaz de guardar alrededor de 2 horas de video de alta calidad (High Quality video) junto con audio estéreo y/o Surround 5.1. El audio debe de ser codificado con Dolby Digital AC3, DTS, MPEG-1 o MPEG-2. El tiempo de audio y video que caben en el disco dependen del tipo de codificación utilizada. En lo que concierne el mundo de la música, los DVD-V no son la mejor opción para la reproducción de música en Surround 5.1 ya que los 6 canales deben ser codificados usando algún tipo de compresión lossy y la decodificación puede variar de un sistema al otro. Dado que el DVD-V le da prioridad al video nunca se ven dvd’s de audio PCM linear con mezclas Surround 5.1. Sin embargo esto es posible, nada mas que no se implementa. Lo que si es recurrente es que contengan audio estéreo PCM linear a 48 o 96kHz con resoluciones de 16, 20 o 24bits. Es importante saber que un DVD-V no codifica audio que haya sido grabado o mezclado a 44.1kHz. La menor frecuencia de sampleo posible es de 48kHz así que si su mezcla está a 44.1kHz será necesario hacer un up-sampling3 antes de poder ponerla en un DVD-V. DVD-A: el DVD-Audio hizo su aparición en el 2000. Como su nombre lo indica este formato da prioridad a la reproducción de audio y no de video. El DVD-A puede reproducir hasta 6 canales de audio linear PCM (audio no comprimido). Tiene la gran ventaja de poder combinar resoluciones y frecuencias de sampleo distintas. Por ejemplo, es posible crear un DVD-A donde el primer track sea una mezcla Surround 5.1 a 24b/96kHz, el segundo sea una mezcla estéreo 24b/48k, el tercero sea estéreo 16b/44.1kHz, el cuarto sea 5.1a 24b/192kHZ, etc. Esto da gran flexibilidad al ingeniero que desea guardar diferentes mezclas en un mismo disco sin tener que estar cambiando de resolución o de frecuencia de sampleo. Los DVD-A también tienen un cierta cantidad de espacio para guardar video, fotos, textos o diseños. La diferencia con el DVD-V es que el espacio reservado a ese propósito es 3 up-sampling: conversión del audio a una frecuencia de sampleo mayor que la original. mucho menor. Dentro de este espacio también se puede guardar audio que acompañe la imagen pero debe de ser codificado con Dolby Digital AC3. Hay varios programas que queman DVD-A. Dos de ellos son DiskBuilder o Minnetonka Audio Chrome,. Estos son relativamente baratos y muy fáciles de usar. Hoy por hoy el DVD-A es la mejor opción para distribución y reproducción de música en Surround 5.1 ya que reproduce 6 canales audio PCM linear a resoluciones y frecuencias de sampleo distintas. Cinta Digital DAT: El DAT es una cinta digital capaz de grabar y reproducir dos canales de audio PCM linear con una resolución de 16bits y frecuencias de sampleo de 44.1kHz o 48kHz4. El Digital Audio Tape surgió a finales de los ochenta y se volvió muy popular ya que su tamaño es dos veces mas pequeño que el de un casete análogo5. Hoy en día el DAT sigue siendo un formato primordial en el mundo de la grabación de sonido para cine y video, pero en el mundo de la producción musical se le ve menos. El DAT logra tener un Bit Rate6 tan elevado como el de un CD gracias a que usa una cabeza rotatoria similar a la de videograbadora. Esto permite que la velocidad a la cual se graba y se lee la información se mantenga elevada no obstante el hecho que la cinta en realidad corra lentamente (1pulgada/segundo). Gracias a esto es posible que un DAT contenga hasta 180minutos de sonido. A esta técnica se le llama Helican Scan y es la técnica utilizada también en la grabadoras de video-casetes. DTRS Las cintas DTRS (Digital Tape Recording System) son cintas digitales capaces de guardar y reproducir 8 canales de audio PCM a 16bits y 44.1 o 48kHz. El DTRS es idéntico a un Hi8 video-casete. Estas cintas son físicamente mas grandes que un DAT o que un casete análogo. No obstante, su tamaño es más bien pequeño y resulta mucho mas práctico que una cinta de carrete de media pulgada. La introducción de las grabadoras Tascam DA88 hicieron que este formato se volviera extremadamente popular tanto en el mundo de la producción musical como en el mundo del audio para cine y video. Nuevas versiones de estas grabadoras como la DA98 permiten grabar a 24bits. A esto se le denomina el HRMode (high resolution mode). Un DTRS que ha sido grabado a 24bits no podrá ser reproducido en una maquina como la DA88 ya que no es de alta resolución7. La mayor parte de las cintas DTRS pueden grabar hasta 120min de audio, incluyendo las que son grabadas con el HR-Mode. Cinta de 1/2” o DASH: las cintas de media pulgada (1/2”) utilizadas en grabadoras como la Sony3348 o la Studer-D827 son también conocidas como cintas DASH. En realidad uno se debe referir a la grabadora como una máquina DASH y no a la cinta ya que esta es 4 5 6 También se puede grabar a 32khz con una resolución de 12 bits lo cual alarga la duración de la grabación. La cinta de un DAT es de 4mm. Bit Rate se refiere al numero de bits que se usan por segundo para representar la señal digital. Este esta directamente relacionado con la calidad del sonido: a mayor bit rate mayor calidad. 7 Las únicas dos grabadoras Tascam DTRS de alta resolución de son la DA-78HR y la DA-98HR. simplemente una cinta de carrete de media pulgada. Las siglas indican la tecnología utilizada por estas máquinas. DASH en ingles significa Digital Audio Stationary Head. Habíamos visto que el DAT usa una cabeza rotatoria que permite que la cinta corra lentamente mientras que la información transferida es elevada. En el caso de las máquinas DASH la cinta debe correr mucho mas rápidamente ya que usan cabezas estacionarias. Dependiendo del largo de la cinta se puede grabar mas o menos tiempo. Usando la Sony3348, dentro de una cinta de media pulgada se pueden grabar 48 canales de audio PCM linear a 16/20bits y a 44.1/48kHz. Es importante saber que la cinta también es capaz de guardar 24 canales a 24bits. En este caso los canales 25 a 48 son usados para guardar los 4 extra bits. Sin embargo la máquina no trae convertidores de 24bits. La conversión de alta resolución necesita hacerse antes de llegar a la grabadora. MD MD: El MiniDisc es un disco óptico similar al CD pero mucho mas pequeño. En este se puede guardar cualquier tipo de información digital pero por lo general es usado para grabación y reproducción de audio. Por lo general los discos son de 60, 74, u 80 minutos. La ventaja del MD comparado a un CD o un DAT es que se puede regrabar un millón de veces sin afectar la calidad del audio. La desventaja es que el MD usa compresión de tipo lossy. En el caso de los aparatos SONY esta compresión es llamada ATRAC. Otras empresas usan distintos algoritmos pero todos se basan en los mismos conceptos psicoacústicos de codificación. Los nuevos MiniDisk de SONY usan una mejor compresión llamada ATRAC3plus y que permite la grabación de hasta 300 minutos de música en un disco de 74minutos. La siguiente tabla muestra los distintos formatos que cada medio puede contener y las diversas características de cada formato dependiendo del medio que lo reproduce: MEDIO Formato Canales Bit Rate Por lo General Compresión PCM Frecuencia de Resolución Sampleo 44.1kHz 16bits CD 2 1,411kbps ninguna DTS 44.1kHz 16bits 5.1 1.234Mbps 16b/44.1kHz estéreo 1.234Mbps 5.1 PCM 44.1kHz 16bits 2 1,411kbps DSD 2.8MHz 1bit 8 22.4Mbps PCM 48/96kHz 16/20/24bits 8 Dolby Digital 48kHz AC-3 DTS 48/96kHz 16/20/24bits 6.1 6,144kbps 18,432kbps 64 a 448kbps 16/20/24bits 7.1 64 a 1,536kbps MPEG-2 48kHz 16/20bits 7.1 32 o 912kbps 754kbps estéreo DTS lossy 1,509.25kbps 5.1 ----------------------- MPEG lossy MPEG-1 48kHz 16/20bits 2 384kbps ----------------------- MPEG lossy DVD-A PCM 6 9.6Mbps DAT PCM 4 1,411kbps 5 o 5.1 canales a 96kHz/24-bit usando MLP 16b/48kHz estéreo DTRS PCM 44.1/48/88.2/ 16/20/24bits 96/176.4/192 kHz 32/44.1/48 12/16bits kHz 44.1/48kHz 16/24bits 8 Cinta de 1/2” PCM 44.1/48kHz 48 Mini Disc ATRAC3plus ---------------- ----------------- 5,644kbps a 16b/48kHz estéreo ninguna 9,216kbps 33.8Mbps a 20b/48kHz estéreo ninguna 46Mbps 256/64/48kbps ----------------------- ATRAC3 Lossy SACD DVD-V 16/20/24bits 2 16b/44.1kHz estéreo DSD 5.1 y/o DSD estéreo a 16b/48kHz estéreo 192kbps estéreo DTS ninguna ninguna ninguna AC-3 lossy MLP (Meridiean Lossless packing) ninguna En la segunda parte de este artículo veremos los Formatos No-Físicos y explicaremos en detalle de que se trata la compresión Lossy y Lossless. Por el momento este fue un recuento de los medios y formatos físicos que tenemos a nuestra disposición para grabar y reproducir audio en el mundo digital. Alejandro de Icaza es graduado de la universidad de McGill con el titulo de Maestría en Ingeniería de Sonido y licenciatura en Música y tecnología musical. Se especializa en el audio digital y en la grabación y mezcla de música para sonido Surround 5.1. Actualmente vive en Montreal, Canadá, donde trabaja como ingeniero de sonido y productor independiente. [email protected]