PRINCIPIOS DE AUDIO JORGE HERNÁN JARAMILLO HOYOS UNIVERSIDAD PONTIFICIA BOLIVARIANA FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA MEDELLÍN 2005 PRINCIPIOS DE AUDIO JORGE HERNÁN JARAMILLO HOYOS Trabajo de grado para optar al título de Ingeniero Electrónico Director José Ricardo Zapata Ingeniero Electrónico UNIVERSIDAD PONTIFICIA BOLIVARIANA FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA MEDELLÍN 2005 Nota de aceptación __________________________________ __________________________________ __________________________________ __________________________________ __________________________________ Presidente del jurado __________________________________ Jurado __________________________________ Jurado Medellín, Julio 2005 AGRADECIMIENTOS Al Ing. José Ricardo Zapata por sus orientaciones al dirigir este proyecto. A la Universidad Pontificia Bolivariana formadora integral de excelentes ingenieros. A mis padres, soporte incondicional en todas mis actividades. CONTENIDO pág. INTRODUCCIÓN 1 1. INTRODUCCIÓN AL SONIDO 2 1.1 EL SONIDO COMO MOVIMIENTO ONDULATORIO 3 1.1.1 Características del movimiento ondulatorio 3 1.1.2 Naturaleza del sonido 5 1.1.3 Características de las ondas en el tiempo y en la frecuencia 8 1.1.4 Descripción matemática de las ondas 11 1.1.5 Tipos de ondas según su geometría 12 1.1.6 Ondas estacionarias 14 1.1.7 Principios de propagación de las ondas 17 1.1.8 Interacción de las ondas con el medio 19 1.1.9 Parámetros físicos y unidades de medida del sonido 24 1.2 VOZ HUMANA 28 1.2.1 Formantes 30 1.2.2 Rango dinámico y de frecuencia 30 1.2.3 Características adicionales de la voz 31 1.3 SISTEMA AUDITIVO 33 1.3.1 Oído externo 33 1.3.2 Oído medio 34 1.3.3 Respuesta en frecuencia del oído 35 1.3.4 Oído interno 36 2. ACÚSTICA 38 2.1 SEÑALES ACÚSTICAS 39 2.2 PSICOACÚSTICA 41 2.2.1 Características de la respuesta humana 41 2.2.2 Sonoridad o percepción de la intensidad 42 2.2.3 Altura 48 2.2.4 Timbre 50 2.2.5 Direccionalidad y espacialidad 50 2.2.6 Enmascaramiento 53 2.3 ACÚSTICA MUSICAL 58 2.3.1 Consonancia y disonancia 58 2.3.2 Escalas 61 2.3.3 Instrumentos musicales 66 2.4 ACÚSTICA ARQUITECTÓNICA 75 2.4.1 Campo sonoro 76 2.4.2 Acústica de grandes recintos 84 2.4.3 Materiales absorbentes acústicos 91 2.4.4 Acústica de pequeños recintos 94 2.4.5 Dispositivos para el control acústico 99 2.4.6 Características generales en el diseño de recintos 106 2.5 RUIDO ACÚSTICO 110 2.5.1 Tipos de ruido acústico 110 2.5.2 Fuentes de ruido 113 2.5.3 Cuantificación del ruido 117 2.5.4 Criterios de caracterización del ruido 118 2.5.5 Efectos del ruido sobre el hombre 119 3. ELECTROACÚSTICA Y PROCESAMIENTO DE AUDIO 121 3.1 MICRÓFONOS 122 3.1.1 Micrófonos de carbón 122 3.1.2 Micrófonos piezoeléctricos 123 3.1.3 Micrófonos dinámicos 124 3.1.4 Micrófonos capacitivos 127 3.1.5 Micrófonos Electret 128 3.1.6 Micrófonos de presión y de gradiente de presión 129 3.1.7 Parámetros de los micrófonos 131 3.1.8 Micrófonos para aplicaciones 141 3.2 ALTAVOCES 143 3.2.1 Clasificación de los altavoces (según mecanismo de transducción) 143 3.2.2 Cajas acústicas 147 3.2.3 Materiales de las cajas acústicas 155 3.2.4 Impedancia de los altavoces 156 3.2.5 Parámetros de Thiele-Small 158 3.2.6 Sensibilidad 160 3.2.7 Respuesta en frecuencia 161 3.2.8 Direccionalidad 162 3.2.9 Especificaciones de potencia 164 3.2.10 Distorsión armónica 166 3.2.11 Clasificación de los altavoces (según el rango de frecuencias) 167 3.2.12 Configuración y cuidado de los altavoces 169 3.3 AMPLIFICADORES 170 3.3.1 Amplificadores con transistores y con tubos de vacío 170 3.3.2 Características generales de los amplificadores 173 3.3.3 Preamplificadores 182 3.3.4 Amplificadores de potencia 184 3.3.5 Multiamplificación 186 3.4 FILTROS Y ECUALIZADORES 187 3.4.1 Filtros análogos 187 3.4.2 Clasificación según su banda de operación 188 3.4.3 Diseño de filtros 189 3.4.4 Filtros digitales 191 3.4.5 Filtros adaptativos 192 3.4.6 Redes divisoras de frecuencia 193 3.4.7 Ecualizadores 195 3.5 UNIDADES DINÁMICAS 199 3.5.1 Compresores 200 3.5.2 Limitadores 203 3.5.3 Compuertas 205 3.5.4 Expansores 207 3.6 AUDIO DIGITAL 209 3.6.1 Conversión análoga-digital 209 3.6.2 PCM 211 3.6.3 Dither 212 3.6.4 Efectos de audio digital 212 4. FORMATOS DE GRABACIÓN 217 4.1 ORÍGENES 217 4.1.1 Cilindro de Edison 217 4.1.2 Alambre 218 4.1.3 Gramófono 218 4.1.4 Disco 78 219 4.1.5 Disco de vinil 219 4.2 REGISTRO MAGNÉTICO ANÁLOGO 220 4.2.1 Grabación magnética 221 4.2.2 Reproducción magnética 222 4.2.3 Factores que intervienen en el proceso de grabación/reproducción 222 4.2.4 Componentes de las cintas magnéticas 223 4.2.5 Formatos 224 4.3 REGISTRO DIGITAL 228 4.3.1 Compact disc 229 4.3.2 Digital Audio Tape 231 4.3.3 Digital Compact Cassette 232 4.3.4 DASH 232 4.3.5 Minidisc 233 4.3.6 DVD 233 4.3.7 Blu-Ray 234 4.3.8 HDVD 235 5. CONCLUSIONES 236 BIBLIOGRAFÍA 237 ANEXOS 238 LISTA DE TABLAS pág Tabla 1. Rango dinámico de diferentes voces 31 Tabla 2. División del espectro en bandas críticas 47 Tabla 3. Frecuencias de las notas musicales 65 Tabla 4. Coeficiente de absorción para diversos materiales 93 Tabla 5. PT y STC para distintos materiales 109 Tabla 6. Características direccionales de diversos patrones 136 Tabla 7. Conexión balanceada 139 Tabla 8. Algunos efectos en serie y en paralelo 213 Tabla 9. Velocidades de transferencia para CD convencional 231 LISTA DE FIGURAS pág Figura 1. Onda senoidal con algunas de sus características 5 Figura2. Vibración de una lengüeta 7 Figura 3. Onda de presión (sonora) 7 Figura 4. Envolvente ADSR en el tiempo 8 Figura 5. Ondas periódicas 9 Figura 6. Espectro de frecuencia 11 Figura 7. Onda plana 13 Figura 8. Onda esférica 13 Figura 9. Ondas estacionarias en una cuerda 14 Figura 10. Ondas estacionarias en un tubo abierto 16 Figura 11. Ondas estacionarias en un tubo cerrado 16 Figura 12. Principio de Huygens 18 Figura 13. Reflexión sobre una superficie plana 19 Figura 14. Refracción de ondas 20 Figura 15. Tubo de Quincke 20 Figura 16. Patrón de difracción 21 Figura 17. Diagrama del tracto vocal 29 Figura 18. Oído externo 34 Figura 19. Oído medio 35 Figura 20. Respuesta en frecuencia del oído 36 Figura 21. Diagrama completo del oído 37 Figura 22. Umbral de audición en función de la frecuencia 43 Figura 23. Curvas de Fletcher y Munson 44 Figura 24. Relación entre nivel de sonoridad y sonoridad 46 Figura 25. Altura en función de la frecuencia 49 Figura 26. Experimento ilustrando el efecto Haas 51 Figura 27. Enmascaramiento temporal 54 Figura 28. Patrón de enmascaramiento del ruido blanco a varias presiones sonoras 55 Figura 29. Patrón de enmascaramiento para bandas de ruido 55 Figura 30. Patrón de enmascaramiento en función del nivel de presión sonora 56 Figura 31. Componentes armónicos de las notas musicales la y mi 60 Figura 32. Algunos intervalos musicales 60 Figura 33. Construcción de la escala natural 63 Figura 34. Instrumentos de percusión 68 Figura 35. Instrumentos de cuerda 70 Figura 36. Instrumentos de viento 73 Figura 37. Sistema MIDI 74 Figura 38. Estructura del campo sonoro en el eje del tiempo 79 Figura 39. Campo directo, campo reverberante y distancia crítica 83 Figura 40. Aplicación del método de “ray-tracing” en el Royal Albert Hall 86 Figura 41. Tiempo de reverberación óptimo en función del volumen para varias salas 89 Figura 42. Montaje de un material poroso a una distancia de una estructura rígida 92 Figura 43. Material absorbente en forma de cuña anecoica 94 Figura 44. Recinto rectangular para analizar las frecuencias de resonancia 96 Figura 45. Resonador de Helmholtz 100 Figura 46. Pánel resonante 100 Figura 47. Difusión sobre una superficie convexa 102 Figura 48. Patrón de difracción de un difusor por secuencias numéricas 102 Figura 49. Difusor de residuo cuadrático 104 Figura 50. Difusor Birradial 105 Figura 51. Difusores perforados 106 Figura 52. Estructura para el aislamiento acústico 108 Figura 53. Ruido aleatorio 110 Figura 54 Ruido blanco 111 Figura 55. Ruido rosa 111 Figura 56. Ruido continuo constante 111 Figura 57. Ruido continuo intermitente 112 Figura 58. Ruido fluctuante periódicamente 112 Figura 59. Ruido fluctuante no periódico 112 Figura 60. Ruido impulsivo 113 Figura 61. Micrófono de carbón 123 Figura 62. Respuesta en frecuencia de los micrófonos de carbón 123 Figura 63. Estructura interna de un micrófono piezoeléctrico 124 Figura 64. Respuesta en frecuencia de un micrófono piezoeléctrico 124 Figura 65. Micrófono de bobina móvil 125 Figura 66. Micrófono de cinta 126 Figura 67. Micrófono capacitivo 127 Figura 68. Micrófono Electret 128 Figura 69. Diafragma de un micrófono de gradiente de presión 130 Figura 70. Patrón bidireccional de un micrófono de gradiente de presión 130 Figura 71. Respuesta en frecuencia de un micrófono 132 Figura 72. Patrones polares de direccionalidad 135 Figura 73. Equivalente circuital de un micrófono conectado a un amplificador 138 Figura 74. Micrófono de Lavaliere 141 Figura 75. Micrófono de cañón 141 Figura 76. Micrófono de contacto 142 Figura 77. Micrófono parabólico 142 Figura 78. Micrófono inalámbrico 142 Figura 79. Corte transversal de un altavoz de bobina móvil 144 Figura 80. Altavoz de cinta 146 Figura 81. Estructura de un altavoz electrostático 146 Figura 82. Fenómeno del corto acústico 148 Figura 83. Bafle infinito 149 Figura 84. Caja sellada 149 Figura 85. Caja “Bass-reflex” 149 Figura 86. Bafles comerciales con radiador pasivo 150 Figura 87. Bafles comerciales con sistema ELF 152 Figura 88. Caja de carga simétrica 153 Figura 89. Caja laberinto 154 Figura 90. Caja línea de Tx. 154 Figura 91. Diagrama típico de impedancia de un altavoz 157 Figura 92. Ejemplo de un sistema eléctrico para modelar un altavoz con caja “bass-reflex” 159 Figura 93. Respuesta en frecuencia de tres altavoces para graves 161 Figura 94. Patrón direccional de un altavoz en función de la frecuencia 162 Figura 95. Bocina que acopla dos medios a y b 163 Figura 96. Altavoces para bajos “woofers” 167 Figura 97. Altavoz para medios “squawker” 168 Figura 98. Altavoz para agudos “tweeter” 168 Figura 99. Transistor BJT 171 Figura 100. Tubo de vacío 171 Figura 101. Esquema de preamplificación y amplificación 175 Figura 102. Modelo circuital de conexión entre un generador y un amplificador 180 Figura 103. Filtro pasabajos ideal 189 Figura 104. Sistema multiamplificado 194 Figura 105. Control de tonos 195 Figura 106. Ecualizador gráfico 196 Figura 107. Esquema del funcionamiento de un compresor 200 Figura 108. Relación entrada-salida para un compresor 201 Figura 109. Envolvente para la compresión 202 Figura 110. Relación entrada-salida para un limitador 204 Figura 111. Funcionamiento de una compuerta 205 Figura 112. Compuerta con dos umbrales 206 Figura 113. Muestreo de una onda senoidal 210 Figura 114. Cuantización y codificación de una muestra 211 Figura 115. Esquema general de un procesador de efecto 212 Figura 116. Retardo digital 213 Figura 117. Eco sencillo 213 Figura 118. Eco múltiple 214 Figura 119. Trémolo 214 Figura 120. Vibrato 215 Figura 121. Coro 215 Figura 122. Wah-wah 215 Figura 123. Phaser 216 Figura 124. Fonógrafo 217 Figura 125. Cilindros de Edison 218 Figura 126. Gramófono 218 Figura 127. Disco 78 219 Figura 128. Disco de vinil 220 Figura 129. Mecanismo de grabación del cabezal sobre la cinta 222 Figura 130. Cassette RCA 224 Figura 131. Cartucho de ocho pistas 225 Figura 132. Play-tape 226 Figura 133. Audio Cassette Compacto 227 Figura 134. Microcassette 227 Figura 135. Compact disc 231 Figura 136. DAT (digital audio tape) 232 Figura 137. Minidisc 233 Figura 138. DVD 234 Figura 139. Blu-ray 234 LISTA DE ANEXOS pág ANEXO A. Artículo publicable 237 ANEXO B. Proyecto de trabajo de grado 243 ANEXO C. Diario de campo 252 ANEXO D. Carta de cumplimiento de objetivos 254 GLOSARIO ABSORCIÓN SONORA: acción que lleva a cabo una superficie en la cual se absorbe (y se elimina) parte de la energía de la onda incidente. ACÚSTICA: disciplina que estudia el sonido en sus diversos aspectos. AISLAMIENTO ACÚSTICO: acción que lleva a cabo cualquier tabique divisorio entre dos ambientes impidiendo en mayor o menor medida el paso de energía acústica de uno a otro lado. ALIASING: es un tipo de distorsión que se produce cuando no se cumple el teorema del muestreo (la frecuencia mínima de muestreo debe ser igual a dos veces a máxima frecuencia presente en la señal). consiste en la aparición de frecuencias inexistentes en la señal original. ALTAVOZ: transductor que convierte señales eléctricas en sonido. ALTURA: sensación de mayor o menor grado de agudeza de un sonido. AMBIENCIA: sensación auditiva por la cual es posible tener una idea de las características de un ambiente: paredes, posicionamiento de obstáculos, etc. AMPLIFICADOR: dispositivo utilizado para aumentar el nivel de una señal. AMPLITUD: valor máximo de una señal. ANÁLOGO: cualidad de una variable física de evolucionar en el tiempo de forma continua. ANCHO DE BANDA: diferencia entre las frecuencias máxima y mínima que permite pasar un filtro pasabanda o un filtro cualquiera. ARMÓNICO: cada componente de frecuencia en una señal que es múltiplo entero de la frecuencia fundamental. AUDIO: técnicas aplicadas al procesamiento y reproducción del sonido. AUDIO DIGITAL: técnicas para el procesamiento, almacenamiento y reproducción de señales sonoras basadas en la conversión de señales eléctricas a números. BAFLE: caja acústica. BANDA: un intervalo de frecuencias. BANDA DE AUDIO: el intervalo de frecuencias comprendido entre 20Hz y 20kHz BATIDO: variación de amplitud de la onda resultante de la superimposición de dos señales de frecuencias próximas. CABEZAL: dispositivo que contiene los transductores electromagnéticos que permiten grabar, reproducir o borrar una cinta magnética. CAJA ACÚSTICA: recinto para evitar la transferencia entre la onda de compresión (delantera) y descompresión (trasera) de un altavoz de radiación directa. CAMPO DIRECTO: parte del campo sonoro formada por todas aquellas ondas o frentes de onda que aún no han experimentado ninguna reflexión. CAMPO REVERBERANTE: parte del campo sonoro formada por aquellas ondas que han sufrido al menos una reflexión. CAMPO SONORO: forma en que varía o se distribuye el sonido en el tiempo y en el espacio. CD: disco compacto. disco de tecnología óptica para reproducción de audio digital de alta calidad. COEFICIENTE DE ABSORCIÓN SONORA: fracción de la energía sonora que incide sobre un material o estructura superficial que resulta absorbido. COMPRESOR: equipo que recibe una señal y reduce su rango dinámico en función de parámetros ajustados por el usuario. COMPUERTA: dispositivo que cierra la entrada cuando ésta no alcanza a tener un nivel comparable al mínimo conocido de la señal, presumiendo que es ruido. CONEXIÓN BALANCEADA: tipo de conexión que utiliza tres conductores, uno de ellos conectado a tierra y los otros dos con tensiones opuestas. CONSONANCIA: sensación auditiva generada por dos sonidos superpuestos que no generan batidos. CUÑAS ANECOICAS: terminación superficial en forma de cuñas de un material absorbente acústico con el propósito de aumentar la superficie efectiva y por lo tanto el coeficiente de absorción. DAT: cinta para audio digital. dB: símbolo de decibel. DCC: cassette digital compacto. DECIBEL: unidad convencional utilizada para la expresión logarítmica de relaciones de dos magnitudes. DESVANECIMIENTO: en un sonido, etapa final durante la cual la amplitud del sonido se reduce hasta volverse despreciable. DIAFONÍA: separación de canales. DIAFRAGMA: en un micrófono, una lámina delgada que vibra en concordancia con la onda sonora. en un altavoz, un pistón (generalmente en forma de cono) puesto a vibrar por el excitador que genera el sonido. DIRECCIONALIDAD: características del sonido en cuanto a la dirección de la cual procede o hacia la cual se encuentra su fuente. DISONANCIA: sensación auditiva generada por dos sonidos superpuestos que producen batidos. DISTORSIÓN: alteración de la forma de onda de una señal. DITHER: ruido de bajo nivel agregado a una señal análoga previa al muestreo para mejorar el ruido de digitalización. ECO: reflexión del sonido que demora más de 100ms en volver a la fuente. ECUALIZADOR: filtro formado por varias bandas en cada una de las cuales se puede ajustar la ganancia o atenuación. EFECTO: el resultado de cualquier procesmianto de una señal de audio diferente de la transducción, la amplificación, la compresión y la ecualización. EFECTO DOPPLER: aumento o disminución aparente de la frecuencia de una fuente cuando ésta se encuentra en movimiento relativo respecto al receptor. EFECTO HAAS: habilidad humana para identificar la dirección de procedencia de un sonido a partir del primer frente de onda que llega a los oídos. ELASTICIDAD: propiedad que tienen algunos materiales (como el aire por ejemplo) de reestablecer su forma después de un cambio en su configuración. ENMASCARAMIENTO: fenómeno psicoacústico en el cual un tono débil se vuelve inaudible en presencia de otro más intenso cercano en frecuencia. ENVOLVENTE: evolución de algún parámetro del sonido en el tiempo, típicamente su amplitud. ESPACIALIDAD: características del sonido relativas a su interacción con el espacio en el que se halla confinado. ESPECTRO: amplitudes de las diversas componentes senoidales de un sonido. EXCITADOR: en un altavoz, la unidad motriz que puede ser de naturaleza electrodinámica, electrostática o piezoeléctrica. EXPANSOR: dispositivo que aumenta el rango dinámico de la señal que recibe. FACTOR DE AMORTIGUACIÓN: cociente entre la impedancia de carga de un amplificador y su impedancia interna. FADER: atenuador. FASE: medida del retraso o adelanto de una señal respecto a otra. FILTRO: dispositivo con la capacidad de seleccionar partes de una señal en función de sus frecuencias. FORMANTES: resonancias características de una voz o instrumento que determinan su timbre. FRECUENCIA: cantidad de ciclos por unidad de tiempo. FUENTE FANTASMA: fuente de tensión que utiliza para alimentar y polarizar elementos en los micrófonos capacitivos a través de los mismos cables que llevan la señal. GANANCIA: cociente entre la señal de salida y la de entrada en un amplificador, generalmente expresada en dB. IMPEDANCIA ACÚSTICA: cociente entre la presión sonora y la velocidad volumétrica de las partículas. INTENSIDAD SONORA: energía sonora que atraviesa una superficie por unidad de tiempo y por unidad de área. INTERVALO: en música, la diferencia entre dos notas de alturas distintas (exceptuando el unísono). LFO: oscilador de baja frecuencia. LIMITADOR: dispositivo que ajusta la ganancia de manera que la señal no pueda umentar por encima de cirto nivel. LONGITUD DE ONDA: distancia en el espacio entre dos picos sucesivos de una onda sonora periódica. MICRÓFONO: dispositivo transductor que transforma la señal sonora en señal eléctrica. MINIDISC: formato de grabación y reproducción digital basado en tecnología óptica o magnetoóptica. MODOS NORMALES: frecuencias de resonancia en un recinto. MODULACIÓN: variación de un parámetro de un sistema eléctrónico. MOMÉNTUM: cantidad física que relaciona la masa con la velocidad de un sistema de partículas. MUESTREO: acción de tomar muestras de una señal a intervalos regulares. NIVEL: es la expresión logarítmica de una magnitud repecto a un valor de referencia. OCTAVA: intervalo correspondiente a multiplicar la frecuencia por 2. ONDA SONORA: perturbación de la presión de equilibrio del aire que se propaga en un medio elástico. PARLANTE: altavoz. PCM: modulación de código de impulsos. PERIÓDICO: se dice de un fenómeno que repite sus propiedades en ciertos intervalos de tiempo fijos. PERÍODO: tiempo que demora en completarse un ciclo una señal periódica. PIEZOELECTRICIDAD: fenómeno que tiene lugar al deformarse ciertos cristales por el cual se genera una tensión entre sus extremos: PISTA: cada sector en una cinta magnética en el cual se graba una señal en general independiente de las grabadas en otras pistas. POTENCIA ACÚSTICA: energía acústica irradiada por unidad de tiempo. [=] watts PREAMPLIFICADOR: amplificador para elevar el nivel de una señal de bajo nivel como las señales de los micrófonos hasta el nivel de línea. PRESIÓN SONORA: diferencia entre la presión de compresión o descompresión de una onda sonora y la presión de equilibrio del aire. RANGO DINÁMICO: diferencia en dB entre los niveles máximo y mínimo de una señal. REFLEXIÓN: se refiere a la existencia de una segunda sonora posterior a la incidencia de una onda sonora sobre una superficie. RESONANCIA: fenómeno por el cual en un sistema físico a cierta frecuencia la respuesta es mayor. REVERBERACIÓN: permanencia de un sonido en un ambiente depués de extinguida su fuente a causa de múltiples reflexiones. RUIDO: una señal no deseada con espectro continuo. RUIDO ACÚSTICO: ruido ambiental debido a la superposición de una multitud de fuentes distantes y próximas. RUIDO BLANCO: ruido aproximadamente constante y uniforme en la frecuencia. RUIDO ROSA: es el ruido blanco con una pendiente de –3cB. tiene igual energía por octava dentro del rango de frecuencias audibles. SATURACIÓN: estado de un dispositivo en el cual ante un aumento de excitación ya no se produce un aumento en la respuesta. SENSIBILIDAD: en un micrófono, relación entre la tensión generada y la presión sonora. en un amplificador, tensión necesaria para producir la potencia especificada. en un altavoz, el nivel de presión sonora obtenido a 1m frente al mismo cuando se aplica 1W de potencia. SEÑAL: una magnitud física variable en el tiempo que transporta energía y/o información. SONORIDAD: sensación que permite distinguir los sonidos más débiles de los sonidos más fuertes. SOSTENIMIENTO: en un sonido, tramo durante el cual la amplitud de la onda se mantiene constante hasta que se desactive la nota correspondiente. SQUAWKER: altavoz para reproducir frecuencias medias. THD: distorsión total armónica. es una medida relativa de la energía contenida en los armónicos de una señal. TIMBRE: sensación que permite distinguir a los sonidos por su fuente. TRANSDUCTOR: dispositivo que transforma una señal de una forma de energía a otra. TWEETER: altavoz para reproducir frecuencias altas. VCA: amplificador controlado por voltaje. WAVELET: palabra utilizada para describir una pequeña onda que aparece solamente una vez en el tiempo WOOFER: altavoz para la reproducción de los sonidos graves. RESUMEN En este trabajo se presentan los contenidos más relevantes para un curso introductorio dirigido a interesados en audio y en sistemas de sonido. La primera parte incluye una introducción al sonido con énfasis en su carácter físico y ondulatorio. Aquí se muestran aspectos fundamentales de la naturaleza del sonido, desde su generación hasta su propagación en un medio elástico. Se estudian también los parámetros básicos de este fenómeno físico que servirán de base conceptual para capítulos posteriores. Igualmente se incluyen los mecanismos humanos de transmisión y percepción: la voz humana y el sistema auditivo, teniendo en cuenta características físicas y fisiológicas. Posterior al capítulo introductorio, se presenta el estudio formal de la acústica, como parte de la física que estudia la producción, transmisión y percepción del sonido. Siendo la acústica una ciencia amplia y multidisciplinaria se escogieron únicamente cuatro temas, considerados los más relevantes para un curso introductorio: psicoacústica, acústica arquitectónica, acústica musical y el ruido acústico. La psicoacústica es el estudio de como el ser humano percibe subjetivamente las características físicas sonoras y como el cerebro procesa dicha información. La acústica arquitectónica estudia los elementos para el diseño óptimo de recintos (salas de concierto, salas de grabación, iglesias, edificios, etc.) según lineamientos acústicos preestablecidos. La acústica musical estudia las relaciones físicas existentes en la música, haciendo particular énfasis en la música occidental. En el capítulo de ruido acústico se define este fenómeno, su clasificación, su fuente, y los daños al ser humano. Luego de estudiar la acústica, se describen los elementos procesadores de audio. Estos son dispositivos electrónicos o electroacústicos que de alguna forma modifican o transforman el sonido para alguna aplicación en un sistema. Entre éstos se encuentran los micrófonos, los parlantes y los amplificadores. Además se hace una introducción al audio digital, sistemas de audio refinados utilizando técnicas digitales y los avances de la microelectrónica. Por último, se introducen los formatos de grabación modernos además de una pequeña reseña histórica de los orígenes de la grabación sonora. 1 INTRODUCCIÓN El trabajo “Principios de Audio” es una propuesta para la comunidad académica que busca la integración de diversos y selectos temas de sonido y acústica para continuar con la iniciativa de crear una nueva línea de formación en audio en la Universidad Pontificia Bolivariana. No habían existido hasta ahora materias que trataran de manera sistemática y exhaustiva los sistemas de audio y en el ámbito regional no se había trabajado cursos de este tipo. Por esta razón se origina la propuesta de documentar el curso Principios de Audio con el fin de apoyar esta etapa pionera e introductoria de la nueva línea de Audio. Este trabajo es fundamentalmente fruto de una labor investigativa propuesta por el director Ing. José Ricardo Zapata en la cual se destaca la utilización de una multitud de recursos bibliográficos disponibles: libros, revistas especializadas, notas de clase (Principios de Audio) y sitios en Internet. El resultado es una recopilación de temas básicos e intermedios idóneos para un ingeniero que comienza el estudio del sonido. 2 1. INTRODUCCIÓN AL SONIDO Los fenómenos sonoros han formado parte del ambiente de la vida humana desde las épocas más remotas en la historia. En esta sección se tratarán los principios físicos que gobiernan los sistemas de sonido y la interacción del ser humano con él a través del habla y de la escucha. Se introduce el carácter ondulatorio de los sonidos y los mecanismos del ser humano para percibirlos. Los conceptos que se desarrollarán en este capítulo son fundamentales para el entendimiento cabal de los posteriores. 3 1.1 EL SONIDO COMO MOVIMIENTO ONDULATORIO Una onda es un ente físico que permite la propagación de energía entre dos puntos sin necesidad de transferir masa. Las ondas mecánicas son aquellas que necesitan de un medio elástico (aire por ejemplo) para su propagación. Existen dos tipos básicos de ondas mecánicas: -ondas longitudinales: Ondas en el cual el movimiento de las partículas es paralelo a la dirección de propagación. -ondas transversales: Ondas en el cual el movimiento de las partículas es perpendicular a la dirección de propagación. El sonido es un ejemplo de onda mecánica longitudinal y por eso de ahora en adelante se referirá a este tipo de ondas. 1.1.1 Características del movimiento ondulatorio Se puede definir un movimiento ondulatorio mediante dos propiedades básicas: • existe una propagación continua de energía • no hay desplazamiento de materia El segundo punto significa que las partículas del medio solo vibran alrededor de una posición de reposo o referencia, y se transfiere moméntum y energía sin necesidad del movimiento físico del ente que la produce. El sonido es una onda (longitudinal) y al serlo cumple con las dos propiedades anteriores. También aplican los parámetros básicos de una onda en general, a saber: frecuencia, longitud de onda, período, longitud de onda, velocidad, amplitud, fase, frecuencia angular. 4 Frecuencia: Un ciclo consiste en una expansión y una compresión del medio. La frecuencia se define como el número de ciclos en el transcurso de un segundo. Se mide en ciclos por segundo o hertz f [=] Hz Período: El período es la duración de un ciclo. El período T está relacionado con f así: T=1/f. Se mide en segundos. T[=] s Longitud de onda: Es la distancia que separa dos perturbaciones sucesivas. Se mide en metros y se representa por la letra griega λ. λ=c/f [=] m c: velocidad de la onda (m/s) f: frecuencia de la onda (Hz) Para el rango de audición, las longitudes de onda del sonido van desde 17.2m (para 20 Hz) hasta 1.72cm(20kHz) ya que el espectro audible contiene las frecuencias entre 20Hz20kHz. (Nótese que frecuencia y longitud de onda son inversamente proporcionales.) Velocidad: Las ondas (no las partículas) se propagan en el aire con una velocidad dada por: V=distancia/tiempo=λ/Τ=λf [=]m/s. Amplitud: Se refiere al valor máximo del desplazamiento de las partículas respecto a su posición de reposo. Se mide en metros (m). A[=]m Fase: Es una medida del retraso o adelanto que tiene una onda respecto a una referencia (puede ser otra onda). Se mide en radianes. φ[=] rad 5 Frecuencia Angular: La frecuencia es una medida de cuantas veces una onda se “repite” (atraviesa el mismo valor en el espacio o tiempo). Sin embargo, podemos pensar en una onda como un ente que rota hasta volver a su posición original. Una rotación se caracteriza por una revolución completa que equivale a 2π radianes. Si multiplicamos la frecuencia (f) por 2π, obtenemos el número de radianes que el ente revoluciona en un segundo. ω=2πf [=]rad/s Utilizando los parámetros anteriores, una onda senoidal puede expresarse como: y=Asen(ωt+φ) (función del tiempo) y: amplitud en el tiempo A: amplitud máxima ω: frecuencia angular y T . A t φ Figura 1 Onda senoidal con algunas de sus características 1.1.2 Naturaleza del sonido El sonido tiene su origen en las vibraciones en un medio elástico, es decir, las vibraciones deben ocurrir en un medio que sea capaz de transmitir esas vibraciones. Estos son los dos elementos esenciales para la existencia de un sonido: • un ente vibrante • un medio con capacidad de transmitir esas vibraciones 6 (Existe un tercer elemento, la capacidad humana de percibir esas vibraciones, relacionado con un campo fundamental de la acústica (la psicoacústica) el cual será tratado posteriormente.) El ente vibrante puede ser de naturaleza muy diversa como: las cuerdas vocales en la garganta, las cuerdas de un violín, una descarga eléctrica, golpes, pájaros, etc. El medio también es de índole muy variada como aire, madera, agua, metal, etc. (siendo el aire el medio elástico más común). A continuación se mostrará que el sonido está caracterizado por variaciones de presión ocasionadas por algún ente vibrante. 1.1.2.1 Presión. La presión es una magnitud física muy importante en el estudio de las ondas sonoras. La presión se define como fuerza por unidad de área. La unidad de presión es Pa (pascales)[=]N/m2. La presión en el aire por ejemplo, determina el espacio físico que separa las moléculas. Es decir, fluctuaciones en la presión implican cambios en la separación de las moléculas. Las moléculas, en el aire, buscan su estado original de presión. Una presión dada implica una separación particular de las moléculas. Si eliminamos la presión, las moléculas buscarán su posición original o estado de reposo. Por ejemplo, si estiramos un pedazo de caucho, este tiende a retomar su posición de equilibrio original cuando es soltado. La propiedad que tienen algunos materiales de reintegrarse a su forma o volumen original después de una deformación, se llama elasticidad. Los gases, como el aire, también son elásticos. Como se había anotado anteriormente, la elasticidad es la propiedad responsable de la transmisión de las vibraciones a través del medio. Por ejemplo, si una capa de gas ejerce cierta presión, disminuye su volumen y ocasiona un desequilibrio. Al cesar dicha fuerza (presión), el gas ocupará el volumen original. Un ejemplo: Existe una lengüeta que actuará como fuente sonora (es decir, fuente que producirá las vibraciones) El eje central es la posición de reposo o de equilibrio. Primero se inclina hasta A y después llega hasta B, pasando por la línea de reposo. Esto se repite varias veces. Cuando la lengüeta se mueve hacia A, la masa de aire circundante es alterada. Las moléculas de aire delante de la lengüeta (hacia A) chocan contra las otras moléculas que tienen delante(transfieren energía y moméntum) y se produce una compresión. Las 7 moléculas que están detrás sufren el efecto contrario; se dispersan hasta llenar más volumen. eje central A B movimiento de la lengüeta Figura 2 Vibración de una lengüeta En resumen, por un lado de la lengüeta se propagará una compresión y por el otro lado, una descompresión. Cuando la lengüeta se mueva hacia B, ocurre esencialmente lo mismo solo que en dirección contraria: en el lado hacia B aparecerá una compresión y en el lado hacia A aparecerá una descompresión. Estas variaciones de presión en un medio elástico, constituyen la onda sonora. Más específicamente , el sonido es el resultado de vibraciones de moléculas de un medio en la misma dirección de propagación. Este tipo de ondas son llamadas longitudinales. De ahora en adelante se utilizarán los términos onda y onda sonora para hacer alusión a lo mismo, el sonido, a menos que se indique lo contrario. 1.1.2.2 Representación gráfica de las ondas sonoras. Las ondas sonoras son ondas longitudinales de presión. Sin embargo, para poder representarlas gráficamente, se dibuja una onda transversal ya que es más fácil de visualizar. Para hacer ésto, los movimientos característicos de una onda longitudinal hacia adelante y hacia atrás se representan por movimientos por encima y por detrás de una línea de referencia que corresponde a la posición de reposo(presión de equilibrio del aire). posición de reposo Figura 3 Onda de presión (sonora) 8 Las flechas en la figura representan los desplazamientos de las partículas de aire en sentido longitudinal, aunque aparecen en la gráfica en sentido transversal (solamente por facilidad visual). 1.1.3 Características de las ondas en el tiempo y en la frecuencia El análisis de las ondas se puede realizar en el dominio del tiempo o en el dominio de la frecuencia. El análisis en cada dominio tiene características complementarias y se puede intercambiar de dominios utilizando las técnicas de Fourier que serán comentadas brevemente. 1.1.3.1 Envolvente de amplitud en el tiempo. La envolvente de amplitud en el tiempo se refiere a los cambios que sufre el sonido en un intervalo de tiempo respecto a un parámetro, en este caso amplitud. La amplitud se refiere a alguna magnitud que cambia respecto a una posición de referencia. En las ondas sonoras esta amplitud generalmente está dada por la presión y está íntimamente relacionada con la intensidad sonora (parámetro físico del sonido), que veremos oportunamente. Existen cuatro variables de interés al analizar la envolvente de amplitud de una señal en el tiempo. Estas son el ataque (“attack”), caída (“decay”), sostenimiento o sostenido (“sustain”) y desvanecimiento (“release”). Esta envolvente se denomina ADSR(AttackDecaySustainRelease) por sus siglas en inglés. Ataque se refiere al tiempo que transcurre desde el principio de un sonido hasta que éste llega a su nivel máximo. Es la fase inicial de la envolvente. La caída comprende el tiempo desde el ataque al nivel de mantenimiento (sostenimiento). El sostenimiento es el tiempo durante el cual el sonido permanece invariable en la amplitud. amplitud Ataque Caída Sostenido Desvanecimiento Figura 4 Envolvente ADSR en el tiempo t 9 Finalmente, el desvanecimiento es el tiempo que tarda el sonido en pasar del sostenimiento al nivel final, el nivel en que la amplitud es despreciable. Generalmente el desvanecimiento comienza al soltar una nota, de un teclado por ejemplo. 1.1.3.2 Ondas periódicas. El período es otro parámetro que se puede identificar fácilmente en el tiempo, pero es una característica de ondas periódicas solamente. Ondas periódicas son aquellas que repiten su valor de amplitud para cada intervalo de tiempo. Es decir, se cumple que F(t+nT)= F(t) (n ∈ Z) T es llamado período primitivo de la señal. Ejemplos comunes de ondas periódicas son : senoidal, cuadrada, triangular, diente de sierra, etc. a) b) T T c) d) T T Figura 5 Ondas periódicas a) cuadrada b) triangular c)diente de sierra d)irregular 1.1.3.3 Espectro de frecuencia. Todas las ondas periódicas se pueden sintetizar a partir de la función seno mediante el Análisis de Fourier. Jean-Baptiste Joseph Fourier, barón de Auxerre (1768-1830), desarrolló un tipo de análisis matemático por el que cualquier onda periódica compuesta, puede descomponerse en una suma de ondas senoidales de amplitud, frecuencia y fase adecuadas. Las frecuencias de estas ondas senoidales guardan una relación estrecha pues son todas múltiplos enteros de la frecuencia fundamental. Es decir, cualquier función 10 periódica se puede escribir como una sumatoria (finita o no) de términos seno pues estas funciones son base ortogonal para el espacio de las funciones periódicas. El espectro de estas señales (es decir el conjunto de frecuencias asociadas) es discreto: contiene solo los múltiplos enteros de la frecuencia fundamental. Esta es quizá la característica fundamental de las ondas periódicas. A los múltiplos enteros de la frecuencia fundamental se les conoce como armónicos de la señal. Una señal dada puede tener uno, varios, o todos los armónicos de su frecuencia fundamental. Por ejemplo, una señal sinusoidal pura solo tiene un componente de frecuencia: su frecuencia fundamental. De ahí la importancia de la función seno en el Análisis de Fourier. La señal cuadrada solo contiene armónicos impares (es decir, múltiplos impares de la frecuencia fundamental) mientras que una señal diente de sierra los contiene todos. De esta forma podemos definir el espectro de una señal como el conjunto de armónicos que la integran. Si se quiere analizar un sonido como un todo, se debe analizar cada componente de frecuencia por separado, pues cada una tiene su envolvente particular. Los armónicos de frecuencia alta tienden a atenuarse más rápidamente que los de baja frecuencia. Sin embargo, no todas las señales en la naturaleza son periódicas. Para el análisis de señales aperiódicas se debe recurrir a otro tema del análisis de Fourier, llamado Transformada de Fourier. Mediante este método es posible conocer el espectro de una señal arbitraria además de su densidad espectral de potencia, útil en el análisis del ruido. Existen varios tipos de espectros de acuerdo a la relación entre los armónicos y la frecuencia fundamental: Espectro armónico: Es un espectro que contiene armónicos múltiplos enteros de la frecuencia fundamental. Es discreto. Espectro inarmónico: Contiene frecuencias que no son múltiplos enteros de la frecuencia fundamental. Estas componentes se denominan parciales. Generalmente, se le atribuye a esto el sonido áspero. Espectro continuo: Espectro cuyas componentes están demasiado cerca y puede considerarse continuo. Este espectro es característico de señales aperiódicas como el ruido. 11 a) amplitud b) amplitud f (Hz) 10 20 30 40 50 60 f (Hz) 10 20 30 40 50 60 Figura 6 Espectro de frecuencias a) espectro de una señal periódica (discreto) b) espectro de una señal de ruido (continuo) 1.1.4 Descripción matemática de las ondas Como se había indicado anteriormente, una onda sonora es una perturbación en la presión de un medio que provoca el movimiento de las moléculas alrededor de su posición de equilibrio. La onda sonora, como una gran cantidad de ondas en la naturaleza, son solución de la ecuación general (la demostración no se incluye): c2 d 2u(x,y,z,t)= ∂ 2 u(x, y, z, t) ∂t 2 c: velocidad del sonido u: onda función de x, y, z, t d 2: operador laplaciano Una solución de esta ecuación debe depender del espacio y del tiempo. Si restringimos el movimiento a una sola dirección (eje x), se verifica que: u(x,t)= Acos(kx-ωt) cumple con dicha ecuación, donde: k= 2π : número de ondas [=] rad/m λ ω: frecuencia angular [=] rad/s A: amplitud de presión [=] Pa 12 En el caso del sonido, la onda u(x,t) es en realidad una onda de presión, y se podría reemplazarla por p(x,t) (presión). Nótese que la solución de onda depende del espacio y del tiempo. 1.1.5 Tipos de ondas según su geometría Las ondas se pueden clasificar de acuerdo a su geometría. El criterio es la forma del frente de onda. El frente de onda es el lugar geométrico de los puntos en un medio que se encuentran en un mismo estado vibratorio en un instante dado. Dependiendo de la forma del frente de onda, se tendrán distintos tipos de ondas: planas, esféricas y cilíndricas. 1.1.5.1 Ondas planas. Si las ondas tienen frentes de onda planos en una sola dirección, la ecuación de onda se convierte en: c 2 ∂ 2 p(x, t) ∂ 2 p(x, t) = ∂x 2 ∂t 2 cuya solución general es p(x,t)= F (ct-x) + G(ct+x). F es una onda viajera en la dirección positiva mientras que G es una onda viajera en la dirección negativa. Los frentes de onda de estas ondas son planos. La característica más importante de una onda plana es su única dirección de propagación, representada por un vector unitario u perpendicular al plano en la dirección de propagación de la onda. El fenómeno de propagación de las ondas planas, ya sea en dos dimensiones o en tres, es en realidad un problema unidimensional, pues solo existe una dirección de propagación. z frente de onda (plano) vector en la dirección de propagación x 13 Figura 7 Onda plana 1.1.5.2 Ondas esféricas. Si la vibración que genera el movimiento ondulatorio se origina en un punto y se propaga con la misma velocidad en todas las direcciones, resultarán ondas esféricas. Estas ondas son isotrópicas (radiación igual en todas las direcciones) y tienen además simetría esférica (respecto al ángulo polar y el azimutal). Los frentes de onda son esferas concéntricas con el punto donde se origina la vibración. En el caso de dos dimensiones, los frentes de onda son circunferencias y las ondas son circulares. Matemáticamente, la descripción de una onda esférica se reduce a (teniendo en cuenta la simetría esférica): c2 ∂ 2 rp ∂ 2 rp = ∂r 2 ∂t 2 (solo depende de la componente radial y del tiempo). La solución general es: p(r,t)= f(r-ct)/r + g(r+ct)/r De la solución es claro que la presión disminuye con el radio. Las ondas esféricas cobran mucha importancia en el estudio del sonido, pues de su propagación dependen parámetros sonoros importantes como la intensidad que se explicará oportunamente. Figura 8 Onda esférica 1.1.5.3 Ondas cilíndricas. En las ondas cilíndricas, los frentes de onda son superficies paralelas a una línea dada (el eje z) y es perpendicular al plano xy. Este tipo de onda es 14 producida cuando se tienen una serie de fuentes distribuidas uniformemente en el eje z, todas oscilando en fase. La descripción matemática de estas ondas es: 2 c ∂ 2 rp ∂r 2 = ∂ 2 rp ∂t 2 (no existe dependencia en el ángulo azimutal o en la coordenada axial) La solución de esta ecuación implica la utilización de la función de Bessel pero no son muy relevantes en el estudio del sonido. 1.1.6 Ondas estacionarias Un resultado muy especial ocurre cuando dos ondas idénticas (de igual frecuencia y amplitud) que se mueven en direcciones opuestas son superpuestas. Cuando ambas ondas están en fase, la onda resultante tendrá el doble de la amplitud, pero la misma longitud de onda (período). Esto ocurre en t=0. Después de un t = T/4 (T es el período de ambas ondas), las ondas se encuentran exactamente fuera de fase. Después en t=T/2, las ondas se encuentran en fase nuevamente y la amplitud resultante es dos veces la amplitud original. Después en t=3/4T, las ondas estarán desfasadas completamente, resultando en una onda de amplitud nula. Finalmente, en t =T, cada onda se ha propagado una longitud de onda completa en su dirección respectiva. En resumen, la onda resultante se conoce como estacionaria, pues no viaja ni a la izquierda ni a la derecha, sino que oscila continuamente entre dos extremos. La onda pierde el carácter de viajera y se le conoce como estacionaria. a) t=0, T/2 b) t=1/4T, 3/4T Figura 9 Ondas estacionarias en una cuerda sujeta por dos extremos 15 1.1.6.1 Cuerdas. Para que existan ondas estacionarias en una cuerda de longitud L, se debe cumplir la condición L= n f= λ (n ∈ Z). Su frecuencia por ende va a ser: 2 nv 2L La velocidad transversal en una cuerda es función de la tensión de la cuerda (T[=]N) y de su densidad lineal (µ[=]kg/m) así: v= T [=]m/s µ Combinando ambas ecuaciones se obtiene una expresión para la frecuencia: f n= n T [=] Hz 2L µ n corresponde al número armónico, es decir, el múltiplo de la frecuencia fundamental. Las ondas estacionarias son comunes en cuerdas, tubos y en membranas. Para el caso de los tubos, se pueden distinguir dos casos: tubo abierto (abierto en los dos extremos) y tubo cerrado (abierto en un extremo y cerrado en el otro). 1.1.6.2 Tubo abierto. La onda recorre el tubo desde un extremo hasta el otro como onda de compresión y se refleja como una onda de descompresion. En un tubo abierto se produce una máxima amplitud en los extremos, ambos abiertos. Los puntos de máxima amplitud se denominan vientres o antinodos. Por oposición, los puntos de mínima amplitud (amplitud nula) de denominan nodos. La distancia entre un vientre y un nodo es igual a λ/4. Las frecuencias naturales para un tubo abierto están dadas por la ecuación: f n= nc 2L n: modo de vibración L: longitud del tubo c: velocidad del sonido 16 1 modo de vibración 2 modo de vibración 3 modo de vibración Figura 10 Onda estacionaria en un tubo abierto Nótese en la figura que el modo de vibración coincide con el número de nodos. 1.1.6.3 Tubo cerrado. En un tubo cerrado un extremo está abierto y el otro está cerrado. En el extremo abierto se produce un máximo de amplitud (vientre) y en el otro un mínimo (nodo). Debido a que la distancia entre un vientre y un nodo es de λ/4, debe existir un número impar de cuartos de longitud de onda que ajuste la longitud del tubo. Las frecuencias naturales para los tubos cerrados son: f n= (2n - 1)c 4L n: modo de vibración L: longitud del tubo c: velocidad del sonido Nótese que solo existen frecuencias naturales impares. 1 modo de vibración 2 modo de vibración 3 modo de vibración Figura 11 Ondas estacionarias en un tubo cerrado 17 1.1.6.4 Ondas en membranas. Las membranas son cuerpos de superficie grande con relación a su espesor. Estas necesitan tensión para vibrar, como por ejemplo en parches de tambores y de timbales. Sin embargo la vibración en las membranas tiene características distintas a las ondas en cuerdas o en tubos. Por una parte, no existen nodos como tal sino líneas nodales. Además, las membranas cumplen unas leyes denominadas leyes de Chladni: - la frecuencia de dos membranas de igual superficie es inversamente proporcional a su espesor - la frecuencia de dos membranas de igual espesor es inversamente proporcional al cuadrado de su diámetro 1.1.7 Principios de propagación de las ondas Los siguientes principios establecen la forma como se propagan las ondas en un medio dado. Estos principios son: - Principio de Huygens - Teorema de Malus Para entender con mayor claridad estos principios, primero se deben precisar algunos términos. frente de onda: Un frente de onda es una superficie que pasa por todos los puntos del medio alcanzados por el movimiento ondulatorio en el mismo instante. Equivalentemente, el frente de onda es la región definida por la extensión más lejana de la propagación de la onda. rayo: Los rayos son líneas perpendiculares a los frentes de onda que caracterizan la dirección de una onda. Una onda en un medio homogéneo se mueve en la dirección de los rayos, aunque éstos en si no tienen una entidad física. En el caso de ondas acústicas (sonoras), los rayos se denominan rayos acústicos. 1.1.7.1 Principio de Huygens. El principio de Huygens establece que todos los puntos pertenecientes a un frente onda dada actúan como fuentes de ondas circulares (o esféricas en el espacio). El patrón de onda final será igual a la suma de las contribuciones de cada 18 pequeña onda que emana de cada punto del frente de onda. Estas pequeñas ondas son llamadas “wavelets”. La intensidad de la onda circular que es emanada de cualquier punto es máxima en la dirección de propagación y gradualmente disminuye hasta llegar a cero en la dirección opuesta. El análisis utilizando “wavelets” de Huygens es una técnica conveniente para analizar propagación de las ondas. El principio de Huygens explica como se van formando los frentes de onda. Cada punto que pertenece a un frente de onda actúa como fuente de ondas circulares. Las crestas de las “wavelets” generadas por cada punto constituyen el próximo frente de onda con la misma forma al anterior. El efecto total de la suma de las crestas individuales es la propagación de onda original. nuevo frente de onda “wavelets” Figura 12 Principio de Huygens Otro resultado importante de este comportamiento (consecuencia del principio de Huygens), es que la dirección de propagación de la onda permanece perpendicular al frente de onda. En dos dimensiones, el frente de onda será una línea recta o curva, mientras que en tres dimensiones el frente de onda es un plano o una superficie. 1.1.7.2 Teorema de Malus. El teorema de Malus establece que los rayos de una misma propagación se demoran el mismo tiempo en llegar pues permanecen en todo tiempo perpendiculares a una superficie. Es equivalente a decir que el tiempo entre dos frentes de onda es el mismo visto desde cualquier rayo. Es aplicable a la óptica así como a la acústica. 19 1.1.8. Interacción de las ondas con el medio Diversos efectos ocurren cuando las ondas interactúan con el medio o entre ellas mismas ellos mismos. Estos efectos cobran gran relevancia al explicar algunos fenómenos que serán analizados en capítulos posteriores. 1.1.8.1 Superposición. El principio de superposición puede ser enunciado como sigue: La existencia de una onda no afecta la existencia o las propiedades de otra onda, aunque que se encuentren en el mismo punto y en el mismo instante. Este principio es equivalente a decir que las ondas se pueden sumar algebraicamente. Si se tienen dos ondas, A y B, el desplazamiento de la onda A+B es igual a la suma de los desplazamientos individuales (debido a A y debido a B). Este una gran distinción entre las ondas y la materia, ya que dos entes materiales no pueden ocupar el mismo volumen en el mismo instante. 1.1.8.2 Reflexión. La reflexión consiste en la existencia de una segunda onda de igual o menor energía cuando un frente de onda incide sobre una superficie. onda incidente (α (β onda reflejada α=β Figura 13 Reflexión sobre una superficie plana El diagrama muestra el rayo incidente y el rayo reflejado sobre una superficie plana (plano). Este tipo de reflexión se denomina especular. Los respectivos ángulos (respecto a la normal) son iguales. Esto se conoce como la primera ley de Snell. Si las ondas son reflejadas de superficies irregulares, la reflexión debe examinarse para cada punto, pues para cada punto existe una normal distinta. Este tipo reflexión se denomina difusa y se refleja la onda en múltiples direcciones. Si una onda incide sobre una superficie parabólica, los rayos reflejados se encontrarán en un punto llamado foco o punto focal de la parábola. Los reflectores parabólicos tienen 20 muchas aplicaciones, tanto para ondas luminosas, como para ondas sonoras (por ejemplo, los micrófonos). Además, la reflexión es fundamental para el entendimiento de la reverberación y el eco que serán tratados posteriormente. 1.1.8.3 Refracción. Cuando una onda incide sobre una superficie, no necesariamente será reflejada totalmente. Si la superficie es frontera entre dos medios, parte de la onda es reflejada y otra parte atraviesa el segundo medio. Al atravesar el segundo medio, cambia la dirección de propagación de la onda. Un cambio de medio también es acompañado por un cambio de velocidad. Cada medio tiene un índice característico llamado índice de refracción (n) y se cumple que nisenθi=nrsenθr donde los subíndices i y r representan incidente y refractado respectivamente. Esta se conoce como la segunda ley de Snell (para la refracción.) onda incidente θi θr medio 1 (ni) onda refractada medio 2 (nr) Figura 14 Refracción de ondas 1.1.8.3.1 Refracción atmosférica. La refracción atmosférica es el resultado del cambio de dirección que sufre la radiación cuando atraviesa la atmósfera terrestre. El cambio de dirección depende del índice de refracción y es responsable de fenómenos como la dispersión. 1.1.8.4 Absorción. Otro fenómeno asociado a la reflexión y a la refracción es la absorción. Esto ocurre cuando parte de la energía de la onda no es ni reflejada ni refractada, sino que 21 se queda en la superficie frontera entre los dos medios. Generalmente, la energía sonora se convierte en otro tipo como calor, movimiento etc. El estudio de la absorción se pospondrá cuando se hable acerca de acústica arquitectónica. 1.1.8.5 Interferencia. Interferencia hace referencia a la combinación o suma de dos ondas similares, sin afectar las propiedades entre ellas (principio. de superposición). La interferencia puede ser destructiva, resultando en la desaparición de las ondas cuando están desfasadas, o constructiva cuando están en fase. La interferencia se puede observar con el experimento del tubo de Quincke. entrada L1 L2 salida Figura 15 Tubo de Quincke Fuente: VAN DER WICK. Physics. Göttingen, Alemania: PHYWE, 1998. El tubo de Quincke es un tubo que se divide en dos ramas en forma de U. Una de las ramas tiene longitud constante (L1) y la otra variable (L2). Se produce un sonido en uno de los extremos del tubo proveniente de un diapasón o una membrana vibratoria. En el otro extremo existe un receptor, generalmente un micrófono. Si L2-L1 = nλ (n ∈ Z), la interferencia será constructiva, las ondas están en fase cuando lleguen al micrófono y se escuchará una amplitud muy cercana a la original. Si L2-L1 = (2n+1) λ/2 (n ∈ Z), la interferencia será destructiva, las ondas están desfasadas completamente cuando lleguen al micrófono y no se escuchará nada. 1.1.8.6 Difracción. La refracción es el cambio de dirección de propagación de una onda (o torcimiento) cuando atraviesa a un medio distinto. Si ocurre un cambio de dirección de propagación sin cambio de medio, ocurre difracción. Esto ocurre cuando una onda encuentra un obstáculo de dimensiones reducidas en relación con su longitud de onda. 22 Debido al fenómeno de difracción, es que podemos oír sonidos alrededor de esquinas, o tras una barrera, aunque se pierda el contacto visual con la fuente. Señales de baja frecuencia se difractan más que señales de alta frecuencia. Figura 16 Patrón de difracción a través de dos ranuras Fuente: WEISSTEIN, Eric. Scienceworld. s.l.: Eric Weisstein. 2000 <www. scienceworld.wolfram.com> [consulta: 19 Feb. 2005] 1.1.8.7 Efecto Pulsatorio. El efecto pulsatorio es un fenómeno físico resultado de la suma de dos tonos (ondas) cuyas frecuencias difieren en un valor muy pequeño ∆f=f2-f1=e donde e es un valor casi despreciable (pero f2 no es igual a f1). Supongamos que tenemos dos ondas, una con frecuencia de 15 Hz y otra de frecuencia 17Hz. La onda resultante (suma) tendrá una frecuencia de 16 Hz. (el promedio aritmético entre las dos frecuencias). Debido a que las frecuencias de las ondas difieren muy poco, las ondas entran en fase y se desfasan alternadamente, ocasionando interferencia constructiva y destructiva respectivamente. Es decir, la amplitud de la señal varía entre 0 y la suma de las dos amplitudes sonoras. La frecuencia a la cual la amplitud varía de forma alternada se llama fpulsatoria y es igual a la diferencia entre las dos frecuencias. En el ejemplo, la fpulsatoria es de 2 Hz (la amplitud de la onda resultante crece y decrece dos veces en un segundo.) En general, para dos tonos (onda senoidal pura) de frecuencias f1y f2, tal que f2-f1 es muy pequeña: ftonoresultante= (f1 + f2) 2 fpulsatorio=f2-f1 23 1.1.8.8 Efecto Doppler. Es una experiencia cotidiana percibir como el sonido de un carro (una ambulancia por ejemplo), cambia cuando se acerca o se aleja de nosotros. Cuando se acerca, el sonido tiende a volverse más agudo mientras que cuando se aleja, el sonido tiende a volverse más grave. Este efecto ocurre cuando la fuente emisora de ondas y el receptor están en movimiento relativo y las frecuencias percibidas son distintas a las frecuencias originales de la fuente. (en el caso de ondas sonoras, el efecto es observable cuando las velocidades alcanzan un porcentaje suficiente de la velocidad del sonido.) Se pueden considerar tres casos: • receptor móvil • emisor móvil • ambos (receptor y emisor) móviles En el caso de receptor móvil, las ondas salen del emisor a una velocidad V de propagación del sonido(propia del medio). Si el receptor se mueve hacia el emisor a una velocidad Vr, percibirá el sonido con una velocidad V +Vr y si se aleja, pericibirá el sonido a una velocidad V-Vr. Sin embargo, el receptor no nota un cambio en la longitud de onda. Esto implica un cambio en la frecuencia (pues la longitud de onda se mantuvo constante y la velocidad cambió). Se debe cumplir que: fr=( V ± Vr fe ) = (V ± Vr) [=] Hz λ V fr: frecuencia que percibe el receptor fe: frecuencia del emisor Vr: velocidad a la que se mueve el receptor V: velocidad del sonido Si la fuente es la que está en movimiento, (según se acerca o se aleja del emisor), la posición de inicio de cada frente de ondas será diferente: si el emisor se acerca al receptor, 24 la longitud de onda será menor, mientras que si el emisor se aleja, la longitud de onda será mayor: λr= λ ∓ fr= Ve o mejor: fe feV [=] Hz V ∓ Ve fr: frecuencia que percibe el receptor fe: frecuencia del emisor Ve: velocidad con la que se mueve el emisor V: velocidad del sonido La expresión general, cuando el emisor y el receptor ambos están en movimiento es: fr= (V ± Vr)fe [=] Hz V ∓ Ve 1.1.8.9 Resonancia. La resonancia se puede definir como la existencia de un máximo de energía en una configuración física debido a fuerzas externas que excitan periódicamente con una frecuencia igual a uno de los modos de oscilación natural del sistema. Este fenómeno está íntimamente relacionado con la generación de ondas estacionarias. Por ejemplo, cuando se genera una onda estacionaria en un sistema debido a un sonido con una frecuencia característica (coincide con un modo de oscilación natural), el sistema resuena. 1.1.9 Parámetros físicos y unidades de medida del sonido A continuación se expondrán los parámetros más relevantes del sonido que se manejarán en el desarrollo de capítulos posteriores. 25 1.1.9.1 Velocidad del sonido en diferentes medios. En el aire se tiene que: c= 1.4 Pο ρ c= velocidad del sonido[=]m/s Po= presión atmosférica[=]Pa ρ= densidad del aire[=]kg/m3 Asumiendo que el aire es un gas ideal, existe una fórmula que relaciona la velocidad con la temperatura del aire: c=332 1 + T 273 c: velocidad del sonido[=]m/s T: temperatura en grados centígrados [=] °C A temperatura ambiente (20°C), la velocidad del sonido es aproximadamente igual a 343m/s. Para el caso de los sólidos, la onda se propaga con una velocidad dada por: c= E [=] m/s µ E: módulo de Young del sólido [=] N/m µ: densidad del sólido [=] kg/m3 En los gases, perturbaciones en la presión implican cambios en la temperatura. Para una onda en propagación, cuando existe una compresión, la temperatura se eleva mientras que cuando hay una rarefacción (descompresión) la temperatura disminuye. Sin embargo, debido a la baja conductividad térmica, el proceso puede ser considerado adiabático. La velocidad de una onda sonora en un gas ideal, viene dada por: 26 c= gRT [=] m/s µ g: coeficiente adiabático [=] kg mol/litros atm ms2 R: constante de los gases [=] litros atm/°Kmol T: temperatura [=] °K d: densidad [=] kg/m3 Otras características importantes que influyen en la velocidad y en la propagación del sonido e inherentes al medio son: Calor específico: El sonido viaja a cierta velocidad dependiendo de la temperatura que hay en el medio y debido a la relación existente entre calor específico y temperatura, el calor se convierte en parámetro.[=] Joules°K/kg Viscosidad del medio: Se refiere a las fuerzas que se oponen a la propagación de las ondas. Es el análogo a la fricción pero aplicado a fluidos. A mayor viscosidad, menor velocidad. [=] Ns/m2 Coeficiente cinemático de viscosidad: Es una cantidad que indica como está cambiando la viscosidad en un fluido [=] m2/s Conductividad calorífica: Es la capacidad que tiene un medio para transmitir calor. Al estar relacionado con la temperatura, influye en la velocidad. [=]calm/seg°C Difusibilidad térmica: Reúne los anteriores parámetros en uno solo. 1.1.9.2 Intensidad sonora. Toda propagación ondulatoria trae consigo una transferencia de energía. La cantidad de energía transportada por una onda, por unidad de superficie y unidad de tiempo se denomina intensidad. Esto es equivalente a calcular la potencia media por unidad de superficie. I= < p2 > [=] w/m2 ρc <p2>: valor cuadrático medio de la presión[=]Pa ρ: densidad del medio[=]kg/m3 c: velocidad del sonido[=]m/s 27 Para una fuente que irradia igual en todas las direcciones (isotrópica), se tiene que I= W , 4πr 2 donde W es la potencia total (acústica) irradiada por la fuente y r es la distancia a la fuente. Es decir, la intensidad sonora varía inversamente proporcional a la distancia de la fuente al cuadrado. Una unidad muy práctica es el de Nivel de Intensidad Sonora o SIL (Sound Intensity Level). Está dada por: SIL (dB) = 10log I I0 I0 es una intensidad de referencia e igual a 10-12 w/m2 que corresponde a la unidad de intensidad mínima audible por el ser humano, aunque debe resaltarse que este umbral depende de la frecuencia y del individuo. 1.1.9.3 Presión acústica. La presión acústica es la medida de la amplitud de la onda de presión que origina el sonido. Generalmente esta medida corresponde al valor cuadrático medio de la onda. El nivel de presión acústica es una unidad que indica la relación entre la presión acústica y una presión de referencia. SPL (dB) = 10log p2 = 20log 2 p0 p p0 p es el valor RMS de la presión mientras que p0= 20µPa es una potencia de referencia correspondiente a el valor de presión mínimo audible por el ser humano (otra vez, el umbral depende de la frecuencia pero ésto se profundizará en el capítulo de psicoacústica). De esta expresión se deduce que doblar la presión acústica en un punto determinado resulta en un incremento de 6dB en el nivel de presión acústica. 1.1.9.4 Potencia acústica. La potencia acústica es la cantidad de energía por unidad de tiempo radiada desde una fuente en forma de ondas acústicas. El nivel de potencia acústica es una unidad que indica la relación entre la potencia acústica y una potencia de referencia 28 SWL = 10log( W ) donde W0=10-12 W W0 De esta expresión se puede deducir que doblar la potencia acústica resulta en incremento de 3dB en el nivel de potencia acústica. En este punto es importante aclarar que el nivel de presión sonora y el nivel potencia acústica, aunque relacionados con conceptos distintos. El nivel de presión sonora en un punto en el espacio depende de la distancia que se encuentra la fuente y del ambiente que rodea al punto. Por el contrario, el nivel de potencia acústica es característico de la fuente y no depende ni de la distancia ni del ambiente. El nivel de presión acústica puede ser medido por instrumentos, pero la medición de nivel de potencia acústica se debe hacer indirectamente. 1.1.9.5 Impedancia acústica. La impedancia acústica es el cociente entre la presión acústica sobre una superficie por el flujo que la atraviesa. ZA= p [=] Pa s/m3[=] ohm acústico U p: presión acústica [=] Pa U: flujo volumétrico (velocidad multiplicada por la superficie) [=] m3/s Por analogía a las impedancias eléctricas, la impedancia acústica está compuesta por resistencia, masa y compliancia acústica. La resistencia acústica es una medida del calor que se disipa mientras que la masa y la compliancia son elementos almacenadores de energía acústica. 29 1.2 VOZ HUMANA La fuente del sonido para la voz humana es la vibración de las cuerdas vocales y efectos adyacentes producidos por todo el tracto vocal: laringe, faringe, boca y cavidad nasal. El principio físico relevante para la producción de sonido en el hombre es el de Bernoulli. Este principio establece que en el movimiento de un fluido la presión es menor en lugares donde la velocidad es mayor, y viceversa. La diferencia de presiones ocasiona una fuerza efectiva, llamada fuerza de Bernoulli. En el caso de las cuerdas vocales, el aire que pasa a través de ellas proveniente de los pulmones hace que las cuerdas vocales se cierren. Inmediatamente después que éstas se cierran, presión de aire se acumula en la tráquea haciendo que se vuelvan a abrir nuevamente. Este ciclo se repite una y otra vez. La tasa a la cual se abre y se cierran las cuerdas vocales determina la frecuencia de los sonidos resultantes. El sistema vibratorio produce una rápida oscilación de la presión de aire en el aparato vocal generando. La voz también está determinada por las posiciones de los labios, la mandíbula, la lengua y la laringe. Figura 17 Diagrama del tracto vocal Fuente: PAYTON, Eric. Guitarraonline. s.l.: 2001 <www. www.guitarraonline.com > [consulta: 19 Feb. 2005] 30 De acuerdo con lo expuesto, el órgano de la voz se puede dividir en tres grandes unidades que son: - los pulmones que aportan energía - las cuerdas vocales que actúan como osciladores al vibrar - el tracto vocal completo que actúa como una caja de resonancia 1.2.1 Formantes El tracto vocal (faringe, laringe, cavidad oral) actúa como un tubo resonante cerrado en la glotis y abierto en los labios. En un tubo cerrado, existen modos de oscilación para armónicos impares. En el caso del tracto vocal, se tienen 4 o 5 resonancias importantes denominadas formantes. Estas formantes están en aprox. 500 Hz, 1500 Hz, 2500 Hz, y 3500 Hz. Estas corresponden a λ/4, 3λ/4, 5λ/4 y 7λ/4. Los formantes pueden variar de acuerdo a la posición y abertura de la boca y la cavidad nasal. De hecho, la posición de la mandíbula determina el primer formante, la posición de la lengua determina el segundo formante y la posición de la punta de la lengua determina el tercero. Cuando la frecuencia de la señal de la voz es igual o está cerca de alguna de las formantes, la amplitud es mayor. Esto genera un espectro de la voz irregular con máximos en las frecuencias de las formantes. 1.2.2 Rango dinámico y de frecuencia El rango dinámico del hombre es el conjunto de valores de presión sonora que puede reproducir, desde el sonido más débil hasta el más fuerte. Esto es muy variable, ya que está condicionada a varios factores, como la frecuencia, el nivel de ruido y características propias del individuo. Por ejemplo, cuando se habla elevando la voz todo lo posible, sin 31 forzar las cuerdas vocales, la potencia de la palabra llega a ser 1mW. Un susurro por el contrario es de 0.001µW. La siguiente tabla muestra diversos valores de presión sonora (en dB) según la fuente sonora. Tabla 1 Rango dinámico de diferentes voces Tipo de fuente sonora Nivel de presión sonora (dB) Nivel susurro 20 Hombre conversación normal 55 Mujer conversación normal 50 Hombre gritando 85 Mujer gritando 80 Nivel máximo 90 Fuente: RECUERO LÓPEZ, Manuel. Ingeniería acústica. Madrid: Paraninfo, 1995. 654p El rango de frecuencia del hombre es el conjunto de frecuencias que es capaz de reproducir. El rango completo va desde 20Hz hasta 14kHz. Estos son los extremos pero es más común encontrar la voz en el rango de 100Hz hasta 3kHz. La frecuencia fundamental para un adulto hombre es de 120 Hz en promedio (80-200Hz). La frecuencia fundamental para una mujer es de 220 Hz en promedio (140-500Hz). Sin embargo, se debe tener en cuenta que tanto el hombre como la mujer producen armónicos de la frecuencia fundamental y estos armónicos pueden ser de muy alta frecuencia (>5kHz). 1.2.3 Características adicionales de la voz La producción de letras en la voz es uno de los aspectos fundamentales a considerar. Primero que todo, el mecanismo de producción de vocales y consonantes es diferente. Para la producción de vocales, el aire que pasa por la laringe solamente es modulado por las cuerdas vocales. Por oposición, para la generación de consonantes se necesita además la intervención de los labios, cavidades, paladar y la lengua. Las consonantes son más complejas que las vocales, tanto por su mecanismo de generación como por su contenido de frecuencias. La “s” es la letra con mayor componentes de agudos. Si se suprimen las 32 frecuencias superiores a 6kHz, la letra no se entiende. Lo mismo sucede con la “j” si se suprimen las frecuencias superiores 4.5kHz. Por debajo de 2kHz, la “r” es una de las pocas consonantes que se entienden. Por último, por debajo de 500Hz ninguna consonante se entiende y además, todas las vocales se confunden con la “u”. En conclusión, si se desea reproducir fielmente la voz para evitar los anteriores problemas, se deberán reproducir las frecuencias entre 60 Hz hasta 10kHz, siendo esenciales de 200 a 6kHz. El reconocimiento de la palabra es otro aspecto importante en un sistema de transmisión sonora. El sistema de transmisión sonora es de índole variada: el aire, el teléfono, un estudio de grabación, radio. etc. En estos sistemas es fundamental la comprensión de la palabra. El reconocimiento fiel y óptimo de la palabra se conoce como inteligibilidad. La inteligibilidad depende de muchos aspectos, pero los más importantes son el nivel de presión sonora, la frecuencia y la reverberación. El nivel de presión sonora debe ser superior al ruido de tal forma que se escuche la información necesaria. El ruido es toda señal indeseada. La frecuencia es un parámetro importante y está demostrado que las frecuencias más importantes para la inteligibilidad son las comprendidas entre 500Hz y 3kHz. La reverberación también tiene influencia sobre la inteligibilidad de la palabra, pero su estudio se pospone para el capítulo de acústica arquitectónica. 33 1.3 SISTEMA AUDITIVO El oído humano es uno de los órganos más impresionantes del cuerpo pues posee un rango increíble de sensibilidad, tanto en frecuencia como en amplitud. El oído responde a frecuencias entre 20Hz y 20kHz y responde a una rango de variación de presiones de 1,000,000 a 1. El fenómeno de la percepción sonora en los humanos es un proceso complejo que requiere un análisis que se desarrolla en tres etapas básicas: • captación de las ondas sonoras • conversión de la señal acústica en impulsos nerviosos y la transmisión de esos impulsos hasta el cerebro • procesamiento neural de la información Las primeras dos etapas se producen en el oído mientras que la última ocurre en el cerebro propiamente dicho. Las variaciones de presión del aire causadas por las ondas sonoras se convierten en vibraciones mecánicas que a su vez producen vibraciones de un fluido. Estas generan impulsos eléctricos, y el cerebro los transforma en sensaciones auditivas. Solamente se discutirá la fisiología del oído, el cual se divide en tres partes que operan de manera complementaria: el oído externo, el oído medio y el oído interno. Estas tres partes del oído constituye el sistema periférico de audición. 1.3.1 Oído externo La parte más exterior es el pabellón el cual se encarga de recoger las ondas sonoras y las dirige hacia el conducto auditivo externos a través del orificio auditivo. Al otro extremo del oído externo, se encuentra el tímpano, el cual constituye la entrada al oído medio. El canal que comunica el pabellón auricular con el oído medio se llama conducto auditivo. Así, la función primordial del oído externo es el de recolectar las ondas sonoras y dirigirlas al oído medio. Sin embargo, el oído externo tiene otras funciones como la de proteger las 34 estructuras del oído medio contra daños además de minimizar la distancia del oído interno al cerebro (de esta forma se reducen los tiempos de propagación). Así hay menos forma de distorsionar la señal ya que ésta ya ha sufrido variaciones debido a efectos de difracción en el pabellón auricular y la cabeza. Figura 18 Oído externo Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica., 1995 1.3.2 Oído medio El tímpano es el primer elemento mecánico del oído y con éste comienza la parte media. Adherido al tímpano, se encuentra un huesecillo llamado martillo, unido por ligamentos a un segundo hueso llamado yunque. La serie de huesecillos termina con el estribo y el peso total de los huesos es de 63 miligramos aproximadamente. Estos tres huesos están situados en una cavidad llena de aire que se comunica con la faringe mediante la trompa de Eustaquio. La trompa de Eustaquio tiene la importante función de estabilizar la presión del oído, haciendo que la presión del oído interno sea igual a la presión atmosférica. Los sonidos son conducidos a través del conducto auditivo hasta el tímpano. Los cambios de presión en la membrana timpánica (debido a la señal sonora), hacen que la membrana vibre de acuerdo a la forma del sonido. Estas vibraciones se transfieren a la cadena de huesecillos (martillo, yunque y estribo) que actúan como un sistema de palancas. El estribo, en el borde de la ventana oval, transfiere su vibración (proveniente del aire) a el fluido. Se debe procurar una transferencia de potencia máxima de las vibraciones en aire hacia el fluido, y el sistema de palancas actúa como acoplador para que esto se pueda realizar. La ventana oval marca la entrada para el oído interno. 35 Figura 19 Oído medio Fuente: PIEDRAHITA, Ramón. Fisiología. s.l.:s.n.. 2000 < www.salud.nih.gov> [consulta: 13 Abr. 2005] 1.3.2.1 Reflejo timpánico. Cuando se aplican sonidos muy fuertes al oído (> 90 dB SPL) los músculos del tímpano y del estribo se contraen de forma automática, modificando la característica de transferencia del oído medio. Esto actúa como un control automático de ganancia pues al modificar la función de transferencia del oído medio se disminuyen la cantidad de energía entregada al oído interno. Tiene como propósito proteger a las células receptoras frente a sobrecargas que puedan llegar a destruirlas. Este fenómeno se denomina reflejo timpánico pero no es instantáneo; tarda de 40 a 160ms en producirse. Es un mecanismo no lineal. 1.3.3 Respuesta en frecuencia del oído El conjunto formado por el oído externo y el oído medio forman un sistema cuya respuesta en frecuencia es de tipo pasabajos como se muestra en la figura. En el intervalo cercano a los 4 kHz se observa un pequeño efecto de ganancia, debido a las características del conducto auditivo. Esta respuesta sólo es válida cuando el sistema se comporta de modo lineal; es decir, cuando la intensidad del sonido no es muy elevada, para evitar que actúe el reflejo timpánico. 36 Figura 20 Respuesta en frecuencia combinada del oído externo y el oído medio Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. 1.3.4 Oído interno El oído interno tiene la función primordial de convertir las ondas mecánicas en impulsos nerviosos y también el de filtrar la señal sonora. El órgano fundamental del oído interno es el caracol o cóclea. El caracol es un conducto rígido de unos 35mm de longitud encargado de convertir las vibraciones físicas en señales eléctricas. El interior del conducto está dividido por en sentido longitudinal por la membrana basilar y por la membrana de Reissner. Estas a su vez forman tres compartimentos llamadas escalas: la escala timpánica, la escala vestibular y la escala media. Las primeras dos escalas contienen un líquido llamado perilinfa y se interconectan mediante una abertura localizada en el caracol llamado helicotrema. La escala media contiene otro líquido llamado endolinfa. Las vibraciones provenientes del oído medio entran al oído interno a través de la ventana oval, generando ondas viajeras en el líquido dentro de la escala vestibular. La onda sonora pasa por el helicotrema y regresa a través de la escala timpánica hasta la ventana redonda (una región flexible en la base de la cóclea). La ventana redonda no permite que la onda sonora sea reflejada. La membrana basilar contiene células ciliares responsables de producir pontenciales eléctricos en función de la excitación de la membrana debido al movimiento del fluido. Este movimiento es función de la frecuencia. A lo largo de la membrana basilar, se encuentra el órgano de Corti, responsable de la transmisión de los impulsos eléctricos al nervio acústico y de ahí al cerebro. En el cerebro se hace el procesamiento neural para identificar las propiedades de la onda sonora (frecuencia, amplitud, forma). 37 Figura 21 Diagrama completo del oído Fuente: FIGUEROA, David. s.l.: s.n. 1997 < www..medspain.com/ruidoindustrial > [consulta: 21 Abr. 2005] 38 2. ACÚSTICA La acústica es la parte de la física que estudia la producción, transmisión y percepción del sonido. El sonido tiene aplicaciones en muchas ramas del conocimiento y por lo tanto constituye una ciencia multidisciplinaria. Algunas áreas de trabajo en acústica son: acústica arquitectónica: Estudia el fenómeno sonoro respecto a las construcciones. Se aplica en el diseño de salas de conciertos, auditorios, teatros, estudios de grabación, etc. ingeniería acústica: Estudia todos los procesos de medición acústica e instrumentación para su aplicación en la música, la medicina y en la geología. acústica musical: La acústica musical combina elementos científicos y artísticos-musicales para el diseño óptimo de instrumentos, sistemas de grabación, sistemas de reproducción, etc. control de ruido y de vibraciones: El ruido está reconocido oficialmente como un causante de contaminación (contaminación sonora) y su control ha sido implementado por organismos gubernamentales. Su campo de trabajo está en las fábricas, en el control preventivo de vibraciones en las máquinas, ruidos internos, etc. bioacústica, psicoacústica y acústica médica: Estudia la interacción entre las ondas sonoras y los humanos y los animales. Particularmente, los ultrasonidos han servido como herramienta de diagnóstico y tratamiento. En este capítulo, primero se introducirán conceptos relevantes a la acústica y a las señales acústicas. Posteriormente, se tratarán algunos temas de acústica aplicada: psicoacústica, acústica musical, acústica arquitectónica y ruido acústico. 39 2.1 SEÑALES ACÚSTICAS Las señales acústicas son las mismas señales sonoras pero con un enfoque ligado a la transmisión a distancia. Por esto, éstas se dividen en dos, a saber, señal primaria y señal secundaria. Señal primaria: Esta se refiere a la señal original, directamente desde la fuente que la produce. Señal secundaria: Es aquella que pasa a través de algún canal o es procesada por algún equipo. Se busca que sea igual a la señal primaria. Sin embargo, esto en la práctica no es posible debido a problemas asociados a la transmisión, circuitería y al canal: -pérdida del espacio acústico -cambio de nivel -cambio del espectro -cambio del rango dinámico -distorsiones -ruido pérdida del espacio acústico: Se pierde la localización de la fuente en el espacio y no se sabe de donde proviene la señal. cambio de nivel: Siempre existirán cambios en la presión sonora traducidos en aumentos o descensos en amplitud (nivel) cambio de espectro: En los equipos el espectro se ve filtrado o reducido debido a que el ancho de banda de éstos no es ilimitado. También debido a distorsiones aparecen otros armónicos no deseados. cambio del rango dinámico: Es un problema inherente a los equipos cuando el rango dinámico de éstos es menor al de la señal primaria. distorsión: Existen dos tipos de distorsión básicamente, a saber: distorsión lineal y distorsión lineal. La distorsión lineal es aquella que afecta solamente a la amplitud de la señal y se puede corregir utilizando amplificadores. La distorsión no lineal es más difícil de 40 corregir. En la distorsión no lineal hay cambio en la forma de la señal, es decir, en los armónicos de ésta. Aparecen nuevos armónicos y éstos deben controlarse. Un parámetro importante es el THD (o distorsión armónica total) que relaciona la energía promedio de los armónicos con respecto a la frecuencia fundamental. Es deseable que este valor sea pequeño. La distorsión por intermodulación ocurre cuando existe modulación entre los armónicos, es decir se generan nuevas frecuencias no deseadas a partir de los armónicos presentes en la señal. Ruido: El ruido se puede definir como potencia (acústica) no deseada. En equipos electroacústicos, esta potencia suele ser de naturaleza eléctrica y no es deseable y muchas veces inevitable. 41 2.2 PSICOACÚSTICA Hasta el momento, se ha discutido acerca de características físicas y medibles del sonido, pero no se ha dicho cómo se comporta éste al llegar a nuestros oídos y a nuestra cabeza. Es decir, la psicoacústica estudia la relación entre los parámetros físicos del sonido y nuestra percepción subjetiva de ellos. Los parámetros psicoacústicos más relevantes son: - sonoridad - altura - timbre La sonoridad es la percepción subjetiva de la intensidad sonora. La altura o tono está ligada a la gravedad o que tan agudo es un de sonido. Está relacionado con la frecuencia fundamental de la señal sonora. El timbre es caracterizado por la forma de la onda, o su componente armónico. Sin embargo, debido a la sensibilidad y respuesta en frecuencia del oído humano, estos términos en el contexto de la psicoacústica no son totalmente independientes. Aparte de éstos términos, se estudiarán otros que son fenómenos característicos de la percepción del sonido como la direccionalidad, la espacialidad y el enmascaramiento. 2.2.1 Características de la respuesta humana Nuestra habilidad para percibir cualquier estímulo utilizando nuestros sentidos está limitada por dos situaciones principalmente: - limitaciones físicas - la habilidad del cerebro para procesar la información 42 Las limitaciones físicas determinan las fronteras absolutas de rango de sensibilidad para nuestra audición. El hecho que los humanos percibamos frecuencias desde los 20 Hz hasta los 20kHz (aunque estos valores pueden variar de persona a persona debido a la edad, sexo, etc.) está establecido por la construcción física de nuestro oído y sus componentes internos. Igualmente, no podemos detectar todas las intensidades. La habilidad del cerebro para procesar información es un poco más difícil de analizar, pero se puede observar la deficiencia de éste cuando en el cerebro se enmascaran ciertas frecuencias (es decir escuchamos unas pero otras, aún estando ahí, las ignoramos). 2.2.1.1 Rango dinámico y rango de frecuencia. Se había anotado anteriormente que el ser humano es capaz de detectar únicamente aquellos sonidos que se encuentran dentro de un determinado rango de amplitudes y frecuencias. El rango dinámico del oído es el conjunto de intensidades que puede detectar el oído, y empieza en la mínima presión sonora que puede detectar y termina en la máxima presión sonora que puede tolerar. La mínima corresponde a 0dB SPL y la máxima a 140 dB SPL aproximadamente. El rango de frecuencias es el conjunto de frecuencias que son capaces de excitar al oído y producir una percepción. Normalmente, el rango de frecuencias está entre 20Hz y 20kHz. Este rango varía según la edad. (Al envejecer, se disminuye tanto el rango dinámico como el rango de frecuencia). 2.2.2 Sonoridad o percepción de la intensidad La sonoridad es la percepción subjetiva de la intensidad. Debido a que la sensibilidad del oído es variable no existe una relación directa entre ambas. La sensibilidad del oído está relacionado con el umbral de audición y éste se define como la potencia sonora mínima capaz de excitar al oído y producir una respuesta sensorial. El umbral para la audición a 1kHz es de 20uPa o 0dBspl. Si excitamos al oído con un tono puro (senoidal) con menor presión acústica, no podríamos oírlo. Sin embargo, nótese que el umbral para la audición se definió para 1kHz. Esto es debido a que el oído se comporta distinto (con respecto a las intensidades) a distintas frecuencias. De ahí la distinción entre sonoridad (subjetiva) e intensidad (objetiva). Por ejemplo, si se tratara de encontrar el umbral de audición para una 43 frecuencia digamos de 100Hz, tendría que ser más “intensa” que 0dBspl (de hecho sería alrededor de 25dBspl). Para que un tono de 100Hz suene igual de duro (sonoridad) a un tono de 1kHz, el primero deberá tener una mayor presión (o potencia) acústica. Figura 22 Umbral de audición en función de la frecuencia Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004. Nótese que el Umbral de Audición es variable pues depende de hecho de la frecuencia. Del gráfico podemos hacer cuatro observaciones importantes: - Las frecuencias menores a 1kHz y mayores a 5kHz deben ser (en términos de presión acústica) mayores a 0dBspl para que puedan ser audibles. - Para las frecuencias menores a 100Hz: entre más baja la frecuencia, más alto es el umbral - Para las frecuencias mayores a 5kHz: entre más alta sea la frecuencia, más alto es el umbral - Para frecuencias entre 2kHz y 5kHz sonidos con una presión acústica menor a 0dBspl, pueden ser audibles. Es decir, en este intervalo de frecuencia, el oído es más sensible. En general, la respuesta de sonoridad en el oído no es para nada lineal. La sensibilidad del sistema auditivo no es independiente de la frecuencia. Es importante resaltar que la curva de Umbral de Audibilidad presenta una dependencia con respecto al modo de propagación de las ondas sonoras; la curva de arriba se hizo suponiendo una condición de campo libre (en promedio), aunque en situaciones cotidianas la propagación es de campo difuso (el sonido incide desde todas las direcciones posibles) 44 Para diferenciar el nivel de sonoridad del nivel de presión sonora (SPL) se realizaron una serie de experimentos psicoacústicos. El primero de éstos data de 1933 y fue llevado a cabo por Fletcher y Munson. El experimento consistía en hacerle escuchar a una misma persona un tono puro (senoidal) de 1KHz a un nivel de presión sonora determinado. Luego se le hacía escuchar otro tono (distinta frecuencia) y se ajustaba el “volumen” (SPL) hasta escuchara igual de fuerte este tono que el de 1KHz. El experimento se repitió para diversas frecuencias y niveles de presión sonora hasta obtener unas curvas de igual nivel de sonoridad, llamadas contornos de Fletcher y Munson (ver figura). dB SPL f (Hz) Figura 23 Curvas de Fletcher y Munson Fuente: FIGUEROA, David. s.l.: s.n. 1997 < www..medspain.com/ruidoindustrial > [consulta: 21 Abr. 2005] Mediante estas curvas se pudo definir el concepto de nivel de sonoridad, expresado en fons. Las distintas líneas (o contornos) representan los distintos niveles de sonoridad. La línea roja en el gráfico muestra el umbral para la audición para distintas frecuencias. Los fons permiten ordenar los sonidos según su sonoridad en forma independiente de la frecuencia. 2.2.2.1 Curvas de ponderación, fons, y sons. Debido a que el oído humano no responde igual a todas las frecuencias, se han normalizado 4 curvas de niveles de ponderación (A B C D). El propósito de estas curvas es que actúen como un filtro que “siga” la respuesta del oído humano. De esta forma, con las curvas se puede obtener una mejor medición de sonoridad (subjetiva), pues los instrumentos físicos solamente pueden medir intensidades (objetivo). El filtro que se utiliza para simular la audición humana se llama un filtro ponderado. Es ponderado pues asigna distintas ganancias a distintas frecuencias. La respuesta en frecuencia del filtro es lo que se denomina curva de ponderación. Cada curva tiene su característica particular: 45 Curva A: Sigue la respuesta del oído humano a niveles de 40 fons y corrige las frecuencias altas y bajas. Curva B: Responde a la sensibilidad del oído con niveles de 55 fons. La respuesta es casi lineal y rectifica la respuesta a frecuencias muy bajas. Curva C: Corresponde a una respuesta muy lineal. Es útil para intensidades (spl) altas. Curva D: Se utiliza para la medida subjetiva del ruido de los aviones. Los equipos electrónicos utilizados para la medición acústica deben adaptarse a la respuesta en frecuencia del oído humano respecto a la intensidad. De ahí la necesidad de filtros que ponderan de forma diferente las diferentes frecuencias. La curva A ha tenido aceptación por su gran correlación con la molestia y el daño auditivo. Las medidas utilizando este filtro se expresan en dBA. La mayoría de las mediciones de sonido se hacen en dBA y por eso se denomina al instrumento que mide dBA como medidor del nivel sonoro. Los fons son unidades importantes pues combinan aspectos psicológicos con aspectos físicos. Por ejemplo, un sonido de 500Hz a una sonoridad de 40 fons llega al oído de igual forma que cualquier otro sonido de 40 fons de cualquier otra frecuencia. Sin embargo, los fons (nivel de sonoridad) no describe completamente el comportamiento del oído humano respecto a las intensidades. El nivel de sonoridad analizado es aún una magnitud psicofísica, ya que en última instancia se basa en la comparación de sensaciones con las producidas por una frecuencia (1 kHz) tomada arbitrariamente como referencia. El problema básico de los fons, reside en que un tono con doble sonoridad que uno dado, no se escucha el doble de sonoro. Así, por ejemplo, un tono de 80 fon no es el doble de sonoro que uno de 40 fon. A fin de establecer una escala subjetiva de sonoridad se realizaron otra serie de experimentos. Se aumentaba la intensidad de la fuente hasta que se lograra una proporción de 2 a 1 en sonoridad. Para ésto, el concepto de “doblemente sonoro” debía quedar completamente determinado y definido. Esto puede lograrse por comparación entre la audición monoaural (un oído) y biaural (ambos oídos) de un mismo sonido. Un sonido B 46 escuchado monoauralmente es doblemente sonoro que otro A cuando produce el mismo incremento de sensación que produce pasar de la escucha monoaural a la escucha biaural de A. Los experimentos se realizaron con varios niveles de presión sonora para cada conjunto de frecuencias (obviamente frecuencias audibles). El resultado es una relación entre el nivel de sonoridad expresado en fon y la sonoridad, expresado en son. La escala de son (sonoridad) y la escala de fon (nivel de sonoridad sonoridad) se relacionan de forma logarítmica. Figura 24 Relación entre nivel de sonoridad (fon) y sonoridad (son) Fuente: MIYARA, Federico. Introducción a la psicoacústica. Bogotá: Fundación Decibel, 2004 Por encima de 40 fon, la curva es lineal (en un gráfico logarítmico). De ésto se deduce una primera expresión para calcular el nivel de sonoridad a partir de la sonoridad: S = 10 Ns − 40 30 [=] sons Para Ns<40fon, es posible aproximar la curva anterior por medio de la ecuación S= 6.9 ⋅ 10 −5 (Ns-2)2.634[=] sons Es importante resaltar que lo anteriormente expuesto respecto a intensidades y sonoridades se refiere a tonos puros: es decir, aquellos que solo tienen una componente de frecuencia (senoidal, 0 armónicos). La mayoría de los sonidos que se encuentran en la práctica son sonidos compuestos (con gran componente armónico). El análisis de la sonoridad de 47 sonidos compuestos (con armónicos) es más compleja porque los mecanismos de integración de la sensación difieren según la separación entre las frecuencias de los componentes. Esto introduce el concepto de banda crítica. 2.2.2.2 Banda crítica. Un criterio para decidir si los tonos están próximos o no es si están en una misma banda crítica. La banda crítica se define como un intervalo de frecuencia que representa la máxima resolución frecuencial del sistema auditivo en diversos experimentos psicoacústicos. Constituye el intervalo de frecuencias en el cual el oído interno efectúa una integración espectral de la señal sonora, es decir, el intervalo en el cual se pueden sumar las energías de los distintos componentes espectrales de la señal. La tabla muestra las bandas críticas (según Zwicker y Feldtkeller): Tabla 2 División del espectro en bandas críticas fi: frecuencia inferior de la banda fo: frecuencia central de la banda fs: frecuencia superior de la banda fbc: ancho de banda En la tabla se muestra : fi: frecuencia inferior de la banda fo: frecuencia central de la banda fs: frecuencia superior de la banda fbc: ancho de banda 48 Si los sonidos puros que forman el sonido compuesto están comprendidos dentro de una misma banda crítica, la intensidad (cuadrado de la presión sonora) total se obtiene sumando las intensidades individuales. A partir de la intensidad total, se calcula la sonoridad (a partir de las curvas ya expuestas) correspondiente a dicha banda crítica. Si en cambio los tonos puros están suficientemente alejados, la sonoridad total se calcula sumando directamente las sonoridades individuales. Se pueden resumir ambos casos en un procedimiento “práctico” para obtener la sonoridad ( o nivel de sonoridad) total de un sonido compuesto: 1. Subdividir el espectro del sonido en cuestión en bandas críticas con la ayuda de la tabla de Zwicker y Feldtkeller. 2. Sumar las intensidades de los tonos puros (armónicos) de cada banda 3. Convertir la intensidad total de cada banda en nivel sonoridad y después a sonoridad. 4. Sumar todas las sonoridades de las diversas bandas críticas. Esta resultante es la sonoridad del sonido. Si se quiere el nivel de sonoridad, simplemente se transforma de acuerdo a la ecuación que relaciona a S y Ns. 2.2.3 Altura La altura de un sonido está relacionado con la frecuencia fundamental de éste. La relación entre frecuencia y altura es bastante directa correspondiendo las bajas frecuencias a sonidos graves y las altas frecuencias a sonidos agudos. Sin embargo, la altura tiene alguna dependencia tanto de la sonoridad (intensidad) como del timbre. Cuando dos tonos iguales (de igual frecuencia) tienen intensidades distintas también parecen tener alturas ligeramente distintas. Igualmente, un timbre brillante parece ser más agudo que un timbre opaco, aunque las frecuencias y las intensidades sean iguales. Existe un fenómeno relativo a la altura y a la frecuencia a partir de los 1000Hz. Por debajo de 500Hz, existe una relación lineal entre altura y frecuencia. Pero a partir de 500Hz, 49 intervalos de frecuencia cada vez más grandes producen incrementos más pequeños de altura (subjetiva). Por esta razón se inventó una nueva escala que diera cuenta del fenómeno perceptivo de la altura. Stevens, Volkman, y Newman en 1937 propusieron una unidad de altura denominada mel. La escala mel es una escala perceptual juzgada por personas de tal forma que los tonos estén equiespaciados para todas las frecuencias. El punto de referencia para esta escala es establecer que un tono de 1Khz a 40dB equivale precisamente a 1000mels. Por debajo de 1000Hz (o 1000 mels) la escala mel coincide exactamente con la escala de frecuencia normal (en Hz). Por encima de 1000Hz, intervalos de frecuencias cada vez mayores producen la sensación de incrementos iguales en la altura. Por ejemplo, cuatro octavas por encima de 500Hz en la escala de frecuencia corresponden a apenas dos en la escala mel. (se comprime). Para convertir f (Hz) en m (mel): m = 1127ln(1 + f / 700). y la inversa: f = 700(em / 1127 − 1). Figura 25 Altura (medida en mels) en función de la frecuencia Fuente: WEISSTEIN, Eric. Scienceworld. s.l.: Eric Weisstein. 2000 <www. scienceworld.wolfram.com> [consulta: 17 Feb. 2005] La altura es uno de los parámetros perceptivos fundamentales del sonido. La altura es de vital importancia en el estudio de la acústica musical. 50 2.2.4 Timbre El timbre es un atributo que permite diferenciar dos sonidos con igual altura y sonoridad. Es la cualidad del sonido que nos permite identificar con facilidad la voz de alguien cuando hablamos por teléfono o un instrumento musical de otro. El timbre de un sonido es una cualidad compleja que depende principalmente del espectro o la forma de la onda. El espectro de una onda lo constituye las frecuencias que la originan según el Análisis de Fourier. Es decir, el análisis de las frecuencias individuales de un onda sonora dada, nos proporciona información acerca de su naturaleza tímbrica. Otro elemento importante en el análisis del timbre es la envolvente del sonido en el tiempo. La envolvente indica el comportamiento dinámico de un sonido en el tiempo. Ya se había hablado anteriormente de envolventes en el tiempo (ADSR). La envolvente se subdivide en envolvente primaria y en envolventes secundarias. La primera determina la forma en que varía en el tiempo la amplitud general. La segunda corresponde a las variaciones temporales relativas de los armónicos. Es decir, las envolventes secundarias dependen de la manera en que se amortiguan las diferentes frecuencias del espectro. Si se combinan ambos elementos, el espectro y la envolvente, se podrá caracterizar la identidad tímbrica de un sonido en particular. El estudio del timbre cobra mucha importancia al tratar de imitar sonidos o producir sonidos de forma artificial. El campo que estudia esto es la síntesis de sonidos y los instrumentos más populares utilizados para este fin son los sintetizadores electrónicos. 2.2.5 Direccionalidad y espacialidad Un factor importante en el estudio del sonido es el reconocimiento de su procedencia; de dónde viene el sonido y como puede el ser humano detectar esa procedencia. Los sonidos reales se originan en fuentes que están ubicadas en algún lugar del espacio circundante dando origen a dos tipos de sensaciones: la direccionalidad y la espacialidad. 51 La direccionalidad se refiere a la localización relativa de la fuente del sonido o su dirección de procedencia mientras que la espacialidad permite obtener información auditiva del ambiente donde se generó y se propagó el sonido (dimensiones del ambiente, arquitectura, acabado superficial, etc.) La direccionalidad está asociada a tres fenómenos principalmente. El primero de estos fenómenos es el retardo o diferencia de tiempos de llegada del sonido desde un oído hasta el otro, debido a que el recorrido de la onda desde la fuente hasta cada oído es diferente, en general. El segundo fenómeno es la diferencia de presiones (sonoras) entre los oídos debido a la distancia entre ellos además de que la cabeza actúa como una barrera sonora. El tercer fenómeno se relaciona con las alteraciones en el espectro producidas por la propia cabeza. Estas alteraciones son más notorias en el oído menos expuesto. El cerebro recoge todas esta información respecto a diferencias de distancias, presiones y cambios en el espectro y toma una decisión respecto a la localización de la fuente. Esta capacidad se conoce como discriminación direccional. La sensación de direccionalidad está determinada por el primer frente de onda que llega a los oídos. Esto se conoce como el efecto Haas o efecto de precedencia. El efecto Haas se puede ilustrar mediante un experimento: El experimento consiste en escuchar mediante unos audífonos estereofónicos dos señales iguales, una de ellas ligeramente retardada respecto a la otra en cada oído. Las diferentes etapas del experimento se enumeran a continuación. - La señal llega a ambos oído simultáneamente (sin retardo) - La señal llega al oído derecho con un retardo de 0.3ms - La señal llega al oído derecho con un retardo de 0.6ms - La señal llega al oído derecho con un retardo de 20ms. - La señal llega al oído derecho con un retardo mayor o igual a 35ms. 0 ms 0.3 ms 0.6 ms 20 ms 35 ms Figura 26 Experimento ilustrando el efecto Haas En el caso 1, se percibe una fuente común y corriente. En el caso 2, se crea la sensación de una fuente virtual (aparente) que se desplaza desde el frente hacia el lado no retardado. En 52 el caso 3, la fuente virtual parece estar en el extremo izquierdo. En el caso 4, la fuente virtual parece ensancharse, es decir, tiende a convertirse en dos fuentes por separado. El caso 5, el segundo sonido se percibe como un eco del primero pero de fuentes distintas. (la fuente virtual se convirtió en dos). Este es el denominado efecto Haas mediante el cual el retardo entre las señales determinan la direccionalidad. La espacialidad es otro fenómeno relacionado con la percepción humana de la fuente sonora que nos da una idea de espacio circundante. La espacialidad depende principalmente de cuatro factores. El primero es la distancia entre la fuente y el oído. La presión sonora disminuye con la distancia y si se conoce la naturaleza de la fuente (si la distinguimos o si es familiar), al escuchar un sonido propagarse, es posible tener una idea de la distancia de la fuente. El segundo factor lo constituye las reflexiones tempranas. Si nos encontramos en el aire libre, sabemos que el sonido proveniente de una fuente al alejarse indefinidamente, se extingue. El caso contrario ocurre si estamos en un espacio cerrado en el cual la onda sonora se refleja en las paredes múltiples veces. Las primeras de estas reflexiones se denominan reflexiones tempranas. Son aquellas que llegan al oído desde generado el sonido hasta 30ms después. Estas reflexiones tempranas le dan al sistema auditivo una sensación del tamaño del ambiente que lo rodea. Esta sensación es llamada ambiencia y es fundamental en el estudio de la acústica arquitectónica en la próxima sección. El tercer factor que influye en la espacialidad del sonido es la reverberación. La reverberación es consecuencia de las reflexiones tardías del sonido. Las reflexiones tardías, a diferencia de las reflexiones tempranas se superponen entre sí debido a que aparecen las reflexiones de las reflexiones y posteriormente las reflexiones de las reflexiones. En pocos instantes se combinan cientos de reflexiones, dando origen a a la reverberación. Es debido a la reverberación que el sonido prolonga aún cuando la fuente sonora es interrumpida. El tiempo de reverberación o tiempo de permanencia depende de las características del ambiente y por lo tanto este tiempo brinda cierta información especial respecto al recinto donde se propaga el sonido. El último factor fundamental en la sensación de espacialidad es el efecto Doppler. El efecto Doppler ya fue explicado anteriormente y es la percepción de un cambio de frecuencia cuando existe una fuente en movimiento. Este efecto no es de considerable importancia en la música por ejemplo, pues los instrumentos están estáticos 53 generalmente pero tiene aplicación en las bandas de sonido de películas para simular con mayor realismo una fuente móvil. 2.2.6 Enmascaramiento El enmascaramiento es un fenómeno psicoacústico en el cual un sonido es ocultado (opacado) por otro y el cerebro solamente es capaz de reconocer uno de los dos sonidos. Esto es equivalente a decir que en el enmascaramiento se aumenta el umbral de audibilidad de un sonido debido a la presencia de otro. El enmascaramiento sonoro tiene su origen en los receptores auditivos situados en la membrana basilar. Esto en consecuencia ocasiona un nivel de actividad neural que altera la detectabilidad de algunos componentes y ocurre el enmascaramiento. El enmascaramiento sonoro está relacionado principalmente con el nivel de presión sonora, la frecuencia y con la envolvente en el tiempo. Dependiendo de esos factores se podrá distinguir entre la señal enmascarante y la señal enmascarada. Para facilitar el análisis, se supondrán primeramente dos señales puras (una componente de frecuencia). 2.2.6.1 Umbral de enmascaramiento (UE) y nivel de sensación (NS). Se dijo anteriormente que el umbral de audibilidad es el nivel de presión sonora mínimo audible para el ser humano, variable en la frecuencia. Ahora se debe introducir un nuevo término relacionado para el análisis del enmascaramiento sonoro. Este, es el umbral de enmascaramiento (UE) y se define como el nivel de presión sonora de una señal de prueba para que ésta sea audible en presencia de una señal enmascarante. Nótese que en la definición de umbral de enmascaramiento se hace referencia a una nueva señal: la señal enmascarante. En el caso en que no exista señal enmascarante, las definiciones de umbral de audibilidad y de umbral de enmascaramiento son idénticas. El patrón de enmascaramiento es una forma de representar el umbral de enmascaramiento en función de una variable, generalmente la frecuencia. Se suele representar de manera gráfica. Otro parámetro importante en el estudio del enmascaramiento sonoro es el nivel de sensación (NS), medido en dBsl: 54 NS(dBsl)= UE(dBSPL)-UA(dBSPL) Las unidades que son medidas en dBsl siempre están relacionadas a un umbral de audibilidad. (dBSPL es el nivel de presión sonora) 2.2.6.2 Tipos de enmascaramiento. Existen diversos tipos de enmascaramiento de acuerdo al nivel de presión sonora, la frecuencia, y la separación en el tiempo de la señal enmascarante y la enmascarada. Dependiendo de la ubicación en el tiempo de señal de prueba y la señal enmascarante se definen los siguientes tipos de enmascaramientos sonoros (temporales): Enmascaramiento simultáneo: La señal de prueba y la señal enmascarante se presentan al mismo tiempo, solapadas. Pre-enmascaramiento (enmascaramiento previo): La señal enmascarante se presenta después de la señal de prueba. Post-enmascaramiento (enmascaramiento posterior) : La señal enmascarante se presenta antes de la señal de prueba. Figura 27 Enmascaramiento temporal Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l.: Universidad Simón Bolívar, Departamento de electrónica. 1995 A continuación se efectuará un análisis de los efectos espectrales relativos a el ruido que tiene el enmascaramiento simultáneo, quizá el más importante y que se presenta con mayor frecuencia. 2.2.6.3 Análisis del enmascaramiento simultáneo en la frecuencia. Se realizaron experimentos con ruido blanco, es decir, ruido cuya densidad espectral de energía es 55 constante e independiente de la frecuencia. El patrón de enmascaramiento del ruido blanco, obtenido experimentalmente es el siguiente: Figura 28 Patrón de enmascaramiento del ruido blanco a varias presiones sonoras Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica. 1995. Del gráfico se pueden hacer algunas afirmaciones: - El umbral de enmascaramiento para el ruido blanco es aproximadamente constante para frecuencias menores de 500 Hz y aumenta a razón de 10dB/década para frecuencias mayores. - Es más fácil enmascarar un tono de alta frecuencia que uno de baja frecuencia (esto a pesar de que la intensidad del ruido blanco es uniforme en la frecuencia) Un análisis similar puede realizarse para diversas bandas de ruido a un mismo nivel de presión sonora. Particularmente, en la siguiente figura las bandas de ruido de 250, 1000, 4000 y 8000 Hz de frecuencia central y 100, 160, 700 y 1700 Hz de ancho de banda, respectivamente y todas a un nivel de 60 dBSPL Figura 29 Patrón de enmascaramiento para varias bandas de ruido a un mismo nivel de presión Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l.: Universidad Simón Bolívar. Departamento de electrónica. 1995 56 Del gráfico se pueden hacer algunas afirmaciones: - El efecto del enmascaramiento se extiende fuera del intervalo de frecuencias a la cual está confinada la banda. - Este efecto se ve más pronunciado en altas frecuencias. Considerando el ruido blanco analizado de primero y el ruido de distintas bandas analizado después, es razonable pensar que el efecto de enmascaramiento es lineal para frecuencias menores de 500 Hz y logarítimico para frecuencias superiores. 2.2.6.4 Dependencia del nivel de presión sonora. En los párrafos anteriores se consideraron los efectos de enmascaramiento utilizando como variable de control la frecuencia. Ahora se utilizará como variable el nivel de presión sonora y se obtendrán conclusiones similares. El análisis que sigue hace referencia a un conjunto de bandas de ruido con la misma frecuencia central (1kHz) y el mismo ancho de banda (160Hz), pero con distintos niveles de presión sonora. Figura 30 Patrón de enmascaramiento en función del nivel de presión sonora Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l.: Universidad Simón Bolívar. Departamento de electrónica. 1995 Nótese del gráfico anterior que el patrón de enmascaramiento es mayor para mayores presiones sonoras, como era de esperarse. En efecto, dado un incremento de n dB en la señal enmascarante, se obtiene también aproximadamente un incremento de n dB en el 57 umbral de enmascaramiento. También se puede observar que a frecuencias menores de la frecuencia central, la pendiente es aproximadamente constante (independiente de la frecuencia) y la banda inferior es estrecha. Un efecto contrario ocurre en la banda superior en el cual la pendiente es menor (en magnitud ) para niveles de presión sonora mayores. Esta es aún otra evidencia de que el enmascaramiento es mayor para frecuencias grandes que para frecuencias pequeñas. 58 2.3 ACÚSTICA MUSICAL La acústica musical es un capítulo importante de la acústica y estudia la relación entre los sonidos, haciendo particular énfasis en el tono y la cualidad tímbrica de éstos. Hace parte de la acústica musical el estudio de la consonancia y disonancia, las escalas musicales y el comportamiento de los distintos instrumentos musicales, acústicos y electrónicos. 2.3.1 Consonancia y disonancia En el capítulo de introducción al sonido, se estudió el fenómeno de las pulsaciones, o efecto pulsatorio. Este concepto es necesario para explicar la definición de consonancia. Las pulsaciones ocurren cuando se superponen dos tonos de frecuencias muy próximas de tal forma que aparece un sonido modulado por una envolvente. Si se suman dos sonidos de frecuencias f1 y f2, entonces aparecen pulsaciones de frecuencia F = f1-f2, con amplitud modulada desde 0 hasta el valor máximo que es igual a la suma de las dos amplitudes (f1 y f2). Dependiendo de la rapidez de las pulsaciones (es decir de F ), se perciben distintos efectos. Si la rapidez es pequeña, del orden de 1 o 2 Hz, no es detectable la pulsación. Si la rapidez es grande, 5 o 10Hz hasta 50 Hz el resultado produce una sensación de agitación, comúnmente llamada disonancia. Nota: Cuando la rapidez es lo suficientemente grande (las frecuencias difieren por >60Hz), el fenómeno de pulsación se hace indistinguible. La disonancia está basada también en sensaciones psicoacústicas subjetivas las cuales no son agradables para el oído. Sin embargo, está fundamentada en la situación física descrita anteriormente. El análisis de la disonancia presentado fue para dos tonos puros, pero se puede generalizar teniendo en cuenta el espectro de una señal compuesta, es decir, sus armónicos. Esta generalización es importante pues prácticamente todos los sonidos presentes en la música son compuestos. Ahora, superponer dos sonidos compuestos es equivalente a superponer un espectro con un cierto número de armónicos con otro espectro con otro número de armónicos. Por esta razón es posible que aparezca el efecto de pulsaciones entre los armónicos de ambos sonidos. Supóngase, dos tonos compuestos de 59 frecuencias f1=311Hz y f2=220Hz. La resta de estas dos frecuencias origina la frecuencia de pulsación f pulsación = 91Hz. Esta frecuencia es demasiado rápida para producir una sensación de disonancia. Sin embargo, ambas frecuencias son tonos compuestos y por lo tanto tienen la secuencia de armónicos (múltiplos enteros de la frecuencia fundamental): 622 Hz, 933 Hz . . . (para f1) y 440 Hz, 660 Hz, 880Hz . . .(para f2). El segundo armónico de f1 (622 Hz) genera pulsaciones con el tercer armónico de f2 (660Hz) pues la resta de ambos F= 660 –622= 38Hz, causando disonancia. El concepto de consonancia, que es simplemente evitar la disonancia, es importante para la construcción de la escala musical. De esta forma, se puede definir consonancia como la situación en el cual no exista interferencia importante (respecto a pulsaciones) entre los armónicos de las señales sonoras superpuestas. Matemáticamente, se puede describir de la siguiente forma: si dos señales acústicas tienen períodos T1 y T2 (F1 y F2), existen números enteros n y m tal que nT1=mT2 cuando ambas ondas entran en fase (T1 recorre n ciclos mientras que T2 recorre m ciclos). Esto es equivalente a decir que F1/F2 =n/m, ya que F=1/T. Cuando la relación n/m es de números enteros pequeños, es decir, las dos señales entran en fase más veces y hay menos probabilidad de pulsaciones, se dice entonces que la relación es de consonancia. 2.3.1.1 Intervalos. Para estudiar consonancia entre sonidos musicales, se deben encontrar las distancias relativas entre dos frecuencias de tal forma que no se genere disonancia (o por lo menos, exista muy poca). Estas distancias son llamadas intervalos y son caracterizadas por el cociente entre las dos frecuencias (n/m). El primer intervalo es el unísono, relación de frecuencias 1:1. Se refiere a dos tonos idénticos ejecutados simultáneamente. La consonancia en este caso es perfecto, pues todos los armónicos van a ser idénticos y es imposible que se generen pulsaciones. El segundo intervalo importante es la octava, relación de frecuencias 2:1. En este caso un tono tiene el doble de frecuencia que el otro. En este caso tampoco existe conflicto entre armónicos pues todos los armónicos del tono más agudo coinciden con armónicos del más grave. El tercer intervalo es la quinta, relación de frecuencias 3:2. En este caso, no todas los armónicos de ambos sonidos coincidirán, pero aún así no existe disonancia. Por ejemplo un sonido de frecuencia de 220 60 Hz (equivale a la nota musical la) y un sonido de frecuencia de 330 Hz. (equivale a la nota musical mi) constituyen un intervalo de quinta porque 330=220x1.5. la 220 440 mi 330 880 660 990 .... .... Figura 31 Componentes armónicos de las notas musicales la y mi En la figura se muestran algunos de los armónicos que generan las notas. Puesto que algunas veces coinciden y cuando no coinciden, la diferencia de las frecuencias es de 110Hz, los armónicos no entran en conflicto y no existe disonancia. Después del unísono y la octava, la quinta es el intervalo más consonante. Después de la quinta siguen otros intervalos, con menos consonancia pero importantes en la música occidental: 4:3(cuarta), 5:4(tercera mayor), 6:5(tercera menor), 5:3(sexta mayor), 8:5(sexta menor) a) b) c) d) e) f) Figura 32 Algunos intervalos musicales partiendo de la nota do a) tercera mayor b) tercera menor c) cuarta d) sexta menor e) quinta f) octava A partir de estos intervalos procederemos al análisis de las escalas musicales. (Únicamente se estudiará la escala occidental, aunque hay que resaltar que existen muchas otras en el mundo musical.) 61 2.3.2 Escalas Una escala es una sucesión de notas musicales. Las escalas en general deben satisfacer tres condiciones: economía, funcionalidad y reproducibilidad. La economía de una escala se refiere que se deben seleccionar un número no muy grande de notas para una escala simple. Por otra parte, lograr un número “infinito” de sonidos solamente es realizable por instrumentos de afinación continua, como lo son el violín, la viola, el cello, el trombón, etc. La funcionalidad es un parámetro importante pues indica que uso se le va dar a la escala. Una escala debe estar adecuada para diversos usos que se le de: uso monofónico (un instrumento) o uso polifónico (varios instrumentos). Relacionada con la funcionalidad, está el sentido estético subjetivo de las notas; la mayor cantidad de combinación de notas en una escala debe resultar agradable. La reproducibilidad se refiere a la facilidad de lograr una afinación precisa por medio de la voz o instrumento. 2.3.2.1 Evolución de las escalas musicales. La evolución de las escalas musicales depende históricamente del contexto musical de una época determinada. La música, como lenguaje universal, surgió paralelamente en distintas partes del mundo. Se conocen fuentes que datan desde hace 50 siglos en Sumeria, India y en Mesopotamia. Quizá el instrumento más importante era la voz, utilizado tanto para cantar textos poéticos como para cantos fúnebres. También se contaba con instrumentos simples de percusión, además del monocordio (instrumento de una sola cuerda). Para las música primitiva, era suficiente una escala simple monofónica (solo un instrumento) pues así eran los instrumentos de la época y aún no se combinaban sonidos simultáneos. Sin embargo, los Mesopotámicos conocían ya algunos intervalos (unísono, octava, quinta, cuarta) hacia el siglo VI antes de Cristo. Pitágoras, matemático de Grecia, fue pionero en el campo de relacionar matemáticamente la música. Pitágoras experimentaba con un instrumento sencillo de una sola cuerda llamado monocordio. El variaba la tensión de la cuerda (mediante pesos colgantes sujeto a la cuerda) al igual que su longitud y encontró de forma muy temprana que la frecuencia es inversamente proporcional a la longitud de la cuerda (y directamente proporcional a la raíz 62 cuadrada de la tensión). Encontró que los sonidos “agradables” se obtenían mediante relaciones en frecuencia de números enteros pequeños, consonantes. Los primeros intervalos que encontró fue : 1:1 (unísono), 2:1(octava) y 3:2 (quinta). Al experimentar con estos intervalos surge la escala pitagórica. La escala pitagórica es una escala basada en el encadenamiento de quintas. El encadenamiento de quintas es un proceso en el cual se parte de un sonido, y se toma su quinta (intervalo de quinta, una relación de 3/2 en frecuencias). Partiendo de este segundo sonido, se vuelve a tomar su quinta y así sucesivamente hasta completar una serie de sonidos deseados. En la escala más simple, se toman siete sonidos partiendo de un sonido grave: Fa. A partir de Fa, se obtienen los siguientes sonidos: Do, Sol, Re, La, Si (intervalos de quinta sucesivas). Se debe tener en cuenta que no todos los sonidos quedan en una misma octava. Si quisiéramos una escala seguida Do, Re, Mi, Fa, Sol, La, Si, debemos ajustar las octavas de algunas notas: Fa se sube una octava, Do y Sol no se modifican, Re y La se bajan una octava, y Mi y Si se bajan dos octavas. Esta escala, Do, Re, Mi, Fa, Sol, La, Si es también llamada escala diatónica de Do. (En el piano corresponde a las notas blancas). El origen de los nombres de las notas pertenecientes a la escala se atribuye a Guido de Arezzo y data del siglo XI D.C. Guido Arezzo se basó en un poema religioso en latín dedicado a San Juan Bautista. (Este himno fue escrito por Paulo Diácon): Ut queant laxis Resonare Fibris Mira gestorum Famuli Tuorum Solve Polutim Labii reatum Sancte Ioannes Arezzo tomó la primera sílaba de cada verso para dar nombre a las notas (seis) de la escala: Ut, Re, Mi, Fa, Sol, La. El nombre para la séptima nota (Si) vino después en el siglo XVI, tomado de las primeras letras de las palabras “Sancte Ioannes”. También fue después que se cambió Ut por Do, al parecer por la facilidad en su pronunciación. 63 La anterior escala fue utilizada por mucho tiempo, pero se encontró un problema con algunos intervalos que no eran acústicamente perfectos. Por ejemplo, el intervalo de Do a Mi (tercera mayor) se logra de la siguiente forma: Mi/Do = 3 3 3 3 1 1 81 . ⋅ ⋅ ⋅ ⋅ ⋅ = 2 2 2 2 2 2 64 3 Los primeros cuatro factores ( ) corresponden a los encadenamientos de quintas (un 2 intervalo de quinta equivale a multiplicar por 3 ) necesarios para obtener un Mi: 2 Do-Sol → Sol-Re → Re-La → La-Mi. 1 Los últimos dos factores ( ) corresponden a bajar dos octavas, como se vio anteriormente. 2 Sin embargo, al analizar consonancias, la relación para una tercera mayor era de 5 . Pero 4 5 80 81 = , y eso no es igual a ! A esta diferencia se le llamó coma pitagórica y representa 4 64 64 una imperfección acústica de la escala pitagórica. Una situación similar ocurría con el intervalo de sexta mayor. (La/Do). Para ayudar a subsanar esta imperfección, se recurrió a otra forma para la construcción de la escala musical. En vez de encadenar quintas sucesivas, se utilizan solamente tres quintas que da lugar a cuatro notas partiendo de Fa: Fa, Do, Sol y Re. Ahora, se introducen terceras perfectas en la mitad de cada intervalo de quinta. Se introduce un La entre Fa y Do (La es la tercera perfecta de Fa), un Mi entre Do y Sol (Mi es la tercera perfecta de Do), y un Si entre Sol y Re. (Si es la tercera perfecta de Sol). Después se reordenan ubicando todas las notas en una misma octava al igual que la escala pitagórica. A esta nueva escala, se le denominó escala natural y reducía el efecto de la coma pitagórica, causa de su imperfección acústica. 3ra fa 3ra la 5ta do 3ra mi 5ta sol si 5ta Figura 33 Construcción de la escala natural re 64 Ambas escalas resultaron útiles por mucho tiempo, pero la música seguía evolucionando hasta la denominada música ficta. Ficta significa falsa y se refiere a la introducción de notas no pertenecientes a la escala, pero que le agregaban variedad y belleza. Esto implicaba que se debían ampliar las escalas por diversos motivos: transposición: Transponer significa subir o bajar una composición para adaptarla al rango de una voz o un instrumento. Si una composición se transpone una octava, la escala sigue siendo la misma pero si se transpone una tercera, o cuarta o quinta por ejemplo, se deben introducir notas adicionales. modulación: Modular significa cambiar de tonalidad y este cambio se utilizaba para hacer que algunos pasajes musicales utilicen una escala mientras que otros utilicen escalas distintas. Para ambas situaciones se requiere la adición de nuevos sonidos y por eso se propuso una escala con doce sonidos, llamada escala temperada. Además de las notas ya conocidas de la escala pitagórica o de la natural, se introdujeron unos intervalos intermedios entre las notas para un total de 12 notas en la escala: Do# (se lee Do sostenido) o Reb (se lee Re bemol) se introduce entre Do y Re. Re# o Mib se introduce entre Re y Mi Fa# o Solb se introduce entre Fa y Sol Sol# o Lab se introduce entre Sol y La La# o Sib se introduce entre La y Si (Estos nuevos tonos corresponden a las teclas negras en el piano). Las particularidades de estos nuevos tonos así como las nuevas escalas y posibilidades que se generan son muchas, pero son objeto de un texto de música. Esta escala temperada era variada y funcional pero tenía un grave inconveniente: para mantener los intervalos acústicamente perfectos se tenía que volver a construir la escala a partir de cada nota. Esto significa que habría una escala acústicamente perfecta para Do y otra acústicamente perfecta para Re por ejemplo. Estaríamos hablando de doce escalas diferentes que obviamente va en contra del principio de economía y simplicidad. De hecho, antes del siglo XVII, cuando se requería interpretar una pieza en una escala distinta se debía afinar el instrumento nuevamente para conservar los intervalos planteados en la escala temperada. Afortunadamente, apareció una solución 65 para esto: el temperamento uniforme. El temperamento uniforme consiste en ubicar iguales distancias relativas (en frecuencia) para todas las notas. Consiste en dividir la escala en 12 intervalos iguales denominados semitonos. Es decir, la distancia entre Do y Do# (un semitono) debe ser la misma que la distancia entre Do# y Re (un semitono), igual a la distancia entre Re y Re# (un semitono), y así sucesivamente. Esto se logra mediante la siguiente fórmula matemática: fi+1=21/12 fi donde fi representa una frecuencia arbitraria y fi+1 es la frecuencia un semitono (medio tono) arriba. Por ejemplo si f1=Do, entonces f2=Do#, f3=Re, f4=Re#, etc. Tabla 3 Frecuencias de las notas musicales en una escala con temperamento uniforme MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004 De esta forma todos los intervalos son equiespaciados y por eso el nombre de temperamento uniforme. Con ésto se resuelven los problemas de la escala pitagórica y la escala natural. Se pueden interpretar piezas sin necesidad de afinar nuevamente el instrumento. 66 2.3.3 Instrumentos musicales Un instrumento musical consiste en la combinación de uno o más sistemas resonantes capaces de producir uno o más tonos, además de los medios para excitar estos sistemas. Estos se pueden clasificar según la familia a la cual pertenecen (dependiendo del modo en que se produce el sonido): instrumentos de percusión, instrumentos de cuerda, instrumentos de viento y instrumentos electrónicos. Cada una de estas categorías a su vez pueden ser subdivididas en otras más específicas atendiendo a alguna característica. Sin embargo, existen algunas características que son comunes a los instrumentos en general. Estas son dos principalmente: la tonal y la dinámica. El aspecto tonal depende de la altura y del timbre del instrumento. El aspecto dinámico depende de los rangos de intensidad de cada instrumento. Obviamente estos rangos a su vez también dependen de la persona particular que interprete el instrumento. Algunos factores que influyen y gobiernan sobre el aspecto tonal y el aspecto dinámico son: el patrón de direccionalidad y la duración del sonido. El patrón de direccionalidad indica en que dirección se está propagando el sonido y mide la respuesta del sonido producido por un instrumento respecto a una orientación o eje de referencia. La duración de un sonido es el intervalo en el cual el sonido persiste sin interrupción. También se pueden clasificar los instrumentos según la duración de los sonidos que es capaz de producir: instrumentos de duración fija: se mantiene un sonido por un tiempo relativamente corto pues éste se extingue. instrumentos de duración variable limitada: la duración máxima está limitada por parámetros físicos como el paso completo de un arco en instrumentos de cuerda, o por la capacidad pulmonar del intérprete. instrumentos de duración ilimitada: en estos instrumentos se puede mantener un sonido por tiempo ilimitado sin discontinuidad. Por ejemplo, el piano y la guitarra pertenecen al conjunto de instrumentos de duración fija, el violín y los instrumentos de viento al conjunto de instrumentos de duración variable 67 limitada y los órganos pertenecen al conjunto de los instrumentos de duración ilimitada. También relacionado con la duración, está la envolvente en el tiempo de los instrumentos. La envolvente en el tiempo ya fue estudiada en la sección anterior (“attack”, “decay”, “sustain”, “release”) y también influye en las características tonales y dinámicas de los instrumentos. 2.3.3.1 Instrumentos de percusión. Los instrumentos de percusión son aquellos en el que se produce sonido por efecto de percusión directa o indirecta. La percusión se efectúa de maneras muy diversas como por varillas metálicas, mediante baquetas, golpeando un cuerpo sonoro contra otro, indirectamente mediante un teclado, etc. Se pueden clasificar en instrumentos de altura determinada (entonación definida) y en instrumentos de altura indeterminada (entonación indefinida). A los primeros pertenece el xilófono, la marimba, el metalófono, el glockenspiel, mientras que al segundo grupo pertenece el bombo, platillos, congas, bongos, batería. Una característica general de este grupo de instrumentos es que su espectro es inarmónico, es decir, contiene frecuencias que no son múltiplos de alguna frecuencia determinada fundamental. Además en algunos instrumentos como la marimba y el xilófono se crea una resonancia adicional adicionando un tubo o una columna de aire, el cual amplifica el sonido y ayuda a filtrar armónicos no deseados. Otra clasificación para los instrumentos de percusión es según el elemento vibrante que utilizan: varilla, placa y membrana. Las varillas son cuerpos rígidos cuya longitud es notablemente mayor que las dimensiones restantes. Pueden vibrar con vibraciones longitudinales, transversales o de torsión. Las placas y membranas son cuerpos de superficie grande con relación a su espesor; excitadas por percusión o fricción emiten sonidos caracterizados por un complejo grande de parciales discordantes (armónicos). Las placas, debido a su rigidez, sólo necesitan un punto de apoyo, mientras que las membranas necesitan tensión previa para vibrar. Al grupo de varilla como elemento vibrante pertenecen el xilófono, celesta y el triángulo. Instrumentos de placa son los platillos, la campana y el gong. De membrana están los timbales, el bombo, el tambor y la pandereta. La percusión generalmente es utilizada como soporte rítmico en agrupaciones musicales, debido a su entonación indefinida, exceptuando los instrumentos de percusión con altura determinada. 68 Figura 34 Instrumentos de percusión Fuente: DIANI, Felipe. s.l.:s.n. 1998. <culturitalia.uibk.ac.at> [consulta: 14 Abr. 2005] 69 2.3.3.2 Instrumentos de cuerda. Los instrumentos musicales de cuerda son aquellos en que el cuerpo vibrante y sonoro es una cuerda. Estos se clasifican de acuerdo al modo en que son excitadas las cuerdas: Cuerda punteada: La cuerda es apartada de su posición normal (de reposo) y se deja libre generando una vibración. A este grupo pertenecen la guitarra, el banjo, el arpa, el ukelele, etc. Cuerda frotada: Frotar una cuerda consiste en rozar la cuerda con un material de gran adherencia como ciertas fibras naturales y sintéticas. A este grupo pertenecen el violín, la viola, el cello y el contrabajo. El elemento frotante se denomina arco. Cuerda percutida: Este procedimiento consiste en percutir (golpear) la cuerda con un macillo o martillo. A este grupo pertenece el piano y el clavicordio. Es importante resaltar que para la mayoría de los instrumentos de cuerda existe un mecanismo de amplificación. Cuando la cuerda vibra, transmite al aire energía sonora, pero muchas veces esta energía, o mejor intensidad sonora, es insuficiente. La mayor parte de la energía de la cuerda pasa a través de un mecanismo de amplificación denominado caja armónica o caja resonante el cual permite entregar una mayor cantidad de energía sonora al medio (aire). Las cuerdas pueden producir vibraciones transversales y longitudinales, pero solo las primeras producen sonidos agradables (menos componentes inarmónicos y menos ruido). Ahora consideremos las vibraciones transversales en una cuerda sujeta fija por ambos extremos. En el capítulo introductorio de ondas se explicó que la frecuencia correspondiente al armónico de orden n está dada por: fn= n T 2L µ donde L es la longitud de la cuerda, T es la tensión y u es la densidad lineal de la cuerda. Se puede escribir la densidad lineal de la cuerda como: µ= masa , pero masa=Vd donde d es la densidad volumétrica y V es el volumen. La longitud ecuación queda µ= Vd =Ad donde A es el área de la sección transversal de la cuerda. longitud 70 A=πr2 para la sección transversal de la cuerda (considerada como un cilindro). De aquí se obtiene una fórmula equivalente para fn: fn= n 2Lr T πd De acuerdo a esta fórmula se deduce claramente que la frecuencia es: - inversamente proporcional al radio de la sección transversal, a la longitud, y a la raíz cuadrada de su densidad volumétrica. - directamente proporcional a la raíz cuadrada de la tensión Estas aseveraciones son conocidas como las leyes de Mersenne para vibraciones transversales en una cuerda. Para afinar un instrumento de cuerda, es decir, subir o bajar su frecuencia, se acostumbra tensar la cuerda (por medio de clavijas por ejemplo). Entre más tensa esté la cuerda, más alto será su sonido de acuerdo a la ley de Mersenne. Esta ley también explica por que razón las cuerdas graves de una guitarra son más grandes y pesadas: su densidad volumétrica es mayor y por lo tanto su altura será menor. Figura 35 Instrumentos de cuerda Fuente: DIANI, Felipe. s.l.:s.n. 1998. <culturitalia.uibk.ac.at> [consulta: 14 Abr. 2005] 71 2.3.3.3 Instrumentos de viento. Los instrumentos de viento son aquellos que contienen un volumen gaseoso capaz de producir sonido al ser convenientemente excitado. Es importante resaltar que el cuerpo sonoro es el volumen gaseoso y no el recipiente que lo contiene. El mecanismo de vibración consiste en las numerosas reflexiones de la onda sonora dentro del recipiente. La vibración de las columnas de aire contenidas en los tubos sonoros es debida a la formación de una onda estacionara dentro del recipiente. La forma más general de clasificación de los instrumentos de viento es según la forma del recipiente o tubo: tubos cerrados y tubos abiertos. Tubos Cerrados: Poseen una sola abertura. Tienen el máximo de vibración en el extremo cerrado (vientre) y un mínimo en el extremo cerrado (nodo).- La frecuencia del sonido emergente es: f n= (2n - 1)c 4L n: el número del armónico L: longitud del tubo c: velocidad del sonido. Se puede deducir que la frecuencia es inversamente proporcional a la longitud del tubo. Además, en tubos cerrados solo existirán armónicos impares brindándole un timbre muy particular a este tipo de instrumentos. Instrumentos de tubo cerrado son: el clarinete, algunos órganos y la ocarina. Tubos abiertos: Poseen dos o más aberturas. Tienen el máximo de vibración en ambos extremos (vientres). La frecuencia del sonido emergente es: f n= nc 2L n: el número del armónico L: longitud del tubo c: velocidad del sonido. Se puede deducir que la frecuencia es inversamente proporcional a longitud del tubo. A diferencia de los tubos cerrados, en los tubos abiertos existen teóricamente todos los 72 armónicos (pares e impares). Instrumentos de tubo abierto son: flauta traversa, el oboe y el trombón. Si tomamos la frecuencia fundamental para tanto tubos abiertos como para tubos cerrados (n=1) obtenemos: f fund = ffund= c (tubos cerrados) 4L c (tubos abiertos) 2L Esto significa que la frecuencia fundamental para un tubo abierto es dos veces mayor que para un tubo cerrado, lo que significa en términos musicales que esa frecuencia específica en tubos abiertos se encuentra una octava por encima que la de su contraparte en tubos cerrados (asumiendo la misma longitud del tubo). Existen otras clasificaciones para los instrumentos de viento dependiendo de su forma interior, los hay cilíndricos, cónicos y prísmicos. También se clasifican de acuerdo al modo de la excitación de la columna aérea: Tubos con embocadura: Hay instrumentos con embocadura directa como la flauta traversa e instrumentos con embocadura indirecta como la flauta de pico. Tubos con lengüeta: La lengüeta puede ser libre como en la armónica, simple como en el clarinete o doble como el oboe. Tubos con boquilla o lengüeta “labial”: La lengüeta se realiza utilizando los labios como en la trompeta. 73 Figura 36 Instrumentos de viento Fuente: DIANI, Felipe. s.l.:s.n. 1998. <culturitalia.uibk.ac.at> [consulta: 14 Abr. 2005] 74 2.3.3.4 Instrumentos electrónicos. Estos instrumentos modernos surgieron en el siglo XX y avanzaron gracias a la tecnología digital. También son llamados sintetizadores pues son capaces de sintetizar una onda sonora a partir de una señal eléctrica. El elemento fundamental del sintetizador es el oscilador pues es éste el que se encarga de generar la señal eléctrica. Los osciladores electrónicos son capaces de generar miles de formas de onda además de variar sus más importantes parámetros como lo son la altura y la amplitud. Además de los osciladores, existen otros componentes que permiten modificar el sonido de muchas formas: Control de envolventes: Este permite el control de la evolución en el tiempo de cualquier parámetro asociado a un generador de sonido, como la altura, el contenido armónico, etc. Control de efectos: Este permite modificar varios parámetros a través de fluctuaciones periódicas para obtener una gama de efectos especiales como vibrato, trémolo, wah-wah, etc. Interfaz: La interfaz es cualquier dispositivo que sirva como ente intermediario entre un sintetizador y el intérprete. Una interfaz permite enviar al sintetizador información sobre los sonidos que debe producir como la altura y la sonoridad. Esta última se evalúa a partir de sensores de presión en el caso en que la interfaz sea un teclado. Interconexión MIDI: MIDI (Musical Instrument Digital Interface) es una interfaz digital para instrumentos musicales. Es una norma que establece un código de comunicación entre instrumentos musicales y entre instrumentos y computadores. Debido a la naturaleza digital de MIDI, existen muchas posibilidades. Mediante programas de computador denominados secuenciadores es posible controlar el instrumento por computadora y así ejecutar música previamente programada. También es posible seleccionar instrumentos y editar virtualmente cualquier parámetro en una grabación como el tempo, la altura, agregar voces, cambiar el timbre, etc. Figura 37 Sistema MIDI (teclado, secuenciador, computador) Fuente: KING, Andrew. s.l.:sn. 2001. < www.andymid.com/system> [consulta 15 Abr. 2005] 75 2.4 ACÚSTICA ARQUITECTÓNICA La acústica arquitectónica estudia todos los fenómenos relacionados con la propagación del sonido en un recinto es decir, el comportamiento de las ondas sonoras respecto al espacio que la rodea. El estudio parte desde la generación del sonido por parte de la fuente hasta el instante en que llega la onda sonora hasta los oídos. Los recintos son la interfase entre una fuente de sonido, sea natural o electrónica, y nuestro oído. Los fenómenos sonoros más importantes relacionados con propagación en un recinto son: la reflexión, la refracción, la absorción y la difracción, siendo la reflexión la más importante. Esto debido a las numerosas reflexiones de la energía sonora en un recinto en el piso, las paredes, personas, obstáculos en general, creando un campo sonoro complejo que merece especial atención. La acústica arquitectónica también analiza todos los parámetros que influyen en la calidad acústica de un recinto y así diseñar un óptimo tratamiento acústico. La calidad acústica se refiere a la transmisión fiel y funcional del sonido, obviamente dependiendo de la aplicación. Existen distintas aplicaciones específicas en el diseño de recintos como por ejemplo diseño de salas de grabación, salas de cine, auditorios, salones de clase, etc. que deben tener unas cualidades acústicas determinadas y específicas para dicha aplicación. Por cualidad acústica se entienden una serie de propiedades relacionadas con el sonido en un recinto como los ecos, la reverberación, las reflexiones tempranas, el campo sonoro generado, etc. Estas propiedades dependen a su vez de la geometría del recinto así como de los materiales empleados en su construcción y recubrimiento. El objetivo del tratamiento acústico de recintos es modificar la respuesta del recinto al estímulo de ondas sonoras en un sentido conveniente. Primero se definirán algunos conceptos preliminares y después se analizarán condiciones geométricas de la arquitectura para aplicarlas en el diseño específico de recintos. 76 2.4.1 Campo sonoro El campo sonoro es una función que asigna a cada punto del espacio y a cada instante del tiempo un nivel de presión sonora. Un claro entendimiento del campo sonoro es de vital importancia para el diseño acústico de los recintos. Primero se hará una clasificación respecto al tiempo y posteriormente se hará respecto al espacio. 2.4.1.1 Estructura del campo sonoro en el eje del tiempo. Dentro de un ambiente se tiene que, en un punto dado llega un conjunto complejo de ondas sonoras que pueden clasificarse de acuerdo con su orden de llegada y a su densidad temporal. De esta forma se puede obtener una clasificación de acuerdo los tiempos de llegada de la onda sonora a los oídos. El fenómeno detrás de los siguientes conceptos son las reflexiones(exceptuando el sonido directo). 2.4.1.1.1 Sonido directo. El primer concepto fundamental para entender el campo sonoro es el sonido directo. El sonido directo es el sonido que viene directamente desde la fuente sonora, antes de que exista alguna reflexión. 2.4.1.1.2 Reflexiones tempranas. Un oyente en un recinto cerrado recibirá dos ondas sonoras. Una onda sonora proviente directamente desde la fuente hasta los oídos del oyente. Esta se denomina sonido directo. Sin embargo debido a posibles superficies reflectoras como pisos, paredes, obstáculos, el sonido emitido por la fuente también será reflejado por estas superficies y llegarán al oído del oyente de forma indirecta. A las primeras reflexiones recibidas, que están considerablemente separadas en el tiempo, se les denominan reflexiones tempranas. 2.4.1.1.3 Ambiencia. La ambiencia es la sensación que permite al oyente ubicarse espacialmente en un recinto. Esto es debido a la distribución en el tiempo de las reflexiones tempranas. El control de la ambiencia es fundamental en el diseño acústico arquitectónico. 77 Esto se realiza mediante el proceso de “ray tracing” o trazado de rayos para determinar todas las trayectorias posibles del sonido a través del recinto hasta las superficies reflectoras y determinar los tiempos de las reflexiones tempranas. 2.4.1.1.4 Absorción sonora. Este parámetro es independiente de las reflexiones pues es un parámetro intrínseco de los materiales. Sin embargo está relacionado con la reverberación y por eso merece un análisis. Las ondas sonoras que inciden en una superficie pueden tener uno o varios de los siguientes comportamientos: la onda es reflejada, refractada o absorbida. Las superficies en un recinto reflejan parcialmente la onda sonora mientras que el resto es absorbida. La cantidad de absorción es relativo a la cantidad de energía incidente, lo que conlleva a la siguiente definición: Coeficiente de absorción a = Energía absorbida Energía incidente El coeficiente de absorción sonora es un parámetro de gran importancia para el comportamiento acústico de un ambiente. Este coeficiente de absorción depende principalmente del material utilizado en las superficies como paredes y techos pero también es función de la frecuencia. Es decir los materiales tienen distintos coeficientes de absorción para distintas frecuencias. En general a aumenta con la frecuencia debido a que a frecuencias altas, la longitud de onda es pequeña y la superficie se torna más absorbente ya que irregularidades en la superficie como poros atrapan a la onda cuando son de dimensiones comparables. En general, los materiales duros como el hormigón son buenos reflectores (baja absorción) mientras que materiales blandos y porosos como la lana y la espuma son malos reflectores (alta absorción). Asociado al coeficiente de absorción sonora, está el área de absorción o simplemente absorción que es el producto del coeficiente de absorción sonora y la superficie efectiva para un material dado. La absorción cuantifica la energía extraída del campo acústico, cuando la onda sonora atraviesa un medio determinado o el choque de la misma con las superficies límites del recinto. Está dada por (función de la frecuencia): 78 n A= ∑α S i i 1 A: absorción [=] sabines α: coeficiente de absorción sonora S: superficie n: número de superficies También existe una expresión para la absorción teniendo en cuenta las personas y los objetos ya que también son obstáculos en un recinto e interfieren en la propagación del sonido. n A= ∑α p i i 1 A: absorción [=] sabines α: coeficiente de absorción sonora p: personas u objetos n: número de superficies Las personas aportan aproximadamente 0.4m2 por individuo de área de absorción a una frecuencia de 1kHz. El área de absorción para objetos en general depende del material, tamaño y frecuencia. 2.4.1.1.5 Reverberación. Las reflexiones tempranas corresponden a las primeras reflexiones en un recinto, pero después de un determinado tiempo comienzan a aparecer las reflexiones de las reflexiones y posteriormente las reflexiones de las reflexiones de las reflexiones y así sucesivamente. Esto genera un campo sonoro complejo debido a la densidad de reflexiones. La permanencia del sonido debido a las múltiples reflexiones es llamada reverberación. Solo una fracción del sonido es reflejada (la otra es absorbida) en cada incidencia sobre una superficie. Esto es válido para cada reflexión. La parte de la energía sonora absorbida o es transmitida a otro medio (a otra habitación por ejemplo), o es convertida a otro tipo de energía como energía mecánica (vibraciones) o energía térmica (calentamiento). Solamente las ondas reflejadas se mantienen como energía sonora hasta extinguirse eventualmente. 79 Figura 38 Estructura del campo sonoro en el eje del tiempo Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. 2.4.1.1.6 Eco. El eco es el resultado de una única reflexión que retorna al punto donde se encuentra la fuente sonora cuando el retardo (el tiempo que demora en ida y vuelta) es mayor a 100ms. La onda sonora parte de un punto y es reflejada por una superficie. La expresión para la velocidad del sonido como espacio recorrido sobre tiempo es: c= 2d t donde c es la velocidad del sonido, t el tiempo y d la distancia entre la fuente y la superficie reflectora. Nótese que el espacio se escribe 2d pues interesa el recorrido de ida y vuelta del sonido. De la anterior ecuación y reemplazando t por 100ms y c por 345m/s, obtenemos la distancia mínima para obtener un eco: 17 m. 2.4.1.2 Estructura del campo sonoro en el espacio. En el estudio de la acústica arquitectónica es fundamental conocer como se distribuye el campo sonoro en el ambiente como por ejemplo, de un recinto. Es importante resaltar que el estudio de la estructura del campo sonoro en el espacio no es independiente del estudio en el tiempo pues también se deben tener en consideración las reflexiones que son función del tiempo. Para efectuar este análisis, el campo sonoro se debe dividir en dos componentes: campo directo y campo reverberante. El campo directo contiene el sonido generado directamente desde la fuente, sin haber sufrido alguna reflexión. El campo reverberante por el contrario contiene el sonido desde la primera reflexión, hasta extinguido el sonido. Aunque estos dos 80 campos son complementarios, tienen comportamientos distintos. El campo directo (en intensidad sonora) está dado por: Idirecto= W [=]w/m2 4πd 2 W: potencia acústica de la fuente d: distancia de la fuente al punto donde se realiza la medición. Tomando puntos a y b separados a una distancia d y 2d respectivamente de la fuente y se calculan sus respectivas intensidades en el campo directo se obtiene: Ia= W W y Ib= 2 4πd 4π(2d) 2 Ahora se toma el nivel de intensidad sonora en decibeles y calculamos la diferencia. De esta forma se obtiene el número de decibeles que ha disminuido Ib con respecto a Ia: (Ia-Ib)dB= 10log( W W )-10log( )= 10log4= 6dB 2 4πd 4π(2d) 2 En conclusión, también se define el campo directo como la región donde la intensidad disminuye 6dB por cada duplicación en la distancia. También es llamado campo cercano. Otra característica importante del campo directo es que es direccional, es decir, se puede determinar con relativa facilidad la procedencia del sonido. Existe un parámetro que cuantifica la direccionalidad o directividad de la fuente sonora. Es Q, un número adimensional que se define como: Q= intensidad de la fuente en una dirección determinada intensidad de una fuente omnidireccional La directividad es importante porque ayuda a indicar cuanto sonido será direccionado hacia un área específica comparada con toda la energía generada por la fuente. Q=1 significa que la fuente se comporta como una fuente omnidireccional, o radiación esférica. Q mayores 81 que 1 implican que la fuente es muy direccional pues la energía sonora se concentra hacia una dirección determinada. Este parámetro depende tanto de la forma geométrica de la fuente, como de su disposición respecto a las superficies en un recinto. Q también se puede expresar en decibeles y es llamado índice de directividad (ID). ID=10logQ Teniendo en cuenta el parámetro Q, la ecuación más general para el campo directo es: Idirecto= WQ [=]w/m2 2 4πd Nótese que esta ecuación se reduce a la primera dada cuando Q =1 (la fuente es omnidireccional) El campo reverberante se comporta de manera muy distinta al campo directo pues es aproximadamente constante, e independiente de la distancia. Esto, debido a las numerosas reflexiones que se superponen entre sí para una distribución aproximadamente uniforme del sonido. Lo anterior es equivalente a decir que el flujo de energía sonora es equiprobable en todas las direcciones, a diferencia del campo directo que es directivo. El campo reverberante se cuantifica de forma muy distinta al campo directo pues como se vio, este es inversamente proporcional a la distancia al cuadrado mientras que el campo reverberante debe depender exclusivamente de las reflexiones (y no de la distancia). Ireverberante= 4W W = [=] w/m2 aS R ( ) 1- a (con R=( a: coeficiente de absorción sonora W: potencia acústica de la fuente S: el área de la superficie interior del recinto. R: constante del recinto aS )[=] Sabines) 1− a 82 (En el caso de un recinto con varios materiales absorbentes, a se reemplaza por a prom ,el coeficiente promedio). Es claro de la ecuación para el campo reverberado que éste depende de la forma acústica del recinto y no de la distancia. El campo reverberado, a diferencia del campo directo es difuso o adireccional. En el aire libre existe solamente el campo directo. La ausencia de reflexiones en el aire libre (debido a la ausencia de superficies reflectoras) hace imposible la existencia de un campo reverberante. Sin embargo, si consideramos ambientes cerrados, debemos considerar la superposición de ambos campos, el sonoro y el reverberante. En general se tiene I sonoro = I directo + I reverberante= 4W WQ + 2 R 4πd Esta ecuación también es útil expresarla en decibeles Isonoro(dB)=10log( 4W WQ + ) 2 R 4πd La región donde predomina el campo directo y la región donde predomina el campo reverberante depende de la distancia. De hecho, existe una distancia que delimita las regiones (sirve como frontera), llamada distancia crítica. Para valores menores a la distancia crítica predomina el campo directo mientras que para distancias mayores predomina el campo reverberante. La distancia crítica se obtiene de la siguiente manera. Considérese la superposición de ambas intensidades (sonora y reverberante). La distancia crítica se define como la distancia en la cual se equiparan el campo directo con el campo reverberante: I directo = I reverberante 4W WQ = 2 4πd crítica R 83 d crítica= 0.141 QR Figura 39 Campo directo, campo reverberante y distancia crítica Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.. La distancia crítica depende tanto de la directividad de la fuente como del parámetro R de absorción. En general, en el diseño acústico de recintos es deseable que esta distancia sea grande. Cuando el campo reverberante predomina y es muy intenso, la inteligibilidad del habla se pierde. Para minimizar este efecto, se aumenta la distancia crítica para que predomine en una región considerable el campo directo. R es la constante del recinto, función del coeficiente de absorción. Cuando el recinto es muy absorbente, R es grande mientras que cuando el recinto es muy reverberante R es pequeño. De la ecuación se deduce que en recintos absorbentes la distancia crítica es grande mientras que para recintos reverberante la distancia es pequeña. Otras afirmaciones respecto la distancia crítica son: • La distancia crítica, al depender del coeficiente de absorción sonora, depende también de la frecuencia y por lo tanto existen varias distancias críticas para varias frecuencias. • Es importante notar que la distancia crítica no depende de la potencia acústica que genera la fuente. Era de esperarse pues la potencia acústica influye de igual manera al campo directo como al reverberante. Por esta razón, si aumentamos el volumen en un recinto no mejoraremos la inteligibilidad pues también estaríamos aumentando el campo reverberante. 84 • Para aumentar la distancia crítica se tienen básicamente dos opciones: aumentar la directividad Q o aumentar el factor del recinto R. La primera opción generalmente resulta más sencilla (y económica) que un tratamiento con materiales acústicos. Ya se definieron los términos necesarios para entrar en materia con respecto a las consideraciones de diseño de recintos según su aplicación específica. El estudio del diseño de recintos se puede subdividir en categorías según la longitud de onda de la señal sonora pues el análisis es distinto. Las categorías son las siguientes: Acústica de grandes recintos: análisis de recintos cuando la longitud de onda es pequeña respecto a las dimensiones del recinto Acústica de pequeños recintos: análisis de recintos cuando la longitud de onda es comparable a las dimensiones del recinto. Dispositivos de control acústico: estudio de algunos de los dispositivos más importantes en el diseño y tratamiento acústico de recintos Características generales del diseño de recintos: se estudiarán los aspectos más relevantes a tener en cuenta en el diseño de recintos y el aislamiento acústica. 2.4.2 Acústica de grandes recintos La acústica de grandes recintos se refiere al análisis y el diseño de situaciones en la cual la longitud de onda sonora es pequeña respecto al tamaño del recinto. Obviamente, ésto depende tanto de la frecuencia sonora como de las dimensiones reales del recinto. Generalmente, se acepta que recintos con superficie interior mayor a 300m2 son considerados recintos grandes. Estos incluye teatros, iglesias, auditorios, salas de concierto, museos, etc. El análisis de grandes recintos incluye dos aspectos fundamentales: 85 - acústica geométrica - reverberación 2.4.2.1 Acústica geométrica. La acústica geométrica, también llamada acústica de rayos, es el análogo de la óptica geométrica en el sonido. La acústica geométrica tiene ciertas consideraciones que la diferencian del análisis de pequeños recintos: • los métodos utilizados en el análisis son geométricos y no físicos • el estudio de la resonancia y modos de resonancia y de difracción no son importantes • el análisis de la reverberación es fundamental El método geométrico utilizado es el de trazado de rayos. Es un método simplificado solamente útil en el análisis de recintos grandes, que supone que las ondas sonoras viajan en líneas rectas. Además, este método supone reflexiones especulares sobre las superficies reflectoras a diferencia de reflexiones difusas en las cuales la onda es reflejada en múltiples direcciones. Por lo tanto, para grandes recintos, se cumple la ley de Snell de la reflexión que relaciona el ángulo de incidencia con el ángulo de reflexión: a incidencia = a reflexión Aunque esta ley es válida para todo tipo de reflexión, en las reflexiones difusas el análisis se complica pues existen demasiadas normales asociadas a la superficie y la reflexión no se origina desde un solo punto sino que se distribuye: se generan patrones de difracción. De ahí el nombre de difuso. Además debido a que las longitudes de onda son pequeñas relativas al tamaño del recinto, las resonancias son numerosas y distribuidas aproximadamente uniformemente en el espacio. Por lo tanto, con el análisis de rayos se ignoran patrones de difracción y los modos de resonancia. El trazado de rayos o “ray tracing” es relativamente simple. Se parte desde el punto donde existe una fuente sonora y se trazan múltiples rayos que inciden sobre superficies potencialmente reflectoras: paredes, pisos, etc. La única consideración que se debe hacer es respetar la Ley de Snell para la reflexión. La siguiente figura ilustra el procedimiento. 86 Figura 40 Aplicación del método de “ray tracing” en el Royal Albert Hall Fuente: DIANI, Felipe. s.l.:s.n. 1998. < www.zainea.com/knudsen.htm> [consulta: 14 Abr. 2005] La técnica de trazado de rayos sirve para determinar a groso modo algunas fallas acústicas como enfoque excesivo o insuficiente del sonido en algunas áreas y las formas geométricas que optimizan la distribución del sonido en un recinto (planas, cóncavas, convexas) 2.4.2.2. Reverberación. La reverberación es un parámetro importante para tener en cuenta en recintos grandes. Se definió anteriormente como la permanencia del sonido debido a múltiples reflexiones. Esto se vuelve importante en recintos grandes pues el sonido tiende a permanecer por mucho tiempo debido a retardos mayores en dimensiones más grandes. Existe un parámetro para estimar y cuantificar la duración de extinción del sonido y por lo tanto el de la reverberación. Este es llamado tiempo de reverberación y se define como el tiempo necesario para que el sonido caiga 60dB debajo de su intensidad inicial. Este valor en decibeles (60 dB) fue escogido experimentalmente ya que cuando una señal cae 60dB, se da la sensación que el sonido se extinguió (se vuelve inaudible). Esto principalmente por el fenómeno de enmascaramiento del ambiente y/o del ruido. Si el nivel inicial (intensidad sonora) es muy intenso se debe escoger otro valor para definir el tiempo de reverberación. Se escribe tiempo de reverberación = RT60 debido a su sigla en inglés, “reverberation time”, y haciendo alusión a 60dB. El tiempo de reverberación debe ser función del coeficiente de absorción sonora a de las superficies ya que el tiempo de reverberación depende de la densidad e intensidad de las 87 reflexiones. Si las superficies son muy reflectoras (a pequeño), existirán muchas reflexiones y existirán muchas antes de que se extinga completamente el sonido. En este caso RT será grande. Si en cambio las superficies son muy absorbentes (a grande), en cada reflexión habrá una fracción considerable absorbida por la superficie y en pocas reflexiones el sonido se hará inaudible. Esto implica una RT pequeña. Dada la dependencia de RT con el coeficiente de absorción se puede concluir que para recintos recubiertos de materiales como el hormigón (muy reflectores, bajo coeficiente de absorción), el tiempo de reverberación será largo. Por oposición, para recintos recubiertos de materiales como lana, alfombras, etc. (malos reflectores, alto coeficiente de absorción), el tiempo de reverberación será corto. Una fórmula describe de manera más exacta la función que relaciona RT con a (atribuida a Sabine, físico norteamericano): RT= 0.161V [=]s aS V: volumen del recinto a: coeficiente de absorción sonora S: área de la superficie interior. Nótese que el tiempo de reverberación depende del cociente V/S. (volumen/superficie). Este cociente no es constante sino que crece a medida que crece el recinto ya que el volumen depende de una distancia cúbica mientras que la superficie depende de una distancia cuadrática. En recintos grandes existirá reverberación considerable y es un parámetro que se debe controlar de acuerdo a la aplicación específica. La fórmula de Sabine se puede generalizar para el caso en que el recinto esté formado por distintos materiales y por lo tanto RT debe depender de distintos coeficientes de absorción sonora. La fórmula más general de Sabine es: RT= 0.161V a1S1 + a2S2 + ....anSn 88 donde los ai (i=1,2 . .n) son los coeficientes de absorción para cada Si (cada superficie con recubrimiento). Esta ecuación no tiene en cuenta la absorción adicional del aire y por eso existe una fórmula de Sabine con un factor adicional para corregir la absorción: RT= 0.161V a promedio S - 4mV donde a promedio es el coeficiente de absorción promedio, S el área de la superficie interior, V el volumen y m es un parámetro asociado al aire que depende de la humedad, la temperatura, y de la frecuencia del sonido. Otros autores después de Sabine han formulado otras ecuaciones que tienen en cuenta más factores y por lo tanto son más exactas: RT= - 0.161V debido a Eyring Sln(1 - a ) - 4mV RT= ( 0.161V ) debida a Milintong ∑ − Si ln(1 − ai) donde Si es el área de superficie i-ésima y ai es el coeficiente de absorción sonora para cada superficie. RT= Sy Sx Sz 0.161V + + ) debida a Fitzroy ( 2 − ln(1 − ax ) − ln(1 − a y ) − ln(1 − az ) S S x : área de la superficie de las paredes laterales S y: área de la superficie de las paredes posterior y anterior S z: área del piso y del techo a x: coeficiente de absorción promedio de las paredes laterales ay: coeficiente de absorción promedio de las paredes posterior y anterior az: coeficiente de absorción promedio del piso y del techo Esta última ecuación es la que más se utiliza actualmente por tomar muchos parámetros a consideración. El tiempo de reverberación no es un concepto absoluto en el sentido en que 89 no se puede determinar para todas las situaciones un único tiempo de reverberación: depende del recinto y la aplicación específica. Por eso se habla de un tiempo de reverberación óptimo, dependiendo de la situación. El tiempo de reverberación óptimo depende de si es una sala de grabación, una sala de concierto, un edificio, un salón de clase y se toman en cuenta parámetros como la inteligibilidad de la palabra, la presencia de música, etc. Por ejemplo, en un salón de conferencias no se puede tener un tiempo de reverberación demasiado grande pues hace que la vocales se prolonguen demasiado y enmascaran a las consonantes. Esto resulta en poca inteligibilidad de una conversación por ejemplo. Por el contrario, una sala de concierto se beneficia con un tiempo de reverberación alto pues se aumenta la reverberación en la música es deseable además de disimular algunas imperfecciones. Se han realizado estudios para obtener el tiempo de reverberación óptimo para múltiples escenarios, y se logró tabular los resultados de tiempo en función del volumen del recinto. Figura 41 Tiempo de reverberación óptimo en función del volumen para varias salas Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.. La figura anterior muestra cinco contornos distintos correspondientes a cinco salas distintas. El contorno a corresponde a un estudio de radiodifusión para voz, b salas de conferencia, c estudios de radiodifusión para música, d salas de concierto y e iglesias. Las aplicaciones que requieren mayor inteligibilidad de la palabra como a y b, necesitan un tiempo de reverberación pequeño para no comprometer la comunicacion. 2.4.2.3 Frecuencia de recinto grande. Existe un parámetro que cuantifica cuando un recinto se comporta como un recinto grande. Conocido el tiempo de reverberación es 90 posible hallar la frecuencia límite a partir de la cual el recinto se comporta como un recinto grande; el número de modos de resonancia es muy grande. f recinto grande =2000 RT [=] Hz V Frecuencias superiores a esta frecuencia tendrán un número elevado de modos de resonancia, suficientes para que esta resonancia sea considerada uniforme en el espacio. Debido a esta uniformidad, el análisis de resonancias no es considerado en recintos grandes. Ondas sonoras con frecuencias inferiores (longitudes de onda grandes comparadas con el recinto) tendrán un número discreto de modos de resonancia en puntos específicos del espacio y su estudio corresponde a la acústica de pequeños recintos. f recinto grande delimita las regiones de grande recinto y pequeño recinto. Existen otros parámetros asociados a la reverberación y las reflexiones que se mencionarán a continuación. 2.4.2.4 Camino promedio libre (Mean Free Path). El camino promedio libre es definido como la distancia promedio que un rayo de sonido viaja antes de que encuentre un obstáculo y se refleje. Un valor aproximado debido a Sabine es: MFP=4 V [=]m S V es el volumen del recinto y S el área de la superficie interior. 2.4.2.5 Tasa promedio de reflexiones. Indica cuantas reflexiones existen por segundo en un recinto (valor promedio). Su valor está dado por T reflexion = c [=]reflexiones/s MFP donde c es la velocidad del sonido y MFP es camino promedio libre 91 2.4.2.6 Pérdida promedio por reflexión. Parámetro que cuantifica las pérdidas de la energía sonora debido a la absorción en cada reflexión. Está dada por: P promedio=10log( 1 1 - apromedio ) [=] dB/reflexión donde a promedio es el coeficiente de absorción sonora promedio. 2.4.2.7 Tasa promedio de pérdidas. Cuantifica las pérdidas de la energía sonora por segundo. T pérdidas = Treflexión P promedio = c 1 ) [=]dB/s 10log( 1 - apromedio MFP Ahora se retomará el tema de los materiales acústicos absorbentes haciendo énfasis en su forma, composición y su construcción. 2.4.3 Materiales absorbentes acústicos Los materiales de construcción y los revestimientos tienen propiedades acústicas muy diversas. Algunas aplicaciones específicas como salas de grabación por ejemplo, necesitan unas cualidades acústicas que requieren de materiales especialmente formulados para lograr una elevada absorción sonora. La absorción aumenta tanto con la densidad como con el espesor del material siendo los materiales porosos muy buenos absorbentes. La absorción también depende de la forma en que esté montado o el material . La figura muestra a un material poroso a una distancia de una estructura rígida, como por ejemplo una pared. 92 Figura 42 Montaje de un material poroso a una distancia de una estructura rígida Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. El coeficiente de absorción sonora puede ser calculado así: a= 4 2 2 ⎡ rs ρc ⎤ ρc ⎛ 2ππf ⎞ + ⎟ ⎢ ⎥ + ⎜ cot rs ⎦ rs ⎝ c ⎠ ⎣ ρc rs: resistencia al flujo del material ρc: impedancia acústica del aire d: distancia del material a la pared f: frecuencia de la onda Nótese de la anterior ecuación que el coeficiente de absorción sonora depende de la frecuencia y las tablas de absorción sonora deben incluir para cada frecuencia (o intervalo de frecuencias) un valor distinto. 93 Tabla 4 Coeficiente de absorción para diversos materiales en función de la frecuencia Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.. A la clase de materiales absorbentes también pertenece la lana de vidrio que además de permitir absorciones sonoras altas, resulta económico. Sin embargo, este material debe estar separado del ambiente acústico mediante paneles protectores pues partículas de este material son dañinas para la piel y para los pulmones. Los protectores son en general planchas perforadas de Eucatex u otros materiales celulósicos. La espuma de poliuretano o melamina son otros materiales con gran absorción sonora. Estos se fabrican en forma de cuñas anecoicas (sin ecos). Con esta estructura, es posible lograr una gran absorción sonora ya que el sonido incide sobre la superficie de una cuña y se refleja varias veces en esa cuña y en la contigua. Esta configuración funciona como una trampa sonora. 94 Para el cubrimiento de cielorrasos se utilizas plafones de materiales celulosos y porosos basados en fibras minerales, fibra de vidrio, fibras celulósicas o corcho. Figura 43 Material absorbente en forma de cuña anecoica Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.. También se puede utilizar lana de vidrio intercalada con estos materiales para optimizar la absorción. Para los pisos se utilizan alfombras pues además de absorber el sonido, atenúan el ruido de pisadas o elementos como cables sobre ellas. La absorción de una alfombra aumenta considerablemente con su espesor pero no es muy dependiente de su material de construcción (nylon, lana, etc. ) Las cortinas también influyen en el tratamiento acústico de un recinto como absorbentes sonoros, aunque su principal función sea otra (parte del diseño arquitectónico, estética). Se debe tener en cuenta que entre más distantes estén las cortinas de las paredes, será mejor la absorción sonora. Materiales porosos como tela o terciopelo son mucho más absorbentes que materiales como el plástico. También aumenta la absorción si la cortina está fruncida o drapeada debido al fenómeno de la trampa sonora. Se puede lograr una acústica variable o dinámica si la cortina cubre una superficie altamente reflectora. A medida que se destape la cortina y la pared reflectora se revele, la absorción disminuirá. Esto es muy importante en recintos que son utilizados para varios propósitos y para cada propósito es mejor una determinada absorción. Es importante notar que algunas reflexiones son útiles y algunas superficies no requieren materiales con absorción sonora. 2.4.4 Acústica de pequeños recintos Cuando la longitud de onda es comparable con las dimensiones del recinto, el recinto deja de comportarse como “grande”. El parámetro para determinar el tamaño relativo del recinto es la frecuencia de recinto grande: por debajo de esta frecuencia las ondas se tratan 95 mediante acústica de pequeño recintos. Se acepta como un recinto pequeño aquella con fc<200Hz. Algunos tipos de pequeños recintos incluyen salones de clase, salones de grabación, “home theaters”, etc. La acústica de pequeños recintos es más complicada que el análisis de grandes recintos pues debe incluir fenómenos físicos ondulatorios que se habían ignorado en los grandes recintos, siendo la resonancia el más notorio. La reflexión deja de ser especular y no se puede hacer el análisis mediante el trazado de rayos de la acústica geométrica. Se deben hacer consideraciones físicas y la reverberación deja de ser un factor importante. 2.4.4.1 Resonancias. Las resonancias o modos normales de vibración son resultado de las reflexiones sucesivas en las paredes. Se definen las frecuencias resonantes como las frecuencias en las cuales las ondas forman mínimos y máximos de presión sonora en distintos puntos del recinto. La existencia de estos máximos y mínimos afecta considerablemente la calidad acústica de un recinto pues la sonoridad de la fuente se concentra en ciertos puntos y en otros se elimina. Además, la reverberación para puntos donde tienen lugar los máximos es mayor creando un desbalance acústico en el recinto. Ya se ha comentado que las resonancias también ocurren en recintos grandes, pero debido a la densidad de resonancias el sonido se escucha uniforme. Esto porque en recintos grandes las frecuencias de resonancia son muy pequeñas y sus armónicos respectivos se conglomeran. En cambio, en un recinto pequeño las resonancias son discretas y la difusión del sonido no es satisfactoria: la distribución espacial del sonido no es uniforme. Los modos de vibración se dividen en tres: axial, tangencial, oblicuo. Axial: Las reflexiones ocurren en superficies (2) opuestas y paralelas. Son las más frecuentes. Tangencial: Las reflexiones ocurren entre cuatro superficies adyacentes, no paralelas. Suele aparecer cuando las superficies son muy macizas. Oblicuas: Las reflexiones ocurren en cualquier dirección entre cualquier conjunto de superficies (hasta 6). No son muy comunes y su estudio suele ser irrelevante. 96 El fenómeno de resonancia se asocia con la generación de una onda estacionaria de una frecuencia definida, lo que se escuchará como un tono a esa frecuencia y posiblemente, alguno de sus armónicos. Un recinto tiende a amplificar frecuencias cercanas al modo (frecuencia natural) de la sala. Un recinto puede tener más de una frecuencia de resonancia dependiendo de su geometría. El análisis que sigue supone un recinto rectangular con dimensiones Lx, Ly, y Lz por simplicidad. z Lz y Lx Ly x Figura 44 Recinto rectangular para analizar las frecuencias de resonancia De la ecuación de onda, se tiene que: ∂ 2p ∂ 2p ∂ 2p + 2 + 2 + k 2p = 0 2 ∂x ∂y ∂z Ahora se supone una solución separable: p(x, y, z) = p1 (x)p2 (y)p3 (z) para obtener tres ecuaciones diferenciales de la forma d 2 p1 2 + k x p1 = 0 2 dx (y otro tanto para y y para z) La reflexión en las fronteras de la caja rectangular debe cumplir con que la presión en esos puntos es máxima, es decir: dp1 (x) =0 dx en x=0 y en x=Lx Con esta condición se obtiene: p1 (x) = A1cos(k 1x) 97 kx = nxπ Lx Así se obtiene la solución general, siguiendo un procedimiento análogo para las dimensiones y y z: ⎛ n πx ⎞ ⎛ n πy ⎞ ⎛ n πz ⎞ p n x n y n z (x, y, z) = Acos⎜⎜ x ⎟⎟cos⎜ y ⎟cos⎜⎜ z ⎟⎟ ⎟ ⎜ ⎝ L x ⎠ ⎝ L y ⎠ ⎝ Lz ⎠ donde nx, ny y nz son números enteros positivos. La condición de resonancia establece que la dimensiones del recinto sean múltiplos enteros de la longitud de onda característica de la onda (2π/k). Esto, y el hecho que la frecuencia es igual a c/λ, conlleva al siguiente resultado para las frecuencias de resonancia: f n xn yn z c c k n x n ynz = = 2π 2 ⎛ nx ⎜⎜ ⎝ Lx 2 2 ⎞ ⎛ ny ⎞ ⎛ nz ⎞ ⎟⎟ + ⎜ ⎟ + ⎜⎜ ⎟⎟ ⎜ ⎟ ⎠ ⎝ L y ⎠ ⎝ Lz ⎠ 2 La terna constituida por (nx,ny,nz), es denominada modo para la respectiva frecuencia de resonancia. Es decir, cada modo describe una determinada frecuencia de resonancia. El modo será axial si dos de las tres componentes son iguales a cero. El modo será tangencial si solamente una de las tres componentes es igual a cero y será oblicuo cuando ninguna de las tres componentes es igual a cero. El caso anteriormente descrito incluye las tres dimensiones pero a veces es útil simplificar la situación y considerar únicamente dos paredes opuestas (modo axial). Si la distancia entre las dos paredes es L, la longitud de onda de la onda estacionara en la pared será 2L (condición de onda estacionaria) y se tiene f= c 2L Si por ejemplo las paredes están separadas por una distancia de 3m implica que (tomando 345m/s como la velocidad del sonido) la frecuencia de resonancia será de 57.5Hz. Otras frecuencias de resonancia corresponden a los armónicos de este tono: 115Hz, 172.5Hz, etc. Nòtese que se hubiera llegado al mismo resultado si en la ecuación general de frecuencias de resonancia consideramos el caso en que ny y nz son iguales a cero (modo axial). Para calcular el número de modos aproximado por debajo de cierta frecuencia se utiliza la siguiente ecuación: 98 N≈ 4ππV3 πSf 2 Lf + + 3c 3 4c 2 8c N: número de modos f: frecuencia límite S: área de la superficie V: volumen del recinto L: suma de las aristas del recinto c: velocidad del sonido La distribución de las frecuencias resonantes en el espectro no es uniforme. Para frecuencias pequeñas (relativas a la frecuencia crítica) el espectro es discreto mientras que para frecuencias grandes el espectro es considerado continuo debido a la cantidad de modos asociados. A medida que crece el tamaño del recinto las resonancias se vuelven más densas, convirtiéndose en reverberación y mejorando por ende la difusión. La presencia de resonancias en general no es deseable pues amplifica ciertas frecuencias y genera un patrón no uniforme de sonoridad en un recinto Existen algunas recomendaciones para mejorar de alguna forma problemas relacionados con resonancias y con difusión: - evitar paralelismos para evitar reflexiones axiales. Esto puede lograrse inclinando una o dos paredes - evitar simetrías entre las longitudes de las aristas en el caso de un recinto rectangular. Las aristas deben ser de longitudes distintas y existen algunas proporciones satisfactorias (propuestas por diversos autores ): 1:1.17:1.47, 1:1.45:2.10 (Ahrae) 1:1.28:1.54 (Bolt) 1:1.25:1.6 (IAC) 1:1.14:1.41(Sepmayer) 99 - utilizar materiales absorbentes pues al disminuir la reflexión, disminuye la intensidad de la onda estacionaria y por ende los modos de resonancia son más débiles 2.4.5 Dispositivos para el control acústico La acústica de una sala o recinto depende de varios factores que incluyen la geometría y disposición de los elementos, así como de los materiales de construcción. Sin embargo, modificar estos parámetros no solo resulta laborioso sino que muchas veces también insuficiente. Por eso existen unos dispositivos especialmente diseñados para afrontar alguno de los problemas más comunes en el tratamiento acústico de salas como son las reflexiones, la reverberación y la resonancia. Estos dispositivos se dividen en: - Absorbentes (Los materiales absorbentes ya fueron examinados). - Resonadores - Páneles - Difusores 2.4.5.1 Resonadores. Los resonadores son dispositivos de banda estrecha (selectivos en frecuencia) que tienen la propiedad de controlar frecuencias graves. Utilizan una cavidad resonante para disipar la energía acústica. Al ser dispositivos de banda estrecha, son útiles para tratar los modos de resonancia de recintos. Debido a que estas frecuencias suelen ser frecuencias graves, los resonadores también son comúnmente llamados trampas de graves (“bass traps” en inglés). Las trampas de graves, aunque pueda sonar contradictorio, pueden ayudar a reforzar los graves en un recinto. Esto puede ocurrir, porque la trampa ayuda a eliminar la reflexión de tonos graves. Estas reflexiones tienden a cancelarse con las ondas originales, eliminando los bajos. Por eso al eliminar la reflexión, se elimina la cancelación y por lo tanto se escuchan los bajos como si no existiese paredes (como en el campo libre). 100 Figura 45 Resonador de Helmholtz Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. En la figura se muestra un resonador Helmholtz. El resonador Helmholtz funciona como una cavidad sintonizada, es decir, atrapa frecuencias dominantes resonantes en un recinto. Está diseñada para atrapar frecuencias graves. La frecuencia fo sintonizante está dada por: f0 = c S 2π LV S: área del cuello V: volumen de la cavidad L: longitud del cuello c: velocidad del sonido 2.4.5.2 Páneles . Los páneles son también estructuras absorbentes basadas en una lámina separada de una estructura rígida como una pared. Figura 46 Pánel resonante Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. 101 La frecuencia de resonancia (o de absorción) de la configuración anterior, es: f res = 6000 md m: densidad lineal de la lámina d: distancia de la pared Los páneles vibrantes se pueden combinar con los resonadores Helmholtz para poder absorber o atrapar un conjunto más amplio de frecuencias graves en el espectro. El pánel es particularmente útil para frecuencias graves-graves mientras que el resonador Helmholtz está diseñado para frecuencias medias-graves. También se puede añadir material poroso a esta configuración para mejorar la absorción con respecto a frecuencias medias y altas. 2.4.5.3 Difusores. En algunos tipos de recintos la difusión del sonido no es homogénea o envolvente. Incluso, en algunos puntos del recinto se perciben sonoridades muy altas debido a reflexiones especulares, y algunas de estas reflexiones (especialmente las de un retardo<20ms) interfieren con el sonido directo. Los difusores son dispositivos utilizados para redireccionar de forma conveniente la energía sonora para lograr una distribución mas uniforme del sonido. El objetivo es obtener una superficie que sea capaz de reflejar una onda incidente en todas las direcciones. Los difusores en general, constan de una serie de páneles o rendijas de longitudes y profundidades definidas para lograr una reflexión no especular o difusa. Se pueden clasificar de la siguiente manera: 2.4.5.3.1 Difusores convexos. Las superficies convexas (o cilíndricas) reflejan las ondas sonoras de manera divergente, convirtiendo a este tipo de superficies en difusores naturales. El espesor de estos difusores influye en la absorción de algunas frecuencias (en especial las graves) lo que significa que funciona como difusor además de trampa de graves. El campo de difusión es perpendicular al eje del cilindro. 102 Figura 47 Difusión resultado de la reflexión sobre una superficie convexa 2.4.5.3.2 Difusores por secuencias numéricas. El estudio de difusores por secuencias numéricas tiene como pionero al Prof. Schroeder. El combinó el estudio acústico de recintos con la teoría de números y de Fourier para encontrar un difusor óptimo. La dispersión de la onda depende de la forma como se refleja la onda en los canales del difusor. El problema entonces se limita a encontrar cual debe ser la secuencia numérica de las profundidades de los canales para que el patrón de difracción sea lo más uniforme posible. Figura 48 Patron de difracción (polar) de un difusor por secuencias numéricas Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. 2.4.5.3.3 Difusores por residuos cuadráticos (QRD). El difusor de residuo cuadrático (QRD) es un tipo de difusor con rendijas rectangulares basado en una secuencia llamada secuencia de residuos cuadráticos. Genera una campo de difusión en el sentido perpendicular a las lamas o canales. La frecuencia mínima de operación está relacionada con la profundidad de los canales mientras que la frecuencia máxima está relacionada con el ancho. Schroeder investigó algunas de las propiedades notorias de la secuencia Sn (residuos cuadráticos): 103 Sn=n2mod(N) n: índice de la secuencia N: número primo Por ejemplo, los primeros términos de esa secuencia para N= 17 son: Sn=0, 1, 4, 9, 16, 8, 2, etc. El Prof. Schroeder demostró que esa secuencia de números se puede relacionar con las dimensiones del difusor de tal forma que se genere un patrón de difracción aproximadamente uniforme en el espacio. El diseño del difusor QRD se resume en los siguientes pasos: • Se selecciona la frecuencia mínima de operación f0 (la frecuencia sonora más pequeña en el recinto). Este factor incidirá directamente en la profundidad máxima del difusor. Las profundidades seguirán una secuencia dada por: dn = Snλ0 2N dn: secuencia de profundidades λ0: longitud de onda de operación Sn: secuencia de residuos cuadráticos • La frecuencia máxima de operación será f max = c donde W es el ancho de cada 2W rendija y c es la velocidad del sonido. En otras palabras W es igual a la media longitud de onda de la frecuencia máxima. Si se desea tomar en cuenta el ancho de las láminas separadoras de las rendijas debe utilizarse la siguiente expresión: f max = c donde T es el ancho (espesor) de las láminas. 2(W + T) 104 Se selecciona el número primo considerando que mientras mayor sea se tendrá más lóbulos de difracción, pero se complicará su construcción. En general se utilizan números primos comprendidos entre 17 y 31. Si el lugar donde debe colocarse el difusor es muy grande, se pueden repetir varios períodos del mismo. Figura 49 Difusor de residuo cuadrático (QRD) Fuente: WILES, John. s.l.:s.n. 2004 <www.rpgdiffusorsystems.com> [consulta: 23 Abr. 2005] Su construcción suele ser en MDF aunque se pueden hacer en madera maciza, metacrilato, vidrio, escayola, mármol, etc. Se utilizan sobre todo en paredes traseras de controles y donde se precise aumentar la difusión como escenarios, locutorios, platós y salas de grabación. 2.4.5.3.4 Difusores birradiales. El análisis hecho para los difusores QRD es válido para una dimensión. Si se tiene en cuenta dos dimensiones, la secuencia para las profundidades se convierte en un matriz: d h,k = (h 2 + k 2 )mod(N) λ 2N h,k: número del sector (0,1, . .N-1) d h,k : profundidad del sector h,k λ: longitud de onda asociada 105 Los difusores birradiales son producto de la combinación de dos difusores QRD con 90º de cruce uno respecto al otro. Permiten distribuir la energía acústica en todo el espacio. Esta configuración genera un campo de difusión semiesférico y son ideales en los techos de las salas. Figura 50 Difusor birradial Fuente: WILES, John. s.l.:s.n. 2004 <www.rpgdiffusorsystems.com> [consulta: 23 Abr. 2005] También es muy común hacer pequeños difusores dentro de las celdas del difusor mismo, técnica conocida como difusores con fractales. 2.4.5.4.5 Difusores basados en raíces primitivas. Este tipo de difusores (también investigados por Schroeder) utiliza otra secuencia numérica que demuestra ser más óptima en cuanto a su patrón de difracción. El procedimiento de diseño es similar al de difusores QRD, pero ahora la secuencia Sn es: Sn = g n mod(N) g: raíz primitiva de N N: número primo El concepto de raíz primitiva es el siguiente: para que g sea raíz primitiva de N debe cumplirse que, para n entre 1 y N-1 no debe repetirse ningún resultado de gn mod (N). 2.4.5.4.6 Difusores acústicos perforados. Los difusores acústicos perforados están formados por una superficie reflexiva pero perforada a otra interna absorbente. Debido a que el sonido incidente encuentra diferentes impedancias a la reflexión, se altera el ángulo 106 de fase, lo que le hace comportarse como difusor al cambiar la trayectoria especular por una difusa. Figura 51 Difusores perforados Fuente: WILES, John. s.l.:s.n. 2004 <www.rpgdiffusorsystems.com> [consulta: 23 Abr. 2005] 2.4.6 Características generales en el diseño de recintos Para que un recinto se comporte de manera ideal en el sentido acústico, algunas condiciones se deben cumplir: - el campo acústico consta de un gran número de ondas reflejadas combinadas con la original, pero se deben evitar algunas fallas acústicas como los ecos y los zumbidos. Esto se puede lograr evitando paralelismos entre superficies reflectoras - la densidad media de energía acústica debe ser uniforme en cualquier punto del campo, evitando sonoridades concentradas debido a reflexiones o amplificación de frecuencias de resonancia. Esto puede mejorarse con materiales absorbentes para disminuir la reflexión o bien ubicar reflectores y difusores en posiciones adecuadas para no concentrar el sonido (o el opuesto, producir sombra acústica). Los modos de resonancia se pueden manejar con las dimensiones del recinto (utilizar proporciones adecuadas para el largo, altura, y profundidad) y también con resonadores - el tiempo de reverberación debe ser óptimo para el volumen del recinto dado y para la aplicación específica. (la reverberación para una iglesia o auditorio musical debe ser mayor que para un salon de clase) El tiempo de reverberación se puede 107 controlar a partir de la directividad de la fuente o R, el parámetro de absorción sonora. - la inteligibilidad del habla debe ser alta en aplicaciones que la requiera. Las reflexiones que inciden en el oído antes de 50ms no pueden ser distinguidas como diferentes por el cerebro y por lo tanto refuerzan el sonido directo. Las reflexiones posteriores a 50ms son consideradas parte de la reverberación e influyen en la inteligibilidad. El índice de claridad (o inteligibilidad) se define como: 10log E , L donde E es la energía sonora incidiendo entre 0 y 50 ms y L es la energía sonora que incide posterior a 50ms. Entre más alto sea este índice, existirá mayor entendimiento del habla. Esto se puede lograr reduciendo el tiempo de reverberación. Hasta ahora se ha tratado mejorar una sala o recinto respecto a la calidad acústica dentro de ella. La otra problemática que trata la acústica arquitectónica es el aislamiento acústico; aislar acústicamente significa impedir que los sonidos generados dentro del mismo trascienda hacia el exterior y recíprocamente, que los ruidos externos se perciban desde su interior. Esto es importante en auditorios grandes escenario de espectáculos donde es importante impedir que el sonido se propague como ruido molesto para la gente fuera de él; el ruido es un contaminante más. También es importante por ejemplo en salas o estudios de grabación donde ruido externo puede repercutir en la calidad de la grabación. Básicamente, el aislamiento sonoro se logra interponiendo un material denso entre la fuente sonora y el receptor. El aislamiento es mayor a medida que crece la densidad superficial del material y también a mayor frecuencia. Esto da una razón de porqué se escucha más la base rítmica y los bajos provenientes de una habitación contigua. Estudios físicos han demostrado que se puede aprovechar mejor el material (la pared) por medio de paredes múltiples. Es decir, dividir el material en varias partes y separarlos con aire, o algún material absorbente. El tipo de material utilizado para construir las paredes o tabiques es roca de yeso. Una estructura muy utilizada es la de dos placas de yeso separadas por una distancia y ese 108 espacio relleno de algún material absorbente, como lana de vidrio. Se puede obtener mayor aislamiento aún si se colocan más placas de yeso. Además si se coloca la lana de vidrio entre las placas de tal forma que no haya rigidez en la conexión, evita que se transmitan vibraciones de un lado a otro. Figura 52 Estructura para el aislamiento acústico Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.. En este punto es importante aclarar que un material absorbente no necesariamente es buen aislante acústico. Esto debido a que parte de la energía absorbida (la energía no reflejada) se convierte en energía térmica o mecánica, pero la otra parte puede ser transformada en energía que se transmite al otro medio. Por eso son importantes los materiales rígidos y densos a parte del material absorbente que se coloca entre ellos. Existen básicamente tres formas para transmitir el sonido de un medio a otro (suponiendo una estructura que separa a los dos medios): • transmisión directa: consiste en percutir o golpear la estructura convirtiéndose ésta en transmisor de sonido. • transmisión indirecta: el sonido, proveniente del aire del primer medio, incide sobre la estructura haciéndola vibrar y esta a su veces transmite el sonido al aire del segundo medio. • transmisión por flancos: el sonido se filtra a través de fisuras o se propaga por tuberías de ventilación, por caños de distribución de energía eléctrica, etc. Para cuantificar la cantidad de aislamiento sonoro se utilizan dos parámetros: la pérdida de transmisión (PT) y la clase de transmisión sonora (STC). La pérdida de transmisión indica que tanta energía acústica incidente se pierde al atravesar un tabique que separa a dos recintos, por ejemplo. La pérdida de transmisión, expresado en dB, depende tanto del material como de la frecuencia de la onda sonora. 109 Una aproximación para la pérdida de transmisión (también llamado índice de reducción) es: R ≈ 20log(fM) − 47dB f: frecuencia de la onda sonora M: masa de la estructura. La clase de transmisión sonora (STC) es un parámetro promedio de PT a varias frecuencias. Mientras que PT es función de la frecuencia, STC es un único valor que permite evaluar rápidamente la calidad del aislamiento sonoro que ofrece un tabique. Es aproximadamente un valor ponderado de varios valores de PT para un conjunto de frecuencias. Es muy importante tener en cuenta estos parámetros y otros más, para el diseño óptimo de salas o recintos con aislamiento acústico. Tabla 5 PT(pérdida de transmisión) y STC (clase de transmisión sonora) para distintos materiales Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.. 110 2.5 RUIDO ACÚSTICO El ruido acústico se puede entender como el sonido no deseado. La diferencia entre sonido y ruido depende tanto del nivel de presión sonora como de la respuesta subjetiva del oído. El grado de molestia del ruido aumenta al aumentar el nivel de presión sonora y la respuesta subjetiva del oído depende de la naturaleza del sonido. Debido a la naturaleza indeseada del ruido, éste se considera un contaminante y es deseable atenuarlo en gran medida. Es imposible eliminar el ruido por completo y además se debe evitar ya que el organismo humano necesita “algo” de ruido. 2.5.1 Tipos de ruido acústico 2.5.1.1 Ruido de fondo. El ruido de fondo es el ruido circundante asociado con un ambiente. Es generalmente una composición de ruidos provenientes de fuentes cercanas y lejanas. 2.5.1.2 Ruido aleatorio. Este tipo de ruido es fluctuante cuyas amplitudes instantáneas aparecen como función del tiempo de acuerdo con una distribución gaussiana. Nivel de Presión Sonora dB distribución gaussiana t Figura 53 Ruido aleatorio 111 2.5.1.3 Ruido blanco. El ruido blanco es aquel cuya presión sonora cuadrática media es uniforme y continua con la frecuencia. Nivel de Presión Sonora dB f (Hz) Figura 54 Ruido blanco 2.5.1.4 Ruido rosa. Este ruido se define como el ruido que tiene igual energía por octava dentro del rango de frecuencias audibles. Es análogo al ruido blanco pero con una pendiente de –3dB. Nivel de Presión Sonora dB f (Hz) Figura 55 Ruido rosa 2.5.1.5 Ruido continuo constante. Este ruido es aquel cuyo nivel de presión sonora medido en bandas de octava es continuo y aproximadamente constante a lo largo del tiempo. Nivel de Presión Sonora dB t Figura 56 Ruido continuo constante 112 2.5.1.6 Ruido continuo intermitente. Es análogo al continuo pero fluctúa en un margen moderado a lo largo del tiempo. Nivel de Presión Sonora dB t Figura 57 Ruido continuo intermitente 2.5.1.7 Ruido fluctuante periódicamente. Es análogo al continuo pero fluctuando periódicamente con el tiempo. Nivel de Presión Sonora dB t Figura 58 Ruido fluctuante periódicamente 2.5.1.8 Ruido fluctuante no periódico. Este es ruido con fluctuaciones irregulares no periódicas. Nivel de Presión Sonora dB t Figura 59 Ruido fluctuante no periódico 113 2.5.1.9 Ruido impulsivo. Este tipo de ruido es de muy corta duración < 1s. Nivel de Presión Sonora dB t Figura 60 Ruido impulsivo 2.5.2 Fuentes de ruido Los ruidos se producen en unos focos sonoros denominados fuentes. Se transmiten a través de un medio (sólido, líquido o gaseoso) y por último llega a un receptor. En lo últimos años se ha tratado de estudiar y conocer con profundidad las fuentes sonoras y todas sus características físicas para disminuir los niveles de ruido que generan. Esto es importante pues el ruido es un contaminante que produce grandes problemas sociales, económicos, psicológicos, fisiológicos, etc. Las fuentes de ruido pueden ser externas a los edificios o internas a los edificios. 2.5.2.1 Ruido debido al tráfico rodado. Este es el ruido producido por los vehículos en movimiento. Esto puede producirse en el motor, órganos de transmisión, neumáticos, etc. El caso más importante es el del tráfico, en el cual confluyen camiones, furgones, carros, motocicletas,etc. produciendo grandes niveles de presión sonora. Para hacer el análisis de presión sonora se deben tener en cuenta múltiples aspectos como: velocidad de los vehículos, porcentaje de camiones en las vías, presencia de edificios en zonas urbanas (pues las reflexiones refuerzan el sonido),etc. 2.5.2.2 Ruido de tráfico aéreo. Este es el ruido producido por los aviones en sus fases de despegue, vuelo y aterrizaje. En las fases de despegue y aterrizaje es cuando más se produce ruido debido a que los aviones se encuentran en el suelo o muy próximos a el. Los 114 aviones pueden alcanzar niveles de potencia acústica hasta de 170dB. Si el avión vuela a velocidades supersónicas (mayores a la velocidad del sonido) se produce un “boom” sónico con un gran nivel de ruido que puede originar enormes vibraciones de las edificaciones en el suelo. 2.5.2.3 Ruido debido a obras públicas y a actividades industriales. Las fuentes de ruido debido a obras públicas existen en la construcción por la maquinaria pesada que se emplea produciendo diversos tipos de ruido: continuos de nivel fluctuante y ruidos impulsivos. Estos son normalmente causados por martillos neumáticos que da un nivel de potencia acústica de 120dB, taladros, sierras,etc. Las fuentes de ruido debido a actividades industriales corresponden a todos aquellos generados por la industria en general: industrias electromecánicas, industrias de procesos químicos, industrias de construcción, etc. Por el ruido que generan las industrias, éstas han sido desplazadas fuera de las poblaciones lejos de las zonas urbanas de vivienda. 2.5.2.4 Ruido debido a actividades comunitarias urbanas. Estos ruidos se dan por la concentración de personas en determinadas zonas de confluencia pública. Son intermitentes y con variación de niveles como por ejemplo en mercados, centros comerciales, cines, teatros, discotecas, etc. 2.5.2.5 Ruido debido a agentes atmosféricos. El agente atmosférico más productor de ruido es la tormenta, con la lluvia, granizo y obviamente los truenos. Producen ruido áreo (ruido que se propaga en el aire) que alcanzan niveles muy elevados. El viento también genera elevados niveles de ruido y genera sonidos de muy alta frecuencia cuando atraviesa ventanas. 2.5.2.6 Ruido debido a las personas. Las personas, dentro de un edificio, al hablar generan ruido de presiones sonoras muy variadas. El nivel de presión sonora depende tanto de la persona emisor (potencia acústica) como de las características del recinto (absorción sonora, tiempo de reverberación, modos, etc.). Los animales domésticos también generan ruidos que pueden llegar a ser muy molestos. 115 2.5.2.7 Ruido de impactos. Es el ruido que se transmite a través de las estructuras como pisadas, movimiento de objetos, golpes dentro de un edificio. Los ruidos con grandes componentes de baja frecuencia se transmiten con facilidad de un local a otro. 2.5.2.8 Ruido debido a televisión, radio y equipos musicales. Los ruidos de estos artefactos depende del tipo de programa sintonizado (en el caso de televisores y radios) y del tipo de música en el caso de los equipos. 2.5.2.9 Ruido debido a aparatos electrodomésticos. Estos aparatos producen ruido aéreo y estructural (propagación por los sólidos por contacto con paredes y suelo). Las fuente más importantes de ruido son : lavaplatos, lavadoras y ventiladores. El electrodoméstico menos ruidoso es la nevera. 2.5.2.10 Ruido debido a instalaciones de fontanería. Este ruido se origina en el sistema de tuberías y se transmite a través de las mismas a toda la estructura (por la canalización y el fluido). El nivel de ruido depende de varios factores como el diámetro de la tubería, la densidad del fluido y la velocidad de flujo. Otra fuente importante de ruido en las instalaciones de fontanería son los grifos. Se produce ruido en los grifos a medida que aumenta la presión y la velocidad al abrirse y cerrarse las válvulas. 2.5.2.11 Ruidos debido a instalaciones de calefacción. Las calderas y los quemadores son fuentes importantes de ruido produciendo niveles elevados en el recinto donde se encuentran ubicados con componentes de bajas frecuencias. Los radiadores eléctricos originan sistemas vibrantes mecánicos resonantes, produciendo ruidos a frecuencias discretas que se transmiten a las paredes. 2.5.2.12 Ruido debido a los ascensores. Las principales fuentes de ruido de los ascensores son los motores de accionamiento y el mando eléctrico. Los ruidos de accionamiento se producen por el motor eléctrico, los engranajes, poleas y en la conducción del cable. Los aparatos de mando molestan debido a los golpes del relé. 116 2.5.2.13 Ruido debido a vertederos de basura. Los vertederos de basura son fuentes de ruido aéreo y estructural de tipo esporádico. La caja de caída de la basura debe estar aislada acústicamente del edificio y hecho de materiales de poca resonancia. 2.5.2.14 Ruido debido a instalaciones de ventilación y climatización. Los conductos de ventilación y climatización facilitan la transmisión de sonidos provenientes de otros locales. Estos conductos deben estar aislados acústicamente del edificio para evitar la infiltración del ruido. 2.5.2.15 Ruido debido a las instalaciones eléctricas. Las instalaciones eléctricas son una fuente de ruido importante. Por una parte, los sistemas de iluminación contienen relés, dispositivos electromecánicos que producen ruidos impulsivos que alcanzan elevados niveles. Por otra parte, la red de alimentación de frecuencia 60Hz resuena y es amplificada por objetos de montaje y mantenimiento. 2.5.3 Cuantificación del ruido Es necesario crear una escala que relacione la respuesta subjetiva de las personas ante el ruido con alguna propiedad física medible de la fuente sonora. Esto se hace con el fin de hacer una caracterización sobre la medida del ruido que permita obtener más información sobre éste: - las molestias que causa el ruido - la medida debe ser aplicable a cualquier fuente de ruido - los parámetros deben ser fácilmente medibles Existen básicamente dos escalas para de cuantificar el ruido: nivel de presión acústica (SPL) y nivel de presión acústico ponderado. 2.5.3.1 Nivel de Presión Acústica en toda la banda. Es el nivel de presión acústica (sin ponderar) para el rango de frecuencias audibles. Se da en NPSdB. 117 2.5.3.2 Nivel de Presión Acústica Ponderado. Es el nivel de presión acústica siguiendo alguna curva de ponderación para compensar diferencias de sensibilidad que el oído humano tiene para las distintas frecuencias dentro del campo auditivo. Existen varios tipos: A, B, C, D, E pero se utiliza casi que exclusivamente la ponderación A para estimar el ruido y sigue aproximadamente a la curva isofónica de 40 fonios. El nivel de ruido para esta ponderación se da en dB(A). La ponderación D se utiliza para medir el ruido de aviones. 2.5.4 Criterios de caracterización del ruido Éstos son los diversos criterios con que se puede analizar un ruido o un conjunto de ruidos. 2.5.4.1 Nivel global. Es el nivel de ruido total en todo el espectro del sonido. Se calcula generalmente como la suma de los niveles en octavas o tercios de octava. (Los niveles están en dB(A)). LG=10log ∑i 100.1Li donde LG: Nivel global de ruido Li: Nivel de ruido por octava 2.5.4.2 Nivel continuo equivalente. Es el nivel de ruido constante que genera la misma energía acústica que un ruido fluctuante durante un intervalo dado de tiempo. ∑ t (10) o.1Li i Leq=10log i T Leq: Nivel de ruido continuo equivalente 118 ti: Tiempo de observación durante el cual el nivel sonoro es Li Li: Nivel sonoro (dB(A)) 2.5.4.3 Nivel percentil de sonido en exceso. Es una medida estadística que indica con que frecuencia se sobrepasa un nivel concreto de ruido. Se expresa así: Lx=NdB(A) x: percentil N: número arbitrario Esto indica que NdB(A) es el nivel de presión acústica que se ha sobrepasado durante x% del tiempo de observación. Por ejemplo, si el tiempo de medida son 10 minutos y L50=30dB(A), esto significa que durante cinco minutos se han tenido niveles superiores a 30dB(A). 2.5.4.4 Nivel de exposición sonora. Es el nivel de ruido constante con un segundo de duración que genera la misma cantidad de energía que un sonido pasajero. LE=Leq+10log( T ) tc donde T: intervalo de tiempo en que se hizo la medición del ruido equivalente tc: duración del sonido pasajero 2.5.4.5 Dosis sonora. Es la energía recibida en periodo de tiempo dado. Su valor suele darse en porcentaje respecto a una referencia. 10 0.1Leq D(%)= 0.1Leqr 100% 10 donde D(%):dosis sonora 119 Leq: Nivel de presión sonora equivalente en dB(A) Leqr: Nivel de presión sonora de referencia en db(A) Para efectuar las mediciones sobre los parámetros mencionados, se debe utilizar un instrumento para medir las presiones sonoras. Este instrumento, denominado sonómetro, está provisto de un micrófono amplificador, un detector de RMS, un integrador y un indicador de lectura. 2.5.5 Efectos del ruido sobre el hombre El excesivo nivel sonoro tiene efectos nocivos para el hombre. Este elevado nivel puede provenir tanto de una fábrica como de un equipo reproductor de música. Se han realizado muchos estudios del efecto que puede tener un elevado nivel sonoro en la salud física y mental del ser humano. Estas afecciones se dividen en: - efectos no clínicos - efectos clínicos no auditivos - efectos Auditivos 2.5.5.1 Efectos no clínicos. Los efectos no clínicos no se manifiestan a través de síntomas o patologías. El efecto no clínico más común es la molestia. Se puede afirmar que existe confort auditivos hasta los 80dB(A). Obviamente, este dato varía dependiendo del tipo de sonido y la motivación para escucharlo. Por encima de 120dB(A) se percibe dolor y un sonido ensordecedor. Con relación al ambiente laboral, los trabajadores pierden eficiencia cuando son expuestos al ruido, siendo más afectadas las labores intelectuales que las labores manuales. Otro efecto importante del ruido es que crea dificultades para la comunicación oral. Por otra parte, por encima de 90dB(A), las distorsiones propias del oído impiden una escucha fiel de la música. Además los sonidos de elevados niveles sonoros enmascaran a los sonidos más débiles. Por estas razones desaparece la alta fidelidad. 120 2.5.5.2 Efectos clínicos no auditivos. Los efectos clínicos no auditivos (aquellos que se manifiestan a través de síntomas o patologías) son muy diversos y han sido ampliamente estudiados. Entre ellos están: hipertensión arterial, taquicardias, estrés, cefaleas, pérdida de concentración, variaciones del ritmo respiratorio, disminución de la secreción salival y del tiempo de tránsito intestinal. También se producen afecciones en la garganta resultado de forzar la voz al tratar de comunicarse en ambientes ruidosos. Los ruidos intensos también inciden en el sentido de equilibrio, llegando a producirse mareos e inestabilidades. 2.5.5.3 Efectos auditivos. Estos efectos quizá son los más correlacionados con el ruido y también son los más graves. La consecuencia más importante es la pérdida de la audición conocida como hipoacusia. Esta condición de resulta de la exposición durante poco tiempo ante sonidos fuertes de corta duración (bombas, estallidos, despegue de aviones) o ante exposición prolongada sonidos menos fuertes (ambiente laboral, música con mucho volumen). La pérdida auditiva se determina midiendo por medio de una audiometría, cuánto sube el umbral de audición en cada frecuencia respecto al considerado normal. (Si sube el umbral de audición significa que se necesita más presión sonora para percibir el sonido). Después se promedian los valores a 500Hz, 1kHZ y 2kHz para obtener la pérdida promedio auditiva, PAP. Existe hipoacusia cuando la PAP supera los 25dB ya que a partir de ahí comienzan las dificultades para la comprensión de la palabra. 121 3. ELECTROACÚSTICA Y PROCESAMIENTO DE AUDIO La electroacústica es la parte de la acústica que se ocupa del estudio, análisis, diseño de dispositivos que convierten energía eléctrica en acústica y viceversa, así como de sus componentes asociados. Entre estos se encuentran los micrófonos, acelerómetros, altavoces, excitadores de compresión, auriculares, audífonos, calibradores acústicos y vibradores. Los micrófonos y altavoces son sus máximos representantes. Estos son denominados genericamente transductores: dispositivos que transforman sonido en electricidad y viceversa. Esta conversión de entes de naturaleza completamente distinta, se realiza acudiendo a principios electromecánicos y electromagnéticos que se discutirán cuando se estén analizando los micrófonos y posteriormente los altavoces. Los elementos de procesamiento de audio son dispositivos que alteran o modifican de alguna forma características del sonido, cuando éste está representado por una variable eléctrica. Las características que modifican son de índole variada como: amplitud, rango dinámico, respuesta en frecuencia, respuesta en el tiempo, timbre, etc. El procesamiento se lleva a cabo de manera electrónica, utilizando la tecnología de semiconductores y la tecnología digital. Fig. 61 Micrófono de propósito general Fuente: WATKINSON, John. An introduction to digital audio. Londres: Clays, 1995 122 3.1 MICRÓFONOS Los micrófonos son transductores que convierten energía sonora en energía eléctrica. Específicamente, convierten presión sonora en tensión eléctrica. Esta tensión eléctrica (convertible a una corriente utilizando un resistor) es análoga al sonido en cuanto a su forma de onda. El criterio general para determinar si un micrófono es bueno o no, es si al comparar las formas de onda de entrada (presión acústica) con las formas de onda de salida (voltaje/corriente) resultan análogas (similares en sus características en el tiempo y en la frecuencia). Los micrófonos permiten el registro, almacenamiento, transmisión y procesamiento electrónico de las señales de audio para diversas aplicaciones como amplificación y comunicación a distancia. Un micrófono consta de una cápsula que contiene un diafragma o membrana móvil. De acuerdo al desplazamiento o velocidad de desplazamiento de la membrana, se produce la conversión acústica-eléctrica. En un micrófono también existe circuitería electrónica (amplificadores, transformadores de impedancia,etc.) utilizada para procesar la señal eléctrica resultado de la conversión. La construcción y el funcionamiento de los micrófonos esta relacionado con el principio de transducción utilizado, es decir, el principio físico que gobierna la transformación de la energía acústica en energía eléctrica. Se hará a continuación una clasificación de acuerdo al principio de transducción y posteriormente se analizaran los parámetros más relevantes para la selección de un micrófono para una aplicación especifica. 3.1.1 Micrófonos de carbón Estos micrófonos fueron los primeros utilizados pero ya otro tipo de micrófonos los estan reemplazando. El micrófono de carbón está compuesto por un diafragma y por pequeños granos de carbón. Al comprimirse el diafragma debido a la presión sonora incidente, se comprimen a su vez los granos de carbón, modificando su resistencia. Este cambio en resistencia se ve reflejado por un cambio de tensión ya que la configuración diafragma- 123 carbón se comporta como un resistor variable. Las variaciones en tensión son proporcionales a las variaciones en presión. Figura 62 Micrófono de carbón Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. Se necesita una fuente interna de voltaje para traducir las variaciones de resistencia en corriente. Este tipo de micrófonos tiene una respuesta en frecuencia (la respuesta en frecuencia de un micrófono en general será analizado posteriormente) muy pobre y hoy en día se utilizan solamente en algunos tipos de teléfonos. . 3.1.2 Micrófonos piezoeléctricos Los micrófonos piezoeléctricos se basan en la propiedad que tienen los materiales piezoléctricos (efecto piezoeléctrico) de convertir torsiones, presiones y esfuerzos mecánicos en corrientes eléctricas. (piezoin=presión en griego). Los micrófonos piezoeléctricos se utilizan en aplicaciones donde es necesario captar sonidos a través de superficies duras, como mesas. Figura 63 Estructura interna de un micrófono piezoeléctrico Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. 124 La respuesta en frecuencia es superior que la de los micrófonos de carbón pero aún no tiene las características suficientes para grabaciones profesionales de voz. Fig. 64 Micrófono piezoeléctrico Fuente: BARTH, John. s.l.:s.n. 2002 <www.globalspec.com> [consulta: 20 Abr. 2005] 3.1.3 Micrófonos dinámicos Los micrófonos dinámicos funcionan de acuerdo a la ley de inducción electromagnética de Faraday. La ley de Faraday establece que un flujo magnético variable en el tiempo produce una fem (fuerza electromotriz). Esta ley es equivalente a decir que en un conductor aparece un voltaje eléctrico inducido cuando éste se encuentre en movimiento relativo respecto a un campo magnético. V=BvL donde: V:voltaje inducido(fem) [=] Voltios B:campo magnetico [=] Tesla v: velocidad del conductor [=] m/s L:longitud del conductor [=]m Los micrófonos dinámicos tienen la propiedad de generar electricidad y por eso, no necesitan de fuentes adicionales en el micrófono. 125 Existen dos tipos básicos de micrófonos dinámicos: micrófonos de bobina móvil y micrófonos de cinta (“ribbon”). 3.1.3.1 Micrófono de bobina móvil. Este micrófono consta de una bobina (móvil) que se desplaza debido a variaciones de presión en el diafragma (una membrana en la superficie del micrófono) debido a ondas sonoras incidentes. En el interior del micrófono se encuentra un imán permanente que genera un campo magnético uniforme. Los desplazamientos de la bobina (adherida al diafragma) dentro del micrófono generan voltajes proporcionales a la velocidad con que se desplaza la bobina, de acuerdo a la ley de Faraday. Entre más rápido se mueve la bobina, más voltaje (o corriente) se generará. Por esta razón también son llamados micrófonos de velocidad. Debido a que las bobinas están hechas con un número específico de vueltas, la cantidad de corriente es mayor a medida que incremente este número; un micrófono de bobina móvil generará más corriente que el micrófono de cinta con las misma velocidad de movimiento. Se utilizan potentes imanes de neodimio para aumentar la sensibilidad de este tipo de micrófonos. Figura 65 Micrófono de bobina móvil Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. Los micrófonos de bobina móvil son muy utilizados en la actualidad principalmente por su robustez que permite tener buena respuesta ante altos niveles SPL. Además debido a que están completamente inmersos en el mercado de micrófonos, resultan muy económicos. Como desventaja se debe mencionar que debido a la inercia de la bobina, es difícil que se mueva con mucha rapidez. Por lo tanto la respuesta en frecuencia para tonos agudos no es la mejor. 126 3.1.3.2 Micrófono de cinta. El micrófono de cinta es otro tipo de micrófono que funciona de acuerdo al principio de inducción de Faraday. Este micrófono responde a cambios de presión en dos lados de la cinta. Por eso, también se le conoce como micrófono bidireccional o de gradiente de presión. En el caso del micrófono de cinta, la membrana es la cinta misma, que generalmente es de aluminio. Una cinta o “ribbon” de aluminio se mueve cuando está conectado a dos polos de un imán. Debido a la inducción electromagnética una corriente se genera en el diafragma (cinta) debido a cambios de presión en ella. Figura 66 Micrófono de cinta Fuente: MARTIN, Geoff. Introduction to Sound Recording.Washington:s.n. 2004. Este tipo de micrófono es muy directivo debido a que solo responde a variaciones de presión frontales. Como ventajas adicionales se puede anotar, que debido a la delgadez de la membrana o diafragma (“ribbon”), el micrófono de cinta tiene muy buena respuesta en las altas frecuencias. Sin embargo, debido a la fragilidad de la cinta es propensa a daños y a rupturas. Además, no tiene buena respuesta en las bajas frecuencias y es muy susceptible a los sonidos de la respiración y de “handling”. Debido a que la corriente generada (inducida) es de muy poco valor, se debe utilizar un amplificador y un acople con un transformador. 3.1.4 Micrófono capacitivo El micrófono capacitivo se basa en el funcionamiento de un capacitor o condensador. Un condensador es un dispositivo formado por dos conductores (placas) que almacena energía en forma de campo eléctrico. Un condensador almacena carga cuando le es suministrado 127 una diferencia de potencial a traves de sus placas. El voltaje (diferencia de potencial) esta relacionado con la carga Q y la capacitancia C: C= Q V Cuando un condensador esta cargado, variaciones en la capacitancia implica variaciones en el voltaje. La capacitancia varía al variar la distancia entre las placas (La capacitancia solamente depende de la geometría de la configuración). Figura 67 Micrófono capacitivo Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. Cuando la presión sonora incide sobre el diafragma del micrófono, una de las placas del condensador (móvil) se mueve modificando la distancia respecto a la otra (estática). Estos cambios en la distancia producen cambios en la capacitancia y esto se traduce en cambios de voltaje. Debido a que responden directamente a los cambios de presión, son también llamados micrófonos de presión. El micrófono capacitivo requiere fuente de polarizacion (para cargar el condensador) ya que el mecanismo no permite generar electricidad, a diferencia de los micrófonos dinámicos. La fuente externa necesaria para el funcionamiento del micrófono puede provenir de una batería, pero hoy en día se utiliza un sistema denominado Phantom Power. Phantom Power es un sistema remoto de abastecimiento de energía (DC) para la polarización de los micrófonos de condensador y el funcionamiento de circuitería electrónica adicional. Los voltajes de abastecimiento varían de 11 a 54 DC y la forma de transmisión de ese voltaje se explicará en la sección de circuitos balanceados. Los micrófonos de condensador tienen muy buena respuesta en frecuencia, especialmente para las frecuencias altas. Como desventaja, se puede anotar la necesidad de una fuente 128 adicional(phantom power) para su funcionamiento y su precio. El patrón de estos micrófonos es omnidireccional. 3.1.5 Micrófonos Electret Los micrófonos Electret son un tipo especial de micrófonos capacitivos con una ventaja adicional: las placas permanecen polarizadas una vez cargadas. El efecto Electret se basa en que algunos materiales son capaces de retener la carga en la superficie, aún después de desconectados. La placa cargada Electret servirá como diafragma para el micrófono. Sin embargo, circuitería interna del micrófono (un transformador de impedancias) requiere una fuente de polarización. Generalmente utiliza “Phantom Power”. Figura 68 Micrófono Electret Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. Se realizó un bosquejo general de la clasificación de los micrófonos de acuerdo al principio de transducción. Ahora se hará una clasificación de los micrófonos de acuerdo a la forma como perciben o detectan la presión sonora. Esta forma incide directamente en el patrón de direccionalidad de ellos. 129 3.1.6 Micrófonos de presión y de gradiente de presión En un medio isotrópico como el aire, la presión sonora en un punto no depende de la dirección en que viaja una onda sonora en específico. Los transductores que responden a la presión en un punto por ende captarán (teóricamente) sonidos de cualquier dirección. Los micrófonos de presión son aquellos con la capacidad de detectar presiones sonoras, independientemente del ángulo de incidencia. Debido a esta cualidad, los micrófonos de presión son llamados omnidireccionales(omni=todo). En los micrófonos de presión, un lado del diafragma está expuesto al campo acústico donde se captará el sonido, mientras que el otro lado está encerrado en el micrófono a una determinada presión de referencia. El movimiento del diafragma está condicionado solo a cambios de presión de la parte expuesta. Es importante aclarar que lo anterior supone que un micrófono es puntual, es decir, que cualquier onda sonora cruzará ese punto, que es completamente imposible. Los micrófonos responden solamente a ondas incidentes en el diafragma frontal (la otra parte del diafragma está inmersa en el micrófono) y el patrón omnidireccional es obtenido debido a que las ondas que no son frontales se difractan alrededor del micrófono. Es decir, las ondas provenientes de todas las direcciones (frontales y difractadas) inciden en el diafragma y el micrófono las capta. Resulta que este tipo de micrófonos son sensibles a cambios de la frecuencia, volviéndose más directivos a medida que crece la frecuencia. Esto ocurre debido a que las ondas de mayor frecuencia (menor longitud de onda) se difractan menos y el micrófono interfiere con el campo acústico creando sombra acústica. En altas frecuencias, el micrófono tiene dificultad para captar sonidos posteriores. Los primeros micrófonos del mercado eran nominalmente de presión (omnidireccionales). Sin embargo, surgieron aplicaciones en que se requerían micrófonos de naturaleza direccional: que capten sonidos provenientes de algunas direcciones, mientras que ignoren de otras. De esto surge el concepto de micrófono de gradiente de presión. Los micrófonos de gradiente de presión responden a la diferencia de presión entre dos puntos A y B. 130 A B Figura 69 Diafragma de un micrófono de gradiente de presión Fuente: MARTIN, Geoff. Introduction to Sound Recording. Washington:s.n. 2004. Esto puntos (A y B) suelen ser la parte frontal y la parte trasera del diafragma. Nótese que en los micrófonos de presión, la parte trasera del diafragma está aislada del campo acústico y por lo tanto la presión es constante en ese punto. Por eso los micrófonos de presión detectan presión absoluta en una sola parte del diafragma (la parte expuesta al campo acústico). En cambio, en los micrófonos de gradiente de presión ambas partes del diafragma están expuestas al campo acústico y por lo tanto sujetos a cambios de presión. Supongamos que una onda incide paralelamente al plano del diafragma. Por simetría, existirán iguales componentes de presión a ambos lados y la presión neta diferencial (gradiente) es cero, por lo cual el micrófono no detectará ese sonido. Por esta razón, el patrón de sensibilidad espacial en este tipo de micrófonos es la de un ocho (bidireccional).Nótese en la figura que para incidencias paralelas al plano (90°, 270°), no existe respuesta por parte del micrófono. 0° 90° 270° 180° Figura 70 Patrón bidireccional de un micrófono de gradiente de presión Los micrófonos de gradiente de presión también son sensibles a cambios en la frecuencia. Cuando una onda de una determinada frecuencia incide sobre uno de los dos puntos del diafragma, digamos A, la onda tendrá una presión determinada en A y otra presión determinada en B. La diferencia de estas presiones está caracterizada por la fase relativa de 131 la onda entre ambos puntos. A medida que la frecuencia aumenta, la fase relativa aumenta y la diferencia de presión también. Una variedad de micrófonos se pueden obtener al superimponer las características de los micrófonos de presión con las características de los micrófonos de gradiente de presión y será explicado posteriormente cuando se estudie la direccionalidad. 3.1.7 Parámetros en los micrófonos Ahora se analizarán algunos parámetros relevantes de los micrófonos: sensibilidad, direccionalidad, ruido, impedancia, , distorsión y conexión. 3.1.7.1 Sensibilidad. La sensibilidad de los micrófonos es uno de los parámetros más importantes pues definen la respuesta ante los niveles de presión sonoro existentes y la eficiencia en la transducción ya estudiada. En general el proceso transducción permite obtener una salida de tensión (o corriente en algunos casos) a partir de una entrada de presión (acústica). La sensibilidad determina la relación que hay entre la tensión y la presión. S= V P donde S: sensibilidad del micrófono [=]voltios/Pa V: voltaje o tensión producida [=] voltios P: presión incidente [=] Pa La expresión de la sensibilidad en decibeles exige una referencia de sensibilidad Sref=1 V V/Pa: Pa 132 SdB=20log( S ) S ref Un micrófono es más sensible a medida que S es mayor. Sin embargo, debe aclararse que las tensiones de salida suelen ser demasiadas pequeñas y se deben utilizar preamplificadores para que éstas puedan ser tratadas con mayor facilidad. Debido a distintos factores, algunos analizados cuando se miraron los principios de transducción, la sensibilidad cambia para distintos valores de frecuencia. Por eso es útil representar la sensibilidad (en dB) en función de la frecuencia. El resultado es denominado respuesta en frecuencia del micrófono. Figura 71 Respuesta en frecuencia de un micrófono Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. Para los micrófonos en general, se define la frecuencia inferior de la respuesta en frecuencia como la frecuencia por debajo de la cual la sensibilidad cae 3dB. Similarmente, la frecuencia superior se define como la frecuencia por encima de la cual la sensibilidad cae 3dB. Con el conocimiento de la frecuencia inferior y la frecuencia superior de un micrófono (respecto a su respuesta en frecuencia), se puede saber a groso modo cual micrófono es mejor para determinada aplicación . La diferencia entre la frecuencia superior y la frecuencia inferior es llamada ancho de banda. En general, los micrófonos sufren cierta caída en sensibilidad cuando la frecuencia es superior a los 10KHz debido a sombras acústicas generadas por el micrófono. Esto ocurre 133 porque las longitudes de onda a esas frecuencias son comparables con el tamaño del micrófono. 3.1.7.2 Direccionalidad y patrones direccionales. La direccionalidad en el contexto de los micrófonos es la capacidad que tienen éstos para captar sonidos provenientes de distintos ángulos (también llamado sensibilidad espacial.) La sensibilidad máxima está limitada por la sensibilidad propia o natural del micrófono. Los patrones direccionales dependen si el micrófono es de presión o de gradiente de presión. A cada patrón direccional se asocia un patrón polar, una gráfica polar que indica como varía la sensibilidad con la dirección de procedencia del sonido, respecto a la sensibilidad máxima. La grabación de sonido requerirá determinado patrón según sea la aplicación. Existen básicamente dos tipos de patrones: direccional: captación del sonido proveniente de algunas direcciones (asociados a micrófonos de gradiente de presión). Se deben utilizar cuando se quiera reducir el ruido de fondo y para captar sonidos lejanos. omnidireccional: captación del sonido proveniente de cualquier dirección (asociados a micrófonos de presión). Son particularmente útiles cuando se quiere grabar la acústica ambiental. Obviamente, existen patrones intermedios resultado de la combinación de patrones direccionales y omnidireccionales, y para clasificarlos, se usa la siguiente ecuación polar (normalizada) que representa el patron direccional general para un micrófono: r=A+Bcosφ donde r: distancia de un punto perteneciente al patron polar al origen A,B: constantes tal que A+B=1 Utilizando el hecho que A+B=1, se pueden lograr en teoría infinitos patrones polares direccionales entre los cuales se destacan: 134 A=1, B=0 r=1 (patrón omnidireccional) Esta figura polar es una circunferencia pues puede captar el sonido desde cualquier dirección de incidencia. A=0, B=1 r=cosφ (patron bidireccional) Esta figura polar es referida comunmente como “figura ocho” por su semejanza con el número. El lóbulo frontal y posterior indican que los micrófonos con este patrón captan sonidos en la dirección del eje del micrófono, e ignoran sonidos que inciden perpendicularmente. (90° y 270°). Esta figura se vio cuando se analizaron micrófonos de gradientes de presión. A=B=0.5 r=0.5+0.5cosφ (patron unidireccional) Esta figura polar se conoce como cardioide. Los cardioides son sensibles a los estímulos sonoros en un rango amplio al frente del micrófono, pero relativamente insensibles a los sonidos detrás del mismo. A=0.375, B=0.675 r=0.375+0.675cosφ (patron unidireccional con lóbulo trasero) Esta figura polar se conoce como supercardioide. El supercardioide es mas direccional que el patrón sensitivo del cardioide. Cuando este tipo de micrófono es apuntado hacia una fuente sonora la interferencia de los sonidos fuera del foco de percepción es eliminada. A=0.25, B=0.75 r=0.25+0.75cosφ (patron unidireccional con lóbulo trasero pronunciado) Esta figura polar se conoce como hipercardioide). El patrón es aún mas direccional que los anteriores y por lo tanto micrófonos con este patrón sirven para captar sonidos distantes. 135 a) omnidireccional b) cardioide c) supercardioide d) hipercardioide e) bidireccional Figura 72 Patrones polares de direccionalidad A los patrones polares se asocian algunos parámetros que de forma distinta, evalúan las características direccionales de ellos con respecto a un patrón polar omnidireccional. Ángulo de Captura (Acceptance angle): Describe el ángulo desde el cual un micrófono es capaz de captar sonidos a una sensibilidad específica, por ejemplo –3dB. Angulo para salida=0: Es el ángulo de incidencia para el patrón en el cual la atenuación se hace infinita. REE(Random Energy Efficiency): Se define como la cantidad de ruido ambiente que capta el micrófono en relación a lo que captaría un micrófono omnidireccional a la misma distancia y con la misma sensibilidad ( se indica en dB ). DF(Distance Factor): Es un parámetro que cuantifica cuanto debemos alejar un micrófono para que capte la misma relación de sonido directo respecto a ruido ambiente teniendo como referencia a un micrófono omnidireccional colocado a un metro de la fuente. Estas características se resumen a continuación en una tabla para los diversos patrones polares estudiados. 136 Tabla 6 Características direccionales de diversos patrones Omnidireccional Cardioide Supercardioide Hipercardioide Bidireccional r=1 r=0.5+0.5cosa r=0.375+0.625cosa r=0.25+0.75cosa r=cosa 131° 115° 105° 90° para ______ 180° 126° 110° 90° REE (dB) 0 -4.8 -5.7 -6 -4.8 DF 1 1.7 1.9 2 1.7 Patrón Polar Ecuación Ángulo de ______ Captura(-3dB) Angulo salida =0 Fuente: MARTIN, Geoff. Introduction to Sound Recording. Washington:s.n. 2004. Para determinar el patrón direccional de un micrófono se realizan ensayos en una camara anecoica (sin ecos) y una fuente sonora emitiendo un sonido de una frecuencia determinada. Teniendo el micrófono completamente en frente de la fuente sonora (ángulo de 0° de incidencia) se toma la tensión generada por el micrófono. Esta tensión se denomina tensión de referencia y se le asocia un valor de 0dB. Después se va rotando el micrófono para obtener la tensión de salida del micrófono para distintos ángulos. Estos valores son atenuados respecto a la tensión de referencia y por lo tanto representan valores negativos dB. Este proceso se repite para varias frecuencias para obtener el patrón polar completo. Existe un efecto de considerable importancia que se presenta en los micrófonos direccionales. Cuando la fuente sonora está a unos milímetros de la cápsula (como cuando cantantes o locutores ponen sus labios en el micrófono), las frecuencias bajas tienden a amplificarse. Este efecto se conoce como efecto de proximidad, en el cual se incrementa la sensibilidad del micrófono respecto a las bajas frecuencias. Aunque en general este efecto es indeseable (pues “colorea” el sonido al amplificar alguna región del espectro), algunos cantantes masculinos aprovechan este efecto para que su voz suene mejor. 137 3.1.7.3 Ruido. El ruido en el caso más general, es la presencia de una señal no deseada. En los micrófonos existen dos tipos de ruido principalmente que deben minimizarse o controlarse: el ruido acústico y el ruido eléctrico. El ruido acústico proviene del ambiente y es muy difícil eliminarlo e imposible eliminarlo por completo. Una solución es utilizar micrófonos directivos de tal forma que no capten todo el ruido (ya que el ruido ambiental es omnipresente) y concentrarse en el elemento a grabar. El ruido eléctrico se puede definir como potencia eléctrica no deseada. Es un elemento intrínseco de la construcción del micrófono y está presente cuando no hay señal externa para excitarlo. La medida de este ruido se realiza en una cámara anecoica. Esta medida se expresa como si el ruido fuese una señal sonora generando una tensión de salida. El ruido se puede disminuir escogiendo un micrófono con baja impedancia y que contenga en su interior circuitería electrónica muy refinada. (El ruido eléctrico para un micrófono de 100ohms es mínimo de .18microvoltios, debido al ruido térmico de los electrones en un circuito). El ruido eléctrico debe hacer parte de las especificaciones de un micrófono pero el ruido ambiental no, pues no es atribuible al micrófono. El parámetro utilizado para especificar el ruido de un micrófono es la relación señal a ruido S/RdB=20log( señal ) ruido 3.1.7.4 Impedancia. La impedancia de un micrófono es la resistencia que opone el micrófono al paso de la tensión. No se debe confundir con la impedancia acústica que es un parámetro del medio. La impedancia de un micrófono es una caracterísitica eléctrica cuando se considera al micrófono como un circuito o parte de un circuito. Se mide en ohms y los micrófonos están clasificados por baja, alta y muy alta impedancia. Lo-Z Baja impedancia (alrededor de 200 Ohm) Hi-Z Alta impedancia (1 K o 3 K e incluso 600 Ohm) Muy alta impedancia (más de 3 K). Esta viene a convertirse en una característica importante del micrófono cuando se requiere conectar éste a un preamplificador o a una mesa de mezcla. El preamplificador o la mesa 138 de mezcla tienen asociados una impedancia llamada impedancia de carga de entrada. Esta es la impedancia que va a “ver” el micrófono cuando se conecte. + V - Zmic Zentrada + Vamp - Figura 73 Equivalente circuital de un micrófono conectado a un amplificador Sea V el voltaje o tensión generado por el micrófono, Zmic la impedancia del micrófono, Zentrada la impedancia de carga de entrada del amplificador, y Vamp el voltaje efectivo que aparece en el amplificador. Estos parámetros están relacionados mediante el siguiente divisor de tensión: Vamp=V Zentrada Zmic + Zentrada El objetivo es que Vamp sea lo más parecido a V para que no haya pérdidas. (aunque siempre va a ser un poco menor según la ecuación anterior). La forma de mejorar esta situación es haciendo que Z entrada sea considerablemente mayor (de 3 a 10 veces) que Zmic. En el caso que se utilice un cable para conectar el micrófono a distancia, la impedancia del cable (modelado como una resistencia más) es agregada a la impedancia que ve el micrófono al conectarlo. Si el micrófono es de alta impedancia, las pérdidas por la longitud del cable son muy grandes, aumentado a medida que crece la distancia entre el micrófono y la mesa o amplificador. Esta es una de las razones por la cual se prefieren los micrófonos de baja impedancia. Para disminuir la impedancia se utiliza transformadores de impedancia que son amplificadores de corriente. Si la corriente incrementa, la razón voltaje sobre corriente (resistencia o impedancia) disminuye. Esto es comunmente utilizado en micrófonos capacitivos. La salida de la cápsula (que contiene el condensador) ingresa a un transformador de impedancias (amplificador de corriente) para reducir la impedancia a unos pocos cientos de ohm. 139 Otra razón para preferir los micrófonos de baja impedancia es que son menos susceptibles al ruido pues el ruido inherente a los sistemas eléctricos (ruido térmico) aumenta cuando las resistencia aumenta. 3.1.7.5 Distorsión. La distorsión es una especificación que cuantifica cuanto se deforma una onda. Una onda (por ejemplo senoidal) se deforma cuando aparece cierta cantidad de armónicos. Aunque todas las señales sonoras son complejas y contienen un determinado número de armónicos, los micrófonos tienden a agregar aún más, modificando la onda original. Esto no es deseable pero es imposible eliminarla por completo. La distorsión está asociada también al nivel de presión sonora pues a niveles altos, la onda tiende más a deformarse por saturación de los sistemas eléctricos (micrófonos, amplificadores, parlantes). La distorsión se expresa mediante la siguiente expresión (distorsión armónica total): THD= f2 2 + f32 + ...fn 2 x100% f12 donde f1 es el valor eficaz de la componente fundamental y f2, f3 y siguientes son los valores eficaces de los armónicos. Básicamente la THD indica cuanto porcentaje de la señal está contenida en los armónicos. La especificación de THD se suele dar asociada con el máximo nivel de presión sonora (NPS). Una especificación podría ser: THD: 0.5% a 120dB NPS 3.1.7.6 Conexión. La conexión de los micrófonos no es un parámetro intrínseco del micrófono en sí, pero si afectará su rendimiento general en la cadena de audio. Existen dos formas básicas de conexión: conexión simple o no balanceada y conexión balanceada. La conexión no balanceada consiste en dos cables conductores que unen al micrófono con el amplificador. Un cable está a potencial eléctrico 0 (se dice también que está conectado a masa) y por el otro viaja la señal eléctrica alterna producto de la transducción del micrófono. Para minimizar el ruido de captación por efecto antena, uno de los cables rodea 140 al otro creando una malla o blindaje electrostático. Sin embargo, este tipo de conexión sigue siendo susceptible al ruido pues por el ruido se añade al cable que lleva la seña. El otro tipo de conexión es la conexión balanceada que utiliza tres conductores en vez de dos. Uno de los conductores está conectado a masa (potencial 0) y un segundo conductor lleva la señal. Ahora, un tercer conductor lleva también señal pero con polaridad opuesta. El ruido se adiciona de forma aproximadamente igual a ambos conductores con señal, suponiendo que la fuente de ruido se encuentra a la misma distancia que ambos conductores. Los conductores llegan al equipo y se encuentra con un amplificador diferencial, que amplifica la diferencia entre las señales de los dos conductores. El resultado es que el amplificador duplica la señal y elimina el ruido. El proceso se esboza en la siguiente tabla. Tabla 7 Conexión balanceada Conductor 1: S+R Salida del amplificador: Conductor 2: -S+R S+R-(-S+R)=2S Fuente: WATKINSON, John. An introduction to digital audio. Londres: Clays, 1995 La señal balanceada se desarrolló para solucionar el problema del ruido captado por los cables que conectan equipos. Este tipo de cables son llamados XLR. 3.1.7.7 Phantom Power. Algunos micrófonos, como los capacitivos necesitan de una fuente externa para el mecanismo de transducción. Esta fuente remota llamada fantasma (phantom) se utiliza en micrófonos con conexión balanceada.. La fuente remota (fantasma) generalmente está ubicada en la mesa de mezcla o consola. Se utilizan tres cables conductores de tal forma que un conductor está conectado a tierra y los otros dos llevan la señal de audio. Adicional, a la señal de audio, estos dos conductores llevan un voltaje idéntico de DC respecto a tierra. Se llama fantasma porque va en la misma línea que la señal de audio. Los cables entonces sirven para dos propósitos: entregan la señal captada por el micrófono a la consola y entrega energía desde la consola hasta el micrófono. Los micrófonos dinámicos, debido a que no necesitan alimentación externa para generar tensión, simplemente ignoran este voltaje siempre y cuando también tengan conexión 141 balanceada. Los voltajes nominales más utilizados son 12V, 24V y 48V para el voltaje DC “fantasma”. 3.1.8 Micrófonos para aplicaciones Para algunas aplicaciones específicas, se deben tener en cuenta aspectos dimensionales y geométricos además de otros aspectos discutidos anteriormente. Es por eso que existe una variedad de micrófonos en el mercado que según su tamaño y forma, son más convenientes para una situación determinada. Micrófono de Lavaliere: Son los micrófonos comunmente utilizados en presentaciones y locuciones. Los más famosos son los micrófonos de clip o de corbata. Figura 74 Micrófono de Lavaliere Fuente: BARTH, John. s.l.:s.n. 2002 <www.globalspec.com> [consulta: 20 Abr. 2005] Micrófono de cañón: Son utilizados en locaciones de producción de películas para captar sonidos a distancia de la cámara. Figura 75 Micrófono de cañón Fuente: BARTH, John. s.l.:s.n. 2002 <www.globalspec.com> [consulta: 20 Abr. 2005] 142 Micrófonos de contacto: Son micrófonos que están directamente en contacto con la fuente sonora. Estos micrófonos se encuentran generalmente montados en instrumentos musicales. Figura 76 Micrófono de contacto Fuente: BARTH, John. s.l.:s.n. 2002 <www.globalspec.com> [consulta: 20 Abr. 2005] Micrófonos Parabólicos: Un micrófono parabólico es una configuración de un micrófono y un reflector parabólico utilizado para concentrar el sonido en el micrófono. Es utilizado generalmente para la cobertura de eventos deportivos. Figura 77 Micrófono parabólico Fuente: BARTH, John. s.l.:s.n. 2002 <www.globalspec.com> [consulta: 20 Abr. 2005] Micrófonos Inalámbricos: Estos micrófonos incorporan una antena transmisora de radio frecuencias para utilizar el micrófonos a distancias moderadas y grandes sin necesidad de cables. Figura 78 Micrófono inalámbrico Fuente: BARTH, John. s.l.:s.n. 2002 <www.globalspec.com> [consulta: 20 Abr. 2005] 143 3.2 ALTAVOCES Los altavoces son los dispositivos duales a los micrófonos: convierten la energía eléctrica nuevamente en energía acústica. Los altavoces son también denominados altoparlantes o simplemente parlantes. En general, estos constan de un mecanismo para convertir la energía eléctrica en energía mecánica ( de movimiento) y otro mecanismo para convertir los movimientos en sonido para su propagación en el aire. En la cadena de audio, los altavoces son considerados como el elemento más delicado para la reproducción fiel del sonido. Esto debido a la cantidad de parámetros que se deben manejar que incluyen: direccionalidad, sensibilidad, impedancia. Los altavoces en teoría deben ser capaces de reproducir todo el espectro de audición humana que abarca desde 20Hz hasta 20kHz (longitudes de onda desde 1.7cm hasta 17 m). Además deben reproducir todo tipo de sonidos, música, voz humana con la máxima calidad posible. Esto no siempre es posible con un solo tipo de altavoz por lo que, al igual que los micrófonos, se escogen altavoces de acuerdo a la aplicación específica. En esta sección se tratarán las características más importantes de los altavoces y también las cajas acústicas que son los recintos donde se ubican los altavoces. (Algunos autores consideran la caja acústica como parte del altavoz pero aquí se analizará por aparte). 3.2.1 Clasificación de los altavoces (mecanismo de transducción) Los altavoces se pueden clasificar de acuerdo a su mecanismo de transducción al igual que los micrófonos. Esta clasificación está directamente relacionada con el rango de frecuencias que puede manejar dicho altavoz. Los mecanismos de transducción más comunes en los altavoces son: electrodinámico: excitación por movimientos debido a fuerzas magnéticas electrostático: excitación por atracciones electrostáticas piezoeléctrico: excitación por efecto piezoléctrico 144 3.2.1.1 Altavoz de bobina móvil. Los altavoces más comunes son los de bobina móvil (generalmente denominados como altavoces dinámicos) cuyo mecanismo de transducción es electrodinámico. El altavoz esta constituido por un circuito magnético y un cono o diafragma. Figura 79 Corte transversal de un altavoz de bobina móvil Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. El circuito magnético está conformado básicamente por: un imán permanente, una bobina móvil, y un entre hierro. En el entrehierro se aloja la bobina, sobre cual existe un poderoso campo magnético. Cuando circula corriente magnética por la bobina (corriente proveniente por ejemplo de un micrófono), se genera una fuerza magnética debido a la interacción de esta corriente con el campo magnético (Ley de Biot-Savart). El movimiento de la bobina se transmite al cono o diafragma. El cono, hecho generalmente de cartón, está suspendido mediante unas cuerdas elásticas para mantener su posición de reposo. Todas las movimientos de la bobina debido a la fuerza magnética variable se convierten en movimientos y vibraciones en el cono al cual está sujeta. Esta es la parte mecánica del altavoz y los movimientos son el efecto motor o excitador del altavoz. Dicho cono actúa como pistón impulsando el aire hacia afuera o hacia dentro, dependiendo de la polaridad de la corriente aplicada a la bobina. El proceso de impulsión de aire es que en ultima instancia 145 genera la propagación del sonido. Esta estructura se conoce como un altavoz de radiación directa pues está expuesta al aire sin algún tipo de caja acústica. Los altavoces de bobina móvil son útiles para reproducir sonidos de bajas frecuencias así como sonidos con grandes niveles de presión sonora. Una ventaja de este tipo de altavoces es que son robustos y por lo tanto resistentes al mal trato. Su construcción es relativamente fácil y son económicos. Debido a la inercia del cono, los sonidos de alta frecuencia son difíciles de producir pues requieren movimientos rápidos del cono. Además, el cono deja de vibrar como un todo y pasa a ondularse, es decir, algunas partes del cono vibran con una polaridad y otras con otra polaridad. Esto resulta en una cancelación parcial de la onda y la energía sonora efectiva radiada será menor para altas frecuencias. Para solucionar este inconveniente, en altas frecuencias se utiliza una variante de la estructura denominada “compression driver” o excitador de compresión, que evita las cancelaciones del sonido y mejora la respuesta en frecuencia. . Esto se logra modificando la geometría del diafragma de cono a forma de cúpula. Así se mejora significativamente los movimientos al disminuir la inercia del diafragma. Además incorpora otro elemento denominado un corrector de fase que permite compensar las diferentes distancias que debe recorrer el sonido desde el diafragma hasta la garganta del excitador, y de esta forma evitar las cancelaciones del sonido. El excitador genera presiones elevadas que luego son llevadas a una bocina. La bocina actúa como un adaptador de impedancia acústica o acople entre el excitador y el aire ambiental y permite la obtención de mayor direccionalidad. 3.2.1.2 Altavoz de cinta o membrana metálica. Los altavoces de cinta o membrana metálica funcionan de acuerdo al mismo principio de transducción electrodinámica que los altavoces de bobina móvil. Se suspende una lámina de aluminio en un campo magnético. Al pasar una corriente (AC) a través de la membrana, se genera una fuerza magnética que hará que la membrana se mueva dependiendo de la polaridad de la corriente. En esta configuración, la membrana es el mismo diafragma para el altavoz (excitador). Debido a la pequeña masa asociada a la membrana, esta configuración es útil para reproducir altas frecuencias pues la inercia es pequeña. Sin embargo, la construcción es delicada pues la 146 membrana en sí es muy frágil. Además, la impedancia de la membrana es muy pequeña (debido a que es metálica) y se necesitaría un transformador de impedancias. Figura 80 Altavoz de cinta Fuente: MARTIN, Geoff. Introduction to Sound Recording. Washington:s.n. 2004. 3.2.1.3 Altavoz electrostático. El altavoz electrostático utiliza la fuerza electrostática como elemento motor y excitador. La fuerza electrostática es la fuerza que experimentan las cargas eléctricas debido presencia de otras cargas. El sistema consta de tres placas conductoras, una de las cuales está cargada con un voltaje positivo de polarización (DC) y está libre para moverse entre dos placas. Las otras dos placas que son fijas están conectadas a la salida de audio (tensión de AC). entrada de audio (A.C.) Figura 81 Estructura de una altavoz electrostático Fuente: MARTIN, Geoff. Introduction to Sound Recording. Washington:s.n. 2004. A medida que cambia la tensión entre las placas debido a la naturaleza variable de AC, la placa intermedia se mueve debido a fuerzas electrostáticas. Debido a que el voltaje de las 147 placas fijas cambia en el tiempo, el movimiento de la placa móvil es alternadamente hacia la derecha y hacia la izquierda, produciendo compresiones y rarefacciones que se traducen en la propagación del sonido. Este esquema de transducción permite reproducir una buena gama de frecuencias del espectro. Debido a que el diafragma (placa móvil) es delgado, se pueden obtener movilidades grandes (buena velocidad de respuesta) necesario para reproducir frecuencias altas. También tiene poca distorsión armónica comparada con los otros tipos de altavoces. Como desventajas se debe anotar que se necesitan voltajes extremadamente altos (miles de voltios) para su polarización. Además resultan ser costosos comparados con los otros altavoces. 3.2.1.4 Altavoces piezoeléctricos. Los altavoces piezoeléctricos basan su funcionamiento en el efecto piezoeléctrico: deformaciones en materiales piezoeléctricos cuando se aplica tensión entre las caras del material (Nótese que el efecto piezoeléctrico también fue aprovechado para algunos micrófonos, pero en dirección inversa: deformaciones crean tensiones). El altavoz piezoeléctrico es utilizado en aplicaciones donde se requieren reproducir exclusivamente tonos agudos. 3.2.2 Cajas acústicas Las cajas acústicas o bafles son los recintos donde están ubicados los altavoces. Cumple tres propósitos principalmente: - mejorar la respuesta en frecuencia - mejorar la eficiencia de la energía sonora radiada - facilitar la maniobrabilidad y proteger a los altavoces En lo que sigue, se tomará como ejemplo el altavoz de bobina móvil de radiación directa. En este altavoz ambos lados del diafragma o cono está expuesto al ambiente. Cuando se produce un movimiento del cono hacia adelante se produce una compresión de aire delante del cono, pero en la parte posterior se produce una descompresión. Esta configuración se 148 denomina dipolo acústico. El dipolo acústico crea una onda sonora en la parte delantera y otra en la parte trasera pero con presiones positiva y negativa respectivamente (equivalente a tener fase inversa). Esta situación crea cancelación de las ondas debido a la superposición de ambas (positiva y negativa) en algunos puntos del espacio. Figura 82 Fenómeno del corto acústico Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. Se puede observar que hacia los lados del altavoz se produce interferencia destructiva entre las ondas sonoras generadas por el frente y las generadas por la parte posterior. El fenómeno se denomina corto acústico. Este fenómeno ocurre para las longitudes de onda suficientemente grandes para que puedan bordear el altavoz, o cualquier superficie donde éste se coloque. Esto disminuye el rendimiento sonoro y crea un patrón direccional irregular. Por esta razón se deben agregar bafles(cajas acústicas) al altavoz para corregir el problema. Sin embargo, al meter el altavoz en la caja surge un problema adicional pues la onda creada en la parte interior(parte posterior del diafragma) puede ser reflejada en la parte posterior del bafle y encontrarse con la onda exterior(parte frontal del diafragma). La suma de estas dos ondas genera distorsión y se compromete la fidelidad de los sonidos que se quieren reproducir. Existen varios tipos de bafles tanto para corregir el problema del corto acústico como para afrontar otros problemas. Se explicarán a continuación haciendo énfasis en los problemas que corrigen así como sus limitaciones. 3.2.2.1 Bafle infinito. El bafle infinito es un bafle simple que consiste en montar el altavoz al ras de una pared sobre un agujero perforado en ésta. De esta forma, las ondas de 149 compresión y descompresión no podrán mezclarse. La ventaja de este sistema es el evitar el corto acústico y por lo tanto ampliar el rango de frecuencias bajas. Figura 83 Bafle infinito De hecho, la frecuencia de corte inferior (bajas frecuencias) está relacionada con el diámetro del diafragma: fc= c πD c: velocidad del sonido D: diámetro del diafragma Si se aumenta el tamaño del diafragma, se puede disminuir la frecuencia de corte lo que es deseable para ampliar el espectro que puede reproducir el altavoz. Sin embargo, con un bafle infinito se desperdicia la energía sonora irradiada detrás del diafragma (la parte que está montada sobre la pared). 3.2.2.2 Bafle sellado. El bafle sellado es el tipo de caja más básico. Consiste en una caja cerrada llena de material absorbente. El objetivo es anular la onda que se genera en el interior de la caja. Figura 84 Caja sellada Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. 150 Como ventajas se puede decir que la pendiente de atenuación de la respuesta no es muy pronunciada(suave descenso) y la respuesta temporal es satisfactoria. El recinto cerrado tiene varios inconvenientes además del poco rendimiento (la radiación posterior es convertida a calor y a vibraciones al ser absorbida). Por un lado, se producen en el interior ondas estacionarias al coincidir las dimensiones del recinto con la mitad de la longitud de onda (condición de onda estacionaria). Además el aire contenido en la caja actúa como un muelle y a grandes niveles SPL, el sonido se distorsiona. Como desventaja adicional se debe anotar que la frecuencia de corte no es muy baja y para reproducir bajas frecuencias se deben utilizar bafles muy grandes. 3.2.2.3 Bafle “Bass-reflex”. Este tipo de caja está especialmente diseñada para reforzar los bajos. Es el tipo de caja más extendido, junto a la caja sellada. El bafle consiste de una caja cerrada parcialmente llena de material absorbente, pero con un tubo con salida al exterior. Este tubo actúa como una resistencia entre el aire del interior y del exterior y permite orientar el sonido proveniente de la parte posterior del diafragma de tal forma que no se produzca cancelación sino refuerzo de las bajas frecuencias. Figura 85 Caja “Bass-reflex” Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. La configuración con el agujero actúa como el resonador Helmholtz, que produce sonido cuando es convenientemente excitado. La frecuencia de resonancia es directamente proporcional a la superficie del tubo e inversamente proporcional al volumen de aire en la caja. Para lograr la máxima efectividad, se debe hacer coincidir la frecuencia de resonancia 151 del altavoz con la frecuencia de la caja. Esto se puede hacer o variando el volumen de aire en la caja, o modificando la superficie del tubo (este último procedimiento es el más utilizado). La caja bass-reflex tiene como característica principal su buen rendimiento en graves, causado por una frecuencia de corte menor que en las cajas selladas y su capacidad para manejar grandes SPL sin distorsión. Sin embargo tiene el problema que la pendiente de atenuación de su respuesta es muy alta: 18-24dB/Oct. La respuesta temporal no es demasiado buena. 3.2.2.4 Caja con radiador pasivo. Es una variante de la caja bass-reflex. Fue inventado por Celestion. Consiste en una caja “bass-reflex” en la que se ha sustituido el tubo o agujero por un radiador pasivo. Un radiador pasivo es un altavoz adicional, pero sin imán y sin bobina(por eso es pasivo). Sólo tiene el chasis, la suspensión y el diafragma. Figura 86 Bafles comerciales con sistema de radiador pasivo Fuente: SAKE, Rudy. s.l.:s.n. 2003 <www.bafflemania.com> [consulta: 20 Abr. 2005] Para hacer que el radiador pasivo ofrezca la misma resistencia al aire que el tubo de un sistema bass-reflex, se le añade una masa al altavoz pasivo. Su misión es reforzar los graves que se crean en el interior de la caja. Este refuerzo se hace de una manera más exacta que en los bafles bass-reflex pues en estos últimos el aire se mueve de manera descontrolada mientras que el radiador pasivo depende de la masa que es un parámetro más exacto y 152 confiable. La distorsión para bajas frecuencias es menor que para el bass-reflex. El bafle con radiador es considerablemente más caro. 3.2.2.5 Caja ELF. ELF es un acrónimo de Extended Low Frequency. Son utilizadas específicamente para trabajar a frecuencias menores que la frecuencia inferior donde el nivel SPL ha caído 3dB. Esto significa que esa frecuencia, que generalmente es una frecuencia inferior, se convierte en una frecuencia superior pues solo interesa la banda de frecuencias menor a ella Debido a ésto, se pueden hacer bafles de tamaño sumamente reducido(el subwoofer de Bang&Oluffsen es un ejemplo, un cubo de 25-30 cm de lado), pagando el precio de incrementar la potencia necesaria para el funcionamiento. El elemento básico del sistema ELF es un integrador que predice el comportamiento del altavoz a frecuencias bajas y mejora la respuesta en frecuencia. Otra ventaja es que la eliminación de la onda producida por la parte trasera se produce por la propia elasticidad del aire. Figura 87 Bafles comerciales con sistema ELF Fuente: SAKE, Rudy. s.l.:s.n. 2003 <www.bafflemania.com> [consulta: 20 Abr. 2005] Los inconvenientes son serios: al reducir el SPL a -12dB/oct, el nivel para la corrección debe ser muy fuerte. Se deben utilizar amplificadores de potencia con valores muy elevados. Además existen serias limitaciones por desplazamiento de la membrana, pues las excursiones para baja frecuencia deben ser mayores y se genera mucha distorsión. 3.2.2.6 Cajas Paso banda o de carga simétrica. Las cajas Paso banda consisten en una caja con una pared interior donde está el “woofer” (altavoz especialmente diseñado para 153 bajas frecuencias). En uno de los lados hay una sub-caja “bass-reflex” y en el otro, puede haber una bass-reflex o una caja sellada. Figura 88 Caja de carga simétrica Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. Se han hecho muy populares últimamente, sobre todo en los sistemas Home Cinema, que constan de un “sub-woofer” (en caja paso banda) y cinco satélites de agudos y medios. El problema de estos sistemas es la baja consistencia del sonido, sobre todo en espacios grandes, donde no se llega a percibir homogeneidad en el sonido. Este tipo de caja sólo deja salir el sonido por el conducto. Un efecto no deseable es que la caja actúa como un resonador de Helmholtz, y por lo tanto sintoniza una única frecuencia que se destaca de las otras. Otros inconvenientes son la eficiencia baja y la respuesta temporal (la señal sufre retrasos muy altos) 3.2.2.7 Caja laberinto. La caja laberinto consiste en un tubo largo lleno de material absorbente. El material absorbente elimina la onda en el interior del tubo. Este tubo o caja guía la onda (que se comporta como onda plana) de tal forma que no se generen ondas estacionarias y así evitando coloraciones y brindando mejores respuestas para las bajas frecuencias. Sin embargo, a niveles SPL suficientemente altos si existirá reflexión y por tanto algunas ondas estacionarias. Como criterio de diseño, la longitud del tubo debe ser aproximadamente igual a ¼ de la longitud de onda de Fc, la frecuencia de resonancia, para que no se cancele la onda sino que se refuerce. 154 Como ventajas, se puede decir que el diseño de la caja permite anular, por lo menos teóricamente, las resonancias. Tiene buena respuesta en frecuencia, especialmente respecto a los graves. También, el laberinto al tener un único punto de emisión sonora evita interacción con el recinto. Una desventaja es que las cajas de laberinto son sumamente grandes y tienen muchos materiales y estructuras complejas en su interior. Figura 89 Caja laberinto Fuente:PATTON, Todd. s.l.:s.n. 1999 <www.pcpaudio.com/pcpfiles > [consulta: 20 Abr. 2005] 3.2.2.8 Caja “Línea de TX”. Esta caja recibe su nombre debido a la analogía con líneas de TX: líneas que transportan energía eléctrica o información con la menor pérdida posible. Este tipo de cajas son las mejores que existen para preservar la cualidad del sonido, pero su construcción es muy laboriosa. Figura 90 Caja de línea de Tx Fuente:PATTON, Todd. s.l.:s.n. 1999 <www.pcpaudio.com/pcpfiles > [consulta: 20 Abr. 2005] 155 El mecanismo básico de estas cajas es hacer que la onda delantera producida por el diafragma entre en fase con la onda trasera de tal forma que el sonido se refuerce. Esto se controla mediante la longitud de la línea o tubo para controlar los desfases dependiendo de la frecuencia. A una fase o retardo determinado, la onda trasera refuerza el sonido de la onda delantera. Esta configuración tiene muchas ventajas: - no existen resonancias por ondas estacionarias - la pendiente de atenuación es tan solo de 6dB/octava - genera poca distorsión para niveles SPL elevados - la respuesta temporal es buena - tiene buena respuesta en frecuencia para los bajos La desventaja más notoria como se había indicado anteriormente es que la construcción requiere de muchos materiales, además del tamaño de la caja que la hace poco comercializable. Ahora se hará una breve mirada a los materiales más comunmente utilizados en la fabricación de cajas acústicas. 3.2.3 Materiales de las cajas El material de las cajas es un parámetro importante pues influye directamente en la calidad de la caja para la reproducción del sonido que genera el altavoz. Algunas características que se tienen en cuenta en el material son la densidad, el grosor, y rigidez. Históricamente se han utilizado solo una poca cantidad de materiales pero han dado buenos resultados. Estos materiales son: - Aglomerado - MDF - Contrachapado - Madera 156 3.2.3.1 Aglomerado. El aglomerado es el material más económico de los mencionados. El aglomerado no es muy sólido por lo que generalmente requiere algún tipo de refuerzo para aumentar su rigidez. La rigidez aumenta con el grosor y los mejores aglomerados parten desde 30mm de grosor. Una ventaja es que no hay resonancias marcadas como las que existen cuando la caja es de MDF. 3.2.3.2 MDF. MDF está compuesto por fibras de madera pegadas de una manera especial. La rigidez del MDF es superior a la del aglomerado. También tiene un buen índice de absorción. Sin embargo, este material no es homogéneo ni lineal por lo que es susceptible a resonancias cuando el sonido en una caja de MDF está en el rango de 200-400Hz. Estas resonancias tienden a cancelar los sonidos de estas frecuencias (recordando el corto acústico). Esto no es deseable pues esa banda de frecuencias le da mucho cuerpo al sonido y son eliminadas por la resonancia que ocurre debido al material. 3.2.3.3 Contrachapado. El contrachapado es otro material de uso común para fabricar cajas acústicas. Es poco absorbente y se curva muy fácil (poca rigidez). 3.2.3.4 Madera. La madera es un material cuyo comportamiento es difícil de predecir debido a la cantidad de factores relacionados como: el tipo de madera, el grosor, contenido de humedad, etc. La madera en general, posee menor coloración que la brindada por materiales como el aglomerado o MDF. Sin embargo, las cajas de madera son de 3 a 10 veces más caras que las otras. También se deben utilizar muchos materiales absorbentes pues el índice de absorción es bajo. 3.2.4 Impedancia de los altavoces La impedancia que presenta a la entrada el altavoz brinda información sobre el tipo de carga que este puede ofrecer, por ejemplo a un amplificador. La impedancia de un altavoz 157 depende de su tipo y de su forma constructiva. La configuración básica (para un altavoz dinámico) depende de varios factores: - resistencia óhmica del hilo: El hilo en la cual está suspendida la bobina tiene una resistencia dependiente del material, longitud y área de sección transversal. - reactancia de la bobina: La reactancia de la bobina es dependiente de la frecuencia y del coeficiente de autoinducción (L). XL(reactancia)=L2πf - corrientes inducidas en la bobina: Debido a que la bobina se desplaza en un campo magnético, se inducen corrientes en ella. Estas son difíciles de mantener constante y alteran la impedancia. Para una frecuencia de 1KHz, la impedancia de un altavoz dinámico varía entre 2 y 16 ohms. Muy relacionado con la impedancia está la frecuencia de resonancia: la frecuencia natural de vibración de la configuración cono-bobina. La frecuencia de resonancia depende tanto del tamaño del diafragma como de la rigidez del mismo. Es inversamente proporcional al tamaño del diafragma. Un diafragma rígido tiene una frecuencia de resonancia más elevada que un diafragma suave. En este valor de frecuencia, la impedancia es máxima debido a componentes reactivos en el altavoz. Z Zmáxima Znominal f resonancia f (Hz) Figura 91 Diagrama típico de impedancia de un altavoz Las curvas de impedancia indican la reactancia que tiene el altavoz según la frecuencia de operación. Estas presentan un pico que corresponde a la frecuencia de resonancia del altavoz. Por encima de dicha frecuencia la impedancia decrece, llega a un mínimo, y luego aumenta nuevamente. El mínimo de impedancia después de una resonancia se denomina impedancia nominal. Esta impedancia nominal es utilizada para hacer los cálculos de 158 potencia pues donde se da el mínimo de impedancia corresponde a un tipo resistivo (donde no hay desfase entre la tensión y la corriente). La curva de impedancia se modifica cuando el altavoz se monta en una caja acústica debido a la influencia del gabinete sobre las características mecánicas del altavoz (la frecuencia de resonancia se modifica). Generalmente es deseable que la frecuencia de resonancia sea baja para poder resaltar los tonos graves que son los más expuestos al efecto de cancelación por corto acústico. También se busca que la curva de impedancia sea lo más plana posible alrededor de la frecuencia de resonancia. Algunas veces se coloca más de un altavoz en una misma caja lo que se traduce en una curva con varias frecuencias de resonancia (picos de impedancia). 3.2.5 Parámetros de Thiele-Small Esta sección está basada en los trabajos de Neville Thiele y Richard Small. Se busca un modelo circuital para simular el comportamiento de los altavoces dinámicos. Para hacer ésto, primero se analiza el comportamiento electromecánico de la bobina, el imán, el cono, la suspensión y el aire. De la bobina se especifica su inductancia (capacidad de almacenamiento de energía en forma de campo magnético), la resistencia en D.C: (disipación de calor). El campo magnético del imán depende de su diámetro, el material (generalmente Ferroxdure) y de la densidad de flujo proporcionado por él. La ecuación resultante es equivalente a la ecuación de un sistema eléctrico, descrito mediante bobinas, resistencias y condensadores. El sonido obtenido por el altavoz, la impedancia y la frecuencia de resonancia se obtienen a partir de un análisis circuital. Además estos parámetros se pueden modificar para obtener una respuesta en frecuencia deseada a partir del diseño del altavoz. Existen tres ecuaciones básicas: - La relación entre el movimiento de la bobina y el voltaje inducido por el imán(ley de Faraday) - La ecuación para presión dentro de la caja - La relación entre las fuerzas y el movimiento de la configuración cono-suspensión 159 A partir de estas ecuaciones se obtiene un modelo circuital que pretende generalizar el comportamiento de los altavoces con sus respectivas cajas acústicas, aunque, el circuito se modifica dependiendo del tipo de caja (sellada, infinita, bass-reflex,etc.) Uno de los parámetros más importantes es el factor Q. Q es el factor de amortiguamiento del altavoz y tiene influencia en la respuesta de las bajas frecuencias del sistema. Este valor depende de las características del altavoz y de la caja acústica. Q es el resultado de considerar dos Q parciales: un Q considerando características eléctricas (bobina e imán)y otro Q considerando características mecánicas (cono y suspensión). Es importante resaltar que existe un valor de Q dependiendo del tipo de caja acústica (o la ausencia de ella). Valores de Q cercanos a 1 indican que la respuesta se mantendrá plana hasta la frecuencia de resonancia. Valores superiores a 1 indican un aumento de señal en la frecuencia de resonancia y son causa de un mal amortiguamiento del altavoz. Un valor de Q cercano a 0.5 se considera óptimo para un sistema de alta fidelidad. Otros factores importantes son el volumen de aire desplazado por el cono, las dimensiones del cono, masa de la configuración y la elasticidad. A partir de estos valores se hace el modelo circuital Figura 92 Ejemplo de un sistema eléctrico para modelar un altavoz con caja bass-reflex Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica.1995. No se entrará en detalle con todos los parámetros pues son muchos y son tema del diseño específico de altavoces. 160 3.2.6 Sensibilidad La sensibilidad está relacionada con el nivel de presión sonora que se puede obtener de la caja acústica con una potencia dada. Se define como el nivel de presión sonora a 1m de distancia cuando se aplica una potencia eléctrica de 1W. Sin embargo no es sencillo determinar el nivel de presión sonora a distancias superiores a 1m pues entran en juego tanto el campo directo(proveniente del bafle) como el campo reverberante (proveniente de las reflexiones). La medición de sensibilidad se debe realizar en una cámara anecoica, un recinto donde se han eliminado todos los ecos y reflexiones. Si no se tiene una cámara anecoica, la medición se hace en un recinto donde se deben tener en cuenta la presión sonora tanto del campo directo como del campo reverberante . Se puede estimar la variación del nivel de presión sonora al pasar de una distancia de 1m a una distancia d cualquiera en un ambiente reverberante mediante la siguiente fórmula: Q 4 + 2 R ∆NPSdB=10log 4πd Q 4π (1m) 2 R: constante acústica del recinto (dependiente del área y coeficiente de absorción promedio) Q: factor de directividad de la fuente (altavoz: para bajas frecuencias Q=1 y para altas frecuencias Q>>1 dependiendo del ángulo de cobertura de la bocina) Entonces, para calcular el nivel de presión sonora simplemente se suma el ∆NPS con la sensibilidad: NPSdB= SdB + ∆NPSdB La sensibilidad es en general un dato del bafle (especificada a una distancia de 1m y 1W), pero debe tenerse en cuenta que esa especificación es para una frecuencia o banda de frecuencias. Nótese que si usamos la anterior fórmula para calcular la presión sonora a 1m de distancia, predomina el campo directo sobre el reverberante y el NPS coincide con la sensibilidad. 161 3.2.7 Respuesta en frecuencia La curva de respuesta informa el comportamiento del altavoz en toda la gama de frecuencias. Nos permite conocer la intensidad sonora proporcionada para las frecuencias que se deben reproducir. Esto se realiza al especificar la variación de la presión acústica radiada (dada en dB) a una frecuencia determinada, a una tensión constante y en una determinada dirección. La curva de respuesta se toma en una cámara anecoica y se utiliza un trazador de curvas. Figura 93 Respuesta en frecuencia de tres altavoces para graves (“woofers”) Fuente: SAKE, Rudy. s.l.:s.n. 2003 <www.bafflemania.com> [consulta: 20 Abr. 2005] La respuesta en frecuencia del altavoz es irregular y varía dependiendo del número de altavoces (en el caso de un altavoz integrado) y de la caja acústica utilizada. En el inicio de la curva, encuentra un máximo correspondiente a la frecuencia de resonancia del diafragma (generalmente de unos cientos de Hz) y luego oscila en mayor o menor grado hasta llegar a la frecuencia de corte. Las oscilaciones carecen de importancia siempre y cuando no exista una diferencia superior a 10dB entre pico y valle. En sistemas de alta fidelidad, se exige que las diferencias sean menores a 5dB. Las frecuencias de corte inferior y superior de la respuesta en frecuencia se ubican teniendo el cuenta el criterio de 3dB. La banda de frecuencias considerada útil en un altavoz está comprendida entre la frecuencia inferior y la frecuencia superior. 162 Una manera de especificar la respuesta en frecuencia es como rango de frecuencias: 35Hz a 18kHz, +/- 3dB Por último, es importante anotar que una buena selección de caja acústica influye en el desempeño del altavoz en la frecuencia. 3.2.8 Direccionalidad La direccionalidad de un bafle es un parámetro importante que indica como varía la sensibilidad del mismo dependiendo del ángulo de salida. Es decir, indica la dirección o direcciones donde es enviada la energía. La sensibilidad fluctúa debido a fenómenos de interferencia o cancelación entre las ondas provenientes de distintos puntos del diafragma. También influye la interferencia de la caja acústica, especialmente notoria en altas frecuencias . Todo lo anterior da origen a un patrón direccional que a su vez se divide en dos: un diagrama (patrón) horizontal y un diagrama vertical debido a que los bafles no son simétricos. El diagrama horizontal es simétrico mientras que el diagrama vertical es asimétrico. Estos diagramas se realizan en una cámara anecoica. 200 Hz 1kHz Figura 94 Patrón direccional de un altavoz en función de la frecuencia Fuente: SAKE, Rudy. s.l.:s.n. 2003 <www.bafflemania.com> [consulta: 20 Abr. 2005] 163 La figura muestra que la direccionalidad es fuertemente dependiente de la frecuencia. A frecuencias bajas, el altavoz se comporta aproximadamente omnidireccional. Esto debido a que las ondas de baja frecuencia se refractan más fácilmente. En cambio, a frecuencias altas el altavoz se comporta de manera muy direccional. Las cajas acústicas incorporan muchas veces una bocina que incrementa la direccionalidad de la fuente. Una bocina es un elemento que permite acoplar dos medios con impedancias acústicas distintas para que se de una propagación óptima de energía sonora. Figura 95 Bocina que acopla dos medios a y b El aire tiene menor impedancia acústica que el altavoz (diafragma). La función de la bocina es acoplar los dos medios. La bocina que muestra la figura tiene forma exponencial. Esta forma está demostrada que optimiza la propagación de las vibraciones provenientes del diafragma hasta el contacto con el aire. Un parámetro importante al hablar de direccionalidad es el ángulo de cobertura. Se suele especificar el ángulo de cobertura o ancho de haz como el ángulo que puede cubrir un altavoz con una caída de sensibilidad no mayor a 6dB. La capacidad que tiene un altavoz para cubrir con sonido una determinada área se conoce como dispersión. (Se debe especificar la banda de frecuencias para esta medida. Las bandas de frecuencia de medida se han normalizado a los valores de las frecuencias centrales de las octavas: 125Hz, 250Hz, 500Hz, 1KHz, 2KHz, 4KHz, 8KHz y 16KHz). Este concepto es dual al de ángulo de captura de un micrófono. Otra especificación importante es el índice de directividad. El índice de directividad, expresado en decibelios, es la razón de la intensidad acústica radiada (a una distancia determinada) del altavoz en cuestión, a la intensidad acústica radiada a la misma distancia 164 del un altavoz omnidireccional. Se realizan generalmente dos medidas: uno en campo libre y otra en campo difuso (reverberante). 3.2.9 Especificaciones de potencia Existen varias formas de especificar la potencia, o mejor dicho, hay varias potencias por especificar, cada una con distintas interpretaciones. 3.2.9.1 Potencia media máxima o potencia de régimen. Corresponde a la potencia máxima que se puede aplicar al altavoz de forma continua. Determina la potencia máxima que puede disipar la bobina (en forma de calor) sin que ésta se queme por exceso de temperatura. A veces se encuentra como Potencia RMS, pero esto es incorrecto pues el apelativo RMS solo tiene sentido para voltajes y corrientes (no para potencias). 3.2.9.2 Potencia de pico máximo o potencia admisible. Corresponde al valor máximo instantáneo de potencia que puede aplicarse durante un tiempo muy corto. Este valor está muy relacionado con otra limitación de los altavoces que es el máximo recorrido de la bobina sin que se destruya el diafragma (esto se denomina desconado del altavoz). Esta potencia es mayor que la potencia media máxima. Estas dos anteriores son quizás las más importantes pero existen otras cuya medida es importante para conocer el comportamiento de los altavoces a corto, mediano y largo plazo. 3.2.9.3 Potencia PMPO. Es una especificación de potencia común en equipos de consumo como radiograbdadores o minicomponentes y representa una especie de valor pico durante un tiempo extremadamente muy corto dando valores mayores a la de la potencia pico máximo. Es importante aclarar que esta especificación es del parlante y no del amplificador que lo alimenta, lo que puede dar falsas expectativas al comprar un equipo. 165 3.2.9.4 Potencia eléctrica a corto plazo (PMUS). Especifica el máximo valor de la potencia con que puede trabajar el altavoz (sobre la impedancia nominal) sin que sufra daños permanentes, cuando se le excita con una señal de prueba que simula el espectro musical durante 1 segundo. 3.2.9.5 Potencia eléctrica a largo plazo (PNOM). Especifica el máximo valor de la potencia con que puede trabajar el altavoz (sobre la impedancia nominal) sin que sufra daños permanentes, cuando se le excita con una señal de prueba que simula el espectro musical durante 1 minuto. 3.2.9.6 Potencia continua senoidal: Especifica el máximo valor de la potencia con que puede trabajar el altavoz (sobre la impedancia nominal) sin que sufra daños permanentes (mecánicos y/o térmicos), cuando se le excita con una señal senoidal continua en una determinada banda de frecuencias. 3.2.9.7 Potencia de ruido: Especifica el máximo valor de la potencia con que puede trabajar el altavoz (sobre la impedancia nominal) sin que sufra daños permanentes (mecánicos y/o térmicos), cuando se le excita con una señal ruidosa en alguna banda del espectro. Un parámetro importante (y muy relacionado con la potencia) de los altavoces es la eficiencia. La eficiencia es una medida del rendimiento de la transducción eléctricaacústica. Es la relación de la potencia acústica del altavoz y la potencia eléctrica necesaria para ello: Eficiencia = Pacústica x100% Peléctrica La eficiencia de un altavoz nunca supera el 50% y generalmente es menor al 10%. En equipos domésticos (inclusive de alta calidad), la eficiencia es del orden de 0.5-1%. Afortunadamente, no se requiere una potencia acústica elevada para obtener un elevado volumen sonoro. 166 3.2.10 Distorsión armónica Este parámetro es análogo a la distorsión armónica de los micrófonos. La distorsión armónica se produce por la no linealidad del altavoz que hace que se introduzcan una cantidad de armónicos que modifican la forma de onda (la distorsionan) de la señal. La distorsión armónica se expresa de la siguiente manera: THD= f2 2 + f32 + ...fn 2 x100% f12 donde f1 es el valor de presión acústica radiada a la frecuencia fundamental y f2,f3. . . son los valores de presión acústica correspondientes a los distintos armónicos de la señal. La distorsión armónica total es importante mantenerla debajo de cierto nivel (porcentaje) pues influye en la calidad y la fidelidad del sonido a reproducir. En equipos de alta fidelidad, se requiere que TDH<0.5% Para realizar la medida de la distorsión armónica total, se excita el altavoz con una señal senoidal de frecuencia conocida. Después se capta con un micrófono y se analiza utilizando un analizador de espectros para reconocer los armónicos. (El micrófono para esta medición debe ser de excelente calidad porque si no, la distorsión armónica propia del micrófono influye en la medida). La distorsión armónica es un parámetro muy complejo porque la detección (por parte de un ser humano) de la distorsión armónica (en una canción por ejemplo) depende de varios factores como SPL, la distancia entre las componentes de frecuencia, el umbral de audición individual, etc. Esto implica que leer la especificación de THD en un equipo de audio, aunque da una idea general de la fidelidad del equipo, no predice el comportamiento completo del equipo. 167 3.2.11 Clasificación de los altavoces (según el rango de frecuencias) 3.2.11.1 Altavoces para bajos(“woofers”). Estos altavoces están especialmente diseñados para funcionar adecuadamente en bajas frecuencias. Esto se logra haciendo que la frecuencia de resonancia sea muy baja. La frecuencia de resonancia es inversamente proporcional al tamaño del diafragma. Esta frecuencia se debe ubicar alrededor de los 20Hz e idealmente la curva de respuesta de frecuencia debe ser plana hasta el límite inferior de las frecuencias vocales (alrededor de 100Hz). La frecuencia de corte se debe ubicar alrededor de 4KHz. Para realizar ésto existen básicamente dos formas constructivas. Un sistema consiste en colocar un anillo delgado que desacopla una parte del diafragma que se encuentra alrededor de la bobina móvil con el fin de eliminar los tonos altos. Este sistema no es muy utilizado en la actualidad. Un mejor sistema consiste de una bobina móvil de diámetro grande y larga. El diafragma es pesado pero hecho de un material blando. Se construye así porque la bobina (especialmente en bajas frecuencias) debe efectuar excursiones que pueden sobrepasar los 20mm. Debido al tamaño de la bobina, el entrehierro debe construirse aún más grande para que el campo magnético mantenga su uniformidad para la reproducción fiel del sonido. Este diseño es complicado y por lo tanto caro. Las frecuencias bajas son las frecuencias más delicadas y por eso la tecnología ha dedicado mucho esfuerzo en mejorar los altavoces para bajos (comunmente llamados “woofers”) y en el diseño de cajas acústicas (como “bass-reflex”) para mejorar aún más la respuesta. Los “subwoofers” son altavoces especialmente diseñados para cubrir las frecuencias más graves del espectro. Figura 96 Altavoces para bajos “woofers” Fuente: SAKE, Rudy. s.l.:s.n. 2003 <www.bafflemania.com> [consulta: 20 Abr. 2005] 168 3.2.11.2 Altavoces para medios (“squawkers”). Los altavoces para medios son sumamente importantes pues reproducen la parte del espectro más incidente en las canciones y en la voz. Se dice que el sonido de éstas frecuencias define el carácter de la grabación pues el oído humano es muy sensible a este rango de frecuencias. La frecuencia de resonancia debe ser no superior a 200Hz y la frecuencia de corte debe ser alrededor de 8KHz. Debido a la sensibilidad del oído a estas frecuencias, la distorsión debe mantenerse en niveles muy bajos y por lo tanto el diseño de estos altavoces es muy delicado. Figura 97 Altavoz para medios “squawker” Fuente: SAKE, Rudy. s.l.:s.n. 2003 <www.bafflemania.com> [consulta: 20 Abr. 2005] 3.2.11.3 Altavoces para agudos(“tweeters”). Los altavoces para agudos tienen la función de reproducir los sonidos más altos (mayor frecuencia) del espectro. El diafragma debe ser pequeño pues las longitudes de onda de las señales a reproducir. La frecuencia de resonancia de estos altavoces se sitúa alrededor de 2KHz y la frecuencia de corte mayor a 20KHz. Para mejorar el diseño, se suele agregar una bocina especial para alta frecuencia llamada trompeta. Son hechas de un material rígido y mejoran la respuesta en alta frecuencia respecto a calidad y fidelidad. Las trompetas son caras y se pueden dañar si son excitadas con una señal de baja frecuencia. Los diversos altavoces discutidos anteriormente son utilizados conjuntamente pues es deseable reproducir todo el espectro de la mejor forma posible. Figura 98 Altavoz para agudos “tweeter” Fuente: SAKE, Rudy. s.l.:s.n. 2003 <www.bafflemania.com> [consulta: 20 Abr. 2005] 169 3.2.12 Configuración y cuidado de los altavoces Hay que tener en cuenta ciertas consideraciones cuando se maneja más de un altavoz : - Se deben utilizar filtros adecuados cuando se tienen altavoces con distintas respuestas en frecuencia - No es recomendable una conexión en serie de un grupo de altavoces ya que los voltajes transitorios son lo suficientemente altos como para provocar chispas en las unidades impulsoras. Es preferible la conexión en paralelo. - Cuando se conectan solamente dos altavoces, la decisión de la conexión no es tan fundamental. Se debe tener en cuenta que en la conexión en serie, las impedancias de las bobinas se suman mientras que en paralelo se divide a la mitad (asumiendo altavoces idénticos) - Cuando se operan altavoces múltiples es importante que se encuentren en fase para evitar interferencia destructiva y cancelación parcial. Esto depende de la dirección de movimiento de los conos y de la corriente que genera la fuerza sobre la bobina. - Se debe tener cuidado al operar los altavoces pues éstos se pueden deteriorar debido a fallas térmicas y/o mecánicas. Las fallas térmicas se pueden dar debido a: exceso de potencia de entrada, señales fuera de la banda de frecuencias a la que está diseñada reproducir el altavoz (la energía que no se convierte en sonido y se convierte en calor), y excesiva ecualización de agudos, pues en estas frecuencias la eficiencia es muy baja y se necesita mucha potencia eléctrica para generar una potencia acústica suficiente. - Las causas de fallas mecánicas son debido a la excesiva excursión del altavoz (diafragma y bobina). El altavoz tiene más excursión a medida que la frecuencia sea más baja. Una señal con la frecuencia suficientemente baja y con un nivel SPL suficientemente alto, es capaz de sacar a la bobina del entrehierro resultando en daños algunas veces irreversibles. Para evitar esta condición, no se deben utilizar señales por debajo de la especificación de la configuración altavoz-caja acústica y se debe utilizar un amplificador de potencia adecuado. 170 3.3 AMPLIFICADORES Un amplificador es un dispositivo o circuito con la capacidad de aumentar la magnitud o nivel de potencia de una señal variable en el tiempo sin distorsionar la forma de la onda. Esto es necesario para poder obtener un nivel de intensidad sonora suficiente para que el contenido acústico (voz, música,etc.) llegue de igual forma a los oyentes en un recinto o un auditorio por ejemplo. El amplificador es el primer bloque procesador de señal puramente eléctrico y precede al altavoz en la cadena de audio. Se puede hacer una clasificación de los amplificadores de acuerdo a: - configuración - aplicación - el ancho de banda y el rango de frecuencias a amplificar En esta sección se analizarán amplificadores para aplicaciones de audio hechos a partir de transistores y/o tubos de vacío para amplificar frecuencias del espectro audible (20Hz hasta 20kHz). 3.3.1 Amplificadores con transistores y con tubos de vacío La estructura o configuración de un amplificador depende de la utilización de transistores o tubos al vacío para su operación. Los transistores son dispositivos semiconductores de tres terminales. Son componentes electrónicos muy importantes debido a las numerosas aplicaciones de las cuales se destaca la amplificación de señales. Los transistores se dividen básicamente en dos tipos: • BJT (transistores de unión bipolar): Son dispositivos formado por tres bloques de material semiconductor dopado. Puede ser material P(material dopado con impurezas para facilitar la conducción por medio de “huecos”) y/o material N(material dopado con impurezas para facilitar la conducción por medio de 171 electrones). Existen dos tipos: NPN y PNP y las terminales se denominan base, colector y emisor. • FET (transistores de efecto de campo): En el FET existen tres terminales llamadas drain, source y gate. Source y drain son los puntos extremos del canal que es una trayectoria dentro del semiconductor. La conductividad del canal es controlada por el voltaje aplicado en el gate. Un pequeño cambio en el voltaje de control en el gate se traduce en una variación grande de corriente en el canal. De esta forma, el FET puede amplificar las señales. Existen en dos clasificaciones para los FETs: JFET (FET de unión) y MOSFET(FET con metal y óxido de silicio. Figura 99 Transistor BJT Fuente: TERRY, William. Audilab. s.l.:s.n. 1999. www.audilab.bmed.mcgill.ca [consulta: 10 May. 2005] Un tubo de vacío consiste en una cápsula de vidrio que se la extraído el aire con varios electrodos metálicos dentro. Existen tubos de dos terminales (díodos) y de tres terminales (tríodos). Estos últimos, formados por ánodo, cátodo y rejilla, son los utilizados para la amplificación de señales. Figura 100 Tubo de vacío Fuente: TERRY, William. Audilab. s.l.:s.n. 1999. www.audilab.bmed.mcgill.ca [consulta: 10 May. 2005] 172 La utilización de transistores o tubos al vacío depende de la aplicación específica. Se anotarán las ventajas y desventajas de cada uno a continuación: Ventajas de utilizar transistores • son más económicos • brindan mayor confiabilidad • los amplificadores a base de transistores son más pequeños consumen menos potencia y disipan menos calor Desventajas de utilizar transistores • al reproducir se oye muy opaco; sin cuerpo • tienen mayor distorsión armónica Ventajas de utilizar tubos al vacío • la calidad del sonido es superior • se escucha con mayor fidelidad toda la gama de frecuencias se pueden utilizar para salidas de alta potencia en equipos de audio Desventajas de utilizar tubos al vacío • los amplificadores a base de tubos al vacío son muy grandes • consumen mucha potencia y emiten mucho calor • brindan menor confiabilidad • no son económicos Las características de los transistores y de los tubos al vacío son complementarias y la elección depende de varios factores como exigencia de calidad, presupuesto, y uso. 173 3.3.2 Características generales de los amplificadores Existen diversas características comunes a todos los amplificadores que se discutirán a continuación. 3.3.2.1 Ganancia. La ganancia, también llamada amplificación, es el cociente entre la tensión de salida y la de entrada: G= Vsalida Ventrada La señal que se quiere amplificar se aplica a la entrada entre dos terminales del amplificador y la señal de salida se obtiene entre otras dos terminales del amplificador. Para esta definición se tomaron como referencia el voltaje de salida y el de entrada pero se puede definir ganancia para corrientes. La ganancia comunmente se expresa en decibeles: GdB=20logG=20log Vsalida Ventrada En un amplificador ideal, la onda resultante (señal de salida) no se ve afectada en su forma; unicamente en su amplitud. Cuando la forma de onda se conserva y no hay distorsiones, se dice que el amplificador tiene un comportamiento lineal. De lo contrario, la onda se distorsiona (cambia de forma). 3.3.2.2 Nivel de señal. Los amplificadores manejan distintos tipos de señales de acuerdo a su nivel de señal. Existen tres niveles de señal característicos: bajo nivel, nivel de línea, y nivel de potencia. La señales de bajo nivel son señales de baja potencia producida por un micrófono por ejemplo, en el proceso de transducción. También pueden provenir de los fonocaptores para los discos de vinilo. Las señales de nivel de línea son el resultado de aplicar una etapa de preamplificación a señales de bajo nivel. También son las señales que producen distintos equipos como casseteras, reproductores de CD (compact disc), 174 instrumentos electrónicos, etc. Este nivel es el nivel que manejan las entradas y salidas de las consolas de mezcla. El nivel de potencia es el nivel requerido para excitar los altavoces. Para cuantificar los valores de potencia (o tensión) de estos niveles es necesario introducir unos nuevos tipos de decibeles que no se habían discutido. Estos decibeles representan una variable física y por lo tanto necesitan un valor de referencia. Un ejemplo ya conocido es el de nivel de presión sonora (NPS) cuyo valor de referencia es de 20µPa. En audio se utilizan otros tres decibeles referenciados: dBm , dBu , dBV. El dBm permite expresar el nivel de potencia eléctrica referenciado a una potencia de 1mW. P ) 1mW N dBm=10log( donde P es la potencia eléctrica Por ejemplo, una potencia de 1W corresponde a 30 dBm El dBu permite expresar el nivel de tensión referenciado a una tensión de 0.775V. N dBu=20log( T ) 0.775V donde T es la tensión eléctrica El valor de referencia de 0.775V se debe a que con este voltaje se disipa una potencia de 1mW (0 dBm) sobre una resistencia de 600ohms (P =V2/R). Este valor de resistencia es un valor normalizado que corresponde al valor de impedancia de una línea telefónica clásica. El dBV permite expresar un nivel de tensión referenciado a una tensión de 1V N dBu=20log( T ) 1V donde T es la tensión eléctrica Debido a que tanto dBu como dBV expresan relaciones entre tensiones, existe una relación básica que las relaciona a ambas. N dBu= N dBV +2.2dB Recuérdese dos cosas muy importantes acerca de decibeles: 175 • se utiliza 10log( . . .) cuando se trata de relaciones de potencias y 20log( . . .) cuando se trata de relaciones de tensiones • un valor de 0dB no significa ausencia de señal sino que ésta coincide con el valor de referencia Ahora se puede dar mayor precisión a los tres niveles de señal. En audio se utiliza como criterio los dBu • las señales de bajo nivel son las que tienen un nivel de tensión inferior a –40dBu (valores de tensión menores de 7.75mV • las señales de nivel de línea son las que tienen niveles de tensión comprendidos entre -10 dBu y 30 dBu (tensiones entre 245mV y 24.5V) • las señales de nivel de potencia son niveles de tensión superior a 30 dBu (tensiones superiores a 24.5V) Los amplificadores se pueden clasificar según la señal que pueden manejar: los preamplificadores y amplificadores de potencia. Los preamplificadores tienen como finalidad llevar las señales de bajo nivel a nivel de línea. Los amplificadores de potencia reciben la señal a nivel de línea y la amplifica hasta el nivel de potencia. Nivel de Línea Bajo Nivel Preamplificador Nivel de Potencia Amplificador de Potencia Figura 101 Esquema de pre-amplificación y amplificación 3.3.2.3. Potencia de salida. Existen varias formas de especificar la potencia de salida del amplificador. 3.3.2.3.1 Potencia continua. Esta se refiere a la potencia media que puede entregar de forma continua el amplificador a una carga, normalmente un altavoz. Para que esta especificación esté completa se debe incluir el rango de frecuencias en la cual es válida el 176 dato de potencia además de la impedancia del altavoz (la carga). Esta potencia también se le denomina Potencia RMS, pero recordemos que no es correcto denominar a una potencia RMS pues ésto es característico únicamente de tensiones y/o corrientes. 3.3.2.3.2 Potencia musical (“musical power”). Esta especificación es una medida de la potencia máxima que puede entregar el amplificador en impulsos breves. Por lo tanto, este valor es superior al valor de potencia continua. El valor de la potencia musical indica la facilidad que tiene el amplificador para dar picos de volumen en breves períodos de tiempo. Existen otras especificaciones de potencia: de cresta, instantánea, de pico, etc. que en realidad no informan sobre el comportamiento del amplificador pues son datos aislados que incluyen información acerca de la carga, frecuencias y distorsiones. 3.3.2.4 Nivel de saturación de entrada. Es un dato que define en gran medida la calidad del amplificador al que se refiere. Indica cual es el máximo nivel de señal que puede admitir la entrada del amplificador sin que exista saturación, es decir, sin recortar la señal. Está dado en voltios o en dBV. 3.3.2.5 Sensibilidad. La sensibilidad es otro parámetro de gran importancia en un amplificador y se define como el valor de la tensión de entrada necesaria para producir la máxima potencia. Se puede especificar tanto en voltios como en dBV (o dBu). Por ejemplo, si se tiene un amplificador de 200W sobre una carga de 4ohms con una sensibilidad de 1.5V se puede calcular la ganancia del amplificador: V2/R=200W implica que el voltaje de salida es: 28.2 voltios. Debido a que la sensibilidad es la tensión de entrada necesaria para producir la máxima potencia, se tiene que: G=28,2V/1.5V=18.8 o GdB=20logG=26dB 3.3.2.6 Relación Señal a Ruido. La relación señal a ruido (S/R) es el cociente entre determinado valor de la señal y valor del ruido propio del amplificador: 177 S/R=Vseñal/Vruido S/RdB=20logS/R La relación señal a ruido es distinta según sea la potencia que esté entregando el amplificador. Normalmente, se supone que la señal respecto a la cual se especifica S/R es la máxima señal; la que proporciona la máxima potencia. Supóngase que se tiene un amplificador con una potencia de 200W (máxima) con una S/RdB= 90dB. Se quiere saber cuanta es S/RdB del amplificador cuando este entregue solamente 100W. Teniendo en cuenta que la potencia es cuadrática con la tensión, si la potencia se reduce a la mitad, la tensión se reducirá en (2)1/2. Esto en decibeles es: 20log(2)1/2= 3dB Si la tensión se reduce en 3dB, también lo hará la S/RdB obteniendo: S/RdB (100w)=90dB-3dB=87dB Este ejemplo confirma que en un mismo amplificador se pueden tener distintos valores de S/RdB según la potencia que esté entregando. 3.3.2.7 Rango dinámico. El rango dinámico se define como la diferencia en dB entre el máximo y mínimo nivel de salida. El mínimo nivel normalmente es el nivel asociado a algún tipo de ruido sea del generador de la señal (micrófono, cassettera,etc.) o el ruido del ambiente. El criterio de selección de un amplificador es que su S/R sea superior al rango dinámico de la señal a amplificar, para el nivel de salida al que va a funcionar. 3.3.2.8 Respuesta en frecuencia. La respuesta en frecuencia de los amplificadores indica la variación de la ganancia con la frecuencia. La ganancia usualmente se da en dB. La especificación de la respuesta en frecuencia se puede dar de dos maneras. La primera, es un gráfico donde se muestra el comportamiento de la ganancia en función de la frecuencia. La segunda forma es dar los límites inferior y superior con una tolerancia, por ejemplo: 178 20Hz a 20kHz, +/-0.5dB Esto significa que la respuesta estará dentro del rango 20Hz-20kHz con una tolerancia a lo sumo de 0.5dB hacia arriba y 0.5dB hacia abajo de su valor nominal. El valor nominal es un valor de ganancia especificado o deducido de otras especificaciones. Es claro que el método gráfico brinda más información pero dar el rango y la tolerancia es más sencillo y muchas veces es suficiente para seleccionar un amplificador. Además de la respuesta en frecuencia, se debe incluir la potencia a la cual se realizó la medida ya que a grandes niveles (de potencia) la respuesta en frecuencia empeora. Normalmente se utiliza la potencia máxima (la peor) para caracterizar la respuesta. . La respuesta en frecuencia de los amplificadores de audio suele ser muy plana y cubren ampliamente el espectro audible. 3.3.2.9 Distorsión. La distorsión en general es la deformación de la señal al atravesar algún elemento procesador de la señal, en este caso el amplificador. Existen diversos tipos de distorsiones dependiendo de que manera se ve deformada la señal. 3.3.2.9.1 Distorsión de fase. Esta distorsión se produce cuando las señales de salida sufren retardos o adelantos en fase con la señal original. Esto es debido a componentes reactivos presentes en el amplificador (bobinas, condensadores). 3.3.2.9.2 Distorsión de frecuencia. Esta distorsión se produce cuando las señales de salida no guardan la misma relación en frecuencia que las de entrada. Esta distorsión también es consecuencia de la presencia de componentes reactivos en el amplificador. 3.3.2.9.3 Distorsión de amplitud. Se produce cuando la ganancia no es igual para todas la amplitudes de la forma de onda de la señal de entrada. 3.3.2.9.4 Distorsión de cruce por cero. Este tipo de distorsión ocurre únicamente en amplificadores clase B y clase AB (aunque en estos últimos en menor proporción). En los amplificadores clase B existen dos transistores complementarios: mientras uno está activo 179 (polarizado) el otro está apagado y viceversa. Cuando la señal cruza por cero, existe un tiempo en el cual ninguno de los transistores está polarizado y la señal se distorsiona. 3.3.2.9.5 Distorsión Armónica Total (THD): Este tipo de distorsión, al igual que en micrófonos y altavoces, se manifiesta como la aparición de nuevos armónicos a la señal que no estaban presentes y fueron añadidos a la señal por la no linealidad del amplificador. La proporción que representan todos estos armónicos frente a la señal pura (en la entrada) se denominada THD y se expresa en %. La distorsión armónica depende tanto de la frecuencia de la señal como de la potencia de salida del amplificador. Generalmente la THD aumenta al aumentar la potencia y la frecuencia. Los amplificadores con relación a los altavoces tienen una distorsión armónica muy baja, pero debido al efecto acumulativo de la distorsión se debe tratar que cada elemento de la cadena de audio aporte la mínima posible. Valores por debajo de 0.1% pueden considerarse buenos y por debajo de 0.01% se consideran excelentes y aptos para el sonido profesional. 3.3.2.9.6 Distorsión por intermodulación (IMD). La distorsión por intermodulación se origina en la interferencia mutua que se produce entre dos tonos de diferente frecuencia sumados en un mismo canal. Cuando se aplica a la entrada de un amplificador dos señales de frecuencias distintas, aparecen unas nuevas señales que resultan de la suma y diferencia de los armónicos de las señales originales. Es decir, si se aplica una señal de frecuencia f1 y una señal de frecuencia f2 aparecen a la salida del amplificador las frecuencias nf1+/-mf2 (donde m y n son números enteros). La amplitud de cada una de estas frecuencias (o el hecho de que cada una esté presente) depende de cada amplificador. La distorsión por intermodulación tiende a ser más nociva para un sistema de sonido que la distorsión total armónica. Esto debido a que la distorsión por intermodulación introduce sonidos que no están armónicamente relacionados con ninguno de los sonidos originales produciendo un efecto desagradable para el oído. La mayoría de los amplificadores actuales tiene valores de IMD menores al 0.1% 180 3.3.2.10 Realimentación negativa. La realimentación negativa es el proceso en el cual la señal de salida se reinyecta a la señal de entrada pero en fase opuesta (negativa). Este proceso es utilizado en varios sistemas físicos y es de particular importancia en los amplificadores pues: - ayuda a reducir la distorsión por intermodulación - hace que la ganancia sea menos sensible a parámetros que son difíciles de controlar y variables con la temperatura Sin embargo la realimentación negativa tiene algunas desventajas: - puede comprometer la calidad del sonido al producir distorsión por las diferencias temporales entre la señal original y la señal de salida reinyectada. - la ganancia global disminuye 3.3.2.11 Impedancia de entrada. La impedancia de entrada es la impedancia que se mide externamente en los terminales de entrada. Esta es una especificación muy importante porque indica cual es la tensión efectiva aplicada al amplificador. Esto se puede ver en el siguiente modelo circuital de la conexión entre un generador de señal (por ejemplo un micrófono) y un amplificador: Zseñal Vseñal Zentrada + Vamp Figura 102 Modelo circuital de conexión entre un generador y un amplificador Se puede plantear la ecuación del divisor de tensión para obtener la tensión efectiva aplicada al amplificador: Vamp= Zentrada Vseñal Zentrada + Zseñal 181 Conviene por lo tanto que la Zentrada sea lo más grande posible relativa a la impedancia de la señal para que haya una mínima reducción de la tensión aplicada al amplificador. Típicamente la impedancia de entrada de los amplificadores está en el rango entre 10kΩ y 50kΩ. La impedancia de las consolas (Zseñal) es de algunos cientos de Ω por lo que la reducción de la señal es del orden del 5% (0.5dB) la cual no es muy significativa. En amplificadores con entradas balanceadas se especifican dos valores de impedancia: una correspondiente a entradas balanceadas y otro correspondiente a entradas no balanceadas. 3.3.2.12 Factor de amortiguamiento. Los amplificadores tienen una impedancia de salida (interna) que depende de la construcción del amplificador. Esta impedancia de salida no debe confundirse con la impedancia nominal de carga que será conectada a la salida del amplificador, generalmente un altavoz. La impedancia de salida de un amplificador es muy baja (menor a 1ohm) mientras que la impedancia de un altavoz está comprendida entre 4 y 16 ohms. El factor de amortiguación relaciona la impedancia nominal de carga y la impedancia real de salida. Por ejemplo, un amplificador que le entrega potencia a una carga de 4ohms y cuya impedancia de salida es de 0.04ohms posee un factor de amortiguación de F.A.= 4ohms =100 0.04ohms Son considerados aceptables valores superiores a 4 pero los factores de amortiguación de los amplificadores actuales pueden superar a 100. Es deseable un amplificador con un factor de amortiguación alto para lograr que la impedancia del altavoz no modifique significativamente la tensión real sobre él. 3.3.2.13 Separación entre canales o diafonía (“crosstalk”). Existe diafonía cuando al aplicar señal a uno sólo de los canales se observa la señal de salida en el canal contrario. Es una medida que indica la separación real existente entre los dos canales de un sistema estereofónico. La diferencia de niveles (en dB) es la separación entre canales. Valores superiores a 60dB son recomendados para un óptimo funcionamiento. Una correcta 182 especificación de la separación de canales requiere que se indique a que frecuencia se hizo la medición (en general se utiliza 1kHz). 3.3.3 Preamplificadores La función principal de los preamplificadores es la de llevar la señal de bajo nivel a nivel de línea. Los preamplificadores normalmente vienen incorporados en las consolas o equipos generadores de señal. Mientras la señal recorre ese camino sufre distintas transformaciones en cuanto a nivel absoluto, nivel de las señales de unas frecuencias con respecto a otras, volumen, balance, etc. Los preamplificadores además de llevar la señal de bajo nivel a nivel de línea tiene otras funciones y se subdivide en varias partes. 3.3.3.1 Selector de entradas. Existen diversas fuentes de señal en un sistema de audio como lo son: micrófonos, sintonizadores, magnetófono, etc. y éstas confluyen directamente en el selector de entradas. La función del selector de entradas es de dejar pasar solo una de estas señales(o algunas en el caso de los mezcladores) hacia el resto del sistema. . 3.3.3.2 Conformador de señal. Un conformador de señal es un dispositivo destinado a variar la señal original en alguno o algunos de sus parámetros. Esto se hace tanto para suprimir efectos molestos como para atenuar los deseados. El conformador a su vez se divide en: controles de tono, compensador, filtros, control de volumen y balance 3.3.3.2.1 Controles de tono. Los controles de tono permiten compensar los posibles desequilibrios existentes entre los diversos elementos del sistema, la deficiencia acústica en recintos de grabación, corregir errores de grabación o simplemente adaptar el sonido resultante al gusto particular de cada oyente. La tendencia normal debe ser que el conjunto del sistema de una respuesta frecuencial plana. Esto se hace mediante unos controles que varían el nivel (en dB)en una banda de frecuencia específica (un control por cada banda). 183 Los valores típicos de variación son de –10dB (atenuación máxima) hasta 10dB (amplificación máxima). Si el número de controles es pequeño (menor a cinco) se hablará de controles de tono pero si el número es mayor, se hablará de ecualizadores. 3.3.3.2.2 Compensador. Como se vio anteriormente en la sección de psicoacústica, el oído no responde igual a todas las frecuencias. Es más fácil dada una intensidad sonora, escuchar los tonos medios que los agudos y mucho más difícil, los graves. (Esto se puede verificar analizando las curvas de Fletcher y Munson). Para compensar este efecto, la mayoría de los amplificadores disponen de un mando llamado compensador que amplifica automaticamente las frecuencias graves y agudas manteniendo constante las frecuencias medias. La actuación de un compensador depende de muchos factores como el NPS, la sensibilidad de los altoparlantes, la calidad acústica del recinto, etc. 3.3.3.2.3 Filtros. Los filtros son dispositivos utilizados para eliminar o atenuar una determinada gama de frecuencias. Esto en principio parecería comprometer la calidad y fidelidad del audio a reproducir. El uso de filtros se justifica para eliminar efectos molestos para el oído. El filtro subsónico suprime las frecuencias debajo de 20Hz y por lo tanto no afecta el contenido que el oído puede detectar (20Hz es el umbral de audición). Estas frecuencias, sin embargo pueden sobrecargar al amplificador como al altoparlante, generadas por el motor de un giradiscos o alguna resonancia. El filtro de graves trabaja en un rango de frecuencias un poco más alto, alrededor de los 50 o 60Hz . Afecta el contenido sonoro que el oído puede detectar, pero esto no es demasiado grave pues pocos instrumentos y personas son capaz de generarlas y altavoces para reproducirlos. Este filtro elimina el ruido de la red eléctrica que se puede filtrar por inducción. Un último tipo de filtro, el filtro de agudos, trabaja sobre frecuencias superiores a 10kHz y suprime ruidos molestos como soplidos, sonido de rayado en un disco, etc. Aunque estos filtros si deforman la onda (y su contenido), es preferible utilizarlo para eliminar ruidos molestos. En todos los casos, se requiere que la pendiente de actuación del filtro sea muy pronunciada para obtener la cancelación del efecto. 184 3.3.3.2.4 Control de volumen. El control de volumen permite la obtención del nivel de escucha deseado por el oyente. También permite calibrar con alguna exactitud el nivel de señal de entrada al amplificador(de potencia). Suele calibrarse de 0 a 10. (0 corresponde a la potencia mínima y 10 corresponde a la potencia máxima). No es aconsejable trabajar a la potencia máxima pues el amplificador se saturará recortando la señal de salida resultando en una degradación notoria del sonido. Algunos amplificadores incorporan junto al control de volumen un limitador de volumen. El limitador impone un límite en la cantidad de potencia que pueda entregar el control de volumen. Es útil para proteger pantallas acústicas que no puedan soportar el nivel máximo de potencia del preamplificador. Aunque accidentalmente se lleve el mando del volumen al máximo, el amplificador estará limitado en potencia evitando el riesgo de averiar las pantallas. También es común encontrar en junto al control de volumen un silenciador. El silenciador permite reducir el nivel de salida en un valor fijo (generalmente 20dB) instantáneamente y recuperar nuevamente el nivel sin actuar sobre el control de volumen. Esto es útil cuando se requiera atender una conversación por ejemplo durante un intervalo de tiempo, y posteriormente recuperar el nivel original. 3.3.3.2.5 Balance. En un sistema estereofónico existen dos canales. Aunque las potencias por ambos canales fueran idénticas, es posible escuchar de distinta forma el sonido de salida de los canales por diversos factores, que incluyen: la posición de los parlantes, la situación de los oyentes y las características acústicas del recinto. Para corregir o compensar este efecto, se dispone de un mando (balance) para atenuar la señal de uno de los canales y así la señal resultante se desvía más hacia una canal que otro. Esto es equivalente a tener un mando de volumen para cada canal. 3.3.4 Amplificadores de potencia. La tensión entregada por el preamplificador (nivel de línea) debe ser amplificada para conseguir la potencia necesaria para lograr el funcionamiento adecuado de los altavoces. 185 Los amplificadores de potencia se pueden clasificar de acuerdo al ángulo de conducción, es decir, el intervalo de tiempo que están funcionando los elementos activos que conforman el circuito del amplificador (transistores o tubos). Dependiendo de este ángulo de conducción, se hacen conclusiones respecto a la potencia utilizada y al funcionamiento. 3.3.4.1 Amplificadores clase A. En el amplificador clase A el dispositivo (transistor o tubo) conduce todo e l periodo de la señal. Es decir, el dispositivo está activo (conduciendo y amplificando) todo el tiempo que dura la señal de entrada. La eficiencia de potencia de un amplificador está dada por: η=Palterna/Pcc Esta cuantifica que tanta potencia de señal puede generar a partir de la potencia de la fuente de alimentación. En estos amplificadores la eficiencia de potencia no es muy buena. En el mejor de los casos es del orden de 50%. En estos amplificadores se desperdicia mucha potencia pero compensa con que el sonido carece de distorsiones. 3.3.4.2 Amplificadores clase B. En el amplificador clase B el dispositivo conduce unicamente mitad del ciclo. Por esta razón se deben utilizar dos transistores (o tubos) idénticos que trabajen de manera complementaria (push-pull). Un transistor conduce (está activo) en una mitad del ciclo y se ocupa del semiciclo positivo de la onda mientras que el otro transistor conduce mientras el semiciclo negativo de la señal. Con esta configuración se puede lograr una eficiencia de hasta 78.5% superando de esta forma al amplificador clase A. Sin embargo, debido a que se utilizan dos transistores, existe un tiempo “muerto” en el cual ninguno de los dos está activo pues la polarización debe superar el Vce de aprox 0.5 V. Esto se traduce en un tipo de distorsión llamada “crossover” o de cruce por cero. Esto añade armónicos indeseados a la señal y la forma de onda se ve distorsionada. 3.3.4.3 Amplificadores clase AB. El amplificador clase AB es un intermedio entre los dos amplificadores ya mencionados. Utiliza al igual que en el amplificador clase B dos transistores. Cada transistor de salida trabaja con más del 50% de la señal pero sin 186 amplificarla entera. Para obtener la señal entera se disponen de dos transistores complementarios que suman sus señales y restituyen la señal original. Con esta configuración se suman las ventajas de cada amplificador (clase A y clase B): mayor eficiencia de potencia que en clase A y menor distorsión que en clase B. 3.3.4.4 Amplificadores con muestreo digital. Estos utilizan modulación de pulsos conmutados a una frecuencia ultrasónica. Es decir, modulan el ancho de una señal cuadrada de alta frecuencia (portadora) para reproducir la señal de audio. Con este tipo de amplificadores se pueden lograr altas potencias de salida con mínima disipación térmica. La distorsión es relativamente baja. El mayor inconveniente es de carácter constructivo y que no son muy económicos. Aparte de esto, estos amplificadores muestran unas ventajas suficientes para tenerlos en cuenta en equipos de alta fidelidad. 3.3.5 Multiamplificación. La multiamplificación es una técnica en la cual cada altavoz (en un sistema de varios altavoces) está manejada por una etapa de potencia (amplificación) individual. Para lograr ésto, se debe dividir la frecuencia mediante filtros antes de ser amplificada la señal de excitación de los altavoces. Aunque puede ser dispendioso utilizar muchos amplificadores (especialmente por el tamaño y el precio), ésto trae consigo muchas ventajas como: - mayor potencia - mayor eficiencia - mayor factor de amortiguación - menor distorsión - posibilidad de conexión óptima de varios altavoces 187 3.4 FILTROS Y ECUALIZADORES Los filtros son dispositivos que modifican el contenido espectral de la señal. Están diseñados para atenuar o eliminar ciertos componentes del sonido (intensidad sonora) en función de la frecuencia. La utilización de filtros en los sistemas de audio es muy importante ya que son muchas las situaciones en las cuales se requiere acentuar o atenuar determinadas frecuencias. Aparecen filtros a la entrada de los amplificadores para evitar la presencia de señales de muy baja o muy alta frecuencia que, sin ser útiles, son ruido para el sistema. También aparecen filtros para separar la señal en sus componentes espectrales de baja, media y alta frecuencia para sistemas acústicos de múltiples altavoces. Por último, una gran aplicación de los filtros se encuentra en los ecualizadores: dispositivos que permiten corregir deficiencias en la respuesta en frecuencia en un sistema. 3.4.1 Filtros análogos (o analógicos) Un filtro análogo es un sistema determinístico (bloque de proceso) que modifica el contenido espectral de una señal en el dominio continuo del tiempo. Los filtros análogos a su vez se dividen en filtros pasivos y filtros activos. 3.4.1.1 Filtros pasivos. Los filtros pasivos utilizan condensadores, bobinas y resistencias (elementos pasivos) para su funcionamiento. No requieren de fuente de alimentación. 3.4.1.2 Filtros activos. Los filtros activos utilizan amplificadores operacionales (elemento activo) condensadores y resistencias. Los filtros activos tienen dos ventajas sobre los filtros pasivos: - amplifican y filtran en una sola etapa - se pueden conectar varios en cascada A diferencia de los filtros pasivos, los filtros activos al contener un amplificador requieren una fuente de alimentación. 188 3.4.2 Clasificación según su banda de operación Los filtros también se pueden clasificar según su banda (de frecuencia) de operación en: 3.4.2.1 Filtros pasabajo. Los filtros pasabajo son filtros que únicamente dejan pasar frecuencias desde 0Hz hasta una frecuencia denominada frecuencia superior de corte del filtro. Frecuencias superiores a esta frecuencia son atenuadas o eliminadas en el caso ideal. Los filtros pasabajos reales no bloquean totalmente las altas frecuencias sino que las atenúan a razón de cierta cantidad de dB por octava. Los valores típicos de atenuaciones son –6dB/octava, -12dB/octava y –18dB/octava. La frecuencia de corte (superior) de un filtro pasabajo varía entre 3kHz y 20kHz. 3.4.2.2 Filtros pasaalto. Los filtros pasaalto por oposición a los filtros pasabajo bloquean (atenúan) las frecuencias por debajo de una frecuencia denominada frecuencia inferior de corte, dejando pasar inalteradas las frecuencias superiores. Los valores típicos de atenuaciones al igual que en los filtros pasabajo son –6dB/octava, -12dB/octava y – 18dB/octava. La frecuencia de corte (inferior) de un filtro pasabajo varía entre 20Hz y 100Hz. 3.4.2.3 Filtros pasabanda. Un filtro pasabanda es un filtro diseñado para permitir que una banda de frecuencias pase a través del filtro inalterada mientras que frecuencias fuera de esa banda son bloqueadas. La banda de frecuencias está localizada entre la frecuencia de corte inferior y la frecuencia de corte superior del filtro. 3.4.2.4 Filtros eliminabanda. Tienen un comportamiento dual al Filtro pasabanda. Bloquea (elimina) una banda de frecuencias comprendida entre la frecuencia de corte inferior y la frecuencia de corte superior y deja inalteradas las frecuencias fuera de la banda. 189 3.4.3 Diseño de filtros. El diseño de filtros es un proceso que requiere tres pasos: - establecer las especificaciones del filtro para unas determinadas exigencias (atenuación máxima y mínima, ganancia, frecuencias de corte, etc.) - determinar la función de transferencia a partir de las especificaciones - implementar el filtro ya sea en hardware o en software Los diversos filtros clasificados según la banda de frecuencias se pueden obtener a partir de especificaciones para un filtro pasabajo. Es decir, primero se modela el filtro tomando como referencia un filtro pasabajo y luego se aplica una técnica denominada transformación del filtro, ya sea para convertirlo en pasa alto, pasabanda, eliminabanda o dejarlo como pasabajo. Por esta razón, el filtro pasabajo ha sido objeto de estudio de varios investigadores con el fin de obtener un filtro con las mejores características. Los filtros están caracterizadas por magnitud y por fase. Se desea que la magnitud del filtro represente de la manera más cercana un sistema para atenuar todas las frecuencias superiores a la frecuencia de corte. Se distinguen dos bandas de frecuencias separadas por la frecuencia de corte. La banda de las frecuencias inferiores a la frecuencia de corte se denomina banda de paso, pues deja pasar las frecuencias. La banda de las frecuencias superiores a la frecuencia de corte se denomina banda de stop o banda atenuada. Ganancia banda de paso banda de stop f corte f (Hz) Figura 103 Filtro pasabajos ideal La fase se desea que sea lineal para evitar distorsión. Sin embargo, esto hace parte de una idealización del filtro. Los filtros reales no tienen caídas abruptas desde la banda de paso 190 hasta la banda de stop. La transición se hace mediante una pendiente de caída en dB/octava. Entre mayor sea el valor de la pendiente, más rápida es la transición. Los filtros reales tampoco tienen atenuación infinita en la banda de stop como si tiene el filtro ideal. Se habla de una atenuación mínima en la banda de stop y una atenuación máxima en la banda de paso. Existen varias aproximaciones al filtro pasabajo y las más relevantes se discutirán a continuación. 3.4.3.1 Butterworth. Los filtros tipo Butterworth tienen una pendiente de caída (de atenuación) de 20ndB/década donde n es el orden del filtro. Además admite respuesta plana en la banda de paso, la banda de frecuencias inferior a la frecuencia inferior de corte. La fase es lineal. 3.4.3.2 Chebychev. Los filtros tipo Chebychev tienen una pendiente de atenuación mayor que 20ndB/década lo que se traduce en filtros superiores con órdenes más bajos. Sin embargo, tiene rizado en la banda de paso. La fase del filtro no es lineal lo que conduce a distorsión por retraso de grupo. 3.4.3.3 Filtros elípticos. Los filtros elípticos tienen como característica principal que tienen rizado tanto en la banda de paso como en la banda atenuada. La transición de la banda de paso a la banda atenuada es óptima (superior a Chebychev). Aún así, la fase es no lineal. 3.4.3.4 Bessel. En los filtros tipo Bessel la fase es lineal en la banda de paso pero la transición es más suave a la banda atenuada. Esto es un sacrificio por obtener una mejor respuesta transitoria (respuesta ante cambios repentinos de señal). Los detalles de la obtención de la función de transferencia y de la implementación de los filtros no es objeto de este libro. 191 3.4.4 Filtros digitales Un filtro digital es el procesamiento realizado a una señal de entrada digital, entrada cuyo dominio son valores discretos del tiempo. Consta de un arreglo de números (vector) que modela una ecuación en diferencias. Los filtros digitales tienen muchas ventajas sobre los filtros análogos: - Alta inmunidad al ruido - Alta precisión (limitada por los errores de redondeo en la aritmética empleada) - Fácil modificación de las características del filtro - Muy bajo costo Existen dos tipos de filtros digitales: Filtros IIR y filtros FIR 3.4.4.1 Filtros FIR(Finite Impulse Response). Un filtro FIR de orden M se define mediante la siguiente ecuación en diferencias: y[n]=B0x[n]+B1x[n-1] . . .+BMx[n-M]. A esta ecuación en diferencia corresponde la función de transferencia (mediante Transformada Z): H(z)= B0+B1z-1 . . .+BMz-M La secuencia {Bk}son los coeficientes (vector) del filtro. La salida del filtro depende unicamente de la entrada y no de valores pasados de la salida. Por lo tanto, se dice que el filtro es no recursivo. La respuesta es de duración finita. 3.4.4.2 Filtros IIR(Infinite Impulse Response). Un filtro IIR de orden N se define mediante la siguiente ecuación en diferencia: y[n]+A1y[n-1]+ . . .ANy[n-N]= B0x[n]+B1x[n-1] . . .+BMx[n-M] cuya función de transferencia correspondiente es: B 0 + B1 z -1 . . . + B M z -M H(z)= 1 + A 1 z -1 . . . + A N z - N 192 Los filtros IIR son recursivos ya que la salida es función de tanto los valores de la entrada como de los valores pasados de la salida. Para este propósito, el filtro debe tener realimentación. Este filtro es de duración infinita. La decisión entre implementar un filtro FIR o un filtro IIR se basa en las ventajas y desventajas que cada uno posee. Filtros FIR Filtros IIR son de fase lineal producen distorsión de fase la convergencia es más lenta el orden de un filtro IIR es que la de un filtro IIR menor que la de un filtro FIR (requiere un mayor orden) para la misma aplicación son siempre estables la estabilidad depende de las condiciones del sistema 3.4.5 Filtros adaptativos El diseño de filtros se complica cuando no se conoce por completo las características de la señal cuyo espectro se quiere modificar. Esto sucede, por ejemplo, en sistemas que requieran filtrar la señal en tiempo real. Para resolver este problema, se utilizan filtros adaptativos que son dispositivos con la capacidad de auto-diseñarse a través de un algoritmo recursivo. Este tipo de filtros tienen condiciones iniciales y después converge a la solución óptima. El proceso se divide en dos partes: un proceso de filtrado en el cual se obtiene un dato de salida en respuesta a datos de entrada. un proceso adaptativo en el cual se ajustan los coeficientes del filtro de acuerdo a un algoritmo. Los filtros adaptativos pueden ser análogos o digitales. 193 3.4.6 Redes divisoras de frecuencia Al estudiar los altavoces, se indicó que muchas veces era necesario utilizar dos o más altavoces para cubrir el rango de frecuencias de la señal de audio debido a dificultades del comportamiento de un altavoz en alta y baja frecuencia. Cada altavoz del sistema responde acústicamente a la porción de la señal comprendida en su rango de frecuencias específico. Sin embargo, no es deseable enviar toda la señal al altavoz pues se desperdicia potencia eléctrica y se somete al altavoz a una gran sobrecarga. Las redes divisoras de frecuencia o redes “crossover” permiten efectuar una separación de la señal en rangos de frecuencia según los altavoces a utilizar. En los sistemas de pequeña o mediana potencia, las cajas acústicas contienen dos o más altavoces para cubrir los distintos rangos de frecuencia. La caja recibe un única señal de potencia proveniente de un único amplificador y la división de frecuencias se efectúa en la caja acústica (posterior a la etapa de amplificación). La red en este caso es pasiva; utiliza solamente condensadores, bobinas y resistencias. En los sistemas de grandes potencias (superiores a 100W) se utiliza el esquema de multiamplificación, ya discutido cuando se analizaron los amplificadores. En este esquema se realiza la división de frecuencias antes de la etapa de amplificación y luego se amplifica por separado cada una de las señales así obtenidas. Los filtros utilizados para la multiamplificación funcionamiento. son activos; utiliza amplificadores operacionales para su 194 Preamplificador Pasabajo Pasabajo Pasaalto Pasaalto Amplificador Amplificador bajos medios Amplificador agudos Figura 104 Sistema multiamplificado Los sistemas multiamplificados tienen muchas ventajas frente a los tradicionales (algunas ya anotadas anteriormente en el capítulo de amplificadores): - la potencia se reparte en dos o más amplificadores y por lo tanto cada uno resulta de menor potencia que si se usara un solo amplificador. (esto es particularmente útil para el amplificador del “tweeter” que es de menor potencia (mayor rendimiento) que el amplificador del “woofer” - la distorsión se reduce pues la distorsión en una de las vías no tiene ninguna repercusión en el resto. - la característica de los amplificadores para cada vía (para agudos y graves por ejemplo) pueden tener respuesta en frecuencia más restringida lo que reduce el ruido y el costo del equipo al ser una especificación más flexible Las especificaciones de las redes “crossover” (activas) incluyen parámetros habituales ya discutidos en el capítulo de amplificadores: impedancias, relación señal a ruido, etc. respuesta en frecuencia, distorsión, 195 3.4.7 Ecualizadores Un ecualizador es un dispositivo que permite alterar (aumentar o reducir) la ganancia selectivamente en tres o más bandas de frecuencia. Son una parte fundamental de un sistema de audio ya que permite: - enfatizar o atenuar bandas determinadas de frecuencia (particularmente útil para algunos tipos de música) - compensación de filtrados previos o posteriores - facilitar la mezcla de sonidos - reducción de ruido 3.4.7.1 Control de tono. El Control de tono es el tipo de ecualizador más sencillo. Permite controlar tres bandas fijas de frecuencia del espectro denominadas graves (bajas frecuencias), medios (medias frecuencias) y agudos (altas frecuencias). Es usual encontrarlo en los preamplificadores. El Control de Tono, al dividir el espectro sonoro en bandas muy grandes, no es muy preciso ni muy selectivo. De hecho, el término ecualizador se reserva para los dispositivos que manejen 5 o más bandas. graves medios agudos Figura 105 Control de tonos 3.4.7.2 Ecualizador gráfico o de bandas. Los ecualizadores gráficos están divididos en bandas de frecuencias, generalmente de 5 hasta 31 bandas. Cada banda está centrada en una frecuencia determinada, denominada frecuencia central de la banda. Las frecuencias centrales se seleccionan de tal forma que exista una relación aproximadamente constante entre frecuencias consecutivas. Existen varias formas de dividir el espectro en bandas. La 196 más común es dividir el espectro en bandas de octava; las frecuencias centrales están elegidas de modo que cada frecuencia sea el doble de la anterior (por analogía con la octava musical): 31.5, 63, 125, 250, 500, 1k, 2k, 4k, 8k, 16k.. Nótese que el ancho de cada banda aumenta con la frecuencia. Si estas bandas se sitúan en una gráfica lineal, se nota que las primeras bandas están muy comprimidas. En cambio si estas bandas se sitúan en una gráfica logarítmica (como normalmente se utiliza en las especificaciones de respuesta en frecuencia), es espaciado es uniforme. En los ecualizadores por bandas de tercio de octava, cada frecuencia central es aproximadamente 25% mayor que la anterior. También existen ecualizadores de ½ octava y de 2/3 de octava. La resolución del ecualizador depende del número de bandas de frecuencia en la cual está divido el espectro. En orden de mayor a menor resolución, los ecualizadores se ordenan así: 1/3 de octava ½ de octava 2/3 de octava octava Para el ajuste de la ganancia o de atenuación, los ecualizadores gráficos cuentan en cada banda con un potenciómetro graduado en dB. La posición central o de reposo corresponde a 0dB(ganancia =1). En la posición más alta se tiene la ganancia máxima(típicamente 18dB ó 12dB ó 6dB) y en la posición más baja se tiene la atenuación máxima (típicamente –18dB ó –12dB ó –6dB). Si se eleva una de las bandas hasta la ganancia máxima dejando inalteradas las demás (0dB), la frecuencia central se amplificará con la ganancia máxima pero el resto de la banda lo hará en menor proporción. La ganancia inclusive puede afectar las bandas contiguas pero se atenúa muy rápidamente a medida que se aleja de la frecuencia central. Figura 106 Ecualizador gráfico 197 Existen varias aplicaciones de los ecualizadores gráficos. Entre éstas están: - el retoque tonal de composiciones musicales - utilización del ecualizador como complemento de diversos efectos y procesadores - compensación de deficiencias de un sistema de audio Esta última es la aplicación más importante. Un sistema de audio está conformado por micrófonos, altavoces, amplificadores, redes “crossover” y otros equipos electrónicos. Todas estas partes involucradas contribuyen con defectos respecto a la respuesta en frecuencia. Los ecualizadores proporcionan una solución a este problema atenuando frecuencias que resuenan o enfatizando aquellas que son absorbidas. Para especificar los ecualizadores gráficos, se utilizan las comunes a los sistemas de audio estudiados anteriormente: impedancias de entrada y de salida, distorsión armónica (con salida máxima), respuesta en frecuencia con todos los controles en 0dB (planos), relación señal a ruido. 3.4.7.3 Ecualizadores paramétricos. Los ecualizadores paramétricos permiten ajustar la frecuencia central de una banda. Esto implica la posibilidad de ubicar de forma precisa un defecto acústico y corregirlo (una resonancia, por ejemplo). También es posible ajustar el ancho de banda y la ganancia. Sin embargo, tienen menos bandas que los ecualizadores gráficos. El factor de calidad Q de un filtro paramétrico relaciona la frecuencia central con el ancho de banda. Q= f0 AB donde f0: frecuencia central del filtro AB: ancho de banda de actuación del filtro Un valor de Q alto implica que el filtro es muy selectivo y abarca pocas frecuencias. Esto es muy deseable cuando se quiere corregir un error acústico en una banda de frecuencias estrecha. La aplicación de los ecualizadores paramétricos está en corregir defectos acústicos en frecuencias específicas. Esto puede resultar de una resonancia en una caja acústica (es 198 deseable atenuarla) o un rango de frecuencias que son excesivamente absorbidas (es deseable enfatizarlas). Otras aplicaciones pueden ser eliminar zumbidos de línea y el “feedback” de los altavoces. Las especificaciones de los ecualizadores paramétricos son similares a las de los altavoces gráficos. 3.4.7.4 Ecualizadores paragráficos. Los ecualizadores paragráficos combinan las características de los ecualizadores gráficos y de los ecualizadores paramétricos: tienen varias bandas de frecuencia con frecuencias ajustables independientemente y control del factor de calidad Q. La aplicación de estos ecualizadores está en los sistemas electroacústicos complejos, en donde pueden aparecer varios defectos acústicos a varias frecuencias específicas. 199 3.5 UNIDADES DINÁMICAS Las unidades dinámicas son procesadores que modifican el rango dinámico de una señal. El rango dinámico se define como la diferencia en dB de la señal más intensa con respecto a más débil. Esta especificación está relacionada con la capacidad que tiene un sistema de audio de reproducir todas las intensidades perceptibles por el ser humano. El rango dinámico del ser humano y de los instrumentos musicales acústicos es de alrededor de 130dB. Sin embargo, el rango dinámico de los formatos de grabación y reproducción es menor: Eléctricos análogos 80dB Magnéticos análogos 60dB Digitales 120dB Las unidades dinámicas pueden tener control manual o control automático. Las unidades de control manual dependen de un experto que modifica aspectos del rango dinámico manualmente al escuchar la señal. En este caso, el hombre actúa como un procesador: la señal proveniente de alguna fuente es procesada por el sistema auditivo y por el cerebro. Este último envía una señal de control que es traducida en es la modificación manual del rango dinámico. El procesador “humano” de dinámica tiene ciertos inconvenientes: - el operador debe conocer de antemano la señal - solo puede controlar un canal a la vez - las acciones no pueden ser exactamente repetibles - es lento Por estas razones se recurre a un control automático independiente del hombre para la modificación del rango dinámico. Aún así, se tienen algunas desventajas de utilizar control automático. Las unidades de control automático son sistemas electrónicos “feedforward”, es decir, sin retroalimentación. Se comentó anteriomente que lo sistemas sin retroalimentación son más propensos a ruidos y a distorsiones. Además, debido a la 200 naturaleza electrónica de las unidades dinámicas, existen ruidos eléctricos característicos de los dispositivos semiconductores que lo conforman muy difíciles de eliminar. Existen cuatro tipos de unidades dinámicas que modifican de alguna forma el rango dinámico de la señal y se clasifican en dos grupos: Compresores y Limitadores Compuertas y Expansores 3.5.1 Compresores Un compresor de audio es un procesador electrónico capaz de reducir el rango dinámico de la señal. Esto se hace atenuando la amplitud de señales (tensiones) superiores a una amplitud de referencia denominada umbral. VCA Entrada Salida Control de Ganancia Detector de Nivel Relación de Compresión Figura 107 Esquema del funcionamiento de un compresor El compresor funciona de la siguiente forma. El VCA es un amplificador controlado que posee una entrada por medio de la cual se pude variar la ganancia. Existe un Detector de Nivel que verifica continuamente si la señal de entrada supera o no un nivel de referencia establecido (umbral). Si el umbral no se supera, el VCA tienen ganancia unitaria (0dB). Si sí se supera el umbral, el VCA deberá modificar su ganancia de tal modo que el nivel que excede del umbral se reduzca en una proporción llamada relación de compresión. Por ejemplo, si la relación de compresión es de 3:1, un exceso de 15 dB se atenúa a un exceso de 5dB. A partir del umbral, el compresor se comporta como un amplificador de ganancia variable. El nivel de umbral y la relación de compresión son parámetros ajustables por el usuario y definen la forma en que actuará el compresor. 201 1:1 Entrada 2:1 3:1 ∞ :1 UMBRAL Salida Figura 108 Relación entrada-salida para un compresor A partir del gráfico se puede observar que antes del umbral, no hay ninguna modificación en la salida con respecto a la ganancia. Una vez alcanzado el umbral, el amplificador modifica la ganancia atenuando el exceso en dB de la señal con respecto al umbral. Nótese que la máxima compresión es la de ∞ :1 que corresponde a un limitador (los limitadores se discutirán posteriormente). La pendiente de la parte de la gráfica mayor al umbral es la relación de compresión. Cuando se sobrepasa el umbral, el VCA responde disminuyendo la ganancia. Sin embargo, el compresor no responde instantáneamente. Existen dos razones por lo cual ésto no sucede. Por una parte, el detector de nivel del compresor debe esperar un ciclo por lo menos para reconocer el nivel de la señal. De lo contrario, si la ganancia varía demasiado rápido se produce distorsión de la onda. Por otra parte, una variación brusca y abrupta de la ganancia produce un efecto auditivo claramente perceptible. Por estas razones, el compresor incorpora cambios graduales de la ganancia a través de un generador de envolventes. El generador tiene dos intervalos de transición: un intervalo inicial en el cual se llega de manera gradual a la ganancia establecida por la relación de compresión denominada ataque o “attack” y un intervalo final en el cual se regresa también de manera gradual a la ganancia original denominada relevo o “release”. 202 Compresión Ataque Relevo t tA tR Figura 109 Envolvente para la compresión En el diagrama de la envolvente se pueden distinguir dos tiempos importantes: el tiempo de ataque (tA) y el tiempo de relevo (tR). El tiempo de ataque es el tiempo que transcurre desde que se detecta una señal de alta intensidad que supera el umbral hasta que el compresor ajusta la ganancia a un valor determinado. Los tiempo mínimos de ataque oscilan entre 50 y 500 microsegundos mientras que los máximos oscilan entre 20 y 100milisegundos. El tiempo de relevo es el tiempo que transcurre desde que se detecta una señal de baja intensidad (menor al umbral) hasta que la ganancia del compresor vuelve a ser unitaria (0dB). El tiempo de relevo es mayor al tiempo de ataque; suele ser del orden de 60ms hasta inclusive entre 2 y 5 segundos. En algunos compresores también existe un tiempo de sostén o “hold”. Consiste en un retardo desde que la señal deja de superar el umbral y el instante que comienza el relevo. El objetivo de este retardo es evitar distorsiones en las señales de baja frecuencia. Existen otras características de los compresores que vale la pena mencionar. 3.5.1.1 Ganancia de salida. Los compresores poseen un control de ganancia para compensar las atenuaciones del compresor. Muchas veces en etapas previas se ha reducido la ganancia para no saturar al amplificador VCA con la señal de entrada. Después del proceso de compresión, es necesario restituir la ganancia mediante un control de ganancia (amplificador) a la salida del compresor. Es importante también este control para aprovechar el rango dinámico de los dispositivos que se conectan al compresor. 203 3.5.1.2 Codo (“Knee”). Algunos compresores tienen un control para regular la transición entre el estado de no procesamiento y el estado de procesamiento. Se puede tener una transición suave (codo suave o “soft knee”) o una transición fuerte (codo duro o “hard knee”). La transición suave es necesaria cuando la señal fluctúa alrededor del umbral donde la compresión se pude hacer muy notoria. Hacer una transición suave equivale a una compresión gradual. 3.5.1.3 Cadena Lateral (“Side Chain”). Los compresores permiten acceder exteriormente a la entrada de control mediante un conector de inserción. Esta entrada de control denominada “Side Chain” permite utilizar una señal externa para utilizar en el circuito de detección. Esto hace posible controlar la compresión de una señal por medio de otra. Este mecanismo, llamado “ducking” permite que se comprima una orquesta sinfónica en el momento que a parezca un solista o cuando comienza a hablar el presentador. También es posible mediante el “side chain” intercalar varios procesadores de tal forma que se comprima una señal procesada. Es común utilizar un ecualizador (como procesador previo). De esta forma, se puede utilizar el compresor como un de-esser; un dispositivo que comprime las altas frecuencias donde está presente la consonante “s” y de esta forma eliminar excesos de esta consonante frente al micrófono. Análogamente, se puede utilizar el compresor como anti-pop; un dispositivo que comprime las bajas frecuencias donde están los soplos y “pops” debido al manejo del micrófono. 3.5.1.4 Enlace estéreo (“Stereo Link”). El enlace estéreo es un mecanismo para procesar una señal de dos canales (“stereo”) de tal forma que se aplique compresión a ambos canales de igual forma y simultáneamente. Si esto no se hace, la imagen sonora cambia y se percibe que el sonido se desplaza de un lado hacia otro. 3.5.1.5 Bypass. Permite una conexión directa de la entrada a la salida sin pasar por el compresor. Esto hace posible comparar la señal original con la señal comprimida. 3.5.1.6 Medidores. En algunos compresores es posible encontrar indicadores luminosos que indican el estado de la descompresión así como la ganancia de la señal. 204 3.5.2 Limitadores Los limitadores son un caso especial de los compresores. Son compresores cuya relación de compresión es ∞ :1. Esta razón es válida únicamente en teoría porque es imposible atenuar indefinidamente el exceso sobre el umbral. Compresiones superiores a 10:1 son consideradas en la práctica como limitaciones. El limitador actúa como una barrera para todas las señales que superen el umbral. Esto se hace con el fin de evitar que los picos de la señal saturen al amplificador. 1:1 Entrada ∞ :1 Limitador Salida UMBRAL Figura 110 Relación entrada-salida para un limitador El limitador no recorta la onda como lo hace un amplificador cuando se satura. Simplemente reduce la ganancia de las señales que superen el umbral para llevar el nivel a un valor constante igual al umbral. La aplicación general de los compresores/limitadores es de reducir el rango dinámico de una señal. Esto se hace necesario en diversas situaciones: - cuando se requiera grabar sobre un sistema que no soporta tanto rango dinámico como la fuente original - como protección ante saturaciones - suavizar ataques - cuando se tengan instrumentos o voces con grandes rangos dinámicos y se desee minimizar las variaciones de nivel ocasionadas por cambios en la distancia entre la fuente sonora y el micrófono o por un aumento abrupto de la intensidad sonora 205 3.5.3 Compuertas El ruido en los sistemas de audio debe mantenerse en niveles muy bajos. El ruido propio de los componentes electrónicos es afortunadamente casi siempre inaudible. Sin embargo el ruido acústico captado por el micrófono sumado al ruido interno de éste son superiores al resto de los ruidos de los otros componentes. Este ruido se puede eliminar en gran parte utilizando un procesador dinámico llamado compuerta. La compuerta es un procesador que realiza la función inversa del limitador. Es básicamente un interruptor que conecta la entrada solamente si tiene el nivel suficiente para considerarse como señal. Cuando la entrada no tiene el nivel suficiente se considera como ruido y el interruptor se cierra. Esto mejora la relación señal a ruido (S/R) y por esta razón también se denomina compuerta de ruido. Una compuerta abierta equivale a una ganancia 1 (0dB) y una compuerta cerrada equivale a una ganancia 0 (- ∞ dB). Nivel de Entrada Umbral ruido t Compuerta Abre Cierra Abre t Figura 111 Funcionamiento de una compuerta Existe un umbral por debajo del cual la compuerta se cierra y por encima del cual se abre. El umbral debe ajustarse apenas por encima del ruido para no eliminar las señales de bajo 206 nivel. La compuerta se abre (conecta la salida a la entrada) cuando el nivel de la señal es superior al umbral y se cierra (desconecta la salida de la entrada) cuando el nivel de la señal es inferior al umbral. Sin embargo, este proceso en la práctica no puede ocurrir de esta forma por dos razones: - un cambio abrupto del estado de la compuerta provoca un efecto audible molesto - señales que fluctúan con niveles cercanos al umbral provoca que la compuerta se abra y se cierre repetidamente generando inestabilidad de la compuerta Para solucionar estos inconvenientes, se añaden dos elementos a la compuerta: una histéresis y una envolvente. La histéresis consiste en la existencia de dos umbrales distintos: el umbral de cierre y el umbral de apertura. El umbral de cierre solamente funciona cuando la compuerta está abierta. Cuando la señal se hace menor que este umbral, la compuerta conmutará al estado cerrado. Entonces, pasa a ser operativa el umbral de apertura. Es necesario superar el umbral de apertura para conmutar la compuerta a estado de apertura. Nivel de Entrada Umbral Apertura Umbral Cierre Compuerta Abre Abre Cierra Figura 112 Compuerta con dos umbrales 207 Nótese que debido a la existencia de dos umbrales (uno para cierre y otro para apertura), las fluctuaciones de la señal no genera conmutación lo que incrementa la estabilidad de la compuerta. La diferencia entre los dos umbrales se denomina ventana de histéresis. Esta debe seleccionarse mayor que las fluctuaciones promedio debido al ruido para que éste no conmute la compuerta innecesariamente. La envolvente en las compuertas, al igual que en los compresores, controla los cambios de conmutación de manera gradual. La ganancia se reduce de 1 a 0 gradualmente en un tiempo de relevo y vuelve a la ganancia original en un tiempo de ataque. La situación es análoga a la de compresión, pero con la diferencia que en la compuerta la envolvente representa ganancia. 3.5.4 Expansores Los expansores son dispositivos que convierten el rango dinámico de la señal que está por debajo del umbral en un rango dinámico mayor. Es decir, expande el rango dinámico. Existe un umbral por debajo del cual la señal es atenuada en un factor llamado relación de expansión. Por ejemplo, si una señal baja del umbral con una diferencia de 6dB y la relación de compresión es de 1:3, la salida del expansor deberá bajar a 6x3=18dB: atenúa los valores debajo del umbral. Es una variación de la compuerta en la cual la ganancia cuando se cierra la compuerta no es cero sino un valor intermedio entre 0 y 1. De hecho, la compuerta es un expansor en el cual la atenuación del expansor es infinita (relación de expansión 1: ∞ ). Los expansores/compuertas también al igual que los compresores tienen acceso a la cadena lateral mediante la cual pueden controlar la operación del dispositivo con una señal externa distinta a la señal que se quiere procesar. Algunos también poseen un enlace estéreo para poder efectuar la expansión de igual forma y simultánea a ambos canales. 208 Entre las aplicaciones de los expansores/compuertas pueden citarse - eliminación de ruido con las compuertas - restitución de señales excesivamente comprimidas - pares compresor-expansor se utilizan para eliminar ruidos de grabación 209 3.6 AUDIO DIGITAL El audio digital es una de las aplicaciones más importantes que han tenido las técnicas digitales respecto a la generación, el procesamiento, el almacenamiento y el análisis del sonido. Esto ha sido consecuencia de los progresos de la microelectrónica que ha podido revolucionar la forma en que se manejan y transforman cada vez con más precisión y rapidez la enorme cantidad de información contenida en el sonido. Una gran contribución de las técnicas digitales fue el desarrollo de sistemas de almacenamiento de sonido de gran inalterabilidad y fidelidad. Otra gran contribución fue la introducción de nuevas técnicas de procesamiento sonoro de naturaleza digital y efectos como retardos, reverberaciones y envolventes. Existen varias características que hacen al audio digital superior al audio análogo: durabilidad: La durabilidad de los datos obtenidos de un sistema digital son en teoría eternos pues pueden ser almacenados en diversos dispositivos de almacenamiento de memoria como ROM, disco duro y pueden ser recuperados a la voluntad del usuario en cualquier momento. Por oposición , los datos en un sistema analógico se guardan físicamente sobre un sustrato que es vulnerable al paso del tiempo. tiempo: En la reproducción analógica hay que prestar especial interés a los desfases y oscilaciones que pueden aparecer en el tiempo como el “flutter” y otras imperfecciones mecánicas naturales del sistema de reproducción . precisión: La precisión de un sistema basado en el audio digital es mayor que su contraparte análogo respecto a varios de los parámetros establecidos en capítulos anteriores: relación señal a ruido, separación entre canales, linealidad de la respuesta, etc. 3.6.1 Conversión análoga digital La conversión análoga digital es el método empleado para pasar del mundo continuo al mundo discreto. Se basa en digitalizar (volver en número) una muestra de alguna señal 210 continua. En términos generales, una señal análoga se puede convertir en digital combinando tres operaciones: muestreo, cuantificación y codificación. 3.6.1.1 Muestreo. El muestreo o “sampling” es un proceso en el cual se reemplaza una señal continua por una serie de muestras tomadas a intervalos regulares. La frecuencia con que se toman las muestras se denomina frecuencia de muestreo. a) b) Figura 113 Muestreo de una onda senoidal a)señal original b)señal muestreada Si la frecuencia de muestreo se incrementa, esto significa que se pueden obtener más muestras de la señal y la señal muestreada es fiel a la origina. De hecho, existe un criterio que se debe cumplir en todo proceso de muestreo. Este criterio se llama criterio de Nyquist y establece que la frecuencia de muestreo debe ser mayor que el doble de la máxima frecuencia presente en la señal a muestrear. fM>2fmax Si no se cumple el criterio de Nyquist, se produce “aliasing” una condición en la cual aparecen frecuencias que no se encontraban en la señal original . Por esta razón es muy importante respetar el criterio de Nyquist. Afortunadamente, existe un filtro denominado filtro anti-alias que elimina componentes altas de frecuencia alias. En audio digital, son muy comunes las siguientes frecuencias de muestreo: 24kHz, 30kHz, 44.1kHz, 3.6.1.2 Cuantización. Una vez la señal es muestreada, se procede a cuantizarla. La cuantización es el proceso en el cual se asigna un número a cada una de las muestras tomadas. La amplitud después del muestreo sigue siendo continua, y debe ser convertida a 211 amplitudes discretas. Para hacer esto, la amplitud de la señal de audio es representada por pasos discretos. La cuantización mas usual es la cuantización uniforme, en el cual cada nivel discreto de amplitud es igual al anterior y al siguiente. Sea x el número de bits. Por lo tanto, el número de niveles será: 2x 3.6.1.3 Codificación. Cada nivel discreto de amplitud producto de la cuantización se representa mediante un número binario. Dependiendo del número de bits utilizados, se logra mayor resolución. 111 110 101 100 011 010 001 000 Figura 114 Cuantización y codificación de una muestra 3.6.2 PCM PCM es modulación por codificación de pulsos. PCM es básicamente una técnica de muestreo para digitalizar señales análogas, en especial audio. PCM muestrea la señal 8000 veces por segundo y cada muestra está representada por 8 bits para un total de 64kbps. El audio digital con PCM permite la transmision de audio vía microondas, satélite, láser, fibra óptica, etc. Los procesadores PCM tomand dos canales de audio y los convierte en señales tipo video que puede ser transmitida con altísima confiabilidad y fidelidad. PCM es una técnica que suministra mejores valores de señal a ruido y de rango dinámico cuando se compara con otras técnicas análogas para transmisión sonora 212 3.6.3 Dither Cuando se muestrean y codifican señales de bajo nivel, se produce distorsión en la onda de salida. Esto es en parte por errores de cuantización al aproximar una señal muestrada al nivel más cercano. Para solucionar esto, se utiliza “dithering” que es agregarle ruido a la señal. Si se agrega ruido a la muestra señal de manera más o menos uniforme, esto forza a los niveles bajos truncados al próximo nivel. De esta forma, los bits menos significantes representarán el ruido (“dither”), pero los niveles bajos originales de la muestra pasan al umbral siguiente (bits más significativos). En resumen, se añade ruido para rellenar espacios vacíos en el espectro para suavizar los errores de cuantización, 3.6.4 Efectos de audio digital Los procesadores como los compresores y las compuertas procesaban la totalidad de la señal que pasaban a través de ellos. En cambio, en los procesadores de efectos se mezcla la señal procesada de alguna forma (“wet”), con la señal sin procesar (“dry”). El resultado es lo que comunmente se denomina como efecto. Los efectos brindan mayores posibilidades expresivas, dinámicas y sonoras en general al alterar diversos parámetros de la onda sonora como amplitud, envolvente, espectro, etc. A los procesadores que procesan la señal en su totalidad se denominan efectos en serie o efectos de inserción. Por el contrario, se le denomina efectos en paralelo a los procesadores de efecto propiamente dichos. a) entrada efecto salida b) entrada Σ salida efecto Figura 115 Esquema general de un procesador de efecto a) efecto serie b) efecto paralelo 213 Tabla 8 Algunos efectos en serie y en paralelo Efectos en serie Efectos en paralelo Ecualizador de bandas Retardo Ecualizador paramétrico Reflexiones tempranas Compresor Reverberación Compuerta Ambiencia Expansor Coro Limitador Flanger Vibrato Phaser Wah-wah Trémolo Distorsión Resaltadores Excitadores Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004. 3.6.4.1 Retardo digital. La función de este dispositivo consiste en retardar una señal un tiempo determinado TD generalmente ajustable. El retardo consiste en grabar digitalmente en una memoria y leerla después. Esto consta de un conversor análogo digital, un conversor digital análogo, una memoria RAM y un reloj. Es útil para realizar múltiples efectos. De ahora en adelante, el retardo se representa por el siguiente bloque funcional: Retardo (TD)) Figura116 Retardo digital 3.6.4.2 Eco sencillo. El eco consiste en la repetición de un sonido a causa del retardo entre la onda directa y la reflejada (>100ms) Σ Retardo (TD)) Figura 117 Eco sencillo 214 3.6.4.3 Eco múltiple. El eco múltiple es el resultado de varias reflexiones, por ejemplo entre superficies paralelas opuestas. El esquema es similar al anterior. Σ Σ Retardo (TD)) Figura 118 Eco múltiple 3.6.4.4 Trémolo. El trémolo es un efecto que consiste en una fluctuación periódica de la amplitud. La frecuencia de la fluctuación se logra por medio de un oscilador de baja frecuencia. (LFO por sus siglas en inglés: Low Frequency Oscillator). La oscilación del LFO es inyectada en la entrada de control de un amplificador controlado por tensión. (VCA) para de esta forma modular la amplitud. Este efecto es muy utilizado en algunos sonidos sintetizados ya que ayuda a brindar una mayor expresividad del sonido. Σ VCA LFO Figura 119 Trémolo 3.6.4.5 Vibrato. Vibrato es un efecto que consiste en una vibración periódica de la frecuencia del sonido. Para conseguir este efecto, se introduce un retardo al efecto del trémolo. Al retrasar la señal se produce una reducción aparente de la frecuencia, similar a la frecuencia aparente en el efecto Doppler. 215 Retardo (TD)) LFO Σ Figura 120 Vibrato 3.6.4.6 Coro. El coro es un efecto de la suma de una señal sin procesar con esa señal con vibrato. El resultado es una señal con envolvente irregular que simula instrumentos o voces al unísono Retardo (TD)) LFO Σ Σ Figura 121 Coro 3.6.4.7 Wah-wah. Este efecto se obtiene al modularla frecuencia de corte de un filtropasabajos por medio de un LFO. De esta forma se permite el paso de mayor o menor cantidad de armónicos dependiendo si el LFO esté pasando por un máximo o por un mínimo. LFO frecuencia de corte central Σ Figura 122 Wah-wah 216 3.6.4.8 Phaser. Este efecto está dentro de los que se obtienen modulando un filtro. En este caso, se trata de un filtro pasabanda de banda estrecha cuya frecuencia central es modulada por el oscilador de baja frecuencia. Esta configuración da la sensación de cancelación de la onda. Σ LFO frecuencia de corte central Σ Figura 123 Phaser 217 4. FORMATOS DE GRABACIÓN 4.1 ORÍGENES La primera grabación de sonido fue realizada por Thomas Edison en el año de 1877 en un repetidor telefónico. Ese mismo año, el señor Edison se inventó el fonógrafo (Reproductor de discos), un equipo mas complejo en el cual el sonido pasaba de la bocina a la boquilla central, provocando la vibración del diafragma. El punzón de este equipo grababa en surcos en una fina lámina de latón que recubría el tambor giratorio. Simultáneamente, el fonógrafo contaba con un segundo punzón y diafragma que podían acoplarse para reproducir la grabación. Figura 124 Fonógrafo Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.1.1 Cilindro de Edison Con este cilindro rotando a una velocidad de 90 rpm era posible registrar casi 4 minutos de voz hablada. Los primeros cilindros se podían reproducir unas doce veces. Después era necesario suavizarlos para volver a ser grabados. 218 Figura 125 Cilindros de Edison Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.1.2 Alambre En este tipo de almacenamiento de audio análogo, la grabación se hacía en alambre delgado que podía ser reproducido por horas. Los carretes de alambre se grababan y reproducían a 24 pulgadas por segundo. Una hora de sonido gastaba 7200 pies de alambre. El auge de este tipo de grabación fue en los años 30 y 40 fue remplazado posteriormente por la cinta magnética. 4.1.3 Gramófono Inventado por el alemán Emile Berliner en 1887 y denominado en un principio como fonógrafo, este instrumento electromecánico reproducía discos de vinilo grabados con surcos en espiral con pequeños realces en ambas caras. El gramófono consta de un plato giratorio, un brazo, la aguja y el amplificador, aunque éste último no siempre iba incorporado al instrumento. Fueron denominados posteriormente como tocadiscos. Figura 126 Gramófono Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 219 4.1.4 Disco 78 Las primeras grabaciones en este formato (78 revoluciones por minuto) fueron comercializadas en 1885, fecha a partir de la cual se convirtieron en el medio de grabación mas popular, reemplazando el cilindro de Edison por ser más económico, menos frágil y más fácil de almacenar. Fueron construidos en un principio con ebonita, material que posteriormente fue reemplazado por el shellac o la goma laca. Este material se obtenía a partir de un líquido que segregaba el insecto Laca o Laccifer Lacca, el cual habitaba en las selvas de Asma, India y Tailandia. Figura 127 Disco 78 Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.1.5 Disco de vinil Construido en cloruro de polivinilo (de ahí su nombre), y de 30 centímetros de diámetro, el disco de vinil reemplazó los discos fonográficos que se usaban desde 1895 porque era irrompible, lo cual le brindaba una ventaja. La calidad de sonido en este tipo de formato depende de la calidad del vinilo usado para su fabricación. En la mayoría de aplicaciones se usaba vinilo reciclado, lo cual daba una menor calidad. Para obtener mejor fidelidad de audio se usaba vinilo virgen o “pesado” 220 como se le conoce. En la actualidad todos los discos de vinilo son fabricados con vinilo virgen. Figura 128 Disco de vinil Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 221 4.2 REGISTRO MAGNÉTICO ANÁLOGO El registro magnético hace referencia al registro de señales en algún soporte basado en la magnetización. Hay sustancias en la naturaleza que son imanadas (adquieren el carácter de un imán) bajo el efecto de un campo magnético. Estas sustancias son sustancias ferromagnéticas. La imanación en las sustancias ferromagnéticas sigue un proceso de histéresis, en el cual la exposición a un campo magnético y su posterior retiro deja un magnetismo residual en la sustancia, denominada magnetismo remanente. El principio de registro magnético es utilizar ese magnetismo remanente para almacenar información proveniente de una señal de audio (corriente alterna). Existen formatos análogos y digitales según sea la información a grabar. Algunos formatos análogos incluye a la cinta y al cassette y formatos digitales a DAT y 8mm. El proceso de registro magnético básicamente se divide en dos subprocesos: grabación magnética y reproducción magnética. 4.2.1 Grabación magnética El principio de la grabación magnética es el de generar una fuerza magnética proporcional a la señal a grabar y aplicarla mediante el cabezal de grabación en una pequeña región de una cinta recubierta de partículas ferromagnéticas. El cabezal es el elemento encargado de producir la fuerza. El cabezal está compuesto por una bobina, el núcleo y el entrehierro. Cuando una corriente i pasa a través de la bobina, se produce un campo magnético en el cabezal, más específicamente en el entrehierro. Este campo varía en intensidad y polaridad de acuerdo con los cambios de la señal (i). El máximo flujo magnético coincide con el máximo de la señal i. La cinta magnética se desplaza a una velocidad constante por debajo del cabezal. Las partículas ferromagnéticas son afectadas por el campo magnético constantemente variable en el entrehierro. Estas son orientadas magnéticamente a medida que se desplaza la cinta. Debido a la naturaleza ferromagnética de las partículas, la cinta es imanada de forma permanente (magnetismo remanente). En definitiva, el movimiento de la 222 cinta continúa y las variaciones de señal quedan registradas como una serie de impulsos magnéticos que dependen de la intensidad, polaridad y frecuencia de la señal. cabezal magnético cinta Figura 129 Mecanismo de grabación del cabezal sobre la cinta Fuente: MIYARA, Federico. Registro magnético. Bogotá: Fundación Decibel, 2004 4.2.2 Reproducción magnética La idea de la reproducción magnética es inversa a la de grabación. Al pasar la región magnetizada frente al núcleo de la bobina, existe un flujo variable y se genera una fuerza electromotriz. Esta fuerza electromotriz es variable y corresponde a la señal previamente grabada. 4.2.3 Factores que intervienen en el proceso de grabación/reproducción 4.2.3.1 Variación de la impedancia de la cabeza de grabación. La cabeza magnética es una bobina enrollada a un material ferromagnético. Por lo tanto, su impedancia es reactiva y varía con la frecuencia. Se suele disponer de una resistencia de gran valor en serie con la bobina que permite estabilizar la intensidad que circula por el conjunto. 4.2.3.2 Relación señal a ruido. Este factor es de gran importancia en todos los sistemas de transmisión sonora. En el registro magnético, existe ruido tanto en el cabezal como en el soporte magnético (cinta). El ruido de las cabezas magnéticas proviene de campos magnéticos cercanos. El ruido de la cinta es inherente a la construcción de ésta. Se pude 223 aumentar la relación señal a ruido si se aumenta la superficie de la pista grabada o aumentando la longitud del entre hierro. 4.2.4 Componentes de las cintas magnéticas Las cintas magnéticas de audio se componen de una base de poliéster y una serie de capas superpuestas de distinta composición química y de diversa flexibilidad y resistencia a la tracción. Estos elementos son: - Base de poliéster (polietilterephtalato, Mylar). - Adhesivo aglomerante (poliuretano). - partículas de óxidos metálicos (dióxido de cromo, dióxido de hierro, etc.), que están integradas en el adhesivo (en las cintas de alta calidad, se incorpora adicionalmente una sustancia antifúngica para prevenir la proliferación de hongos). - capa inferior de carbono, para proteger la cinta de arañazos, minimizar las cargas de electricidad estática y disminuir los rozamientos mecánicos. 4.2.4.1 Efectos del calor. La temperatura afecta las cintas magnéticas, haciendo que éstas se expandan y se arruinen. Perdiendo su aglomerante a causa de la exposición al calor. 4.2.4.2 Pérdida del aglomerante. La humedad del ambiente es absorbida por el aglomerante causando hidrolización. Este fenómeno deja residuos pegajosos en las cabezas de reproducción ocasionando que se traben. 224 4.2.5 Formatos 4.2.5.1 Cinta abierta. Primer formato usado por los pioneros alemanes de AEG en sus magnetófonos en 1934. A pesar de la aparición de la cinta en cartucho o cassette en 1963, el formato de carrete abierto fue el medio preferido por los profesionales del audio hasta 1980, fecha en la cual apareció el audio digital. 4.2.5.2 Cartucho RCA. En 1958 la RCA (Radio Corporation of America) introdujo este tipo de formato como un primer intento de introducir la cinta dentro de un contenedor que fuera portátil y más cómodo de transportar. Las medidas de este cartucho eran de 5’’ x 7 1/8’’ x ½’’ y su velocidad era de 3 ¾’’ pulgadas por segundo, obteniéndose 30 minutos de audio en una cinta de ¼’’, o de 7/8 pulgadas por segundo moviendo una pequeña palanca en el dispositivo reproductor y grabador. RCA fracasó en su intento de popularizar este formato y para 1960 abandonó su producción. Figura 130. Cassette RCA Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.2.5.3 Cartucho de cuatro pistas. Este formato fue desarrollado en 1954 por George Eash, pero fue hasta el año de 1956 que Earl “Madman” Muntz, un mercader de autos usados, vio la oportunidad de incrementar la venta de autos implementando un sistema capaz de reproducir este tipo de formatos, mejorando los sistemas actuales que sólo tenían 225 radio. El Cartucho de 4 pistas fue popular en los automóviles, pero no tuvo un gran auge por el pronto lanzamiento del cartucho de 8 pistas y el cassette compacto, que lo desplazó definitivamente del mercado. 4.2.5.4 Cartucho de 8 pistas. Ahora obsoleto, este formato tuvo su mayor auge en los años 60s y 70s. La idea de crear los cartuchos de 8 pistas surgió cuando su creador, Bill Lear, dio un paseo a bordo de uno de los automóviles que poseían sistemas de reproducción de cartuchos de 4 pistas. Fue así como propuso a Ampex, Ford, Motorola y RCA Records que juntos con su compañía Lear Jet, desarrollaran un sistema de audio para autos de lujo. Los cartuchos de 8 pistas o Estereo-8 fueron desarrollados en 1956 y consistían de un carrete donde se enrollaba la cinta, la cual tenía sus dos extremos adheridos a un trozo de cinta de lámina conductiva metálica de manera que se formara un “loop” continuo. Cuando la cinta metálica pasaba a través de un par de contactos cercanos a la cabeza de lectura del equipo reproductor, se enviaba una señal que indicaba terminación de la pista y la cabeza lectora se desplazaba a la siguiente pista, permitiendo una reproducción continua sin necesidad de rebobinar. Fue el primer formato en utilizar la automatización para obtener una reproducción continua. Figura 131 Cartucho de ocho pistas Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.2.5.5 Play Tape. En 1966 el formato dominante del mercado era el cartucho de 8 pistas, aunque no era lo suficientemente pequeño como para considerarlo portátil. El Playtape, nombre que llevaban tanto el reproductor como el formato, tenían la virtud de ser en 226 realidad portátiles, llegando a considerarse como el reemplazo del radio de transistores o mas bien convirtiéndose en una alternativa de éste. El creador del Playtape, Frank Stanton, concibió la idea durante los años 40s mientras prestaba servicio en la marina de los Estados Unidos durante la segunda guerra mundial, pero fue hasta 1966 que Sears y MGM records, después de perfeccionar el primer modelo funcional adquirido años antes de Stanton, presentaron al mundo desde Nueva York el Playtape con un éxito casi inmediato. Figura 132 Play-tape Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.2.5.6 Audio cassette compacto. Medio de almacenamiento análogo presentado por la compañía Phillips en el año de 1963. Se compone de una tira de cinta BASF enrollada dentro de una cubierta protectora de plástico la cual tiene dos lados conocidos como A y B. Este formato que un principio no fue concebido para comercializarse, adquirió una popularidad tal que aún en la actualidad es utilizado. Su tamaño compacto, fiabilidad, bajo costo de manufactura y capacidad de grabar audio estereo le dio a este formato gran aceptación en el mercado. Para 1965 se comenzó su producción en masa aunque su popularización no fue inmediata, fue sólo hasta principio de los años 70s que se convirtió en el formato de cinta magnética más utilizado. En un principio la cinta se fabricó en ferrita (Fe2O3), pero luego se usaron otros materiales como el dióxido de cromo (CrO2) y el metal para obtener mejor calidad en el sonido. Fueron utilizados igualmente sistemas de reducción de ruido que se implementaban tanto 227 en grabadoras como en las máquinas reproductoras, de los cuales el más conocido es el Dolby Noise Reduction (Dolby NR). Figura 133 Audio cassette compacto Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.2.5.7 Microcassette. Es un formato que posee las mismas características de un cassette compacto pero con la diferencia de ser más pequeño y poseer una velocidad de grabación más lenta, lo que implica que debe ser grabado exclusivamente en grabadoras de microcassette. Figura 134 Microcassette Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.2.5.8 L-Cassette. El L-Cassette fue un formato de corta vida creado por la compañía Sony en 1976 con la intención de superar la calidad del cassette compacto, el cual no presentaba la misma fidelidad del carrete abierto. El L-Cassette era muy similar al cassette compacto, sólo que más grande. 228 4.3 REGISTRO DIGITAL La ventaja del audio digital sobre el audio análogo respecto al almacenamiento es que la información se codifica digitalmente haciéndola virtualmente incorruptible por sistemas de ruido y distorsión propios de los medios de almacenamiento. Los sistemas de grabación digital han sido ampliamente difundidos últimamente debido a sus características inherentes como calidad, fidelidad e inalterabilidad del sonido. Existen varias clasificaciones para los sistemas de grabación digital. Se pueden clasificar según el fenómeno físico involucrado, y de esta forma tener sistemas: - electrónicos (memorias) - magnéticos (cintas, DAT) - ópticos (CD, DVD, minidisc) También se pueden clasificar según el acceso temporal en: - temporarios (RAM) - editables (cinta, discos magnéticos) - definitivos (CD de solo lectura, ROM) En esta sección se analizarán las tecnologías más difundidas actualmente en el mercado, atendiendo a sus características más relevantes. 229 4.3.1 Compact Disc 4.3.1.1 Origen. En 1968, durante la Digital Audio Convention, Phillips decidió proyectar el disco compacto. Es un formato fabricado con Policarbonato. En 1979 nace el Disco Compacto de Audio y con él la primera revolución en la era digital. En 1980 se estandariza el formato CD-DA. Posteriormente en 1983 se fabrica el CD-ROM como medio de almacenamiento masivo de datos de sólo lectura, constituyendo la segunda revolución digital. En 1984 se presenta el Libro Amarillo para el formato CD-ROM, para luego editarse el Libro Verde para especificar el estándar CD-I (Disco Compato Interactivo que combina video y sonido esterofónico). En el año de 1990 se publica el Libro Naranja para especificar el formato de disco grabable, el primero en aparecer es el CD-MO (Magneto-Ópticos), seguido por el CD-R que puede almacenar hasta 650 MB. (no puede ser borrado ni volver a grabarse). Finalmente, llega el CD-RW, el cual permite grabar y borrar datos hasta 1000 veces. 4.3.1.2 Sistema de lectura. El mecanismo de lectura del CD se basa en la utilización de un fotosensor y un fotodiodo emisor de láser. Visto desde abajo, un CD presenta un espiral con fosas (“pits”) y llanuras (“lands”) en un material aluminoreflectante. Un haz de láser incide sobre el material que es reflejado en mayor o menor grado dependiendo si incide en el borde de la fosa o no. El foto sensor detecta ésto como un uno o un cero dependiendo del grado de intensidad de la reflexión. La pista de un CD es leída desde el interior del disco hacia el exterior, permitiendo discos de tamaño variable y maximiza el rendimiento de producción. La pista se lee a 1,2 m/s, de forma que los bits tienen duración constante, exigiendo que el disco gire a menor velocidad angular cuando se esté leyendo la periferia que cuando se lee el centro. Esta función la realiza un servo motor de velocidad lineal constante (CLV), apoyándose en la señal leída por los fotodetectores. • El foco debe mantenerse con precisión de ±0.5 µm. • La superficie de un disco tiene desviaciones de ±0.4 µm 230 • Es necesario un mecanismo de enfoque que mueva el objetivo de forma automática para mantener el foco. 4.3.1.3 Formatos CD • CD-DA (Compact Disc Digital Audio –Libro Rojo) Pertenece al Libro Rojo y fue desarrollado por Phillips y Sony a principios de los años 80s. Está destinado al formato de audio. • CD-ROM (ISO 9660 - Libro Amarillo) Este formato es el utilizado habitualmente para datos. Su denominación fue plasmada en la norma ISO 9660, norma para la estructura de archivos en un disco compacto. • CD-I (Interactive – Libro Verde) Formato multimedia que integra texto, gráficos, video, audio y datos binarios (juegos, enciclopedias, películas, etc) • CD-ROM XA (Extended Architecture) Combinación del formato CD-ROM y el CD-I, extensión del estándar Yellow Book, consistente con el formato ISO 9660, pero diseñado para mejorar las capacidades de audio y video (tomadas del estándar CD-I). Puede ser utilizado para el almacenamiento de datos solamente. • CD-R (Multisession –Libro Naranja) Derivación de los formatos anteriores, a efectos de ser utilizados en grabadores de CD-ROM y aprovechar de este modo la posibilidad de agregar datos a un CD-ROM • CD-RW (Multissesion –Libro Azul) Similar a la norma definida por el Libro Naranja. La diferencia es que agrega la posibilidad de realizar una multisesión con datos y audio. Al ser el formato más moderno puede presentar inconvenientes de reconocimiento en varias lectoras. 231 Tabla 9 Velocidades de transferencia para CD convencional 1X 2X 4X 6X 8X 10X 12X 16X 20X 24X 32X 150 KB/s 300 KB/s 600 KB/s 900 KB/s 1200 KB/s 1500 KB/s 1800 KB/s 930 KB/s 2400 KB/s 1170 KB/s 3000 KB/s 1400 KB/s 3600 KB/s 2100 KB/s 4800 KB/s Figura 135 Compact disc Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.3.2 Digital Audio Tape (DAT). Digital Audio Tape es, como su nombre en inglés lo indica, una cinta de audio digital. Es un formato de audio grabable introducido por la compañía Sony a final de los 80. La intención era reemplaza en definitiva al cassette compacto, pero no obtuvo la popularidad esperada, especialmente por la introducción de los sistemas ópticos (CD). Sin embargo, DAT hoy en día se utiliza principalmente en estudios profesionales de grabación. DAT surgió por la necesidad de un gran ancho de banda para el registro magnético de señales de audio digital. El estándar DAT permite grabar a una tasa de 32kHz a 12 bits en 2 pistas, 44.1kHz o 48kHz a 16 bits en 2 o 4 pistas. A menor tasa de grabación, mayor duración de grabación pero menor calidad. DAT supera al cassette convencional por el gran 232 ancho de banda que tiene que le permite grabar una porción mucha más amplia del espectro. Además, debido a su naturaleza digital, es fácil reproducir una pista específica y/o rebobinar. 4.3.2.1 Funcionamiento. El DAT tiene, a diferencia de los formatos análogos magnéticos convencionales, un cabezal magnético rotativo. Esto permite tener una velocidad relativa más grande entre el cabezal y la cinta lo que permite tener un ancho de banda superior para la grabación. Figura 136 DAT Cinta de audio digital Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.3.3 Digital Compact Cassette(DCC) El cassette compacto digital es otro formato digital en cinta magnética. Fue introducido por Philips en 1991. DCC difiere de DAT básicamente por dos razones. Primero, emplea una cabeza magnética estática. Segundo, utiliza un algoritmo de compresión de datos. 4.3.4 DASH Es un formato digital magnético. Es un formato versátil que acepta varias frecuencias de muestro, velocidades de cinta y número de pistas. 233 4.3.5 Minidisc Como su nombre lo indica, minidisc es una versión pequeña del CD. El objetivo es disponer de la misma cantidad de audio que un CD en un área menor. Para ésto se utiliza una tecnología óptico magnética. Se magnetiza una película delgada. La lectura de la película hace uso del efecto Kell, por el cual un campo magnético introduce una rotación en la polarización del haz láser. El cambio de polarización es detectado en forma similar al CD. Este formato utiliza compresión psicoacústica. Figura 137 Minidisc Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.3.6 DVD (Digital Versatile Disc) DVD es un medio óptico de almacenamiento de todo tipo de información (video, datos, sonido, etc.). El mecanismo de lectura y escritura es similar a la del CD, pero en el caso de DVD los “lands” y los “pits” son mucho más pequeños lo que se traduce en mayor información almacenable. DVD no es un medio exclusivamente diseñado para el sonido sino para datos en general. Existen variedades de formatos de DVD: DVD-RAM, DVD-R (grabable una vez), DVD-RW (regrabable) 234 Figura 138 DVD Digital Versatile Disc Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 4.3.7 Blu-Ray Blu-ray es otro medio óptico de almacenamiento de todo tipo de información. Sin embargo, utiliza un tipo de láser distinto al utilizado por el CD y por el DVD. Utiliza un haz de rayo azul-violeta que tiene una longitud de onda más corta que el láser rojo convencional. De esta forma, el láser puede ser concentrado en espacios más pequeños y por ende, se puede grabar más información. Figura 139 Blu-ray Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003 < http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005] 235 4.3.8 HDVD (“High definition volumetric display”) HDVD es el resultado de la fusión entre las compañías Sonic y Revisent. Es básicamente un formato de almacenamiento masivo que supera al DVD convencional. La resolución de HDVD es cuatro veces superior lo que permite una alta definición. Es actualmente la competencia directa de Blu- Ray. 236 5. CONCLUSIONES El curso Principios de Audio le abre las puertas a los estudiantes de Ingeniería Electrónica e Informática para comenzar una nueva ruta electiva en el vasto terreno del audio. Este proyecto es una pieza fundamental para la continuidad de los cursos y está orientado a el diseño de una metodología óptima para la enseñanza. Es necesario un fundamento teórico sólido para abordar la inmensidad de temas relacionados con el sonido y la acústica. Por esta razón, aquellos ingenieros con propósitos de incursionar en temas avanzados en sonido y acústica encontrarán en este libro un apoyo conceptual que les servirá como un importante punto de partida. Los temas presentados en el texto fueron compendiados de acuerdo a criterios de enseñanza en pregrado. Sin embargo cabe aclarar que cada uno de los temas puede ser explorado e intensificado mucho más en términos de complejidad matemática y física y de nuevas tecnologías. Aún así, el texto trata de manera exhaustiva y con un grado alto de profundización los temas seleccionados. La manera más óptima de exponer los temas tratados en el libro es a través de recursos que permitan la participación entusiasta del estudiante: presentaciones con diapositivas, ejemplos sonoros, simulaciones, animaciones, videos, etc. Además, la parte teórica del curso debe ir acompañada de una parte de laboratorio para aplicar los conceptos aprendidos. 237 BIBLIOGRAFÍA BORÉ, Gerhart and PEUS, Stephan. Microphones. Berlin: Druck-Centrum Fürst, 1999. 78p. BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de electrónica., 1995. 260p. CASTAÑEDA, Carlos y RODRÍGUEZ, Juan. Audio digital. Medellín.1985. 212p. Tesis. (ingeniero electrónico). UPB. Facultad de Ingeniería Eléctrica y Electrónica. CORREA, Juan. Electrónica musical. Medellín. 1999. 183p.Tesis. (ingeniero electrónico). UPB. Facultad de Ingeniería Eléctrica y Electrónica. MARTIN, Geoff. Introduction to sound recording. sl:sn. 2004, 843p. MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004. 319p. MOMPÍN POBLET, José. Manual de alta fidelidad y sonido profesional. Barcelona: Marcombo, 1984. 241p. (serie Mundo Electrónico) RECUERO LÓPEZ, Manuel. Ingeniería acústica. Madrid: Paraninfo, 1995. 654p. SAPOSHKOV, M.A. Electroacústica. Barcelona: Reverté, 1983. 273p. WATKINSON, John. An introduction to digital audio. Londres: Clays, 1995. 385p. 238 ANEXOA Principios de audio José Ricardo Zapata Jorge H. Jaramillo Hoyos Facultad de Ingeniería Electrónica de la UPB Abstract—This article describes the most relevant aspects of an introductory course in audio. The first part includes an introduction to sound with emphasis on its wavelike nature. Also, the human mechanisms of voice production and hearing are discussed pointing out physical and physiological characteristics. After the introduction, an overview of acoustics, as an independent branch of physics, is presented. Acoustics, as a multidisciplinary field is very broad so only four topics shall be analyzed: psychoacustics, architectural acoustics, musical acoustics, and acoustic noise. After studying acoustics, several audio processing devices are described: microphones, loudspeakers, compressors, etc. as well as an introduction to digital audio. Finally, modern recording techniques are presented along with a brief history of its origin. I. GENERALIDADES DEL SONIDO U na onda es un ente físico que permite la propagación de energía entre dos puntos sin necesidad de transferir masa. Las ondas mecánicas son aquellas que necesitan de un medio elástico (aire por ejemplo) para su propagación. Existen dos tipos básicos de ondas mecánicas: -ondas longitudinales: Ondas en el cual el movimiento de las partículas es paralelo a la dirección de propagación. -ondas transversales: Ondas en el cual el movimiento de las partículas es perpendicular a la dirección de propagación. El sonido es un ejemplo de onda mecánica longitudinal y por eso de ahora en adelante se referirá a este tipo de ondas. El sonido tiene su origen en las vibraciones en un medio elástico, es decir, las vibraciones deben ocurrir en un medio que sea capaz de transmitir esas vibraciones. Estos son los dos elementos esenciales para la existencia de un sonido: • un ente vibrante • un medio con capacidad de transmitir esas vibraciones (Existe un tercer elemento, la capacidad humana de percibir esas vibraciones, relacionado con un campo fundamental de la acústica (la psicoacústica) el cual será tratado posteriormente.) El ente vibrante puede ser de naturaleza muy diversa como: las cuerdas vocales en la garganta, las cuerdas de un violín, una descarga eléctrica, golpes, pájaros, etc. El medio también es de índole muy variada como aire, madera, agua, metal, etc. (siendo el aire el medio elástico más común). Las ondas sonoras son ondas longitudinales de presión. Sin embargo, para poder representarlas gráficamente, se dibuja una onda transversal ya que es más fácil de visualizar. Para hacer ésto, los movimientos característicos de una onda longitudinal hacia adelante y hacia atrás se representan por movimientos por encima y por detrás de una línea de referencia que corresponde a la posición de reposo. posición de reposo Fig. 1 Onda de presión (sonora) 239 Las flechas en la figura representan los desplazamientos de las partículas de aire en sentido longitudinal, aunque aparecen en la gráfica en sentido transversal (solamente por facilidad visual). El análisis de las ondas sonoras se puede realizar en el dominio del tiempo o en el dominio de la frecuencia. El análisis en cada dominio tiene características complementarias y se puede intercambiar de dominios utilizando las técnicas de Fourier. Todas las ondas periódicas se pueden sintetizar a partir de la función seno mediante el Análisis de Fourier. Jean-Baptiste Joseph Fourier, barón de Auxerre (1768-1830), desarrolló un tipo de análisis matemático por el que cualquier onda periódica compuesta, puede descomponerse en una suma de ondas senoidales de amplitud, frecuencia y fase adecuadas. Las frecuencias de estas ondas senoidales guardan una relación estrecha pues son todas múltiplos enteros de la frecuencia fundamental. Es decir, cualquier función periódica se puede escribir como una sumatoria (finita o no) de términos seno pues estas funciones son base ortogonal para el espacio de las funciones periódicas. El espectro de estas señales (es decir el conjunto de frecuencias asociadas) es discreto: contiene solo los múltiplos enteros de la frecuencia fundamental. Las ondas se pueden clasificar de acuerdo a su geometría. El criterio es la forma del frente de onda. El frente de onda es el lugar geométrico de los puntos en un medio que se encuentran en un mismo estado vibratorio en un instante dado. Dependiendo de la forma del frente de onda, se tendrán distintos tipos de ondas: planas, esféricas y cilíndricas. Las siguientes propiedades son características de todas las ondas, pero en el sonido cobran gran relevancia al explicar varios efectos que serán explicados en posteriores capítulos. Estas propiedades son: - Principio de Huygens Teorema de Malus Superposición Reflexión Refracción Absorción Interferencia - Difracción Efecto Pulsatorio Efecto Doppler Resonancia II. VOZ HUMANA La fuente del sonido para la voz humana es la vibración de las cuerdas vocales y efectos adyacentes producidos por todo el tracto vocal: laringe, faringe, boca y cavidad nasal. El principio físico relevante para la producción de sonido en el hombre es el de Bernoulli. Este principio establece que en el movimiento de un fluido la presión es menor en lugares donde la velocidad es mayor, y viceversa. La diferencia de presiones ocasiona una fuerza efectiva, llamada fuerza de Bernoulli. En el caso de las cuerdas vocales, el aire que pasa a través de ellas proveniente de los pulmones hace que las cuerdas vocales se cierren. Inmediatamente después que éstas se cierran, presión de aire se acumula en la tráquea haciendo que se vuelvan a abrir nuevamente. Este ciclo se repite una y otra vez. La tasa a la cual se abre y se cierran las cuerdas vocales determina la frecuencia de los sonidos resultantes. El sistema vibratorio produce una rápida oscilación de la presión de aire en el aparato vocal generando. La voz también está determinada por las posiciones de los labios, la mandíbula, la lengua y la laringe. Fig. 2 Diagrama del tracto vocal 240 De acuerdo con lo expuesto, el órgano de la voz se puede dividir en tres grandes unidades que son: - los pulmones que aportan energía - las cuerdas vocales que actúan como osciladores al vibrar el tracto vocal completo que actúa como una caja de resonancia III. EL OÍDO HUMANO El oído humano es uno de los órganos más impresionantes del cuerpo pues posee un rango increíble de sensibilidad, tanto en frecuencia como en amplitud. El oído responde a frecuencias entre 20Hz y 20kHz y responde a una rango de variación de presiones de 1,000,000 a 1. El fenómeno de la percepción sonora en los humanos es un proceso complejo que requiere un análisis que se desarrolla en tres etapas básicas: • • • captación de las ondas sonoras conversión de la señal acústica en impulsos nerviosos y la transmisión de esos impulsos hasta el cerebro procesamiento neural de la información Las primeras dos etapas se producen en el oído mientras que la última ocurre en el cerebro propiamente dicho. Las variaciones de presión del aire causadas por las ondas sonoras se convierten en vibraciones mecánicas que a su vez producen vibraciones de un fluido. Estas generan impulsos eléctricos, y el cerebro los transforma en sensaciones auditivas. Solamente se discutirá la fisiología del oído, el cual se divide en tres partes que operan de manera complementaria: el oído externo, el oído medio y el oído interno. Estas tres partes del oído constituyen el sistema periférico de audición. IV. PSICOACÚSTICA La psicoacústica estudia la relación entre los parámetros físicos del sonido y nuestra percepción subjetiva de ellos. Los parámetros psicoacústicos más relevantes son: - sonoridad altura timbre La sonoridad es la percepción subjetiva de la intensidad sonora. La altura o tono está ligada a la gravedad o que tan agudo es un de sonido. Está relacionado con la frecuencia fundamental de la señal sonora. El timbre es caracterizado por la forma de la onda, o su componente armónico. Sin embargo, debido a la sensibilidad y respuesta en frecuencia del oído humano, estos términos en el contexto de la psicoacústica no son totalmente independientes. Nuestra habilidad para percibir cualquier estímulo utilizando nuestros sentidos está limitada por dos situaciones principalmente: - limitaciones físicas la habilidad del cerebro para procesar la información Las limitaciones físicas determinan las fronteras absolutas de rango de sensibilidad para nuestra audición. El hecho que los humanos percibamos frecuencias desde los 20 Hz hasta los 20kHz (aunque estos valores pueden variar de persona a persona debido a la edad, sexo, etc.) está establecido por la construcción física de nuestro oído y sus componentes internos. Igualmente, no podemos detectar todas las intensidades. La habilidad del cerebro para procesar información es un poco más difícil de analizar, pero se puede observar la deficiencia de éste cuando en el cerebro se enmascaran ciertas frecuencias (es decir escuchamos unas pero otras, aún estando ahí, las ignoramos). V. ACÚSTICA MUSICAL Fig. 3 Diagrama completo del oído 241 La acústica musical es un capítulo importante de la acústica y estudia la relación entre los sonidos, haciendo particular énfasis en el tono y la cualidad tímbrica de éstos. Hace parte de la acústica musical el estudio de la consonancia y disonancia, las escalas musicales y el comportamiento de los distintos instrumentos musicales, acústicos y electrónicos. Un instrumento musical consiste en la combinación de uno o más sistemas resonantes capaces de producir uno o más tonos, además de los medios para excitar estos sistemas. Estos se pueden clasificar según la familia a la cual pertenecen (dependiendo del modo en que se produce el sonido): instrumentos de percusión, instrumentos de cuerda, instrumentos de viento y instrumentos electrónicos. Cada una de estas categorías a su vez pueden ser subdivididas en otras más específicas atendiendo a alguna característica. VI. ACÚSTICA ARQUITECTÓNICA La acústica arquitectónica estudia todos los fenómenos relacionados con la propagación del sonido en un recinto es decir, el comportamiento de las ondas sonoras respecto al espacio que la rodea. El estudio parte desde la generación del sonido por parte de la fuente hasta el instante en que llega la onda sonora hasta los oídos. Los recintos son la interfase entre una fuente de sonido, sea natural o electrónica, y nuestro oído. Los fenómenos sonoros más importantes relacionados con propagación en un recinto son: la reflexión, la refracción, la absorción y la difracción, siendo la reflexión la más importante. Esto debido a las numerosas reflexiones de la energía sonora en un recinto en el piso, las paredes, personas, obstáculos en general, creando un campo sonoro complejo que merece especial atención La acústica arquitectónica también analiza todos los parámetros que influyen en la calidad acústica de un recinto y así diseñar un óptimo tratamiento acústico. La calidad acústica se refiere a la transmisión fiel y funcional del sonido, obviamente dependiendo de la aplicación. Existen distintas aplicaciones específicas en el diseño de recintos como por ejemplo diseño de salas de grabación, salas de cine, auditorios, salones de clase, etc. que deben tener unas cualidades acústicas determinadas y específicas para dicha aplicación. Por cualidad acústica se entienden una serie de propiedades relacionadas con el sonido en un recinto como los ecos, la reverberación, las reflexiones tempranas, el campo sonoro generado, etc. Estas propiedades dependen a su vez de la geometría del recinto así como de los materiales empleados en su construcción y recubrimiento. El objetivo del tratamiento acústico de recintos es modificar la respuesta del recinto al estímulo de ondas sonoras en un sentido conveniente. VII. RUIDO ACÚSTICO El ruido acústico se puede entender como el sonido no deseado. La diferencia entre sonido y ruido depende tanto del nivel de presión sonora como de la respuesta subjetiva del oído. El grado de molestia del ruido aumenta al aumentar el nivel de presión sonora y la respuesta subjetiva del oído depende de la naturaleza del sonido. Debido a la naturaleza indeseada del ruido, éste se considera un contaminante y es deseable atenuarlo en gran medida. VIII. ELECTROACÚSTICA Y PROCESAMIENTO DE AUDIO La electroacústica es la parte de la acústica que se ocupa del estudio, análisis, diseño de dispositivos que convierten energía eléctrica en acústica y viceversa, así como de sus componentes asociados. Entre estos se encuentran los micrófonos, acelerómetros, altavoces, excitadores de compresión, auriculares, audífonos, calibradores acústicos y vibradores. Los micrófonos y altavoces son sus máximos representantes. Estos son denominados genericamente transductores: dispositivos que transforman sonido en electricidad y vice-versa. Esta conversión de entes de naturaleza completamente distinta, se realiza acudiendo a principios electromecánicos y electromagnéticos que se discutirán cuando se estén analizando los micrófonos y posteriormente los altavoces. Los elementos de procesamiento de audio son dispositivos que alteran o modifican de alguna forma características del sonido, cuando éste está representado por una variable eléctrica. Las características que modifican son de índole variada como: amplitud, rango dinámico, respuesta en frecuencia, respuesta en el tiempo, 242 timbre, etc. El procesamiento se lleva a cabo de manera electrónica, utilizando la tecnología de semiconductores y la tecnología digital. Los micrófonos son transductores que convierten energía sonora en energía eléctrica. Específicamente, convierten presión sonora en tensión eléctrica. Esta tensión eléctrica (convertible a una corriente utilizando un resistor) es análoga al sonido en cuanto a su forma de onda. la señal. Esto se hace atenuando la amplitud de señales (tensiones) superiores a una amplitud de referencia denominada umbral. VCA Entrada Salida Control de Ganancia Detector de Nivel Relación de Compresión Fig. 6. Estructura de un compresor Fig. 4 Micrófonos Los altavoces son los dispositivos duales a los micrófonos: convierten la energía eléctrica nuevamente en energía acústica. Los altavoces son también denominados altoparlantes o simplemente parlantes. En general, estos constan de un mecanismo para convertir la energía eléctrica en energía mecánica ( de movimiento) y otro mecanismo para convertir los movimientos en sonido para su propagación en el aire. En la cadena de audio, los altavoces son considerados como el elemento más delicado para la reproducción fiel del sonido. Fig. 6 Altavoces Un compresor de audio es un procesador electrónico capaz de reducir el rango dinámico de El audio digital es una de las aplicaciones más importantes que han tenido las técnicas digitales respecto a la generación, el procesamiento, el almacenamiento y el análisis del sonido. Esto ha sido consecuencia de los progresos de la microelectrónica que ha podido revolucionar la forma en que se manejan y transforman cada vez con más precisión y rapidez la enorme cantidad de información contenida en el sonido. Una gran contribución de las técnicas digitales fue el desarrollo de sistemas de almacenamiento de sonido de gran inalterabilidad y fidelidad. Otra gran contribución fue la introducción de nuevas técnicas de procesamiento sonoro de naturaleza digital y efectos como retardos, reverberaciones y envolventes. IX. FORMATOS DE GRABACIÓN La primera grabación de sonido fue realizada por Thomas Edison en el año de 1877 en un repetidor telefónico. Ese mismo año, el señor Edison se inventó el fonógrafo (Reproductor de discos), un equipo mas complejo en el cual el sonido pasaba de la bocina a la boquilla central, provocando la vibración del diafragma. Actualmente se utilizan popularmente el registro magnético y el registro óptico. El principio de la grabación magnética es el de generar una fuerza magnética proporcional a la señal a grabar y aplicarla mediante el cabezal de grabación en una pequeña región de una cinta recubierta de partículas ferromagnéticas. El cabezal es el elemento encargado de producir la fuerza. El cabezal está compuesto por una bobina, el núcleo y el entrehierro. Cuando una corriente i pasa a través de la bobina, se produce un campo 243 magnético en el cabezal, más específicamente en el entrehierro. cabezal magnético en pregrado. Sin embargo cabe aclarar que cada uno de los temas puede ser explorado e intensificado mucho más en términos de complejidad matemática y física y de nuevas tecnologías. Aún así, el texto trata de manera exhaustiva y con un grado alto de profundización los temas seleccionados. cinta REFERENCIAS Fig. 8 Diagrama del cabezal El mecanismo óptico es un medio utilizado en los discos compactos por ejemplo. El mecanismo de lectura del CD se basa en la utilización de un fotosensor y un fotodiodo emisor de láser. Visto desde abajo, un CD presenta un espiral con fosas (“pits”) y llanuras (“lands”) en un material aluminoreflectante. Un haz de láser incide sobre el material que es reflejado en mayor o menor grado dependiendo si incide en el borde de la fosa o no. El foto sensor detecta ésto como un uno o un cero dependiendo del grado de intensidad de la reflexión. La pista de un CD es leída desde el interior del disco hacia el exterior, permitiendo discos de tamaño variable y maximiza el rendimiento de producción. [1] [2] [3] F. Miyara. Acústica y sistemas de sonido. Fundación decibel, 1998 M.Recuero. Ingeniería Acústica.Paraninfo, 1995 M.Saposhkov. Electroacústica, Reverté, 1983 Jorge Jaramillo nació en Rionegro, Antioquia en 1982. Cursó estudios de primaria y bachillerato en el Colegio Albania de La Guajira. Es egresado de la Facultad de Ingeniería Electrónica de la UPB. Sus campos de interés son las matemáticas y la investigacion en ciencias exactas en general José Ricardo Zapata nació en Medellín en 1981. Es ingeniero electrónico de la UPB y está optando al título de Magister en Telecomunicaciones. Actualmente se desempeña como docente en el área de Audio. Fig. 9 Disco compacto X. CONCLUSIONES Es necesario un fundamento teórico sólido para abordar la inmensidad de temas relacionados con el sonido y la acústica. Por esta razón, aquellos ingenieros con propósitos de incursionar en temas avanzados en sonido y acústica encontrarán en este libro un apoyo conceptual que les servirá como un importante punto de partida. Los temas presentados en el texto fueron compendiados de acuerdo a criterios de enseñanza 244 ANEXO B PROYECTO DE TRABAJO DE GRADO PRINCIPIOS DE AUDIO Estudiante: CC. 8’162,904 de Envigado Carné: 00154975 Teléfono: 313 22 71 Celular: 300 556 0003 Jorge Hernán Jaramillo Hoyos Facultad de Ingeniería Electrónica Universidad Pontificia Bolivariana e-mail: [email protected] Director: CC. 71’375.690 de Medellín Teléfono: 415 90 95 Ext. 111 Celular: 300 773 81 00 IEO. José Ricardo Zapata González Grupo de Investigación GIDATI Universidad Pontificia Bolivariana e-mail: [email protected] Asesor: CC. 91’425.195 de Barrancabermeja Teléfono: 2657000 Ext.269 Magister Tony Peñarredonda Universidad Pontificia Bolivariana e-mail: [email protected] Universidad Pontificia Bolivariana Medellín Febrero 2005 245 1. INVOLUCRADOS Estudiante Nombre: Facultad: Situación: Promedio acumulado: Jorge Hernán Jaramillo Hoyos Ingeniería Electrónica Egresado 4.2 Director Nombre: Grado: Cargo: Institución: José Ricardo Zapata Ingeniero Electrónico Universidad Pontificia Bolivariana Docente tiempo completo Universidad Pontificia Bolivariana Asesor Nombre: Grado: Cargo: Institución: Tony Peñarredonda Caraballo Ingeniero Electrónico Universidad Pontificia Bolivariana Jefe de ingeniería Discos Fuentes 2. MODALIDAD Asistencia a la Docencia 3. TEMA DEL PROYECTO La Facultad Eléctrica y Electrónica de la Universidad Pontificia Bolivariana ofrece a partir de Enero de 2005 la nueva línea optativa de Audio que comprende tres cursos: Principios de Audio, Sistemas de Audio y Audio y sus Aplicaciones. El primero de estos cursos, Principios de Audio, es el objeto de este proyecto. El curso será documentado completamente mediante un texto guía que sirva como apoyo pedagógico para los estudiantes. (ver numeral 8 para detalles del contenido). Como ayuda al docente para la exposición de los temas, se realizarán presentaciones en Powerpoint ilustrativas y didácticas. También se buscarán formas de hacer interactivas las clases a través de ejemplos varios relevantes al audio como lo son simulaciones, ejemplos sonoros, videos, etc. 246 Tipo de trabajo % Teórico Búsqueda/Estudio Desarrollo 70 30 Áreas Ciencias Básicas Circuitos % 30 30 Procesamiento de señales 40 4. ANTECEDENTES La Ingeniería de Audio se centra en los fenómenos acústicos desde su generación y propagación hasta sus aplicaciones en el diseño de recintos, eliminación de ruido y distorsión, implementación de hardware especializado, etc. La Ingeniería de Audio aparece como una rama de la Ingeniería Eléctrica y Electrónica y su estudio es fundamental en sistemas de transmisión de información al ser la voz el primer tipo de comunicación y uno de los tres grandes tipos de tráfico en redes e interconexiones utilizados como parte integral del proceso de comunicación. Por esta razón, la Ingeniería de Audio ha cobrado mucha importancia en los últimos años con relación a sistemas de telecomunicaciones e informáticos. La Universidad Pontificia Bolivariana ha fomentado la participación de los estudiantes de último semestre en la elaboración de tesis de grado concerniente al audio y sus aplicaciones. Los trabajos citados a continuación servirán como referencia para la realización de este proyecto: Audio digital elaborada por Carlos Eduardo Castañeda R. y Juan José Rodríguez Plataforma para el procesamiento digital de señales de audio elaborada por Ricardo Antonio García Ortega Electrónica musical elaborada por Juan Diego Correa Manual de estudio e implementación de practicas de procesamiento digital de señales con tms320c3x, elaborada por Luis David Emiliani y Maria Cecilia Jaramillo (trabajo de asistencia a la docencia.) 247 No había existido hasta ahora materias que trataran de manera sistemática y exhaustiva los sistemas de audio y en el ámbito regional no se había trabajado cursos de este tipo. Por esta razón existe la propuesta de documentar el curso Principios de Audio con el fin de asistir en esta etapa pionera e introductoria de la nueva línea de Audio. 5. OBJETIVOS 5.1 Objetivo general Asistir en la metodología y preparación de material didáctico para la enseñanza de la materia Principios de Audio, materia de la nueva línea de Audio de la Universidad Pontificia Bolivariana. 5.2 Objetivos específicos Recolectar y analizar información concerniente a los temas tratados en la asignatura Principios de audio. Redactar un texto guía con el contenido del curso Principios de Audio para su posterior utilización por parte de los estudiantes que asistan la materia en cuestión. Realizar presentaciones del curso en Powerpoint con el fin de asistir directamente al docente para facilitar la exposición de los temas. Buscar la participación interactiva con los estudiantes a través de ejemplos en audio, simulaciones, videos, etc. relevantes al contenido del curso. Constatar la relevancia de los sistemas de Audio en la Ingeniería, concretamente en sistemas de telecomunicaciones e informáticos. 5. JUSTIFICACIÓN Y BENEFICIOS El curso Principios de Audio le abre las puertas a los estudiantes de Ingeniería Electrónica e Informática para comenzar una nueva ruta electiva en el vasto terreno del audio. Para el óptimo aprovechamiento del curso, éste debe ser documentado de una manera explícita y precisa mostrando claramente los conceptos e ilustrándolos mediante una adecuada diagramación y una serie de ejemplos que los estudiantes puedan asimilar. Es una oportunidad para brindarle a la comunidad académica un apoyo en las labores de docencia (para el profesor) y de aprendizaje (para los estudiantes.) El proyecto es una pieza fundamental para la continuidad de los cursos y está orientado a el diseño de una metodología óptima para la enseñanza. 6. ALCANCE Comprende la recolección de la información necesaria para la elaboración de un texto completo y de alta calidad como respaldo pedagógico al curso Principios de Audio. Este deberá ir en perfecta concordancia con el manual de laboratorio, proyecto en elaboración. Además se generará un mecanismo pionero para la investigación en diversos tópicos de audio. 248 7. TABLA DE CONTENIDOS UNIDAD 1: NIVELATORIO - Matemática para Audio. - Física de ondas. - Medidas. - Teoría musical (solfeo, instrumentos). - Tecnología musical (Tecnología que se usa actualmente) - Sistema Auditivo UNIDAD 2: ACUSTICA - Propagación y principios acústicos - Fundamentos de arquitectura.(Factores que afectan la calidad acústica de un recinto, aislamientos acústicos, materiales y estructuras absorbentes de sonido) - Psicoacústica - Ruido acústico - Técnicas de reducción de ruido UNIDAD 3: ELEMENTOS PARA PROCESAMIENTO DE AUDIO (Hardware y Software) - Amplificadores - Atenuadores - Filtros - Ecualizadores - Retardadores - Efectos de audio - Fuentes - Unidades dinámicas - Consolas - Transductores UNIDAD 4: GRABACION Y EDICION DE AUDIO - Formatos de grabación análoga (cassettes, discos de vinilo.) - Formatos de grabación digital ( DAT, DASH, Disco Duro,CD,DVD,Minidisc) - Sistemas de Grabación. - Sistemas de Edición de Audio. 249 8. PRESUPUESTO Y RECURSOS NECESARIOS TABLA DE RECURSOS NECESARIOS Recurso presupuestado Participación (Miles de Pesos) Estudiante Fotocopias y bibliografía Internet, llamadas y fax larga distancia 200 240 Servicios de Cómputo (200h @ 5k$/h) 1000 Implica desembolso SI NO (Existente) (Nuevo) 200 240 1000 U.P.B. Trabajo Asesor (30h @ 40k$/h Magíster) 1200 1200 Trabajo Director (80h @ 25k$/h Profesional) 2000 2000 Imprevisibles(10%) 144 1584 Subtotales por columna 320 3520 44 484 5104 Totales 420 4620 5104 9. FINANCIACIÓN La financiación de los recursos para la elaboración del proyecto provendrán del estudiante y por parte del grupo de investigación GIDATI. 10. CRONOGRAMA DE OCUPACIÓN Actividades/Meses Feb Mar 2005 Abr May 1. Busqueda Bibliográfica 2. Formulación del Proyecto 3. Redacción Documento 4. Preparación Exposiciones y ejemplos 5. Revisión del informe por parte de los jurados Horas Totales Numero de Graduandos Jun Jul Aug Ocupación (horas) 200 100 250 200 --- 750 1 250 11. BIBLIOGRAFÍA Libros [1] Curso Práctico de Luces y Sonido Audio Digital Cekit [2] Electroacústica M.A. Saposhkov Editorial Reverté Biblioteca Universidad Pontificia Bolivariana [3] Ingeniería Acústica Manuel Recuero López Paraninfo [4] Sound System Engineering Don Davis, Carolyn Davis Sams, 1987 Biblioteca Universidad Nacional de Colombia [5] Tesis Audio Digital Carlos Eduardo Castañeda Juan José Rodríguez 1985 Biblioteca Universidad Pontificia Bolivariana [6] Tesis Electrónica Musical Juan Diego Correa 1999 [7] Tratamiento Digital de Señales John G. Proakis Prentice Hall Biblioteca Universidad Pontificia Bolivariana Sitios en Internet http://www.aes.org http://www.diac.upm.es/asignaturas/sistaudio/TFC%20Ignacio/index.html 251 http://www.epanorama.net/links/audiocircuits.html http://www.eumus.edu.uy/docentes/maggiolo/acu/acuvin.html http://www.eumus.edu.uy/docentes/maggiolo/acuapu/ http://www.kettering.edu/%7Edrussell/demos.html http://www.silcom.com/~aludwig/contents.htm http://www.tic3tac.com/acustica_curso.htm 252 12. PROPIEDAD INTELECTUAL Y DESTINACIÓN DEL PROYECTO Debido a la modalidad de este proyecto (Asistencia a la Docencia), debe quedar explícito que la autoría del proyecto es del Ingeniero José Ricardo Zapata (Director) y el estudiante Jorge Hernán Jaramillo, que trabaja en un objetivo propuesto por el director, obtiene como consecuencia un reconocimiento moral como asistente en la elaboración del proyecto. A continuación se presenta un acta de reconocimiento de las partes involucradas: ACTA DE PROPIEDAD INTELECTUAL DEL PROYECTO : PRINCIPIOS DE AUDIO Los derechos de autor corresponden al Director del proyecto : El Ingeniero Electrónico José Ricardo Zapata González, y al estudiante de Ingeniería Electrónica: Jorge Hernán Jaramillo Hoyos, el cual hará aportes intelectuales en los avances y en el resultado final del proyecto como asistente del mismo. 1. Director y el graduando serán autor y coautor respectivamente de todas las publicaciones Nacionales e Internacionales que genere el proyecto. Asumirán la responsabilidad ética y profesional de darle los créditos a los asesores y entidades que directa o indirectamente apoyen el proyecto; tanto como a la Universidad Pontificia Bolivariana, Facultad de Ingeniería Eléctrica - Electrónica. 2. Los derechos patrimoniales pertenecerán al docente José Ricardo Zapata y a la Universidad Pontificia Bolivariana. 3. Cláusulas de confidencialidad: Toda información entregada por el director a el estudiante, para la elaboración del trabajo dirigido de grado deberá ser manejada con la máxima confidencialidad. Cualquier uso que el estudiante le de a la información, deberá ser consultado previamente con el director y éste dar consentimiento para su uso. 4. Causales de retiro. El retiro podrá ser voluntario o ser motivado por el incumplimiento de las obligaciones de una de las partes. 5. Constancias. Todos los participantes conocen y aceptan el reglamento de elaboración de trabajos de grado de IEE. Jorge Hernán Jaramillo Hoyos José Ricardo Zapata González CC. 8’162.904 de Envigado CC. 71’375.690 de Medellín 253 ANEXO C DIARIO DE CAMPO # SEMANA EN DESCRIPCIÓN EL MES DE LABOR REALIZADA 1 FEBRERO preparación del anteproyecto. 2 FEBRERO preparación del anteproyecto 3 FEBRERO búsqueda bibliográfica y asistencia a clase 4 FEBRERO búsqueda bibliográfica en biblioteca UPB y asistencia a clase 1 MARZO búsqueda bibliográfica, asistencia a clase y redacción primer capítulo 2 MARZO redacción primer capítulo y asistencia a clase 3 MARZO redacción segundo capítulo correcciones del primer capítulo 4 MARZO redacción segundo capítulo, asistencia a clase 1 ABRIL redacción segundo capítulo, búsqueda bibliográfica biblioteca UPB 2 ABRIL redacción y corrección HORAS DEDICADAS (APROX.) 20 20 20 20 30 20 20 20 20 10 FIRMA DIRECTOR 254 3 ABRIL 1 MAYO 2 MAYO 3 MAYO 4 MAYO 1 JUNIO 2 JUNIO 3 JUNIO redacción y corrección, búsqueda bibliográfica Universidad EAFIT redacción tercer capítulo redacción y corrección redacción tercer y cuarto capítulo redacción tercer y cuarto capítulo corrección y preparación diapositivas corrección, preparación de diapositivas y ejemplos corrección preparación de diapositivas y ejemplos 40 20 30 40 40 40 40 40 255 ANEXO D Carta cumplimiento de objetivos Medellín, Julio de 2005 Señores FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA COMITÉ DE ASUNTOS ACADÉMICOS UNIVERSIDAD PONTIFICIA BOLIVARIANA La ciudad Referencia: Cumplimiento de objetivos del trabajo de grado “Principios de audio”. Como director del proyecto de grado “Principios de audio”, realizado por el estudiante Jorge H. Jaramillo Hoyos con carné número 00154975 y ID 000017819, comunico a ustedes el cumplimiento de los objetivos planteados y acepto que el informe cumple con los estándares de presentación exigidos por la facultad en la presentación de trabajos de grado. José Ricardo Zapata. Director del proyecto. 256