Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 178 Fig. 51 Corte transversal de un conducto de la cóclea La cóclea como analizador en frecuencia La membrana basilar es una estructura cuyo espesor y rigidez no es constante: cerca de la ventana oval, la membrana es gruesa y rígida, pero a medida que se acerca hacia el vértice de la cóclea se vuelve más delgada y flexible. La rigidez decae casi exponencialmente con la distancia a la ventana oval; esta variación de la rigidez en función de la posición afecta la velocidad de propagación de las ondas sonoras a lo largo de ella, y es responsable en gran medida de un fenómeno muy importante: la selectividad en frecuencia del oído interno. Ondas viajeras y transformación de frecuencia a posición Las ondas de presión generadas en la perilinfa a través de la ventana oval tienden a desplazarse a lo largo de la escala vestibular. Debido a que el fluido es incompresible la membrana basilar se deforma, y la ubicación y amplitud de dicha deformación varía en el tiempo a medida que la onda de presión avanza a lo largo de la cóclea. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 179 Para comprender el modo de propagación de las ondas de presión, supóngase que se excita el sistema auditivo con una señal sinusoidal de una frecuencia dada: La membrana basilar vibrará sinusoidalmente, pero la amplitud de la vibración irá en aumento a medida que se aleja de la ventana oval (debido a la variación en la velocidad de propagación), hasta llegar a un punto en el cual la deformación de la membrana basilar sea máxima; en ese punto de "resonancia", la membrana basilar es acústicamente "transparente" (es decir, se comporta como si tuviera un orificio), de modo que la amplitud de la vibración y, por ende, la transmisión de la energía de la onda al fluido de la escala timpánica es máxima en dicho punto. Fig. 52. Onda viajera en la membrana basilar. A partir de esa región, la onda no puede propagarse eficientemente, de modo que la amplitud de la vibración se atenúa muy rápidamente a medida que se acerca al helicotrema. En la Fig. 52 se observa la onda en la membrana basilar en un instante de tiempo. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 180 En este modo de propagación, las ondas de presión son ondas viajeras, en las cuales (a diferencia de las ondas estacionarias) no existen nodos. En la Fig. 52 se observa la amplitud de oscilación de la membrana basilar en dos instantes de tiempo, junto con la envolvente de la onda viajera, en función de la distancia al estribo. La ubicación del máximo de la envolvente de la onda viajera depende de la frecuencia de la señal sonora, como puede observarse en la Fig. 53: mientras menor es la frecuencia del tono, mayor es la distancia que viaja la onda a lo largo de la membrana antes de ser atenuada, y viceversa. De esta forma, la membrana basilar dispersa las distintas componentes de una señal de espectro complejo en posiciones bien definidas respecto a la ventana oval. Fig. 53. Ondas viajeras para un tono de 200 Hz Fig. 54. Transformación de frecuencia a posición en la membrana basilar Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 181 Selectividad en frecuencia de la membrana basilar Como se ha visto, las altas frecuencias contenidas en un estímulo sonoro se atenúan a medida que la onda se desplaza hacia el helicotrema. Así, se puede considerar a la membrana basilar como un filtro pasa bajos de parámetros distribuidos. Por otro lado, si se midiese la respuesta en frecuencia en un punto dado de dicha membrana, se obtendría una respuesta de tipo pasa banda. Este comportamiento de la membrana basilar puede modelarse, con un grado de aproximación razonable, como una línea de transmisión no uniforme, representada en la Fig. 55. Cada etapa en paralelo representa un segmento corto de la membrana basilar. La corriente suministrada por la fuente corresponde a la velocidad del estribo. Los inductores en serie y en paralelo representan las masas del fluido y de segmentos de la membrana basilar, respectivamente; los condensadores representan la rigidez de la membrana, y se asume que su valor varía exponencialmente según la posición. Las resistencias representan pérdidas en la membrana. Fig. 55. Representación de la membrana basilar como una línea de transmisión Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 182 Este modelo pasivo presenta varios inconvenientes: no considera fenómenos activos y no lineales de la membrana, no es capaz de generar una respuesta pasabanda tan estrecha como las observadas experimentalmente en tejidos vivos y, además, no toma en cuenta el hecho de que la membrana basilar es una estructura en tres dimensiones. A pesar de ello, permite representar fácilmente los fenómenos de resonancia y de ondas viajeras. 4.3.5 Mecanismo de transducción Interacción entre las membranas basilar y tectorial El proceso de transducción o conversión de señal mecánica a electroquímica se desarrolla en el órgano de Corti, situado sobre la membrana basilar. Las vibraciones de la membrana basilar hacen que ésta se mueva en sentido vertical. A su vez la membrana tectorial, ubicada sobre las células ciliares (los transductores), vibra igualmente; sin embargo, dado que los ejes de movimiento de ambas membranas son distintos, el efecto final es el de un desplazamiento "lateral" de la membrana tectorial con respecto a la membrana basilar. Como resultado, los cilios de las células ciliares externas se "doblan" hacia un lado u otro (hacia la derecha, en la Fig. 56, cuando la membrana basilar "sube"). En el caso de las células internas, aun cuando sus cilios no están en contacto directo con la membrana tectorial, los desplazamientos del líquido y su alta viscosidad (relativa a las dimensiones de los cilios) hacen que dichos cilios se doblen también en la misma dirección. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 183 Células ciliares y potenciales eléctricos La diferencia fundamental entre los dos fluidos de la cóclea, la perilinfa y la endolinfa, estriba en las distintas concentraciones de iones en los dos fluidos. De esta manera, la endolinfa se encuentra a un potencial eléctrico ligeramente positivo (ver Fig. 57) respecto a la perilinfa. Fig.56 Desplazamiento relativo de las membranas basilar y tectorial. Por otro lado, los movimientos de los cilios en una dirección determinada (hacia la derecha, en la Fig. 56) hacen que la conductividad de la membrana de las células ciliares aumente. Debido a las diferencias de potencial existentes, los cambios en la membrana modulan una corriente eléctrica que fluye a través de las células ciliares. Fig 57 Potenciales eléctricos en el órgano de Corti y los fluidos de la cóclea. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 184 La consiguiente disminución en el potencial interno de las células internas provoca la activación de los terminales nerviosos aferentes, generándose un impulso nervioso que viaja hacia el cerebro. Por el contrario, cuando los cilios se doblan en la dirección opuesta, la conductividad de la membrana disminuye y se inhibe la generación de dichos impulsos. Se pueden destacar dos aspectos de este proceso de transducción: primero, que la generación de impulsos nerviosos es un fenómeno probabilístico; segundo, que el proceso se comporta como un rectificador de media onda, puesto que la probabilidad de activación de las fibras nerviosas "sigue" a las porciones "positivas" de la señal sonora (equivalentes a desplazamientos hacia "arriba" de la membrana basilar, en la Fig. 56), mientras que se hace cero en las porciones "negativas" de la onda. Interacción entre células ciliares internas y externas Las fibras aferentes están conectadas mayormente con las células ciliares internas, por lo que es posible concluir con certeza que éstas son los verdaderos "sensores" del oído. Por el contrario, el papel de las células ciliares externas (más numerosas que las internas) era objeto de especulaciones hasta hace pocos años. Recientemente se ha comprobado que dichas células no operan como receptores, sino como "músculos", es decir, como elementos móviles que pueden modificar las oscilaciones en la membrana basilar. La actuación de las células ciliares externas parece ser la siguiente para niveles de señal elevados, el movimiento del fluido que rodea los cilios de las células internas es suficiente para doblarlos, y las células externas se saturan. Sin embargo, cuando los niveles de señal son bajos, los desplazamientos de los cilios de las células internas son muy pequeños para activarlas; en este caso, las células externas se "alargan", aumentando la magnitud de la oscilación hasta que se saturan. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 185 Este es un proceso no lineal de retroalimentación positiva de la energía mecánica, de modo que las células ciliares externas actúan como un control automático de ganancia, aumentando la sensibilidad del oído. Este nuevo modelo del mecanismo de transducción nos indica que el conjunto formado por la membrana basilar y sus estructuras anexas forman un sistema activo, no lineal y con realimentación, y permite explicar dos fenómenos asociados al oído interno: el "tono de combinación", generado a partir de dos tonos de distinta frecuencia por un elemento no lineal que contiene un término cúbico, y las "emisiones otoacústicas", las cuales consisten en tonos generados en el oído interno en forma espontánea o estimulada, y que pueden llegar a ser audibles. Selectividad en frecuencia de la cóclea Debido a la acción de filtraje de la membrana basilar, cada célula transductora procesa una versión del estímulo sonoro filtrada de modo diferente. Esta acción de filtraje de la membrana basilar por sí sola equivale a la de filtros cuya respuesta en frecuencia es relativamente "ancha". Ahora bien, la realimentación positiva provocada por las células ciliares externas contribuye a aumentar la selectividad del sistema auditivo. Esto puede comprobarse midiendo la respuesta de una única fibra nerviosa ante variaciones en la frecuencia y la amplitud del estímulo sonoro; las curvas de sintonía así obtenidas indican una respuesta de tipo pasabanda mucho más angosta que la debida al efecto de la membrana basilar como elemento pasivo. Adicionalmente, experimentos recientes han permitido determinar que la selectividad del oído interno es virtualmente idéntica a la selectividad del sistema auditivo en su totalidad, estimada por métodos psicoacústicos. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 186 4.3.6 Procesamiento a nivel neural Los impulsos nerviosos generados en el oído interno contienen (en forma codificada) información acerca de la amplitud y el contenido espectral de la señal sonora; estos dos parámetros están representados por la tasa de impulsos y la distribución de los mismos en las distintas fibras, respectivamente Las fibras nerviosas aferentes llevan esta información hasta diversos lugares del cerebro. En éste se encuentran estructuras de mayor o menor complejidad, encargadas de procesar distintos aspectos de la información. Por ejemplo, en los centros "inferiores" del cerebro se recibe, procesa e intercambia información proveniente de ambos oídos, con el fin de determinar la localización de las fuentes del sonido en el plano horizontal en función de los retardos interaurales, mientras que en los centros "superiores" de la corteza existen estructuras más especializadas que responden a estímulos más complejos. La información transmitida por el nervio auditivo se utiliza finalmente para generar lo que se conoce como "sensaciones". Hasta ahora se ha visto que las distintas partes del sistema auditivo son susceptibles de ser modeladas matemáticamente, en términos de su comportamiento como sistemas físicos. Se podría por tanto pensar que el modelo perceptual ideal es aquel que simula, en términos de los procesos físicos y fisiológicos, todas las etapas del sistema auditivo, incluyendo la etapa de procesamiento neural en el cerebro. Sin embargo, la comprensión que se tiene acerca de lo que ocurre en las estructuras cerebrales es muy limitada, especialmente en lo relativo a los centros "superiores" del cerebro. Por lo tanto, es necesario recurrir a la descripción psicoacústica de los fenómenos perceptuales y de las sensaciones. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 187 44..44 PPSSIIC CO OA AC CÚ ÚSST TIIC CA A Son muchos los fenómenos que abarca el sonido y diferentes las propiedades para describirlos. Gran número de estas propiedades no puede ser descrito a través de los fenómenos físicos que involucran las ondas acústicas, sino más bien son fenómenos perceptuales que abarcan un número complejo de relaciones para poder ser descrito. En la fig. 58 podemos observar muchos de estos fenómenos a que nos referimos. Estos fenómenos son estudiados por la Psicoacústica y se requieren de un conocimiento previo para poder desarrollar alguna aplicación que involucre el sonido; ya que como podemos observar en la figura la gran mayoría determinan la calidad del sonido y diversas propiedades que se aplican para obtener distintos efectos sonoros. Fig.58. Ramas que implican estudios psicoacústicos auditiva Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 188 En la presente sección abarcaremos brevemente los conceptos más generales de muchos de estos fenómenos y de la terminología utilizada para su desarrollo. 4.4.1 Rango dinámico y respuesta en frecuencia del oído Area de audición El ser humano es capaz de detectar únicamente aquellos sonidos que se encuentren dentro de un determinado rango de amplitudes y frecuencias. En este sentido, se puede establecer una analogía entre el aparato auditivo y un sistema electrónico de audio: en base al concepto convencional del rango dinámico. Se define el rango dinámico del oído como la relación entre la máxima potencia sonora que éste puede manejar y la mínima potencia necesaria para detectar un sonido. Asimismo, el rango de frecuencias asignado convencionalmente al sistema auditivo va desde los 20 Hz hasta los 20 kHz, aun cuando este rango puede variar de un sujeto a otro o disminuir en función de la edad del sujeto, de trastornos auditivos o de una pérdida de sensibilidad (temporal o permanente) debida a la exposición a sonidos de elevada intensidad. Cabe destacar que la sensibilidad del sistema auditivo no es independiente de la frecuencia. Estos tres parámetros del oído (rango dinámico, respuesta en frecuencia y sensibilidad en función de la frecuencia) se resumen en la siguiente figura, que ilustra el área de audición. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 189 Fig. 59. Area de audición. El extremo superior del rango dinámico está dado por el umbral de dolor, el cual define las presiones sonoras máximas que puede soportar el oído. Más abajo de este nivel, se encuentra el límite de riesgo de daños, el cual representa un umbral de presión sonora que no debe sobrepasarse por más de un cierto período de tiempo (ocho horas diarias por día laboral), o de lo contrario puede producirse un pérdida de sensibilidad permanente. El extremo inferior, denominado umbral de audibilidad (UA), representa la sensibilidad del aparato auditivo, es decir, el valor mínimo de presión sonora que debe tener un tono para que éste sea apenas perceptible. De la fig. 59 resulta obvio que esta sensibilidad depende de la frecuencia de la señal sonora. Como se ve en la fig. 59, el aparato auditivo es capaz de operar sobre un rango de presiones sonoras muy amplio (unos 150 dB). Las presiones sonoras correspondientes al mínimo del umbral de audibilidad (Å 0 dB SPL) equivalen a desplazamientos de la membrana basilar inferiores a 1010 m, distancia comparable al diámetro de un átomo. Tan extraordinaria sensibilidad se debe a los mecanismos activos y no lineales descritos Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 190 anteriormente; es decir, a la acción combinada de varias células ciliares externas sobre cada célula interna. 4.4.2 Umbral de audibilidad La sensibilidad del aparato auditivo puede variar considerablemente de un sujeto a otro. Por esta razón, resulta conveniente definir un umbral de audibilidad promedio, también llamado mínimo campo audible promedio; éste se representa mediante una curva que indica la presión sonora de un tono puro de larga duración (> 200 ms), el cual se propaga en condiciones de campo libre y en ausencia de cualquier otro sonido, y que puede ser detectado por el 50% de una población de sujetos jóvenes (entre 18 y 25 años) y audiológicamente normales. Los valores medios del umbral de audibilidad han sido objeto de un proceso de estandarización, descrito en un documento de la ISO. Es preciso tener en mente que el umbral de audibilidad promedio no representa un límite absoluto, sino una medida estadística asociada con la probabilidad de detección de un tono de determinada frecuencia y amplitud y que, por ende, debe ser empleado con cautela; por ejemplo, si el UA promedio se utiliza en un sistema que evalúa la calidad del sonido sometido a algún proceso de codificación, puede proporcionar resultados optimistas e inducir a errores. La sensibilidad del sistema auditivo humano disminuye con la edad, especialmente en las altas frecuencias, debido al deterioro de las células ciliares del órgano de Corti. El umbral de audibilidad no sólo es función del sujeto y de los parámetros ya mencionados, sino que además presenta una dependencia con respecto al modo de propagación de las ondas sonoras. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 191 Ahora bien, el modo de propagación de "campo libre" sólo es posible en ambientes anecoicos o utilizando audífonos cuya respuesta en frecuencia haya sido adecuadamente corregida; sin embargo, en situaciones cotidianas (ambientes reverberantes; aplicación directa del sonido, sin audífonos) las características en frecuencia del lugar en el cual se encuentre el sujeto, por una parte, y la difracción provocada por la cabeza y el pabellón auricular, por otra, hacen que la propagación del sonido se asemeje a la condición de "campo difuso", en la cual el sonido incide desde todas las direcciones posibles. En esta condición, la sensibilidad del oído varía notablemente, como se observa en la Fig. 60. Fig.60. Umbral de audibilidad en condiciones de campo libre y difuso. 4.4.3 Excitación y nivel de excitación Como se vio anteriormente, el comportamiento de la membrana basilar frente a los estímulos sonoros puede resumirse en tres propiedades: existencia de ondas viajeras, dispersión de las componentes de distinta frecuencia a lo largo de la membrana y comportamiento pasa bajos (considerando la totalidad de la membrana). Supóngase que se estimula a la membrana basilar con un tono puro, de nivel X dB SPL. Debido a las propiedades antes descritas de la membrana basilar, la propagación Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 192 del tono será tal que se producirá una onda viajera, cuya envolvente se muestra en la Fig. 22. La amplitud máxima de la envolvente depende de la intensidad del estímulo. Por otro lado, debido a la naturaleza del mecanismo de transducción de la señal sonora, dicha envolvente está asociada directamente con la actividad neural en el órgano de Corti, puesto que la tasa de generación de impulsos nerviosos depende de la amplitud de la señal. Así pues, se puede establecer una equivalencia directa entre la intensidad de la señal, la envolvente de la onda viajera y el grado de estimulación o excitación de los receptores auditivos (esto es, las células ciliares internas) y sus terminaciones nerviosas asociadas. Fig. 61. Envolvente de la onda viajera provocada por un tono puro. Por esto, se define el patrón de excitación como la curva que representa, en función de la frecuencia, la magnitud de la actividad neural (o, lo que es equivalente, la envolvente de la onda viajera) expresada en unidades de intensidad sonora. De esta manera, es posible interpretar el patrón de excitación como una curva que resume las transformaciones de que es objeto la señal sonora en el oído interno. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 193 La Fig. 62 muestra el patrón de excitación correspondiente a un tono de 1 kHz y 60 dB SPL. El valor del patrón de excitación en cualquier punto de la curva, expresado en dB SPL, se denomina nivel de excitación; por definición, el nivel de excitación máximo en la curva corresponde al nivel de presión sonora del tono. Fig. 62. Patrón de excitación producido por un tono. A pesar de que, obviamente, no es posible determinar directamente el patrón de excitación mediante experimentos psicoacústicos, éste puede inferirse indirectamente a partir de resultados de experimentos fisiológicos y de su relación con diversos fenómenos perceptuales, tales como el enmascaramiento y la sonoridad. 4.4.4 Enmascaramiento sonoro El enmascaramiento sonoro puede definirse como el proceso en el cual el umbral de audibilidad correspondiente a un sonido se eleva, debido a la presencia de otro sonido. Para ilustrar mejor este fenómeno, imagínese el siguiente experimento: Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o Un sujeto 194 audiológicamente normal se introduce en un ambiente anecoico y con bajo nivel de ruido acústico de fondo, y se le hace escuchar una señal sonora A (p. ej., un tono puro) que sea perfectamente audible, es decir, cuyo nivel de presión sonora esté muy por encima del umbral de audibilidad del sujeto a la frecuencia del tono. Se le pide al sujeto que juzgue (subjetivamente) la intensidad del tono de prueba A. Luego, se añade una señal sonora B (p. ej., una banda de ruido centrada en la frecuencia del tono) de bajo nivel SPL, y se va aumentando progresivamente el nivel de B, manteniendo constante el nivel de A. El sujeto notará que, a medida que aumenta el nivel de la señal B, la intensidad aparente o subjetiva de A disminuye hasta que, eventualmente, A se hace inaudible. En este caso se dice que la señal A está totalmente enmascarada por la señal B. El enmascaramiento depende del nivel de presión sonora de las señales "enmascarante" y "enmascarada", así como de la separación en frecuencia y en tiempo entre las mismas. A continuación mencionaremos brevemente diversas características del fenómeno de enmascaramiento sonoro. Umbral de enmascaramiento y nivel de sensación Para medir cuantitativamente la magnitud del enmascaramiento, así como para distinguir entre el umbral de audibilidad en condiciones de "silencio" (es decir, en ausencia de otra señal distinta a la señal de prueba) y el UA en condiciones de enmascaramiento, se define el umbral de enmascaramiento (UE) como "el nivel de presión sonora de un sonido de prueba necesario para que éste sea apenas audible en presencia de una señal enmascarante". De la definición anterior resulta obvio que los umbrales de audibilidad y de enmascaramiento deben ser idénticos en ausencia de señales enmascarantes. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 195 Si se representa en forma gráfica el valor del UE en función de la frecuencia (u otra variable análoga), se obtiene una curva denominada patrón de enmascaramiento. Adicionalmente, se define el nivel de sensación (NS) de una señal de prueba como la diferencia, en dB SL, entre el umbral de enmascaramiento y el umbral de audibilidad correspondientes a dicha señal y expresados en dB SPL: ec. 4.19 La unidad "dB SL", aplicada a cualquier parámetro relacionado con estímulos sonoros, se utiliza para recalcar el hecho de que es una medida relativa al umbral de audibilidad. Enmascaramiento simultáneo Dependiendo de la ubicación temporal de la señal de prueba (P) con respecto a la señal enmascarante (E), se pueden distinguir tres situaciones posibles (Fig. 63): 1) Enmascaramiento simultáneo: E y P se presentan solapados en el tiempo (E está presente durante toda la duración de P). 2) Enmascaramiento previo: a la presentación de la señal enmascarante, o pre-enmascaramiento: E se presenta después de P. 3) Post-enmascaramiento: E se presenta antes que P. Fig. 63. Ubicación temporal de las señales Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 196 Efectos espectrales Según estudios realizados se ha podido observar que el enmascaramiento simultáneo tiene una dependencia con la frecuencia de manera no lineal, para bajas frecuencias y en forma logarítmica para frecuencias altas (> 500Hz). A continuación mostramos algunos ejemplos de esta dependencia. La fig. 64 muestra el patrón de enmascaramiento generado por ruido blanco (de espectro plano entre 20 Hz y 20 kHz) con distintas densidades espectrales. La curva punteada inferior corresponde al UA; los extremos izquierdo y derecho de las curvas de los UEs se superponen con el UA. Fig. 64 Patrón de enmascaramiento producido por ruido blanco. En la siguiente figura se puede observar el patrón de enmascaramiento provocado por bandas de ruido de una banda crítica de ancho y nivel de 60 dB SPL. Las bandas de ruido, centradas en 70, 250, 1000, 4000 y 8000 Hz, tienen anchos de 100, 100, 160, 700 y 1700 Hz, respectivamente. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 197 Las pendientes superior e inferior de cada banda de ruido son superiores a 200 dB/octava, por lo que sus espectros pueden ser considerados rectangulares (ruido pasabanda ideal). La curva inferior corresponde al UA. (a) Escala lineal de frecuencia (b) Escala logarítmica de frecuencia. Fig. 65. Patrón de enmascaramiento producido por bandas de ruido angostas. Dependencia del nivel de señal En la siguiente fig. 66 se muestra el patrón de enmascaramiento correspondiente a bandas de ruido centradas en 1 kHz. Todas las bandas de ruido tienen el mismo ancho de banda (160 Hz), pero difieren en el nivel de presión sonora. Fig. 66. Patrón de enmascaramiento producido por bandas de ruido de distinta intensidad sonora. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 198 En esta figura se nota que el valor máximo del patrón de enmascaramiento depende del nivel de la señal enmascarante, en forma tal que un incremento de X dB en la presión sonora de la señal provoca un incremento de X dB en el UE máximo (situado aproximadamente en la frecuencia central de la banda de ruido). Por otro lado, la dependencia de las pendientes con respecto al nivel de señal resulta un tanto inesperada: hacia las frecuencias inferiores a la frecuencia central de la banda de ruido, la pendiente permanece prácticamente constante (es casi independiente del nivel), mientras que hacia las altas frecuencias la pendiente aumenta (en magnitud) a medida que disminuye el nivel de señal. Umbral de audibilidad y de enmascaramiento En las figuras 64, 65 y 66 se observa que los patrones de enmascaramiento se superponen con el umbral de audibilidad en las bajas y altas frecuencias. Este solapamiento es de esperarse, puesto que, a medida que la distancia en frecuencia entre las señales enmascarante y enmascarada aumenta, el efecto de la primera debe disminuir y, eventualmente, desaparecer. La relación entre el umbral de audibilidad y los patrones de enmascaramiento es aún más estrecha, puesto que el UA puede considerarse, en cierta medida, como un umbral de enmascaramiento. Efectos temporales Los ejemplos estudiados hasta ahora corresponden a señales de prueba de gran duración (> 200 ms). Ahora bien, tanto el umbral de audibilidad como el de enmascaramiento dependen de la duración de la señal de prueba. La siguiente figura muestra la variación del UA para tonos de 200, 1000 y 4000 Hz, así como la variación del UE producido por ruido uniformemente enmascarante (RUE), en función de la duración de la señal de prueba. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 199 El valor de umbral indicado en el gráfico es igual al nivel de un tono de duración infinita (potencia del tono) a partir del cual se extrae un segmento de señal con la duración indicada. Las curvas correspondientes al RUE son válidas en el rango de frecuencias audibles. Fig. 67. Umbral de audibilidad y de enmascaramiento en función de la duración de la señal enmascarada. Para duraciones de la señal de prueba de más de 200 ms, el umbral permanece constante, mientras que para duraciones inferiores a 200 ms el umbral aumenta en 10 dB por década de tiempo: es decir, si el UE de un tono de T segundos de duración es igual a X dB SPL, el UE de un tono de 0,1T segundos será de (X + 10) dB SPL. Esta dependencia sugiere que, para duraciones inferiores a 200 ms, el sistema auditivo opera como un detector de energía: de este modo, si se reduce la duración de una señal de T a 0,1T segundos, para que la señal siga siendo apenas audible es preciso incrementar la potencia de la señal de P a 10P, con el fin de que la energía de la señal, e = PT, permanezca constante. Por otro lado, para duraciones de más de 200 ms el umbral (es decir, la detectabilidad del tono de prueba) es independiente de la duración. En consecuencia, se Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 200 puede inferir que el sistema auditivo opera como un detector de energía dentro de una ventana de tiempo de 200 ms de duración . Enmascaramiento no simultáneo La Fig. 68 muestra las regiones temporales en las cuales ocurren los fenómenos de pre-enmascaramiento, post-enmascaramiento y enmascaramiento simultáneo, así como la evolución en el tiempo de los mismos. Fig.68. Nivel de sensación de una señal de prueba apenas audible, en función del tiempo. Pre-enmascaramiento El pre-enmascaramiento es un fenómeno inesperado, pues pareciera implicar que el sistema auditivo es no causal una señal puede enmascarar a otra antes de ser aplicada. Sin embargo, es posible justificar la existencia del pre-enmascaramiento si se piensa que cualquier sensación sonora no se produce instantáneamente, sino que se requiere de un cierto tiempo para que se origine dicha sensación; de hecho, un estímulo sonoro debe tener una duración mínima para que se generen impulsos en las terminaciones nerviosas del órgano de Corti . Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 201 Las señales de gran intensidad requieren de un tiempo de formación de la sensación menor que el de las señales de baja intensidad; así, si una señal "grande" se presenta unos pocos milisegundos después que una señal "pequeña", la sensación asociada a ésta puede no llegar a producirse, quedando efectivamente enmascarada. Debido a la corta duración del pre-enmascaramiento y a la escasa información disponible, los modelos perceptuales ignoran usualmente los efectos de pre-enmascaramiento, aún cuando éstos pueden ser de gran importancia en sistemas de codificación de audio basados en transformadas. Post-enmascaramiento El post-enmascaramiento, por el contrario, es un efecto fácil de medir aún en sujetos no entrenados. Por regla general, se determina experimentalmente mediante señales de prueba de corta duración (del orden de los 5 ms o menos), aplicadas luego de una señal enmascarante de duración variable. El efecto de post-enmascaramiento existe durante un intervalo máximo de unos 200 ms después de la desaparición de la señal enmascarante. En la Fig. 69 se observa el comportamiento del umbral de enmascaramiento en función del retardo entre el instante en que desaparece la señal enmascarante y el instante en que desaparece la señal de prueba, y de la intensidad de la señal enmascarante. La señal de prueba en este caso es un impulso de presión de forma "gaussiana", de 20 ms de duración; la señal enmascarante es ruido blanco de 0,5 s y nivel de densidad espectral variable. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 202 Fig. 69 Decaimiento del post-enmascaramiento en función del tiempo y de la intensidad de la señal enmascarante. Por último, el post-enmascaramiento depende del contenido frecuencial de las señales enmascarante y enmascarada. Diversos experimentos descritos en la literatura permiten concluir que la cantidad de post-enmascaramiento es mayor en las bajas frecuencias que en las altas. 4.4.5 Bandas críticas y tasa de bandas críticas Como se vio hemos visto, el comportamiento de la cóclea como analizador en frecuencia puede resumirse en dos características: • La componente del espectro de la señal sonora es procesada por más de un receptor auditivo. • Análogamente, cada receptor auditivo procesa diversas componentes del espectro de la señal. La forma del patrón de excitación provocado por un tono puro ilustra bien estas dos características, e indica que la selectividad en frecuencia del sistema auditivo no es infinita. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 203 Ancho de banda crítico El ancho de banda crítico es un concepto desarrollado por Fletcher, que puede interpretarse como una medida de la selectividad frecuencial del oído. El ancho de banda crítico permite explicar por qué, dado un tono de una cierta frecuencia, una banda de ruido estrecha centrada en dicha frecuencia produce la misma cantidad de enmascaramiento sobre el tono que una banda ancha de ruido, aun cuando el nivel de densidad espectral de ambos ruidos sea igual y, por ende, la energía del ruido de banda estrecha sea menor]. En pocas palabras, si el ancho de la banda de ruido varía, para enmascarar al tono es necesario que la energía del ruido contenida en un intervalo de frecuencias alrededor del tono sea constante. La energía efectiva de la señal enmascarante es aquella confinada en tal intervalo, mientras que el resto no contribuye al enmascaramiento del tono. El ancho de este intervalo crítico ha sido denominado ancho de banda crítico. De esta manera, el ancho de banda crítico (tal y como lo definió Fletcher) se obtiene cuando el ancho de la banda de ruido es tal que la intensidad de un tono de prueba apenas audible es igual a la intensidad de la banda de ruido. Ahora bien, esta medida de la selectividad del sistema auditivo es incorrecta, puesto que Fletcher basó su definición en dos suposiciones erróneas: • Cuando el tono es apenas audible, la "relación señal a ruido" (SNR) entre las intensidades del tono y de la banda de ruido no es igual a 0 dB. • Esta "relación señal a ruido" varía con la frecuencia del tono: a frecuencias bajas, es de unos 2 dB, mientras que en las altas frecuencias llega a unos 6 dB. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 204 Bandas críticas: definición y determinación experimental A pesar de los errores implícitos en la definición de Fletcher, el concepto de un ancho crítico sigue siendo válido, puesto que numerosos experimentos psicoacústicos indican que las respuestas de los sujetos ante distintos fenómenos perceptuales cambian abruptamente cuando los estímulos sobrepasan un cierto ancho de banda. Así pues, se define una banda crítica (BC) como un intervalo de frecuencia que representa la máxima resolución frecuencial del sistema auditivo en diversos experimentos psicoacústicos. Adicionalmente, puede decirse que una BC constituye el intervalo de frecuencia en el cual el oído interno efectúa una integración espacial (es decir, espectral) de la intensidad de la señal sonora: la BC es el intervalo en el cual se "suma" la energía de las distintas componentes espectrales de la señal. Tasa de bandas críticas Los anchos de las bandas críticas dependen de la frecuencia, como se ilustra en la Fig..31. Esta curva, se obtuvo promediando los resultados de la medición de las BCs en más de 50 sujetos y con cinco métodos distintos. Por debajo de los 500 Hz, el ancho de banda crítico es aproximadamente constante (aprox. 100 Hz), mientras que por encima de los 500 Hz crece en proporción a la frecuencia: el ancho de una banda crítica centrada en una frecuencia superior a 500 Hz es de alrededor del 20% de la frecuencia central. Esta curva puede ser modelada mediante la siguiente ecuación, la cual permite calcular el ancho de banda crítico (en Hz), ÆfBC, correspondiente a la frecuencia en Hz, f, con un error inferior al 10%: ec. 4.20 Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 205 Fig. 70. Ancho de las bandas críticas en función de la frecuencia. Basándose en los valores obtenidos mediante la Fig. 70 o la ecuación anterior, es posible subdividir el rango de frecuencias audibles en intervalos adyacentes de una BC de ancho, que no se solapan entre sí, y que representan una primera aproximación al problema de modelar la selectividad en frecuencia del oído interno. Esta subdivisión se representa en la siguiente figura; en el rango audible de 20 Hz a 20 kHz se encuentran 25 bandas críticas adyacentes, numeradas en forma consecutiva en la fig. 71. En la Tabla 12 se muestran los valores que definen las primeras 24 BCs, según Zwicker, los cuales se han convertido en un estándar "de facto" para describir la distribución de las BCs en función de la frecuencia. Ahora supóngase que se subdivide de manera continua el rango de frecuencias audibles en intervalos solapados entre sí de una BC de ancho, y que se desea obtener, para cada frecuencia f0, un valor que represente el número (no necesariamente entero) de bandas críticas adyacentes y no solapadas contenidas en el intervalo de 0 a f0 Hz. Los valores así obtenidos constituyen la denominada tasa de bandas críticas, también llamada escala de bandas críticas. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 206 Fig.71. Bandas críticas adyacentes en el rango de frecuencias audibles. Nº de banda crítica 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Frec. central (Hz) 50 150 250 350 450 570 700 840 1000 1170 1370 1600 1850 2150 2500 2900 3400 4000 4800 5800 7000 Frec. superior (Hz) 100 200 300 400 510 630 770 920 1080 1270 1480 1720 2000 2320 2700 3150 3700 4400 5300 6400 7700 Ancho de la BC(Hz) 100 100 100 100 110 120 140 150 160 190 210 240 280 320 380 450 550 700 900 1100 1300 22 8500 9500 1800 23 24 10500 13500 12000 15500 2500 3500 Tabla 12. Distribución de las bandas críticas en función de la frecuencia. Estrictamente hablando, la tasa de BCs (Fig. 72) y el ancho de las bandas críticas (Fig. 71) están relacionados a través de la siguiente ecuación: ec. 4.21 Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 207 En la Fig. 72 se muestra la relación entre la tasa de bandas críticas, la frecuencia y el número asignado a las BCs adyacentes de la Fig. 71. Fig.72. Tasa de bandas críticas en función de la frecuencia. Para los valores de tasa de BCs, se ha definido como unidad el "bark": un intervalo de frecuencia de 1 bark es, por definición, un intervalo de una BC de ancho en cualquier punto del rango de frecuencias audibles. En la Fig. 72 se observa que la primera BC abarca el intervalo de 0 a 1 bark, la segunda BC el intervalo de 1 a 2 barks, y así sucesivamente. La Fig. 73 ilustra la relación entre la tasa de BCs y diversos parámetros físicos, fisiológicos y perceptuales. En la parte superior de la figura se representa en forma esquemática la cóclea "desenrollada"; la membrana basilar corresponde a la zona rayada del dibujo. Fig. 73. Relación entre la tasa de bandas críticas y otras escalas de medición. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 208 En esta figura resulta obvio que no existe una relación simple entre la frecuencia y las demás escalas. Sin embargo, la relación entre la tasa de BCs y parámetros tales como la posición en la membrana basilar (escala fisiológica), el número de incrementos de frecuencia apenas perceptibles y el cociente de frecuencias subjetivas o "alturas del sonido" (escalas Psicoacústicas) resulta prácticamente lineal. Por todo lo expuesto, la tasa de BCs no sólo está asociada con una medida de la selectividad en frecuencia, como lo son las bandas críticas, sino que además constituye una escala más natural y conveniente que la escala de frecuencias para representar gráficamente e interpretar fenómenos perceptuales 4.4.6 Diferencias entre señales tonales y no tonales El tono es la característica del sonido que indica su altura. Los cambios de tono vienen originados por diferencias de frecuencia de la onda sonora. Aún cuando, según lo expuesto hasta ahora, pareciese que la "habilidad" de una señal para enmascarar a un tono depende sólo de la intensidad contenida en la BC centrada en el tono, diversos resultados experimentales [2] indican que tal "habilidad" depende además de la tonalidad de la señal enmascarante. En este contexto, el término "tonalidad" se utiliza para describir cualitativamente la similitud del espectro de la señal con el de un tono puro: una señal es "tonal" cuando su espectro es "impulsivo", mientras que es "no tonal" o "ruidosa" si su espectro se asemeja al de una banda de ruido. La siguiente figura ilustra la llamada asimetría de enmascaramiento entre tonos y bandas de ruido. La curva corresponde al patrón de enmascaramiento producido por un tono puro que enmascara a una banda crítica de ruido (caso T) y viceversa (caso R). Ambas señales enmascarantes tienen una intensidad total de 72 dB SPL. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 209 Fig. 74. Patrones de enmascaramiento correspondientes a un tono y a una banda crítica de ruido, centrados en 1000 Hz. En esta figura se observa que la banda de ruido es más efectiva que el tono como señal enmascarante: la diferencia entre los umbrales de enmascaramiento de un caso y de otro es de unos 21 dB. 4.4.7 Efecto Haas Este fenómeno perceptual llamado también Efecto Precedencia tiene una gran importancia, tanto en Acústica Arquitectónica como en Electroacústica y consiste en la fusión de los sonidos que lleguen en una ventana de tiempo de 50 ms donde la percepción de la dirección del sonido es la indicada por el sonido inicial. Una forma simple de demostrar el fenómeno es a partir de un equipo de sonido estereofónico. (fig.36). Si las señales son iguales en ambos canales, el sonido sea percibido como proveniente del centro del sistema. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o Fig. 75. 210 Disposición del equipo para evaluar el efecto Haas. Si introducimos un retardo de 5ms al canal derecho (Fig. 75). En este caso el sonido será percibido saliendo del canal izquierdo, a pesar que las intensidades son iguales. Fig. 76. Retardo de 5 ms en el canal derecho. Si atenuamos 10 dB el canal izquierdo (o le damos 10 dB de ganancia al canal derecho) el sonido será percibido saliendo otra vez del centro del sistema. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 211 Fig. 77 Atenuación de 10 dB en el canal izquierdo. Esa relación de retardo e intensidad puede verse en forma más completa en la Fig. 78. Fig. 78. Efecto Precedencia o "Efecto Haas". Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 212 44..55 M MO OD DE EL LA AD DO OD DE E PPR RO OC CE ESSO OSS A AC CU USST TIIC CO OSS Son múltiples las sensaciones que nos provocan los acordes musicales a nuestro sistema sensorial, desde el más sublime placer hasta la más detestable sensación de molestia. Por ejemplo, la sensación de colocarse a la orilla de un acantilado y gritar una palabra con el objetivo de escucharla un momento después nuevamente. Muchos de estos efectos enriquecen nuestro gusto musical y despiertan nuevas sensaciones en nuestro ser. Por tal motivo la ingeniería de sonido ha buscado los medios artificiales de reproducir estos efectos capaces de explotar a otro nivel los sistemas sensores del oído. Esta implementación artificial de efectos por medio del procesamiento de la señal se ha desarrollado de manera tal que existen a nuestra disposición los modelos de los sistemas que emulan estos sonidos. En la presente sección haremos una breve descripción de los efectos más populares en la actualidad en el tratamiento del sonido, y sus modelos matemáticos para su desarrollo. 4.5.1 El procesado espacial y la reverberación El sistema auditivo responde a diversas características tanto de la fuente sonora como del medio de propagación. En general estos son los dos elementos a controlar para la recreación de sonidos deseados. Al proceso que abarca el estudio de estos parámetros se les conoce con el nombre de procesado espacial. La reverberación es la suma total de las reflexiones del sonido que llegan al lugar del oyente en diferentes momentos del tiempo. Auditivamente se caracteriza por una prolongación, a modo de "cola sonora", que se añade al sonido original. La duración y la coloración tímbrica de esta cola dependen de: la distancia entre el oyente y la fuente sonora; y la naturaleza de las superficies que reflejan el sonido. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 213 En situaciones naturales hablamos de sonido directo para referirnos al sonido que se transmite directamente desde la fuente sonora hasta nosotros (o hasta el mecanismo de captación que tengamos). Por otra parte, el sonido reflejado es el que percibimos después de que haya rebotado en las superficies que delimitan el recinto acústico, o en los objetos que se encuentren en su trayectoria. Evidentemente, la trayectoria del sonido reflejado siempre será más larga que la del sonido directo, de manera que temporalmente escuchamos primero el sonido seco, y unos instantes más tarde escucharemos las primeras reflexiones (early reflections); a medida que transcurre el tiempo las reflexiones que nos llegan son cada vez de menor intensidad, hasta que desaparecen. Nuestra sensación, no obstante, no es la de escuchar sonidos separados, ya que el cerebro los integra en un único precepto, siempre que las reflexiones lleguen con una separación menor de unos 50 milisegundos (efecto Hall). Cuando manipulamos un reverberador artificial, los principales parámetros de control son: Ø Tiempo de decaimiento: se define como el tiempo que tarda el sonido reverberado en disminuir 60 dB (a menudo se denomina TR60). Las salas grandes tienen tiempos largos (un segundo o más), mientras que las habitaciones de una casa tienen tiempos muy cortos (menos de medio segundo). Ø Retardo de las primeras reflexiones: en salas grandes las primeras reflexiones tardan en llegar más tiempo que en salas pequeñas, pudiendo sonar incluso como una especie de eco. Ø Intensidad de las primeras reflexiones: está determinada por la distancia del oyente y de la fuente sonora respecto a las superficies reflectantes. Si el oyente o la fuente sonora están junto a ellas las primeras reflexiones sonarán con mucha intensidad. Manipulando los 3 parámetros anteriores podemos crear la sensación de tamaño del recinto, y de posicionamiento de fuente y oyente dentro de él. Adicionalmente podemos crear diferentes sensaciones relacionadas con los materiales de las paredes, Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 214 suelo y techo con parámetros tales como: Tipo de reverberación (hall, plate, room), densidad de las reflexiones, y absorción selectivo de ciertas frecuencias. Existen diversos tipos de reverberadores artificiales dentro de los más populares tenemos: • Reverberador plano: Este tipo de reverberador logra su efecto retroalimentando la señal de salida luego de haberla retrasado D muestras. Su diagrama de bloques y ecuación de diferencias la podemos ver a continuación. y(n) = ay(n – D) + x(n) x(n) ec. 4.22 y(n) + + a Z-D Fig. 79 Diagrama de bloque de un reverberador plano • Reverberador pasabajos: Este tipo de reverberador se obtiene modificando el reverberador plano en su ruta de retroalimentación, al remplazar la ganancia a por filtro pasabajos como podemos observar en el diagrama de bloques de abajo. La presencia de este filtro en la retroalimentación causa un efecto de expansión en el eco, lo cual resulta una mejor respuesta y sintonización en la reverberación. La función de transferencia de este sistema y su diagrama de bloques lo podemos ver a continuación. H( z ) = 1 1 − z G( z ) −D Capí tul o IV ec. 4.23 Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o x(n) 215 y(n) + + Z-D G(z) Fig. 80. Diagrama de bloque de un reverberador pasabajo • Reverberador pasatodo: Este tipo de reverberador se caracteriza por la siguiente función de transferencia: H( z ) = − a + z −D 1 − az − D ec. 4.24 Este tipo de sistema exhibe una respuesta en magnitud plana, pero su respuesta transitoria decae exponencialmente con el tiempo. exponencial del eco. Lo cual causa un decaimiento La construcción de este filtro se logra expandiendo en fracciones parciales su función de transferencia. Dos posibles diagramas de bloques utilizados para su construcción se muestran a continuación. x(n) -a + + y(n) + + Z-D a (a) -1/a + x(n) k + Fig. 81 Diagramas de bloques de un reverberador pasatodo: a)de forma canónica y b) de forma paralela + + Z-D k = (1-a 2 )/a a (b) Capí tul o IV y(n) Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o • 216 Reverberedor Schroeder’s: El reverberador Schoeder’s podríamos decir que es el paraíso acústico, en cuanto a efectos de reverberación se refiere. Este reverberador es una combinación de diversos arreglos en paralelo de reverberadores planos y a su vez estos arreglos en cascada con reverberadores del tipo pasatodo. Este reverberador logra que el efecto de reverberación en los ecos aumente, generando e incrementando la respuesta al impulso causadas generalmente por las primeras reflexiones (early reflection) y la ultimas reflexiones (late reflection). El siguiente diagrama de bloques muestra la estructura de este reverberador. xx1(n) + b1 + Z -D1 a1 xx2(n) + b2 + Z -D2 a2 x(n) Σ xx5(n) x6(n) (n) b5 ++ ++ b6 ++ Z -D5 xx3(n) + a5 y(n) ++ Z-D6 a6 b3 + Z -D3 a3 x4(n) (n) + b4 + Z -D4 a4 Fig. 82 Diagrama de bloque de un reverberador Schroeder’s Es importante remarcar que cuando uno empieza a utilizar reverberaciones suele hacer un abuso de ellas. La mejor manera de evaluar su efectividad consiste en ajustar el equilibrio entre sonido seco y sonido reverberado (dry/wet) según creamos apropiado, y a Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 217 continuación eliminar la reverberación; si "aparecen" detalles o instrumentos que en la mezcla no se oían quiere decir que seguramente estábamos a punto de sobre-reverberar. De esta forma los efectos de sonido se suelen clasificar en dos grupos según los parámetros que influyen en su generación; así tememos las transformaciones tímbricas en base a la estructura de los sonidos y transformaciones tímbricas en base a los retardos. 4.5.2 Transformaciones tímbricas basadas en la estructura de los sonidos. Filtrado. El dispositivo más utilizado para transformar el timbre de un sonido es el ecualizador. Un ecualizador permite modificar la señal de entrada de manera tal que determinados componentes de su estructura o espectro salen de él atenuados o amplificados. Un ecualizador permite, como máximo, manipular 3 parámetros: Ø Frecuencia de actuación o central: para determinar sobre qué zona del espectro queremos actuar. Ø Anchura de banda o factor Q: para determinar la región en torno a la frecuencia central (cuanto más estrecha más precisa será la modificación, pero seguramente será menos evidente); Ø Nivel de atenuación/amplificación: para determinar la magnitud en dB que necesitamos realzar o atenuar la banda sobre la que actuamos. Un ecualizador puede ser: • Paramétrico: si permite manipular los tres parámetros anteriores; • Semiparamétrico: si la Q está prefijada y sólo podemos alterar los otros dos parámetros (habitual en muchas mesas de mezclas); • Gráfico: si consta de un número fijo de frecuencias (8, 15, 31) de actuación, con una Q fija, de manera que tan sólo permite modificar el nivel de atenuación/amplificación Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 218 (con 31 bandas y una Q de tercio de octava puede ser el típico ecualizador utilizado para ajustar tonalmente una sala). Las transformaciones que podemos conseguir con un ecualizador no son excesivamente drásticas, aunque nos pueden ayudar a atenuar determinadas frecuencias molestas o exageradamente presentes, a realzar determinadas características tímbricas de una fuente sonora, o, en última instancia, a compensar determinadas deficiencias microfónicas o perceptuales. La ecualización no se debe utilizar por rutina o sistema sino en función de los objetivos sonoros o musicales (claridad, equilibrio tonal, énfasis en determinados componentes, etc.). La ecualización como parte de un equipo reproductor de sonido es fundamental debido a que en los procesos de captación de sonido, tanto en tiempo real como para el almacenaje, generalmente son atenuadas ciertas componentes en frecuencias del sonido para mejorar la calidad de captación. Por ejemplo en la grabación de discos se suele atenuar las señales correspondientes a tonos bajos para evitar la creación de surcos amplios que se puedan entremezclar con surcos contiguos y/o para evitar el ruido circundante. Generalmente dependiendo del equipo reproductor o captador de sonido se estipula un nivel de ecualización estándar que debe cumplir el mismo para colocarse en el mercado. Esto debido que los diseñadores de equipos complementarios estipulan sus entradas y salidas de sus sistemas según estos estándares. La encargada de estos estándares es la Record Industry Association of America (RIIA) y aquel equipo que no la cumpla no debe de salir al mercado. Un ecualizador es básicamente un filtro que solo deja pasar ciertas frecuencias de interés que son realzadas o atenuadas con una ganancia variable a la salida del sistema, como podemos observar en la siguiente figura. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 219 Filtro pasa bajas k Variable operando a f1 + Filtro pasa banda operando entre f2 y f3 Señal de entrada k Variable + + Señal de salida Filtro Filtro pasa pasa alta alta operando operando aa f4 k Variable Fig. 83 Diagrama de bloque de un compensador simple de tres bandas Como podemos observar la señal de entrada de nuestro sistema debe alimentar diferentes subsistemas. Estos subsistemas son diversos tipos de filtros, que para este caso son tres: un pasa banda operando a una frecuencia f1; un pasa banda operando entre f2 y f3; un pasa alto operando a f4. Estos filtros extraen de la señal original aquellas componentes que se desean tratar de la señal original. La ganancia k es la encargada de suministrar al sistema la atenuación de los niveles requeridos; la misma es del tipo variable lo que permite al operador colocarla en la mejor posición para la percepción del sonido deseado. Finalmente se suman las señales luego de ser tratadas para obtener la señal de salida que será reproducida. En una mezcla es importante tratar de plantear siempre en primer lugar una ecualización destructiva (en la que se atenúan determinadas zonas para conseguir el deseado equilibrio tonal) antes que una constructiva (en la que una amplificación excesiva puede originar un aumento del ruido); en lugar de amplificar lo que queremos resaltar podemos obtener el mismo efecto atenuando todo aquello que no nos interesa resaltar. En cambio, en grabación, si es necesario ecualizar deberemos preferir antes una Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 220 ecualización constructiva (que siempre permita volver a atenuar en mezcla) antes que una destructiva (si hemos atenuado algo, difícilmente vamos a conseguir que "reaparezca"); ahora bien, hay que conocer en qué zonas se mueve la energía de los instrumentos para no cometer el error de enfatizar zonas vacías que lo único que hará será aumentarnos el ruido de la grabación. 4.5.3 Transformaciones tímbricas basadas en retardos (delays). Utilizando como base el concepto de retardar la señal original k muestras para luego combinarla con la señal sin atrasó se pueden conseguir alteraciones tímbricas. Es así como tenemos otro medio para la generación de efectos. Las sensaciones producidas por el retardo (delay) impuesto a la señal varía en relación con el tiempo de retardo impuesto a la señal; así tenemos que: Ø Con un retardo muy corto (< 30 milisegundos) y una cierta realimentación alteraremos claramente la tímbrica. El sonido se hará metálico y adquirirá resonancias muy definidas en determinadas frecuencias. Incluso podemos simular acordes a partir de esta opción. Ø Con un retardo entre 20 y 80 milésimas afectamos principalmente a la presencia del instrumento, ya que nos aprovechamos del efecto Hass para "sumar" perceptualmente dos sonidos iguales (y físicamente separados en el tiempo), de manera que podemos generar la sensación de sonido más "grueso", o de multiplicación de instrumentistas. Ø Con retardos mayores de 80 o 100 milisegundos el efecto principal que obtenemos es de tipo rítmico, por tanto (al menos en el caso de músicas con ritmos marcados) hay que ajustar el tiempo de retardo al tiempo de la música, para lo cual existen tablas muy útiles. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 221 Además del tiempo de retardo, es posible manipular parámetros como: Ø Regeneración: la señal retardada vuelve a retardarse, con una regeneración al 100% la señal no deja nunca de sonar. Ø Múltiples líneas de retardo (multi-tap delay): es posible retardar de maneras diferentes pero simultáneas una misma señal (por ejemplo, una línea atenúa progresivamente la señal retardada, otra hace un número fijo de retardos, con una dinámica creciente, y otra hace lo mismo pero con una dinámica y una distribución de tiempos de retardo aleatorias. Ø Panoramización: permite hacer sonar las repeticiones alternativamente en uno u otro lado del espacio acústico, o ir desplazándolas progresivamente en una determinada dirección. Bajo este concepto se han desarrollada una diversa gama de efectos; dentro de los de mayor popularidad tenemos: • Efecto de Eco Cuando las reflexiones de un sonido llegan con retardos superiores a 50 milisegundos respecto de la fuente original aparece lo que denominamos eco. En otros tiempos el efecto de eco se conseguía gracias a los 2 cabezales (grabación y reproducción) de un magnetofón. Inyectando un sonido, grabándolo y reproduciéndolo inmediatamente obtendremos un retardo cuyo tiempo estará determinado por la distancia entre los cabezales y por la velocidad de la cinta (puede oscilar entre 66 y 266 milisegundos). Actualmente los ecos se consiguen mediante retardos digitales (delays) que nos permiten tiempos desde una milésima de segundo hasta 3 ó 4 segundos; a continuación observamos el diagrama de bloques y la ecuación de diferencias que produce el efecto de eco en un sistema digital. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 222 x(n) y(n) + + Z-D a Fig.84 diagrama de bloques de sistema digital que produce el eco y(n) = x(n) + ax(n – D) ec. 4.25 Donde x(n) es la señal de entrada e y(n) es la señal de salida. Como podemos observar la señal original se retrasa D muestras de la señal original y luego es atenuada por el factor de escalado a, para finalmente combinarla con la señal original con el fin de obtener el efecto de eco deseado. La atenuación de la señal antes del mezclado es requerida para evitar la saturación en la señal de salida, de manera tal que se obtenga un efecto nítido y con baja distorsión. • Flanger Se trata de un filtrado periódico (en forma de peine) de una serie de frecuencias determinada por el tiempo de retardo (por ejemplo, con uno de 0.5 milisegundos realzaremos 2KHz y sus armónicos), aunque explicarlo con palabras es poco efectivo. El origen del flanger es mecánico (hay quien se lo atribuye a George Martin y a John Lennon): si al grabar una cinta en un magnetofón presionamos con el dedo de vez en cuando y con fuerza variable la bobina que entrega cinta originamos micro-frenazos que alteran la señal original. Si grabamos simultáneamente en 2 magnetofones, y en uno aplicamos el "flanging" manual mientras que en el otro no, generaremos el barrido característico del efecto de flanger. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 223 Para producir este efecto por medio de un procesador digital de señales (DSP) se requiere básicamente la misma estructura que un generador de eco, pero en este caso el elemento retardor de la señal (d(n)) debe ser variable en el tiempo. A continuación mostramos el diagrama de bloques básico para la construcción del flanger y su respectiva ecuación de diferencias. x(n) y(n) + + Z-d(n) a Fig. 85. Diagrama de bloques de sistema digital que produce el flanger y(n) = x(n) - ax(n – d(n)) La señal de entrada y de salida son x(n) e y(n) respectivamente. ec. 4.26 Es importante acotar que el retrazo d(n) puede ser aleatorio o periódico. El flanger proporciona efectos más llamativos cuanto más rico (armónicamente hablando) sea el sonido. • Chorus Se utiliza para "engrosar" la señal, o para simular la existencia de varios instrumentos sonando al unísono. En esta situación, un intérprete puede tocar con cierto retraso y con cierta desafinación respecto a otro intérprete; eso es lo que trata de simular, de manera compacta, este efecto. El siguiente diagrama de bloques muestra su modelaje en formato digital. Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 224 Σ x(n) y(n) delay d1(n) x(n - d11(n)) a1(n) delay d2(n) x(n - d2 (n)) a2(n) Fig. 86 Diagrama de bloques de sistema digital que produce el Chorus Se puede observar que para producir este efecto debemos colocar tanto las ganancias como los retardos (delays) variables en el tiempo. Generalmente estas variaciones en el tiempo son funciones de n pero se restringen a un número finito sus posibles valores. Esto se realiza para con el fin de evitar excesivos de atrasos entre señales, para el caso de los delays (d), o excesivas amplitudes en la señal de salida, en el caso de los atenuadores (a). • Transpositor Inicialmente las transposiciones mecánicas se basaban en alterar la velocidad de reproducción de una cinta respecto de su velocidad en el momento de la grabación (reproduciendo al doble obtenemos una transposición de octava hacia arriba), pero también se alteraba la tímbrica ya que esta transformación no preserva las estructuras de formantes propias de muchos instrumentos (por ejemplo la voz) y de ahí los conocidos efectos de "pitufo" o de "fabulositos", en los que la voz así procesada poco tiene que ver con la original. Muchos transpositores digitales aún operan en base a esa idea de alterar la velocidad de reproducción, aunque en los últimos años van apareciendo más equipos y Capí tul o IV Traba jo de Gra duac ió n Franc isco J. Garc ía Casti ll o 225 programas capaces de transponer, incluso en tiempo real, sin alterar en exceso las características del instrumento. x(n) Σ Filtro BP fc1< f < fc2 Π Π y(n) Filtro anti-alising ω ωm >> ω ωd cos ω ωmn cos ω ωdnn Proceso de modulación y demodulación Fig. 87 Diagrama de bloques para el efecto de transposición Un algoritmo fácil de implementar lo podemos observar en el diagrama de bloques mostrado arriba. Este se basa en filtrar la señal de entrada para obtener la componente que deseamos transponer, por ejemplo la señal de voz de 300Hz a 3kHz. Luego se modula en frecuencia la señal filtrada (por ejemplo 10kHz), de forma que aumentemos la señal en frecuencia. Luego demodulamos la señal con una frecuencia menor a la utilizada para su modulación (para este ejemplo digamos que 9kHz), de forma que la señal filtrada final haya sido aumentando su timbre. Finalmente mezclamos esta señal con la señal de entrada para obtener el efecto deseado. Cabe destacar que la señal filtrada final debe pasar antes de sumarse a la señal original por un filtro anti-aliasing de manera de evitar el doblamiento de la señal. Observaremos en el próximo capítulo una forma de llevar a cabo uno de estos procesos estudiados; usando como base los aspectos teóricos discutidos con relación a los sistemas acústicos. También se emplearán como parámetros de diseño algunos de las características del sonido ya estudiadas al principio de este capítulo. Capí tul o IV