La cóclea como analizador en frecuencia La membrana basilar es

Anuncio
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
178
Fig. 51 Corte transversal de un conducto de la cóclea
La cóclea como analizador en frecuencia
La membrana basilar es una estructura cuyo espesor y rigidez no es constante:
cerca de la ventana oval, la membrana es gruesa y rígida, pero a medida que se acerca
hacia el vértice de la cóclea se vuelve más delgada y flexible.
La rigidez decae casi exponencialmente con la distancia a la ventana oval; esta
variación de la rigidez en función de la posición afecta la velocidad de propagación de las
ondas sonoras a lo largo de ella, y es responsable en gran medida de un fenómeno muy
importante: la selectividad en frecuencia del oído interno.
Ondas viajeras y transformación de frecuencia a posición
Las ondas de presión generadas en la perilinfa a través de la ventana oval tienden
a desplazarse a lo largo de la escala vestibular. Debido a que el fluido es incompresible la
membrana basilar se deforma, y la ubicación y amplitud de dicha deformación varía en el
tiempo a medida que la onda de presión avanza a lo largo de la cóclea.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
179
Para comprender el modo de propagación de las ondas de presión, supóngase que
se excita el sistema auditivo con una señal sinusoidal de una frecuencia dada:
La membrana basilar vibrará sinusoidalmente, pero la amplitud de la vibración irá
en aumento a medida que se aleja de la ventana oval (debido a la variación en la
velocidad de propagación), hasta llegar a un punto en el cual la deformación de la
membrana basilar sea máxima; en ese punto de "resonancia", la membrana basilar es
acústicamente "transparente" (es decir, se comporta como si tuviera un orificio), de modo
que la amplitud de la vibración y, por ende, la transmisión de la energía de la onda al
fluido de la escala timpánica es máxima en dicho punto.
Fig. 52. Onda viajera en la membrana basilar.
A partir de esa región, la onda no puede propagarse eficientemente, de modo que
la amplitud de la vibración se atenúa muy rápidamente a medida que se acerca al
helicotrema. En la Fig. 52 se observa la onda en la membrana basilar en un instante de
tiempo.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
180
En este modo de propagación, las ondas de presión son ondas viajeras, en las
cuales (a diferencia de las ondas estacionarias) no existen nodos. En la Fig. 52 se observa
la amplitud de oscilación de la membrana basilar en dos instantes de tiempo, junto con la
envolvente de la onda viajera, en función de la distancia al estribo.
La ubicación del máximo de la envolvente de la onda viajera depende de la
frecuencia de la señal sonora, como puede observarse en la Fig. 53: mientras menor es la
frecuencia del tono, mayor es la distancia que viaja la onda a lo largo de la membrana
antes de ser atenuada, y viceversa. De esta forma, la membrana basilar dispersa las
distintas componentes de una señal de espectro complejo en posiciones bien definidas
respecto a la ventana oval.
Fig. 53. Ondas viajeras para un tono de 200 Hz
Fig. 54. Transformación de frecuencia a posición en la membrana basilar
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
181
Selectividad en frecuencia de la membrana basilar
Como se ha visto, las altas frecuencias contenidas en un estímulo sonoro se
atenúan a medida que la onda se desplaza hacia el helicotrema. Así, se puede considerar a
la membrana basilar como un filtro pasa bajos de parámetros distribuidos. Por otro lado,
si se midiese la respuesta en frecuencia en un punto dado de dicha membrana, se
obtendría una respuesta de tipo pasa banda.
Este comportamiento de la membrana basilar puede modelarse, con un grado de
aproximación razonable, como una línea de transmisión no uniforme, representada en la
Fig. 55.
Cada etapa en paralelo representa un segmento corto de la membrana basilar. La
corriente suministrada por la fuente corresponde a la velocidad del estribo. Los
inductores en serie y en paralelo representan las masas del fluido y de segmentos de la
membrana basilar, respectivamente; los condensadores representan la rigidez de la
membrana, y se asume que su valor varía exponencialmente según la posición. Las
resistencias representan pérdidas en la membrana.
Fig. 55. Representación de la membrana basilar como una línea de transmisión
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
182
Este modelo pasivo presenta varios inconvenientes: no considera fenómenos
activos y no lineales de la membrana, no es capaz de generar una respuesta pasabanda tan
estrecha como las observadas experimentalmente en tejidos vivos y, además, no toma en
cuenta el hecho de que la membrana basilar es una estructura en tres dimensiones.
A
pesar de ello, permite representar fácilmente los fenómenos de resonancia y de ondas
viajeras.
4.3.5 Mecanismo de transducción
Interacción entre las membranas basilar y tectorial
El proceso de transducción o conversión de señal mecánica a electroquímica se
desarrolla en el órgano de Corti, situado sobre la membrana basilar.
Las vibraciones de la membrana basilar hacen que ésta se mueva en sentido
vertical. A su vez la membrana tectorial, ubicada sobre las células ciliares (los
transductores), vibra igualmente; sin embargo, dado que los ejes de movimiento de ambas
membranas son distintos, el efecto final es el de un desplazamiento "lateral" de la
membrana tectorial con respecto a la membrana basilar.
Como resultado, los cilios de las células ciliares externas se "doblan" hacia un
lado u otro (hacia la derecha, en la Fig. 56, cuando la membrana basilar "sube").
En el caso de las células internas, aun cuando sus cilios no están en contacto
directo con la membrana tectorial, los desplazamientos del líquido y su alta viscosidad
(relativa a las dimensiones de los cilios) hacen que dichos cilios se doblen también en la
misma dirección.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
183
Células ciliares y potenciales eléctricos
La diferencia fundamental entre los dos fluidos de la cóclea, la perilinfa y la
endolinfa, estriba en las distintas concentraciones de iones en los dos fluidos. De esta
manera, la endolinfa se encuentra a un potencial eléctrico ligeramente positivo (ver Fig.
57) respecto a la perilinfa.
Fig.56 Desplazamiento relativo de las membranas basilar y tectorial.
Por otro lado, los movimientos de los cilios en una dirección determinada (hacia
la derecha, en la Fig. 56) hacen que la conductividad de la membrana de las células
ciliares aumente. Debido a las diferencias de potencial existentes, los cambios en la
membrana modulan una corriente eléctrica que fluye a través de las células ciliares.
Fig 57 Potenciales eléctricos en el órgano de Corti y los fluidos de la cóclea.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
184
La consiguiente disminución en el potencial interno de las células internas
provoca la activación de los terminales nerviosos aferentes, generándose un impulso
nervioso que viaja hacia el cerebro. Por el contrario, cuando los cilios se doblan en la
dirección opuesta, la conductividad de la membrana disminuye y se inhibe la generación
de dichos impulsos.
Se pueden destacar dos aspectos de este proceso de transducción: primero, que la
generación de impulsos nerviosos es un fenómeno probabilístico; segundo, que el proceso
se comporta como un rectificador de media onda, puesto que la probabilidad de
activación de las fibras nerviosas "sigue" a las porciones "positivas" de la señal sonora
(equivalentes a desplazamientos hacia "arriba" de la membrana basilar, en la Fig. 56),
mientras que se hace cero en las porciones "negativas" de la onda.
Interacción entre células ciliares internas y externas
Las fibras aferentes están conectadas mayormente con las células ciliares internas,
por lo que es posible concluir con certeza que éstas son los verdaderos "sensores" del
oído. Por el contrario, el papel de las células ciliares externas (más numerosas que las
internas) era objeto de especulaciones hasta hace pocos años.
Recientemente se ha comprobado que dichas células no operan como receptores,
sino como "músculos", es decir, como elementos móviles que pueden modificar las
oscilaciones en la membrana basilar.
La actuación de las células ciliares externas parece ser la siguiente para niveles de
señal elevados, el movimiento del fluido que rodea los cilios de las células internas es
suficiente para doblarlos, y las células externas se saturan. Sin embargo, cuando los
niveles de señal son bajos, los desplazamientos de los cilios de las células internas son
muy pequeños para activarlas; en este caso, las células externas se "alargan", aumentando
la magnitud de la oscilación hasta que se saturan.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
185
Este es un proceso no lineal de retroalimentación positiva de la energía mecánica,
de modo que las células ciliares externas actúan como un control automático de ganancia,
aumentando la sensibilidad del oído.
Este nuevo modelo del mecanismo de transducción nos indica que el conjunto
formado por la membrana basilar y sus estructuras anexas forman un sistema activo, no
lineal y con realimentación, y permite explicar dos fenómenos asociados al oído interno:
el "tono de combinación", generado a partir de dos tonos de distinta frecuencia por un
elemento no lineal que contiene un término cúbico, y las "emisiones otoacústicas", las
cuales consisten en tonos generados en el oído interno en forma espontánea o estimulada,
y que pueden llegar a ser audibles.
Selectividad en frecuencia de la cóclea
Debido a la acción de filtraje de la membrana basilar, cada célula transductora
procesa una versión del estímulo sonoro filtrada de modo diferente. Esta acción de filtraje
de la membrana basilar por sí sola equivale a la de filtros cuya respuesta en frecuencia es
relativamente "ancha". Ahora bien, la realimentación positiva provocada por las células
ciliares externas contribuye a aumentar la selectividad del sistema auditivo.
Esto puede comprobarse midiendo la respuesta de una única fibra nerviosa ante
variaciones en la frecuencia y la amplitud del estímulo sonoro; las curvas de sintonía así
obtenidas indican una respuesta de tipo pasabanda mucho más angosta que la debida al
efecto de la membrana basilar como elemento pasivo.
Adicionalmente, experimentos recientes han permitido determinar que la
selectividad del oído interno es virtualmente idéntica a la selectividad del sistema
auditivo en su totalidad, estimada por métodos psicoacústicos.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
186
4.3.6 Procesamiento a nivel neural
Los impulsos nerviosos generados en el oído interno contienen (en forma
codificada) información acerca de la amplitud y el contenido espectral de la señal sonora;
estos dos parámetros están representados por la tasa de impulsos y la distribución de los
mismos en las distintas fibras, respectivamente
Las fibras nerviosas aferentes llevan esta información hasta diversos lugares del
cerebro. En éste se encuentran estructuras de mayor o menor complejidad, encargadas de
procesar distintos aspectos de la información.
Por ejemplo, en los centros "inferiores" del cerebro se recibe, procesa e
intercambia información proveniente de ambos oídos, con el fin de determinar la
localización de las fuentes del sonido en el plano horizontal en función de los retardos
interaurales, mientras que en los centros "superiores" de la corteza existen estructuras
más especializadas que responden a estímulos más complejos.
La información
transmitida por el nervio auditivo se utiliza finalmente para generar lo que se conoce
como "sensaciones".
Hasta ahora se ha visto que las distintas partes del sistema auditivo son
susceptibles de ser modeladas matemáticamente, en términos de su comportamiento
como sistemas físicos.
Se podría por tanto pensar que el modelo perceptual ideal es aquel que simula, en
términos de los procesos físicos y fisiológicos, todas las etapas del sistema auditivo,
incluyendo la etapa de procesamiento neural en el cerebro. Sin embargo, la comprensión
que se tiene acerca de lo que ocurre en las estructuras cerebrales es muy limitada,
especialmente en lo relativo a los centros "superiores" del cerebro. Por lo tanto, es
necesario recurrir a la descripción psicoacústica de los fenómenos perceptuales y de las
sensaciones.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
187
44..44 PPSSIIC
CO
OA
AC
CÚ
ÚSST
TIIC
CA
A
Son muchos los fenómenos que abarca el sonido y diferentes las propiedades para
describirlos.
Gran número de estas propiedades no puede ser descrito a través de los
fenómenos físicos que involucran las ondas acústicas, sino más bien son fenómenos
perceptuales que abarcan un número complejo de relaciones para poder ser descrito.
En la fig. 58 podemos observar muchos de estos fenómenos a que nos referimos.
Estos fenómenos son estudiados por la Psicoacústica y se requieren de un
conocimiento previo para poder desarrollar alguna aplicación que involucre el sonido; ya
que como podemos observar en la figura la gran mayoría determinan la calidad del
sonido y diversas propiedades que se aplican para obtener distintos efectos sonoros.
Fig.58. Ramas que implican estudios psicoacústicos auditiva
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
188
En la presente sección abarcaremos brevemente los conceptos más generales de
muchos de estos fenómenos y de la terminología utilizada para su desarrollo.
4.4.1 Rango dinámico y respuesta en frecuencia del oído
Area de audición
El ser humano es capaz de detectar únicamente aquellos sonidos que se
encuentren dentro de un determinado rango de amplitudes y frecuencias. En este sentido,
se puede establecer una analogía entre el aparato auditivo y un sistema electrónico de
audio: en base al concepto convencional del rango dinámico.
Se define el rango dinámico del oído como la relación entre la máxima potencia
sonora que éste puede manejar y la mínima potencia necesaria para detectar un sonido.
Asimismo, el rango de frecuencias asignado convencionalmente al sistema auditivo va
desde los 20 Hz hasta los 20 kHz, aun cuando este rango puede variar de un sujeto a otro
o disminuir en función de la edad del sujeto, de trastornos auditivos o de una pérdida de
sensibilidad (temporal o permanente) debida a la exposición a sonidos de elevada
intensidad.
Cabe destacar que la sensibilidad del sistema auditivo no es independiente
de la frecuencia.
Estos tres parámetros del oído (rango dinámico, respuesta en frecuencia y
sensibilidad en función de la frecuencia) se resumen en la siguiente figura, que ilustra el
área de audición.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
189
Fig. 59. Area de audición.
El extremo superior del rango dinámico está dado por el umbral de dolor, el cual
define las presiones sonoras máximas que puede soportar el oído. Más abajo de este
nivel, se encuentra el límite de riesgo de daños, el cual representa un umbral de presión
sonora que no debe sobrepasarse por más de un cierto período de tiempo (ocho horas
diarias por día laboral), o de lo contrario puede producirse un pérdida de sensibilidad
permanente.
El extremo inferior, denominado umbral de audibilidad (UA), representa la
sensibilidad del aparato auditivo, es decir, el valor mínimo de presión sonora que debe
tener un tono para que éste sea apenas perceptible. De la fig. 59 resulta obvio que esta
sensibilidad depende de la frecuencia de la señal sonora.
Como se ve en la fig. 59, el aparato auditivo es capaz de operar sobre un rango de
presiones sonoras muy amplio (unos 150 dB). Las presiones sonoras correspondientes al
mínimo del umbral de audibilidad (Å 0 dB SPL) equivalen a desplazamientos de la
membrana basilar inferiores a 1010 m, distancia comparable al diámetro de un átomo.
Tan extraordinaria sensibilidad se debe a los mecanismos activos y no lineales descritos
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
190
anteriormente; es decir, a la acción combinada de varias células ciliares externas sobre
cada célula interna.
4.4.2 Umbral de audibilidad
La sensibilidad del aparato auditivo puede variar considerablemente de un sujeto a
otro. Por esta razón, resulta conveniente definir un umbral de audibilidad promedio,
también llamado mínimo campo audible promedio; éste se representa mediante una curva
que indica la presión sonora de un tono puro de larga duración (> 200 ms), el cual se
propaga en condiciones de campo libre y en ausencia de cualquier otro sonido, y que
puede ser detectado por el 50% de una población de sujetos jóvenes (entre 18 y 25 años)
y audiológicamente normales.
Los valores medios del umbral de audibilidad han sido objeto de un proceso de
estandarización, descrito en un documento de la ISO.
Es preciso tener en mente que el umbral de audibilidad promedio no representa un
límite absoluto, sino una medida estadística asociada con la probabilidad de detección de
un tono de determinada frecuencia y amplitud y que, por ende, debe ser empleado con
cautela; por ejemplo, si el UA promedio se utiliza en un sistema que evalúa la calidad del
sonido sometido a algún proceso de codificación, puede proporcionar resultados
optimistas e inducir a errores.
La sensibilidad del sistema auditivo humano disminuye con la edad,
especialmente en las altas frecuencias, debido al deterioro de las células ciliares del
órgano de Corti.
El umbral de audibilidad no sólo es función del sujeto y de los parámetros ya
mencionados, sino que además presenta una dependencia con respecto al modo de
propagación de las ondas sonoras.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
191
Ahora bien, el modo de propagación de "campo libre" sólo es posible en
ambientes anecoicos o utilizando audífonos cuya respuesta en frecuencia haya sido
adecuadamente
corregida;
sin
embargo,
en
situaciones
cotidianas
(ambientes
reverberantes; aplicación directa del sonido, sin audífonos) las características en
frecuencia del lugar en el cual se encuentre el sujeto, por una parte, y la difracción
provocada por la cabeza y el pabellón auricular, por otra, hacen que la propagación del
sonido se asemeje a la condición de "campo difuso", en la cual el sonido incide desde
todas las direcciones posibles. En esta condición, la sensibilidad del oído varía
notablemente, como se observa en la Fig. 60.
Fig.60. Umbral de audibilidad en condiciones de campo libre y difuso.
4.4.3 Excitación y nivel de excitación
Como se vio anteriormente, el comportamiento de la membrana basilar frente a
los estímulos sonoros puede resumirse en tres propiedades: existencia de ondas viajeras,
dispersión de las componentes de distinta frecuencia a lo largo de la membrana y
comportamiento pasa bajos (considerando la totalidad de la membrana).
Supóngase que se estimula a la membrana basilar con un tono puro, de nivel X dB
SPL.
Debido a las propiedades antes descritas de la membrana basilar, la propagación
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
192
del tono será tal que se producirá una onda viajera, cuya envolvente se muestra en la Fig.
22.
La amplitud máxima de la envolvente depende de la intensidad del estímulo. Por
otro lado, debido a la naturaleza del mecanismo de transducción de la señal sonora, dicha
envolvente está asociada directamente con la actividad neural en el órgano de Corti,
puesto que la tasa de generación de impulsos nerviosos depende de la amplitud de la
señal.
Así pues, se puede establecer una equivalencia directa entre la intensidad de la
señal, la envolvente de la onda viajera y el grado de estimulación o excitación de los
receptores auditivos (esto es, las células ciliares internas) y sus terminaciones nerviosas
asociadas.
Fig. 61. Envolvente de la onda viajera provocada por un tono puro.
Por esto, se define el patrón de excitación como la curva que representa, en
función de la frecuencia, la magnitud de la actividad neural (o, lo que es equivalente, la
envolvente de la onda viajera) expresada en unidades de intensidad sonora. De esta
manera, es posible interpretar el patrón de excitación como una curva que resume las
transformaciones de que es objeto la señal sonora en el oído interno.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
193
La Fig. 62 muestra el patrón de excitación correspondiente a un tono de 1 kHz y
60 dB SPL. El valor del patrón de excitación en cualquier punto de la curva, expresado en
dB SPL, se denomina nivel de excitación; por definición, el nivel de excitación máximo
en la curva corresponde al nivel de presión sonora del tono.
Fig. 62. Patrón de excitación producido por un tono.
A pesar de que, obviamente, no es posible determinar directamente el patrón de
excitación mediante experimentos psicoacústicos, éste puede inferirse indirectamente a
partir de resultados de experimentos fisiológicos y de su relación con diversos fenómenos
perceptuales, tales como el enmascaramiento y la sonoridad.
4.4.4 Enmascaramiento sonoro
El enmascaramiento sonoro puede definirse como el proceso en el cual el umbral
de audibilidad correspondiente a un sonido se eleva, debido a la presencia de otro sonido.
Para ilustrar mejor este fenómeno, imagínese el siguiente experimento:
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
Un
sujeto
194
audiológicamente
normal
se
introduce
en
un
ambiente anecoico y con bajo nivel de ruido acústico de
fondo, y se le hace escuchar una señal sonora A (p. ej., un
tono puro) que sea perfectamente audible, es decir, cuyo
nivel de presión sonora esté muy por encima del umbral de
audibilidad del sujeto a la frecuencia del tono. Se le pide
al
sujeto
que
juzgue
(subjetivamente)
la
intensidad
del
tono de prueba A. Luego, se añade una señal sonora B (p.
ej., una banda de ruido centrada en la frecuencia del tono)
de bajo nivel SPL, y se va aumentando progresivamente el
nivel de B, manteniendo constante el nivel de A. El sujeto
notará que, a medida que aumenta el nivel de la señal B, la
intensidad aparente o subjetiva de A disminuye hasta que,
eventualmente, A se hace inaudible. En este caso se dice
que la señal A está totalmente enmascarada por la señal B.
El
enmascaramiento depende del nivel de presión sonora de las señales
"enmascarante" y "enmascarada", así como de la separación en frecuencia y en tiempo
entre las mismas.
A continuación mencionaremos brevemente diversas características del fenómeno
de enmascaramiento sonoro.
Umbral de enmascaramiento y nivel de sensación
Para medir cuantitativamente la magnitud del enmascaramiento, así como para
distinguir entre el umbral de audibilidad en condiciones de "silencio" (es decir, en
ausencia de otra señal distinta a la señal de prueba) y el UA en condiciones de
enmascaramiento, se define el umbral de enmascaramiento (UE) como "el nivel de
presión sonora de un sonido de prueba necesario para que éste sea apenas audible en
presencia de una señal enmascarante".
De la definición anterior resulta obvio que los umbrales de audibilidad y de
enmascaramiento deben ser idénticos en ausencia de señales enmascarantes.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
195
Si se representa en forma gráfica el valor del UE en función de la frecuencia (u
otra variable análoga), se obtiene una curva denominada patrón de enmascaramiento.
Adicionalmente, se define el nivel de sensación (NS) de una señal de prueba como la
diferencia, en dB SL, entre el umbral de enmascaramiento y el umbral de audibilidad
correspondientes a dicha señal y expresados en dB SPL:
ec. 4.19
La unidad "dB SL", aplicada a cualquier parámetro relacionado con estímulos
sonoros, se utiliza para recalcar el hecho de que es una medida relativa al umbral de
audibilidad.
Enmascaramiento simultáneo
Dependiendo de la ubicación temporal de la señal de prueba (P) con respecto a la
señal enmascarante (E), se pueden distinguir tres situaciones posibles (Fig. 63):
1) Enmascaramiento simultáneo: E y P se presentan solapados en el
tiempo (E está presente durante toda la duración de P).
2) Enmascaramiento previo: a la presentación de la señal enmascarante, o
pre-enmascaramiento: E se presenta después de P.
3) Post-enmascaramiento: E se presenta antes que P.
Fig. 63. Ubicación temporal de las señales
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
196
Efectos espectrales
Según estudios realizados se ha podido observar que el enmascaramiento
simultáneo tiene una dependencia con la frecuencia de manera no lineal, para bajas
frecuencias y en forma logarítmica para frecuencias altas (> 500Hz).
A continuación
mostramos algunos ejemplos de esta dependencia.
La fig. 64 muestra el patrón de enmascaramiento generado por ruido blanco (de
espectro plano entre 20 Hz y 20 kHz) con distintas densidades espectrales. La curva
punteada inferior corresponde al UA; los extremos izquierdo y derecho de las curvas de
los UEs se superponen con el UA.
Fig. 64 Patrón de enmascaramiento producido por ruido blanco.
En la siguiente figura se puede observar el patrón de enmascaramiento provocado
por bandas de ruido de una banda crítica de ancho y nivel de 60 dB SPL. Las bandas de
ruido, centradas en 70, 250, 1000, 4000 y 8000 Hz, tienen anchos de 100, 100, 160, 700 y
1700 Hz, respectivamente.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
197
Las pendientes superior e inferior de cada banda de ruido son superiores a 200
dB/octava, por lo que sus espectros pueden ser considerados rectangulares (ruido
pasabanda ideal). La curva inferior corresponde al UA.
(a) Escala lineal de frecuencia
(b) Escala logarítmica de frecuencia.
Fig. 65. Patrón de enmascaramiento producido por bandas de ruido angostas.
Dependencia del nivel de señal
En la siguiente fig. 66 se muestra el patrón de enmascaramiento correspondiente a
bandas de ruido centradas en 1 kHz. Todas las bandas de ruido tienen el mismo ancho de
banda (160 Hz), pero difieren en el nivel de presión sonora.
Fig. 66. Patrón de enmascaramiento producido
por bandas de ruido de distinta intensidad sonora.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
198
En esta figura se nota que el valor máximo del patrón de enmascaramiento
depende del nivel de la señal enmascarante, en forma tal que un incremento de X dB en la
presión sonora de la señal provoca un incremento de X dB en el UE máximo (situado
aproximadamente en la frecuencia central de la banda de ruido).
Por otro lado, la dependencia de las pendientes con respecto al nivel de señal
resulta un tanto inesperada: hacia las frecuencias inferiores a la frecuencia central de la
banda de ruido, la pendiente permanece prácticamente constante (es casi independiente
del nivel), mientras que hacia las altas frecuencias la pendiente aumenta (en magnitud) a
medida que disminuye el nivel de señal.
Umbral de audibilidad y de enmascaramiento
En las figuras 64, 65 y 66 se observa que los patrones de enmascaramiento se
superponen con el umbral de audibilidad en las bajas y altas frecuencias. Este
solapamiento es de esperarse, puesto que, a medida que la distancia en frecuencia entre
las señales enmascarante y enmascarada aumenta, el efecto de la primera debe disminuir
y, eventualmente, desaparecer.
La relación entre el umbral de audibilidad y los patrones de enmascaramiento es
aún más estrecha, puesto que el UA puede considerarse, en cierta medida, como un
umbral de enmascaramiento.
Efectos temporales
Los ejemplos estudiados hasta ahora corresponden a señales de prueba de gran
duración (> 200 ms). Ahora bien, tanto el umbral de audibilidad como el de
enmascaramiento dependen de la duración de la señal de prueba. La siguiente figura
muestra la variación del UA para tonos de 200, 1000 y 4000 Hz, así como la variación
del UE producido por ruido uniformemente enmascarante (RUE), en función de la
duración de la señal de prueba.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
199
El valor de umbral indicado en el gráfico es igual al nivel de un tono de duración
infinita (potencia del tono) a partir del cual se extrae un segmento de señal con la
duración indicada. Las curvas correspondientes al RUE son válidas en el rango de
frecuencias audibles.
Fig. 67. Umbral de audibilidad y de enmascaramiento en
función de la duración de la señal enmascarada.
Para duraciones de la señal de prueba de más de 200 ms, el umbral permanece
constante, mientras que para duraciones inferiores a 200 ms el umbral aumenta en 10 dB
por década de tiempo: es decir, si el UE de un tono de T segundos de duración es igual a
X dB SPL, el UE de un tono de 0,1T segundos será de (X + 10) dB SPL.
Esta dependencia sugiere que, para duraciones inferiores a 200 ms, el sistema
auditivo opera como un detector de energía: de este modo, si se reduce la duración de una
señal de T a 0,1T segundos, para que la señal siga siendo apenas audible es preciso
incrementar la potencia de la señal de P a 10P, con el fin de que la energía de la señal,
e = PT, permanezca constante.
Por otro lado, para duraciones de más de 200 ms el umbral (es decir, la
detectabilidad del tono de prueba) es independiente de la duración. En consecuencia, se
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
200
puede inferir que el sistema auditivo opera como un detector de energía dentro de una
ventana de tiempo de 200 ms de duración .
Enmascaramiento no simultáneo
La Fig. 68 muestra las regiones temporales en las cuales ocurren los fenómenos de
pre-enmascaramiento, post-enmascaramiento y enmascaramiento simultáneo, así como la
evolución en el tiempo de los mismos.
Fig.68. Nivel de sensación de una señal de prueba
apenas audible, en función del tiempo.
Pre-enmascaramiento
El pre-enmascaramiento es un fenómeno inesperado, pues pareciera implicar
que el sistema auditivo es no causal una señal puede enmascarar a otra antes de ser
aplicada. Sin embargo, es posible justificar la existencia del pre-enmascaramiento si
se piensa que cualquier sensación sonora no se produce instantáneamente, sino que se
requiere de un cierto tiempo para que se origine dicha sensación; de hecho, un
estímulo sonoro debe tener una duración mínima para que se generen impulsos en las
terminaciones nerviosas del órgano de Corti .
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
201
Las señales de gran intensidad requieren de un tiempo de formación de la
sensación menor que el de las señales de baja intensidad; así, si una señal "grande" se
presenta unos pocos milisegundos después que una señal "pequeña", la sensación
asociada a ésta puede no llegar a producirse, quedando efectivamente enmascarada.
Debido a la corta duración del pre-enmascaramiento y a la escasa información
disponible,
los
modelos perceptuales
ignoran
usualmente
los
efectos
de
pre-enmascaramiento, aún cuando éstos pueden ser de gran importancia en sistemas
de codificación de audio basados en transformadas.
Post-enmascaramiento
El post-enmascaramiento, por el contrario, es un efecto fácil de medir aún en
sujetos no entrenados. Por regla general, se determina experimentalmente mediante
señales de prueba de corta duración (del orden de los 5 ms o menos), aplicadas luego
de una señal enmascarante de duración variable. El efecto de post-enmascaramiento
existe durante un intervalo máximo de unos 200 ms después de la desaparición de la
señal enmascarante.
En la Fig. 69 se observa el comportamiento del umbral de enmascaramiento
en función del retardo entre el instante en que desaparece la señal enmascarante y el
instante en que desaparece la señal de prueba, y de la intensidad de la señal
enmascarante. La señal de prueba en este caso es un impulso de presión de forma
"gaussiana", de 20 ms de duración; la señal enmascarante es ruido blanco de 0,5 s y
nivel de densidad espectral variable.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
202
Fig. 69 Decaimiento del post-enmascaramiento en función
del tiempo y de la intensidad de la señal enmascarante.
Por último, el post-enmascaramiento depende del contenido frecuencial de las
señales enmascarante y enmascarada. Diversos experimentos descritos en la literatura
permiten concluir que la cantidad de post-enmascaramiento es mayor en las bajas
frecuencias que en las altas.
4.4.5 Bandas críticas y tasa de bandas críticas
Como se vio hemos visto, el comportamiento de la cóclea como analizador en
frecuencia puede resumirse en dos características:
•
La componente del espectro de la señal sonora es procesada por más de un
receptor auditivo.
•
Análogamente, cada receptor auditivo procesa diversas componentes del espectro
de la señal.
La forma del patrón de excitación provocado por un tono puro ilustra bien estas
dos características, e indica que la selectividad en frecuencia del sistema auditivo no es
infinita.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
203
Ancho de banda crítico
El ancho de banda crítico es un concepto desarrollado por Fletcher, que puede
interpretarse como una medida de la selectividad frecuencial del oído.
El ancho de banda crítico permite explicar por qué, dado un tono de una cierta
frecuencia, una banda de ruido estrecha centrada en dicha frecuencia produce la misma
cantidad de enmascaramiento sobre el tono que una banda ancha de ruido, aun cuando el
nivel de densidad espectral de ambos ruidos sea igual y, por ende, la energía del ruido de
banda estrecha sea menor].
En pocas palabras, si el ancho de la banda de ruido varía, para enmascarar al tono
es necesario que la energía del ruido contenida en un intervalo de frecuencias alrededor
del tono sea constante.
La energía efectiva de la señal enmascarante es aquella confinada en tal intervalo,
mientras que el resto no contribuye al enmascaramiento del tono.
El ancho de este
intervalo crítico ha sido denominado ancho de banda crítico.
De esta manera, el ancho de banda crítico (tal y como lo definió Fletcher) se
obtiene cuando el ancho de la banda de ruido es tal que la intensidad de un tono de
prueba apenas audible es igual a la intensidad de la banda de ruido. Ahora bien, esta
medida de la selectividad del sistema auditivo es incorrecta, puesto que Fletcher basó su
definición en dos suposiciones erróneas:
•
Cuando el tono es apenas audible, la "relación señal a ruido" (SNR) entre las
intensidades del tono y de la banda de ruido no es igual a 0 dB.
•
Esta "relación señal a ruido" varía con la frecuencia del tono: a frecuencias bajas,
es de unos 2 dB, mientras que en las altas frecuencias llega a unos 6 dB.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
204
Bandas críticas: definición y determinación experimental
A pesar de los errores implícitos en la definición de Fletcher, el concepto de un
ancho crítico sigue siendo válido, puesto que numerosos experimentos psicoacústicos
indican que las respuestas de los sujetos ante distintos fenómenos perceptuales cambian
abruptamente cuando los estímulos sobrepasan un cierto ancho de banda.
Así pues, se define una banda crítica (BC) como un intervalo de frecuencia que
representa la máxima resolución frecuencial del sistema auditivo en diversos
experimentos psicoacústicos. Adicionalmente, puede decirse que una BC constituye el
intervalo de frecuencia en el cual el oído interno efectúa una integración espacial (es
decir, espectral) de la intensidad de la señal sonora: la BC es el intervalo en el cual se
"suma" la energía de las distintas componentes espectrales de la señal.
Tasa de bandas críticas
Los anchos de las bandas críticas dependen de la frecuencia, como se ilustra en la
Fig..31. Esta curva, se obtuvo promediando los resultados de la medición de las BCs en
más de 50 sujetos y con cinco métodos distintos. Por debajo de los 500 Hz, el ancho de
banda crítico es aproximadamente constante (aprox. 100 Hz), mientras que por encima de
los 500 Hz crece en proporción a la frecuencia: el ancho de una banda crítica centrada en
una frecuencia superior a 500 Hz es de alrededor del 20% de la frecuencia central.
Esta curva puede ser modelada mediante la siguiente ecuación, la cual permite
calcular el ancho de banda crítico (en Hz), ÆfBC, correspondiente a la frecuencia en Hz,
f, con un error inferior al 10%:
ec. 4.20
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
205
Fig. 70. Ancho de las bandas críticas en función de la frecuencia.
Basándose en los valores obtenidos mediante la Fig. 70 o la ecuación anterior, es
posible subdividir el rango de frecuencias audibles en intervalos adyacentes de una BC de
ancho, que no se solapan entre sí, y que representan una primera aproximación al
problema de modelar la selectividad en frecuencia del oído interno.
Esta subdivisión se representa en la siguiente figura; en el rango audible de 20 Hz
a 20 kHz se encuentran 25 bandas críticas adyacentes, numeradas en forma consecutiva
en la fig. 71.
En la Tabla 12 se muestran los valores que definen las primeras 24 BCs, según
Zwicker, los cuales se han convertido en un estándar "de facto" para describir la
distribución de las BCs en función de la frecuencia.
Ahora supóngase que se subdivide de manera continua el rango de frecuencias
audibles en intervalos solapados entre sí de una BC de ancho, y que se desea obtener,
para cada frecuencia f0, un valor que represente el número (no necesariamente entero) de
bandas críticas adyacentes y no solapadas contenidas en el intervalo de 0 a f0 Hz.
Los valores así obtenidos constituyen la denominada tasa de bandas críticas, también
llamada escala de bandas críticas.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
206
Fig.71. Bandas críticas adyacentes en el rango de frecuencias audibles.
Nº de banda
crítica
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Frec. central
(Hz)
50
150
250
350
450
570
700
840
1000
1170
1370
1600
1850
2150
2500
2900
3400
4000
4800
5800
7000
Frec. superior
(Hz)
100
200
300
400
510
630
770
920
1080
1270
1480
1720
2000
2320
2700
3150
3700
4400
5300
6400
7700
Ancho de la
BC(Hz)
100
100
100
100
110
120
140
150
160
190
210
240
280
320
380
450
550
700
900
1100
1300
22
8500
9500
1800
23
24
10500
13500
12000
15500
2500
3500
Tabla 12. Distribución de las bandas críticas en función de la frecuencia.
Estrictamente hablando, la tasa de BCs (Fig. 72) y el ancho de las bandas críticas
(Fig. 71) están relacionados a través de la siguiente ecuación:
ec. 4.21
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
207
En la Fig. 72 se muestra la relación entre la tasa de bandas críticas, la frecuencia y
el número asignado a las BCs adyacentes de la Fig. 71.
Fig.72. Tasa de bandas críticas en función de la frecuencia.
Para los valores de tasa de BCs, se ha definido como unidad el "bark": un
intervalo de frecuencia de 1 bark es, por definición, un intervalo de una BC de ancho en
cualquier punto del rango de frecuencias audibles.
En la Fig. 72 se observa que la
primera BC abarca el intervalo de 0 a 1 bark, la segunda BC el intervalo de 1 a 2 barks, y
así sucesivamente.
La Fig. 73 ilustra la relación entre la tasa de BCs y diversos parámetros físicos,
fisiológicos y perceptuales. En la parte superior de la figura se representa en forma
esquemática la cóclea "desenrollada"; la membrana basilar corresponde a la zona rayada
del dibujo.
Fig. 73. Relación entre la tasa de bandas críticas y otras escalas de medición.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
208
En esta figura resulta obvio que no existe una relación simple entre la frecuencia y
las demás escalas. Sin embargo, la relación entre la tasa de BCs y parámetros tales como
la posición en la membrana basilar (escala fisiológica), el número de incrementos de
frecuencia apenas perceptibles y el cociente de frecuencias subjetivas o "alturas del
sonido" (escalas Psicoacústicas) resulta prácticamente lineal.
Por todo lo expuesto, la tasa de BCs no sólo está asociada con una medida de la
selectividad en frecuencia, como lo son las bandas críticas, sino que además constituye
una escala más natural y conveniente que la escala de frecuencias para representar
gráficamente e interpretar fenómenos perceptuales
4.4.6 Diferencias entre señales tonales y no tonales
El tono es la característica del sonido que indica su altura. Los cambios de tono
vienen originados por diferencias de frecuencia de la onda sonora.
Aún cuando, según lo expuesto hasta ahora, pareciese que la "habilidad" de una
señal para enmascarar a un tono depende sólo de la intensidad contenida en la BC
centrada en el tono, diversos resultados experimentales [2] indican que tal "habilidad"
depende además de la tonalidad de la señal enmascarante.
En este contexto, el término "tonalidad" se utiliza para describir cualitativamente
la similitud del espectro de la señal con el de un tono puro: una señal es "tonal" cuando su
espectro es "impulsivo", mientras que es "no tonal" o "ruidosa" si su espectro se asemeja
al de una banda de ruido.
La siguiente figura ilustra la llamada asimetría de enmascaramiento entre tonos y
bandas de ruido. La curva corresponde al patrón de enmascaramiento producido por un
tono puro que enmascara a una banda crítica de ruido (caso T) y viceversa (caso R).
Ambas señales enmascarantes tienen una intensidad total de 72 dB SPL.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
209
Fig. 74. Patrones de enmascaramiento correspondientes a un tono y a una
banda crítica de ruido, centrados en 1000 Hz.
En esta figura se observa que la banda de ruido es más efectiva que el tono como
señal enmascarante: la diferencia entre los umbrales de enmascaramiento de un caso y de
otro es de unos 21 dB.
4.4.7 Efecto Haas
Este fenómeno perceptual llamado también Efecto Precedencia tiene una gran
importancia, tanto en Acústica Arquitectónica como en Electroacústica y consiste en la
fusión de los sonidos que lleguen en una ventana de tiempo de 50 ms donde la percepción
de la dirección del sonido es la indicada por el sonido inicial.
Una forma simple de demostrar el fenómeno es a partir de un equipo de sonido
estereofónico. (fig.36). Si las señales son iguales en ambos canales, el sonido sea
percibido como proveniente del centro del sistema.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
Fig. 75.
210
Disposición del equipo para evaluar el efecto Haas.
Si introducimos un retardo de 5ms al canal derecho (Fig. 75).
En este caso el
sonido será percibido saliendo del canal izquierdo, a pesar que las intensidades son
iguales.
Fig. 76. Retardo de 5 ms en el canal derecho.
Si atenuamos 10 dB el canal izquierdo (o le damos 10 dB de ganancia al canal
derecho) el sonido será percibido saliendo otra vez del centro del sistema.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
211
Fig. 77 Atenuación de 10 dB en el canal izquierdo.
Esa relación de retardo e intensidad puede verse en forma más completa en la
Fig. 78.
Fig. 78. Efecto Precedencia o "Efecto Haas".
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
212
44..55 M
MO
OD
DE
EL
LA
AD
DO
OD
DE
E PPR
RO
OC
CE
ESSO
OSS A
AC
CU
USST
TIIC
CO
OSS
Son múltiples las sensaciones que nos provocan los acordes musicales a nuestro
sistema sensorial, desde el más sublime placer hasta la más detestable sensación de
molestia. Por ejemplo, la sensación de colocarse a la orilla de un acantilado y gritar una
palabra con el objetivo de escucharla un momento después nuevamente.
Muchos de
estos efectos enriquecen nuestro gusto musical y despiertan nuevas sensaciones en
nuestro ser.
Por tal motivo la ingeniería de sonido ha buscado los medios artificiales de
reproducir estos efectos capaces de explotar a otro nivel los sistemas sensores del oído.
Esta implementación artificial de efectos por medio del procesamiento de la señal se ha
desarrollado de manera tal que existen a nuestra disposición los modelos de los sistemas
que emulan estos sonidos. En la presente sección haremos una breve descripción de los
efectos más populares en la actualidad en el tratamiento del sonido, y sus modelos
matemáticos para su desarrollo.
4.5.1 El procesado espacial y la reverberación
El sistema auditivo responde a diversas características tanto de la fuente sonora
como del medio de propagación. En general estos son los dos elementos a controlar para
la recreación de sonidos deseados. Al proceso que abarca el estudio de estos parámetros
se les conoce con el nombre de procesado espacial.
La reverberación es la suma total de las reflexiones del sonido que llegan al
lugar del oyente en diferentes momentos del tiempo.
Auditivamente se caracteriza por
una prolongación, a modo de "cola sonora", que se añade al sonido original. La duración
y la coloración tímbrica de esta cola dependen de: la distancia entre el oyente y la fuente
sonora; y la naturaleza de las superficies que reflejan el sonido.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
213
En situaciones naturales hablamos de sonido directo para referirnos al sonido que
se transmite directamente desde la fuente sonora hasta nosotros (o hasta el mecanismo de
captación que tengamos).
Por otra parte, el sonido reflejado es el que percibimos
después de que haya rebotado en las superficies que delimitan el recinto acústico, o en los
objetos que se encuentren en su trayectoria.
Evidentemente, la trayectoria del sonido
reflejado siempre será más larga que la del sonido directo, de manera que temporalmente
escuchamos primero el sonido seco, y unos instantes más tarde escucharemos las
primeras reflexiones (early reflections); a medida que transcurre el tiempo las reflexiones
que nos llegan son cada vez de menor intensidad, hasta que desaparecen.
Nuestra
sensación, no obstante, no es la de escuchar sonidos separados, ya que el cerebro los
integra en un único precepto, siempre que las reflexiones lleguen con una separación
menor de unos 50 milisegundos (efecto Hall).
Cuando manipulamos un reverberador artificial, los principales parámetros de
control son:
Ø Tiempo de decaimiento: se define como el tiempo que tarda el sonido
reverberado en disminuir 60 dB (a menudo se denomina TR60).
Las salas
grandes tienen tiempos largos (un segundo o más), mientras que las
habitaciones de una casa tienen tiempos muy cortos (menos de medio
segundo).
Ø Retardo de las primeras reflexiones: en salas grandes las primeras reflexiones
tardan en llegar más tiempo que en salas pequeñas, pudiendo sonar incluso
como una especie de eco.
Ø Intensidad de las primeras reflexiones: está determinada por la distancia del
oyente y de la fuente sonora respecto a las superficies reflectantes.
Si el
oyente o la fuente sonora están junto a ellas las primeras reflexiones sonarán
con mucha intensidad.
Manipulando los 3 parámetros anteriores podemos crear la sensación de tamaño
del recinto, y de posicionamiento de fuente y oyente dentro de él.
Adicionalmente
podemos crear diferentes sensaciones relacionadas con los materiales de las paredes,
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
214
suelo y techo con parámetros tales como: Tipo de reverberación (hall, plate, room),
densidad de las reflexiones, y absorción selectivo de ciertas frecuencias.
Existen diversos tipos de reverberadores artificiales dentro de los más populares
tenemos:
•
Reverberador plano: Este tipo de reverberador logra su efecto retroalimentando la
señal de salida luego de haberla retrasado D muestras.
Su diagrama de bloques y
ecuación de diferencias la podemos ver a continuación.
y(n) = ay(n – D) + x(n)
x(n)
ec. 4.22
y(n)
+
+
a
Z-D
Fig. 79 Diagrama de bloque de un reverberador plano
•
Reverberador pasabajos:
Este tipo de reverberador se obtiene modificando el
reverberador plano en su ruta de retroalimentación, al remplazar la ganancia a por
filtro pasabajos como podemos observar en el diagrama de bloques de abajo.
La
presencia de este filtro en la retroalimentación causa un efecto de expansión en el eco,
lo cual resulta una mejor respuesta y sintonización en la reverberación.
La función
de transferencia de este sistema y su diagrama de bloques lo podemos ver a
continuación.
H( z ) =
1
1 − z G( z )
−D
Capí tul o IV
ec. 4.23
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
x(n)
215
y(n)
+
+
Z-D
G(z)
Fig. 80. Diagrama de bloque de un reverberador pasabajo
•
Reverberador pasatodo:
Este tipo de reverberador se caracteriza por la siguiente
función de transferencia:
H( z ) =
− a + z −D
1 − az − D
ec. 4.24
Este tipo de sistema exhibe una respuesta en magnitud plana, pero su respuesta
transitoria decae exponencialmente con el tiempo.
exponencial del eco.
Lo cual causa un decaimiento
La construcción de este filtro se logra expandiendo en
fracciones parciales su función de transferencia. Dos posibles diagramas de bloques
utilizados para su construcción se muestran a continuación.
x(n)
-a
+
+
y(n)
+
+
Z-D
a
(a)
-1/a
+
x(n)
k
+
Fig. 81 Diagramas de
bloques de un reverberador
pasatodo:
a)de
forma
canónica y b) de forma
paralela
+
+
Z-D
k = (1-a 2 )/a
a
(b)
Capí tul o IV
y(n)
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
•
216
Reverberedor Schroeder’s: El reverberador Schoeder’s podríamos decir que es el
paraíso acústico, en cuanto a efectos de reverberación se refiere.
Este reverberador
es una combinación de diversos arreglos en paralelo de reverberadores planos y a su
vez estos arreglos en cascada con reverberadores del tipo pasatodo.
Este
reverberador logra que el efecto de reverberación en los ecos aumente, generando e
incrementando la respuesta al impulso causadas generalmente por las primeras
reflexiones (early reflection) y la ultimas reflexiones (late reflection). El siguiente
diagrama de bloques muestra la estructura de este reverberador.
xx1(n)
+
b1
+
Z -D1
a1
xx2(n)
+
b2
+
Z -D2
a2
x(n)
Σ
xx5(n)
x6(n)
(n)
b5
++
++
b6
++
Z -D5
xx3(n)
+
a5
y(n)
++
Z-D6
a6
b3
+
Z -D3
a3
x4(n)
(n)
+
b4
+
Z -D4
a4
Fig. 82 Diagrama de bloque de un reverberador Schroeder’s
Es importante remarcar que cuando uno empieza a utilizar reverberaciones suele
hacer un abuso de ellas. La mejor manera de evaluar su efectividad consiste en ajustar el
equilibrio entre sonido seco y sonido reverberado (dry/wet) según creamos apropiado, y a
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
217
continuación eliminar la reverberación; si "aparecen" detalles o instrumentos que en la
mezcla no se oían quiere decir que seguramente estábamos a punto de sobre-reverberar.
De esta forma los efectos de sonido se suelen clasificar en dos grupos según los
parámetros que influyen en su generación; así tememos las transformaciones tímbricas en
base a la estructura de los sonidos y transformaciones tímbricas en base a los retardos.
4.5.2 Transformaciones tímbricas basadas en la estructura de los sonidos. Filtrado.
El dispositivo más utilizado para transformar el timbre de un sonido es el
ecualizador.
Un ecualizador permite modificar la señal de entrada de manera tal que
determinados componentes de su estructura o espectro salen de él atenuados o
amplificados.
Un ecualizador permite, como máximo, manipular 3 parámetros:
Ø Frecuencia de actuación o central: para determinar sobre qué zona del espectro
queremos actuar.
Ø Anchura de banda o factor Q: para determinar la región en torno a la frecuencia
central (cuanto más estrecha más precisa será la modificación, pero seguramente
será menos evidente);
Ø Nivel de atenuación/amplificación: para determinar la magnitud en dB que
necesitamos realzar o atenuar la banda sobre la que actuamos.
Un ecualizador puede ser:
•
Paramétrico: si permite manipular los tres parámetros anteriores;
•
Semiparamétrico: si la Q está prefijada y sólo podemos alterar los otros dos
parámetros (habitual en muchas mesas de mezclas);
•
Gráfico: si consta de un número fijo de frecuencias (8, 15, 31) de actuación, con una
Q fija, de manera que tan sólo permite modificar el nivel de atenuación/amplificación
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
218
(con 31 bandas y una Q de tercio de octava puede ser el típico ecualizador utilizado
para ajustar tonalmente una sala).
Las transformaciones que podemos conseguir con un ecualizador no son
excesivamente drásticas, aunque nos pueden ayudar a atenuar determinadas frecuencias
molestas o exageradamente presentes, a realzar determinadas características tímbricas de
una fuente sonora, o, en última instancia, a compensar determinadas deficiencias
microfónicas o perceptuales.
La ecualización no se debe utilizar por rutina o sistema
sino en función de los objetivos sonoros o musicales (claridad, equilibrio tonal, énfasis en
determinados componentes, etc.).
La ecualización como parte de un equipo reproductor de sonido es fundamental
debido a que en los procesos de captación de sonido, tanto en tiempo real como para el
almacenaje, generalmente son atenuadas ciertas componentes en frecuencias del sonido
para mejorar la calidad de captación.
Por ejemplo en la grabación de discos se suele
atenuar las señales correspondientes a tonos bajos para evitar la creación de surcos
amplios que se puedan entremezclar con surcos contiguos y/o para evitar el ruido
circundante.
Generalmente dependiendo del equipo reproductor o captador de sonido se
estipula un nivel de ecualización estándar que debe cumplir el mismo para colocarse en el
mercado.
Esto debido que los diseñadores de equipos complementarios estipulan sus
entradas y salidas de sus sistemas según estos estándares.
La encargada de estos
estándares es la Record Industry Association of America (RIIA) y aquel equipo que no la
cumpla no debe de salir al mercado.
Un ecualizador es básicamente un filtro que solo deja pasar ciertas frecuencias de
interés que son realzadas o atenuadas con una ganancia variable a la salida del sistema,
como podemos observar en la siguiente figura.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
219
Filtro pasa bajas
k Variable
operando a f1
+
Filtro pasa banda
operando entre f2 y f3
Señal
de
entrada
k Variable
+
+
Señal
de
salida
Filtro
Filtro pasa
pasa alta
alta
operando
operando aa f4
k Variable
Fig. 83 Diagrama de bloque de un compensador simple de tres bandas
Como podemos observar la señal de entrada de nuestro sistema debe alimentar
diferentes subsistemas.
Estos subsistemas son diversos tipos de filtros, que para este
caso son tres: un pasa banda operando a una frecuencia f1; un pasa banda operando entre
f2 y f3; un pasa alto operando a f4.
Estos filtros extraen de la señal original aquellas
componentes que se desean tratar de la señal original. La ganancia k es la encargada de
suministrar al sistema la atenuación de los niveles requeridos; la misma es del tipo
variable lo que permite al operador colocarla en la mejor posición para la percepción del
sonido deseado.
Finalmente se suman las señales luego de ser tratadas para obtener la
señal de salida que será reproducida.
En una mezcla es importante tratar de plantear siempre en primer lugar una
ecualización destructiva (en la que se atenúan determinadas zonas para conseguir el
deseado equilibrio tonal) antes que una constructiva (en la que una amplificación
excesiva puede originar un aumento del ruido); en lugar de amplificar lo que queremos
resaltar podemos obtener el mismo efecto atenuando todo aquello que no nos interesa
resaltar. En cambio, en grabación, si es necesario ecualizar deberemos preferir antes una
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
220
ecualización constructiva (que siempre permita volver a atenuar en mezcla) antes que una
destructiva (si hemos atenuado algo, difícilmente vamos a conseguir que "reaparezca");
ahora bien, hay que conocer en qué zonas se mueve la energía de los instrumentos para
no cometer el error de enfatizar zonas vacías que lo único que hará será aumentarnos el
ruido de la grabación.
4.5.3 Transformaciones tímbricas basadas en retardos (delays).
Utilizando como base el concepto de retardar la señal original k muestras para
luego combinarla con la señal sin atrasó se pueden conseguir alteraciones tímbricas. Es
así como tenemos otro medio para la generación de efectos.
Las sensaciones producidas por el retardo (delay) impuesto a la señal varía en
relación con el tiempo de retardo impuesto a la señal; así tenemos que:
Ø Con un retardo muy corto (< 30 milisegundos) y una cierta realimentación
alteraremos claramente la tímbrica.
El sonido se hará metálico y adquirirá
resonancias muy definidas en determinadas frecuencias.
Incluso podemos simular
acordes a partir de esta opción.
Ø Con un retardo entre 20 y 80 milésimas afectamos principalmente a la presencia del
instrumento, ya que nos aprovechamos del efecto Hass para "sumar" perceptualmente
dos sonidos iguales (y físicamente separados en el tiempo), de manera que podemos
generar la sensación de sonido más "grueso", o de multiplicación de instrumentistas.
Ø Con retardos mayores de 80 o 100 milisegundos el efecto principal que obtenemos es
de tipo rítmico, por tanto (al menos en el caso de músicas con ritmos marcados) hay
que ajustar el tiempo de retardo al tiempo de la música, para lo cual existen tablas
muy útiles.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
221
Además del tiempo de retardo, es posible manipular parámetros como:
Ø Regeneración: la señal retardada vuelve a retardarse, con una regeneración al 100%
la señal no deja nunca de sonar.
Ø Múltiples líneas de retardo (multi-tap delay): es posible retardar de maneras
diferentes pero simultáneas una misma señal (por ejemplo, una línea atenúa
progresivamente la señal retardada, otra hace un número fijo de retardos, con una
dinámica creciente, y otra hace lo mismo pero con una dinámica y una distribución de
tiempos de retardo aleatorias.
Ø Panoramización: permite hacer sonar las repeticiones alternativamente en uno u otro
lado del espacio acústico, o ir desplazándolas progresivamente en una determinada
dirección.
Bajo este concepto se han desarrollada una diversa gama de efectos; dentro de los
de mayor popularidad tenemos:
•
Efecto de Eco
Cuando las reflexiones de un sonido llegan con retardos superiores a 50
milisegundos respecto de la fuente original aparece lo que denominamos eco.
En otros
tiempos el efecto de eco se conseguía gracias a los 2 cabezales (grabación y
reproducción) de un magnetofón.
Inyectando un sonido, grabándolo y reproduciéndolo
inmediatamente obtendremos un retardo cuyo tiempo estará determinado por la distancia
entre los cabezales y por la velocidad de la cinta (puede oscilar entre 66 y 266
milisegundos).
Actualmente los ecos se consiguen mediante retardos digitales (delays) que nos
permiten tiempos desde una milésima de segundo hasta 3 ó 4 segundos; a continuación
observamos el diagrama de bloques y la ecuación de diferencias que produce el efecto de
eco en un sistema digital.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
222
x(n)
y(n)
+
+
Z-D
a
Fig.84 diagrama de bloques de sistema digital que produce el eco
y(n) = x(n) + ax(n – D)
ec. 4.25
Donde x(n) es la señal de entrada e y(n) es la señal de salida. Como podemos
observar la señal original se retrasa D muestras de la señal original y luego es atenuada
por el factor de escalado a, para finalmente combinarla con la señal original con el fin de
obtener el efecto de eco deseado.
La atenuación de la señal antes del mezclado es
requerida para evitar la saturación en la señal de salida, de manera tal que se obtenga un
efecto nítido y con baja distorsión.
•
Flanger
Se trata de un filtrado periódico (en forma de peine) de una serie de frecuencias
determinada por el tiempo de retardo (por ejemplo, con uno de 0.5 milisegundos
realzaremos 2KHz y sus armónicos), aunque explicarlo con palabras es poco efectivo.
El origen del flanger es mecánico (hay quien se lo atribuye a George Martin y a
John Lennon): si al grabar una cinta en un magnetofón presionamos con el dedo de vez
en cuando y con fuerza variable la bobina que entrega cinta originamos micro-frenazos
que alteran la señal original. Si grabamos simultáneamente en 2 magnetofones, y en uno
aplicamos el "flanging" manual mientras que en el otro no, generaremos el barrido
característico del efecto de flanger.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
223
Para producir este efecto por medio de un procesador digital de señales (DSP) se
requiere básicamente la misma estructura que un generador de eco, pero en este caso el
elemento retardor de la señal (d(n)) debe ser variable en el tiempo.
A continuación
mostramos el diagrama de bloques básico para la construcción del flanger y su respectiva
ecuación de diferencias.
x(n)
y(n)
+
+
Z-d(n)
a
Fig. 85. Diagrama de bloques de sistema digital que produce el flanger
y(n) = x(n) - ax(n – d(n))
La señal de entrada y de salida son x(n) e y(n) respectivamente.
ec. 4.26
Es importante
acotar que el retrazo d(n) puede ser aleatorio o periódico. El flanger proporciona efectos
más llamativos cuanto más rico (armónicamente hablando) sea el sonido.
•
Chorus
Se utiliza para "engrosar" la señal, o para simular la existencia de varios
instrumentos sonando al unísono. En esta situación, un intérprete puede tocar con cierto
retraso y con cierta desafinación respecto a otro intérprete; eso es lo que trata de simular,
de manera compacta, este efecto. El siguiente diagrama de bloques muestra su modelaje
en formato digital.
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
224
Σ
x(n)
y(n)
delay d1(n) x(n - d11(n)) a1(n)
delay d2(n)
x(n - d2 (n))
a2(n)
Fig. 86 Diagrama de bloques de sistema digital que produce el Chorus
Se puede observar que para producir este efecto debemos colocar tanto las
ganancias como los retardos (delays) variables en el tiempo.
Generalmente estas
variaciones en el tiempo son funciones de n pero se restringen a un número finito sus
posibles valores.
Esto se realiza para con el fin de evitar excesivos de atrasos entre
señales, para el caso de los delays (d), o excesivas amplitudes en la señal de salida, en el
caso de los atenuadores (a).
•
Transpositor
Inicialmente las transposiciones mecánicas se basaban en alterar la velocidad de
reproducción de una cinta respecto de su velocidad en el momento de la grabación
(reproduciendo al doble obtenemos una transposición de octava hacia arriba), pero
también se alteraba la tímbrica ya que esta transformación no preserva las estructuras de
formantes propias de muchos instrumentos (por ejemplo la voz) y de ahí los conocidos
efectos de "pitufo" o de "fabulositos", en los que la voz así procesada poco tiene que ver
con la original.
Muchos transpositores digitales aún operan en base a esa idea de alterar la
velocidad de reproducción, aunque en los últimos años van apareciendo más equipos y
Capí tul o IV
Traba jo de Gra duac ió n
Franc isco J. Garc ía Casti ll o
225
programas capaces de transponer, incluso en tiempo real, sin alterar en exceso las
características del instrumento.
x(n)
Σ
Filtro BP
fc1< f < fc2
Π
Π
y(n)
Filtro
anti-alising
ω
ωm >> ω
ωd
cos ω
ωmn
cos ω
ωdnn
Proceso de modulación y demodulación
Fig. 87 Diagrama de bloques para el efecto de transposición
Un algoritmo fácil de implementar lo podemos observar en el diagrama de
bloques mostrado arriba. Este se basa en filtrar la señal de entrada para obtener la
componente que deseamos transponer, por ejemplo la señal de voz de 300Hz a 3kHz.
Luego se modula en frecuencia la señal filtrada (por ejemplo 10kHz), de forma que
aumentemos la señal en frecuencia.
Luego demodulamos la señal con una frecuencia
menor a la utilizada para su modulación (para este ejemplo digamos que 9kHz), de forma
que la señal filtrada final haya sido aumentando su timbre. Finalmente mezclamos esta
señal con la señal de entrada para obtener el efecto deseado. Cabe destacar que la señal
filtrada final debe pasar antes de sumarse a la señal original por un filtro anti-aliasing de
manera de evitar el doblamiento de la señal.
Observaremos en el próximo capítulo una forma de llevar a cabo uno de estos
procesos estudiados; usando como base los aspectos teóricos discutidos con relación a los
sistemas acústicos. También se emplearán como parámetros de diseño algunos de las
características del sonido ya estudiadas al principio de este capítulo.
Capí tul o IV
Descargar