6. EFECTOS DE SONIDOS COMUNES 105 6. Efectos de sonido comunes En la mayoría de los pianos electrónicos comerciales de gama media y alta, incluso en los instrumentos más elaborados orientados a una interpretación musical seria podemos encontrar funciones que implementan efectos de sonido que se añaden al sonido del instrumento. Estos efectos pueden ser de origen natural, como la reverberación existente en cualquier sala de conciertos o bien más artificiosos como los efectos típicos denominados chorus o flanging por citar algunos. En lo que respecta a la materia de este estudio, estos efectos suelen implementarse en el mismo proceso de síntesis o bien en módulos independientes que utilizan las mismas técnicas estudiadas en el capítulo 4 y es por ello que se incluyen en este trabajo. Cuando se implementan en el mismo módulo generador de sonido, los efectos se consiguen ajustando o modificando alguno de los parámetros de síntesis, o bien, introduciendo un elemento perturbador, que convenientemente ajustado, logre el efecto deseado. Cuando se implementan como módulos independientes, como es el caso para los pianos de gama media y alta, suelen utilizarse sobre todo modelos físicos, ya que el análisis espectral necesario para sintetizarlos con modelos de señal suele ser complicado, mientras que los mecanismos físicos que intervienen en su gestación suelen ser de naturaleza sencilla y por tanto fácilmente implementable. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 106 6.1. Reverberación Aunque a priori un efecto de sonido pueda parecer un añadido prescindible en el desarrollo de un instrumento electrónico, la reverberación pertenece a la categoría de lo estrictamente necesario para una interpretación musical de calidad. La reverberación es un parámetro muy importante en la ejecución musical. Basta como ejemplo advertir que las compañías discográficas y los intérpretes recorren grandes distancias con el fin de encontrar el patrón de reverberación más adecuado para la pieza a interpretar y que suele variar enormemente de una sala de conciertos o auditorio a otro. De hecho, uno de los grandes (y complejos) problemas a la hora de construir un espacio adecuado para la interpretación musical es el problema de la acústica de reverberación. Además, con la intervención de técnicas de amplificación electrónicas (micrófonos, altavoces) la problemática, en lugar de resolverse, se complica enormemente. Es por ello que el efecto de reverberación no es un capricho gratuito, sino que está muy ligado a la interpretación musical. Todo pianista conoce de sobra el sonido tan seco que puede llegar a producir un piano en una sala con condiciones de reverberación que no sean adecuadas. A veces, este problema puede solucionarse haciendo uso del pedal de resonancia, pero otras, este uso esta vedado por la naturaleza histórica de la pieza, o bien provoca un emborronamiento armónico excesivo impide su utilización. Todos estos problemas se solucionan añadiendo la reverberación adecuada y absolutamente necesaria para una ejecución musical de calidad. Consideremos en primer lugar los requerimientos para simular la acústica de un auditorio. En principio, necesitamos solamente la respuesta en uno o más puntos discretos del espacio, debida a una o más fuentes de energía acústica. La propagación directa de señal desde la fuente del sonido al sistema auditivo del oyente puede ser simulada usando una simple línea de retraso en serie con un atenuador o un filtro paso de bajo como se muestra en la siguiente figura: Figura 6.1. Simulación de la propagación del sonido con pérdidas independientes de la frecuencia. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 107 Si el sonido se atenúa conforme se propaga, con el mismo factor de atenuación para cada frecuencia, la atenuación puede simularse con un simple escalado de la salida. Este es otro ejemplo de la acumulación de pérdidas distribuidas en puntos discretos, lo que significa que no es necesaria implementar una pequeña atenuación para cada trayecto de propagación sino que puede considerarse la atenuación del camino completo. Para un modelo acústico más preciso, es necesario tener en cuenta atenuación dependiente de la frecuencia, reemplazando el factor constante g, por un filtro digital G(z) como se muestra en la siguiente figura: Figura 6.2. Simulación de la propagación del sonido con pérdidas dependientes de la frecuencia. En principio, un filtro LTI puede proporcionar un factor de atenuación para cada frecuencia. Dicho filtro deberá satisfacer una condición obvia: G (e jωT ) ≤ 1 . En las figuras anteriores, la señal de entrada x(n) puede asociarse con una fuente de señal y la salida y (n) con el punto de escucha. Si dicho punto de escucha se encuentra a una distancia d con respecto a la fuente, entonces la longitud de la línea de retraso M debe ser de: M= d cT Donde T representa el intervalo de muestreo. cT es la distancia que el sonido se propaga en un intervalo de muestreo. Al dividir d entre cT obtenemos cuántas muestras son necesarias para cubrir la distancia d. En la práctica M se redondea al entero más cercano, lo cual no causa diferencias audibles, a menos que el tiempo de eco sea demasiado corto. En este caso, el sistema no percibiría el efecto realmente como un eco. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 108 En cuanto a la atenuación g, la teoría acústica nos dice que un punto sonoro produce una onda esférica en un medio isotrópico como el aire. Por tanto, el sonido de cualquier superficie radiante puede calcularse como la suma de contribuciones de onda esférica desde cada punto en la superficie. (principio de Huygens). En una primera aproximación, la energía de la onda se conserva en su propagación a través del aire. En una onda esférica de presión de radio r, la energía del frente de onda se distribuye a lo largo de la superficie esférica 4πr 2 . Por tanto, la energía por unidad de área de una onda esférica decrece con radio 1 r 2 . Dado que la energía es proporcional al cuadrado de la amplitud, una ley de inversa con el cuadrado para la energía se traduce en una ley 1 r para la amplitud. Por tanto el factor de atenuación g debe variar con la inversa de la distancia. Sin embargo, la atenuación del sonido por la distribución esférica no es la única fuente de pérdidas. En un modelo más realista deben tenerse en cuenta las pérdidas por absorción. En medios como el aire, la absorción varía con la frecuencia, donde las altas frecuencias suelen sufrir más atenuación que las bajas. Asimismo, la propagación en cuerdas vibrantes presenta una pérdida por absorción análoga. Denotando g(r,w) el factor de pérdidas asociado a una distancia r a una frecuencia w, bajo condiciones uniformes, la cantidad de atenuación es proporcional a la distancia recorrida, lo que significa que los factores de atenuación para dos segmentos de propagación consecutivos son multiplicativos: g (r1 + r2 , w) = g (r1 , w) g (r2 , w) (6.1) Esta propiedad implica que la atenuación g es una función exponencial de la distancia r. Además de la atenuación dependiente de la frecuencia, los filtros LTI pueden proporcionar un retraso dependiente de la frecuencia. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 109 Reflexión y Reverberación Cuando una onda esférica alcanza una pared o cualquier otro obstáculo, puede sufrir reflexión o difracción. La reflexión tiene lugar cuando el frente de ondas es localmente plano y por tanto la onda puede considerarse como un rayo al que se le aplican las leyes de la reflexión especular. La difracción tiene lugar cuando el frente de onda encuentra una superficie con variaciones en la escala de la longitud de onda. La difracción también se denomina reflexión difusa. Cada punto del objeto puede verse como un nuevo emisor de ondas esféricas, sin embargo, al contrario de lo que sucede en la reflexión especular, los hemisferios emitidos por cada punto de la superficie no se combinan en un frente de onda organizado La distinción entre reflexión difusa y especular es dependiente de la frecuencia. Dado que el sonido viaja a una velocidad de unos 0.3 metros por milisegundo, un cubo de 0.3 metros cúbicos causará reflexión especular a sonidos por encima de 1KHz y difusa por debajo de 1 KHz. Una buena sala de conciertos debe exhibir mayor reflexión difusa que especular. En general, la reverberación debe ser difusa para evitar la formación de ondas estacionarias, ya que deseamos extender la energía sonora uniformemente en tiempo y espacio, sin que primen patrones temporales o espaciales específicos, como ocurriría en caso de reflexión especular. Supongamos ahora el caso más simple de eco acústico con dos caminos de propagación. Figura 6.3. Geometría de eco acústico causado por propagación multitrayecto. En la figura se muestra un sistema multitrayecto simple, donde S representa la fuente acústica y L el oyente. Ambos están a la misma altura h de una superficie reflectora. El camino directo tiene una distancia d mientras que la longitud de la reflexión es 2r. Estas cantidades se encuentran relacionadas por la ecuación SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES ⎛d ⎞ r = h +⎜ ⎟ ⎝2⎠ 2 110 2 2 (6.2) Este eco multitrayecto puede simularse de la siguiente forma: Figura 6.4. Simulación digital del eco multitrayecto. En la figura anterior no es necesario incluir ningún elemento común que afecte igualmente a la señal directa y al eco, ya sea en retraso o atenuación, ya que es la amplitud y desfase relativos de la señal directa con respecto al eco lo que afecta al timbre. Teniendo en cuenta la geometría de la figura, los parámetros pueden calcularse como: M= 2r − d cT g= 1 2r d = 1 d 2r (6.3) Podemos eliminar r haciendo uso de la ecuación (6.2) en su forma de sustitución r = h 2 + (d 2)2 dejando solo dos variables independientes la altura h de la fuente sobre la superficie reflectora y la distancia d entre la fuente sonora y el oyente. De una forma más general, una línea de retraso con múltiples tomas puede simular reflexiones múltiples. Cada salida extrae el equivalente a una reflexión y puede ser convenientemente filtrada para incluir la atenuación por absorción y cualquier otro tipo de pérdidas. Figura. 6.5. Línea de retraso con múltiples tomas. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 111 En principio este tipo de líneas de retardo pueden simular eficientemente cualquier sistema reverberante, porque la reverberación realmente consiste únicamente en la existencia de múltiples trayectos de propagación acústica desde cada fuente. Sin embargo, la implementación de estas líneas de retardo se vuelve computacionalmente muy costosa a la hora de tener en cuenta todos los caminos posibles de propagación y aún más cuando entran en juego fuentes u oyentes móviles Modelo perceptual de reverberación En la figura se muestra el escenario general de reverberación para tres fuentes de sonido y un oyente (dos oídos). Figura 6.6. Escenario general de reverberación para tres fuentes y un oyente. En general los filtros podrían incluir el filtrado realizado por el pabellón auditivo, de forma que cada eco pueda percibirse con el ángulo correcto de llegada en el espacio 3D, es decir, algunas reflexiones deberían poder percibirse con sus direcciones naturales de propagación en el espacio tridimensional. Las dos señales de salida de la figura pueden calcularse mediante seis convoluciones: 3 y i (n) = ∑ s j ∗ hij (n) (6.4) j =1 SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 112 En música, un tiempo de reverberación típico es del orden de un segundo. Para una tasa de muestreo de 60 KHz, cada filtro requeriría unas 50000 multiplicaciones y sumas por muestra lo que significa 2.5 billones de operaciones por segundo. Para tres fuentes y dos puntos de escucha, se alcanza la escalofriante suma de 30 billones de operaciones por segundo. Esta cifra nos indica que la implementación exacta de funciones de transferencia punto a punto en un espacio de reverberación es computacionalmente muy compleja. Además debemos tener en cuenta de que los filtros deben cambiar cuando alguno de las entidades se mueva. Todo esto nos lleva a buscar un modelo computacional para el espacio acústico completo, en lugar de modelos puntuales, en el que fuentes y oyentes puedan moverse libremente sin afectar a la simulación acústica. Esto lleva a la cuestión de cuales son los aspectos perceptualmente importantes de la reverberación y como pueden simularse con estructuras computacionales eficientes. Se puede demostrar que para auditorios típicos, la densidad de eco aumenta conforme al cuadrado del tiempo. Por tanto, tras una pequeña respuesta transitoria inicial, la densidad de eco es tan grande que puede modelarse mediante un proceso estocástico uniforme sin pérdida de fidelidad perceptual. De forma similar, puede demostrarse, que el número de modo resonantes en cualquier banda frecuencial aumenta también con el cuadrado de la frecuencia de modo que a partir de ciertas frecuencias, la distribución de los modos es tan densa que es perceptualmente equivalente a una distribución estocástica de frecuencia con los parámetros adecuados En definitiva, basándonos en los límites de la percepción humana, la respuesta impulsiva de un espacio reverberante puede dividirse en dos segmentos. El primer segmento, transitorio, denominado reflexiones tempranas consiste en los primeros ecos dispersos en la respuesta impulsiva que no forman un patrón homogéneo. En el segundo, denominado reflexiones tardías, la densidad de los ecos es tal, que se impone una caracterización estadística. De la misma forma, la respuesta frecuencial de un sistema de reverberación puede dividirse en 2 segmentos. El intervalo de baja frecuencia consiste en una distribución de dispersa de modos resonantes, mientras que a altas frecuencias los modos presentan una distribución tan densa que pueden caracterizarse mediante una distribución estadística. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 113 Un posible diagrama de un reverberador en cuanto a estas dos divisiones se muestra en la siguiente figura Figura 6.7. División de un reverberador en secciones transitoria y permanente La sección transitoria de la respuesta impulsiva de un entorno reverberante, también denominada reflexiones tempranas, suele tomarse como los primeros 100 ms de la reverberación. Con mayor precisión, es el tiempo hasta que la reverberación alcanza su comportamiento estadístico asintótico. Dado que las reflexiones tempranas son relativamente dispersas y consumen un tiempo pequeño pueden implementarse usando líneas de retraso sin perjuicio del coste computacional. Si existe suficiente potencia computacional, es preferible darle carácter espacial y directivo a las reflexiones tempranas, pues es sabido que las primeras reflexiones tienen una fuerte influencia en la impresión espacial, es decir, la percepción del oyente de los ángulos o direcciones desde donde se reciben los sonidos. En la sección permanente, se modela la reverberación desde un punto de vista perceptual, buscando un decaimiento y respuesta frecuencial suaves pero no demasiado regular. Implementar un decaimiento exponencial no presenta problemas, pues los sistemas lineales estables exhiben dicho comportamiento de forma natural. El problema radica en encontrar una respuesta suave aunque no demasiado regular para que el efecto no resulte muy artificial, pues en caso de estar los modos regularmente espaciados pueden generarse periodicidades audibles en la respuesta impulsiva en el dominio temporal. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 114 Una señal que satisface las características anteriormente mencionadas puede ser un ruido coloreado con decaimiento exponencial, y con un factor de decaimiento de energía mayor a altas frecuencias que a bajas. Un valor típico de densidad en la respuesta de reverberación tardía puede ser de 1000 ecos por segundo, aunque para sonidos muy impulsivos se necesitan casi 10000 ecos para lograr una respuesta suave. Algunos parámetros de control deseables en un módulo de reverberación incluyen: t 60 ( f ) que es el tiempo de reverberación a cada frecuencia f y se define como el tiempo que tarda en decaer la amplitud en 60 dB. G 2 ( f ) o ganancia de potencia de señal a cada frecuencia C ( f ) o claridad que se define como el cociente de energía entre las reflexiones tempranas y tardías. ρ ( f ) o coeficiente inter-aural entre oídos izquierdo y derecho. Otras implementaciones Una implementación con filtros pasa todo se debe a M. R. Schroeder, quien en su trabajo Colorless Artificial Reverberation, sugiere el uso de filtros pasa todo para implementar algoritmos de reverberación. Estos elementos continúan siendo la base de dispositivos comerciales de reverberación. La idea del uso de filtro pasa-todo es especialmente brillante ya que no hay nada en la naturaleza del fenómeno de reverberación que sugiera su uso. Un diagrama básico de un modelo de reverberación puede verse en la siguiente figura: Figura 6.8. Cascada de tres secciones pasa-todo. Cada filtro pasa todo puede interpretarse como un elemento que expande cada muestra de entrada no nula en una repuesta impulsiva infinita. Aunque no es un modelo físico de reflexión difusa, las reflexiones simples son extendidas en un conjunto de reflexiones, que es cualitativamente lo que deseamos. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 115 Una implementación con FDN o redes de retardo realimentadas se debe a M. A.. Gerzon. Un diagrama típico de una red de retardo realimentada se muestra en la figura Figura 6.9. Red de retraso realimentada. La FDN puede verse como un filtro peine realimentado, obtenido reemplazando la línea de retardo con una matriz diagonal y reemplazando la ganancia de realimentación por el producto de una matriz diagonal con una ortogonal El diagrama anterior puede describirse analíticamente como: (6.5) El diseño de la matriz de realimentación Q se hace partiendo de un prototipo sin pérdidas, es decir, con un tiempo de reverberación infinito y trabajando hasta conseguir un generador de ruido con decaimiento exponencial. El diseño de los retardo M i del FDN se realiza en base a asegurar un densidad de modos los suficientemente alta en todas las bandas de frecuencias. Una densidad de modos insuficientes puede dar lugar a la aparición de tonos espúreos. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 116 Una regla empírica para fijar dichos retrasos es utilizar el camino medio libre o mean free path. Dicho parámetro se define como la distancia media que un rayo de sonido viaja antes de encontrar un obstáculo y reflejarse. Un valor aproximado del parámetro para un auditorio convencional puede estimarse como: d =4 V S (6.6) Donde V es el volumen de la habitación y S la superficie total encerrada. Esta aproximación requiere la hipótesis de campo difuso, es decir, que las ondas planas viajan aleatoriamente en cualquier dirección y por tanto solo es válida para reverberaciones tardías. El valor de los retrasos puede hallarse utilizando este valor según: d 1 = cT N N ∑M i =1 (6.7) i Donde c denota la velocidad del sonido y T el período de muestreo. El valor obtenido debe tomarse como cota inferior para los retrasos, pues en salas reales las reflexiones son a menudo difusas especialmente a altas frecuencias. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 117 6.2. Otros efectos Vibrato El término vibrato hace pequeñas variaciones cuasi-periódicas en el pitch o frecuencia fundamental de un tono. Este efecto es musicalmente muy importante en los instrumentos de cuerda frotada y en la voz humana. En los instrumentos de cuerda frotada, el vibrato se produce haciendo vibrar el dedo que sostiene el tono en el diapasón y en la voz humana se consigue modulando la tensión de las cuerdas vocales. El vibrato suele ir acompañado del trémolo que consiste en una modulación en amplitud a la misma frecuencia que el vibrato que lo causa. Para aplicar vibrato a un sonido, es necesario aplicar un salto de frecuencia cuasi-periódico. Esto puede implementarse usando una línea de retraso variable que introduce un efecto Doppler que puede interpretarse musicalmente como un vibrato, es decir una pequeña modulación en frecuencia. Si llamamos x(t) a la entrada a una línea de retraso variable, la salida puede escribirse como: y (t ) = x(t − Dt ) (6.8) Donde Dt representa el retraso variable en tiempo. En implementaciones discretas cuando Dt no es un múltiplo entero del intervalo de muestreo, x(t − Dt ) puede aproximarse siguiendo algún método de interpolación. Analicemos ahora el salto en frecuencia causado por un retraso variable en tiempo para una sinusoide compleja de frecuencia ω s , x (t ) = e jst La salida es ahora y (t ) = x(t − Dt ) = e jω s ( t − Dt ) (6.9) La frecuencia instantánea de esta señal es ω l = ω s (1 − d Dt ) dt (6.10) SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 118 Por tanto, la tasa de crecimiento del retraso proporciona el salto relativo en frecuencia: ω − ωl d Dt = s dt ωs (6.11) Comparamos ahora esta ecuación con la ecuación del efecto Doppler para un sistema de fuente-receptor v ls c ωl = ω s v sl 1− c 1+ (6.12) Donde ω s es la frecuencia emitida por la fuente en reposo, ωl es la frecuencia percibida por el oyente, vls representa la velocidad del oyente relativa al medio en dirección a la fuente y v sl simboliza la velocidad de la fuente relativa al medio en dirección al oyente. Como resultado de la comparación, encontramos que el retraso variable simula naturalmente un efecto Doppler causado por un oyente móvil con velocidad v ls = − 1 d Dt c dt (6.13) Es decir, que la velocidad de variación del retraso, provoca un efecto análogo a un movimiento relativo entre fuente sonora y oyente, lo que a su vez provoca el efecto vibrato buscado Chorus El efecto chorus o choralizer consiste en un procesamiento de señal que consigue a partir de una sola fuente sonora, muchas fuentes sonoras sonando al unísono. Este efecto es muy interesante a la hora de sintetizar el sonido de una sección de cuerdas a partir de la muestra de un único instrumento de la sección. Dado que la ejecución al unísono nunca es exacta (si lo fuera solo tendríamos un aumento del amplitud de la fuente sonora inicial, pero no cambiaría su cualidad tímbrica), el efecto chorus se simula sumando copias con modificaciones independientes entre sí. Dichas SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS 6. EFECTOS DE SONIDOS COMUNES 119 modificaciones pueden incluir retrasos, saltos en frecuencia y/o modulación en amplitud. El efecto chorus suele implementarse usando líneas de retraso variable con múltiples tomas de señal. Dichas salidas pueden oscilar respecto a su posición consiguiendo introducir una cierta aleatoriedad que da la cualidad natural necesaria a una sección de instrumentos tocando al unísono. SÍNTESIS DIGITAL DE INSTRUMENTOS MUSICALES SÍNTESIS DIGITAL DE PIANOS ELECTRÓNICOS