TP2 - Antezana - Giacometti - Martin

Universidad de San Andrés Análisis matemático III - Tutorial Miércoles Caracterización de señales de entrada y analisis de respuestas al impulso de sistemas Martin, Tiziano1 Giacometti, Mateo2 Antezana, Matı́as3 1 2 3 Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina. [email protected] Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina. [email protected] Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina. [email protected] (Dated: 14 de noviembre de 2023) Resumen En el presente trabajo se analizará los impulsos tanto de la fuente como la respuesta al impulso de 4 tipos de señales: los aplausos, la explosión de globos, el choque de maderas y un barrido frecuencial. Para llevar a cabo este estudio, se observará sus respectivas respuestas en frecuencia y sus amplitudes. Seguido a esto, se estudiará el efecto de los objetos ( especı́ficamente de las mochilas) presentes en el lugar en el cual se extrajo las mediciones (en este caso un aula) a la vez que se lo comparará con los resultados obtenidos por otros 13 recintos, utilizando una métrica previamente definida para su análisis (en este caso, el error cuadrático medio aplicado a la respuesta en frecuencia de los recintos a comparar en los intervalos de baja, media y alta frecuencia en el rango de audición humano) . Mediante resultados se comprueba como las respuestas en frecuencia de las señales provenientes tanto de las fuentes como de la respuesta al impulso son parecidas, a la vez que se determinó el poco efecto de los objetos presenten en el recinto medido en los resultados obtenidos. Se demostró que un sonido de aplauso, de un globo explotando y de un golpe de maderas concentran un pico de energı́a antes de los 1000 hertz, luego decae linealmente hasta 20000 hertz, donde luego cae sustancialmente. La repetición de aplausos tuvo más incerteza, seguido de los golpes de maderas y por último los globos. Por otras parte, se logro determinar que los recintos mas parecidos al aula analizada son una iglesia y el menos parecido un bosque en diferentes condiciones climatológicas. Abstract In this study, the impulses of four types of signals—applauses, balloon bursts, wood impacts, and a frequency sweep—were analyzed, considering both the source impulses and the impulse responses. The respective frequency responses and amplitudes of these signals were observed. Subsequently, the effect of objects (specifically, backpacks) present in the measurement environment (in this case, a classroom) was studied and compared with results from 13 other environments. A predefined metric for analysis, in this case, the mean squared error applied to the frequency response of the environments at low, mid, and high frequency intervals within the human audible range, was used for comparison. The results confirm the similarity of frequency responses between signals originating from both sources and impulse responses. Additionally, it was determined that the presence of objects in the measured environment had little effect on the obtained results. It was demonstrated that the sound of applause, a bursting balloon, and a wood impact concentrate peak energy before 1000 hertz, followed by a linear decay up to 20000 hertz, where it subsequently decreases substantially. The repetition of applause showed greater uncertainty, followed by wood impacts, and finally, balloons. On the other hand, it was determined that environments most similar to the analyzed classroom are a church, while the least similar is a forest under different climatic conditions. I. Introducción A la hora de estudiar diversas fuentes sonoras resulta fundamental considerar y entender la influencia que tiene el medio fı́sico donde se efectúa el sonido. Cada entorno particular modifica de manera diferente un audio y esas transformaciones pueden expresarse matemáticamente a partir del análisis de señales. La función que vincula las señales de entrada y salida se conoce como respuesta al impulso. Con el objetivo de llevar a la práctica esta idea en un entorno relacionado a la academia, en el presente informe se estudiará las modificaciones que un salón de clase le impone a ciertas señales especı́ficas que poseen propiedades similares a las de la voz humana. Se utilizarán métodos de obtención de respuestas al impulso inspirados en los contenidos vistos en la materia de Análisis matemático III. En primer lugar, se analizarán señales que no estén afectadas (o lo mı́nimo posible) por el medio donde fueron grabadas. Luego, una vez obtenidos estos datos, se 2 examinarán las diferencias entre las señales ’puras’ y las modificadas por el aula con el objetivo de cuantificar esos cambios y estudiar cómo la presencia de objetos en un espacio puede condicionar la propagación del sonido. Finalmente, se realizará una comparación entre la respuesta al impulso del aula con otras respuestas al impulso provistas por la cátedra. El objetivo de esta parte es poder establecer una métrica objetiva de comparación y sobre esta base establecer grados de similitud entre el salón de clase y el resto de recintos analizados. Por otra parte, resulta necesario mencionar que, además de esta sección de introducción de ideas, el presente informe cuenta con una sección de marco teórico, donde se desarrollarán los conceptos y contenidos clave para entender las nociones prácticas y teóricas de los experimentos y los resultados de ellos. Posteriormente procede un apartado de desarrollo experimental, donde se detallarán los pasos que fueron seguidos a la hora de realizar los experimentos, los diferentes instrumentos utilizados y las consideraciones que se tuvieron en cuenta, de modo que quien lo desee pueda replicarlos. Luego, se desarrollará una sección de resultados y análisis, donde se expondrán justamente los resultados obtenidos y se intentará a cada uno de ellos acompañarlos de una intuición fı́sica y conceptual de que se hayan producido. Por último, el informe concluye con un apartado de consideraciones finales, donde se expondrán los resultados obtenidos de mayor relevancia y las ideas propuestas para futuras investigaciones. II. A. Marco teórico Trasformada de Fourier La Transformada de Fourier para señales continuas es una herramienta esencial en el análisis de señales en el dominio de frecuencias. Esta transformada se aplica a señales continuas en el tiempo, ya sean periódicas o no periódicas. La ecuación de sı́ntesis de esta transformada se define como: Z ∞ 1 x(t) = X(jω)ejωt dω (1) 2π −∞ Mientras que la ecuación de análisis se define como: Z ∞ X(jω) = x(t)e−jωt dt (2) −∞ con una referencia especı́fica. En el contexto del sonido y la acústica, los decibeles se utilizan comúnmente para expresar niveles de presión sonora, intensidad acústica y otras magnitudes relacionadas. La fórmula general para ganancia o pérdida en decibeles se define como P dB = 10log10 (3) P0 donde dB es la abreviación de la medida de decibeles, P es la cantidad medida (presión sonora, potencia, etc.) y P0 es la referencia o nivel de referencia. B. Sistemas LTI La importancia de conocer la estructura de una respuesta al impulso radica en que estas respuestas caracterizan completamente a sistemas que son lineales (es decir, cumplen la condición de linealidad) e invariantes en el tiempo. Los llamamos invariantes en el tiempo dado que un desplazamiento temporal en la señal de entrada implica el mismo desplazamiento temporal en la señal de salida, lo que significa que el comportamiento de un sistema LTI no depende del momento en el que se inyecta la señal a la entrada. Luego, se dice que un sistema LTI queda completamente caracterizado por su respuesta al impulso porque cualquier señal de entrada se puede pensar como una combinación lineal de impulsos desplazados. Si se conoce cómo un sistema determinado modifica a un impulso, para ver cómo altera una señal arbitraria solo se debe pensarla como una sucesión de impulsos e ir aplicando la transformación uno a uno, para luego sumar los resultados. C. Convolución de dos funciones Dadas dos funciones (en nuestro caso, señales en dominio de tiempo) interesará definir el proceso de convolución como aquel procedimiento matemático en el que se combinan ambas funciones con el fin de producir una tercera función (tercera señal) que expresa cómo una ecuación modifica a la otra. La fórmula de este proceso es la siguiente: (x ∗ h)[n] = M −1 X x[k] · h[n − k] = y[n] (4) k=0 Especı́ficamente, en el presente informe se tomarán señales expresadas en el dominio del tiempo (x(t)) y se las analizará la mayor parte del tiempo en el dominio de la frecuencia. Por último, otro concepto que resultará util tener en cuenta a la hora de hacer el análisis de los resultados obtenidos es el de la unidad de decibeles. Se define decibeles como una unidad logarı́tmica que se utiliza para medir la magnitud de una cantidad en relación en donde x e y son las señales correspondientes mientras que y[n] es la función resultante. Observando la fórmula (4) se puede ver como las operaciones (la multiplicación) se realiza punto por punto (posición por posición) a la vez que se produce un desplazamiento de la función h. 3 D. Error Cuadrático Medio El Error Cuadrático Medio o Mean Squared Error (MSE) es una métrica utilizada para evaluar la precisión de un modelo de predicción en comparación con los valores reales. Esta métrica cuantifica la magnitud promedio de los errores al cuadrado entre las predicciones del modelo y los valores reales en un conjunto de datos. n M SE = 1X (yi − ŷi )2 n i=1 (5) Figura 2: Interfaz de audio Scarlett 2i4 de Focusrite Donde n es el número total de observaciones, yi es el valor real de la observación i y donde ŷi es el valor predicho para la observación. Cuanto menor sea el MSE, mejor se ajusta el modelo a los datos. En particular, se utilizará como métrica de medición para comparar la respuesta al impulso del aula con la de otros recintos. III. Desarrollo experimental A. Instrumentos utilizados Para la realización de los diferentes experimentos se utilizaron los siguientes dispositivos. En primer lugar, un micrófono ultralineal de condensador para medición condensador (capaz de convertir la señal el sonido en una señal eléctrica) ECM8000 de la marca Behringer. El mismo cuenta con sensibilidad de 70 dB, con una impedancia (resistencia a la interferencia) de 200 Ohms, con una respuesta de frecuencia entre 20Hz a 20000 Hz, un peso de 136 g y patrón polar omnidireccional. En lo que respecta a sus dimensiones, el micrófono cuenta con 191 mm de largo y 21 mm de ancho. Figura 3: Interfaz de audio Scarlett 2i4 de Focusrite junto con la computadora utilizada para seguir las mediciones En tercer lugar, como consola de señales se hizo uso de Power620plus de la marca Phonic. Entre sus especificaciones mas destacadas se encuentran que el mismo posee un amplificador de potencia estéreo de 2 x 100W / 4 ohms para Main L/R o Main/Monitor (Bridge mono, 200W a 8 ohms), Procesador multi-efectos estéreo digital a 32 bits con 16 programas más control de parámetro y jack para interruptor de pedal, EQ gráfico estéreo de 7 bandas, 6 Entradas de Micrófono balanceadas con jacks XLR, 8 Entradas de Lı́nea por jacks 1/4”, 2 Entradas de Súper Alta Impedancia (Hi-Z) optimizada para entrada directa de instrumentos, 2 Limitadores integrados, entre otros. En cuanto a sus dimensiones, el mismo cuenta con 440 mm de ancho, 265 mm largo, 275 mm de profundidad y 12990 gr de peso. Figura 1: Micrófono ultralineal ECM8000 de Behringer En segundo lugar, como interfaz de audio se utilizó una Scarlett 2i4 de segunda generación 2-in/4-out USB de la marca Focusrite. Entre sus especificaciones mas destacadas se encuentran una sensibilidad de 69 dB, un rango dinámico (diferencia entre el nivel de señal más alto y más bajo que puede manejar) de 120 dB, tasa de muestreo de 192 kHz y resolución de audio de 24 bits. En cuanto a sus dimensiones, el mismo cuenta con una altura de 47.5 mm, un ancho de 175mm y un peso de 1000 gr. Figura 4: Consola de señales Power620plus de Phonic Finalmente, como fuente de los sonidos de las pruebas se valió de un parlante JH153TW de la marca Dancis. El mismo es un parlante del tipo Woofer, Driver y Tweeter, de filtro pasivo, potencia de salida (RMS) de 150 W y nivel de impedancia de 8 Ohms. En lo referido a sus dimensiones, el dispositivo mide 440 mm de ancho, 720 mm de largo y 300 mm de profundidad. 4 Por último, resulta relevante mencionar que, para verificar la correcta estructura de los impulsos luego de ser grabados, también se utilizó la aplicación informática Audacity. B. Experimentos realizados ’ Figura 5: Parlante JH153TW de Dancis Resulta relevante mencionar que para hacer las mediciones se ajustaron los niveles de ganancia tanto de la placa de audio como de la consola de señales para, a grandes rasgos, separar el ruido de fondo en las mediciones sin llegar al extremo de saturar los aparatos. La placa de audio se ajustó para aumentar la amplitud de la señal que percibió el micrófono; en otras palabras, para que, a pesar de la distancia, el sonido emitido en un extremo del aula pueda ser percibido por el micrófono en el otro extremo. Por otra parte, los ajustes en la consola aumentaron la amplitud de la señal eléctrica que fue enviada al parlante, es decir, subió el volumen del parlante. A continuación se procederá a mostrar el esquema de conexionado para cada experimento realizado Experimento 1: Respuesta al impulso de un salón de clases La primera experiencia consistió en la medición de la respuesta al impulso a diferentes señales de un salón de clases (en particular, el aula 17 del edificio Mario Hirsch de la Universidad de San Andrés). El recinto utilizado cuenta con 9.1 m de largo, 6.85 m de ancho y 2.85 m de altura. Los objetos mas significativos que allı́ se encuentran son 25 mesas de 1.2 m de largo, 0.6 m de ancho y 0.78 m de altura y 50 sillas de 40x40 cm y altura regulable (para las experiencias también se encontrarán en su interior los instrumentos descriptos en la sección anterior bajo la disposición que se observa en el gráfico (8)) Por último, es necesario destacar que se ha suprimido la representación de las ventanas y puertas del aula en esta figura. Se ha tomado esta decisión puesto que no se considera relevante para el análisis de la respuesta al impulso. Con el objetivo de que el sonido no se disipe todas las ventanas y puertas se mantuvieron cerradas durante la medición de las señales. v PC Cable Usb Interfaz de audio Cable XLR Micrófono Figura 6: Esquema de conexionado para la medición de las señales puras. La PC se conecta a la interfaz de audio mediante un cable USB. Luego, el micrófono se conecta a la placa a través de un cable XLR PC Cable Usb Interfaz de audio Cable XLR Micrófono v Cable de línea Consola de señales Cable de conexión bipolar Parlante Figura 7: Esquema de conexionado para la medición de las señales modificadas por el aula. La PC se conecta a la interfaz de audio mediante un cable USB. Luego, el micrófono se conecta a la placa a través de un cable XLR. El parlante se conecta a partir de un cable de conexión bipolar a la consola de señales, que a su vez se conecta a la interfaz de audio a través de un cable de lı́nea. Figura 8: Plano en ”vista en planta”del Aula 17 del Edificion Mario Hirsch de la Universidad de San Andrés. El punto ubicado en la anteúltima fila a mano derecha (si se mira de arriba hacia abajo) representa el micrófono. El cuadrado ubicado en la primera fila a mano izquierda representa el parlante. Los dos cuerpos ubicado en la tercera fila a mano derecha representan la consola de señales y la placa de audio 5 Experimento 2: Caracterización de fuentes Figura 9: Interior del Aula 17 del Edificion Mario Hirsch de la Universidad de San Andrés con distribución cotidiana de objetos Como señales de entrada para el sistema, se utilizaron 4 fuentes diferentes: aplausos de un solo individuo, la explosión de un globo, el choque entre 2 bloques de madera y la reproducción de un barrido frecuencial (también conocido como Sweep). Los sonidos fueron emitidos de forma natural (aplausos, explosión del globo y choque de maderas) o reproducidos desde el parlante (barrido frecuencial) desde la misma posición en la que se encuentra colocado el mismo dentro de gráfico (8) (aproximadamente a 3.3 m de la pared izquierda, 1.9 m de la pared superior y a una altura de 1.25 m). Cada señal fue grabada individualmente por el micrófono ultralineal (ubicado a 1.44 m de la pared de la izquierda, 2,10 m de la pared del fondo y a una altura aproximada de 1,1 m) bajo dos condiciones diferentes del sistema: en primer lugar el aula vacı́a de alumnos y sus mochilas y en segundo lugar el aula vacı́a de alumnos pero no de sus mochilas. Cabe aclarar que los ensayos fueron realizados alrededor del medio dı́a, con condiciones tales que la temperatura era igual a 14°C, humedad igual a el 72 % y ruido externo al sistema minimizado lo máximo posible. Resulta necesario destacar el motivo por el cual se han elegido las posiciones anteriormente mencionadas para los instrumentos. Debido a que el objetivo de la medición es estudiar cómo un sonido es modificado por el aula, se ha intentado replicar el escenario de una clase genérica al ubicar el parlante donde por lo generar se posiconarı́a un profesor y el micrófono en un lugar del aula donde podrı́a ubicarse un alumno que actuarı́a como receptos de las señales de voz emitidas por el profesor. Por otro lado, se intentó alejar el micrófono en la mayor medida posible del parlante para que la modificación realizada por el aula sobre la señal sea la más notoria posible, pero por la limitación de la extensión del cable que conectaba al micrófono solamente se ha podido posicionar en la anteúltima fila. El objetivo del segundo experimento fue estudiar las fuentes de audio ’puras’, al tratar de registrar señales que estén lo menos afectadas posible por el recinto donde fueron grabadas. Para lograr esto se realizaron dos modificaciones principales con respecto al experimento anterior. En primer lugar, todos los sonidos se realizaron al lado del micrófono, de modo que las ondas sonoras no ’viajen’ a través de todo el lugar ni se vean influenciadas por el espacio. En segundo lugar, se realizaron varias repeticiones de los mismos impulsos Con la finalidad de contar con registros de audio los mas fidedignos posibles de las señales de entrada utilizadas en los experimentos realizados anteriormente, para el segundo experimento se grabaron varios impulsos provenientes de una misma fuente (aplausos, globos, etc.). Estas capturas de audio se realizaron con los mismos equipos mencionados anteriormente y consistieron en realizar espaciados temporalmente cada uno de los sonidos (menos el barrido frecuencial) 10 veces cerca del micrófono (un punto en el cual no lograba saturarse). Las 10 repeticiones se grabaron en la misma pista de audio por cada uno de los sonidos, tratando que cada repetición sea afectada lo menos posible por ruidos externos y perturbaciones en el sistema generadas en intentos anteriores. C. Consideraciones en los experimentos Estudiar al salón de clases como sistema LTI Cabe aclarar que todos los análisis realizados en base a la información obtenida mediante la realización del Experimento 1 se hicieron considerando al salón de clases como un sistema del tipo lineal e invariante en el tiempo. En la realidad, un salón de clases no cumple plenamente con todas las caracterı́sticas de un sistema LTI debido a que no mantiene la propiedad de linealidad en la mayorı́a de los casos (la absorción y reflexión del sonido en las superficies de las paredes, el techo y el suelo, ası́ como la interacción con los objetos en el salón, como mesas y sillas pueden causar distorsión y cambios no lineales) ni la de ser invariante en el tiempo (la temperatura, humedad, nivel de ocupación del salón, disposición de mobiliario varı́an a lo largo del tiempo y modifican la respuesta del sistema). Sin embargo, se lo consideró LTI ya que su aproximación que no trae demasiados errores y simplifica las cuentas a realizar. Influencia de la temperatura y la humedad en la propagación del sonido Anteriormente se detallaron las condiciones meteorológicas presentes en el dı́a de la medición. Sin embargo, en un primer instante se podrı́a considerar que estos datos podrı́an ser irrelevantes para el análisis de la respuesta al 6 de donde se obtuvo un gráfico como el que se presenta a continuación. Amplitud impulso. Sin embargo, las caracterı́sticas del medio donde se emite un sonido definen su velocidad, las pérdidas por transmisión e incluso su dirección [1]. La velocidad del sonido queda determinada por las caracterı́sticas del aire, principalmente por su temperatura. Se suele decir que el sonido viaja a 343 m/s, sin embargo, esto es cierto sólo cuando la temperatura del aire es 20°C. Se considera que la velocidad del sonido varı́a en 0.6 m/s por cada grado centı́grado. El aire se puede considerar como un filtro pasa-bajos, es decir, absorbe altas frecuencias. Esta absorción depende en mayor medida de la humedad relativa del ambiente. Por ejemplo, un ambiente seco (20 % de humedad) genera una atenuación de -9 dB a 30m de la fuente para frecuencias en el rango de los 10kHz. Esos -9 dB se deben sumar a la atenuación que generan 30m de distancia por la ley del cuadrado inverso ( 20*log(1/30) = -29,5 dB). Por lo tanto, a 30m de distancia de la fuente y con 20 % de humedad, la atenuación será de -38,5 dB para frecuencias cercanas a los 10 kHz[2]. 0.6 0.4 0.2 0.0 0.2 0.4 0.6 0 5 10 15 20 Tiempo [s] 25 30 35 Figura 11: Ejemplo de un audio de seis globos explotando. Señal vista en el dominio del tiempo. Se logra visualizar la presencia de ruido que obligó a modificar el código utilizado para registrar impulsos para no ser detectado como la explosión de otros globos Aplicación de un filtro inverso Lo que interesa obtener para ambos experimentos son impulsos (como un aplauso, un golpe de maderas, etc.). Por este motivo, se tomó un barrido frecuencial y se lo convolucionó con un filtro inverso, de donde se obtuvo un impulso parecido a una delta en el dominio del tiempo. Si bien esto no se ha demostrado, en unas secciones más adelante sı́ se hará. Luego, fue necesario poder separar las señales en varios impulsos individuales para poder analizarlos de manera más especı́fica. Para eso se utilizó la función f ind peaks de SciPy, que sirvió para detectar los valores más altos alcanzados por la señal y de esa manera poder recortar los impulsos al tomar una cierta cantidad de muestras hacia atrás de los picos y hacia adelante. A continuación se mostrará un gráfico en amplitud del filtro inverso del sweep: Filtro Inverso 0.8 0.6 Amplitud Amplitud 0.4 0.2 0.0 0.2 0.4 0.6 0.8 0 1 2 3 Tiempo (en s) 4 5 0.6 0.4 0.2 0.0 0.2 0.4 0.6 0.0 0.1 0.2 0.3 0.4 Tiempo [s] 0.5 0.6 0.7 6 Figura 10: Gráfico de la amplitud del filtro inverso del sweep a lo largo del tiempo (medido en segundos). Figura 12: Ejemplo de un impulso individual correspondiente a un globo explotado. Señal en el dominio del tiempo Recorte de las muestras utilizadas Una parte fundamental del desarrollo de los experimentos consistió en el procesamiento de los datos obtenidos con los aparatos anteriormente descriptos. Una vez obtenidos los audios que contenı́an varias repeticiones de un mismo sonido (un audio con varios aplausos, por ejemplo) se procedió a analizar gráficamente cómo se veı́a esa señal, Luego, se procedió a analizar cada impulso en el dominio de la frecuencia, por lo que se aplicó la transformada de Fourier descripta en la ecuación 2. La cantidad máxima de hertz representada fue 22050 debido a que, si se recuerda el teorema de Nyquist - Shannon [3], no se puede reconstruir componentes frecuenciales superiores a la mitad de la frecuencia de muestreo de un audio. 7 10 40 20 0 10 + 20 Amplitud [dB] Amplitud [dB] Magnitud|Y(f)| 60 30 40 50 60 5000 10000 15000 Frecuencia [Hz] 5000 20000 10000 15000 Frecuencia [Hz] 100 200 Amplitud [dB] Amplitud [dB] 60 0 5000 10000 15000 Frecuencia [Hz] 20 40 60 80 20000 + 100 200 (a) 20000 (b) 0 + 10 Amplitud [dB] Amplitud [dB] 500 1000 2000 5000 Frecuencia [Hz] Figura 15: 20 aplausos. (a) tiene ejes en escala lineal. (b) tiene eje X en escala logarı́tmica y eje Y en escala lineal 0 20 30 40 50 10 + 20 30 40 50 0 A continuación se procederá a mostrar los resultados a partir del Experimento 2. Antes de mostrar las figuras, resulta necesario hacer una recapitulación de cómo se procesaron los datos. En primer lugar, se ’cortaron’ los audios para tener los impulsos por separado. En segundo lugar se llevó cada impulso al dominio de Fourier. Luego, se calculó una señal modelo a partir de calcular la media de todos los impulsos y también se obtuvieron los desvı́os. Posteriormente se modificaron los impulsos de modo que fuera posible representarlos a partir de la unidad decibeles, como se ha explicado previamente. Luego, la señal media, la señal + desvı́o y la señal - desvı́o se normalizaron al restarle a cada señal el máximo de la media. Por último, se ha utilizado un método llamado Rolling(k), que calcula el promedio móvil con una ventana de tamaño k. Cada punto en la serie de rolling es el promedio de los cinco puntos anteriores en la serie original. Esto tiene el efecto de suavizar la serie y resaltar tendencias a largo plazo. Para más información sobre este método se recomienda leer la documentación de la librerı́a Pandas. Para este caso particular se ha aplicado un rolling a cada curva con k = 50. 20000 0 + Análisis de resultados Aplausos, globos y maderas 500 1000 2000 5000 Frecuencia [Hz] (b) 40 En esta sección se analizará bajo diferentes perspectivas y se compararan los resultados obtenidos tras llevar a cabo los pasos descriptos en la sección desarrollo experimental (III). 1. 20000 20 80 Caracterización de fuentes 50 Figura 14: 15 globos. (a) tiene ejes en escala lineal. (b) tiene eje X en escala logarı́tmica y eje Y en escala lineal 0 De esta manera, una vez recortados todos los impulsos, fue posible calcular un impulso promedio y un desvı́o estándar asociado con el objetivo de crear ’señales modelo’ y trabajar en base a ellas. A. 40 (a) Figura 13: Ejemplo de un impulso individual correspondiente a un globo explotado. Señal en el dominio de la frecuencia IV. 30 60 0 0 + 20 5000 10000 15000 Frecuencia [Hz] (a) 20000 100 200 500 1000 2000 5000 Frecuencia [Hz] (b) Figura 16: 20 maderas. (a) tiene ejes en escala lineal. (b) tiene eje X en escala logarı́tmica y eje Y en escala lineal En primer lugar, resulta necesario destacar que todos los gráficos en escala lineal presentan una estructura similar. En todos ellos es posible dilucidar una suba considerable de energı́a (en forma de pico) para los primeros 1000 hertz (aproximadamente). Luego, en todos se ve un decaimiento lineal. Si bien este decaimiento no tiene exactamente la misma pendiente para todos, es posible reconocer que, a groso modo, se trata de una recta decreciente que comienza cerca de los 5000 hertz y culmina cerca de los 20000 hertz y en todo este trayecto se pierden aproximadamente 20 decibeles de energı́a. Por otro lado, también resulta necesario destacar que, luego de los 20000 hertz, la energı́a comienza a perderse de manera mucho más drástica, hasta llegar al máximo de 22050 hertz. Asimismo, resulta necesario aclarar que, a la hora de analizar los resultados, se recomienda hacer más énfasis 20000 8 1.0 0.8 0.8 Magnitud|Y(f)| Magnitud|Y(f)| o poner más atención en las curvas correspondientes a la media y a la media + desvı́o. En ciertos puntos, la curva de media - desvı́o no estuvo definida debido a que contenı́a valores negativos que, a la hora de aplicarles el logaritmo para obtener los decibeles, no fue posible evaluarlos. De esta manera, fue necesario realizar una interpolación sobre los puntos que sı́ pudieron evaluarse y por este motivo se recomienda analizar en más detalle las otras dos curvas. Por otra parte, resulta relevante destacar que los gráficos en escala lineal presentan una especie de ’meseta’ en algún intervalo dentro de todo el rango de frecuencias y que es más sencillo dilucidar en los gráficos con el eje X en escala logarı́tmica. Esta meseta se presenta para los globos entre 200 y 2000 hertz, para los aplausos entre 500 y 2000 hertz y para las maderas entre 2000 y 5000 hertz. En otro orden de ideas, resulta necesario mencionar que, antes de realizar el experimento, se supuso que el impulso que mayor desvı́o iba a presentar iba a ser el de los globos. Se creyó que, debido a que al explotar un globo entran en juego una mayor cantidad de variables sin regular (como la cantidad de aire que contenı́a cada globo, la zona donde fue pinchado, hacia dónde se escapó el aire y la goma del globo, entre otras), las mediciones podrı́an variar significativamente. Sin embargo, al ver los gráficos es posible ver que las diferencias más sustanciales las presentan los aplausos, en segundo lugar las maderas y en tercer lugar los globos. 0.6 0.4 0.2 0.0 0 5000 10000 15000 Frecuencia [Hz] 0.6 0.4 0.2 0.0 20000 0 5000 (a) 10000 15000 Frecuencia [Hz] 20000 (b) Figura 18: En (a) el espectro del filtro inverso, en (b) el del sine sweep Es posible observar que las transformadas de ambas señales parecieran ser en algún sentido ’opuestas’ o ’inversas’, mientras una tiene pendiente positiva, la otra tiene negativa. Las irregularidades que se presentan para frecuencias muy bajas (menores a 20 hz y mayores a 20000 hz) no se deben tener en cuenta, pues solamente dentro de este rango es que el oı́do humano puede percibir el sonido. Luego, una vez que se aplica la operación de convolución a las señales en tiempo (o multiplicación en frecuencia) se obtiene el siguiente resultado 1.0 Anteriormente se presentó el gráfico del filtro inverso para el dominio del tiempo. Ahora se presenta el gráfico del barrido frecuencial en el mismo dominio. 0.8 Magnitud|Y(f)| Sine sweep Amplitud 2. 15000 12500 10000 7500 5000 2500 0 Amplitud 0 0.75 0.50 0.25 0.00 0.25 0.50 0.75 2 4 6 8 10 Tiempo [s] 12 14 16 0.6 0.4 0.2 0.0 0 5000 (a) 10000 15000 Frecuencia [Hz] (b) Figura 19: En (a) el resultado de la convolución en tiempo, en (b) está en frecuencia 0 1 2 3 4 5 Tiempo [s] 6 7 8 Figura 17: Barrido frecuencial en dominio de tiempo. Si bien podrı́a parecer un cuadrado uniforme, si se observa detenidamente es posible ver que, al principio de la grabación, las ondas se repiten cada un intervalo de tiempo mayor y, a medida que pasa el tiempo (y el audio se vuelve más agudo), las ondas comienzan a repetirse en menos tiempo. A continuación se muestra la forma de la transformada de Fourier tanto para el filtro inverso como para el sine sweep Tal como se puede observar, el resultado obtenido en tiempo es un impulso que, a diferencia del resto de fuentes (aplausos, globos, etc.), tiene una similitud más significativa con lo conocida como ’delta’. Tal como se ha estudiado en la cátedra, la transformada de una delta es una constante, tal como se ve en el gráfico (b). B. Respuestas al impulso Tomando en cuenta lo mencionado en la explicación del Experimento 1 (III B) se explicarán los resultados obtenidos junto con un análisis para cada tipo de señal. 20000 9 Comparación de espectros de las respuestas al impulso (con y sin objetos en el aula) En los siguientes gráficos se mostrará la comparación entre el promedio de los valores absolutos de las Trasformadas de Fourier (2) convertidos a decibeles (3) tomando como valor de referencia el máximo valor que se obtuvo de cada promedio de las transformadas (2) para la respuesta al impulso de cada tipo de señal (explicadas en la sección Experimento 1: Respuesta al impulso de un salón de clases) analizando el caso de con y sin mochilas en el recinto (en este caso el aula representada en el esquema (8)): 2 Aplausos con mochilas Aplausos sin mochilas 4 Magnitud (dB) 6 Magnitud (dB) En este punto se mostrará como varia el espectro entre los diferentes tipos de impulsos (ya sea producidos por los aplausos, la explosión de los globos, el choque de las maderas y el sweep) medidos en el aula (representada en el esquema (8)) analizando los casos con o sin mochilas. Para hacer esto, se restringió el rango en el cual se tomaban valores de la señal con el propósito de usar las muestras que más información tenı́an (mejor explicado en la sección ’Recorte de las muestras utilizadas’ (III C)) para los siguientes análisis. golpe de maderas con mochilas golpe de maderas sin mochilas 5 10 15 20 25 0 2500 5000 7500 10000 12500 Frecuencia (Hz) 15000 17500 20000 Figura 22: Gráfico de la comparación entre espectros de la señal producida por el choque entre las maderas en el aula (8) con mochilas (curva ja) y sin mochilas (curva azul) a la vez que el eje x representa los niveles de frecuencias. 10 20 Magnitud (dB) 1. 30 40 50 60 0 sweep con mochilas sweep sin mochilas 5000 10000 Frecuencia (Hz) 15000 20000 Figura 23: Gráfico de la comparación entre espectros del sweep aplicado el filtro inverso (III C) producido con mochilas (curva roja) y sin mochilas (curva azul) a la vez que el eje x representa los niveles de frecuencias. 8 10 12 14 16 18 0 2500 5000 7500 10000 12500 Frecuencia (Hz) 15000 17500 20000 Figura 20: Gráfico de la comparación entre las magnitudes del promedio de los valores de las Trasformadas de Fourier de los impulsos producidos por los aplausos, mostrando el caso con mochilas (curva roja) y sin mochilas (curva azul) tomando como eje x las frecuencias y como eje y el valor de las magnitudes (representando los decibeles). 2.5 Explosión globos con mochilas Explosión globos sin mochilas 5.0 Magnitud (dB) 7.5 10.0 12.5 15.0 17.5 20.0 22.5 0 2500 5000 7500 10000 12500 Frecuencia (Hz) 15000 17500 20000 Figura 21: Gráfico de la comparación entre espectros de la señal producida por la explosión de los globos en el aula (8) con mochilas (curva roja) y sin mochilas (curva azul) a la vez que el eje x representa los niveles de frecuencias. Al analizar las figuras previamente obtenidas se puede apreciar como en algunos casos la cantidad de decibeles (obtenidos tras calcular el valor absoluto del promedio de las Trasformadas de Fourier (2)) de las señales producidas sin mochilas es menor que las obtenidas con mochilas (como el caso de las figuras (20) y (23)). Esto resulta contrario a lo esperado por los autores del informe. Se esperaba que los resultados fueran al revés (tal como ocurre en la figura (20)) al haber efectos de absorción de energı́a por parte de las mochilas en cada respuesta al impulso (al viajar las ondas sonoras de cada señal desde una posición en especifico hasta el micrófono amortiguando ası́ el sonido). Entre las principales suposiciones sobre este fenómeno se encuentra la utilización de un parlante sin un espectro plano (al no ser un parlante de medición), razón por la que la respuesta del mismo no será uniforme a todas las frecuencias. En otras palabras, el resultado obtenido tendrá tanto realces (amplifica la intensidad de las frecuencias por lo que habrá más energı́a) como atenuaciones (reducción de la intensidad de las frecuencias por lo que habrá menos energı́a). De esta manera, se puede concluir que la hipótesis que se tenia de un efecto determı́nate por parte de las mochilas en las respuestas de cada señal no era correcta, sobrestimando ası́ su influencia (ya sea por el pequeño tamaño de los mismos o por su cantidad). 10 Por otro lado, si se observa el gráfico (22) se puede ver como en bajas frecuencias la energı́a obtenida por parte de la respuesta al impulso de la señal grabada sin mochilas es menor a la que si tiene mochilas mientras que para medias y altas frecuencias los valores obtenidos son muchos más parecidos que los gráficos (21) y (23) llegando en algunos casos a ser más baja la energı́a para el caso con mochilas (por ejemplo entre 13750 Hz y 14500 Hz). ción tras aplicar los pasos descriptos en Experimento 1: Respuesta al impulso de un salón de clases) y la amplitud del sweep aplicado el filtro inverso en la señal (según lo explicado en Aplicación de un filtro inverso (III C)) 150 Sweep original con mochilas 0.2 2. Comparación de las amplitudes del sweep original y aplicado el filtro En los siguientes gráficos se mostrará la comparación entre la amplitud original del sweep (obtenido en la medi- Amplitud de la señal Amplitud señal 0.0 0.1 50 0 50 100 150 0.2 Sweep aplicado el filtro con mochilas 0 2 4 6 Tiempo (en s) 8 10 9.2 9.3 9.4 9.5 9.6 Tiempo (en s) 9.7 9.8 Figura 24: Gráfico de la amplitud del sweep original obtenido en la medición (el de color amarillo) vs Gráfico de la amplitud del sweep aplicado el filtro inverso en la señal (el de color verde), ambos considerando el efecto de las mochilas. Como eje x se tomo el tiempo medido en segundos mientras que el eje y representa el valor de la amplitud de la señal Sweep original sin mochilas Sweep aplicado el filtro sin mochilas 0.3 100 0.2 50 Amplitud de la señal Tomando en cuenta los resultados obtenidos en el apartado Caracterización de fuentes en las cuales se representan las energı́as producidas por las fuentes para distintos rangos de frecuencias, se puede ver como en el gráfico de la explosión de globos (19a) los picos de energı́a, al igual que en la figura (21) (tanto para el caso con y sin mochilas), se encuentran en bajas frecuencias (entre 0 y 300 Hz) mientras que para altas frecuencias es donde más se atenúa la señal. A su vez, al analizar los aplausos (19b), se ve como la energı́a se presenta en el rango de frecuencia entre 2000 y 2300 Hz, parecido en lo que ocurre en la respuesta al impulso del mismo tipo de señal (20). Este patrón también se repite para el caso de la señal producida por el choque de las maderas (comparando los gráficos (19b) y (19) con la respuesta al impulso (22)), al encontrarse tanto los valores altos como los bajos de las energı́as en rangos parecidos. De esta forma, se puede concluir como en la mayor parte de los casos, tanto en el primer como en el segundo experimento los resultados obtenidos en frecuencia son parecidos (al darse los picos de energı́a en rangos de frecuencias parecidos). 100 0.1 Amplitud señal Al analizar con más detalle el gráfico (20) se ve (según lo anteriormente mencionado) como es el que más se ajusta a lo que idealmente se esperaba (a pesar de que no se trate del efecto de las mochilas sino más del parecido de los espectros). A su vez, queda reflejado como en bajas frecuencias (entre 1250 Hz y 3000 Hz) la diferencia entre los valores obtenidos de las energı́a (con y sin objetos) es mucho más grande (llegando a ser la diferencia de 7 decibeles) que en otros rangos de frecuencias. Por otro lado, si se toma en cuenta los gráficos previamente obtenidos y se los analiza en el rango de frecuencia que normalmente se encuentra la voz de un ser humano (entre 500 y 3500 Hz según el articulo [4]) se puede apreciar como en la mayor parte de los casos la energı́a obtenida en este intervalo es alta (o no se atenúa tanto como en otros casos). Esto ocurre debido a las caracterı́sticas del mismo aula (8) como su forma, su tamaño, los materiales de construcción utilizados volviéndola un lugar ideal para dar clases (al ser los rangos de baja frecuencia en donde mejor se representa la energı́a). 0.1 0.0 0.1 0 50 100 0.2 150 0.3 0 2 4 6 Tiempo (en s) 8 10 200 9.2 9.3 9.4 9.5 9.6 Tiempo (en s) 9.7 9.8 Figura 25: Gráfico de la amplitud del sweep original obtenido en la medición (el de color amarillo) vs Gráfico de la amplitud del sweep aplicado el filtro inverso en la señal (el de color verde), ambos sin considerar el efecto de las mochilas. Como eje x se tomo el tiempo medido en segundos mientras que el eje y representa el valor de la amplitud de la señal Tanto en el gráfico (24) como en el (25) se aprecia la distorsión de la señal original del sweep obtenido en la medición. Entre las principales causas de este hecho se encuentra las caracaterı́sticas que poseı́a el entorno a la hora de ser grabado. Al reproducirse el barrido frecuencial en un aula (8) el sonido tuvo que reflejarse varias veces antes de disiparse creando ası́ un efecto de persistencia del mismo conocido como Reverberación (mencionado en el artı́culo 11 [5] en el cual se habla de la Reverberación del sonido). Otra razón de este hecho se debe a la utilización de un parlante no ideal (detallado el la imagen (5)) debido a que posee una frecuencia propia (siendo también responsable del resultado llegado en el apartado Comparación de espectros de las respuestas al impulso (con y sin objetos en el aula)), en otras palabras, no posee un espectro plano (la respuesta no es constante para todas las frecuencias dentro del rango auditivo de un ser humano). Al analizar la señal obtenida en los gráficos previamente mencionados tras aplicar el filtro inverso (representado en amplitud por la figura (10)) se ve (en amplitud) las correcciones de las distorsiones del barrido frecuencial original tanto para el caso del sweep grabado con objetos (24) y el de sin objetos (25). A su vez, con el propósito de comparar de mejor manera la evolución de las amplitudes obtenidas en ambos casos (tras aplicar el filtro), se realizó el siguiente gráfico: 10.0 Sweep aplicado el filtro (con mochilas) 10 7.5 Amplitud de la señal Amplitud señal 5.0 2.5 0.0 2.5 5.0 7.5 10.0 9.50 Sweep aplicado el filtro (sin mochilas) 5 9.54 9.56 Tiempo (en s) 9.58 9.60 5 9.50 9.52 9.54 9.56 Tiempo (en s) 9.58 9.60 Figura 26: Gráfico de las amplitudes del sweep aplicado el filtro tomando el caso con mochilas y sin mochilas . En la figura (26) queda en evidencia como en el caso del sweep aplicado el filtro inverso sin la presencia de objetos la amplitud es mayor que el caso sin objetos en los mismos instantes de tiempo. Ahora bien, a pesar del efecto de absorción que idealmente tienen las mochilas, se habı́a llegado previamente en el apartado Comparación de las amplitudes del sweep original y aplicado el filtro a la conclusión de que el efecto de estos objetos en el presente experimento no era tan determinante como se esperaba. Aún ası́, al observar el gráfico previamente obtenido (26) se puede decir como este efecto si se encuentra presente a pesar de tener una implicancia tan baja (al ser chica la diferencia de amplitudes en el mismo tiempo). C. 1. Descripción de los recintos Los 13 recintos, cuyas respuestas al impulso fueron comparadas con la obtenida de las experimentaciones realizadas en el Aula 17 del Edificion Mario Hirsch de la Universidad de San Andrés, son los siguientes: Cancha de tenis (sin techo): Cancha de tenis al descubierto ubicada en el Falkland Palace en Fife, Escocia. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec S30D y captado por un micrófono de campo sonoro SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue de 10,76 m, la altura de la fuente fue de 1,5 m y la altura del receptor fue de 1.5 m. 0 10 9.52 poder determinar el grado de similitud entre las respuestas al impulso de diferentes recintos. Por medio de la utilización de la misma, se buscará determinar dentro de un grupo de 13 ambientes diferentes cuales son los que se comparan de forma parecida a un salón de clases (en particular el Aula 17 que previamente se analizó) y a que factores se debe cada determinado grado de similitud. Comparación entre respuestas al impulso de diferentes recintos En la siguiente sección se procederá a analizar una métrica elaborada con la finalidad de conseguir una forma de Interior de una mina: Mina en desuso encontrada cerca de Trollers Gill, Inglaterra llamada Gill Heads Mine. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz y tanto la distancia fuente-receptor como la altura de los mismo se desconoce. Túnel ferroviario: Túnel ferroviario St Leonards ubicado al sureste del centro de Edimburgo, cerca de Arthur’s Seat. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 5 m y 10 m, la altura de la fuente y el receptor fue 1.5 m y la temperatura durante de medición fue 17°C. Bosque (en verano): Bosque del Parque Nacional Koli en Finlandia a mediados del verano. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 7.2 m, 9 m y 11 m, la altura de la fuente y el receptor fue 1.5 m y la temperatura durante de medición fue 13°C. 12 y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue 8.86 m la altura de la fuente y receptor fueron 1.5 m y la temperatura fue 13°C. Bosque (en invierno): Bosque del Parque Nacional Koli en Finlandia a mediados del invierno. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 7.2 m, 9 m y 11 m, la altura de la fuente y el receptor fue 1.5 m y la temperatura durante de medición fue -1.5°C. Valle con colinas: Desfiladero de piedra caliza conocido como Troller’s Gill en los valles de Yorkshire, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, la distancia fuente-receptor tomada fue 5.5 m y la altura de la fuente y el receptor fue 1.5 m. Reactor Nuclear: Reactor Nuclear R1 ubicado a 25 metros debajo del KTH Royal Institute of Technology, cerca de Estocolmo, Suecia. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor tomada fue de 14.88 m y la altura de la fuente y el receptor fue 1.5 m. Monumento: Monumento creado para Onesipherous Tyndall Bruce en Malvinas, Argentina. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante desconocido y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue 2.3 m y la altura de la fuente y receptor fueron 1.5 m. Iglesia: El Santuario e iglesia parroquial de Todos los Santos está situado en la calle Norte, cerca del rı́o Ouse, Ingleterra. Cuenta con 28.4 m de largo y 14 m de ancho. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8030 y captado por un micrófono Soundfield SPS422B. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 4.5 m, 5.2 m y 13.45 m, la altura de la fuente fue 1.5 m, la del receptor fue 1.3 m y la temperatura durante de medición fue 15°C. Usina del Arte: La Usina del Arte es un centro cultural y sala de espectáculos que ocupa el edificio de la vieja Usina Don Pedro de Mendoza en el barrio de La Boca, Buenos Aires. Las mediciones se realizaron el 2 de junio de 2014 entre las 9:00 y las 18:00 h. El ruido de fondo se midió con el sonómetro al comienzo del experimento en 10 puntos fı́sicos dentro de la habitación en modo lento con un intervalo de integración de 30 segundos. Para obtener las respuestas impulsivas de la sala se generó un barrido sinusoidal logarı́tmico (Sweep) de 50 segundos de 40 Hz a 16 kHz a una frecuencia de muestreo de 16 bits 48 kHz y su filtro inverso para reproducción, grabación y posterior deconvolución y post-procesando. Se utilizó para las mediciones un micrófono Earthworks M50, la frecuencia de muestreo de la grabación fue de 48 kHz y tanto la distancia fuente-receptor como la altura de la fuente y receptor son desconocidas. Polideportivo: Pabellón deportivo del polideportivo de la Universidad de York, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante desconocido y captado por un micrófono desconocido. La frecuencia de muestreo de la grabación fue de 96 kHz y la distancia fuente-receptor y altura de la fuente y receptor desconocidas. Almacén vacı́o: Almacén vacı́o dentro de la fábrica de chocolate y confiterı́a Terry’s en York, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante desconocido y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue 28.35 m, la altura de la fuente y receptor fueron 1.5 m y la temperatura fue 16°C. Sala de mecanografı́a: Sala de mecanografı́a dividida dentro de la fábrica de chocolate y confiterı́a Terry’s en York, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante desconocido 2. Métrica de comparación implementada y condiciones para el análisis A grandes rasgos, la métrica seleccionada consiste en el calculo del error cuadrático medio (MSE) entre las respuestas al impulso en el dominio de la frecuencia de cada recinto dentro de 3 rangos frecuenciales diferentes. La selección del MSE como medio para cuantificar la diferencia entre respuestas se justifica en su caracterı́stica de penaliza de manera significativa los errores grandes debido al cuadrado en la fórmula, lo que lo hace sensible a la grandes diferencias presentes. También fue elegido el dominio de la frecuencia como 13 región de análisis debido a que es más fácil identificar y comparar caracterı́sticas acústicas especı́ficas de como resonancias, atenuaciones, amplificación, reverberación, etc. Por otra parte, cabe aclarar que las respuestas frecuenciales de cada sistema se obtuvieron aplicando la transformada rápida de Fourier (FFT) sobre la respuestas al impulso en el dominio del tiempo de cada recinto. A cada respuesta temporal se le realizo un recorte temporal especifico con la finalidad solo contar con el registro de la información mas relevante de cada localidad. A su vez, cada recorte temporal contó con la misma duración, cuyo valor buscó ser lo suficientemente amplio como para que cada señal logre brindar toda la información relevante contenida (la extinción temporal que se considero mas acertado para estos experimentos en particular fue de 0.5 segundos). Una vez realizadas todas estas modificaciones pertinentes, se aplicaba la FFT sobre las respuestas temporales para obtener cada respuesta frecuencial en particular. Al ya contar con cada respuesta frecuencial, se procedió a restringir las mismas dentro de un rango de 20 Hz a 20 kHz, el cual es el rango de frecuencia auditiva humana y el principal motivo por el que se realiza este corte (no resulta de interés analizar el efecto que produce el sistema sobre el sonido dentro de registros nos perceptibles por las persona). A esta rango frecuencial seleccionado lo dividimos en sus tres estancias: frecuencia baja (20 Hz a 200 Hz), la cual está asociada con tonos graves y sonidos profundos, frecuencia media (200 Hz a 2 kHz), la cual es fundamental para la percepción de la claridad y la presencia en muchos sonidos como la voz humana y la frecuencia alta (2 kHz a 20 kHz), la cual se relaciona con tonos agudos y sonidos brillantes. La justificación detrás de estas partición particular se encuentra en que estas distinciones permiten proporcionar información mas detallada sobre la influencia del sistema sobre las diferentes componentes de la señales de sonido (alteración por presión acústica de las bajas frecuencias, reflexiones y reverberación sobre las medias, atenuación por absorción de las altas, entre otros). Como ultimas aclaraciones, cabe exponer que las comparaciones entre los recintos y el salón de clases se hicieron solamente teniendo en cuenta la respuesta al Sweep del mismo, tanto con mochilas como sin mochilas. La elección de solo utilizar las respuestas al barrido frecuencial se basa en que el mismo fue la señal de entrada del resto de los recintos analizados, por lo que una comparación con las respuestas sobre los aplausos, globos o maderas no brindarı́an información tan significativa o fácil de analizar. A su vez, se mantuvo la distinción entre el ambiente vació de objetos y lleno de objetos debido a que el análisis del recinto vació brinda la posibilidad de obtener comparaciones con la forma ideal del sistema mientras que el ambiente con objetos proporciona comparaciones con el estado habitual del sistema. Finalmente, también se decidió que aquellos recintos que contaran con una mayor cantidad de grabaciones se diferenciarı́an entre si (la distancia entre fuente y receptor de la señal era diferente), lo cual tiene como propósito permitir la visualización de los efectos provocados por distintas distancias de grabación (reverberación, reflexiones, saturación, etc). 3. Resultados y Análisis A continuación, se presentan los datos de la métrica aplicada entre todos los recintos y el salón de clases con mochilas. Recintos Cancha de tenis Interior de mina Túnel ferrov. (5 m) Túnel ferrov. (10 m) Bosque (ver.) (7.2 m) Bosque (ver.) (9 m) Bosque (ver.) (11 m) Bosque (inv.) (7.2 m) Bosque (inv.) (9 m) Bosque (inv.) (11 m) Reactor Nuclear Iglesia (4.5 m) Iglesia (5.2 m) Iglesia (13.45 m) Polideportivo Almacén Vacı́o Sala de mecanografı́a Valle con colinas Monumento Usina del Arte LF 0.076 0.071 0.069 0.067 0.112 0.065 0.092 0.121 0.168 0.140 0.064 0.094 0.053 0.057 0.078 0.082 0.078 0.102 0.092 0.062 MF 0.049 0.062 0.052 0.047 0.049 0.048 0.109 0.140 0.198 0.152 0.025 0.043 0.031 0.030 0.057 0.056 0.065 0.066 0.068 0.026 HF 0.026 0.056 0.033 0.033 0.034 0.038 0.035 0.070 0.080 0.065 0.026 0.034 0.134 0.035 0.034 0.027 0.023 0.086 0.033 0.032 Tabla I: Error Cuadrático Medio (MSE) entre las respuestas en frecuencia de los diferentes recintos y el salón de clases (Aula 17 ) con mochilas en frecuencia baja LF (20 Hz a 200 Hz), media MF (200 Hz a 2 kHz) y alta HF (2 kHz a 20 kHz). Como se puede observar en la tabla, en promedio el recinto que responde al barrido sinusoidal de forma mas parecida al salón de clases es la Iglesia, especı́ficamente a la mayor distancia de grabación posible (13.45 m). Hace sentido que ambas respuestas resulten tan parecidas debido a la alta similitud que tiene la construcción acústica de ambos recintos. En primer lugar, ambos lugares tienden a ser espacios con un volumen significativo y constituidos por superficies reflectantes (paredes, techos y suelos), lo cual produce que el sonido pueda propagarse con mayor facilidad y mas distancia a la vez que se produce reverberación prolongada y resonancia especifica de las frecuencias medias en el ambiente, lo cual es buscado para conseguir que la voz del orador presente en el recinto pueda ser escuchada por todas las personas que allı́ se encuentran con la mayor claridad posible (que el error mas bajo de las comparaciones se de en frecuencias 14 medias no es una casualidad sino que es producto de la búsqueda de ambos recintos por enaltecer las frecuencias medias). Ahora hablando sobre las diferencias entre ambos recintos, la mas significativa la podemos encontrar a la hora de estudiar sus respuestas en baja frecuencia (donde encontramos la mayor grado de error entre ambas). Esto se debe a que en las iglesia es muy buscada la reverberación y amplificación de las frecuencias bajas debido a que también se prioriza que el sonido emitido por los instrumentos (los cuales rondan las frecuencias bajas y medias) sea escuchado con la mayor claridad posible por el publico presente a diferencia de un salón de clases, el cual busca que estas frecuencias se atosiguen por medio de su absorción atreves del mobiliario o los materiales de construcción que componen al ambiente. Recintos Cancha de tenis Interior de mina Túnel ferrov. (5 m) Túnel ferrov. (10 m) Bosque (ver.) (7.2 m) Bosque (ver.) (9 m) Bosque (ver.) (11 m) Bosque (inv.) (7.2 m) Bosque (inv.) (9 m) Bosque (inv.) (11 m) Reactor Nuclear Iglesia (4.5 m) Iglesia (5.2 m) Iglesia (13.45 m) Polideportivo Almacén Vacı́o Sala de mecanografı́a Valle con colinas Monumento Usina del Arte LF 0.075 0.066 0.072 0.069 0.115 0.069 0.087 0.114 0.151 0.126 0.066 0.085 0.184 0.057 0.073 0.075 0.077 0.101 0.087 0.060 MF 0.047 0.057 0.051 0.045 0.048 0.045 0.100 0.129 0.394 0.332 0.121 0.154 0.132 0.134 0.178 0.178 0.193 0.183 0.205 0.126 HF 0.016 0.050 0.013 0.015 0.018 0.118 0.114 0.197 0.213 0.185 0.068 0.072 0.074 0.074 0.088 0.062 0.077 0.215 0.182 0.074 Tabla II: Error Cuadrático Medio (MSE) entre las respuestas en frecuencia de los diferentes recintos y el salón de clases (Aula 17 ) sin mochilas en frecuencia baja LF (20 Hz a 200 Hz), media MF (200 Hz a 2 kHz) y alta HF (2 kHz a 20 kHz). Por otra parte, se puede dilucidar que las regiones con mayor error son los bosques (tanto las grabaciones hechas en verano como la hechas en inviernos). Esto también se justifica en base a la constitución acústica de ambos lugares. Mientras un salón de clases busca amplificar las frecuencias medias y reducir las bajas y altas a partir de su composición estructural, un bosque no es capaz de absorber de sobre manera ninguna de las frecuencias por medio de los objetos que componen el entorno (arboles, piedras, arbustos, etc) a la vez que al no ser una ambiente cerrado es incapaz de generar una efecto significativo de reverberación y reflexión, lo que genera que el sonido se desperece rápidamente y no pueda alcanzar grandes distancias. En comparación con lo analizado en el caso anterior, se puede encontrar que la tendencia de que aquellos lugares mas cerrados como lo son la iglesia, la Usina del Arte o el interior de la mina siguen siendo los lugares que en promedio cuentan con menor error mientras que los lugares mas abiertos como el bosque o el valle con colinas presentan un mayor grado de error. El cambio mas significativo que se puede encontrar es el gran aumentos de error que sufren todos los recintos principalmente en frecuencia media. Esta cambio pudo haberse producido debido a la presencia de una mayor cantidad de energı́a general dentro de la respuestas del salón sin mochilas en comparación con el salón con presencia de mochilas. V. A continuación, se presentan los datos de la métrica aplicada entre todos los recintos y el salón de clases sin mochilas. Conclusiones En relación con el análisis de las caracterı́sticas de las fuentes, los resultados de mayor relevancia que se presentaron fueron los que se detallan a continuación. En primer lugar, se mostró que todos los impulsos, el de globos, el de aplausos y el de maderas poseen la misma estructura general. Un pico al comienzo cerca de los 1000 hertz, una decrecimiento lineal común hasta 20000 hertz y una caı́da drástica para mayores frecuencias. Ası́mismo, se observó la presencia de una ’meseta’ o nivel de decibeles constante que se repitió para las tres fuentes, pero para distintos valores de frecuencias. Asimismo, se refutó con la evidencia empı́rica lo que en un principio se suposo sobre la fuente que presentarı́a más desvı́o. Mientras se creyó que los globos contendrı́an mayor incerteza, los da- 15 tos indicaron que quien presentó resultados más variados fueron los aplausos. Por último, se estudió y demostró cómo, a partir de la convolución con un filtro inverso, se transformó un sine sweep en un impulso similar a una delta. cuencia son parecidos, al dar valores de la energı́a muy similares en ambos casos. A su vez, se observó el barrido frecuencia (obtenido en la medición) viendo su amplitud encontrando como la señal de origen se encontraba distorsionada, razón por la que se tuvo que aplicar un filtro inverso logrando ası́ corregir las distorsiones. Con lo que respecta al análisis de las respuestas al impulso para los diferentes tipos de señales, tomando el caso de la grabación de las muestras con y sin mochilas en el aula (8), se concluyó como el efecto de absorción de la energı́a que ejercı́an tanto las mochilas como las camperas era poco determinante a la hora de comparar espectros entre cada respuesta de cada señal (contrastando la energı́a medida en decibeles (3)). Seguido a esto, se analizó la eficacia del aula (9) para la reproducción de los sonidos de la voz humando (tomando en cuenta el modelo de medición armado (8)) llegando a que se trata de un buen lugar para dar clases (al no atenuarse tanto la energı́a en los intervalos de baja frecuencia como si en los rangos de media y alta). Por otro lado, se realizó una comparación entre espectros de los resultados obtenidos tanto del primer experimento (analizando las fuentes de las señales) como del segundo (estudiando las respuestas al impulso del mismo tipo de señales) llegando a la conclusión de como en ambos casos los resultados obtenidos en fre- Dentro de lo que abarcó el análisis y comparación de la respuesta al impulso de los diferentes recintos, se logró concluir que la métrica propuesta resulto ser de gran utilidad a la hora de realizar las comparaciones debido a su gran impacto sobre los errores grandes y la profundidad de análisis que permite el analizar el impacto de los sistemas en 3 regiones de frecuencias diferentes. En base a los resultados, se pudo determinar que el recinto mas parecido al salón de clases Aula 17 es la iglesia, a la vez que aquellos recintos que eran mas cerrados y que presentan mayor capacidad de reverberación y reflexión como el interior de una mina o la Usina del arte también conseguı́an buenas métricas de error. Por otra parte, se llegó a la conclusión de que el recinto menos parecido al salón de clases era el bosque, que al igual que otros sistemas como el valle, debe sus mala puntuación a la propiedad de ser un ambiente muy abierto y, en consecuencia, con poca capacidad de reflexión o reverberación. [1] B. y Kjaer, Cómo afecta la meteorologı́a a las medidas de ruido ambiental (2001). [2] Sonido, temperatura y humedad (2015). [3] Explicación del teorema de muestreo de nyquist sin ecuaciones (2020). [4] ¿cómo es la frecuencia en la voz humana? (2023). [5] Absorción y reverberación, (2016).

TP2 - Antezana - Giacometti - Martin

Documentos relacionados

Productos

Apoyo

TP2 - Antezana - Giacometti - Martin

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib