Universidad de San Andrés Análisis matemático III - Tutorial Miércoles Caracterización de señales de entrada y analisis de respuestas al impulso de sistemas Martin, Tiziano1 Giacometti, Mateo2 Antezana, Matı́as3 1 2 3 Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina. [email protected] Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina. [email protected] Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina. [email protected] (Dated: 14 de noviembre de 2023) Resumen En el presente trabajo se analizará los impulsos tanto de la fuente como la respuesta al impulso de 4 tipos de señales: los aplausos, la explosión de globos, el choque de maderas y un barrido frecuencial. Para llevar a cabo este estudio, se observará sus respectivas respuestas en frecuencia y sus amplitudes. Seguido a esto, se estudiará el efecto de los objetos ( especı́ficamente de las mochilas) presentes en el lugar en el cual se extrajo las mediciones (en este caso un aula) a la vez que se lo comparará con los resultados obtenidos por otros 13 recintos, utilizando una métrica previamente definida para su análisis (en este caso, el error cuadrático medio aplicado a la respuesta en frecuencia de los recintos a comparar en los intervalos de baja, media y alta frecuencia en el rango de audición humano) . Mediante resultados se comprueba como las respuestas en frecuencia de las señales provenientes tanto de las fuentes como de la respuesta al impulso son parecidas, a la vez que se determinó el poco efecto de los objetos presenten en el recinto medido en los resultados obtenidos. Se demostró que un sonido de aplauso, de un globo explotando y de un golpe de maderas concentran un pico de energı́a antes de los 1000 hertz, luego decae linealmente hasta 20000 hertz, donde luego cae sustancialmente. La repetición de aplausos tuvo más incerteza, seguido de los golpes de maderas y por último los globos. Por otras parte, se logro determinar que los recintos mas parecidos al aula analizada son una iglesia y el menos parecido un bosque en diferentes condiciones climatológicas. Abstract In this study, the impulses of four types of signals—applauses, balloon bursts, wood impacts, and a frequency sweep—were analyzed, considering both the source impulses and the impulse responses. The respective frequency responses and amplitudes of these signals were observed. Subsequently, the effect of objects (specifically, backpacks) present in the measurement environment (in this case, a classroom) was studied and compared with results from 13 other environments. A predefined metric for analysis, in this case, the mean squared error applied to the frequency response of the environments at low, mid, and high frequency intervals within the human audible range, was used for comparison. The results confirm the similarity of frequency responses between signals originating from both sources and impulse responses. Additionally, it was determined that the presence of objects in the measured environment had little effect on the obtained results. It was demonstrated that the sound of applause, a bursting balloon, and a wood impact concentrate peak energy before 1000 hertz, followed by a linear decay up to 20000 hertz, where it subsequently decreases substantially. The repetition of applause showed greater uncertainty, followed by wood impacts, and finally, balloons. On the other hand, it was determined that environments most similar to the analyzed classroom are a church, while the least similar is a forest under different climatic conditions. I. Introducción A la hora de estudiar diversas fuentes sonoras resulta fundamental considerar y entender la influencia que tiene el medio fı́sico donde se efectúa el sonido. Cada entorno particular modifica de manera diferente un audio y esas transformaciones pueden expresarse matemáticamente a partir del análisis de señales. La función que vincula las señales de entrada y salida se conoce como respuesta al impulso. Con el objetivo de llevar a la práctica esta idea en un entorno relacionado a la academia, en el presente informe se estudiará las modificaciones que un salón de clase le impone a ciertas señales especı́ficas que poseen propiedades similares a las de la voz humana. Se utilizarán métodos de obtención de respuestas al impulso inspirados en los contenidos vistos en la materia de Análisis matemático III. En primer lugar, se analizarán señales que no estén afectadas (o lo mı́nimo posible) por el medio donde fueron grabadas. Luego, una vez obtenidos estos datos, se 2 examinarán las diferencias entre las señales ’puras’ y las modificadas por el aula con el objetivo de cuantificar esos cambios y estudiar cómo la presencia de objetos en un espacio puede condicionar la propagación del sonido. Finalmente, se realizará una comparación entre la respuesta al impulso del aula con otras respuestas al impulso provistas por la cátedra. El objetivo de esta parte es poder establecer una métrica objetiva de comparación y sobre esta base establecer grados de similitud entre el salón de clase y el resto de recintos analizados. Por otra parte, resulta necesario mencionar que, además de esta sección de introducción de ideas, el presente informe cuenta con una sección de marco teórico, donde se desarrollarán los conceptos y contenidos clave para entender las nociones prácticas y teóricas de los experimentos y los resultados de ellos. Posteriormente procede un apartado de desarrollo experimental, donde se detallarán los pasos que fueron seguidos a la hora de realizar los experimentos, los diferentes instrumentos utilizados y las consideraciones que se tuvieron en cuenta, de modo que quien lo desee pueda replicarlos. Luego, se desarrollará una sección de resultados y análisis, donde se expondrán justamente los resultados obtenidos y se intentará a cada uno de ellos acompañarlos de una intuición fı́sica y conceptual de que se hayan producido. Por último, el informe concluye con un apartado de consideraciones finales, donde se expondrán los resultados obtenidos de mayor relevancia y las ideas propuestas para futuras investigaciones. II. A. Marco teórico Trasformada de Fourier La Transformada de Fourier para señales continuas es una herramienta esencial en el análisis de señales en el dominio de frecuencias. Esta transformada se aplica a señales continuas en el tiempo, ya sean periódicas o no periódicas. La ecuación de sı́ntesis de esta transformada se define como: Z ∞ 1 x(t) = X(jω)ejωt dω (1) 2π −∞ Mientras que la ecuación de análisis se define como: Z ∞ X(jω) = x(t)e−jωt dt (2) −∞ con una referencia especı́fica. En el contexto del sonido y la acústica, los decibeles se utilizan comúnmente para expresar niveles de presión sonora, intensidad acústica y otras magnitudes relacionadas. La fórmula general para ganancia o pérdida en decibeles se define como P dB = 10log10 (3) P0 donde dB es la abreviación de la medida de decibeles, P es la cantidad medida (presión sonora, potencia, etc.) y P0 es la referencia o nivel de referencia. B. Sistemas LTI La importancia de conocer la estructura de una respuesta al impulso radica en que estas respuestas caracterizan completamente a sistemas que son lineales (es decir, cumplen la condición de linealidad) e invariantes en el tiempo. Los llamamos invariantes en el tiempo dado que un desplazamiento temporal en la señal de entrada implica el mismo desplazamiento temporal en la señal de salida, lo que significa que el comportamiento de un sistema LTI no depende del momento en el que se inyecta la señal a la entrada. Luego, se dice que un sistema LTI queda completamente caracterizado por su respuesta al impulso porque cualquier señal de entrada se puede pensar como una combinación lineal de impulsos desplazados. Si se conoce cómo un sistema determinado modifica a un impulso, para ver cómo altera una señal arbitraria solo se debe pensarla como una sucesión de impulsos e ir aplicando la transformación uno a uno, para luego sumar los resultados. C. Convolución de dos funciones Dadas dos funciones (en nuestro caso, señales en dominio de tiempo) interesará definir el proceso de convolución como aquel procedimiento matemático en el que se combinan ambas funciones con el fin de producir una tercera función (tercera señal) que expresa cómo una ecuación modifica a la otra. La fórmula de este proceso es la siguiente: (x ∗ h)[n] = M −1 X x[k] · h[n − k] = y[n] (4) k=0 Especı́ficamente, en el presente informe se tomarán señales expresadas en el dominio del tiempo (x(t)) y se las analizará la mayor parte del tiempo en el dominio de la frecuencia. Por último, otro concepto que resultará util tener en cuenta a la hora de hacer el análisis de los resultados obtenidos es el de la unidad de decibeles. Se define decibeles como una unidad logarı́tmica que se utiliza para medir la magnitud de una cantidad en relación en donde x e y son las señales correspondientes mientras que y[n] es la función resultante. Observando la fórmula (4) se puede ver como las operaciones (la multiplicación) se realiza punto por punto (posición por posición) a la vez que se produce un desplazamiento de la función h. 3 D. Error Cuadrático Medio El Error Cuadrático Medio o Mean Squared Error (MSE) es una métrica utilizada para evaluar la precisión de un modelo de predicción en comparación con los valores reales. Esta métrica cuantifica la magnitud promedio de los errores al cuadrado entre las predicciones del modelo y los valores reales en un conjunto de datos. n M SE = 1X (yi − ŷi )2 n i=1 (5) Figura 2: Interfaz de audio Scarlett 2i4 de Focusrite Donde n es el número total de observaciones, yi es el valor real de la observación i y donde ŷi es el valor predicho para la observación. Cuanto menor sea el MSE, mejor se ajusta el modelo a los datos. En particular, se utilizará como métrica de medición para comparar la respuesta al impulso del aula con la de otros recintos. III. Desarrollo experimental A. Instrumentos utilizados Para la realización de los diferentes experimentos se utilizaron los siguientes dispositivos. En primer lugar, un micrófono ultralineal de condensador para medición condensador (capaz de convertir la señal el sonido en una señal eléctrica) ECM8000 de la marca Behringer. El mismo cuenta con sensibilidad de 70 dB, con una impedancia (resistencia a la interferencia) de 200 Ohms, con una respuesta de frecuencia entre 20Hz a 20000 Hz, un peso de 136 g y patrón polar omnidireccional. En lo que respecta a sus dimensiones, el micrófono cuenta con 191 mm de largo y 21 mm de ancho. Figura 3: Interfaz de audio Scarlett 2i4 de Focusrite junto con la computadora utilizada para seguir las mediciones En tercer lugar, como consola de señales se hizo uso de Power620plus de la marca Phonic. Entre sus especificaciones mas destacadas se encuentran que el mismo posee un amplificador de potencia estéreo de 2 x 100W / 4 ohms para Main L/R o Main/Monitor (Bridge mono, 200W a 8 ohms), Procesador multi-efectos estéreo digital a 32 bits con 16 programas más control de parámetro y jack para interruptor de pedal, EQ gráfico estéreo de 7 bandas, 6 Entradas de Micrófono balanceadas con jacks XLR, 8 Entradas de Lı́nea por jacks 1/4”, 2 Entradas de Súper Alta Impedancia (Hi-Z) optimizada para entrada directa de instrumentos, 2 Limitadores integrados, entre otros. En cuanto a sus dimensiones, el mismo cuenta con 440 mm de ancho, 265 mm largo, 275 mm de profundidad y 12990 gr de peso. Figura 1: Micrófono ultralineal ECM8000 de Behringer En segundo lugar, como interfaz de audio se utilizó una Scarlett 2i4 de segunda generación 2-in/4-out USB de la marca Focusrite. Entre sus especificaciones mas destacadas se encuentran una sensibilidad de 69 dB, un rango dinámico (diferencia entre el nivel de señal más alto y más bajo que puede manejar) de 120 dB, tasa de muestreo de 192 kHz y resolución de audio de 24 bits. En cuanto a sus dimensiones, el mismo cuenta con una altura de 47.5 mm, un ancho de 175mm y un peso de 1000 gr. Figura 4: Consola de señales Power620plus de Phonic Finalmente, como fuente de los sonidos de las pruebas se valió de un parlante JH153TW de la marca Dancis. El mismo es un parlante del tipo Woofer, Driver y Tweeter, de filtro pasivo, potencia de salida (RMS) de 150 W y nivel de impedancia de 8 Ohms. En lo referido a sus dimensiones, el dispositivo mide 440 mm de ancho, 720 mm de largo y 300 mm de profundidad. 4 Por último, resulta relevante mencionar que, para verificar la correcta estructura de los impulsos luego de ser grabados, también se utilizó la aplicación informática Audacity. B. Experimentos realizados ’ Figura 5: Parlante JH153TW de Dancis Resulta relevante mencionar que para hacer las mediciones se ajustaron los niveles de ganancia tanto de la placa de audio como de la consola de señales para, a grandes rasgos, separar el ruido de fondo en las mediciones sin llegar al extremo de saturar los aparatos. La placa de audio se ajustó para aumentar la amplitud de la señal que percibió el micrófono; en otras palabras, para que, a pesar de la distancia, el sonido emitido en un extremo del aula pueda ser percibido por el micrófono en el otro extremo. Por otra parte, los ajustes en la consola aumentaron la amplitud de la señal eléctrica que fue enviada al parlante, es decir, subió el volumen del parlante. A continuación se procederá a mostrar el esquema de conexionado para cada experimento realizado Experimento 1: Respuesta al impulso de un salón de clases La primera experiencia consistió en la medición de la respuesta al impulso a diferentes señales de un salón de clases (en particular, el aula 17 del edificio Mario Hirsch de la Universidad de San Andrés). El recinto utilizado cuenta con 9.1 m de largo, 6.85 m de ancho y 2.85 m de altura. Los objetos mas significativos que allı́ se encuentran son 25 mesas de 1.2 m de largo, 0.6 m de ancho y 0.78 m de altura y 50 sillas de 40x40 cm y altura regulable (para las experiencias también se encontrarán en su interior los instrumentos descriptos en la sección anterior bajo la disposición que se observa en el gráfico (8)) Por último, es necesario destacar que se ha suprimido la representación de las ventanas y puertas del aula en esta figura. Se ha tomado esta decisión puesto que no se considera relevante para el análisis de la respuesta al impulso. Con el objetivo de que el sonido no se disipe todas las ventanas y puertas se mantuvieron cerradas durante la medición de las señales. v PC Cable Usb Interfaz de audio Cable XLR Micrófono Figura 6: Esquema de conexionado para la medición de las señales puras. La PC se conecta a la interfaz de audio mediante un cable USB. Luego, el micrófono se conecta a la placa a través de un cable XLR PC Cable Usb Interfaz de audio Cable XLR Micrófono v Cable de línea Consola de señales Cable de conexión bipolar Parlante Figura 7: Esquema de conexionado para la medición de las señales modificadas por el aula. La PC se conecta a la interfaz de audio mediante un cable USB. Luego, el micrófono se conecta a la placa a través de un cable XLR. El parlante se conecta a partir de un cable de conexión bipolar a la consola de señales, que a su vez se conecta a la interfaz de audio a través de un cable de lı́nea. Figura 8: Plano en ”vista en planta”del Aula 17 del Edificion Mario Hirsch de la Universidad de San Andrés. El punto ubicado en la anteúltima fila a mano derecha (si se mira de arriba hacia abajo) representa el micrófono. El cuadrado ubicado en la primera fila a mano izquierda representa el parlante. Los dos cuerpos ubicado en la tercera fila a mano derecha representan la consola de señales y la placa de audio 5 Experimento 2: Caracterización de fuentes Figura 9: Interior del Aula 17 del Edificion Mario Hirsch de la Universidad de San Andrés con distribución cotidiana de objetos Como señales de entrada para el sistema, se utilizaron 4 fuentes diferentes: aplausos de un solo individuo, la explosión de un globo, el choque entre 2 bloques de madera y la reproducción de un barrido frecuencial (también conocido como Sweep). Los sonidos fueron emitidos de forma natural (aplausos, explosión del globo y choque de maderas) o reproducidos desde el parlante (barrido frecuencial) desde la misma posición en la que se encuentra colocado el mismo dentro de gráfico (8) (aproximadamente a 3.3 m de la pared izquierda, 1.9 m de la pared superior y a una altura de 1.25 m). Cada señal fue grabada individualmente por el micrófono ultralineal (ubicado a 1.44 m de la pared de la izquierda, 2,10 m de la pared del fondo y a una altura aproximada de 1,1 m) bajo dos condiciones diferentes del sistema: en primer lugar el aula vacı́a de alumnos y sus mochilas y en segundo lugar el aula vacı́a de alumnos pero no de sus mochilas. Cabe aclarar que los ensayos fueron realizados alrededor del medio dı́a, con condiciones tales que la temperatura era igual a 14°C, humedad igual a el 72 % y ruido externo al sistema minimizado lo máximo posible. Resulta necesario destacar el motivo por el cual se han elegido las posiciones anteriormente mencionadas para los instrumentos. Debido a que el objetivo de la medición es estudiar cómo un sonido es modificado por el aula, se ha intentado replicar el escenario de una clase genérica al ubicar el parlante donde por lo generar se posiconarı́a un profesor y el micrófono en un lugar del aula donde podrı́a ubicarse un alumno que actuarı́a como receptos de las señales de voz emitidas por el profesor. Por otro lado, se intentó alejar el micrófono en la mayor medida posible del parlante para que la modificación realizada por el aula sobre la señal sea la más notoria posible, pero por la limitación de la extensión del cable que conectaba al micrófono solamente se ha podido posicionar en la anteúltima fila. El objetivo del segundo experimento fue estudiar las fuentes de audio ’puras’, al tratar de registrar señales que estén lo menos afectadas posible por el recinto donde fueron grabadas. Para lograr esto se realizaron dos modificaciones principales con respecto al experimento anterior. En primer lugar, todos los sonidos se realizaron al lado del micrófono, de modo que las ondas sonoras no ’viajen’ a través de todo el lugar ni se vean influenciadas por el espacio. En segundo lugar, se realizaron varias repeticiones de los mismos impulsos Con la finalidad de contar con registros de audio los mas fidedignos posibles de las señales de entrada utilizadas en los experimentos realizados anteriormente, para el segundo experimento se grabaron varios impulsos provenientes de una misma fuente (aplausos, globos, etc.). Estas capturas de audio se realizaron con los mismos equipos mencionados anteriormente y consistieron en realizar espaciados temporalmente cada uno de los sonidos (menos el barrido frecuencial) 10 veces cerca del micrófono (un punto en el cual no lograba saturarse). Las 10 repeticiones se grabaron en la misma pista de audio por cada uno de los sonidos, tratando que cada repetición sea afectada lo menos posible por ruidos externos y perturbaciones en el sistema generadas en intentos anteriores. C. Consideraciones en los experimentos Estudiar al salón de clases como sistema LTI Cabe aclarar que todos los análisis realizados en base a la información obtenida mediante la realización del Experimento 1 se hicieron considerando al salón de clases como un sistema del tipo lineal e invariante en el tiempo. En la realidad, un salón de clases no cumple plenamente con todas las caracterı́sticas de un sistema LTI debido a que no mantiene la propiedad de linealidad en la mayorı́a de los casos (la absorción y reflexión del sonido en las superficies de las paredes, el techo y el suelo, ası́ como la interacción con los objetos en el salón, como mesas y sillas pueden causar distorsión y cambios no lineales) ni la de ser invariante en el tiempo (la temperatura, humedad, nivel de ocupación del salón, disposición de mobiliario varı́an a lo largo del tiempo y modifican la respuesta del sistema). Sin embargo, se lo consideró LTI ya que su aproximación que no trae demasiados errores y simplifica las cuentas a realizar. Influencia de la temperatura y la humedad en la propagación del sonido Anteriormente se detallaron las condiciones meteorológicas presentes en el dı́a de la medición. Sin embargo, en un primer instante se podrı́a considerar que estos datos podrı́an ser irrelevantes para el análisis de la respuesta al 6 de donde se obtuvo un gráfico como el que se presenta a continuación. Amplitud impulso. Sin embargo, las caracterı́sticas del medio donde se emite un sonido definen su velocidad, las pérdidas por transmisión e incluso su dirección [1]. La velocidad del sonido queda determinada por las caracterı́sticas del aire, principalmente por su temperatura. Se suele decir que el sonido viaja a 343 m/s, sin embargo, esto es cierto sólo cuando la temperatura del aire es 20°C. Se considera que la velocidad del sonido varı́a en 0.6 m/s por cada grado centı́grado. El aire se puede considerar como un filtro pasa-bajos, es decir, absorbe altas frecuencias. Esta absorción depende en mayor medida de la humedad relativa del ambiente. Por ejemplo, un ambiente seco (20 % de humedad) genera una atenuación de -9 dB a 30m de la fuente para frecuencias en el rango de los 10kHz. Esos -9 dB se deben sumar a la atenuación que generan 30m de distancia por la ley del cuadrado inverso ( 20*log(1/30) = -29,5 dB). Por lo tanto, a 30m de distancia de la fuente y con 20 % de humedad, la atenuación será de -38,5 dB para frecuencias cercanas a los 10 kHz[2]. 0.6 0.4 0.2 0.0 0.2 0.4 0.6 0 5 10 15 20 Tiempo [s] 25 30 35 Figura 11: Ejemplo de un audio de seis globos explotando. Señal vista en el dominio del tiempo. Se logra visualizar la presencia de ruido que obligó a modificar el código utilizado para registrar impulsos para no ser detectado como la explosión de otros globos Aplicación de un filtro inverso Lo que interesa obtener para ambos experimentos son impulsos (como un aplauso, un golpe de maderas, etc.). Por este motivo, se tomó un barrido frecuencial y se lo convolucionó con un filtro inverso, de donde se obtuvo un impulso parecido a una delta en el dominio del tiempo. Si bien esto no se ha demostrado, en unas secciones más adelante sı́ se hará. Luego, fue necesario poder separar las señales en varios impulsos individuales para poder analizarlos de manera más especı́fica. Para eso se utilizó la función f ind peaks de SciPy, que sirvió para detectar los valores más altos alcanzados por la señal y de esa manera poder recortar los impulsos al tomar una cierta cantidad de muestras hacia atrás de los picos y hacia adelante. A continuación se mostrará un gráfico en amplitud del filtro inverso del sweep: Filtro Inverso 0.8 0.6 Amplitud Amplitud 0.4 0.2 0.0 0.2 0.4 0.6 0.8 0 1 2 3 Tiempo (en s) 4 5 0.6 0.4 0.2 0.0 0.2 0.4 0.6 0.0 0.1 0.2 0.3 0.4 Tiempo [s] 0.5 0.6 0.7 6 Figura 10: Gráfico de la amplitud del filtro inverso del sweep a lo largo del tiempo (medido en segundos). Figura 12: Ejemplo de un impulso individual correspondiente a un globo explotado. Señal en el dominio del tiempo Recorte de las muestras utilizadas Una parte fundamental del desarrollo de los experimentos consistió en el procesamiento de los datos obtenidos con los aparatos anteriormente descriptos. Una vez obtenidos los audios que contenı́an varias repeticiones de un mismo sonido (un audio con varios aplausos, por ejemplo) se procedió a analizar gráficamente cómo se veı́a esa señal, Luego, se procedió a analizar cada impulso en el dominio de la frecuencia, por lo que se aplicó la transformada de Fourier descripta en la ecuación 2. La cantidad máxima de hertz representada fue 22050 debido a que, si se recuerda el teorema de Nyquist - Shannon [3], no se puede reconstruir componentes frecuenciales superiores a la mitad de la frecuencia de muestreo de un audio. 7 10 40 20 0 10 + 20 Amplitud [dB] Amplitud [dB] Magnitud|Y(f)| 60 30 40 50 60 5000 10000 15000 Frecuencia [Hz] 5000 20000 10000 15000 Frecuencia [Hz] 100 200 Amplitud [dB] Amplitud [dB] 60 0 5000 10000 15000 Frecuencia [Hz] 20 40 60 80 20000 + 100 200 (a) 20000 (b) 0 + 10 Amplitud [dB] Amplitud [dB] 500 1000 2000 5000 Frecuencia [Hz] Figura 15: 20 aplausos. (a) tiene ejes en escala lineal. (b) tiene eje X en escala logarı́tmica y eje Y en escala lineal 0 20 30 40 50 10 + 20 30 40 50 0 A continuación se procederá a mostrar los resultados a partir del Experimento 2. Antes de mostrar las figuras, resulta necesario hacer una recapitulación de cómo se procesaron los datos. En primer lugar, se ’cortaron’ los audios para tener los impulsos por separado. En segundo lugar se llevó cada impulso al dominio de Fourier. Luego, se calculó una señal modelo a partir de calcular la media de todos los impulsos y también se obtuvieron los desvı́os. Posteriormente se modificaron los impulsos de modo que fuera posible representarlos a partir de la unidad decibeles, como se ha explicado previamente. Luego, la señal media, la señal + desvı́o y la señal - desvı́o se normalizaron al restarle a cada señal el máximo de la media. Por último, se ha utilizado un método llamado Rolling(k), que calcula el promedio móvil con una ventana de tamaño k. Cada punto en la serie de rolling es el promedio de los cinco puntos anteriores en la serie original. Esto tiene el efecto de suavizar la serie y resaltar tendencias a largo plazo. Para más información sobre este método se recomienda leer la documentación de la librerı́a Pandas. Para este caso particular se ha aplicado un rolling a cada curva con k = 50. 20000 0 + Análisis de resultados Aplausos, globos y maderas 500 1000 2000 5000 Frecuencia [Hz] (b) 40 En esta sección se analizará bajo diferentes perspectivas y se compararan los resultados obtenidos tras llevar a cabo los pasos descriptos en la sección desarrollo experimental (III). 1. 20000 20 80 Caracterización de fuentes 50 Figura 14: 15 globos. (a) tiene ejes en escala lineal. (b) tiene eje X en escala logarı́tmica y eje Y en escala lineal 0 De esta manera, una vez recortados todos los impulsos, fue posible calcular un impulso promedio y un desvı́o estándar asociado con el objetivo de crear ’señales modelo’ y trabajar en base a ellas. A. 40 (a) Figura 13: Ejemplo de un impulso individual correspondiente a un globo explotado. Señal en el dominio de la frecuencia IV. 30 60 0 0 + 20 5000 10000 15000 Frecuencia [Hz] (a) 20000 100 200 500 1000 2000 5000 Frecuencia [Hz] (b) Figura 16: 20 maderas. (a) tiene ejes en escala lineal. (b) tiene eje X en escala logarı́tmica y eje Y en escala lineal En primer lugar, resulta necesario destacar que todos los gráficos en escala lineal presentan una estructura similar. En todos ellos es posible dilucidar una suba considerable de energı́a (en forma de pico) para los primeros 1000 hertz (aproximadamente). Luego, en todos se ve un decaimiento lineal. Si bien este decaimiento no tiene exactamente la misma pendiente para todos, es posible reconocer que, a groso modo, se trata de una recta decreciente que comienza cerca de los 5000 hertz y culmina cerca de los 20000 hertz y en todo este trayecto se pierden aproximadamente 20 decibeles de energı́a. Por otro lado, también resulta necesario destacar que, luego de los 20000 hertz, la energı́a comienza a perderse de manera mucho más drástica, hasta llegar al máximo de 22050 hertz. Asimismo, resulta necesario aclarar que, a la hora de analizar los resultados, se recomienda hacer más énfasis 20000 8 1.0 0.8 0.8 Magnitud|Y(f)| Magnitud|Y(f)| o poner más atención en las curvas correspondientes a la media y a la media + desvı́o. En ciertos puntos, la curva de media - desvı́o no estuvo definida debido a que contenı́a valores negativos que, a la hora de aplicarles el logaritmo para obtener los decibeles, no fue posible evaluarlos. De esta manera, fue necesario realizar una interpolación sobre los puntos que sı́ pudieron evaluarse y por este motivo se recomienda analizar en más detalle las otras dos curvas. Por otra parte, resulta relevante destacar que los gráficos en escala lineal presentan una especie de ’meseta’ en algún intervalo dentro de todo el rango de frecuencias y que es más sencillo dilucidar en los gráficos con el eje X en escala logarı́tmica. Esta meseta se presenta para los globos entre 200 y 2000 hertz, para los aplausos entre 500 y 2000 hertz y para las maderas entre 2000 y 5000 hertz. En otro orden de ideas, resulta necesario mencionar que, antes de realizar el experimento, se supuso que el impulso que mayor desvı́o iba a presentar iba a ser el de los globos. Se creyó que, debido a que al explotar un globo entran en juego una mayor cantidad de variables sin regular (como la cantidad de aire que contenı́a cada globo, la zona donde fue pinchado, hacia dónde se escapó el aire y la goma del globo, entre otras), las mediciones podrı́an variar significativamente. Sin embargo, al ver los gráficos es posible ver que las diferencias más sustanciales las presentan los aplausos, en segundo lugar las maderas y en tercer lugar los globos. 0.6 0.4 0.2 0.0 0 5000 10000 15000 Frecuencia [Hz] 0.6 0.4 0.2 0.0 20000 0 5000 (a) 10000 15000 Frecuencia [Hz] 20000 (b) Figura 18: En (a) el espectro del filtro inverso, en (b) el del sine sweep Es posible observar que las transformadas de ambas señales parecieran ser en algún sentido ’opuestas’ o ’inversas’, mientras una tiene pendiente positiva, la otra tiene negativa. Las irregularidades que se presentan para frecuencias muy bajas (menores a 20 hz y mayores a 20000 hz) no se deben tener en cuenta, pues solamente dentro de este rango es que el oı́do humano puede percibir el sonido. Luego, una vez que se aplica la operación de convolución a las señales en tiempo (o multiplicación en frecuencia) se obtiene el siguiente resultado 1.0 Anteriormente se presentó el gráfico del filtro inverso para el dominio del tiempo. Ahora se presenta el gráfico del barrido frecuencial en el mismo dominio. 0.8 Magnitud|Y(f)| Sine sweep Amplitud 2. 15000 12500 10000 7500 5000 2500 0 Amplitud 0 0.75 0.50 0.25 0.00 0.25 0.50 0.75 2 4 6 8 10 Tiempo [s] 12 14 16 0.6 0.4 0.2 0.0 0 5000 (a) 10000 15000 Frecuencia [Hz] (b) Figura 19: En (a) el resultado de la convolución en tiempo, en (b) está en frecuencia 0 1 2 3 4 5 Tiempo [s] 6 7 8 Figura 17: Barrido frecuencial en dominio de tiempo. Si bien podrı́a parecer un cuadrado uniforme, si se observa detenidamente es posible ver que, al principio de la grabación, las ondas se repiten cada un intervalo de tiempo mayor y, a medida que pasa el tiempo (y el audio se vuelve más agudo), las ondas comienzan a repetirse en menos tiempo. A continuación se muestra la forma de la transformada de Fourier tanto para el filtro inverso como para el sine sweep Tal como se puede observar, el resultado obtenido en tiempo es un impulso que, a diferencia del resto de fuentes (aplausos, globos, etc.), tiene una similitud más significativa con lo conocida como ’delta’. Tal como se ha estudiado en la cátedra, la transformada de una delta es una constante, tal como se ve en el gráfico (b). B. Respuestas al impulso Tomando en cuenta lo mencionado en la explicación del Experimento 1 (III B) se explicarán los resultados obtenidos junto con un análisis para cada tipo de señal. 20000 9 Comparación de espectros de las respuestas al impulso (con y sin objetos en el aula) En los siguientes gráficos se mostrará la comparación entre el promedio de los valores absolutos de las Trasformadas de Fourier (2) convertidos a decibeles (3) tomando como valor de referencia el máximo valor que se obtuvo de cada promedio de las transformadas (2) para la respuesta al impulso de cada tipo de señal (explicadas en la sección Experimento 1: Respuesta al impulso de un salón de clases) analizando el caso de con y sin mochilas en el recinto (en este caso el aula representada en el esquema (8)): 2 Aplausos con mochilas Aplausos sin mochilas 4 Magnitud (dB) 6 Magnitud (dB) En este punto se mostrará como varia el espectro entre los diferentes tipos de impulsos (ya sea producidos por los aplausos, la explosión de los globos, el choque de las maderas y el sweep) medidos en el aula (representada en el esquema (8)) analizando los casos con o sin mochilas. Para hacer esto, se restringió el rango en el cual se tomaban valores de la señal con el propósito de usar las muestras que más información tenı́an (mejor explicado en la sección ’Recorte de las muestras utilizadas’ (III C)) para los siguientes análisis. golpe de maderas con mochilas golpe de maderas sin mochilas 5 10 15 20 25 0 2500 5000 7500 10000 12500 Frecuencia (Hz) 15000 17500 20000 Figura 22: Gráfico de la comparación entre espectros de la señal producida por el choque entre las maderas en el aula (8) con mochilas (curva ja) y sin mochilas (curva azul) a la vez que el eje x representa los niveles de frecuencias. 10 20 Magnitud (dB) 1. 30 40 50 60 0 sweep con mochilas sweep sin mochilas 5000 10000 Frecuencia (Hz) 15000 20000 Figura 23: Gráfico de la comparación entre espectros del sweep aplicado el filtro inverso (III C) producido con mochilas (curva roja) y sin mochilas (curva azul) a la vez que el eje x representa los niveles de frecuencias. 8 10 12 14 16 18 0 2500 5000 7500 10000 12500 Frecuencia (Hz) 15000 17500 20000 Figura 20: Gráfico de la comparación entre las magnitudes del promedio de los valores de las Trasformadas de Fourier de los impulsos producidos por los aplausos, mostrando el caso con mochilas (curva roja) y sin mochilas (curva azul) tomando como eje x las frecuencias y como eje y el valor de las magnitudes (representando los decibeles). 2.5 Explosión globos con mochilas Explosión globos sin mochilas 5.0 Magnitud (dB) 7.5 10.0 12.5 15.0 17.5 20.0 22.5 0 2500 5000 7500 10000 12500 Frecuencia (Hz) 15000 17500 20000 Figura 21: Gráfico de la comparación entre espectros de la señal producida por la explosión de los globos en el aula (8) con mochilas (curva roja) y sin mochilas (curva azul) a la vez que el eje x representa los niveles de frecuencias. Al analizar las figuras previamente obtenidas se puede apreciar como en algunos casos la cantidad de decibeles (obtenidos tras calcular el valor absoluto del promedio de las Trasformadas de Fourier (2)) de las señales producidas sin mochilas es menor que las obtenidas con mochilas (como el caso de las figuras (20) y (23)). Esto resulta contrario a lo esperado por los autores del informe. Se esperaba que los resultados fueran al revés (tal como ocurre en la figura (20)) al haber efectos de absorción de energı́a por parte de las mochilas en cada respuesta al impulso (al viajar las ondas sonoras de cada señal desde una posición en especifico hasta el micrófono amortiguando ası́ el sonido). Entre las principales suposiciones sobre este fenómeno se encuentra la utilización de un parlante sin un espectro plano (al no ser un parlante de medición), razón por la que la respuesta del mismo no será uniforme a todas las frecuencias. En otras palabras, el resultado obtenido tendrá tanto realces (amplifica la intensidad de las frecuencias por lo que habrá más energı́a) como atenuaciones (reducción de la intensidad de las frecuencias por lo que habrá menos energı́a). De esta manera, se puede concluir que la hipótesis que se tenia de un efecto determı́nate por parte de las mochilas en las respuestas de cada señal no era correcta, sobrestimando ası́ su influencia (ya sea por el pequeño tamaño de los mismos o por su cantidad). 10 Por otro lado, si se observa el gráfico (22) se puede ver como en bajas frecuencias la energı́a obtenida por parte de la respuesta al impulso de la señal grabada sin mochilas es menor a la que si tiene mochilas mientras que para medias y altas frecuencias los valores obtenidos son muchos más parecidos que los gráficos (21) y (23) llegando en algunos casos a ser más baja la energı́a para el caso con mochilas (por ejemplo entre 13750 Hz y 14500 Hz). ción tras aplicar los pasos descriptos en Experimento 1: Respuesta al impulso de un salón de clases) y la amplitud del sweep aplicado el filtro inverso en la señal (según lo explicado en Aplicación de un filtro inverso (III C)) 150 Sweep original con mochilas 0.2 2. Comparación de las amplitudes del sweep original y aplicado el filtro En los siguientes gráficos se mostrará la comparación entre la amplitud original del sweep (obtenido en la medi- Amplitud de la señal Amplitud señal 0.0 0.1 50 0 50 100 150 0.2 Sweep aplicado el filtro con mochilas 0 2 4 6 Tiempo (en s) 8 10 9.2 9.3 9.4 9.5 9.6 Tiempo (en s) 9.7 9.8 Figura 24: Gráfico de la amplitud del sweep original obtenido en la medición (el de color amarillo) vs Gráfico de la amplitud del sweep aplicado el filtro inverso en la señal (el de color verde), ambos considerando el efecto de las mochilas. Como eje x se tomo el tiempo medido en segundos mientras que el eje y representa el valor de la amplitud de la señal Sweep original sin mochilas Sweep aplicado el filtro sin mochilas 0.3 100 0.2 50 Amplitud de la señal Tomando en cuenta los resultados obtenidos en el apartado Caracterización de fuentes en las cuales se representan las energı́as producidas por las fuentes para distintos rangos de frecuencias, se puede ver como en el gráfico de la explosión de globos (19a) los picos de energı́a, al igual que en la figura (21) (tanto para el caso con y sin mochilas), se encuentran en bajas frecuencias (entre 0 y 300 Hz) mientras que para altas frecuencias es donde más se atenúa la señal. A su vez, al analizar los aplausos (19b), se ve como la energı́a se presenta en el rango de frecuencia entre 2000 y 2300 Hz, parecido en lo que ocurre en la respuesta al impulso del mismo tipo de señal (20). Este patrón también se repite para el caso de la señal producida por el choque de las maderas (comparando los gráficos (19b) y (19) con la respuesta al impulso (22)), al encontrarse tanto los valores altos como los bajos de las energı́as en rangos parecidos. De esta forma, se puede concluir como en la mayor parte de los casos, tanto en el primer como en el segundo experimento los resultados obtenidos en frecuencia son parecidos (al darse los picos de energı́a en rangos de frecuencias parecidos). 100 0.1 Amplitud señal Al analizar con más detalle el gráfico (20) se ve (según lo anteriormente mencionado) como es el que más se ajusta a lo que idealmente se esperaba (a pesar de que no se trate del efecto de las mochilas sino más del parecido de los espectros). A su vez, queda reflejado como en bajas frecuencias (entre 1250 Hz y 3000 Hz) la diferencia entre los valores obtenidos de las energı́a (con y sin objetos) es mucho más grande (llegando a ser la diferencia de 7 decibeles) que en otros rangos de frecuencias. Por otro lado, si se toma en cuenta los gráficos previamente obtenidos y se los analiza en el rango de frecuencia que normalmente se encuentra la voz de un ser humano (entre 500 y 3500 Hz según el articulo [4]) se puede apreciar como en la mayor parte de los casos la energı́a obtenida en este intervalo es alta (o no se atenúa tanto como en otros casos). Esto ocurre debido a las caracterı́sticas del mismo aula (8) como su forma, su tamaño, los materiales de construcción utilizados volviéndola un lugar ideal para dar clases (al ser los rangos de baja frecuencia en donde mejor se representa la energı́a). 0.1 0.0 0.1 0 50 100 0.2 150 0.3 0 2 4 6 Tiempo (en s) 8 10 200 9.2 9.3 9.4 9.5 9.6 Tiempo (en s) 9.7 9.8 Figura 25: Gráfico de la amplitud del sweep original obtenido en la medición (el de color amarillo) vs Gráfico de la amplitud del sweep aplicado el filtro inverso en la señal (el de color verde), ambos sin considerar el efecto de las mochilas. Como eje x se tomo el tiempo medido en segundos mientras que el eje y representa el valor de la amplitud de la señal Tanto en el gráfico (24) como en el (25) se aprecia la distorsión de la señal original del sweep obtenido en la medición. Entre las principales causas de este hecho se encuentra las caracaterı́sticas que poseı́a el entorno a la hora de ser grabado. Al reproducirse el barrido frecuencial en un aula (8) el sonido tuvo que reflejarse varias veces antes de disiparse creando ası́ un efecto de persistencia del mismo conocido como Reverberación (mencionado en el artı́culo 11 [5] en el cual se habla de la Reverberación del sonido). Otra razón de este hecho se debe a la utilización de un parlante no ideal (detallado el la imagen (5)) debido a que posee una frecuencia propia (siendo también responsable del resultado llegado en el apartado Comparación de espectros de las respuestas al impulso (con y sin objetos en el aula)), en otras palabras, no posee un espectro plano (la respuesta no es constante para todas las frecuencias dentro del rango auditivo de un ser humano). Al analizar la señal obtenida en los gráficos previamente mencionados tras aplicar el filtro inverso (representado en amplitud por la figura (10)) se ve (en amplitud) las correcciones de las distorsiones del barrido frecuencial original tanto para el caso del sweep grabado con objetos (24) y el de sin objetos (25). A su vez, con el propósito de comparar de mejor manera la evolución de las amplitudes obtenidas en ambos casos (tras aplicar el filtro), se realizó el siguiente gráfico: 10.0 Sweep aplicado el filtro (con mochilas) 10 7.5 Amplitud de la señal Amplitud señal 5.0 2.5 0.0 2.5 5.0 7.5 10.0 9.50 Sweep aplicado el filtro (sin mochilas) 5 9.54 9.56 Tiempo (en s) 9.58 9.60 5 9.50 9.52 9.54 9.56 Tiempo (en s) 9.58 9.60 Figura 26: Gráfico de las amplitudes del sweep aplicado el filtro tomando el caso con mochilas y sin mochilas . En la figura (26) queda en evidencia como en el caso del sweep aplicado el filtro inverso sin la presencia de objetos la amplitud es mayor que el caso sin objetos en los mismos instantes de tiempo. Ahora bien, a pesar del efecto de absorción que idealmente tienen las mochilas, se habı́a llegado previamente en el apartado Comparación de las amplitudes del sweep original y aplicado el filtro a la conclusión de que el efecto de estos objetos en el presente experimento no era tan determinante como se esperaba. Aún ası́, al observar el gráfico previamente obtenido (26) se puede decir como este efecto si se encuentra presente a pesar de tener una implicancia tan baja (al ser chica la diferencia de amplitudes en el mismo tiempo). C. 1. Descripción de los recintos Los 13 recintos, cuyas respuestas al impulso fueron comparadas con la obtenida de las experimentaciones realizadas en el Aula 17 del Edificion Mario Hirsch de la Universidad de San Andrés, son los siguientes: Cancha de tenis (sin techo): Cancha de tenis al descubierto ubicada en el Falkland Palace en Fife, Escocia. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec S30D y captado por un micrófono de campo sonoro SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue de 10,76 m, la altura de la fuente fue de 1,5 m y la altura del receptor fue de 1.5 m. 0 10 9.52 poder determinar el grado de similitud entre las respuestas al impulso de diferentes recintos. Por medio de la utilización de la misma, se buscará determinar dentro de un grupo de 13 ambientes diferentes cuales son los que se comparan de forma parecida a un salón de clases (en particular el Aula 17 que previamente se analizó) y a que factores se debe cada determinado grado de similitud. Comparación entre respuestas al impulso de diferentes recintos En la siguiente sección se procederá a analizar una métrica elaborada con la finalidad de conseguir una forma de Interior de una mina: Mina en desuso encontrada cerca de Trollers Gill, Inglaterra llamada Gill Heads Mine. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz y tanto la distancia fuente-receptor como la altura de los mismo se desconoce. Túnel ferroviario: Túnel ferroviario St Leonards ubicado al sureste del centro de Edimburgo, cerca de Arthur’s Seat. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 5 m y 10 m, la altura de la fuente y el receptor fue 1.5 m y la temperatura durante de medición fue 17°C. Bosque (en verano): Bosque del Parque Nacional Koli en Finlandia a mediados del verano. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 7.2 m, 9 m y 11 m, la altura de la fuente y el receptor fue 1.5 m y la temperatura durante de medición fue 13°C. 12 y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue 8.86 m la altura de la fuente y receptor fueron 1.5 m y la temperatura fue 13°C. Bosque (en invierno): Bosque del Parque Nacional Koli en Finlandia a mediados del invierno. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 7.2 m, 9 m y 11 m, la altura de la fuente y el receptor fue 1.5 m y la temperatura durante de medición fue -1.5°C. Valle con colinas: Desfiladero de piedra caliza conocido como Troller’s Gill en los valles de Yorkshire, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, la distancia fuente-receptor tomada fue 5.5 m y la altura de la fuente y el receptor fue 1.5 m. Reactor Nuclear: Reactor Nuclear R1 ubicado a 25 metros debajo del KTH Royal Institute of Technology, cerca de Estocolmo, Suecia. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor tomada fue de 14.88 m y la altura de la fuente y el receptor fue 1.5 m. Monumento: Monumento creado para Onesipherous Tyndall Bruce en Malvinas, Argentina. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante desconocido y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue 2.3 m y la altura de la fuente y receptor fueron 1.5 m. Iglesia: El Santuario e iglesia parroquial de Todos los Santos está situado en la calle Norte, cerca del rı́o Ouse, Ingleterra. Cuenta con 28.4 m de largo y 14 m de ancho. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8030 y captado por un micrófono Soundfield SPS422B. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 4.5 m, 5.2 m y 13.45 m, la altura de la fuente fue 1.5 m, la del receptor fue 1.3 m y la temperatura durante de medición fue 15°C. Usina del Arte: La Usina del Arte es un centro cultural y sala de espectáculos que ocupa el edificio de la vieja Usina Don Pedro de Mendoza en el barrio de La Boca, Buenos Aires. Las mediciones se realizaron el 2 de junio de 2014 entre las 9:00 y las 18:00 h. El ruido de fondo se midió con el sonómetro al comienzo del experimento en 10 puntos fı́sicos dentro de la habitación en modo lento con un intervalo de integración de 30 segundos. Para obtener las respuestas impulsivas de la sala se generó un barrido sinusoidal logarı́tmico (Sweep) de 50 segundos de 40 Hz a 16 kHz a una frecuencia de muestreo de 16 bits 48 kHz y su filtro inverso para reproducción, grabación y posterior deconvolución y post-procesando. Se utilizó para las mediciones un micrófono Earthworks M50, la frecuencia de muestreo de la grabación fue de 48 kHz y tanto la distancia fuente-receptor como la altura de la fuente y receptor son desconocidas. Polideportivo: Pabellón deportivo del polideportivo de la Universidad de York, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante desconocido y captado por un micrófono desconocido. La frecuencia de muestreo de la grabación fue de 96 kHz y la distancia fuente-receptor y altura de la fuente y receptor desconocidas. Almacén vacı́o: Almacén vacı́o dentro de la fábrica de chocolate y confiterı́a Terry’s en York, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante desconocido y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue 28.35 m, la altura de la fuente y receptor fueron 1.5 m y la temperatura fue 16°C. Sala de mecanografı́a: Sala de mecanografı́a dividida dentro de la fábrica de chocolate y confiterı́a Terry’s en York, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante desconocido 2. Métrica de comparación implementada y condiciones para el análisis A grandes rasgos, la métrica seleccionada consiste en el calculo del error cuadrático medio (MSE) entre las respuestas al impulso en el dominio de la frecuencia de cada recinto dentro de 3 rangos frecuenciales diferentes. La selección del MSE como medio para cuantificar la diferencia entre respuestas se justifica en su caracterı́stica de penaliza de manera significativa los errores grandes debido al cuadrado en la fórmula, lo que lo hace sensible a la grandes diferencias presentes. También fue elegido el dominio de la frecuencia como 13 región de análisis debido a que es más fácil identificar y comparar caracterı́sticas acústicas especı́ficas de como resonancias, atenuaciones, amplificación, reverberación, etc. Por otra parte, cabe aclarar que las respuestas frecuenciales de cada sistema se obtuvieron aplicando la transformada rápida de Fourier (FFT) sobre la respuestas al impulso en el dominio del tiempo de cada recinto. A cada respuesta temporal se le realizo un recorte temporal especifico con la finalidad solo contar con el registro de la información mas relevante de cada localidad. A su vez, cada recorte temporal contó con la misma duración, cuyo valor buscó ser lo suficientemente amplio como para que cada señal logre brindar toda la información relevante contenida (la extinción temporal que se considero mas acertado para estos experimentos en particular fue de 0.5 segundos). Una vez realizadas todas estas modificaciones pertinentes, se aplicaba la FFT sobre las respuestas temporales para obtener cada respuesta frecuencial en particular. Al ya contar con cada respuesta frecuencial, se procedió a restringir las mismas dentro de un rango de 20 Hz a 20 kHz, el cual es el rango de frecuencia auditiva humana y el principal motivo por el que se realiza este corte (no resulta de interés analizar el efecto que produce el sistema sobre el sonido dentro de registros nos perceptibles por las persona). A esta rango frecuencial seleccionado lo dividimos en sus tres estancias: frecuencia baja (20 Hz a 200 Hz), la cual está asociada con tonos graves y sonidos profundos, frecuencia media (200 Hz a 2 kHz), la cual es fundamental para la percepción de la claridad y la presencia en muchos sonidos como la voz humana y la frecuencia alta (2 kHz a 20 kHz), la cual se relaciona con tonos agudos y sonidos brillantes. La justificación detrás de estas partición particular se encuentra en que estas distinciones permiten proporcionar información mas detallada sobre la influencia del sistema sobre las diferentes componentes de la señales de sonido (alteración por presión acústica de las bajas frecuencias, reflexiones y reverberación sobre las medias, atenuación por absorción de las altas, entre otros). Como ultimas aclaraciones, cabe exponer que las comparaciones entre los recintos y el salón de clases se hicieron solamente teniendo en cuenta la respuesta al Sweep del mismo, tanto con mochilas como sin mochilas. La elección de solo utilizar las respuestas al barrido frecuencial se basa en que el mismo fue la señal de entrada del resto de los recintos analizados, por lo que una comparación con las respuestas sobre los aplausos, globos o maderas no brindarı́an información tan significativa o fácil de analizar. A su vez, se mantuvo la distinción entre el ambiente vació de objetos y lleno de objetos debido a que el análisis del recinto vació brinda la posibilidad de obtener comparaciones con la forma ideal del sistema mientras que el ambiente con objetos proporciona comparaciones con el estado habitual del sistema. Finalmente, también se decidió que aquellos recintos que contaran con una mayor cantidad de grabaciones se diferenciarı́an entre si (la distancia entre fuente y receptor de la señal era diferente), lo cual tiene como propósito permitir la visualización de los efectos provocados por distintas distancias de grabación (reverberación, reflexiones, saturación, etc). 3. Resultados y Análisis A continuación, se presentan los datos de la métrica aplicada entre todos los recintos y el salón de clases con mochilas. Recintos Cancha de tenis Interior de mina Túnel ferrov. (5 m) Túnel ferrov. (10 m) Bosque (ver.) (7.2 m) Bosque (ver.) (9 m) Bosque (ver.) (11 m) Bosque (inv.) (7.2 m) Bosque (inv.) (9 m) Bosque (inv.) (11 m) Reactor Nuclear Iglesia (4.5 m) Iglesia (5.2 m) Iglesia (13.45 m) Polideportivo Almacén Vacı́o Sala de mecanografı́a Valle con colinas Monumento Usina del Arte LF 0.076 0.071 0.069 0.067 0.112 0.065 0.092 0.121 0.168 0.140 0.064 0.094 0.053 0.057 0.078 0.082 0.078 0.102 0.092 0.062 MF 0.049 0.062 0.052 0.047 0.049 0.048 0.109 0.140 0.198 0.152 0.025 0.043 0.031 0.030 0.057 0.056 0.065 0.066 0.068 0.026 HF 0.026 0.056 0.033 0.033 0.034 0.038 0.035 0.070 0.080 0.065 0.026 0.034 0.134 0.035 0.034 0.027 0.023 0.086 0.033 0.032 Tabla I: Error Cuadrático Medio (MSE) entre las respuestas en frecuencia de los diferentes recintos y el salón de clases (Aula 17 ) con mochilas en frecuencia baja LF (20 Hz a 200 Hz), media MF (200 Hz a 2 kHz) y alta HF (2 kHz a 20 kHz). Como se puede observar en la tabla, en promedio el recinto que responde al barrido sinusoidal de forma mas parecida al salón de clases es la Iglesia, especı́ficamente a la mayor distancia de grabación posible (13.45 m). Hace sentido que ambas respuestas resulten tan parecidas debido a la alta similitud que tiene la construcción acústica de ambos recintos. En primer lugar, ambos lugares tienden a ser espacios con un volumen significativo y constituidos por superficies reflectantes (paredes, techos y suelos), lo cual produce que el sonido pueda propagarse con mayor facilidad y mas distancia a la vez que se produce reverberación prolongada y resonancia especifica de las frecuencias medias en el ambiente, lo cual es buscado para conseguir que la voz del orador presente en el recinto pueda ser escuchada por todas las personas que allı́ se encuentran con la mayor claridad posible (que el error mas bajo de las comparaciones se de en frecuencias 14 medias no es una casualidad sino que es producto de la búsqueda de ambos recintos por enaltecer las frecuencias medias). Ahora hablando sobre las diferencias entre ambos recintos, la mas significativa la podemos encontrar a la hora de estudiar sus respuestas en baja frecuencia (donde encontramos la mayor grado de error entre ambas). Esto se debe a que en las iglesia es muy buscada la reverberación y amplificación de las frecuencias bajas debido a que también se prioriza que el sonido emitido por los instrumentos (los cuales rondan las frecuencias bajas y medias) sea escuchado con la mayor claridad posible por el publico presente a diferencia de un salón de clases, el cual busca que estas frecuencias se atosiguen por medio de su absorción atreves del mobiliario o los materiales de construcción que componen al ambiente. Recintos Cancha de tenis Interior de mina Túnel ferrov. (5 m) Túnel ferrov. (10 m) Bosque (ver.) (7.2 m) Bosque (ver.) (9 m) Bosque (ver.) (11 m) Bosque (inv.) (7.2 m) Bosque (inv.) (9 m) Bosque (inv.) (11 m) Reactor Nuclear Iglesia (4.5 m) Iglesia (5.2 m) Iglesia (13.45 m) Polideportivo Almacén Vacı́o Sala de mecanografı́a Valle con colinas Monumento Usina del Arte LF 0.075 0.066 0.072 0.069 0.115 0.069 0.087 0.114 0.151 0.126 0.066 0.085 0.184 0.057 0.073 0.075 0.077 0.101 0.087 0.060 MF 0.047 0.057 0.051 0.045 0.048 0.045 0.100 0.129 0.394 0.332 0.121 0.154 0.132 0.134 0.178 0.178 0.193 0.183 0.205 0.126 HF 0.016 0.050 0.013 0.015 0.018 0.118 0.114 0.197 0.213 0.185 0.068 0.072 0.074 0.074 0.088 0.062 0.077 0.215 0.182 0.074 Tabla II: Error Cuadrático Medio (MSE) entre las respuestas en frecuencia de los diferentes recintos y el salón de clases (Aula 17 ) sin mochilas en frecuencia baja LF (20 Hz a 200 Hz), media MF (200 Hz a 2 kHz) y alta HF (2 kHz a 20 kHz). Por otra parte, se puede dilucidar que las regiones con mayor error son los bosques (tanto las grabaciones hechas en verano como la hechas en inviernos). Esto también se justifica en base a la constitución acústica de ambos lugares. Mientras un salón de clases busca amplificar las frecuencias medias y reducir las bajas y altas a partir de su composición estructural, un bosque no es capaz de absorber de sobre manera ninguna de las frecuencias por medio de los objetos que componen el entorno (arboles, piedras, arbustos, etc) a la vez que al no ser una ambiente cerrado es incapaz de generar una efecto significativo de reverberación y reflexión, lo que genera que el sonido se desperece rápidamente y no pueda alcanzar grandes distancias. En comparación con lo analizado en el caso anterior, se puede encontrar que la tendencia de que aquellos lugares mas cerrados como lo son la iglesia, la Usina del Arte o el interior de la mina siguen siendo los lugares que en promedio cuentan con menor error mientras que los lugares mas abiertos como el bosque o el valle con colinas presentan un mayor grado de error. El cambio mas significativo que se puede encontrar es el gran aumentos de error que sufren todos los recintos principalmente en frecuencia media. Esta cambio pudo haberse producido debido a la presencia de una mayor cantidad de energı́a general dentro de la respuestas del salón sin mochilas en comparación con el salón con presencia de mochilas. V. A continuación, se presentan los datos de la métrica aplicada entre todos los recintos y el salón de clases sin mochilas. Conclusiones En relación con el análisis de las caracterı́sticas de las fuentes, los resultados de mayor relevancia que se presentaron fueron los que se detallan a continuación. En primer lugar, se mostró que todos los impulsos, el de globos, el de aplausos y el de maderas poseen la misma estructura general. Un pico al comienzo cerca de los 1000 hertz, una decrecimiento lineal común hasta 20000 hertz y una caı́da drástica para mayores frecuencias. Ası́mismo, se observó la presencia de una ’meseta’ o nivel de decibeles constante que se repitió para las tres fuentes, pero para distintos valores de frecuencias. Asimismo, se refutó con la evidencia empı́rica lo que en un principio se suposo sobre la fuente que presentarı́a más desvı́o. Mientras se creyó que los globos contendrı́an mayor incerteza, los da- 15 tos indicaron que quien presentó resultados más variados fueron los aplausos. Por último, se estudió y demostró cómo, a partir de la convolución con un filtro inverso, se transformó un sine sweep en un impulso similar a una delta. cuencia son parecidos, al dar valores de la energı́a muy similares en ambos casos. A su vez, se observó el barrido frecuencia (obtenido en la medición) viendo su amplitud encontrando como la señal de origen se encontraba distorsionada, razón por la que se tuvo que aplicar un filtro inverso logrando ası́ corregir las distorsiones. Con lo que respecta al análisis de las respuestas al impulso para los diferentes tipos de señales, tomando el caso de la grabación de las muestras con y sin mochilas en el aula (8), se concluyó como el efecto de absorción de la energı́a que ejercı́an tanto las mochilas como las camperas era poco determinante a la hora de comparar espectros entre cada respuesta de cada señal (contrastando la energı́a medida en decibeles (3)). Seguido a esto, se analizó la eficacia del aula (9) para la reproducción de los sonidos de la voz humando (tomando en cuenta el modelo de medición armado (8)) llegando a que se trata de un buen lugar para dar clases (al no atenuarse tanto la energı́a en los intervalos de baja frecuencia como si en los rangos de media y alta). Por otro lado, se realizó una comparación entre espectros de los resultados obtenidos tanto del primer experimento (analizando las fuentes de las señales) como del segundo (estudiando las respuestas al impulso del mismo tipo de señales) llegando a la conclusión de como en ambos casos los resultados obtenidos en fre- Dentro de lo que abarcó el análisis y comparación de la respuesta al impulso de los diferentes recintos, se logró concluir que la métrica propuesta resulto ser de gran utilidad a la hora de realizar las comparaciones debido a su gran impacto sobre los errores grandes y la profundidad de análisis que permite el analizar el impacto de los sistemas en 3 regiones de frecuencias diferentes. En base a los resultados, se pudo determinar que el recinto mas parecido al salón de clases Aula 17 es la iglesia, a la vez que aquellos recintos que eran mas cerrados y que presentan mayor capacidad de reverberación y reflexión como el interior de una mina o la Usina del arte también conseguı́an buenas métricas de error. Por otra parte, se llegó a la conclusión de que el recinto menos parecido al salón de clases era el bosque, que al igual que otros sistemas como el valle, debe sus mala puntuación a la propiedad de ser un ambiente muy abierto y, en consecuencia, con poca capacidad de reflexión o reverberación. [1] B. y Kjaer, Cómo afecta la meteorologı́a a las medidas de ruido ambiental (2001). [2] Sonido, temperatura y humedad (2015). [3] Explicación del teorema de muestreo de nyquist sin ecuaciones (2020). [4] ¿cómo es la frecuencia en la voz humana? (2023). [5] Absorción y reverberación, (2016).