Subido por elmategiaco2

TP2 - Antezana - Giacometti - Martin

Anuncio
Universidad de San Andrés
Análisis matemático III - Tutorial Miércoles
Caracterización de señales de entrada y analisis de respuestas al impulso de sistemas
Martin, Tiziano1 Giacometti, Mateo2 Antezana, Matı́as3
1
2
3
Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina.
[email protected]
Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina.
[email protected]
Universidad de San Andrés, Ingenierı́a en Inteligencia Artificial, Buenos Aires, Argentina.
[email protected]
(Dated: 14 de noviembre de 2023)
Resumen
En el presente trabajo se analizará los impulsos tanto
de la fuente como la respuesta al impulso de 4 tipos de
señales: los aplausos, la explosión de globos, el choque
de maderas y un barrido frecuencial. Para llevar a cabo
este estudio, se observará sus respectivas respuestas en
frecuencia y sus amplitudes. Seguido a esto, se estudiará
el efecto de los objetos ( especı́ficamente de las mochilas)
presentes en el lugar en el cual se extrajo las mediciones
(en este caso un aula) a la vez que se lo comparará con
los resultados obtenidos por otros 13 recintos, utilizando
una métrica previamente definida para su análisis (en este caso, el error cuadrático medio aplicado a la respuesta
en frecuencia de los recintos a comparar en los intervalos
de baja, media y alta frecuencia en el rango de audición
humano) . Mediante resultados se comprueba como las
respuestas en frecuencia de las señales provenientes tanto de las fuentes como de la respuesta al impulso son
parecidas, a la vez que se determinó el poco efecto de los
objetos presenten en el recinto medido en los resultados
obtenidos. Se demostró que un sonido de aplauso, de un
globo explotando y de un golpe de maderas concentran
un pico de energı́a antes de los 1000 hertz, luego decae
linealmente hasta 20000 hertz, donde luego cae sustancialmente. La repetición de aplausos tuvo más incerteza,
seguido de los golpes de maderas y por último los globos. Por otras parte, se logro determinar que los recintos
mas parecidos al aula analizada son una iglesia y el menos
parecido un bosque en diferentes condiciones climatológicas.
Abstract
In this study, the impulses of four types of signals—applauses, balloon bursts, wood impacts, and a frequency sweep—were analyzed, considering both the source impulses and the impulse responses. The respective
frequency responses and amplitudes of these signals were
observed. Subsequently, the effect of objects (specifically,
backpacks) present in the measurement environment (in
this case, a classroom) was studied and compared with
results from 13 other environments. A predefined metric
for analysis, in this case, the mean squared error applied
to the frequency response of the environments at low,
mid, and high frequency intervals within the human audible range, was used for comparison. The results confirm
the similarity of frequency responses between signals originating from both sources and impulse responses. Additionally, it was determined that the presence of objects
in the measured environment had little effect on the obtained results. It was demonstrated that the sound of
applause, a bursting balloon, and a wood impact concentrate peak energy before 1000 hertz, followed by a linear
decay up to 20000 hertz, where it subsequently decreases
substantially. The repetition of applause showed greater
uncertainty, followed by wood impacts, and finally, balloons. On the other hand, it was determined that environments most similar to the analyzed classroom are a
church, while the least similar is a forest under different
climatic conditions.
I.
Introducción
A la hora de estudiar diversas fuentes sonoras resulta
fundamental considerar y entender la influencia que tiene
el medio fı́sico donde se efectúa el sonido. Cada entorno
particular modifica de manera diferente un audio y esas
transformaciones pueden expresarse matemáticamente a
partir del análisis de señales. La función que vincula las
señales de entrada y salida se conoce como respuesta al
impulso.
Con el objetivo de llevar a la práctica esta idea en un entorno relacionado a la academia, en el presente informe se
estudiará las modificaciones que un salón de clase le impone a ciertas señales especı́ficas que poseen propiedades
similares a las de la voz humana. Se utilizarán métodos
de obtención de respuestas al impulso inspirados en los
contenidos vistos en la materia de Análisis matemático
III. En primer lugar, se analizarán señales que no estén
afectadas (o lo mı́nimo posible) por el medio donde fueron grabadas. Luego, una vez obtenidos estos datos, se
2
examinarán las diferencias entre las señales ’puras’ y las
modificadas por el aula con el objetivo de cuantificar esos
cambios y estudiar cómo la presencia de objetos en un
espacio puede condicionar la propagación del sonido. Finalmente, se realizará una comparación entre la respuesta
al impulso del aula con otras respuestas al impulso provistas por la cátedra. El objetivo de esta parte es poder
establecer una métrica objetiva de comparación y sobre
esta base establecer grados de similitud entre el salón de
clase y el resto de recintos analizados.
Por otra parte, resulta necesario mencionar que, además
de esta sección de introducción de ideas, el presente informe cuenta con una sección de marco teórico, donde se
desarrollarán los conceptos y contenidos clave para entender las nociones prácticas y teóricas de los experimentos
y los resultados de ellos. Posteriormente procede un apartado de desarrollo experimental, donde se detallarán los
pasos que fueron seguidos a la hora de realizar los experimentos, los diferentes instrumentos utilizados y las
consideraciones que se tuvieron en cuenta, de modo que
quien lo desee pueda replicarlos. Luego, se desarrollará
una sección de resultados y análisis, donde se expondrán
justamente los resultados obtenidos y se intentará a cada
uno de ellos acompañarlos de una intuición fı́sica y conceptual de que se hayan producido. Por último, el informe concluye con un apartado de consideraciones finales,
donde se expondrán los resultados obtenidos de mayor
relevancia y las ideas propuestas para futuras investigaciones.
II.
A.
Marco teórico
Trasformada de Fourier
La Transformada de Fourier para señales continuas es
una herramienta esencial en el análisis de señales en el
dominio de frecuencias. Esta transformada se aplica a
señales continuas en el tiempo, ya sean periódicas o no
periódicas. La ecuación de sı́ntesis de esta transformada
se define como:
Z ∞
1
x(t) =
X(jω)ejωt dω
(1)
2π −∞
Mientras que la ecuación de análisis se define como:
Z ∞
X(jω) =
x(t)e−jωt dt
(2)
−∞
con una referencia especı́fica. En el contexto del sonido
y la acústica, los decibeles se utilizan comúnmente para
expresar niveles de presión sonora, intensidad acústica y
otras magnitudes relacionadas. La fórmula general para
ganancia o pérdida en decibeles se define como
P
dB = 10log10
(3)
P0
donde dB es la abreviación de la medida de decibeles, P
es la cantidad medida (presión sonora, potencia, etc.) y
P0 es la referencia o nivel de referencia.
B.
Sistemas LTI
La importancia de conocer la estructura de una respuesta al impulso radica en que estas respuestas caracterizan
completamente a sistemas que son lineales (es decir, cumplen la condición de linealidad) e invariantes en el tiempo.
Los llamamos invariantes en el tiempo dado que un desplazamiento temporal en la señal de entrada implica el
mismo desplazamiento temporal en la señal de salida, lo
que significa que el comportamiento de un sistema LTI
no depende del momento en el que se inyecta la señal
a la entrada. Luego, se dice que un sistema LTI queda
completamente caracterizado por su respuesta al impulso porque cualquier señal de entrada se puede pensar como una combinación lineal de impulsos desplazados. Si
se conoce cómo un sistema determinado modifica a un
impulso, para ver cómo altera una señal arbitraria solo
se debe pensarla como una sucesión de impulsos e ir aplicando la transformación uno a uno, para luego sumar los
resultados.
C.
Convolución de dos funciones
Dadas dos funciones (en nuestro caso, señales en dominio
de tiempo) interesará definir el proceso de convolución
como aquel procedimiento matemático en el que se combinan ambas funciones con el fin de producir una tercera
función (tercera señal) que expresa cómo una ecuación
modifica a la otra. La fórmula de este proceso es la siguiente:
(x ∗ h)[n] =
M
−1
X
x[k] · h[n − k] = y[n]
(4)
k=0
Especı́ficamente, en el presente informe se tomarán
señales expresadas en el dominio del tiempo (x(t)) y se
las analizará la mayor parte del tiempo en el dominio
de la frecuencia. Por último, otro concepto que resultará
util tener en cuenta a la hora de hacer el análisis de los
resultados obtenidos es el de la unidad de decibeles. Se
define decibeles como una unidad logarı́tmica que se utiliza para medir la magnitud de una cantidad en relación
en donde x e y son las señales correspondientes mientras
que y[n] es la función resultante.
Observando la fórmula (4) se puede ver como las operaciones (la multiplicación) se realiza punto por punto
(posición por posición) a la vez que se produce un desplazamiento de la función h.
3
D.
Error Cuadrático Medio
El Error Cuadrático Medio o Mean Squared Error (MSE)
es una métrica utilizada para evaluar la precisión de
un modelo de predicción en comparación con los valores reales. Esta métrica cuantifica la magnitud promedio
de los errores al cuadrado entre las predicciones del modelo y los valores reales en un conjunto de datos.
n
M SE =
1X
(yi − ŷi )2
n i=1
(5)
Figura 2: Interfaz de audio Scarlett 2i4 de Focusrite
Donde n es el número total de observaciones, yi es el valor
real de la observación i y donde ŷi es el valor predicho
para la observación. Cuanto menor sea el MSE, mejor se
ajusta el modelo a los datos. En particular, se utilizará
como métrica de medición para comparar la respuesta al
impulso del aula con la de otros recintos.
III.
Desarrollo experimental
A.
Instrumentos utilizados
Para la realización de los diferentes experimentos se utilizaron los siguientes dispositivos. En primer lugar, un
micrófono ultralineal de condensador para medición condensador (capaz de convertir la señal el sonido en una
señal eléctrica) ECM8000 de la marca Behringer. El
mismo cuenta con sensibilidad de 70 dB, con una impedancia (resistencia a la interferencia) de 200 Ohms, con
una respuesta de frecuencia entre 20Hz a 20000 Hz, un
peso de 136 g y patrón polar omnidireccional. En lo que
respecta a sus dimensiones, el micrófono cuenta con 191
mm de largo y 21 mm de ancho.
Figura 3: Interfaz de audio Scarlett 2i4 de Focusrite junto
con la computadora utilizada para seguir las mediciones
En tercer lugar, como consola de señales se hizo uso de
Power620plus de la marca Phonic. Entre sus especificaciones mas destacadas se encuentran que el mismo
posee un amplificador de potencia estéreo de 2 x 100W /
4 ohms para Main L/R o Main/Monitor (Bridge mono,
200W a 8 ohms), Procesador multi-efectos estéreo digital
a 32 bits con 16 programas más control de parámetro y
jack para interruptor de pedal, EQ gráfico estéreo de 7
bandas, 6 Entradas de Micrófono balanceadas con jacks
XLR, 8 Entradas de Lı́nea por jacks 1/4”, 2 Entradas de
Súper Alta Impedancia (Hi-Z) optimizada para entrada
directa de instrumentos, 2 Limitadores integrados, entre
otros. En cuanto a sus dimensiones, el mismo cuenta con
440 mm de ancho, 265 mm largo, 275 mm de profundidad
y 12990 gr de peso.
Figura 1: Micrófono ultralineal ECM8000 de Behringer
En segundo lugar, como interfaz de audio se utilizó una
Scarlett 2i4 de segunda generación 2-in/4-out USB de la
marca Focusrite. Entre sus especificaciones mas destacadas se encuentran una sensibilidad de 69 dB, un rango
dinámico (diferencia entre el nivel de señal más alto y más
bajo que puede manejar) de 120 dB, tasa de muestreo de
192 kHz y resolución de audio de 24 bits. En cuanto a
sus dimensiones, el mismo cuenta con una altura de 47.5
mm, un ancho de 175mm y un peso de 1000 gr.
Figura 4: Consola de señales Power620plus de Phonic
Finalmente, como fuente de los sonidos de las pruebas se
valió de un parlante JH153TW de la marca Dancis. El
mismo es un parlante del tipo Woofer, Driver y Tweeter, de filtro pasivo, potencia de salida (RMS) de 150 W
y nivel de impedancia de 8 Ohms. En lo referido a sus
dimensiones, el dispositivo mide 440 mm de ancho, 720
mm de largo y 300 mm de profundidad.
4
Por último, resulta relevante mencionar que, para verificar la correcta estructura de los impulsos luego de ser grabados, también se utilizó la aplicación informática Audacity.
B.
Experimentos realizados
’
Figura 5: Parlante JH153TW de Dancis
Resulta relevante mencionar que para hacer las mediciones se ajustaron los niveles de ganancia tanto de la placa
de audio como de la consola de señales para, a grandes
rasgos, separar el ruido de fondo en las mediciones sin
llegar al extremo de saturar los aparatos. La placa de
audio se ajustó para aumentar la amplitud de la señal
que percibió el micrófono; en otras palabras, para que,
a pesar de la distancia, el sonido emitido en un extremo
del aula pueda ser percibido por el micrófono en el otro
extremo. Por otra parte, los ajustes en la consola aumentaron la amplitud de la señal eléctrica que fue enviada al
parlante, es decir, subió el volumen del parlante.
A continuación se procederá a mostrar el esquema de
conexionado para cada experimento realizado
Experimento 1: Respuesta al impulso de un salón de clases
La primera experiencia consistió en la medición de la respuesta al impulso a diferentes señales de un salón de clases (en particular, el aula 17 del edificio Mario Hirsch
de la Universidad de San Andrés). El recinto utilizado
cuenta con 9.1 m de largo, 6.85 m de ancho y 2.85 m de
altura. Los objetos mas significativos que allı́ se encuentran son 25 mesas de 1.2 m de largo, 0.6 m de ancho y
0.78 m de altura y 50 sillas de 40x40 cm y altura regulable (para las experiencias también se encontrarán en su
interior los instrumentos descriptos en la sección anterior
bajo la disposición que se observa en el gráfico (8)) Por
último, es necesario destacar que se ha suprimido la representación de las ventanas y puertas del aula en esta
figura. Se ha tomado esta decisión puesto que no se considera relevante para el análisis de la respuesta al impulso.
Con el objetivo de que el sonido no se disipe todas las
ventanas y puertas se mantuvieron cerradas durante la
medición de las señales.
v
PC
Cable Usb
Interfaz de audio Cable XLR
Micrófono
Figura 6: Esquema de conexionado para la medición de
las señales puras. La PC se conecta a la interfaz de audio
mediante un cable USB. Luego, el micrófono se conecta
a la placa a través de un cable XLR
PC
Cable Usb
Interfaz de audio Cable XLR
Micrófono
v
Cable de línea
Consola de señales
Cable de conexión
bipolar
Parlante
Figura 7: Esquema de conexionado para la medición de
las señales modificadas por el aula. La PC se conecta
a la interfaz de audio mediante un cable USB. Luego, el
micrófono se conecta a la placa a través de un cable XLR.
El parlante se conecta a partir de un cable de conexión
bipolar a la consola de señales, que a su vez se conecta a
la interfaz de audio a través de un cable de lı́nea.
Figura 8: Plano en ”vista en planta”del Aula 17 del Edificion Mario Hirsch de la Universidad de San Andrés. El
punto ubicado en la anteúltima fila a mano derecha (si
se mira de arriba hacia abajo) representa el micrófono.
El cuadrado ubicado en la primera fila a mano izquierda
representa el parlante. Los dos cuerpos ubicado en la tercera fila a mano derecha representan la consola de señales
y la placa de audio
5
Experimento 2: Caracterización de fuentes
Figura 9: Interior del Aula 17 del Edificion Mario Hirsch
de la Universidad de San Andrés con distribución cotidiana de objetos
Como señales de entrada para el sistema, se utilizaron 4
fuentes diferentes: aplausos de un solo individuo, la explosión de un globo, el choque entre 2 bloques de madera y la reproducción de un barrido frecuencial (también
conocido como Sweep). Los sonidos fueron emitidos de
forma natural (aplausos, explosión del globo y choque de
maderas) o reproducidos desde el parlante (barrido frecuencial) desde la misma posición en la que se encuentra
colocado el mismo dentro de gráfico (8) (aproximadamente a 3.3 m de la pared izquierda, 1.9 m de la pared
superior y a una altura de 1.25 m). Cada señal fue grabada individualmente por el micrófono ultralineal (ubicado
a 1.44 m de la pared de la izquierda, 2,10 m de la pared
del fondo y a una altura aproximada de 1,1 m) bajo dos
condiciones diferentes del sistema: en primer lugar el aula vacı́a de alumnos y sus mochilas y en segundo lugar
el aula vacı́a de alumnos pero no de sus mochilas. Cabe
aclarar que los ensayos fueron realizados alrededor del
medio dı́a, con condiciones tales que la temperatura era
igual a 14°C, humedad igual a el 72 % y ruido externo al
sistema minimizado lo máximo posible.
Resulta necesario destacar el motivo por el cual se han
elegido las posiciones anteriormente mencionadas para
los instrumentos. Debido a que el objetivo de la medición
es estudiar cómo un sonido es modificado por el aula, se
ha intentado replicar el escenario de una clase genérica
al ubicar el parlante donde por lo generar se posiconarı́a
un profesor y el micrófono en un lugar del aula donde
podrı́a ubicarse un alumno que actuarı́a como receptos
de las señales de voz emitidas por el profesor. Por otro
lado, se intentó alejar el micrófono en la mayor medida
posible del parlante para que la modificación realizada
por el aula sobre la señal sea la más notoria posible, pero
por la limitación de la extensión del cable que conectaba
al micrófono solamente se ha podido posicionar en la anteúltima fila.
El objetivo del segundo experimento fue estudiar las fuentes de audio ’puras’, al tratar de registrar señales que
estén lo menos afectadas posible por el recinto donde fueron grabadas. Para lograr esto se realizaron dos modificaciones principales con respecto al experimento anterior.
En primer lugar, todos los sonidos se realizaron al lado
del micrófono, de modo que las ondas sonoras no ’viajen’
a través de todo el lugar ni se vean influenciadas por el
espacio. En segundo lugar, se realizaron varias repeticiones de los mismos impulsos Con la finalidad de contar
con registros de audio los mas fidedignos posibles de las
señales de entrada utilizadas en los experimentos realizados anteriormente, para el segundo experimento se grabaron varios impulsos provenientes de una misma fuente
(aplausos, globos, etc.). Estas capturas de audio se realizaron con los mismos equipos mencionados anteriormente
y consistieron en realizar espaciados temporalmente cada uno de los sonidos (menos el barrido frecuencial) 10
veces cerca del micrófono (un punto en el cual no lograba
saturarse). Las 10 repeticiones se grabaron en la misma
pista de audio por cada uno de los sonidos, tratando que
cada repetición sea afectada lo menos posible por ruidos
externos y perturbaciones en el sistema generadas en intentos anteriores.
C.
Consideraciones en los experimentos
Estudiar al salón de clases como sistema LTI
Cabe aclarar que todos los análisis realizados en base a la
información obtenida mediante la realización del Experimento 1 se hicieron considerando al salón de clases como
un sistema del tipo lineal e invariante en el tiempo.
En la realidad, un salón de clases no cumple plenamente
con todas las caracterı́sticas de un sistema LTI debido
a que no mantiene la propiedad de linealidad en la mayorı́a de los casos (la absorción y reflexión del sonido en
las superficies de las paredes, el techo y el suelo, ası́ como
la interacción con los objetos en el salón, como mesas y
sillas pueden causar distorsión y cambios no lineales) ni
la de ser invariante en el tiempo (la temperatura, humedad, nivel de ocupación del salón, disposición de mobiliario varı́an a lo largo del tiempo y modifican la respuesta
del sistema). Sin embargo, se lo consideró LTI ya que su
aproximación que no trae demasiados errores y simplifica
las cuentas a realizar.
Influencia de la temperatura y la humedad en la propagación
del sonido
Anteriormente se detallaron las condiciones meteorológicas presentes en el dı́a de la medición. Sin embargo, en
un primer instante se podrı́a considerar que estos datos
podrı́an ser irrelevantes para el análisis de la respuesta al
6
de donde se obtuvo un gráfico como el que se presenta a
continuación.
Amplitud
impulso. Sin embargo, las caracterı́sticas del medio donde se emite un sonido definen su velocidad, las pérdidas
por transmisión e incluso su dirección [1]. La velocidad
del sonido queda determinada por las caracterı́sticas del
aire, principalmente por su temperatura. Se suele decir
que el sonido viaja a 343 m/s, sin embargo, esto es cierto
sólo cuando la temperatura del aire es 20°C. Se considera que la velocidad del sonido varı́a en 0.6 m/s por cada
grado centı́grado. El aire se puede considerar como un
filtro pasa-bajos, es decir, absorbe altas frecuencias. Esta
absorción depende en mayor medida de la humedad relativa del ambiente. Por ejemplo, un ambiente seco (20 %
de humedad) genera una atenuación de -9 dB a 30m de la
fuente para frecuencias en el rango de los 10kHz. Esos -9
dB se deben sumar a la atenuación que generan 30m de
distancia por la ley del cuadrado inverso ( 20*log(1/30)
= -29,5 dB). Por lo tanto, a 30m de distancia de la fuente
y con 20 % de humedad, la atenuación será de -38,5 dB
para frecuencias cercanas a los 10 kHz[2].
0.6
0.4
0.2
0.0
0.2
0.4
0.6
0
5
10
15 20
Tiempo [s]
25
30
35
Figura 11: Ejemplo de un audio de seis globos explotando. Señal vista en el dominio del tiempo. Se logra visualizar la presencia de ruido que obligó a modificar el código
utilizado para registrar impulsos para no ser detectado
como la explosión de otros globos
Aplicación de un filtro inverso
Lo que interesa obtener para ambos experimentos son
impulsos (como un aplauso, un golpe de maderas, etc.).
Por este motivo, se tomó un barrido frecuencial y se lo
convolucionó con un filtro inverso, de donde se obtuvo un
impulso parecido a una delta en el dominio del tiempo.
Si bien esto no se ha demostrado, en unas secciones más
adelante sı́ se hará.
Luego, fue necesario poder separar las señales en varios
impulsos individuales para poder analizarlos de manera
más especı́fica. Para eso se utilizó la función f ind peaks
de SciPy, que sirvió para detectar los valores más altos
alcanzados por la señal y de esa manera poder recortar
los impulsos al tomar una cierta cantidad de muestras
hacia atrás de los picos y hacia adelante.
A continuación se mostrará un gráfico en amplitud del
filtro inverso del sweep:
Filtro Inverso
0.8
0.6
Amplitud
Amplitud
0.4
0.2
0.0
0.2
0.4
0.6
0.8
0
1
2
3
Tiempo (en s)
4
5
0.6
0.4
0.2
0.0
0.2
0.4
0.6
0.0
0.1
0.2
0.3 0.4
Tiempo [s]
0.5
0.6
0.7
6
Figura 10: Gráfico de la amplitud del filtro inverso del
sweep a lo largo del tiempo (medido en segundos).
Figura 12: Ejemplo de un impulso individual correspondiente a un globo explotado. Señal en el dominio del tiempo
Recorte de las muestras utilizadas
Una parte fundamental del desarrollo de los experimentos
consistió en el procesamiento de los datos obtenidos con
los aparatos anteriormente descriptos. Una vez obtenidos
los audios que contenı́an varias repeticiones de un mismo
sonido (un audio con varios aplausos, por ejemplo) se
procedió a analizar gráficamente cómo se veı́a esa señal,
Luego, se procedió a analizar cada impulso en el dominio
de la frecuencia, por lo que se aplicó la transformada de
Fourier descripta en la ecuación 2. La cantidad máxima
de hertz representada fue 22050 debido a que, si se recuerda el teorema de Nyquist - Shannon [3], no se puede
reconstruir componentes frecuenciales superiores a la mitad de la frecuencia de muestreo de un audio.
7
10
40
20
0
10
+
20
Amplitud [dB]
Amplitud [dB]
Magnitud|Y(f)|
60
30
40
50
60
5000
10000
15000
Frecuencia [Hz]
5000
20000
10000
15000
Frecuencia [Hz]
100 200
Amplitud [dB]
Amplitud [dB]
60
0
5000
10000
15000
Frecuencia [Hz]
20
40
60
80
20000
+
100 200
(a)
20000
(b)
0
+
10
Amplitud [dB]
Amplitud [dB]
500 1000 2000 5000
Frecuencia [Hz]
Figura 15: 20 aplausos. (a) tiene ejes en escala lineal. (b)
tiene eje X en escala logarı́tmica y eje Y en escala lineal
0
20
30
40
50
10
+
20
30
40
50
0
A continuación se procederá a mostrar los resultados a
partir del Experimento 2. Antes de mostrar las figuras,
resulta necesario hacer una recapitulación de cómo se
procesaron los datos. En primer lugar, se ’cortaron’ los
audios para tener los impulsos por separado. En segundo
lugar se llevó cada impulso al dominio de Fourier. Luego,
se calculó una señal modelo a partir de calcular la media
de todos los impulsos y también se obtuvieron los desvı́os.
Posteriormente se modificaron los impulsos de modo que
fuera posible representarlos a partir de la unidad decibeles, como se ha explicado previamente. Luego, la señal
media, la señal + desvı́o y la señal - desvı́o se normalizaron al restarle a cada señal el máximo de la media. Por
último, se ha utilizado un método llamado Rolling(k),
que calcula el promedio móvil con una ventana de tamaño k. Cada punto en la serie de rolling es el promedio
de los cinco puntos anteriores en la serie original. Esto
tiene el efecto de suavizar la serie y resaltar tendencias a
largo plazo. Para más información sobre este método se
recomienda leer la documentación de la librerı́a Pandas.
Para este caso particular se ha aplicado un rolling a cada
curva con k = 50.
20000
0
+
Análisis de resultados
Aplausos, globos y maderas
500 1000 2000 5000
Frecuencia [Hz]
(b)
40
En esta sección se analizará bajo diferentes perspectivas
y se compararan los resultados obtenidos tras llevar a
cabo los pasos descriptos en la sección desarrollo experimental (III).
1.
20000
20
80
Caracterización de fuentes
50
Figura 14: 15 globos. (a) tiene ejes en escala lineal. (b)
tiene eje X en escala logarı́tmica y eje Y en escala lineal
0
De esta manera, una vez recortados todos los impulsos,
fue posible calcular un impulso promedio y un desvı́o
estándar asociado con el objetivo de crear ’señales modelo’ y trabajar en base a ellas.
A.
40
(a)
Figura 13: Ejemplo de un impulso individual correspondiente a un globo explotado. Señal en el dominio de la
frecuencia
IV.
30
60
0
0
+
20
5000
10000
15000
Frecuencia [Hz]
(a)
20000
100 200
500 1000 2000 5000
Frecuencia [Hz]
(b)
Figura 16: 20 maderas. (a) tiene ejes en escala lineal. (b)
tiene eje X en escala logarı́tmica y eje Y en escala lineal
En primer lugar, resulta necesario destacar que todos los
gráficos en escala lineal presentan una estructura similar.
En todos ellos es posible dilucidar una suba considerable
de energı́a (en forma de pico) para los primeros 1000 hertz
(aproximadamente). Luego, en todos se ve un decaimiento lineal. Si bien este decaimiento no tiene exactamente
la misma pendiente para todos, es posible reconocer que,
a groso modo, se trata de una recta decreciente que comienza cerca de los 5000 hertz y culmina cerca de los
20000 hertz y en todo este trayecto se pierden aproximadamente 20 decibeles de energı́a. Por otro lado, también
resulta necesario destacar que, luego de los 20000 hertz,
la energı́a comienza a perderse de manera mucho más
drástica, hasta llegar al máximo de 22050 hertz.
Asimismo, resulta necesario aclarar que, a la hora de
analizar los resultados, se recomienda hacer más énfasis
20000
8
1.0
0.8
0.8
Magnitud|Y(f)|
Magnitud|Y(f)|
o poner más atención en las curvas correspondientes a
la media y a la media + desvı́o. En ciertos puntos, la
curva de media - desvı́o no estuvo definida debido a que
contenı́a valores negativos que, a la hora de aplicarles
el logaritmo para obtener los decibeles, no fue posible
evaluarlos. De esta manera, fue necesario realizar una
interpolación sobre los puntos que sı́ pudieron evaluarse
y por este motivo se recomienda analizar en más detalle
las otras dos curvas.
Por otra parte, resulta relevante destacar que los gráficos en escala lineal presentan una especie de ’meseta’ en
algún intervalo dentro de todo el rango de frecuencias y
que es más sencillo dilucidar en los gráficos con el eje X
en escala logarı́tmica. Esta meseta se presenta para los
globos entre 200 y 2000 hertz, para los aplausos entre 500
y 2000 hertz y para las maderas entre 2000 y 5000 hertz.
En otro orden de ideas, resulta necesario mencionar
que, antes de realizar el experimento, se supuso que el
impulso que mayor desvı́o iba a presentar iba a ser el
de los globos. Se creyó que, debido a que al explotar un
globo entran en juego una mayor cantidad de variables
sin regular (como la cantidad de aire que contenı́a cada
globo, la zona donde fue pinchado, hacia dónde se escapó
el aire y la goma del globo, entre otras), las mediciones
podrı́an variar significativamente. Sin embargo, al ver los
gráficos es posible ver que las diferencias más sustanciales
las presentan los aplausos, en segundo lugar las maderas
y en tercer lugar los globos.
0.6
0.4
0.2
0.0
0
5000
10000
15000
Frecuencia [Hz]
0.6
0.4
0.2
0.0
20000
0
5000
(a)
10000
15000
Frecuencia [Hz]
20000
(b)
Figura 18: En (a) el espectro del filtro inverso, en (b) el
del sine sweep
Es posible observar que las transformadas de ambas
señales parecieran ser en algún sentido ’opuestas’ o ’inversas’, mientras una tiene pendiente positiva, la otra
tiene negativa. Las irregularidades que se presentan para frecuencias muy bajas (menores a 20 hz y mayores a
20000 hz) no se deben tener en cuenta, pues solamente
dentro de este rango es que el oı́do humano puede percibir el sonido. Luego, una vez que se aplica la operación
de convolución a las señales en tiempo (o multiplicación
en frecuencia) se obtiene el siguiente resultado
1.0
Anteriormente se presentó el gráfico del filtro inverso
para el dominio del tiempo. Ahora se presenta el gráfico
del barrido frecuencial en el mismo dominio.
0.8
Magnitud|Y(f)|
Sine sweep
Amplitud
2.
15000
12500
10000
7500
5000
2500
0
Amplitud
0
0.75
0.50
0.25
0.00
0.25
0.50
0.75
2
4
6
8 10
Tiempo [s]
12
14
16
0.6
0.4
0.2
0.0
0
5000
(a)
10000
15000
Frecuencia [Hz]
(b)
Figura 19: En (a) el resultado de la convolución en tiempo, en (b) está en frecuencia
0
1
2
3
4
5
Tiempo [s]
6
7
8
Figura 17: Barrido frecuencial en dominio de tiempo.
Si bien podrı́a parecer un cuadrado uniforme, si se observa detenidamente es posible ver que, al principio de
la grabación, las ondas se repiten cada un intervalo de
tiempo mayor y, a medida que pasa el tiempo (y el audio
se vuelve más agudo), las ondas comienzan a repetirse en
menos tiempo.
A continuación se muestra la forma de la transformada
de Fourier tanto para el filtro inverso como para el sine
sweep
Tal como se puede observar, el resultado obtenido en
tiempo es un impulso que, a diferencia del resto de fuentes (aplausos, globos, etc.), tiene una similitud más significativa con lo conocida como ’delta’. Tal como se ha
estudiado en la cátedra, la transformada de una delta es
una constante, tal como se ve en el gráfico (b).
B.
Respuestas al impulso
Tomando en cuenta lo mencionado en la explicación del
Experimento 1 (III B) se explicarán los resultados obtenidos junto con un análisis para cada tipo de señal.
20000
9
Comparación de espectros de las respuestas al impulso
(con y sin objetos en el aula)
En los siguientes gráficos se mostrará la comparación entre el promedio de los valores absolutos de las Trasformadas de Fourier (2) convertidos a decibeles (3) tomando
como valor de referencia el máximo valor que se obtuvo
de cada promedio de las transformadas (2) para la respuesta al impulso de cada tipo de señal (explicadas en
la sección Experimento 1: Respuesta al impulso de
un salón de clases) analizando el caso de con y sin
mochilas en el recinto (en este caso el aula representada
en el esquema (8)):
2
Aplausos con mochilas
Aplausos sin mochilas
4
Magnitud (dB)
6
Magnitud (dB)
En este punto se mostrará como varia el espectro entre
los diferentes tipos de impulsos (ya sea producidos por
los aplausos, la explosión de los globos, el choque de las
maderas y el sweep) medidos en el aula (representada en
el esquema (8)) analizando los casos con o sin mochilas.
Para hacer esto, se restringió el rango en el cual se tomaban valores de la señal con el propósito de usar las
muestras que más información tenı́an (mejor explicado
en la sección ’Recorte de las muestras utilizadas’ (III C))
para los siguientes análisis.
golpe de maderas con mochilas
golpe de maderas sin mochilas
5
10
15
20
25
0
2500
5000
7500
10000
12500
Frecuencia (Hz)
15000
17500
20000
Figura 22: Gráfico de la comparación entre espectros de la
señal producida por el choque entre las maderas en el aula
(8) con mochilas (curva ja) y sin mochilas (curva azul) a
la vez que el eje x representa los niveles de frecuencias.
10
20
Magnitud (dB)
1.
30
40
50
60
0
sweep con mochilas
sweep sin mochilas
5000
10000
Frecuencia (Hz)
15000
20000
Figura 23: Gráfico de la comparación entre espectros del
sweep aplicado el filtro inverso (III C) producido con mochilas (curva roja) y sin mochilas (curva azul) a la vez
que el eje x representa los niveles de frecuencias.
8
10
12
14
16
18
0
2500
5000
7500
10000
12500
Frecuencia (Hz)
15000
17500
20000
Figura 20: Gráfico de la comparación entre las magnitudes del promedio de los valores de las Trasformadas de
Fourier de los impulsos producidos por los aplausos, mostrando el caso con mochilas (curva roja) y sin mochilas
(curva azul) tomando como eje x las frecuencias y como
eje y el valor de las magnitudes (representando los decibeles).
2.5
Explosión globos con mochilas
Explosión globos sin mochilas
5.0
Magnitud (dB)
7.5
10.0
12.5
15.0
17.5
20.0
22.5
0
2500
5000
7500
10000
12500
Frecuencia (Hz)
15000
17500
20000
Figura 21: Gráfico de la comparación entre espectros de
la señal producida por la explosión de los globos en el aula
(8) con mochilas (curva roja) y sin mochilas (curva azul)
a la vez que el eje x representa los niveles de frecuencias.
Al analizar las figuras previamente obtenidas se puede
apreciar como en algunos casos la cantidad de decibeles
(obtenidos tras calcular el valor absoluto del promedio de
las Trasformadas de Fourier (2)) de las señales producidas sin mochilas es menor que las obtenidas con mochilas
(como el caso de las figuras (20) y (23)). Esto resulta contrario a lo esperado por los autores del informe. Se esperaba que los resultados fueran al revés (tal como ocurre
en la figura (20)) al haber efectos de absorción de energı́a
por parte de las mochilas en cada respuesta al impulso
(al viajar las ondas sonoras de cada señal desde una posición en especifico hasta el micrófono amortiguando ası́
el sonido). Entre las principales suposiciones sobre este
fenómeno se encuentra la utilización de un parlante sin
un espectro plano (al no ser un parlante de medición),
razón por la que la respuesta del mismo no será uniforme a todas las frecuencias. En otras palabras, el resultado obtenido tendrá tanto realces (amplifica la intensidad
de las frecuencias por lo que habrá más energı́a) como
atenuaciones (reducción de la intensidad de las frecuencias por lo que habrá menos energı́a). De esta manera, se
puede concluir que la hipótesis que se tenia de un efecto
determı́nate por parte de las mochilas en las respuestas
de cada señal no era correcta, sobrestimando ası́ su influencia (ya sea por el pequeño tamaño de los mismos o
por su cantidad).
10
Por otro lado, si se observa el gráfico (22) se puede ver
como en bajas frecuencias la energı́a obtenida por parte
de la respuesta al impulso de la señal grabada sin mochilas es menor a la que si tiene mochilas mientras que para
medias y altas frecuencias los valores obtenidos son muchos más parecidos que los gráficos (21) y (23) llegando
en algunos casos a ser más baja la energı́a para el caso
con mochilas (por ejemplo entre 13750 Hz y 14500 Hz).
ción tras aplicar los pasos descriptos en Experimento
1: Respuesta al impulso de un salón de clases)
y la amplitud del sweep aplicado el filtro inverso en la
señal (según lo explicado en Aplicación de un filtro
inverso (III C))
150
Sweep original con mochilas
0.2
2.
Comparación de las amplitudes del sweep original y
aplicado el filtro
En los siguientes gráficos se mostrará la comparación entre la amplitud original del sweep (obtenido en la medi-
Amplitud de la señal
Amplitud señal
0.0
0.1
50
0
50
100
150
0.2
Sweep aplicado el filtro con mochilas
0
2
4
6
Tiempo (en s)
8
10
9.2
9.3
9.4
9.5
9.6
Tiempo (en s)
9.7
9.8
Figura 24: Gráfico de la amplitud del sweep original obtenido en la medición (el de color amarillo) vs Gráfico
de la amplitud del sweep aplicado el filtro inverso en la
señal (el de color verde), ambos considerando el efecto de
las mochilas. Como eje x se tomo el tiempo medido en
segundos mientras que el eje y representa el valor de la
amplitud de la señal
Sweep original sin mochilas
Sweep aplicado el filtro sin mochilas
0.3
100
0.2
50
Amplitud de la señal
Tomando en cuenta los resultados obtenidos en el apartado Caracterización de fuentes en las cuales se representan las energı́as producidas por las fuentes para
distintos rangos de frecuencias, se puede ver como en
el gráfico de la explosión de globos (19a) los picos de
energı́a, al igual que en la figura (21) (tanto para el caso
con y sin mochilas), se encuentran en bajas frecuencias
(entre 0 y 300 Hz) mientras que para altas frecuencias es
donde más se atenúa la señal. A su vez, al analizar los
aplausos (19b), se ve como la energı́a se presenta en el
rango de frecuencia entre 2000 y 2300 Hz, parecido en
lo que ocurre en la respuesta al impulso del mismo tipo
de señal (20). Este patrón también se repite para el caso de la señal producida por el choque de las maderas
(comparando los gráficos (19b) y (19) con la respuesta al
impulso (22)), al encontrarse tanto los valores altos como los bajos de las energı́as en rangos parecidos. De esta
forma, se puede concluir como en la mayor parte de los
casos, tanto en el primer como en el segundo experimento
los resultados obtenidos en frecuencia son parecidos (al
darse los picos de energı́a en rangos de frecuencias parecidos).
100
0.1
Amplitud señal
Al analizar con más detalle el gráfico (20) se ve (según lo
anteriormente mencionado) como es el que más se ajusta a lo que idealmente se esperaba (a pesar de que no
se trate del efecto de las mochilas sino más del parecido
de los espectros). A su vez, queda reflejado como en bajas frecuencias (entre 1250 Hz y 3000 Hz) la diferencia
entre los valores obtenidos de las energı́a (con y sin objetos) es mucho más grande (llegando a ser la diferencia
de 7 decibeles) que en otros rangos de frecuencias. Por
otro lado, si se toma en cuenta los gráficos previamente
obtenidos y se los analiza en el rango de frecuencia que
normalmente se encuentra la voz de un ser humano (entre 500 y 3500 Hz según el articulo [4]) se puede apreciar
como en la mayor parte de los casos la energı́a obtenida
en este intervalo es alta (o no se atenúa tanto como en
otros casos). Esto ocurre debido a las caracterı́sticas del
mismo aula (8) como su forma, su tamaño, los materiales de construcción utilizados volviéndola un lugar ideal
para dar clases (al ser los rangos de baja frecuencia en
donde mejor se representa la energı́a).
0.1
0.0
0.1
0
50
100
0.2
150
0.3
0
2
4
6
Tiempo (en s)
8
10
200 9.2
9.3
9.4
9.5
9.6
Tiempo (en s)
9.7
9.8
Figura 25: Gráfico de la amplitud del sweep original obtenido en la medición (el de color amarillo) vs Gráfico
de la amplitud del sweep aplicado el filtro inverso en la
señal (el de color verde), ambos sin considerar el efecto
de las mochilas. Como eje x se tomo el tiempo medido
en segundos mientras que el eje y representa el valor de
la amplitud de la señal
Tanto en el gráfico (24) como en el (25) se aprecia la distorsión de la señal original del sweep obtenido en la medición. Entre las principales causas de este hecho se encuentra las caracaterı́sticas que poseı́a el entorno a la hora de
ser grabado. Al reproducirse el barrido frecuencial en un
aula (8) el sonido tuvo que reflejarse varias veces antes de
disiparse creando ası́ un efecto de persistencia del mismo
conocido como Reverberación (mencionado en el artı́culo
11
[5] en el cual se habla de la Reverberación del sonido).
Otra razón de este hecho se debe a la utilización de un
parlante no ideal (detallado el la imagen (5)) debido a
que posee una frecuencia propia (siendo también responsable del resultado llegado en el apartado Comparación
de espectros de las respuestas al impulso (con y
sin objetos en el aula)), en otras palabras, no posee
un espectro plano (la respuesta no es constante para todas las frecuencias dentro del rango auditivo de un ser
humano).
Al analizar la señal obtenida en los gráficos previamente mencionados tras aplicar el filtro inverso (representado en amplitud por la figura (10)) se ve (en amplitud)
las correcciones de las distorsiones del barrido frecuencial original tanto para el caso del sweep grabado con
objetos (24) y el de sin objetos (25). A su vez, con el
propósito de comparar de mejor manera la evolución de
las amplitudes obtenidas en ambos casos (tras aplicar el
filtro), se realizó el siguiente gráfico:
10.0
Sweep aplicado el filtro (con mochilas)
10
7.5
Amplitud de la señal
Amplitud señal
5.0
2.5
0.0
2.5
5.0
7.5
10.0
9.50
Sweep aplicado el filtro (sin mochilas)
5
9.54
9.56
Tiempo (en s)
9.58
9.60
5
9.50
9.52
9.54
9.56
Tiempo (en s)
9.58
9.60
Figura 26: Gráfico de las amplitudes del sweep aplicado
el filtro tomando el caso con mochilas y sin mochilas .
En la figura (26) queda en evidencia como en el caso
del sweep aplicado el filtro inverso sin la presencia de
objetos la amplitud es mayor que el caso sin objetos en
los mismos instantes de tiempo. Ahora bien, a pesar del
efecto de absorción que idealmente tienen las mochilas, se
habı́a llegado previamente en el apartado Comparación
de las amplitudes del sweep original y aplicado el
filtro a la conclusión de que el efecto de estos objetos en
el presente experimento no era tan determinante como
se esperaba. Aún ası́, al observar el gráfico previamente obtenido (26) se puede decir como este efecto si se
encuentra presente a pesar de tener una implicancia tan
baja (al ser chica la diferencia de amplitudes en el mismo
tiempo).
C.
1.
Descripción de los recintos
Los 13 recintos, cuyas respuestas al impulso fueron comparadas con la obtenida de las experimentaciones realizadas en el Aula 17 del Edificion Mario Hirsch de la
Universidad de San Andrés, son los siguientes:
Cancha de tenis (sin techo): Cancha de tenis al
descubierto ubicada en el Falkland Palace en Fife,
Escocia. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido
por un parlante Genelec S30D y captado por un
micrófono de campo sonoro SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la
distancia fuente-receptor fue de 10,76 m, la altura
de la fuente fue de 1,5 m y la altura del receptor
fue de 1.5 m.
0
10
9.52
poder determinar el grado de similitud entre las respuestas al impulso de diferentes recintos. Por medio de la
utilización de la misma, se buscará determinar dentro de
un grupo de 13 ambientes diferentes cuales son los que
se comparan de forma parecida a un salón de clases (en
particular el Aula 17 que previamente se analizó) y a que
factores se debe cada determinado grado de similitud.
Comparación entre respuestas al impulso de
diferentes recintos
En la siguiente sección se procederá a analizar una métrica elaborada con la finalidad de conseguir una forma de
Interior de una mina: Mina en desuso encontrada cerca de Trollers Gill, Inglaterra llamada Gill
Heads Mine. La señal de entrada (fuente) fue un
barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por
un micrófono Soundfield ST450. La frecuencia de
muestreo de la grabación fue de 96 kHz y tanto la
distancia fuente-receptor como la altura de los mismo se desconoce.
Túnel ferroviario: Túnel ferroviario St Leonards
ubicado al sureste del centro de Edimburgo, cerca
de Arthur’s Seat. La señal de entrada (fuente) fue
un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz
emitido por un parlante Genelec 8130A y captado
por un micrófono Soundfield ST450. La frecuencia
de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 5 m y 10 m,
la altura de la fuente y el receptor fue 1.5 m y la
temperatura durante de medición fue 17°C.
Bosque (en verano): Bosque del Parque Nacional Koli en Finlandia a mediados del verano. La
señal de entrada (fuente) fue un barrido sinusoidal
(Sweep) de 20 Hz a 22 kHz emitido por un parlante
Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor
tomadas fueron 7.2 m, 9 m y 11 m, la altura de
la fuente y el receptor fue 1.5 m y la temperatura
durante de medición fue 13°C.
12
y captado por un micrófono SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la
distancia fuente-receptor fue 8.86 m la altura de la
fuente y receptor fueron 1.5 m y la temperatura fue
13°C.
Bosque (en invierno): Bosque del Parque Nacional Koli en Finlandia a mediados del invierno. La
señal de entrada (fuente) fue un barrido sinusoidal
(Sweep) de 20 Hz a 22 kHz emitido por un parlante
Genelec 8130A y captado por un micrófono Soundfield ST450. La frecuencia de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor
tomadas fueron 7.2 m, 9 m y 11 m, la altura de
la fuente y el receptor fue 1.5 m y la temperatura
durante de medición fue -1.5°C.
Valle con colinas: Desfiladero de piedra caliza conocido como Troller’s Gill en los valles de
Yorkshire, Inglaterra. La señal de entrada (fuente)
fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz
emitido por un parlante Genelec 8130A y captado
por un micrófono Soundfield ST450. La frecuencia
de muestreo de la grabación fue de 96 kHz, la distancia fuente-receptor tomada fue 5.5 m y la altura
de la fuente y el receptor fue 1.5 m.
Reactor Nuclear: Reactor Nuclear R1 ubicado a
25 metros debajo del KTH Royal Institute of Technology, cerca de Estocolmo, Suecia. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep)
de 20 Hz a 22 kHz emitido por un parlante Genelec 8130A y captado por un micrófono SPS422B.
La frecuencia de muestreo de la grabación fue de
48 kHz, la distancia fuente-receptor tomada fue de
14.88 m y la altura de la fuente y el receptor fue
1.5 m.
Monumento: Monumento creado para Onesipherous Tyndall Bruce en Malvinas, Argentina. La
señal de entrada (fuente) fue un barrido sinusoidal
(Sweep) de 20 Hz a 22 kHz emitido por un parlante
desconocido y captado por un micrófono SPS422B.
La frecuencia de muestreo de la grabación fue de
48 kHz, la distancia fuente-receptor fue 2.3 m y la
altura de la fuente y receptor fueron 1.5 m.
Iglesia: El Santuario e iglesia parroquial de Todos
los Santos está situado en la calle Norte, cerca del
rı́o Ouse, Ingleterra. Cuenta con 28.4 m de largo y
14 m de ancho. La señal de entrada (fuente) fue un
barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un parlante Genelec 8030 y captado por
un micrófono Soundfield SPS422B. La frecuencia
de muestreo de la grabación fue de 96 kHz, las distancias fuente-receptor tomadas fueron 4.5 m, 5.2
m y 13.45 m, la altura de la fuente fue 1.5 m, la
del receptor fue 1.3 m y la temperatura durante de
medición fue 15°C.
Usina del Arte: La Usina del Arte es un centro
cultural y sala de espectáculos que ocupa el edificio de la vieja Usina Don Pedro de Mendoza en el
barrio de La Boca, Buenos Aires. Las mediciones
se realizaron el 2 de junio de 2014 entre las 9:00
y las 18:00 h. El ruido de fondo se midió con el
sonómetro al comienzo del experimento en 10 puntos fı́sicos dentro de la habitación en modo lento
con un intervalo de integración de 30 segundos. Para obtener las respuestas impulsivas de la sala se
generó un barrido sinusoidal logarı́tmico (Sweep)
de 50 segundos de 40 Hz a 16 kHz a una frecuencia
de muestreo de 16 bits 48 kHz y su filtro inverso
para reproducción, grabación y posterior deconvolución y post-procesando. Se utilizó para las mediciones un micrófono Earthworks M50, la frecuencia
de muestreo de la grabación fue de 48 kHz y tanto la distancia fuente-receptor como la altura de la
fuente y receptor son desconocidas.
Polideportivo: Pabellón deportivo del polideportivo de la Universidad de York, Inglaterra. La
señal de entrada (fuente) fue un barrido sinusoidal
(Sweep) de 20 Hz a 22 kHz emitido por un parlante
desconocido y captado por un micrófono desconocido. La frecuencia de muestreo de la grabación fue
de 96 kHz y la distancia fuente-receptor y altura de
la fuente y receptor desconocidas.
Almacén vacı́o: Almacén vacı́o dentro de la fábrica de chocolate y confiterı́a Terry’s en York, Inglaterra. La señal de entrada (fuente) fue un barrido sinusoidal (Sweep) de 20 Hz a 22 kHz emitido por un
parlante desconocido y captado por un micrófono
SPS422B. La frecuencia de muestreo de la grabación fue de 48 kHz, la distancia fuente-receptor fue
28.35 m, la altura de la fuente y receptor fueron 1.5
m y la temperatura fue 16°C.
Sala de mecanografı́a: Sala de mecanografı́a dividida dentro de la fábrica de chocolate y confiterı́a
Terry’s en York, Inglaterra. La señal de entrada
(fuente) fue un barrido sinusoidal (Sweep) de 20
Hz a 22 kHz emitido por un parlante desconocido
2.
Métrica de comparación implementada y condiciones
para el análisis
A grandes rasgos, la métrica seleccionada consiste en el
calculo del error cuadrático medio (MSE) entre
las respuestas al impulso en el dominio de la frecuencia de cada recinto dentro de 3 rangos frecuenciales diferentes. La selección del MSE como medio para cuantificar la diferencia entre respuestas se justifica en su caracterı́stica de penaliza de manera significativa los errores grandes debido al cuadrado en la fórmula,
lo que lo hace sensible a la grandes diferencias presentes.
También fue elegido el dominio de la frecuencia como
13
región de análisis debido a que es más fácil identificar
y comparar caracterı́sticas acústicas especı́ficas de como
resonancias, atenuaciones, amplificación, reverberación,
etc.
Por otra parte, cabe aclarar que las respuestas frecuenciales de cada sistema se obtuvieron aplicando la transformada rápida de Fourier (FFT) sobre la respuestas al
impulso en el dominio del tiempo de cada recinto. A cada respuesta temporal se le realizo un recorte temporal
especifico con la finalidad solo contar con el registro de
la información mas relevante de cada localidad. A su vez,
cada recorte temporal contó con la misma duración, cuyo valor buscó ser lo suficientemente amplio como para
que cada señal logre brindar toda la información relevante contenida (la extinción temporal que se considero mas
acertado para estos experimentos en particular fue de 0.5
segundos). Una vez realizadas todas estas modificaciones
pertinentes, se aplicaba la FFT sobre las respuestas temporales para obtener cada respuesta frecuencial en particular.
Al ya contar con cada respuesta frecuencial, se procedió
a restringir las mismas dentro de un rango de 20 Hz a 20
kHz, el cual es el rango de frecuencia auditiva humana
y el principal motivo por el que se realiza este corte (no
resulta de interés analizar el efecto que produce el sistema sobre el sonido dentro de registros nos perceptibles
por las persona). A esta rango frecuencial seleccionado
lo dividimos en sus tres estancias: frecuencia baja (20 Hz
a 200 Hz), la cual está asociada con tonos graves y sonidos profundos, frecuencia media (200 Hz a 2 kHz), la
cual es fundamental para la percepción de la claridad y
la presencia en muchos sonidos como la voz humana y la
frecuencia alta (2 kHz a 20 kHz), la cual se relaciona con
tonos agudos y sonidos brillantes. La justificación detrás
de estas partición particular se encuentra en que estas
distinciones permiten proporcionar información mas detallada sobre la influencia del sistema sobre las diferentes
componentes de la señales de sonido (alteración por presión acústica de las bajas frecuencias, reflexiones y reverberación sobre las medias, atenuación por absorción de
las altas, entre otros).
Como ultimas aclaraciones, cabe exponer que las comparaciones entre los recintos y el salón de clases se hicieron
solamente teniendo en cuenta la respuesta al Sweep del
mismo, tanto con mochilas como sin mochilas. La elección de solo utilizar las respuestas al barrido frecuencial
se basa en que el mismo fue la señal de entrada del resto
de los recintos analizados, por lo que una comparación
con las respuestas sobre los aplausos, globos o maderas
no brindarı́an información tan significativa o fácil de analizar. A su vez, se mantuvo la distinción entre el ambiente
vació de objetos y lleno de objetos debido a que el análisis
del recinto vació brinda la posibilidad de obtener comparaciones con la forma ideal del sistema mientras que el
ambiente con objetos proporciona comparaciones con el
estado habitual del sistema. Finalmente, también se decidió que aquellos recintos que contaran con una mayor
cantidad de grabaciones se diferenciarı́an entre si (la distancia entre fuente y receptor de la señal era diferente),
lo cual tiene como propósito permitir la visualización de
los efectos provocados por distintas distancias de grabación (reverberación, reflexiones, saturación, etc).
3.
Resultados y Análisis
A continuación, se presentan los datos de la métrica aplicada entre todos los recintos y el salón de clases con
mochilas.
Recintos
Cancha de tenis
Interior de mina
Túnel ferrov. (5 m)
Túnel ferrov. (10 m)
Bosque (ver.) (7.2 m)
Bosque (ver.) (9 m)
Bosque (ver.) (11 m)
Bosque (inv.) (7.2 m)
Bosque (inv.) (9 m)
Bosque (inv.) (11 m)
Reactor Nuclear
Iglesia (4.5 m)
Iglesia (5.2 m)
Iglesia (13.45 m)
Polideportivo
Almacén Vacı́o
Sala de mecanografı́a
Valle con colinas
Monumento
Usina del Arte
LF
0.076
0.071
0.069
0.067
0.112
0.065
0.092
0.121
0.168
0.140
0.064
0.094
0.053
0.057
0.078
0.082
0.078
0.102
0.092
0.062
MF
0.049
0.062
0.052
0.047
0.049
0.048
0.109
0.140
0.198
0.152
0.025
0.043
0.031
0.030
0.057
0.056
0.065
0.066
0.068
0.026
HF
0.026
0.056
0.033
0.033
0.034
0.038
0.035
0.070
0.080
0.065
0.026
0.034
0.134
0.035
0.034
0.027
0.023
0.086
0.033
0.032
Tabla I: Error Cuadrático Medio (MSE) entre las respuestas en frecuencia de los diferentes recintos y el salón
de clases (Aula 17 ) con mochilas en frecuencia baja LF
(20 Hz a 200 Hz), media MF (200 Hz a 2 kHz) y alta
HF (2 kHz a 20 kHz).
Como se puede observar en la tabla, en promedio el recinto que responde al barrido sinusoidal de forma mas
parecida al salón de clases es la Iglesia, especı́ficamente a la mayor distancia de grabación posible (13.45 m).
Hace sentido que ambas respuestas resulten tan parecidas debido a la alta similitud que tiene la construcción
acústica de ambos recintos. En primer lugar, ambos lugares tienden a ser espacios con un volumen significativo y
constituidos por superficies reflectantes (paredes, techos
y suelos), lo cual produce que el sonido pueda propagarse
con mayor facilidad y mas distancia a la vez que se produce reverberación prolongada y resonancia especifica de
las frecuencias medias en el ambiente, lo cual es buscado para conseguir que la voz del orador presente en el
recinto pueda ser escuchada por todas las personas que
allı́ se encuentran con la mayor claridad posible (que el
error mas bajo de las comparaciones se de en frecuencias
14
medias no es una casualidad sino que es producto de la
búsqueda de ambos recintos por enaltecer las frecuencias
medias). Ahora hablando sobre las diferencias entre ambos recintos, la mas significativa la podemos encontrar
a la hora de estudiar sus respuestas en baja frecuencia
(donde encontramos la mayor grado de error entre ambas). Esto se debe a que en las iglesia es muy buscada la
reverberación y amplificación de las frecuencias bajas debido a que también se prioriza que el sonido emitido por
los instrumentos (los cuales rondan las frecuencias bajas
y medias) sea escuchado con la mayor claridad posible
por el publico presente a diferencia de un salón de clases,
el cual busca que estas frecuencias se atosiguen por medio
de su absorción atreves del mobiliario o los materiales de
construcción que componen al ambiente.
Recintos
Cancha de tenis
Interior de mina
Túnel ferrov. (5 m)
Túnel ferrov. (10 m)
Bosque (ver.) (7.2 m)
Bosque (ver.) (9 m)
Bosque (ver.) (11 m)
Bosque (inv.) (7.2 m)
Bosque (inv.) (9 m)
Bosque (inv.) (11 m)
Reactor Nuclear
Iglesia (4.5 m)
Iglesia (5.2 m)
Iglesia (13.45 m)
Polideportivo
Almacén Vacı́o
Sala de mecanografı́a
Valle con colinas
Monumento
Usina del Arte
LF
0.075
0.066
0.072
0.069
0.115
0.069
0.087
0.114
0.151
0.126
0.066
0.085
0.184
0.057
0.073
0.075
0.077
0.101
0.087
0.060
MF
0.047
0.057
0.051
0.045
0.048
0.045
0.100
0.129
0.394
0.332
0.121
0.154
0.132
0.134
0.178
0.178
0.193
0.183
0.205
0.126
HF
0.016
0.050
0.013
0.015
0.018
0.118
0.114
0.197
0.213
0.185
0.068
0.072
0.074
0.074
0.088
0.062
0.077
0.215
0.182
0.074
Tabla II: Error Cuadrático Medio (MSE) entre las respuestas en frecuencia de los diferentes recintos y el salón
de clases (Aula 17 ) sin mochilas en frecuencia baja LF
(20 Hz a 200 Hz), media MF (200 Hz a 2 kHz) y alta
HF (2 kHz a 20 kHz).
Por otra parte, se puede dilucidar que las regiones con
mayor error son los bosques (tanto las grabaciones hechas
en verano como la hechas en inviernos). Esto también se
justifica en base a la constitución acústica de ambos lugares. Mientras un salón de clases busca amplificar las
frecuencias medias y reducir las bajas y altas a partir
de su composición estructural, un bosque no es capaz de
absorber de sobre manera ninguna de las frecuencias por
medio de los objetos que componen el entorno (arboles,
piedras, arbustos, etc) a la vez que al no ser una ambiente cerrado es incapaz de generar una efecto significativo
de reverberación y reflexión, lo que genera que el sonido
se desperece rápidamente y no pueda alcanzar grandes
distancias.
En comparación con lo analizado en el caso anterior, se
puede encontrar que la tendencia de que aquellos lugares
mas cerrados como lo son la iglesia, la Usina del Arte
o el interior de la mina siguen siendo los lugares que en
promedio cuentan con menor error mientras que los lugares mas abiertos como el bosque o el valle con colinas
presentan un mayor grado de error. El cambio mas significativo que se puede encontrar es el gran aumentos
de error que sufren todos los recintos principalmente en
frecuencia media. Esta cambio pudo haberse producido
debido a la presencia de una mayor cantidad de energı́a
general dentro de la respuestas del salón sin mochilas en
comparación con el salón con presencia de mochilas.
V.
A continuación, se presentan los datos de la métrica aplicada entre todos los recintos y el salón de clases sin
mochilas.
Conclusiones
En relación con el análisis de las caracterı́sticas de las
fuentes, los resultados de mayor relevancia que se presentaron fueron los que se detallan a continuación. En
primer lugar, se mostró que todos los impulsos, el de
globos, el de aplausos y el de maderas poseen la misma
estructura general. Un pico al comienzo cerca de los 1000
hertz, una decrecimiento lineal común hasta 20000 hertz
y una caı́da drástica para mayores frecuencias. Ası́mismo,
se observó la presencia de una ’meseta’ o nivel de decibeles constante que se repitió para las tres fuentes, pero
para distintos valores de frecuencias. Asimismo, se refutó
con la evidencia empı́rica lo que en un principio se suposo
sobre la fuente que presentarı́a más desvı́o. Mientras se
creyó que los globos contendrı́an mayor incerteza, los da-
15
tos indicaron que quien presentó resultados más variados
fueron los aplausos. Por último, se estudió y demostró
cómo, a partir de la convolución con un filtro inverso, se
transformó un sine sweep en un impulso similar a una
delta.
cuencia son parecidos, al dar valores de la energı́a muy
similares en ambos casos. A su vez, se observó el barrido
frecuencia (obtenido en la medición) viendo su amplitud
encontrando como la señal de origen se encontraba distorsionada, razón por la que se tuvo que aplicar un filtro
inverso logrando ası́ corregir las distorsiones.
Con lo que respecta al análisis de las respuestas al impulso para los diferentes tipos de señales, tomando el caso de
la grabación de las muestras con y sin mochilas en el aula
(8), se concluyó como el efecto de absorción de la energı́a
que ejercı́an tanto las mochilas como las camperas era
poco determinante a la hora de comparar espectros entre cada respuesta de cada señal (contrastando la energı́a
medida en decibeles (3)). Seguido a esto, se analizó la eficacia del aula (9) para la reproducción de los sonidos de
la voz humando (tomando en cuenta el modelo de medición armado (8)) llegando a que se trata de un buen
lugar para dar clases (al no atenuarse tanto la energı́a en
los intervalos de baja frecuencia como si en los rangos de
media y alta). Por otro lado, se realizó una comparación
entre espectros de los resultados obtenidos tanto del primer experimento (analizando las fuentes de las señales)
como del segundo (estudiando las respuestas al impulso del mismo tipo de señales) llegando a la conclusión
de como en ambos casos los resultados obtenidos en fre-
Dentro de lo que abarcó el análisis y comparación de la
respuesta al impulso de los diferentes recintos, se logró
concluir que la métrica propuesta resulto ser de gran utilidad a la hora de realizar las comparaciones debido a
su gran impacto sobre los errores grandes y la profundidad de análisis que permite el analizar el impacto de los
sistemas en 3 regiones de frecuencias diferentes. En base
a los resultados, se pudo determinar que el recinto mas
parecido al salón de clases Aula 17 es la iglesia, a la vez
que aquellos recintos que eran mas cerrados y que presentan mayor capacidad de reverberación y reflexión como
el interior de una mina o la Usina del arte también conseguı́an buenas métricas de error. Por otra parte, se llegó
a la conclusión de que el recinto menos parecido al salón
de clases era el bosque, que al igual que otros sistemas
como el valle, debe sus mala puntuación a la propiedad
de ser un ambiente muy abierto y, en consecuencia, con
poca capacidad de reflexión o reverberación.
[1] B. y Kjaer, Cómo afecta la meteorologı́a a las medidas de
ruido ambiental (2001).
[2] Sonido, temperatura y humedad (2015).
[3] Explicación del teorema de muestreo de nyquist sin ecuaciones (2020).
[4] ¿cómo es la frecuencia en la voz humana? (2023).
[5] Absorción y reverberación, (2016).
Descargar