Las ondas mecánicas son aquellas que necesitan de un medio

Anuncio
PRINCIPIOS DE AUDIO
JORGE HERNÁN JARAMILLO HOYOS
UNIVERSIDAD PONTIFICIA BOLIVARIANA
FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
MEDELLÍN
2005
PRINCIPIOS DE AUDIO
JORGE HERNÁN JARAMILLO HOYOS
Trabajo de grado para optar al título de Ingeniero Electrónico
Director
José Ricardo Zapata
Ingeniero Electrónico
UNIVERSIDAD PONTIFICIA BOLIVARIANA
FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
MEDELLÍN
2005
Nota de aceptación
__________________________________
__________________________________
__________________________________
__________________________________
__________________________________
Presidente del jurado
__________________________________
Jurado
__________________________________
Jurado
Medellín, Julio 2005
AGRADECIMIENTOS
Al Ing. José Ricardo Zapata por sus orientaciones al dirigir este proyecto.
A la Universidad Pontificia Bolivariana formadora integral de excelentes ingenieros.
A mis padres, soporte incondicional en todas mis actividades.
CONTENIDO
pág.
INTRODUCCIÓN
1
1. INTRODUCCIÓN AL SONIDO
2
1.1 EL SONIDO COMO MOVIMIENTO ONDULATORIO
3
1.1.1 Características del movimiento ondulatorio
3
1.1.2 Naturaleza del sonido
5
1.1.3 Características de las ondas en el tiempo y en la frecuencia
8
1.1.4 Descripción matemática de las ondas
11
1.1.5 Tipos de ondas según su geometría
12
1.1.6 Ondas estacionarias
14
1.1.7 Principios de propagación de las ondas
17
1.1.8 Interacción de las ondas con el medio
19
1.1.9 Parámetros físicos y unidades de medida del sonido
24
1.2 VOZ HUMANA
28
1.2.1 Formantes
30
1.2.2 Rango dinámico y de frecuencia
30
1.2.3 Características adicionales de la voz
31
1.3 SISTEMA AUDITIVO
33
1.3.1 Oído externo
33
1.3.2 Oído medio
34
1.3.3 Respuesta en frecuencia del oído
35
1.3.4 Oído interno
36
2. ACÚSTICA
38
2.1 SEÑALES ACÚSTICAS
39
2.2 PSICOACÚSTICA
41
2.2.1 Características de la respuesta humana
41
2.2.2 Sonoridad o percepción de la intensidad
42
2.2.3 Altura
48
2.2.4 Timbre
50
2.2.5 Direccionalidad y espacialidad
50
2.2.6 Enmascaramiento
53
2.3 ACÚSTICA MUSICAL
58
2.3.1 Consonancia y disonancia
58
2.3.2 Escalas
61
2.3.3 Instrumentos musicales
66
2.4 ACÚSTICA ARQUITECTÓNICA
75
2.4.1 Campo sonoro
76
2.4.2 Acústica de grandes recintos
84
2.4.3 Materiales absorbentes acústicos
91
2.4.4 Acústica de pequeños recintos
94
2.4.5 Dispositivos para el control acústico
99
2.4.6 Características generales en el diseño de recintos
106
2.5 RUIDO ACÚSTICO
110
2.5.1 Tipos de ruido acústico
110
2.5.2 Fuentes de ruido
113
2.5.3 Cuantificación del ruido
117
2.5.4 Criterios de caracterización del ruido
118
2.5.5 Efectos del ruido sobre el hombre
119
3. ELECTROACÚSTICA Y PROCESAMIENTO DE AUDIO
121
3.1 MICRÓFONOS
122
3.1.1 Micrófonos de carbón
122
3.1.2 Micrófonos piezoeléctricos
123
3.1.3 Micrófonos dinámicos
124
3.1.4 Micrófonos capacitivos
127
3.1.5 Micrófonos Electret
128
3.1.6 Micrófonos de presión y de gradiente de presión
129
3.1.7 Parámetros de los micrófonos
131
3.1.8 Micrófonos para aplicaciones
141
3.2 ALTAVOCES
143
3.2.1 Clasificación de los altavoces (según mecanismo de transducción)
143
3.2.2 Cajas acústicas
147
3.2.3 Materiales de las cajas acústicas
155
3.2.4 Impedancia de los altavoces
156
3.2.5 Parámetros de Thiele-Small
158
3.2.6 Sensibilidad
160
3.2.7 Respuesta en frecuencia
161
3.2.8 Direccionalidad
162
3.2.9 Especificaciones de potencia
164
3.2.10 Distorsión armónica
166
3.2.11 Clasificación de los altavoces (según el rango de frecuencias)
167
3.2.12 Configuración y cuidado de los altavoces
169
3.3 AMPLIFICADORES
170
3.3.1 Amplificadores con transistores y con tubos de vacío
170
3.3.2 Características generales de los amplificadores
173
3.3.3 Preamplificadores
182
3.3.4 Amplificadores de potencia
184
3.3.5 Multiamplificación
186
3.4 FILTROS Y ECUALIZADORES
187
3.4.1 Filtros análogos
187
3.4.2 Clasificación según su banda de operación
188
3.4.3 Diseño de filtros
189
3.4.4 Filtros digitales
191
3.4.5 Filtros adaptativos
192
3.4.6 Redes divisoras de frecuencia
193
3.4.7 Ecualizadores
195
3.5 UNIDADES DINÁMICAS
199
3.5.1 Compresores
200
3.5.2 Limitadores
203
3.5.3 Compuertas
205
3.5.4 Expansores
207
3.6 AUDIO DIGITAL
209
3.6.1 Conversión análoga-digital
209
3.6.2 PCM
211
3.6.3 Dither
212
3.6.4 Efectos de audio digital
212
4. FORMATOS DE GRABACIÓN
217
4.1 ORÍGENES
217
4.1.1 Cilindro de Edison
217
4.1.2 Alambre
218
4.1.3 Gramófono
218
4.1.4 Disco 78
219
4.1.5 Disco de vinil
219
4.2 REGISTRO MAGNÉTICO ANÁLOGO
220
4.2.1 Grabación magnética
221
4.2.2 Reproducción magnética
222
4.2.3 Factores que intervienen en el proceso de grabación/reproducción
222
4.2.4 Componentes de las cintas magnéticas
223
4.2.5 Formatos
224
4.3 REGISTRO DIGITAL
228
4.3.1 Compact disc
229
4.3.2 Digital Audio Tape
231
4.3.3 Digital Compact Cassette
232
4.3.4 DASH
232
4.3.5 Minidisc
233
4.3.6 DVD
233
4.3.7 Blu-Ray
234
4.3.8 HDVD
235
5. CONCLUSIONES
236
BIBLIOGRAFÍA
237
ANEXOS
238
LISTA DE TABLAS
pág
Tabla 1. Rango dinámico de diferentes voces
31
Tabla 2. División del espectro en bandas críticas
47
Tabla 3. Frecuencias de las notas musicales
65
Tabla 4. Coeficiente de absorción para diversos materiales
93
Tabla 5. PT y STC para distintos materiales
109
Tabla 6. Características direccionales de diversos patrones
136
Tabla 7. Conexión balanceada
139
Tabla 8. Algunos efectos en serie y en paralelo
213
Tabla 9. Velocidades de transferencia para CD convencional
231
LISTA DE FIGURAS
pág
Figura 1. Onda senoidal con algunas de sus características
5
Figura2. Vibración de una lengüeta
7
Figura 3. Onda de presión (sonora)
7
Figura 4. Envolvente ADSR en el tiempo
8
Figura 5. Ondas periódicas
9
Figura 6. Espectro de frecuencia
11
Figura 7. Onda plana
13
Figura 8. Onda esférica
13
Figura 9. Ondas estacionarias en una cuerda
14
Figura 10. Ondas estacionarias en un tubo abierto
16
Figura 11. Ondas estacionarias en un tubo cerrado
16
Figura 12. Principio de Huygens
18
Figura 13. Reflexión sobre una superficie plana
19
Figura 14. Refracción de ondas
20
Figura 15. Tubo de Quincke
20
Figura 16. Patrón de difracción
21
Figura 17. Diagrama del tracto vocal
29
Figura 18. Oído externo
34
Figura 19. Oído medio
35
Figura 20. Respuesta en frecuencia del oído
36
Figura 21. Diagrama completo del oído
37
Figura 22. Umbral de audición en función de la frecuencia
43
Figura 23. Curvas de Fletcher y Munson
44
Figura 24. Relación entre nivel de sonoridad y sonoridad
46
Figura 25. Altura en función de la frecuencia
49
Figura 26. Experimento ilustrando el efecto Haas
51
Figura 27. Enmascaramiento temporal
54
Figura 28. Patrón de enmascaramiento del ruido blanco a varias presiones sonoras
55
Figura 29. Patrón de enmascaramiento para bandas de ruido
55
Figura 30. Patrón de enmascaramiento en función del nivel de presión sonora
56
Figura 31. Componentes armónicos de las notas musicales la y mi
60
Figura 32. Algunos intervalos musicales
60
Figura 33. Construcción de la escala natural
63
Figura 34. Instrumentos de percusión
68
Figura 35. Instrumentos de cuerda
70
Figura 36. Instrumentos de viento
73
Figura 37. Sistema MIDI
74
Figura 38. Estructura del campo sonoro en el eje del tiempo
79
Figura 39. Campo directo, campo reverberante y distancia crítica
83
Figura 40. Aplicación del método de “ray-tracing” en el Royal Albert Hall
86
Figura 41. Tiempo de reverberación óptimo en función del volumen para varias salas
89
Figura 42. Montaje de un material poroso a una distancia de una estructura rígida
92
Figura 43. Material absorbente en forma de cuña anecoica
94
Figura 44. Recinto rectangular para analizar las frecuencias de resonancia
96
Figura 45. Resonador de Helmholtz
100
Figura 46. Pánel resonante
100
Figura 47. Difusión sobre una superficie convexa
102
Figura 48. Patrón de difracción de un difusor por secuencias numéricas
102
Figura 49. Difusor de residuo cuadrático
104
Figura 50. Difusor Birradial
105
Figura 51. Difusores perforados
106
Figura 52. Estructura para el aislamiento acústico
108
Figura 53. Ruido aleatorio
110
Figura 54 Ruido blanco
111
Figura 55. Ruido rosa
111
Figura 56. Ruido continuo constante
111
Figura 57. Ruido continuo intermitente
112
Figura 58. Ruido fluctuante periódicamente
112
Figura 59. Ruido fluctuante no periódico
112
Figura 60. Ruido impulsivo
113
Figura 61. Micrófono de carbón
123
Figura 62. Respuesta en frecuencia de los micrófonos de carbón
123
Figura 63. Estructura interna de un micrófono piezoeléctrico
124
Figura 64. Respuesta en frecuencia de un micrófono piezoeléctrico
124
Figura 65. Micrófono de bobina móvil
125
Figura 66. Micrófono de cinta
126
Figura 67. Micrófono capacitivo
127
Figura 68. Micrófono Electret
128
Figura 69. Diafragma de un micrófono de gradiente de presión
130
Figura 70. Patrón bidireccional de un micrófono de gradiente de presión
130
Figura 71. Respuesta en frecuencia de un micrófono
132
Figura 72. Patrones polares de direccionalidad
135
Figura 73. Equivalente circuital de un micrófono conectado a un amplificador
138
Figura 74. Micrófono de Lavaliere
141
Figura 75. Micrófono de cañón
141
Figura 76. Micrófono de contacto
142
Figura 77. Micrófono parabólico
142
Figura 78. Micrófono inalámbrico
142
Figura 79. Corte transversal de un altavoz de bobina móvil
144
Figura 80. Altavoz de cinta
146
Figura 81. Estructura de un altavoz electrostático
146
Figura 82. Fenómeno del corto acústico
148
Figura 83. Bafle infinito
149
Figura 84. Caja sellada
149
Figura 85. Caja “Bass-reflex”
149
Figura 86. Bafles comerciales con radiador pasivo
150
Figura 87. Bafles comerciales con sistema ELF
152
Figura 88. Caja de carga simétrica
153
Figura 89. Caja laberinto
154
Figura 90. Caja línea de Tx.
154
Figura 91. Diagrama típico de impedancia de un altavoz
157
Figura 92. Ejemplo de un sistema eléctrico para modelar un altavoz con caja
“bass-reflex”
159
Figura 93. Respuesta en frecuencia de tres altavoces para graves
161
Figura 94. Patrón direccional de un altavoz en función de la frecuencia
162
Figura 95. Bocina que acopla dos medios a y b
163
Figura 96. Altavoces para bajos “woofers”
167
Figura 97. Altavoz para medios “squawker”
168
Figura 98. Altavoz para agudos “tweeter”
168
Figura 99. Transistor BJT
171
Figura 100. Tubo de vacío
171
Figura 101. Esquema de preamplificación y amplificación
175
Figura 102. Modelo circuital de conexión entre un generador y un amplificador
180
Figura 103. Filtro pasabajos ideal
189
Figura 104. Sistema multiamplificado
194
Figura 105. Control de tonos
195
Figura 106. Ecualizador gráfico
196
Figura 107. Esquema del funcionamiento de un compresor
200
Figura 108. Relación entrada-salida para un compresor
201
Figura 109. Envolvente para la compresión
202
Figura 110. Relación entrada-salida para un limitador
204
Figura 111. Funcionamiento de una compuerta
205
Figura 112. Compuerta con dos umbrales
206
Figura 113. Muestreo de una onda senoidal
210
Figura 114. Cuantización y codificación de una muestra
211
Figura 115. Esquema general de un procesador de efecto
212
Figura 116. Retardo digital
213
Figura 117. Eco sencillo
213
Figura 118. Eco múltiple
214
Figura 119. Trémolo
214
Figura 120. Vibrato
215
Figura 121. Coro
215
Figura 122. Wah-wah
215
Figura 123. Phaser
216
Figura 124. Fonógrafo
217
Figura 125. Cilindros de Edison
218
Figura 126. Gramófono
218
Figura 127. Disco 78
219
Figura 128. Disco de vinil
220
Figura 129. Mecanismo de grabación del cabezal sobre la cinta
222
Figura 130. Cassette RCA
224
Figura 131. Cartucho de ocho pistas
225
Figura 132. Play-tape
226
Figura 133. Audio Cassette Compacto
227
Figura 134. Microcassette
227
Figura 135. Compact disc
231
Figura 136. DAT (digital audio tape)
232
Figura 137. Minidisc
233
Figura 138. DVD
234
Figura 139. Blu-ray
234
LISTA DE ANEXOS
pág
ANEXO A. Artículo publicable
237
ANEXO B. Proyecto de trabajo de grado
243
ANEXO C. Diario de campo
252
ANEXO D. Carta de cumplimiento de objetivos
254
GLOSARIO
ABSORCIÓN SONORA: acción que lleva a cabo una superficie en la cual se absorbe (y se
elimina) parte de la energía de la onda incidente.
ACÚSTICA: disciplina que estudia el sonido en sus diversos aspectos.
AISLAMIENTO ACÚSTICO: acción que lleva a cabo cualquier tabique divisorio entre dos
ambientes impidiendo en mayor o menor medida el paso de energía acústica de uno a otro
lado.
ALIASING: es un tipo de distorsión que se produce cuando no se cumple el teorema del
muestreo (la frecuencia mínima de muestreo debe ser igual a dos veces a máxima
frecuencia presente en la señal). consiste en la aparición de frecuencias inexistentes en la
señal original.
ALTAVOZ: transductor que convierte señales eléctricas en sonido.
ALTURA: sensación de mayor o menor grado de agudeza de un sonido.
AMBIENCIA: sensación auditiva por la cual es posible tener una idea de las características
de un ambiente: paredes, posicionamiento de obstáculos, etc.
AMPLIFICADOR: dispositivo utilizado para aumentar el nivel de una señal.
AMPLITUD: valor máximo de una señal.
ANÁLOGO: cualidad de una variable física de evolucionar en el tiempo de forma continua.
ANCHO DE BANDA: diferencia entre las frecuencias máxima y mínima que permite pasar
un filtro pasabanda o un filtro cualquiera.
ARMÓNICO: cada componente de frecuencia en una señal que es múltiplo entero de la
frecuencia fundamental.
AUDIO: técnicas aplicadas al procesamiento y reproducción del sonido.
AUDIO DIGITAL: técnicas para el procesamiento, almacenamiento y reproducción de
señales sonoras basadas en la conversión de señales eléctricas a números.
BAFLE: caja acústica.
BANDA: un intervalo de frecuencias.
BANDA DE AUDIO: el intervalo de frecuencias comprendido entre 20Hz y 20kHz
BATIDO: variación de amplitud de la onda resultante de la superimposición de dos señales
de frecuencias próximas.
CABEZAL: dispositivo que contiene los transductores electromagnéticos que permiten
grabar, reproducir o borrar una cinta magnética.
CAJA ACÚSTICA: recinto para evitar la transferencia entre la onda de compresión
(delantera) y descompresión (trasera) de un altavoz de radiación directa.
CAMPO DIRECTO: parte del campo sonoro formada por todas aquellas ondas o frentes de
onda que aún no han experimentado ninguna reflexión.
CAMPO REVERBERANTE: parte del campo sonoro formada por aquellas ondas que han
sufrido al menos una reflexión.
CAMPO SONORO: forma en que varía o se distribuye el sonido en el tiempo y en el
espacio.
CD: disco compacto. disco de tecnología óptica para reproducción de audio digital de alta
calidad.
COEFICIENTE DE ABSORCIÓN SONORA: fracción de la energía sonora que incide
sobre un material o estructura superficial que resulta absorbido.
COMPRESOR: equipo que recibe una señal y reduce su rango dinámico en función de
parámetros ajustados por el usuario.
COMPUERTA: dispositivo que cierra la entrada cuando ésta no alcanza a tener un nivel
comparable al mínimo conocido de la señal, presumiendo que es ruido.
CONEXIÓN BALANCEADA: tipo de conexión que utiliza tres conductores, uno de ellos
conectado a tierra y los otros dos con tensiones opuestas.
CONSONANCIA: sensación auditiva generada por dos sonidos superpuestos que no
generan batidos.
CUÑAS ANECOICAS: terminación superficial en forma de cuñas de un material
absorbente acústico con el propósito de aumentar la superficie efectiva y por lo tanto el
coeficiente de absorción.
DAT: cinta para audio digital.
dB: símbolo de decibel.
DCC: cassette digital compacto.
DECIBEL: unidad convencional utilizada para la expresión logarítmica de relaciones de
dos magnitudes.
DESVANECIMIENTO: en un sonido, etapa final durante la cual la amplitud del sonido se
reduce hasta volverse despreciable.
DIAFONÍA: separación de canales.
DIAFRAGMA: en un micrófono, una lámina delgada que vibra en concordancia con la
onda sonora. en un altavoz, un pistón (generalmente en forma de cono) puesto a vibrar por
el excitador que genera el sonido.
DIRECCIONALIDAD: características del sonido en cuanto a la dirección de la cual
procede o hacia la cual se encuentra su fuente.
DISONANCIA: sensación auditiva generada por dos sonidos superpuestos que producen
batidos.
DISTORSIÓN: alteración de la forma de onda de una señal.
DITHER: ruido de bajo nivel agregado a una señal análoga previa al muestreo para mejorar
el ruido de digitalización.
ECO: reflexión del sonido que demora más de 100ms en volver a la fuente.
ECUALIZADOR: filtro formado por varias bandas en cada una de las cuales se puede
ajustar la ganancia o atenuación.
EFECTO: el resultado de cualquier procesmianto de una señal de audio diferente de la
transducción, la amplificación, la compresión y la ecualización.
EFECTO DOPPLER: aumento o disminución aparente de la frecuencia de una fuente
cuando ésta se encuentra en movimiento relativo respecto al receptor.
EFECTO HAAS: habilidad humana para identificar la dirección de procedencia de un
sonido a partir del primer frente de onda que llega a los oídos.
ELASTICIDAD: propiedad que tienen algunos materiales (como el aire por ejemplo) de
reestablecer su forma después de un cambio en su configuración.
ENMASCARAMIENTO: fenómeno psicoacústico en el cual un tono débil se vuelve
inaudible en presencia de otro más intenso cercano en frecuencia.
ENVOLVENTE: evolución de algún parámetro del sonido en el tiempo, típicamente su
amplitud.
ESPACIALIDAD: características del sonido relativas a su interacción con el espacio en el
que se halla confinado.
ESPECTRO: amplitudes de las diversas componentes senoidales de un sonido.
EXCITADOR: en un altavoz, la unidad motriz que puede ser de naturaleza
electrodinámica, electrostática o piezoeléctrica.
EXPANSOR: dispositivo que aumenta el rango dinámico de la señal que recibe.
FACTOR DE AMORTIGUACIÓN: cociente entre la impedancia de carga de un
amplificador y su impedancia interna.
FADER: atenuador.
FASE: medida del retraso o adelanto de una señal respecto a otra.
FILTRO: dispositivo con la capacidad de seleccionar partes de una señal en función de sus
frecuencias.
FORMANTES: resonancias características de una voz o instrumento que determinan su
timbre.
FRECUENCIA: cantidad de ciclos por unidad de tiempo.
FUENTE FANTASMA: fuente de tensión que utiliza para alimentar y polarizar elementos
en los micrófonos capacitivos a través de los mismos cables que llevan la señal.
GANANCIA: cociente entre la señal de salida y la de entrada en un amplificador,
generalmente expresada en dB.
IMPEDANCIA ACÚSTICA: cociente entre la presión sonora y la velocidad volumétrica de
las partículas.
INTENSIDAD SONORA: energía sonora que atraviesa una superficie por unidad de
tiempo y por unidad de área.
INTERVALO: en música, la diferencia entre dos notas de alturas distintas (exceptuando el
unísono).
LFO: oscilador de baja frecuencia.
LIMITADOR: dispositivo que ajusta la ganancia de manera que la señal no pueda umentar
por encima de cirto nivel.
LONGITUD DE ONDA: distancia en el espacio entre dos picos sucesivos de una onda
sonora periódica.
MICRÓFONO: dispositivo transductor que transforma la señal sonora en señal eléctrica.
MINIDISC: formato de grabación y reproducción digital basado en tecnología óptica o
magnetoóptica.
MODOS NORMALES: frecuencias de resonancia en un recinto.
MODULACIÓN: variación de un parámetro de un sistema eléctrónico.
MOMÉNTUM: cantidad física que relaciona la masa con la velocidad de un sistema de
partículas.
MUESTREO: acción de tomar muestras de una señal a intervalos regulares.
NIVEL: es la expresión logarítmica de una magnitud repecto a un valor de referencia.
OCTAVA: intervalo correspondiente a multiplicar la frecuencia por 2.
ONDA SONORA: perturbación de la presión de equilibrio del aire que se propaga en un
medio elástico.
PARLANTE: altavoz.
PCM: modulación de código de impulsos.
PERIÓDICO: se dice de un fenómeno que repite sus propiedades en ciertos intervalos de
tiempo fijos.
PERÍODO: tiempo que demora en completarse un ciclo una señal periódica.
PIEZOELECTRICIDAD: fenómeno que tiene lugar al deformarse ciertos cristales por el
cual se genera una tensión entre sus extremos:
PISTA: cada sector en una cinta magnética en el cual se graba una señal en general
independiente de las grabadas en otras pistas.
POTENCIA ACÚSTICA: energía acústica irradiada por unidad de tiempo. [=] watts
PREAMPLIFICADOR: amplificador para elevar el nivel de una señal de bajo nivel como
las señales de los micrófonos hasta el nivel de línea.
PRESIÓN SONORA: diferencia entre la presión de compresión o descompresión de una
onda sonora y la presión de equilibrio del aire.
RANGO DINÁMICO: diferencia en dB entre los niveles máximo y mínimo de una señal.
REFLEXIÓN: se refiere a la existencia de una segunda sonora posterior a la incidencia de
una onda sonora sobre una superficie.
RESONANCIA: fenómeno por el cual en un sistema físico a cierta frecuencia la respuesta
es mayor.
REVERBERACIÓN: permanencia de un sonido en un ambiente depués de extinguida su
fuente a causa de múltiples reflexiones.
RUIDO: una señal no deseada con espectro continuo.
RUIDO ACÚSTICO: ruido ambiental debido a la superposición de una multitud de fuentes
distantes y próximas.
RUIDO BLANCO: ruido aproximadamente constante y uniforme en la frecuencia.
RUIDO ROSA: es el ruido blanco con una pendiente de –3cB. tiene igual energía por
octava dentro del rango de frecuencias audibles.
SATURACIÓN: estado de un dispositivo en el cual ante un aumento de excitación ya no se
produce un aumento en la respuesta.
SENSIBILIDAD: en un micrófono, relación entre la tensión generada y la presión sonora.
en un amplificador, tensión necesaria para producir la potencia especificada. en un altavoz,
el nivel de presión sonora obtenido a 1m frente al mismo cuando se aplica 1W de potencia.
SEÑAL: una magnitud física variable en el tiempo que transporta energía y/o información.
SONORIDAD: sensación que permite distinguir los sonidos más débiles de los sonidos
más fuertes.
SOSTENIMIENTO: en un sonido, tramo durante el cual la amplitud de la onda se mantiene
constante hasta que se desactive la nota correspondiente.
SQUAWKER: altavoz para reproducir frecuencias medias.
THD: distorsión total armónica. es una medida relativa de la energía contenida en los
armónicos de una señal.
TIMBRE: sensación que permite distinguir a los sonidos por su fuente.
TRANSDUCTOR: dispositivo que transforma una señal de una forma de energía a otra.
TWEETER: altavoz para reproducir frecuencias altas.
VCA: amplificador controlado por voltaje.
WAVELET: palabra utilizada para describir una pequeña onda que aparece solamente una
vez en el tiempo
WOOFER: altavoz para la reproducción de los sonidos graves.
RESUMEN
En este trabajo se presentan los contenidos más relevantes para un curso introductorio
dirigido a interesados en audio y en sistemas de sonido. La primera parte incluye una
introducción al sonido con énfasis en su carácter físico y ondulatorio. Aquí se muestran
aspectos fundamentales de la naturaleza del sonido, desde su generación hasta su
propagación en un medio elástico. Se estudian también los parámetros básicos de este
fenómeno físico que servirán de base conceptual para capítulos posteriores. Igualmente
se incluyen los mecanismos humanos de transmisión y percepción: la voz humana y el
sistema auditivo, teniendo en cuenta características físicas y fisiológicas. Posterior al
capítulo introductorio, se presenta el estudio formal de la acústica, como parte de la
física que estudia la producción, transmisión y percepción del sonido. Siendo la
acústica una ciencia amplia y multidisciplinaria se escogieron únicamente cuatro temas,
considerados los más relevantes para un curso introductorio: psicoacústica, acústica
arquitectónica, acústica musical y el ruido acústico. La psicoacústica es el estudio de
como el ser humano percibe subjetivamente las características físicas sonoras y como el
cerebro procesa dicha información. La acústica arquitectónica estudia los elementos
para el diseño óptimo de recintos (salas de concierto, salas de grabación, iglesias,
edificios, etc.) según lineamientos acústicos preestablecidos. La acústica musical
estudia las relaciones físicas existentes en la música, haciendo particular énfasis en la
música occidental. En el capítulo de ruido acústico se define este fenómeno, su
clasificación, su fuente, y los daños al ser humano. Luego de estudiar la acústica, se
describen los elementos procesadores de audio. Estos son dispositivos electrónicos o
electroacústicos que de alguna forma modifican o transforman el sonido para alguna
aplicación en un sistema. Entre éstos se encuentran los micrófonos, los parlantes y los
amplificadores. Además se hace una introducción al audio digital, sistemas de audio
refinados utilizando técnicas digitales y los avances de la microelectrónica. Por último,
se introducen los formatos de grabación modernos además de una pequeña reseña
histórica de los orígenes de la grabación sonora.
1
INTRODUCCIÓN
El trabajo “Principios de Audio” es una propuesta para la comunidad académica que
busca la integración de diversos y selectos temas de sonido y acústica para continuar
con la iniciativa de crear una nueva línea de formación en audio en la Universidad
Pontificia Bolivariana. No habían existido hasta ahora materias que trataran de manera
sistemática y exhaustiva los sistemas de audio y en el ámbito regional no se había
trabajado cursos de este tipo. Por esta razón se origina la propuesta de documentar el
curso Principios de Audio con el fin de apoyar esta etapa pionera e introductoria de la
nueva línea de Audio. Este trabajo es fundamentalmente fruto de una labor investigativa
propuesta por el director Ing. José Ricardo Zapata en la cual se destaca la utilización de
una multitud de recursos bibliográficos disponibles: libros, revistas especializadas,
notas de clase (Principios de Audio) y sitios en Internet. El resultado es una
recopilación de temas básicos e intermedios idóneos para un ingeniero que comienza el
estudio del sonido.
2
1. INTRODUCCIÓN AL SONIDO
Los fenómenos sonoros han formado parte del ambiente de la vida humana desde las
épocas más remotas en la historia. En esta sección se tratarán los principios físicos que
gobiernan los sistemas de sonido y la interacción del ser humano con él a través del habla y
de la escucha. Se introduce el carácter ondulatorio de los sonidos y los mecanismos del ser
humano para percibirlos. Los conceptos que se desarrollarán en este capítulo son
fundamentales para el entendimiento cabal de los posteriores.
3
1.1 EL SONIDO COMO MOVIMIENTO ONDULATORIO
Una onda es un ente físico que permite la propagación de energía entre dos puntos sin
necesidad de transferir masa. Las ondas mecánicas son aquellas que necesitan de un medio
elástico (aire por ejemplo) para su propagación. Existen dos tipos básicos de ondas
mecánicas:
-ondas longitudinales: Ondas en el cual el movimiento de las partículas es paralelo a la
dirección de propagación.
-ondas transversales: Ondas en el cual el movimiento de las partículas es perpendicular a la
dirección de propagación.
El sonido es un ejemplo de onda mecánica longitudinal y por eso de ahora en adelante se
referirá a este tipo de ondas.
1.1.1 Características del movimiento ondulatorio
Se puede definir un movimiento ondulatorio mediante dos propiedades básicas:
•
existe una propagación continua de energía
•
no hay desplazamiento de materia
El segundo punto significa que las partículas del medio solo vibran alrededor de una
posición de reposo o referencia, y se transfiere moméntum y energía sin necesidad del
movimiento físico del ente que la produce.
El sonido es una onda (longitudinal) y al serlo cumple con las dos propiedades anteriores.
También aplican los parámetros básicos de una onda en general, a saber: frecuencia,
longitud de onda, período, longitud de onda, velocidad, amplitud, fase, frecuencia angular.
4
Frecuencia: Un ciclo consiste en una expansión y una compresión del medio. La
frecuencia se define como el número de ciclos en el transcurso de un segundo. Se mide en
ciclos por segundo o hertz
f [=] Hz
Período: El período es la duración de un ciclo. El período T está relacionado con f así:
T=1/f. Se mide en segundos.
T[=] s
Longitud de onda: Es la distancia que separa dos perturbaciones sucesivas. Se mide en
metros y se representa por la letra griega λ.
λ=c/f [=] m
c: velocidad de la onda (m/s)
f: frecuencia de la onda (Hz)
Para el rango de audición, las longitudes de onda del sonido van desde 17.2m (para 20 Hz)
hasta 1.72cm(20kHz) ya que el espectro audible contiene las frecuencias entre 20Hz20kHz. (Nótese que frecuencia y longitud de onda son inversamente proporcionales.)
Velocidad: Las ondas (no las partículas) se propagan en el aire con una velocidad dada por:
V=distancia/tiempo=λ/Τ=λf [=]m/s.
Amplitud: Se refiere al valor máximo del desplazamiento de las partículas respecto a su
posición de reposo. Se mide en metros (m).
A[=]m
Fase: Es una medida del retraso o adelanto que tiene una onda respecto a una referencia
(puede ser otra onda). Se mide en radianes.
φ[=] rad
5
Frecuencia Angular: La frecuencia es una medida de cuantas veces una onda se “repite”
(atraviesa el mismo valor en el espacio o tiempo). Sin embargo, podemos pensar en una
onda como un ente que rota hasta volver a su posición original. Una rotación se caracteriza
por una revolución completa que equivale a 2π radianes. Si multiplicamos la frecuencia (f)
por 2π, obtenemos el número de radianes que el ente revoluciona en un segundo.
ω=2πf [=]rad/s
Utilizando los parámetros anteriores, una onda senoidal puede expresarse como:
y=Asen(ωt+φ) (función del tiempo)
y: amplitud en el tiempo
A: amplitud máxima
ω: frecuencia angular
y
T
.
A
t
φ
Figura 1 Onda senoidal con algunas de sus características
1.1.2 Naturaleza del sonido
El sonido tiene su origen en las vibraciones en un medio elástico, es decir, las vibraciones
deben ocurrir en un medio que sea capaz de transmitir esas vibraciones.
Estos son los dos elementos esenciales para la existencia de un sonido:
•
un ente vibrante
•
un medio con capacidad de transmitir esas vibraciones
6
(Existe un tercer elemento, la capacidad humana de percibir esas vibraciones, relacionado
con un campo fundamental de la acústica (la psicoacústica) el cual será tratado
posteriormente.)
El ente vibrante puede ser de naturaleza muy diversa como: las cuerdas vocales en la
garganta, las cuerdas de un violín, una descarga eléctrica, golpes, pájaros, etc. El medio
también es de índole muy variada como aire, madera, agua, metal, etc. (siendo el aire el
medio elástico más común). A continuación se mostrará que el sonido está caracterizado
por variaciones de presión ocasionadas por algún ente vibrante.
1.1.2.1 Presión. La presión es una magnitud física muy importante en el estudio de las
ondas sonoras. La presión se define como fuerza por unidad de área. La unidad de presión
es Pa (pascales)[=]N/m2. La presión en el aire por ejemplo, determina el espacio físico que
separa las moléculas. Es decir, fluctuaciones en la presión implican cambios en la
separación de las moléculas. Las moléculas, en el aire, buscan su estado original de presión.
Una presión dada implica una separación particular de las moléculas. Si eliminamos la
presión, las moléculas buscarán su posición original o estado de reposo. Por ejemplo, si
estiramos un pedazo de caucho, este tiende a retomar su posición de equilibrio original
cuando es soltado. La propiedad que tienen algunos materiales de reintegrarse a su forma o
volumen original después de una deformación, se llama elasticidad.
Los gases, como el aire, también son elásticos. Como se había anotado anteriormente, la
elasticidad es la propiedad responsable de la transmisión de las vibraciones a través del
medio. Por ejemplo, si una capa de gas ejerce cierta presión, disminuye su volumen y
ocasiona un desequilibrio. Al cesar dicha fuerza (presión), el gas ocupará el volumen
original.
Un ejemplo:
Existe una lengüeta que actuará como fuente sonora (es decir, fuente que producirá las
vibraciones) El eje central es la posición de reposo o de equilibrio. Primero se inclina hasta
A y después llega hasta B, pasando por la línea de reposo. Esto se repite varias veces.
Cuando la lengüeta se mueve hacia A, la masa de aire circundante es alterada. Las
moléculas de aire delante de la lengüeta (hacia A) chocan contra las otras moléculas que
tienen delante(transfieren energía y moméntum) y se produce una compresión. Las
7
moléculas que están detrás sufren el efecto contrario; se dispersan hasta llenar más
volumen.
eje central
A
B
movimiento de la
lengüeta
Figura 2 Vibración de una lengüeta
En resumen, por un lado de la lengüeta se propagará una compresión y por el otro lado, una
descompresión. Cuando la lengüeta se mueva hacia B, ocurre esencialmente lo mismo solo
que en dirección contraria: en el lado hacia B aparecerá una compresión y en el lado hacia
A aparecerá una descompresión. Estas variaciones de presión en un medio elástico,
constituyen la onda sonora. Más específicamente , el sonido es el resultado de vibraciones
de moléculas de un medio en la misma dirección de propagación. Este tipo de ondas son
llamadas longitudinales. De ahora en adelante se utilizarán los términos onda y onda sonora
para hacer alusión a lo mismo, el sonido, a menos que se indique lo contrario.
1.1.2.2 Representación gráfica de las ondas sonoras. Las ondas sonoras son ondas
longitudinales de presión. Sin embargo, para poder representarlas gráficamente, se dibuja
una onda transversal ya que es más fácil de visualizar. Para hacer ésto, los movimientos
característicos de una onda longitudinal hacia adelante y hacia atrás se representan por
movimientos por encima y por detrás de una línea de referencia que corresponde a la
posición de reposo(presión de equilibrio del aire).
posición
de reposo
Figura 3 Onda de presión (sonora)
8
Las flechas en la figura representan los desplazamientos de las partículas de aire en sentido
longitudinal, aunque aparecen en la gráfica en sentido transversal (solamente por facilidad
visual).
1.1.3 Características de las ondas en el tiempo y en la frecuencia
El análisis de las ondas se puede realizar en el dominio del tiempo o en el dominio de la
frecuencia. El análisis en cada dominio tiene características complementarias y se puede
intercambiar de dominios utilizando las técnicas de Fourier que serán comentadas
brevemente.
1.1.3.1 Envolvente de amplitud en el tiempo. La envolvente de amplitud en el tiempo se
refiere a los cambios que sufre el sonido en un intervalo de tiempo respecto a un parámetro,
en este caso amplitud. La amplitud se refiere a alguna magnitud que cambia respecto a una
posición de referencia. En las ondas sonoras esta amplitud generalmente está dada por la
presión y está íntimamente relacionada con la intensidad sonora (parámetro físico del
sonido), que veremos oportunamente. Existen cuatro variables de interés al analizar la
envolvente de amplitud de una señal en el tiempo. Estas son el ataque (“attack”), caída
(“decay”), sostenimiento o sostenido (“sustain”) y desvanecimiento (“release”). Esta
envolvente se denomina ADSR(AttackDecaySustainRelease) por sus siglas en inglés.
Ataque se refiere al tiempo que transcurre desde el principio de un sonido hasta que éste
llega a su nivel máximo. Es la fase inicial de la envolvente. La caída comprende el tiempo
desde el ataque al nivel de mantenimiento (sostenimiento). El sostenimiento es el tiempo
durante el cual el sonido permanece invariable en la amplitud.
amplitud
Ataque
Caída
Sostenido Desvanecimiento
Figura 4 Envolvente ADSR en el tiempo
t
9
Finalmente, el desvanecimiento es el tiempo que tarda el sonido en pasar del sostenimiento
al nivel final, el nivel en que la amplitud es despreciable. Generalmente el desvanecimiento
comienza al soltar una nota, de un teclado por ejemplo.
1.1.3.2 Ondas periódicas. El período es otro parámetro que se puede identificar fácilmente
en el tiempo, pero es una característica de ondas periódicas solamente. Ondas periódicas
son aquellas que repiten su valor de amplitud para cada intervalo de tiempo. Es decir, se
cumple que F(t+nT)= F(t)
(n ∈ Z) T es llamado período primitivo de la señal. Ejemplos comunes de ondas periódicas
son : senoidal, cuadrada, triangular, diente de sierra, etc.
a)
b)
T
T
c)
d)
T
T
Figura 5 Ondas periódicas a) cuadrada b) triangular c)diente de sierra d)irregular
1.1.3.3 Espectro de frecuencia. Todas las ondas periódicas se pueden sintetizar a partir de
la función seno mediante el Análisis de Fourier. Jean-Baptiste Joseph Fourier, barón de
Auxerre (1768-1830), desarrolló un tipo de análisis matemático por el que cualquier onda
periódica compuesta, puede descomponerse en una suma de ondas senoidales de amplitud,
frecuencia y fase
adecuadas. Las frecuencias de estas ondas senoidales guardan una relación estrecha pues
son todas múltiplos enteros de la frecuencia fundamental. Es decir, cualquier función
10
periódica se puede escribir como una sumatoria (finita o no) de términos seno pues estas
funciones son base ortogonal para el espacio de las funciones periódicas. El espectro de
estas señales (es decir el conjunto de frecuencias asociadas) es discreto: contiene solo los
múltiplos enteros de la frecuencia fundamental. Esta es quizá la característica fundamental
de las ondas periódicas. A los múltiplos enteros de la frecuencia fundamental se les conoce
como armónicos de la señal. Una señal dada puede tener uno, varios, o todos los armónicos
de su frecuencia fundamental. Por ejemplo, una señal sinusoidal pura solo tiene un
componente de frecuencia: su frecuencia fundamental. De ahí la importancia de la función
seno en el Análisis de Fourier. La señal cuadrada solo contiene armónicos impares (es
decir, múltiplos impares de la frecuencia fundamental) mientras que una señal diente de
sierra los contiene todos. De esta forma podemos definir el espectro de una señal como el
conjunto de armónicos que la integran. Si se quiere analizar un sonido como un todo, se
debe analizar cada componente de frecuencia por separado, pues cada una tiene su
envolvente particular. Los armónicos de frecuencia alta tienden a atenuarse más
rápidamente que los de baja frecuencia.
Sin embargo, no todas las señales en la naturaleza son periódicas. Para el análisis de señales
aperiódicas se debe recurrir a otro tema del análisis de Fourier, llamado Transformada de
Fourier. Mediante este método es posible conocer el espectro de una señal arbitraria además
de su densidad espectral de potencia, útil en el análisis del ruido.
Existen varios tipos de espectros de acuerdo a la relación entre los armónicos y la
frecuencia fundamental:
Espectro armónico: Es un espectro que contiene armónicos múltiplos enteros de la
frecuencia fundamental. Es discreto.
Espectro inarmónico: Contiene frecuencias que no son múltiplos enteros de la frecuencia
fundamental. Estas componentes se denominan parciales. Generalmente, se le atribuye a
esto el sonido áspero.
Espectro continuo: Espectro cuyas componentes están demasiado cerca y puede
considerarse continuo. Este espectro es característico de señales aperiódicas como el ruido.
11
a)
amplitud
b)
amplitud
f (Hz)
10
20 30 40
50
60
f (Hz)
10
20 30 40
50
60
Figura 6 Espectro de frecuencias a) espectro de una señal periódica (discreto)
b) espectro de una señal de ruido (continuo)
1.1.4 Descripción matemática de las ondas
Como se había indicado anteriormente, una onda sonora es una perturbación en la presión
de un medio que provoca el movimiento de las moléculas alrededor de su posición de
equilibrio. La onda sonora, como una gran cantidad de ondas en la naturaleza, son solución
de la ecuación general (la demostración no se incluye):
c2 d 2u(x,y,z,t)=
∂ 2 u(x, y, z, t)
∂t 2
c: velocidad del sonido
u: onda función de x, y, z, t
d 2: operador laplaciano
Una solución de esta ecuación debe depender del espacio y del tiempo. Si restringimos el
movimiento a una sola dirección (eje x), se verifica que:
u(x,t)= Acos(kx-ωt) cumple con dicha ecuación, donde:
k=
2π
: número de ondas [=] rad/m
λ
ω: frecuencia angular [=] rad/s
A: amplitud de presión [=] Pa
12
En el caso del sonido, la onda u(x,t) es en realidad una onda de presión, y se podría
reemplazarla por p(x,t) (presión). Nótese que la solución de onda depende del espacio y del
tiempo.
1.1.5 Tipos de ondas según su geometría
Las ondas se pueden clasificar de acuerdo a su geometría. El criterio es la forma del frente
de onda. El frente de onda es el lugar geométrico de los puntos en un medio que se
encuentran en un mismo estado vibratorio en un instante dado. Dependiendo de la forma
del frente de onda, se tendrán distintos tipos de ondas: planas, esféricas y cilíndricas.
1.1.5.1 Ondas planas. Si las ondas tienen frentes de onda planos en una sola dirección, la
ecuación de onda se convierte en:
c
2
∂ 2 p(x, t) ∂ 2 p(x, t)
=
∂x 2
∂t 2
cuya solución general es p(x,t)= F (ct-x) + G(ct+x). F es una onda viajera en la dirección
positiva mientras que G es una onda viajera en la dirección negativa. Los frentes de onda de
estas ondas son planos. La característica más importante de una onda plana es su única
dirección de propagación, representada por un vector unitario u perpendicular al plano en la
dirección de propagación de la onda. El fenómeno de propagación de las ondas planas, ya
sea en dos dimensiones o en tres, es en realidad un problema unidimensional, pues solo
existe una dirección de propagación.
z
frente de onda
(plano)
vector en la
dirección de
propagación
x
13
Figura 7 Onda plana
1.1.5.2 Ondas esféricas. Si la vibración que genera el movimiento ondulatorio se origina
en un punto y se propaga con la misma velocidad en todas las direcciones, resultarán ondas
esféricas. Estas ondas son isotrópicas (radiación igual en todas las direcciones) y tienen
además simetría esférica (respecto al ángulo polar y el azimutal). Los frentes de onda son
esferas concéntricas con el punto donde se origina la vibración. En el caso de dos
dimensiones, los frentes de onda son circunferencias y las ondas son circulares.
Matemáticamente, la descripción de una onda esférica se reduce a (teniendo en cuenta la
simetría esférica):
c2
∂ 2 rp ∂ 2 rp
=
∂r 2
∂t 2
(solo depende de la componente radial y del tiempo).
La solución general es:
p(r,t)= f(r-ct)/r + g(r+ct)/r
De la solución es claro que la presión disminuye con el radio. Las ondas esféricas cobran
mucha importancia en el estudio del sonido, pues de su propagación dependen parámetros
sonoros importantes como la intensidad que se explicará oportunamente.
Figura 8 Onda esférica
1.1.5.3 Ondas cilíndricas. En las ondas cilíndricas, los frentes de onda son superficies
paralelas a una línea dada (el eje z) y es perpendicular al plano xy. Este tipo de onda es
14
producida cuando se tienen una serie de fuentes distribuidas uniformemente en el eje z,
todas oscilando en fase. La descripción matemática de estas ondas es:
2
c
∂ 2 rp
∂r 2
=
∂ 2 rp
∂t 2
(no existe dependencia en el ángulo azimutal o en la coordenada axial)
La solución de esta ecuación implica la utilización de la función de Bessel pero no son muy
relevantes en el estudio del sonido.
1.1.6 Ondas estacionarias
Un resultado muy especial ocurre cuando dos ondas idénticas (de igual frecuencia y
amplitud) que se mueven en direcciones opuestas son superpuestas. Cuando ambas ondas
están en fase, la onda resultante tendrá el doble de la amplitud, pero la misma longitud de
onda (período). Esto ocurre en t=0. Después de un t = T/4 (T es el período de ambas ondas),
las ondas se encuentran exactamente fuera de fase. Después en t=T/2, las ondas se
encuentran en fase nuevamente y la amplitud resultante es dos veces la amplitud original.
Después en t=3/4T, las ondas estarán desfasadas completamente, resultando en una onda de
amplitud nula. Finalmente, en t =T, cada onda se ha propagado una longitud de onda
completa en su dirección respectiva. En resumen, la onda resultante se conoce como
estacionaria, pues no viaja ni a la izquierda ni a la derecha, sino que oscila continuamente
entre dos extremos.
La onda pierde el carácter de viajera y se le conoce como estacionaria.
a)
t=0, T/2
b)
t=1/4T, 3/4T
Figura 9 Ondas estacionarias en una cuerda sujeta por dos extremos
15
1.1.6.1 Cuerdas. Para que existan ondas estacionarias en una cuerda de longitud L, se debe
cumplir la condición L= n
f=
λ
(n ∈ Z). Su frecuencia por ende va a ser:
2
nv
2L
La velocidad transversal en una cuerda es función de la tensión de la cuerda (T[=]N) y de
su densidad lineal (µ[=]kg/m) así:
v=
T
[=]m/s
µ
Combinando ambas ecuaciones se obtiene una expresión para la frecuencia:
f n=
n T
[=] Hz
2L µ
n corresponde al número armónico, es decir, el múltiplo de la frecuencia fundamental.
Las ondas estacionarias son comunes en cuerdas, tubos y en membranas. Para el caso de los
tubos, se pueden distinguir dos casos: tubo abierto (abierto en los dos extremos) y tubo
cerrado (abierto en un extremo y cerrado en el otro).
1.1.6.2 Tubo abierto. La onda recorre el tubo desde un extremo hasta el otro como onda de
compresión y se refleja como una onda de descompresion. En un tubo abierto se produce
una máxima amplitud en los extremos, ambos abiertos. Los puntos de máxima amplitud se
denominan vientres o antinodos. Por oposición, los puntos de mínima amplitud (amplitud
nula) de denominan nodos. La distancia entre un vientre y un nodo es igual a λ/4. Las
frecuencias naturales para un tubo abierto están dadas por la ecuación:
f n=
nc
2L
n: modo de vibración
L: longitud del tubo
c: velocidad del sonido
16
1 modo de
vibración
2 modo de
vibración
3 modo de
vibración
Figura 10 Onda estacionaria en un tubo abierto
Nótese en la figura que el modo de vibración coincide con el número de nodos.
1.1.6.3 Tubo cerrado. En un tubo cerrado un extremo está abierto y el otro está cerrado.
En el extremo abierto se produce un máximo de amplitud (vientre) y en el otro un mínimo
(nodo). Debido a que la distancia entre un vientre y un nodo es de λ/4, debe existir un
número impar de cuartos de longitud de onda que ajuste la longitud del tubo. Las
frecuencias naturales para los tubos cerrados son:
f n=
(2n - 1)c
4L
n: modo de vibración
L: longitud del tubo
c: velocidad del sonido
Nótese que solo existen frecuencias naturales impares.
1 modo de
vibración
2 modo de
vibración
3 modo de
vibración
Figura 11 Ondas estacionarias en un tubo cerrado
17
1.1.6.4 Ondas en membranas. Las membranas son cuerpos de superficie grande con
relación a su espesor. Estas necesitan tensión para vibrar, como por ejemplo en parches de
tambores y de timbales. Sin embargo la vibración en las membranas tiene características
distintas a las ondas en cuerdas o en tubos. Por una parte, no existen nodos como tal sino
líneas nodales. Además, las membranas cumplen unas leyes denominadas leyes de Chladni:
-
la frecuencia de dos membranas de igual superficie es inversamente proporcional a
su espesor
-
la frecuencia de dos membranas de igual espesor es inversamente proporcional al
cuadrado de su diámetro
1.1.7 Principios de propagación de las ondas
Los siguientes principios establecen la forma como se propagan las ondas en un medio
dado. Estos principios son:
-
Principio de Huygens
-
Teorema de Malus
Para entender con mayor claridad estos principios, primero se deben precisar algunos
términos.
frente de onda: Un frente de onda es una superficie que pasa por todos los puntos del
medio alcanzados por el movimiento ondulatorio en el mismo instante. Equivalentemente,
el frente de onda es la región definida por la extensión más lejana de la propagación de la
onda.
rayo: Los rayos son líneas perpendiculares a los frentes de onda que caracterizan la
dirección de una onda. Una onda en un medio homogéneo se mueve en la dirección de los
rayos, aunque éstos en si no tienen una entidad física. En el caso de ondas acústicas
(sonoras), los rayos se denominan rayos acústicos.
1.1.7.1 Principio de Huygens. El principio de Huygens establece que todos los puntos
pertenecientes a un frente onda dada actúan como fuentes de ondas circulares (o esféricas
en el espacio). El patrón de onda final será igual a la suma de las contribuciones de cada
18
pequeña onda que emana de cada punto del frente de onda. Estas pequeñas ondas son
llamadas “wavelets”. La intensidad de la onda circular que es emanada de cualquier punto
es máxima en la dirección de propagación y gradualmente disminuye hasta llegar a cero en
la dirección opuesta. El análisis utilizando “wavelets” de Huygens es una técnica
conveniente para analizar propagación de las ondas.
El principio de Huygens explica como se van formando los frentes de onda. Cada punto que
pertenece a un frente de onda actúa como fuente de ondas circulares. Las crestas de las
“wavelets” generadas por cada punto constituyen el próximo frente de onda con la misma
forma al anterior. El efecto total de la suma de las crestas individuales es la propagación de
onda original.
nuevo frente
de onda
“wavelets”
Figura 12 Principio de Huygens
Otro resultado importante de este comportamiento (consecuencia del principio de
Huygens), es que la dirección de propagación de la onda permanece perpendicular al frente
de onda. En dos dimensiones, el frente de onda será una línea recta o curva, mientras que en
tres dimensiones el frente de onda es un plano o una superficie.
1.1.7.2 Teorema de Malus. El teorema de Malus establece que los rayos de una misma
propagación se demoran el mismo tiempo en llegar pues permanecen en todo tiempo
perpendiculares a una superficie. Es equivalente a decir que el tiempo entre dos frentes de
onda es el mismo visto desde cualquier rayo. Es aplicable a la óptica así como a la acústica.
19
1.1.8. Interacción de las ondas con el medio
Diversos efectos ocurren cuando las ondas interactúan con el medio o entre ellas mismas
ellos mismos. Estos efectos cobran gran relevancia al explicar algunos fenómenos que
serán analizados en capítulos posteriores.
1.1.8.1 Superposición. El principio de superposición puede ser enunciado como sigue: La
existencia de una onda no afecta la existencia o las propiedades de otra onda, aunque que se
encuentren en el mismo punto y en el mismo instante. Este principio es equivalente a decir
que las ondas se pueden sumar algebraicamente. Si se tienen dos ondas, A y B, el
desplazamiento de la onda A+B es igual a la suma de los desplazamientos individuales
(debido a A y debido a B). Este una gran distinción entre las ondas y la materia, ya que dos
entes materiales no pueden ocupar el mismo volumen en el mismo instante.
1.1.8.2 Reflexión. La reflexión consiste en la existencia de una segunda onda de igual o
menor energía cuando un frente de onda incide sobre una superficie.
onda
incidente
(α
(β
onda
reflejada
α=β
Figura 13 Reflexión sobre una superficie plana
El diagrama muestra el rayo incidente y el rayo reflejado sobre una superficie plana
(plano). Este tipo de reflexión se denomina especular. Los respectivos ángulos (respecto a
la normal) son iguales. Esto se conoce como la primera ley de Snell.
Si las ondas son reflejadas de superficies irregulares, la reflexión debe examinarse para
cada punto, pues para cada punto existe una normal distinta. Este tipo reflexión se
denomina difusa y se refleja la onda en múltiples direcciones.
Si una onda incide sobre una superficie parabólica, los rayos reflejados se encontrarán en
un punto llamado foco o punto focal de la parábola. Los reflectores parabólicos tienen
20
muchas aplicaciones, tanto para ondas luminosas, como para ondas sonoras (por ejemplo,
los micrófonos). Además, la reflexión es fundamental para el entendimiento de la
reverberación y el eco que serán tratados posteriormente.
1.1.8.3 Refracción. Cuando una onda incide sobre una superficie, no necesariamente será
reflejada totalmente. Si la superficie es frontera entre dos medios, parte de la onda es
reflejada y otra parte atraviesa el segundo medio. Al atravesar el segundo medio, cambia la
dirección de propagación de la onda. Un cambio de medio también es acompañado por un
cambio de velocidad.
Cada medio tiene un índice característico llamado índice de refracción (n) y se cumple que
nisenθi=nrsenθr
donde los subíndices i y r representan incidente y refractado respectivamente. Esta se
conoce como la segunda ley de Snell (para la refracción.)
onda
incidente
θi
θr
medio 1
(ni)
onda
refractada
medio 2
(nr)
Figura 14 Refracción de ondas
1.1.8.3.1 Refracción atmosférica. La refracción atmosférica es el resultado del cambio de
dirección que sufre la radiación cuando atraviesa la atmósfera terrestre. El cambio de
dirección depende del índice de refracción y es responsable de fenómenos como la
dispersión.
1.1.8.4 Absorción. Otro fenómeno asociado a la reflexión y a la refracción es la absorción.
Esto ocurre cuando parte de la energía de la onda no es ni reflejada ni refractada, sino que
21
se queda en la superficie frontera entre los dos medios. Generalmente, la energía sonora se
convierte en otro tipo como calor, movimiento etc. El estudio de la absorción se pospondrá
cuando se hable acerca de acústica arquitectónica.
1.1.8.5 Interferencia. Interferencia hace referencia a la combinación o suma de dos ondas
similares, sin afectar las propiedades entre ellas (principio. de superposición). La
interferencia puede ser destructiva, resultando en la desaparición de las ondas cuando están
desfasadas, o constructiva cuando están en fase. La interferencia se puede observar con el
experimento del tubo de Quincke.
entrada
L1
L2
salida
Figura 15 Tubo de Quincke
Fuente: VAN DER WICK. Physics. Göttingen, Alemania: PHYWE, 1998.
El tubo de Quincke es un tubo que se divide en dos ramas en forma de U. Una de las ramas
tiene longitud constante (L1) y la otra variable (L2). Se produce un sonido en uno de los
extremos del tubo proveniente de un diapasón o una membrana vibratoria. En el otro
extremo existe un receptor, generalmente un micrófono. Si L2-L1 = nλ (n ∈ Z), la
interferencia será constructiva, las ondas están en fase cuando lleguen al micrófono y se
escuchará una amplitud muy cercana a la original. Si L2-L1 = (2n+1) λ/2 (n ∈ Z), la
interferencia será destructiva, las ondas están desfasadas completamente cuando lleguen al
micrófono y no se escuchará nada.
1.1.8.6 Difracción. La refracción es el cambio de dirección de propagación de una onda (o
torcimiento) cuando atraviesa a un medio distinto. Si ocurre un cambio de dirección de
propagación sin cambio de medio, ocurre difracción. Esto ocurre cuando una onda
encuentra un obstáculo de dimensiones reducidas en relación con su longitud de onda.
22
Debido al fenómeno de difracción, es que podemos oír sonidos alrededor de esquinas, o tras
una barrera, aunque se pierda el contacto visual con la fuente. Señales de baja frecuencia se
difractan más que señales de alta frecuencia.
Figura 16 Patrón de difracción a través de dos ranuras
Fuente: WEISSTEIN, Eric. Scienceworld. s.l.: Eric Weisstein. 2000
<www. scienceworld.wolfram.com> [consulta: 19 Feb. 2005]
1.1.8.7 Efecto Pulsatorio. El efecto pulsatorio es un fenómeno físico resultado de la suma
de dos tonos (ondas) cuyas frecuencias difieren en un valor muy pequeño ∆f=f2-f1=e donde
e es un valor casi despreciable (pero f2 no es igual a f1).
Supongamos que tenemos dos ondas, una con frecuencia de 15 Hz y otra de frecuencia
17Hz. La onda resultante (suma) tendrá una frecuencia de 16 Hz. (el promedio aritmético
entre las dos frecuencias). Debido a que las frecuencias de las ondas difieren muy poco, las
ondas entran en fase y se desfasan alternadamente, ocasionando interferencia constructiva y
destructiva respectivamente. Es decir, la amplitud de la señal varía entre 0 y la suma de las
dos amplitudes sonoras. La frecuencia a la cual la amplitud varía de forma alternada se
llama fpulsatoria y es igual a la diferencia entre las dos frecuencias. En el ejemplo, la fpulsatoria
es de 2 Hz (la amplitud de la onda resultante crece y decrece dos veces en un segundo.)
En general, para dos tonos (onda senoidal pura) de frecuencias f1y f2, tal que f2-f1 es muy
pequeña:
ftonoresultante=
(f1 + f2)
2
fpulsatorio=f2-f1
23
1.1.8.8 Efecto Doppler. Es una experiencia cotidiana percibir como el sonido de un carro
(una ambulancia por ejemplo), cambia cuando se acerca o se aleja de nosotros. Cuando se
acerca, el sonido tiende a volverse más agudo mientras que cuando se aleja, el sonido
tiende a volverse más grave. Este efecto ocurre cuando la fuente emisora de ondas y el
receptor están en movimiento relativo y las frecuencias percibidas son distintas a las
frecuencias originales de la fuente. (en el caso de ondas sonoras, el efecto es observable
cuando las velocidades alcanzan un porcentaje suficiente de la velocidad del sonido.)
Se pueden considerar tres casos:
•
receptor móvil
•
emisor móvil
•
ambos (receptor y emisor) móviles
En el caso de receptor móvil, las ondas salen del emisor a una velocidad V de propagación
del sonido(propia del medio). Si el receptor se mueve hacia el emisor a una velocidad Vr,
percibirá el sonido con una velocidad V +Vr y si se aleja, pericibirá el sonido a una
velocidad V-Vr. Sin embargo, el receptor no nota un cambio en la longitud de onda. Esto
implica un cambio en la frecuencia (pues la longitud de onda se mantuvo constante y la
velocidad cambió). Se debe cumplir que:
fr=(
V ± Vr
fe
) = (V ± Vr) [=] Hz
λ
V
fr: frecuencia que percibe el receptor
fe: frecuencia del emisor
Vr: velocidad a la que se mueve el receptor
V: velocidad del sonido
Si la fuente es la que está en movimiento, (según se acerca o se aleja del emisor), la
posición de inicio de cada frente de ondas será diferente: si el emisor se acerca al receptor,
24
la longitud de onda será menor, mientras que si el emisor se aleja, la longitud de onda será
mayor:
λr= λ ∓
fr=
Ve
o mejor:
fe
feV
[=] Hz
V ∓ Ve
fr: frecuencia que percibe el receptor
fe: frecuencia del emisor
Ve: velocidad con la que se mueve el emisor
V: velocidad del sonido
La expresión general, cuando el emisor y el receptor ambos están en movimiento es:
fr=
(V ± Vr)fe
[=] Hz
V ∓ Ve
1.1.8.9 Resonancia. La resonancia se puede definir como la existencia de un máximo de
energía en una configuración física debido a fuerzas externas que excitan periódicamente
con una frecuencia igual a uno de los modos de oscilación natural del sistema. Este
fenómeno está íntimamente relacionado con la generación de ondas estacionarias. Por
ejemplo, cuando se genera una onda estacionaria en un sistema debido a un sonido con una
frecuencia característica (coincide con un modo de oscilación natural), el sistema resuena.
1.1.9 Parámetros físicos y unidades de medida del sonido
A continuación se expondrán los parámetros más relevantes del sonido que se manejarán en
el desarrollo de capítulos posteriores.
25
1.1.9.1 Velocidad del sonido en diferentes medios. En el aire se tiene que:
c= 1.4
Pο
ρ
c= velocidad del sonido[=]m/s
Po= presión atmosférica[=]Pa
ρ= densidad del aire[=]kg/m3
Asumiendo que el aire es un gas ideal, existe una fórmula que relaciona la velocidad con la
temperatura del aire:
c=332 1 +
T
273
c: velocidad del sonido[=]m/s
T: temperatura en grados centígrados [=] °C
A temperatura ambiente (20°C), la velocidad del sonido es aproximadamente igual a
343m/s.
Para el caso de los sólidos, la onda se propaga con una velocidad dada por:
c=
E
[=] m/s
µ
E: módulo de Young del sólido [=] N/m
µ: densidad del sólido [=] kg/m3
En los gases, perturbaciones en la presión implican cambios en la temperatura. Para una
onda en propagación, cuando existe una compresión, la temperatura se eleva mientras que
cuando hay una rarefacción (descompresión) la temperatura disminuye. Sin embargo,
debido a la baja conductividad térmica, el proceso puede ser considerado adiabático. La
velocidad de una onda sonora en un gas ideal, viene dada por:
26
c=
gRT
[=] m/s
µ
g: coeficiente adiabático [=] kg mol/litros atm ms2
R: constante de los gases [=] litros atm/°Kmol
T: temperatura [=] °K
d: densidad [=] kg/m3
Otras características importantes que influyen en la velocidad y en la propagación del
sonido e inherentes al medio son:
Calor específico: El sonido viaja a cierta velocidad dependiendo de la temperatura que hay
en el medio y debido a la relación existente entre calor específico y temperatura, el calor se
convierte en parámetro.[=] Joules°K/kg
Viscosidad del medio: Se refiere a las fuerzas que se oponen a la propagación de las ondas.
Es el análogo a la fricción pero aplicado a fluidos. A mayor viscosidad, menor velocidad.
[=] Ns/m2
Coeficiente cinemático de viscosidad: Es una cantidad que indica como está cambiando la
viscosidad en un fluido [=] m2/s
Conductividad calorífica: Es la capacidad que tiene un medio para transmitir calor. Al
estar relacionado con la temperatura, influye en la velocidad. [=]calm/seg°C
Difusibilidad térmica: Reúne los anteriores parámetros en uno solo.
1.1.9.2 Intensidad sonora. Toda propagación ondulatoria trae consigo una transferencia de
energía. La cantidad de energía transportada por una onda, por unidad de superficie y
unidad de tiempo se denomina intensidad. Esto es equivalente a calcular la potencia media
por unidad de superficie.
I=
< p2 >
[=] w/m2
ρc
<p2>: valor cuadrático medio de la presión[=]Pa
ρ: densidad del medio[=]kg/m3
c: velocidad del sonido[=]m/s
27
Para una fuente que irradia igual en todas las direcciones (isotrópica), se tiene que I=
W
,
4πr 2
donde W es la potencia total (acústica) irradiada por la fuente y r es la distancia a la fuente.
Es decir, la intensidad sonora varía inversamente proporcional a la distancia de la fuente al
cuadrado. Una unidad muy práctica es el de Nivel de Intensidad Sonora o SIL (Sound
Intensity Level). Está dada por:
SIL (dB) = 10log
I
I0
I0 es una intensidad de referencia e igual a 10-12 w/m2 que corresponde a la unidad de
intensidad mínima audible por el ser humano, aunque debe resaltarse que este umbral
depende de la frecuencia y del individuo.
1.1.9.3 Presión acústica. La presión acústica es la medida de la amplitud de la onda de
presión que origina el sonido. Generalmente esta medida corresponde al valor cuadrático
medio de la onda. El nivel de presión acústica es una unidad que indica la relación entre la
presión acústica y una presión de referencia.
SPL (dB) = 10log
p2
= 20log
2
p0
p
p0
p es el valor RMS de la presión mientras que p0= 20µPa es una potencia de referencia
correspondiente a el valor de presión mínimo audible por el ser humano (otra vez, el umbral
depende de la frecuencia pero ésto se profundizará en el capítulo de psicoacústica). De esta
expresión se deduce que doblar la presión acústica en un punto determinado resulta en un
incremento de 6dB en el nivel de presión acústica.
1.1.9.4 Potencia acústica. La potencia acústica es la cantidad de energía por unidad de
tiempo radiada desde una fuente en forma de ondas acústicas. El nivel de potencia acústica
es una unidad que indica la relación entre la potencia acústica y una potencia de referencia
28
SWL = 10log(
W
) donde W0=10-12 W
W0
De esta expresión se puede deducir que doblar la potencia acústica resulta en incremento de
3dB en el nivel de potencia acústica.
En este punto es importante aclarar que el nivel de presión sonora y el nivel potencia
acústica, aunque relacionados con conceptos distintos. El nivel de presión sonora en un
punto en el espacio depende de la distancia que se encuentra la fuente y del ambiente que
rodea al punto. Por el contrario, el nivel de potencia acústica es característico de la fuente y
no depende ni de la distancia ni del ambiente. El nivel de presión acústica puede ser medido
por instrumentos, pero la medición de nivel de potencia acústica se debe hacer
indirectamente.
1.1.9.5 Impedancia acústica. La impedancia acústica es el cociente entre la presión
acústica sobre una superficie por el flujo que la atraviesa.
ZA=
p
[=] Pa s/m3[=] ohm acústico
U
p: presión acústica [=] Pa
U: flujo volumétrico (velocidad multiplicada por la superficie) [=] m3/s
Por analogía a las impedancias eléctricas, la impedancia acústica está compuesta por
resistencia, masa y compliancia acústica. La resistencia acústica es una medida del calor
que se disipa mientras que la masa y la compliancia son elementos almacenadores de
energía acústica.
29
1.2 VOZ HUMANA
La fuente del sonido para la voz humana es la vibración de las cuerdas vocales y efectos
adyacentes producidos por todo el tracto vocal: laringe, faringe, boca y cavidad nasal. El
principio físico relevante para la producción de sonido en el hombre es el de Bernoulli. Este
principio establece que en el movimiento de un fluido la presión es menor en lugares donde
la velocidad es mayor, y viceversa. La diferencia de presiones ocasiona una fuerza efectiva,
llamada fuerza de Bernoulli. En el caso de las cuerdas vocales, el aire que pasa a través de
ellas proveniente de los pulmones hace que las cuerdas vocales se cierren. Inmediatamente
después que éstas se cierran, presión de aire se acumula en la tráquea haciendo que se
vuelvan a abrir nuevamente. Este ciclo se repite una y otra vez. La tasa a la cual se abre y se
cierran las cuerdas vocales determina la frecuencia de los sonidos resultantes. El sistema
vibratorio produce una rápida oscilación de la presión de aire en el aparato vocal
generando. La voz también está determinada por las posiciones de los labios, la mandíbula,
la lengua y la laringe.
Figura 17 Diagrama del tracto vocal
Fuente: PAYTON, Eric. Guitarraonline. s.l.: 2001
<www. www.guitarraonline.com > [consulta: 19 Feb. 2005]
30
De acuerdo con lo expuesto, el órgano de la voz se puede dividir en tres grandes unidades
que son:
-
los pulmones que aportan energía
-
las cuerdas vocales que actúan como osciladores al vibrar
-
el tracto vocal completo que actúa como una caja de resonancia
1.2.1 Formantes
El tracto vocal (faringe, laringe, cavidad oral) actúa como un tubo resonante cerrado en la
glotis y abierto en los labios. En un tubo cerrado, existen modos de oscilación para
armónicos impares. En el caso del tracto vocal, se tienen 4 o 5 resonancias importantes
denominadas formantes. Estas formantes están en aprox. 500 Hz, 1500 Hz, 2500 Hz, y
3500 Hz. Estas corresponden a λ/4, 3λ/4, 5λ/4 y 7λ/4. Los formantes pueden variar de
acuerdo a la posición y abertura de la boca y la cavidad nasal. De hecho, la posición de la
mandíbula determina el primer formante, la posición de la lengua determina el segundo
formante y la posición de la punta de la lengua determina el tercero. Cuando la frecuencia
de la señal de la voz es igual o está cerca de alguna de las formantes, la amplitud es mayor.
Esto genera un espectro de la voz irregular con máximos en las frecuencias de las
formantes.
1.2.2 Rango dinámico y de frecuencia
El rango dinámico del hombre es el conjunto de valores de presión sonora que puede
reproducir, desde el sonido más débil hasta el más fuerte. Esto es muy variable, ya que está
condicionada a varios factores, como la frecuencia, el nivel de ruido y características
propias del individuo. Por ejemplo, cuando se habla elevando la voz todo lo posible, sin
31
forzar las cuerdas vocales, la potencia de la palabra llega a ser 1mW. Un susurro por el
contrario es de 0.001µW. La siguiente tabla muestra diversos valores de presión sonora (en
dB) según la fuente sonora.
Tabla 1 Rango dinámico de diferentes voces
Tipo de fuente sonora
Nivel de presión sonora (dB)
Nivel susurro
20
Hombre conversación normal
55
Mujer conversación normal
50
Hombre gritando
85
Mujer gritando
80
Nivel máximo
90
Fuente: RECUERO LÓPEZ, Manuel. Ingeniería acústica. Madrid: Paraninfo, 1995. 654p
El rango de frecuencia del hombre es el conjunto de frecuencias que es capaz de reproducir.
El rango completo va desde 20Hz hasta 14kHz. Estos son los extremos pero es más común
encontrar la voz en el rango de 100Hz hasta 3kHz. La frecuencia fundamental para un
adulto hombre es de 120 Hz en promedio (80-200Hz). La frecuencia fundamental para una
mujer es de 220 Hz en promedio (140-500Hz). Sin embargo, se debe tener en cuenta que
tanto el hombre como la mujer producen armónicos de la frecuencia fundamental y estos
armónicos pueden ser de muy alta frecuencia (>5kHz).
1.2.3 Características adicionales de la voz
La producción de letras en la voz es uno de los aspectos fundamentales a considerar.
Primero que todo, el mecanismo de producción de vocales y consonantes es diferente. Para
la producción de vocales, el aire que pasa por la laringe solamente es modulado por las
cuerdas vocales. Por oposición, para la generación de consonantes se necesita además la
intervención de los labios, cavidades, paladar y la lengua. Las consonantes son más
complejas que las vocales, tanto por su mecanismo de generación como por su contenido de
frecuencias. La “s” es la letra con mayor componentes de agudos. Si se suprimen las
32
frecuencias superiores a 6kHz, la letra no se entiende. Lo mismo sucede con la “j” si se
suprimen las frecuencias superiores 4.5kHz. Por debajo de 2kHz, la “r” es una de las pocas
consonantes que se entienden. Por último, por debajo de 500Hz ninguna consonante se
entiende y además, todas las vocales se confunden con la “u”. En conclusión, si se desea
reproducir fielmente la voz para evitar los anteriores problemas, se deberán reproducir las
frecuencias entre 60 Hz hasta 10kHz, siendo esenciales de 200 a 6kHz.
El reconocimiento de la palabra es otro aspecto importante en un sistema de transmisión
sonora. El sistema de transmisión sonora es de índole variada: el aire, el teléfono, un
estudio de grabación, radio. etc. En estos sistemas es fundamental la comprensión de la
palabra. El reconocimiento fiel y óptimo de la palabra se conoce como inteligibilidad. La
inteligibilidad depende de muchos aspectos, pero los más importantes son el nivel de
presión sonora, la frecuencia y la reverberación. El nivel de presión sonora debe ser
superior al ruido de tal forma que se escuche la información necesaria. El ruido es toda
señal indeseada. La frecuencia es un parámetro importante y está demostrado que las
frecuencias más importantes para la inteligibilidad son las comprendidas entre 500Hz y
3kHz. La reverberación también tiene influencia sobre la inteligibilidad de la palabra, pero
su estudio se pospone para el capítulo de acústica arquitectónica.
33
1.3 SISTEMA AUDITIVO
El oído humano es uno de los órganos más impresionantes del cuerpo pues posee un rango
increíble de sensibilidad, tanto en frecuencia como en amplitud. El oído responde a
frecuencias entre 20Hz y 20kHz y responde a una rango de variación de presiones de
1,000,000 a 1. El fenómeno de la percepción sonora en los humanos es un proceso
complejo que requiere un análisis que se desarrolla en tres etapas básicas:
•
captación de las ondas sonoras
•
conversión de la señal acústica en impulsos nerviosos y la transmisión de esos
impulsos hasta el cerebro
•
procesamiento neural de la información
Las primeras dos etapas se producen en el oído mientras que la última ocurre en el cerebro
propiamente dicho. Las variaciones de presión del aire causadas por las ondas sonoras se
convierten en vibraciones mecánicas que a su vez producen vibraciones de un fluido. Estas
generan impulsos eléctricos, y el cerebro los transforma en sensaciones auditivas.
Solamente se discutirá la fisiología del oído, el cual se divide en tres partes que operan de
manera complementaria: el oído externo, el oído medio y el oído interno. Estas tres partes
del oído constituye el sistema periférico de audición.
1.3.1 Oído externo
La parte más exterior es el pabellón el cual se encarga de recoger las ondas sonoras y las
dirige hacia el conducto auditivo externos a través del orificio auditivo. Al otro extremo del
oído externo, se encuentra el tímpano, el cual constituye la entrada al oído medio. El canal
que comunica el pabellón auricular con el oído medio se llama conducto auditivo. Así, la
función primordial del oído externo es el de recolectar las ondas sonoras y dirigirlas al oído
medio. Sin embargo, el oído externo tiene otras funciones como la de proteger las
34
estructuras del oído medio contra daños además de minimizar la distancia del oído interno
al cerebro (de esta forma se reducen los tiempos de propagación). Así hay menos forma de
distorsionar la señal ya que ésta ya ha sufrido variaciones debido a efectos de difracción en
el pabellón auricular y la cabeza.
Figura 18 Oído externo
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica., 1995
1.3.2 Oído medio
El tímpano es el primer elemento mecánico del oído y con éste comienza la parte media.
Adherido al tímpano, se encuentra un huesecillo llamado martillo, unido por ligamentos a
un segundo hueso llamado yunque. La serie de huesecillos termina con el estribo y el peso
total de los huesos es de 63 miligramos aproximadamente. Estos tres huesos están situados
en una cavidad llena de aire que se comunica con la faringe mediante la trompa de
Eustaquio. La trompa de Eustaquio tiene la importante función de estabilizar la presión del
oído, haciendo que la presión del oído interno sea igual a la presión atmosférica.
Los sonidos son conducidos a través del conducto auditivo hasta el tímpano. Los cambios
de presión en la membrana timpánica (debido a la señal sonora), hacen que la membrana
vibre de acuerdo a la forma del sonido. Estas vibraciones se transfieren a la cadena de
huesecillos (martillo, yunque y estribo) que actúan como un sistema de palancas. El estribo,
en el borde de la ventana oval, transfiere su vibración (proveniente del aire) a el fluido. Se
debe procurar una transferencia de potencia máxima de las vibraciones en aire hacia el
fluido, y el sistema de palancas actúa como acoplador para que esto se pueda realizar. La
ventana oval marca la entrada para el oído interno.
35
Figura 19 Oído medio
Fuente: PIEDRAHITA, Ramón. Fisiología. s.l.:s.n.. 2000
< www.salud.nih.gov> [consulta: 13 Abr. 2005]
1.3.2.1 Reflejo timpánico. Cuando se aplican sonidos muy fuertes al oído (> 90 dB SPL)
los músculos del tímpano y del estribo se contraen de forma automática, modificando la
característica de transferencia del oído medio. Esto actúa como un control automático de
ganancia pues al modificar la función de transferencia del oído medio se disminuyen la
cantidad de energía entregada al oído interno. Tiene como propósito proteger a las células
receptoras frente a sobrecargas que puedan llegar a destruirlas. Este fenómeno se denomina
reflejo timpánico pero no es instantáneo; tarda de 40 a 160ms en producirse. Es un
mecanismo no lineal.
1.3.3 Respuesta en frecuencia del oído
El conjunto formado por el oído externo y el oído medio forman un sistema cuya
respuesta en frecuencia es de tipo pasabajos como se muestra en la figura. En el intervalo
cercano a los 4 kHz se observa un pequeño efecto de ganancia, debido a las características
del conducto auditivo.
Esta respuesta sólo es válida cuando el sistema se comporta de modo lineal; es decir,
cuando la intensidad del sonido no es muy elevada, para evitar que actúe el reflejo
timpánico.
36
Figura 20 Respuesta en frecuencia combinada del oído externo y el oído medio
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
1.3.4 Oído interno
El oído interno tiene la función primordial de convertir las ondas mecánicas en impulsos
nerviosos y también el de filtrar la señal sonora. El órgano fundamental del oído interno es
el caracol o cóclea. El caracol es un conducto rígido de unos 35mm de longitud encargado
de convertir las vibraciones físicas en señales eléctricas. El interior del conducto está
dividido por en sentido longitudinal por la membrana basilar y por la membrana de
Reissner. Estas a su vez forman tres compartimentos llamadas escalas: la escala timpánica,
la escala vestibular y la escala media. Las primeras dos escalas contienen un líquido
llamado perilinfa y se interconectan mediante una abertura localizada en el caracol llamado
helicotrema. La escala media contiene otro líquido llamado endolinfa. Las vibraciones
provenientes del oído medio entran al oído interno a través de la ventana oval, generando
ondas viajeras en el líquido dentro de la escala vestibular. La onda sonora pasa por el
helicotrema y regresa a través de la escala timpánica hasta la ventana redonda (una región
flexible en la base de la cóclea). La ventana redonda no permite que la onda sonora sea
reflejada.
La membrana basilar contiene células ciliares responsables de producir pontenciales
eléctricos en función de la excitación de la membrana debido al movimiento del fluido.
Este movimiento es función de la frecuencia. A lo largo de la membrana basilar, se
encuentra el órgano de Corti, responsable de la transmisión de los impulsos eléctricos al
nervio acústico y de ahí al cerebro. En el cerebro se hace el procesamiento neural para
identificar las propiedades de la onda sonora (frecuencia, amplitud, forma).
37
Figura 21 Diagrama completo del oído
Fuente: FIGUEROA, David. s.l.: s.n. 1997
< www..medspain.com/ruidoindustrial > [consulta: 21 Abr. 2005]
38
2. ACÚSTICA
La acústica es la parte de la física que estudia la producción, transmisión y percepción del
sonido. El sonido tiene aplicaciones en muchas ramas del conocimiento y por lo tanto
constituye una ciencia multidisciplinaria.
Algunas áreas de trabajo en acústica son:
acústica arquitectónica: Estudia el fenómeno sonoro respecto a las construcciones. Se
aplica en el diseño de salas de conciertos, auditorios, teatros, estudios de grabación, etc.
ingeniería acústica: Estudia todos los procesos de medición acústica e instrumentación
para su aplicación en la música, la medicina y en la geología.
acústica musical: La acústica musical combina elementos científicos y artísticos-musicales
para el diseño óptimo de instrumentos, sistemas de grabación, sistemas de reproducción,
etc.
control de ruido y de vibraciones: El ruido está reconocido oficialmente como un
causante de contaminación (contaminación sonora) y su control ha sido implementado por
organismos gubernamentales. Su campo de trabajo está en las fábricas, en el control
preventivo de vibraciones en las máquinas, ruidos internos, etc.
bioacústica, psicoacústica y acústica médica: Estudia la interacción entre las ondas
sonoras y los humanos y los animales. Particularmente, los ultrasonidos han servido como
herramienta de diagnóstico y tratamiento.
En este capítulo, primero se introducirán conceptos relevantes a la acústica y a las señales
acústicas. Posteriormente, se tratarán algunos temas de acústica aplicada: psicoacústica,
acústica musical, acústica arquitectónica y ruido acústico.
39
2.1 SEÑALES ACÚSTICAS
Las señales acústicas son las mismas señales sonoras pero con un enfoque ligado a la
transmisión a distancia. Por esto, éstas se dividen en dos, a saber, señal primaria y señal
secundaria.
Señal primaria: Esta se refiere a la señal original, directamente desde la fuente que la
produce.
Señal secundaria: Es aquella que pasa a través de algún canal o es procesada por algún
equipo. Se busca que sea igual a la señal primaria. Sin embargo, esto en la práctica no es
posible debido a problemas asociados a la transmisión, circuitería y al canal:
-pérdida del espacio acústico
-cambio de nivel
-cambio del espectro
-cambio del rango dinámico
-distorsiones
-ruido
pérdida del espacio acústico: Se pierde la localización de la fuente en el espacio y no se
sabe de donde proviene la señal.
cambio de nivel: Siempre existirán cambios en la presión sonora traducidos en aumentos o
descensos en amplitud (nivel)
cambio de espectro: En los equipos el espectro se ve filtrado o reducido debido a que el
ancho de banda de éstos no es ilimitado. También debido a distorsiones aparecen otros
armónicos no deseados.
cambio del rango dinámico: Es un problema inherente a los equipos cuando el rango
dinámico de éstos es menor al de la señal primaria.
distorsión: Existen dos tipos de distorsión básicamente, a saber: distorsión lineal y
distorsión lineal. La distorsión lineal es aquella que afecta solamente a la amplitud de la
señal y se puede corregir utilizando amplificadores. La distorsión no lineal es más difícil de
40
corregir. En la distorsión no lineal hay cambio en la forma de la señal, es decir, en los
armónicos de ésta. Aparecen nuevos armónicos y éstos deben controlarse. Un parámetro
importante es el THD (o distorsión armónica total) que relaciona la energía promedio de los
armónicos con respecto a la frecuencia fundamental. Es deseable que este valor sea
pequeño.
La distorsión por intermodulación ocurre cuando existe modulación entre los armónicos, es
decir se generan nuevas frecuencias no deseadas a partir de los armónicos presentes en la
señal.
Ruido: El ruido se puede definir como potencia (acústica) no deseada. En equipos
electroacústicos, esta potencia suele ser de naturaleza eléctrica y no es deseable y muchas
veces inevitable.
41
2.2 PSICOACÚSTICA
Hasta el momento, se ha discutido acerca de características físicas y medibles del sonido,
pero no se ha dicho cómo se comporta éste al llegar a nuestros oídos y a nuestra cabeza. Es
decir, la psicoacústica estudia la relación entre los parámetros físicos del sonido y nuestra
percepción subjetiva de ellos. Los parámetros psicoacústicos más relevantes son:
-
sonoridad
-
altura
-
timbre
La sonoridad es la percepción subjetiva de la intensidad sonora. La altura o tono está ligada
a la gravedad o que tan agudo es un de sonido. Está relacionado con la frecuencia
fundamental de la señal sonora. El timbre es caracterizado por la forma de la onda, o su
componente armónico. Sin embargo, debido a la sensibilidad y respuesta en frecuencia del
oído humano, estos términos en el contexto de la psicoacústica no son totalmente
independientes. Aparte de éstos términos, se estudiarán otros que son fenómenos
característicos de la percepción del sonido como la direccionalidad, la espacialidad y el
enmascaramiento.
2.2.1 Características de la respuesta humana
Nuestra habilidad para percibir cualquier estímulo utilizando nuestros sentidos está limitada
por dos situaciones principalmente:
-
limitaciones físicas
-
la habilidad del cerebro para procesar la información
42
Las limitaciones físicas determinan las fronteras absolutas de rango de sensibilidad para
nuestra audición. El hecho que los humanos percibamos frecuencias desde los 20 Hz hasta
los 20kHz (aunque estos valores pueden variar de persona a persona debido a la edad, sexo,
etc.) está establecido por la construcción física de nuestro oído y sus componentes internos.
Igualmente, no podemos detectar todas las intensidades.
La habilidad del cerebro para procesar información es un poco más difícil de analizar, pero
se puede observar la deficiencia de éste cuando en el cerebro se enmascaran ciertas
frecuencias (es decir escuchamos unas pero otras, aún estando ahí, las ignoramos).
2.2.1.1 Rango dinámico y rango de frecuencia. Se había anotado anteriormente que el ser
humano es capaz de detectar únicamente aquellos sonidos que se encuentran dentro de un
determinado rango de amplitudes y frecuencias. El rango dinámico del oído es el conjunto
de intensidades que puede detectar el oído, y empieza en la mínima presión sonora que
puede detectar y termina en la máxima presión sonora que puede tolerar. La mínima
corresponde a 0dB SPL y la máxima a 140 dB SPL aproximadamente. El rango de frecuencias
es el conjunto de frecuencias que son capaces de excitar al oído y producir una percepción.
Normalmente, el rango de frecuencias está entre 20Hz y 20kHz. Este rango varía según la
edad. (Al envejecer, se disminuye tanto el rango dinámico como el rango de frecuencia).
2.2.2 Sonoridad o percepción de la intensidad
La sonoridad es la percepción subjetiva de la intensidad. Debido a que la sensibilidad del
oído es variable no existe una relación directa entre ambas. La sensibilidad del oído está
relacionado con el umbral de audición y éste se define como la potencia sonora mínima
capaz de excitar al oído y producir una respuesta sensorial. El umbral para la audición a
1kHz es de 20uPa o 0dBspl. Si excitamos al oído con un tono puro (senoidal) con menor
presión acústica, no podríamos oírlo. Sin embargo, nótese que el umbral para la audición se
definió para 1kHz. Esto es debido a que el oído se comporta distinto (con respecto a las
intensidades) a distintas frecuencias. De ahí la distinción entre sonoridad (subjetiva) e
intensidad (objetiva). Por ejemplo, si se tratara de encontrar el umbral de audición para una
43
frecuencia digamos de 100Hz, tendría que ser más “intensa” que 0dBspl (de hecho sería
alrededor de 25dBspl). Para que un tono de 100Hz suene igual de duro (sonoridad) a un
tono de 1kHz, el primero deberá tener una mayor presión (o potencia) acústica.
Figura 22 Umbral de audición en función de la frecuencia
Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.
Nótese que el Umbral de Audición es variable pues depende de hecho de la frecuencia. Del
gráfico podemos hacer cuatro observaciones importantes:
-
Las frecuencias menores a 1kHz y mayores a 5kHz deben ser (en términos de
presión acústica) mayores a 0dBspl para que puedan ser audibles.
-
Para las frecuencias menores a 100Hz: entre más baja la frecuencia, más alto es el
umbral
-
Para las frecuencias mayores a 5kHz: entre más alta sea la frecuencia, más alto es el
umbral
-
Para frecuencias entre 2kHz y 5kHz sonidos con una presión acústica menor a
0dBspl, pueden ser audibles. Es decir, en este intervalo de frecuencia, el oído es más
sensible.
En general, la respuesta de sonoridad en el oído no es para nada lineal. La sensibilidad del
sistema auditivo no es independiente de la frecuencia. Es importante resaltar que la curva
de Umbral de Audibilidad presenta una dependencia con respecto al modo de propagación
de las ondas sonoras; la curva de arriba se hizo suponiendo una condición de campo libre
(en promedio), aunque en situaciones cotidianas la propagación es de campo difuso (el
sonido incide desde todas las direcciones posibles)
44
Para diferenciar el nivel de sonoridad del nivel de presión sonora (SPL) se realizaron una
serie de experimentos psicoacústicos. El primero de éstos data de 1933 y fue llevado a cabo
por Fletcher y Munson. El experimento consistía en hacerle escuchar a una misma persona
un tono puro (senoidal) de 1KHz a un nivel de presión sonora determinado. Luego se le
hacía escuchar otro tono (distinta frecuencia) y se ajustaba el “volumen” (SPL) hasta
escuchara igual de fuerte este tono que el de 1KHz. El experimento se repitió para diversas
frecuencias y niveles de presión sonora hasta obtener unas curvas de igual nivel de
sonoridad, llamadas contornos de Fletcher y Munson (ver figura).
dB SPL
f (Hz)
Figura 23 Curvas de Fletcher y Munson
Fuente: FIGUEROA, David. s.l.: s.n. 1997
< www..medspain.com/ruidoindustrial > [consulta: 21 Abr. 2005]
Mediante estas curvas se pudo definir el concepto de nivel de sonoridad, expresado en fons.
Las distintas líneas (o contornos) representan los distintos niveles de sonoridad. La línea
roja en el gráfico muestra el umbral para la audición para distintas frecuencias. Los fons
permiten ordenar los sonidos según su sonoridad en forma independiente de la frecuencia.
2.2.2.1 Curvas de ponderación, fons, y sons. Debido a que el oído humano no responde
igual a todas las frecuencias, se han normalizado 4 curvas de niveles de ponderación (A B
C D). El propósito de estas curvas es que actúen como un filtro que “siga” la respuesta del
oído humano. De esta forma, con las curvas se puede obtener una mejor medición de
sonoridad (subjetiva), pues los instrumentos físicos solamente pueden medir intensidades
(objetivo). El filtro que se utiliza para simular la audición humana se llama un filtro
ponderado. Es ponderado pues asigna distintas ganancias a distintas frecuencias. La
respuesta en frecuencia del filtro es lo que se denomina curva de ponderación. Cada curva
tiene su característica particular:
45
Curva A: Sigue la respuesta del oído humano a niveles de 40 fons y corrige las frecuencias
altas y bajas.
Curva B: Responde a la sensibilidad del oído con niveles de 55 fons. La respuesta es casi
lineal y rectifica la respuesta a frecuencias muy bajas.
Curva C: Corresponde a una respuesta muy lineal. Es útil para intensidades (spl) altas.
Curva D: Se utiliza para la medida subjetiva del ruido de los aviones.
Los equipos electrónicos utilizados para la medición acústica deben adaptarse a la respuesta
en frecuencia del oído humano respecto a la intensidad. De ahí la necesidad de filtros que
ponderan de forma diferente las diferentes frecuencias. La curva A ha tenido aceptación por
su gran correlación con la molestia y el daño auditivo. Las medidas utilizando este filtro se
expresan en dBA. La mayoría de las mediciones de sonido se hacen en dBA y por eso se
denomina al instrumento que mide dBA como medidor del nivel sonoro.
Los fons son unidades importantes pues combinan aspectos psicológicos con aspectos
físicos. Por ejemplo, un sonido de 500Hz a una sonoridad de 40 fons llega al oído de igual
forma que cualquier otro sonido de 40 fons de cualquier otra frecuencia. Sin embargo, los
fons (nivel de sonoridad) no describe completamente el comportamiento del oído humano
respecto a las intensidades. El nivel de sonoridad analizado es aún una magnitud
psicofísica, ya que en última instancia se basa en la comparación de sensaciones con las
producidas por una frecuencia (1 kHz) tomada arbitrariamente como referencia. El
problema básico de los fons, reside en que un tono con doble sonoridad que uno dado, no se
escucha el doble de sonoro. Así, por ejemplo, un tono de 80 fon no es el doble de sonoro
que uno de 40 fon. A fin de establecer una escala subjetiva de sonoridad se realizaron otra
serie de experimentos. Se aumentaba la intensidad de la fuente hasta que se lograra una
proporción de 2 a 1 en sonoridad. Para ésto, el concepto de “doblemente sonoro” debía
quedar completamente determinado y definido. Esto puede lograrse por comparación entre
la audición monoaural (un oído) y biaural (ambos oídos) de un mismo sonido. Un sonido B
46
escuchado monoauralmente es doblemente sonoro que otro A cuando produce el mismo
incremento de sensación que produce pasar de la escucha monoaural a la escucha biaural de
A. Los experimentos se realizaron con varios niveles de presión sonora para cada conjunto
de frecuencias (obviamente frecuencias audibles). El resultado es una relación entre el nivel
de sonoridad expresado en fon y la sonoridad, expresado en son.
La escala de son (sonoridad) y la escala de fon (nivel de sonoridad sonoridad) se relacionan
de forma logarítmica.
Figura 24 Relación entre nivel de sonoridad (fon) y sonoridad (son)
Fuente: MIYARA, Federico. Introducción a la psicoacústica. Bogotá: Fundación Decibel, 2004
Por encima de 40 fon, la curva es lineal (en un gráfico logarítmico). De ésto se deduce una
primera expresión para calcular el nivel de sonoridad a partir de la sonoridad:
S = 10
Ns − 40
30
[=] sons
Para Ns<40fon, es posible aproximar la curva anterior por medio de la ecuación
S= 6.9 ⋅ 10 −5 (Ns-2)2.634[=] sons
Es importante resaltar que lo anteriormente expuesto respecto a intensidades y sonoridades
se refiere a tonos puros: es decir, aquellos que solo tienen una componente de frecuencia
(senoidal, 0 armónicos). La mayoría de los sonidos que se encuentran en la práctica son
sonidos compuestos (con gran componente armónico). El análisis de la sonoridad de
47
sonidos compuestos (con armónicos) es más compleja porque los mecanismos de
integración de la sensación difieren según la separación entre las frecuencias de los
componentes. Esto introduce el concepto de banda crítica.
2.2.2.2 Banda crítica. Un criterio para decidir si los tonos están próximos o no es si están
en una misma banda crítica. La banda crítica se define como un intervalo de frecuencia que
representa la máxima resolución frecuencial del sistema auditivo en diversos experimentos
psicoacústicos. Constituye el intervalo de frecuencias en el cual el oído interno efectúa una
integración espectral de la señal sonora, es decir, el intervalo en el cual se pueden sumar las
energías de los distintos componentes espectrales de la señal. La tabla muestra las bandas
críticas (según Zwicker y Feldtkeller):
Tabla 2 División del espectro en bandas críticas
fi: frecuencia inferior de la banda
fo: frecuencia central de la banda
fs: frecuencia superior de la banda
fbc: ancho de banda
En la tabla se muestra :
fi: frecuencia inferior de la banda
fo: frecuencia central de la banda
fs: frecuencia superior de la banda
fbc: ancho de banda
48
Si los sonidos puros que forman el sonido compuesto están comprendidos dentro de una
misma banda crítica, la intensidad (cuadrado de la presión sonora) total se obtiene sumando
las intensidades individuales. A partir de la intensidad total, se calcula la sonoridad (a
partir de las curvas ya expuestas) correspondiente a dicha banda crítica.
Si en cambio los tonos puros están suficientemente alejados, la sonoridad total se calcula
sumando directamente las sonoridades individuales.
Se pueden resumir ambos casos en un procedimiento “práctico” para obtener la sonoridad (
o nivel de sonoridad) total de un sonido compuesto:
1. Subdividir el espectro del sonido en cuestión en bandas críticas con la ayuda de la
tabla de Zwicker y Feldtkeller.
2. Sumar las intensidades de los tonos puros (armónicos) de cada banda
3. Convertir la intensidad total de cada banda en nivel sonoridad y después a
sonoridad.
4. Sumar todas las sonoridades de las diversas bandas críticas. Esta resultante es la
sonoridad del sonido. Si se quiere el nivel de sonoridad, simplemente se transforma
de acuerdo a la ecuación que relaciona a S y Ns.
2.2.3 Altura
La altura de un sonido está relacionado con la frecuencia fundamental de éste. La relación
entre frecuencia y altura es bastante directa correspondiendo las bajas frecuencias a sonidos
graves y las altas frecuencias a sonidos agudos. Sin embargo, la altura tiene alguna
dependencia tanto de la sonoridad (intensidad) como del timbre. Cuando dos tonos iguales
(de igual frecuencia) tienen intensidades distintas también parecen tener alturas ligeramente
distintas. Igualmente, un timbre brillante parece ser más agudo que un timbre opaco,
aunque las frecuencias y las intensidades sean iguales.
Existe un fenómeno relativo a la altura y a la frecuencia a partir de los 1000Hz. Por debajo
de 500Hz, existe una relación lineal entre altura y frecuencia. Pero a partir de 500Hz,
49
intervalos de frecuencia cada vez más grandes producen incrementos más pequeños de
altura (subjetiva). Por esta razón se inventó una nueva escala que diera cuenta del
fenómeno perceptivo de la altura. Stevens, Volkman, y Newman en 1937 propusieron una
unidad de altura denominada mel. La escala mel es una escala perceptual juzgada por
personas de tal forma que los tonos estén equiespaciados para todas las frecuencias. El
punto de referencia para esta escala es establecer que un tono de 1Khz a 40dB equivale
precisamente a 1000mels. Por debajo de 1000Hz (o 1000 mels) la escala mel coincide
exactamente con la escala de frecuencia normal (en Hz). Por encima de 1000Hz, intervalos
de frecuencias cada vez mayores producen la sensación de incrementos iguales en la altura.
Por ejemplo, cuatro octavas por encima de 500Hz en la escala de frecuencia corresponden a
apenas dos en la escala mel. (se comprime).
Para convertir f (Hz) en m (mel):
m = 1127ln(1 + f / 700).
y la inversa:
f = 700(em / 1127 − 1).
Figura 25 Altura (medida en mels) en función de la frecuencia
Fuente: WEISSTEIN, Eric. Scienceworld. s.l.: Eric Weisstein. 2000
<www. scienceworld.wolfram.com> [consulta: 17 Feb. 2005]
La altura es uno de los parámetros perceptivos fundamentales del sonido. La altura es de
vital importancia en el estudio de la acústica musical.
50
2.2.4 Timbre
El timbre es un atributo que permite diferenciar dos sonidos con igual altura y sonoridad.
Es la cualidad del sonido que nos permite identificar con facilidad la voz de alguien cuando
hablamos por teléfono o un instrumento musical de otro. El timbre de un sonido es una
cualidad compleja que depende principalmente del espectro o la forma de la onda. El
espectro de una onda lo constituye las frecuencias que la originan según el Análisis de
Fourier. Es decir, el análisis de las frecuencias individuales de un onda sonora dada, nos
proporciona información acerca de su naturaleza tímbrica.
Otro elemento importante en el análisis del timbre es la envolvente del sonido en el tiempo.
La envolvente indica el comportamiento dinámico de un sonido en el tiempo. Ya se había
hablado anteriormente de envolventes en el tiempo (ADSR). La envolvente se subdivide en
envolvente primaria y en envolventes secundarias. La primera determina la forma en que
varía en el tiempo la amplitud general. La segunda corresponde a las variaciones
temporales relativas de los armónicos. Es decir, las envolventes secundarias dependen de la
manera en que se amortiguan las diferentes frecuencias del espectro.
Si se combinan ambos elementos, el espectro y la envolvente, se podrá caracterizar la
identidad tímbrica de un sonido en particular. El estudio del timbre cobra mucha
importancia al tratar de imitar sonidos o producir sonidos de forma artificial. El campo que
estudia esto es la síntesis de sonidos y los instrumentos más populares utilizados para este
fin son los sintetizadores electrónicos.
2.2.5 Direccionalidad y espacialidad
Un factor importante en el estudio del sonido es el reconocimiento de su procedencia; de
dónde viene el sonido y como puede el ser humano detectar esa procedencia. Los sonidos
reales se originan en fuentes que están ubicadas en algún lugar del espacio circundante
dando origen a dos tipos de sensaciones: la direccionalidad y la espacialidad.
51
La direccionalidad se refiere a la localización relativa de la fuente del sonido o su dirección
de procedencia mientras que la espacialidad permite obtener información auditiva del
ambiente donde se generó y se propagó el sonido (dimensiones del ambiente, arquitectura,
acabado superficial, etc.)
La direccionalidad está asociada a tres fenómenos principalmente. El primero de estos
fenómenos es el retardo o diferencia de tiempos de llegada del sonido desde un oído hasta
el otro, debido a que el recorrido de la onda desde la fuente hasta cada oído es diferente, en
general. El segundo fenómeno es la diferencia de presiones (sonoras) entre los oídos debido
a la distancia entre ellos además de que la cabeza actúa como una barrera sonora. El tercer
fenómeno se relaciona con las alteraciones en el espectro producidas por la propia cabeza.
Estas alteraciones son más notorias en el oído menos expuesto. El cerebro recoge todas esta
información respecto a diferencias de distancias, presiones y cambios en el espectro y toma
una decisión respecto a la localización de la fuente. Esta capacidad se conoce como
discriminación direccional.
La sensación de direccionalidad está determinada por el primer frente de onda que llega a
los oídos. Esto se conoce como el efecto Haas o efecto de precedencia. El efecto Haas se
puede ilustrar mediante un experimento:
El experimento consiste en escuchar mediante unos audífonos estereofónicos dos señales
iguales, una de ellas ligeramente retardada respecto a la otra en cada oído. Las diferentes
etapas del experimento se enumeran a continuación.
- La señal llega a ambos oído simultáneamente (sin retardo)
- La señal llega al oído derecho con un retardo de 0.3ms
- La señal llega al oído derecho con un retardo de 0.6ms
- La señal llega al oído derecho con un retardo de 20ms.
- La señal llega al oído derecho con un retardo mayor o igual a 35ms.
0 ms
0.3 ms
0.6 ms
20 ms
35 ms
Figura 26 Experimento ilustrando el efecto Haas
En el caso 1, se percibe una fuente común y corriente. En el caso 2, se crea la sensación de
una fuente virtual (aparente) que se desplaza desde el frente hacia el lado no retardado. En
52
el caso 3, la fuente virtual parece estar en el extremo izquierdo. En el caso 4, la fuente
virtual parece ensancharse, es decir, tiende a convertirse en dos fuentes por separado. El
caso 5, el segundo sonido se percibe como un eco del primero pero de fuentes distintas. (la
fuente virtual se convirtió en dos). Este es el denominado efecto Haas mediante el cual el
retardo entre las señales determinan la direccionalidad.
La espacialidad es otro fenómeno relacionado con la percepción humana de la fuente
sonora que nos da una idea de espacio circundante. La espacialidad depende principalmente
de cuatro factores. El primero es la distancia entre la fuente y el oído. La presión sonora
disminuye con la distancia y si se conoce la naturaleza de la fuente (si la distinguimos o si
es familiar), al escuchar un sonido propagarse, es posible tener una idea de la distancia de la
fuente. El segundo factor lo constituye las reflexiones tempranas. Si nos encontramos en el
aire libre, sabemos que el sonido proveniente de una fuente al alejarse indefinidamente, se
extingue. El caso contrario ocurre si estamos en un espacio cerrado en el cual la onda
sonora se refleja en las paredes múltiples veces. Las primeras de estas reflexiones se
denominan reflexiones tempranas. Son aquellas que llegan al oído desde generado el sonido
hasta 30ms después. Estas reflexiones tempranas le dan al sistema auditivo una sensación
del tamaño del ambiente que lo rodea. Esta sensación es llamada ambiencia y es
fundamental en el estudio de la acústica arquitectónica en la próxima sección. El tercer
factor que influye en la espacialidad del sonido es la reverberación. La reverberación es
consecuencia de las reflexiones tardías del sonido. Las reflexiones tardías, a diferencia de
las reflexiones tempranas se superponen entre sí debido a que aparecen las reflexiones de
las reflexiones y posteriormente las reflexiones de las reflexiones. En pocos instantes se
combinan cientos de reflexiones, dando origen a a la reverberación. Es debido a la
reverberación que el sonido prolonga aún cuando la fuente sonora es interrumpida. El
tiempo de reverberación o tiempo de permanencia depende de las características del
ambiente y por lo tanto este tiempo brinda cierta información especial respecto al recinto
donde se propaga el sonido. El último factor fundamental en la sensación de espacialidad es
el efecto Doppler. El efecto Doppler ya fue explicado anteriormente y es la percepción de
un cambio de frecuencia cuando existe una fuente en movimiento. Este efecto no es de
considerable importancia en la música por ejemplo, pues los instrumentos están estáticos
53
generalmente pero tiene aplicación en las bandas de sonido de películas para simular con
mayor realismo una fuente móvil.
2.2.6 Enmascaramiento
El enmascaramiento es un fenómeno psicoacústico en el cual un sonido es ocultado
(opacado) por otro y el cerebro solamente es capaz de reconocer uno de los dos sonidos.
Esto es equivalente a decir que en el enmascaramiento se aumenta el umbral de audibilidad
de un sonido debido a la presencia de otro. El enmascaramiento sonoro tiene su origen en
los receptores auditivos situados en la membrana basilar. Esto en consecuencia ocasiona un
nivel de actividad neural que altera la detectabilidad de algunos componentes y ocurre el
enmascaramiento. El enmascaramiento sonoro está relacionado principalmente con el nivel
de presión sonora, la frecuencia y con la envolvente en el tiempo. Dependiendo de esos
factores se podrá distinguir entre la señal enmascarante y la señal enmascarada. Para
facilitar el análisis, se supondrán primeramente dos señales puras (una componente de
frecuencia).
2.2.6.1 Umbral de enmascaramiento (UE) y nivel de sensación (NS). Se dijo
anteriormente que el umbral de audibilidad es el nivel de presión sonora mínimo audible
para el ser humano, variable en la frecuencia. Ahora se debe introducir un nuevo término
relacionado para el análisis del enmascaramiento sonoro. Este, es el umbral de
enmascaramiento (UE) y se define como el nivel de presión sonora de una señal de prueba
para que ésta sea audible en presencia de una señal enmascarante. Nótese que en la
definición de umbral de enmascaramiento se hace referencia a una nueva señal: la señal
enmascarante. En el caso en que no exista señal enmascarante, las definiciones de umbral
de audibilidad y de umbral de enmascaramiento son idénticas. El patrón de
enmascaramiento es una forma de representar el umbral de enmascaramiento en función de
una variable, generalmente la frecuencia. Se suele representar de manera gráfica. Otro
parámetro importante en el estudio del enmascaramiento sonoro es el nivel de sensación
(NS), medido en dBsl:
54
NS(dBsl)= UE(dBSPL)-UA(dBSPL)
Las unidades que son medidas en dBsl siempre están relacionadas a un umbral de
audibilidad. (dBSPL es el nivel de presión sonora)
2.2.6.2 Tipos de enmascaramiento. Existen diversos tipos de enmascaramiento de acuerdo
al nivel de presión sonora, la frecuencia, y la separación en el tiempo de la señal
enmascarante y la enmascarada.
Dependiendo de la ubicación en el tiempo de señal de prueba y la señal enmascarante se
definen los siguientes tipos de enmascaramientos sonoros (temporales):
Enmascaramiento simultáneo: La señal de prueba y la señal enmascarante se presentan al
mismo tiempo, solapadas.
Pre-enmascaramiento (enmascaramiento previo): La señal enmascarante se presenta
después de la señal de prueba.
Post-enmascaramiento (enmascaramiento posterior) : La señal enmascarante se presenta
antes de la señal de prueba.
Figura 27 Enmascaramiento temporal
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l.: Universidad Simón Bolívar, Departamento de
electrónica. 1995
A continuación se efectuará un análisis de los efectos espectrales relativos a el ruido que
tiene el enmascaramiento simultáneo, quizá el más importante y que se presenta con mayor
frecuencia.
2.2.6.3 Análisis del enmascaramiento simultáneo en la frecuencia. Se realizaron
experimentos con ruido blanco, es decir, ruido cuya densidad espectral de energía es
55
constante e independiente de la frecuencia. El patrón de enmascaramiento del ruido blanco,
obtenido experimentalmente es el siguiente:
Figura 28 Patrón de enmascaramiento del ruido blanco a varias presiones sonoras
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica. 1995.
Del gráfico se pueden hacer algunas afirmaciones:
-
El umbral de enmascaramiento para el ruido blanco es aproximadamente constante
para frecuencias menores de 500 Hz y aumenta a razón de 10dB/década para
frecuencias mayores.
-
Es más fácil enmascarar un tono de alta frecuencia que uno de baja frecuencia (esto
a pesar de que la intensidad del ruido blanco es uniforme en la frecuencia)
Un análisis similar puede realizarse para diversas bandas de ruido a un mismo nivel de
presión sonora. Particularmente, en la siguiente figura las bandas de ruido de 250, 1000,
4000 y 8000 Hz de frecuencia central y 100, 160, 700 y 1700 Hz de ancho de banda,
respectivamente y todas a un nivel de 60 dBSPL
Figura 29 Patrón de enmascaramiento para varias bandas de ruido a un mismo nivel de presión
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l.: Universidad Simón Bolívar. Departamento de
electrónica. 1995
56
Del gráfico se pueden hacer algunas afirmaciones:
-
El efecto del enmascaramiento se extiende fuera del intervalo de frecuencias a la
cual está confinada la banda.
-
Este efecto se ve más pronunciado en altas frecuencias.
Considerando el ruido blanco analizado de primero y el ruido de distintas bandas analizado
después, es razonable pensar que el efecto de enmascaramiento es lineal para frecuencias
menores de 500 Hz y logarítimico para frecuencias superiores.
2.2.6.4 Dependencia del
nivel de presión sonora. En los párrafos anteriores se
consideraron los efectos de enmascaramiento utilizando como variable de control la
frecuencia. Ahora se utilizará como variable el nivel de presión sonora y se obtendrán
conclusiones similares.
El análisis que sigue hace referencia a un conjunto de bandas de ruido con la misma
frecuencia central (1kHz) y el mismo ancho de banda (160Hz), pero con distintos niveles
de presión sonora.
Figura 30 Patrón de enmascaramiento en función del nivel de presión sonora
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l.: Universidad Simón Bolívar. Departamento de
electrónica. 1995
Nótese del gráfico anterior que el patrón de enmascaramiento es mayor para mayores
presiones sonoras, como era de esperarse. En efecto, dado un incremento de n dB en la
señal enmascarante, se obtiene también aproximadamente un incremento de n dB en el
57
umbral de enmascaramiento. También se puede observar que a frecuencias menores de la
frecuencia central, la pendiente es aproximadamente constante (independiente de la
frecuencia) y la banda inferior es estrecha. Un efecto contrario ocurre en la banda superior
en el cual la pendiente es menor (en magnitud ) para niveles de presión sonora mayores.
Esta es aún otra evidencia de que el enmascaramiento es mayor para frecuencias grandes
que para frecuencias pequeñas.
58
2.3 ACÚSTICA MUSICAL
La acústica musical es un capítulo importante de la acústica y estudia la relación entre los
sonidos, haciendo particular énfasis en el tono y la cualidad tímbrica de éstos. Hace parte
de la acústica musical el estudio de la consonancia y disonancia, las escalas musicales y el
comportamiento de los distintos instrumentos musicales, acústicos y electrónicos.
2.3.1 Consonancia y disonancia
En el capítulo de introducción al sonido, se estudió el fenómeno de las pulsaciones, o efecto
pulsatorio. Este concepto es necesario para explicar la definición de consonancia. Las
pulsaciones ocurren cuando se superponen dos tonos de frecuencias muy próximas de tal
forma que aparece un sonido modulado por una envolvente. Si se suman dos sonidos de
frecuencias f1 y f2, entonces aparecen pulsaciones de frecuencia F = f1-f2, con amplitud
modulada desde 0 hasta el valor máximo que es igual a la suma de las dos amplitudes (f1 y
f2). Dependiendo de la rapidez de las pulsaciones (es decir de F ), se perciben distintos
efectos. Si la rapidez es pequeña, del orden de 1 o 2 Hz, no es detectable la pulsación. Si la
rapidez es grande, 5 o 10Hz hasta 50 Hz el resultado produce una sensación de agitación,
comúnmente llamada disonancia. Nota: Cuando la rapidez es lo suficientemente grande (las
frecuencias difieren por >60Hz), el fenómeno de pulsación se hace indistinguible. La
disonancia está basada también en sensaciones psicoacústicas subjetivas las cuales no son
agradables para el oído. Sin embargo, está fundamentada en la situación física descrita
anteriormente. El análisis de la disonancia presentado fue para dos tonos puros, pero se
puede generalizar teniendo en cuenta el espectro de una señal compuesta, es decir, sus
armónicos. Esta generalización es importante pues prácticamente todos los sonidos
presentes en la música son compuestos. Ahora, superponer dos sonidos compuestos es
equivalente a superponer un espectro con un cierto número de armónicos con otro espectro
con otro número de armónicos. Por esta razón es posible que aparezca el efecto de
pulsaciones entre los armónicos de ambos sonidos. Supóngase, dos tonos compuestos de
59
frecuencias f1=311Hz y f2=220Hz. La resta de estas dos frecuencias origina la frecuencia
de pulsación f
pulsación
= 91Hz. Esta frecuencia es demasiado rápida para producir una
sensación de disonancia. Sin embargo, ambas frecuencias son tonos compuestos y por lo
tanto tienen la secuencia de armónicos (múltiplos enteros de la frecuencia fundamental):
622 Hz, 933 Hz . . . (para f1) y 440 Hz, 660 Hz, 880Hz . . .(para f2). El segundo armónico
de f1 (622 Hz) genera pulsaciones con el tercer armónico de f2 (660Hz) pues la resta de
ambos F= 660 –622= 38Hz, causando disonancia.
El concepto de consonancia, que es simplemente evitar la disonancia, es importante para la
construcción de la escala musical. De esta forma, se puede definir consonancia como la
situación en el cual no exista interferencia importante (respecto a pulsaciones) entre los
armónicos de las señales sonoras superpuestas. Matemáticamente, se puede describir de la
siguiente forma: si dos señales acústicas tienen períodos T1 y T2 (F1 y F2), existen
números enteros n y m tal que nT1=mT2 cuando ambas ondas entran en fase (T1 recorre n
ciclos mientras que T2 recorre m ciclos). Esto es equivalente a decir que F1/F2 =n/m, ya
que F=1/T. Cuando la relación n/m es de números enteros pequeños, es decir, las dos
señales entran en fase más veces y hay menos probabilidad de pulsaciones, se dice entonces
que la relación es de consonancia.
2.3.1.1 Intervalos. Para estudiar consonancia entre sonidos musicales, se deben encontrar
las distancias relativas entre dos frecuencias de tal forma que no se genere disonancia (o
por lo menos, exista muy poca). Estas distancias son llamadas intervalos y son
caracterizadas por el cociente entre las dos frecuencias (n/m). El primer intervalo es el
unísono, relación de frecuencias 1:1. Se refiere a dos tonos idénticos ejecutados
simultáneamente. La consonancia en este caso es perfecto, pues todos los armónicos van a
ser idénticos y es imposible que se generen pulsaciones. El segundo intervalo importante es
la octava, relación de frecuencias 2:1. En este caso un tono tiene el doble de frecuencia que
el otro. En este caso tampoco existe conflicto entre armónicos pues todos los armónicos del
tono más agudo coinciden con armónicos del más grave. El tercer intervalo es la quinta,
relación de frecuencias 3:2. En este caso, no todas los armónicos de ambos sonidos
coincidirán, pero aún así no existe disonancia. Por ejemplo un sonido de frecuencia de 220
60
Hz (equivale a la nota musical la) y un sonido de frecuencia de 330 Hz. (equivale a la nota
musical mi) constituyen un intervalo de quinta porque 330=220x1.5.
la
220 440
mi
330
880
660
990
....
....
Figura 31 Componentes armónicos de las notas musicales la y mi
En la figura se muestran algunos de los armónicos que generan las notas. Puesto que
algunas veces coinciden y cuando no coinciden, la diferencia de las frecuencias es de
110Hz, los armónicos no entran en conflicto y no existe disonancia. Después del unísono y
la octava, la quinta es el intervalo más consonante. Después de la quinta siguen otros
intervalos, con menos consonancia pero importantes en la música occidental: 4:3(cuarta),
5:4(tercera mayor), 6:5(tercera menor), 5:3(sexta mayor), 8:5(sexta menor)
a)
b)
c)
d)
e)
f)
Figura 32 Algunos intervalos musicales partiendo de la nota do
a) tercera mayor b) tercera menor c) cuarta d) sexta menor e) quinta f) octava
A partir de estos intervalos procederemos al análisis de las escalas musicales.
(Únicamente se estudiará la escala occidental, aunque hay que resaltar que existen muchas
otras en el mundo musical.)
61
2.3.2 Escalas
Una escala es una sucesión de notas musicales. Las escalas en general deben satisfacer tres
condiciones: economía, funcionalidad y reproducibilidad. La economía de una escala se
refiere que se deben seleccionar un número no muy grande de notas para una escala simple.
Por otra parte, lograr un número “infinito” de sonidos solamente es realizable por
instrumentos de afinación continua, como lo son el violín, la viola, el cello, el trombón, etc.
La funcionalidad es un parámetro importante pues indica que uso se le va dar a la escala.
Una escala debe estar adecuada para diversos usos que se le de: uso monofónico (un
instrumento) o uso polifónico (varios instrumentos). Relacionada con la funcionalidad, está
el sentido estético subjetivo de las notas; la mayor cantidad de combinación de notas en una
escala debe resultar agradable.
La reproducibilidad se refiere a la facilidad de lograr una afinación precisa por medio de la
voz o instrumento.
2.3.2.1 Evolución de las escalas musicales. La evolución de las escalas musicales depende
históricamente del contexto musical de una época determinada. La música, como lenguaje
universal, surgió paralelamente en distintas partes del mundo. Se conocen fuentes que datan
desde hace 50 siglos en Sumeria, India y en Mesopotamia. Quizá el instrumento más
importante era la voz, utilizado tanto para cantar textos poéticos como para cantos fúnebres.
También se contaba con instrumentos simples de percusión, además del monocordio
(instrumento de una sola cuerda). Para las música primitiva, era suficiente una escala
simple monofónica (solo un instrumento) pues así eran los instrumentos de la época y aún
no se combinaban sonidos simultáneos. Sin embargo, los Mesopotámicos conocían ya
algunos intervalos (unísono, octava, quinta, cuarta) hacia el siglo VI antes de Cristo.
Pitágoras, matemático de Grecia, fue pionero en el campo de relacionar matemáticamente
la música. Pitágoras experimentaba con un instrumento sencillo de una sola cuerda llamado
monocordio. El variaba la tensión de la cuerda (mediante pesos colgantes sujeto a la
cuerda) al igual que su longitud y encontró de forma muy temprana que la frecuencia es
inversamente proporcional a la longitud de la cuerda (y directamente proporcional a la raíz
62
cuadrada de la tensión). Encontró que los sonidos “agradables” se obtenían mediante
relaciones en frecuencia de números enteros pequeños, consonantes. Los primeros
intervalos que encontró fue : 1:1 (unísono), 2:1(octava) y 3:2 (quinta). Al experimentar con
estos intervalos surge la escala pitagórica. La escala pitagórica es una escala basada en el
encadenamiento de quintas. El encadenamiento de quintas es un proceso en el cual se parte
de un sonido, y se toma su quinta (intervalo de quinta, una relación de 3/2 en frecuencias).
Partiendo de este segundo sonido, se vuelve a tomar su quinta y así sucesivamente hasta
completar una serie de sonidos deseados. En la escala más simple, se toman siete sonidos
partiendo de un sonido grave: Fa. A partir de Fa, se obtienen los siguientes sonidos: Do,
Sol, Re, La, Si (intervalos de quinta sucesivas). Se debe tener en cuenta que no todos los
sonidos quedan en una misma octava. Si quisiéramos una escala seguida Do, Re, Mi, Fa,
Sol, La, Si, debemos ajustar las octavas de algunas notas: Fa se sube una octava, Do y Sol
no se modifican, Re y La se bajan una octava, y Mi y Si se bajan dos octavas. Esta escala,
Do, Re, Mi, Fa, Sol, La, Si es también llamada escala diatónica de Do. (En el piano
corresponde a las notas blancas).
El origen de los nombres de las notas pertenecientes a la escala se atribuye a Guido de
Arezzo y data del siglo XI D.C. Guido Arezzo se basó en un poema religioso en latín
dedicado a San Juan Bautista. (Este himno fue escrito por Paulo Diácon):
Ut queant laxis
Resonare Fibris
Mira gestorum
Famuli Tuorum
Solve Polutim
Labii reatum
Sancte Ioannes
Arezzo tomó la primera sílaba de cada verso para dar nombre a las notas (seis) de la escala:
Ut, Re, Mi, Fa, Sol, La. El nombre para la séptima nota (Si) vino después en el siglo XVI,
tomado de las primeras letras de las palabras “Sancte Ioannes”. También fue después que se
cambió Ut por Do, al parecer por la facilidad en su pronunciación.
63
La anterior escala fue utilizada por mucho tiempo, pero se encontró un problema con
algunos intervalos que no eran acústicamente perfectos. Por ejemplo, el intervalo de Do a
Mi (tercera mayor) se logra de la siguiente forma:
Mi/Do =
3 3 3 3 1 1 81
.
⋅ ⋅ ⋅ ⋅ ⋅ =
2 2 2 2 2 2 64
3
Los primeros cuatro factores ( ) corresponden a los encadenamientos de quintas (un
2
intervalo de quinta equivale a multiplicar por
3
) necesarios para obtener un Mi:
2
Do-Sol → Sol-Re → Re-La → La-Mi.
1
Los últimos dos factores ( ) corresponden a bajar dos octavas, como se vio anteriormente.
2
Sin embargo, al analizar consonancias, la relación para una tercera mayor era de
5
. Pero
4
5 80
81
=
, y eso no es igual a
! A esta diferencia se le llamó coma pitagórica y representa
4 64
64
una imperfección acústica de la escala pitagórica. Una situación similar ocurría con el
intervalo de sexta mayor. (La/Do). Para ayudar a subsanar esta imperfección, se recurrió a
otra forma para la construcción de la escala musical. En vez de encadenar quintas
sucesivas, se utilizan solamente tres quintas que da lugar a cuatro notas partiendo de Fa: Fa,
Do, Sol y Re. Ahora, se introducen terceras perfectas en la mitad de cada intervalo de
quinta. Se introduce un La entre Fa y Do (La es la tercera perfecta de Fa), un Mi entre Do y
Sol (Mi es la tercera perfecta de Do), y un Si entre Sol y Re. (Si es la tercera perfecta de
Sol). Después se reordenan ubicando todas las notas en una misma octava al igual que la
escala pitagórica. A esta nueva escala, se le denominó escala natural y reducía el efecto de
la coma pitagórica, causa de su imperfección acústica.
3ra
fa
3ra
la
5ta
do
3ra
mi
5ta
sol
si
5ta
Figura 33 Construcción de la escala natural
re
64
Ambas escalas resultaron útiles por mucho tiempo, pero la música seguía evolucionando
hasta la denominada música ficta. Ficta significa falsa y se refiere a la introducción de notas
no pertenecientes a la escala, pero que le agregaban variedad y belleza. Esto implicaba que
se debían ampliar las escalas por diversos motivos:
transposición: Transponer significa subir o bajar una composición para adaptarla al rango
de una voz o un instrumento. Si una composición se transpone una octava, la escala sigue
siendo la misma pero si se transpone una tercera, o cuarta o quinta por ejemplo, se deben
introducir notas adicionales.
modulación: Modular significa cambiar de tonalidad y este cambio se utilizaba para hacer
que algunos pasajes musicales utilicen una escala mientras que otros utilicen escalas
distintas.
Para ambas situaciones se requiere la adición de nuevos sonidos y por eso se propuso una
escala con doce sonidos, llamada escala temperada. Además de las notas ya conocidas de la
escala pitagórica o de la natural, se introdujeron unos intervalos intermedios entre las notas
para un total de 12 notas en la escala:
Do# (se lee Do sostenido) o Reb (se lee Re bemol) se introduce entre Do y Re.
Re# o Mib se introduce entre Re y Mi
Fa# o Solb se introduce entre Fa y Sol
Sol# o Lab se introduce entre Sol y La
La# o Sib se introduce entre La y Si
(Estos nuevos tonos corresponden a las teclas negras en el piano). Las particularidades de
estos nuevos tonos así como las nuevas escalas y posibilidades que se generan son muchas,
pero son objeto de un texto de música. Esta escala temperada era variada y funcional pero
tenía un grave inconveniente: para mantener los intervalos acústicamente perfectos se tenía
que volver a construir la escala a partir de cada nota. Esto significa que habría una escala
acústicamente perfecta para Do y otra acústicamente perfecta para Re por ejemplo.
Estaríamos hablando de doce escalas diferentes que obviamente va en contra del principio
de economía y simplicidad. De hecho, antes del siglo XVII, cuando se requería interpretar
una pieza en una escala distinta se debía afinar el instrumento nuevamente para conservar
los intervalos planteados en la escala temperada. Afortunadamente, apareció una solución
65
para esto: el temperamento uniforme. El temperamento uniforme consiste en ubicar iguales
distancias relativas (en frecuencia) para todas las notas. Consiste en dividir la escala en 12
intervalos iguales denominados semitonos. Es decir, la distancia entre Do y Do# (un
semitono) debe ser la misma que la distancia entre Do# y Re (un semitono), igual a la
distancia entre Re y Re# (un semitono), y así sucesivamente. Esto se logra mediante la
siguiente fórmula matemática:
fi+1=21/12 fi
donde fi representa una frecuencia arbitraria y fi+1 es la frecuencia un semitono (medio tono)
arriba. Por ejemplo si f1=Do, entonces f2=Do#, f3=Re, f4=Re#, etc.
Tabla 3 Frecuencias de las notas musicales en una escala con temperamento uniforme
MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004
De esta forma todos los intervalos son equiespaciados y por eso el nombre
de
temperamento uniforme. Con ésto se resuelven los problemas de la escala pitagórica y la
escala natural. Se pueden interpretar piezas sin necesidad de afinar nuevamente el
instrumento.
66
2.3.3 Instrumentos musicales
Un instrumento musical consiste en la combinación de uno o más sistemas resonantes
capaces de producir uno o más tonos, además de los medios para excitar estos sistemas.
Estos se pueden clasificar según la familia a la cual pertenecen (dependiendo del modo en
que se produce el sonido): instrumentos de percusión, instrumentos de cuerda, instrumentos
de viento y instrumentos electrónicos. Cada una de estas categorías a su vez pueden ser
subdivididas en otras más específicas atendiendo a alguna característica.
Sin embargo, existen algunas características que son comunes a los instrumentos en
general. Estas son dos principalmente: la tonal y la dinámica. El aspecto tonal depende de
la altura y del timbre del instrumento. El aspecto dinámico depende de los rangos de
intensidad de cada instrumento. Obviamente estos rangos a su vez también dependen de la
persona particular que interprete el instrumento. Algunos factores que influyen y gobiernan
sobre el aspecto tonal y el aspecto dinámico son: el patrón de direccionalidad y la duración
del sonido. El patrón de direccionalidad indica en que dirección se está propagando el
sonido y mide la respuesta del sonido producido por un instrumento respecto a una
orientación o eje de referencia. La duración de un sonido es el intervalo en el cual el sonido
persiste sin interrupción. También se pueden clasificar los instrumentos según la duración
de los sonidos que es capaz de producir:
instrumentos de duración fija: se mantiene un sonido por un tiempo relativamente corto
pues éste se extingue.
instrumentos de duración variable limitada: la duración máxima está limitada por
parámetros físicos como el paso completo de un arco en instrumentos de cuerda, o por la
capacidad pulmonar del intérprete.
instrumentos de duración ilimitada: en estos instrumentos se puede mantener un sonido
por tiempo ilimitado sin discontinuidad.
Por ejemplo, el piano y la guitarra pertenecen al conjunto de instrumentos de duración fija,
el violín y los instrumentos de viento al conjunto de instrumentos de duración variable
67
limitada y los órganos pertenecen al conjunto de los instrumentos de duración ilimitada.
También relacionado con la duración, está la envolvente en el tiempo de los instrumentos.
La envolvente en el tiempo ya fue estudiada en la sección anterior (“attack”, “decay”,
“sustain”, “release”) y también influye en las características tonales y dinámicas de los
instrumentos.
2.3.3.1 Instrumentos de percusión. Los instrumentos de percusión son aquellos en el que
se produce sonido por efecto de percusión directa o indirecta. La percusión se efectúa de
maneras muy diversas como por varillas metálicas, mediante baquetas, golpeando un
cuerpo sonoro contra otro, indirectamente mediante un teclado, etc. Se pueden clasificar en
instrumentos de altura determinada (entonación definida) y en instrumentos de altura
indeterminada (entonación indefinida). A los primeros pertenece el xilófono, la marimba, el
metalófono, el glockenspiel, mientras que al segundo grupo pertenece el bombo, platillos,
congas, bongos, batería. Una característica general de este grupo de instrumentos es que su
espectro es inarmónico, es decir, contiene frecuencias que no son múltiplos de alguna
frecuencia determinada fundamental. Además en algunos instrumentos como la marimba y
el xilófono se crea una resonancia adicional adicionando un tubo o una columna de aire, el
cual amplifica el sonido y ayuda a filtrar armónicos no deseados.
Otra clasificación para los instrumentos de percusión es según el elemento vibrante que
utilizan: varilla, placa y membrana. Las varillas son cuerpos rígidos cuya longitud es
notablemente mayor que las dimensiones restantes. Pueden vibrar con vibraciones
longitudinales, transversales o de torsión. Las placas y membranas son cuerpos de
superficie grande con relación a su espesor; excitadas por percusión o fricción emiten
sonidos caracterizados por un complejo grande de parciales discordantes (armónicos). Las
placas, debido a su rigidez, sólo necesitan un punto de apoyo, mientras que las membranas
necesitan tensión previa para vibrar. Al grupo de varilla como elemento vibrante pertenecen
el xilófono, celesta y el triángulo. Instrumentos de placa son los platillos, la campana y el
gong. De membrana están los timbales, el bombo, el tambor y la pandereta. La percusión
generalmente es utilizada como soporte rítmico en agrupaciones musicales, debido a su
entonación indefinida, exceptuando los instrumentos de percusión con altura determinada.
68
Figura 34 Instrumentos de percusión
Fuente: DIANI, Felipe. s.l.:s.n. 1998.
<culturitalia.uibk.ac.at> [consulta: 14 Abr. 2005]
69
2.3.3.2 Instrumentos de cuerda. Los instrumentos musicales de cuerda son aquellos en
que el cuerpo vibrante y sonoro es una cuerda. Estos se clasifican de acuerdo al modo en
que son excitadas las cuerdas:
Cuerda punteada: La cuerda es apartada de su posición normal (de reposo) y se deja libre
generando una vibración. A este grupo pertenecen la guitarra, el banjo, el arpa, el ukelele,
etc.
Cuerda frotada: Frotar una cuerda consiste en rozar la cuerda con un material de gran
adherencia como ciertas fibras naturales y sintéticas. A este grupo pertenecen el violín, la
viola, el cello y el contrabajo. El elemento frotante se denomina arco.
Cuerda percutida: Este procedimiento consiste en percutir (golpear) la cuerda con un
macillo o martillo. A este grupo pertenece el piano y el clavicordio.
Es importante resaltar que para la mayoría de los instrumentos de cuerda existe un
mecanismo de amplificación. Cuando la cuerda vibra, transmite al aire energía sonora, pero
muchas veces esta energía, o mejor intensidad sonora, es insuficiente. La mayor parte de la
energía de la cuerda pasa a través de un mecanismo de amplificación denominado caja
armónica o caja resonante el cual permite entregar una mayor cantidad de energía sonora al
medio (aire).
Las cuerdas pueden producir vibraciones transversales y longitudinales, pero solo las
primeras producen sonidos agradables (menos componentes inarmónicos y menos ruido).
Ahora consideremos las vibraciones transversales en una cuerda sujeta fija por ambos
extremos. En el capítulo introductorio de ondas se explicó que la frecuencia
correspondiente al armónico de orden n está dada por:
fn=
n T
2L µ
donde L es la longitud de la cuerda, T es la tensión y u es la densidad lineal de la cuerda. Se
puede escribir la densidad lineal de la cuerda como:
µ=
masa
, pero masa=Vd donde d es la densidad volumétrica y V es el volumen. La
longitud
ecuación queda µ=
Vd
=Ad donde A es el área de la sección transversal de la cuerda.
longitud
70
A=πr2 para la sección transversal de la cuerda (considerada como un cilindro). De aquí se
obtiene una fórmula equivalente para fn:
fn=
n
2Lr
T
πd
De acuerdo a esta fórmula se deduce claramente que la frecuencia es:
-
inversamente proporcional al radio de la sección transversal, a la longitud, y a la
raíz cuadrada de su densidad volumétrica.
-
directamente proporcional a la raíz cuadrada de la tensión
Estas aseveraciones son conocidas como las leyes de Mersenne para vibraciones
transversales en una cuerda. Para afinar un instrumento de cuerda, es decir, subir o bajar su
frecuencia, se acostumbra tensar la cuerda (por medio de clavijas por ejemplo). Entre más
tensa esté la cuerda, más alto será su sonido de acuerdo a la ley de Mersenne. Esta ley
también explica por que razón las cuerdas graves de una guitarra son más grandes y
pesadas: su densidad volumétrica es mayor y por lo tanto su altura será menor.
Figura 35 Instrumentos de cuerda
Fuente: DIANI, Felipe. s.l.:s.n. 1998.
<culturitalia.uibk.ac.at> [consulta: 14 Abr. 2005]
71
2.3.3.3 Instrumentos de viento. Los instrumentos de viento son aquellos que contienen un
volumen gaseoso capaz de producir sonido al ser convenientemente excitado. Es importante
resaltar que el cuerpo sonoro es el volumen gaseoso y no el recipiente que lo contiene. El
mecanismo de vibración consiste en las numerosas reflexiones de la onda sonora dentro del
recipiente. La vibración de las columnas de aire contenidas en los tubos sonoros es debida a
la formación de una onda estacionara dentro del recipiente. La forma más general de
clasificación de los instrumentos de viento es según la forma del recipiente o tubo: tubos
cerrados y tubos abiertos.
Tubos Cerrados: Poseen una sola abertura. Tienen el máximo de vibración en el extremo
cerrado (vientre) y un mínimo en el extremo cerrado (nodo).- La frecuencia del sonido
emergente es:
f n=
(2n - 1)c
4L
n: el número del armónico
L: longitud del tubo
c: velocidad del sonido.
Se puede deducir que la frecuencia es inversamente proporcional a la longitud del tubo.
Además, en tubos cerrados solo existirán armónicos impares brindándole un timbre muy
particular a este tipo de instrumentos. Instrumentos de tubo cerrado son: el clarinete,
algunos órganos y la ocarina.
Tubos abiertos: Poseen dos o más aberturas. Tienen el máximo de vibración en ambos
extremos (vientres). La frecuencia del sonido emergente es:
f n=
nc
2L
n: el número del armónico
L: longitud del tubo
c: velocidad del sonido.
Se puede deducir que la frecuencia es inversamente proporcional a longitud del tubo. A
diferencia de los tubos cerrados, en los tubos abiertos existen teóricamente todos los
72
armónicos (pares e impares). Instrumentos de tubo abierto son: flauta traversa, el oboe y el
trombón.
Si tomamos la frecuencia fundamental para tanto tubos abiertos como para tubos cerrados
(n=1) obtenemos:
f fund =
ffund=
c
(tubos cerrados)
4L
c
(tubos abiertos)
2L
Esto significa que la frecuencia fundamental para un tubo abierto es dos veces mayor que
para un tubo cerrado, lo que significa en términos musicales que esa frecuencia específica
en tubos abiertos se encuentra una octava por encima que la de su contraparte en tubos
cerrados (asumiendo la misma longitud del tubo).
Existen otras clasificaciones para los instrumentos de viento dependiendo de su forma
interior, los hay cilíndricos, cónicos y prísmicos. También se clasifican de acuerdo al modo
de la excitación de la columna aérea:
Tubos con embocadura: Hay instrumentos con embocadura directa como la flauta traversa
e instrumentos con embocadura indirecta como la flauta de pico.
Tubos con lengüeta: La lengüeta puede ser libre como en la armónica, simple como en el
clarinete o doble como el oboe.
Tubos con boquilla o lengüeta “labial”: La lengüeta se realiza utilizando los labios como
en la trompeta.
73
Figura 36 Instrumentos de viento
Fuente: DIANI, Felipe. s.l.:s.n. 1998.
<culturitalia.uibk.ac.at> [consulta: 14 Abr. 2005]
74
2.3.3.4 Instrumentos electrónicos. Estos instrumentos modernos surgieron en el siglo XX
y avanzaron gracias a la tecnología digital. También son llamados sintetizadores pues son
capaces de sintetizar una onda sonora a partir de una señal eléctrica. El elemento
fundamental del sintetizador es el oscilador pues es éste el que se encarga de generar la
señal eléctrica. Los osciladores electrónicos son capaces de generar miles de formas de
onda además de variar sus más importantes parámetros como lo son la altura y la amplitud.
Además de los osciladores, existen otros componentes que permiten modificar el sonido de
muchas formas:
Control de envolventes: Este permite el control de la evolución en el tiempo de cualquier
parámetro asociado a un generador de sonido, como la altura, el contenido armónico, etc.
Control de efectos: Este permite modificar varios parámetros a través de fluctuaciones
periódicas para obtener una gama de efectos especiales como vibrato, trémolo, wah-wah,
etc.
Interfaz: La interfaz es cualquier dispositivo que sirva como ente intermediario entre un
sintetizador y el intérprete. Una interfaz permite enviar al sintetizador información sobre
los sonidos que debe producir como la altura y la sonoridad. Esta última se evalúa a partir
de sensores de presión en el caso en que la interfaz sea un teclado.
Interconexión MIDI: MIDI (Musical Instrument Digital Interface) es una interfaz digital
para instrumentos musicales. Es una norma que establece un código de comunicación entre
instrumentos musicales y entre instrumentos y computadores. Debido a la naturaleza digital
de MIDI, existen muchas posibilidades. Mediante programas de computador denominados
secuenciadores es posible controlar el instrumento por computadora y así ejecutar música
previamente programada. También es posible seleccionar instrumentos y editar
virtualmente cualquier parámetro en una grabación como el tempo, la altura, agregar voces,
cambiar el timbre, etc.
Figura 37 Sistema MIDI (teclado, secuenciador, computador)
Fuente: KING, Andrew. s.l.:sn. 2001.
< www.andymid.com/system> [consulta 15 Abr. 2005]
75
2.4 ACÚSTICA ARQUITECTÓNICA
La acústica arquitectónica estudia todos los fenómenos relacionados con la propagación del
sonido en un recinto es decir, el comportamiento de las ondas sonoras respecto al espacio
que la rodea. El estudio parte desde la generación del sonido por parte de la fuente hasta el
instante en que llega la onda sonora hasta los oídos. Los recintos son la interfase entre una
fuente de sonido, sea natural o electrónica, y nuestro oído.
Los fenómenos sonoros más importantes relacionados con propagación en un recinto son:
la reflexión, la refracción, la absorción y la difracción, siendo la reflexión la más
importante. Esto debido a las numerosas reflexiones de la energía sonora en un recinto en el
piso, las paredes, personas, obstáculos en general, creando un campo sonoro complejo que
merece especial atención. La acústica arquitectónica también analiza todos los parámetros
que influyen en la calidad acústica de un recinto y así diseñar un óptimo tratamiento
acústico. La calidad acústica se refiere a la transmisión fiel y funcional del sonido,
obviamente dependiendo de la aplicación. Existen distintas aplicaciones específicas en el
diseño de recintos como por ejemplo diseño de salas de grabación, salas de cine, auditorios,
salones de clase, etc. que deben tener unas cualidades acústicas determinadas y específicas
para dicha aplicación. Por cualidad acústica se entienden una serie de propiedades
relacionadas con el sonido en un recinto como los ecos, la reverberación, las reflexiones
tempranas, el campo sonoro generado, etc. Estas propiedades dependen a su vez de la
geometría del recinto así como de los materiales empleados en su construcción y
recubrimiento. El objetivo del tratamiento acústico de recintos es modificar la respuesta del
recinto al estímulo de ondas sonoras en un sentido conveniente.
Primero se definirán algunos conceptos preliminares y después se analizarán condiciones
geométricas de la arquitectura para aplicarlas en el diseño específico de recintos.
76
2.4.1 Campo sonoro
El campo sonoro es una función que asigna a cada punto del espacio y a cada instante del
tiempo un nivel de presión sonora. Un claro entendimiento del campo sonoro es de vital
importancia para el diseño acústico de los recintos.
Primero se hará una clasificación respecto al tiempo y posteriormente se hará respecto al
espacio.
2.4.1.1 Estructura del campo sonoro en el eje del tiempo. Dentro de un ambiente se tiene
que, en un punto dado llega un conjunto complejo de ondas sonoras que pueden clasificarse
de acuerdo con su orden de llegada y a su densidad temporal. De esta forma se puede
obtener una clasificación de acuerdo los tiempos de llegada de la onda sonora a los oídos.
El fenómeno detrás de los siguientes conceptos son las reflexiones(exceptuando el sonido
directo).
2.4.1.1.1 Sonido directo. El primer concepto fundamental para entender el campo sonoro
es el sonido directo. El sonido directo es el sonido que viene directamente desde la fuente
sonora, antes de que exista alguna reflexión.
2.4.1.1.2 Reflexiones tempranas. Un oyente en un recinto cerrado recibirá dos ondas
sonoras. Una onda sonora proviente directamente desde la fuente hasta los oídos del oyente.
Esta se denomina sonido directo. Sin embargo debido a posibles superficies reflectoras
como pisos, paredes, obstáculos, el sonido emitido por la fuente también será reflejado por
estas superficies y llegarán al oído del oyente de forma indirecta. A las primeras reflexiones
recibidas, que están considerablemente separadas en el tiempo, se les denominan
reflexiones tempranas.
2.4.1.1.3 Ambiencia. La ambiencia es la sensación que permite al oyente ubicarse
espacialmente en un recinto. Esto es debido a la distribución en el tiempo de las reflexiones
tempranas. El control de la ambiencia es fundamental en el diseño acústico arquitectónico.
77
Esto se realiza mediante el proceso de “ray tracing” o trazado de rayos para determinar
todas las trayectorias posibles del sonido a través del recinto hasta las superficies
reflectoras y determinar los tiempos de las reflexiones tempranas.
2.4.1.1.4 Absorción sonora. Este parámetro es independiente de las reflexiones pues es un
parámetro intrínseco de los materiales. Sin embargo está relacionado con la reverberación y
por eso merece un análisis. Las ondas sonoras que inciden en una superficie pueden tener
uno o varios de los siguientes comportamientos: la onda es reflejada, refractada o
absorbida. Las superficies en un recinto reflejan parcialmente la onda sonora mientras que
el resto es absorbida. La cantidad de absorción es relativo a la cantidad de energía
incidente, lo que conlleva a la siguiente definición:
Coeficiente de absorción a =
Energía absorbida
Energía incidente
El coeficiente de absorción sonora es un parámetro de gran importancia para el
comportamiento acústico de un ambiente. Este coeficiente de absorción depende
principalmente del material utilizado en las superficies como paredes y techos pero también
es función de la frecuencia. Es decir los materiales tienen distintos coeficientes de
absorción para distintas frecuencias. En general a aumenta con la frecuencia debido a que a
frecuencias altas, la longitud de onda es pequeña y la superficie se torna más absorbente ya
que irregularidades en la superficie como poros atrapan a la onda cuando son de
dimensiones comparables. En general, los materiales duros como el hormigón son buenos
reflectores (baja absorción) mientras que materiales blandos y porosos como la lana y la
espuma son malos reflectores (alta absorción). Asociado al coeficiente de absorción sonora,
está el área de absorción o simplemente absorción que es el producto del coeficiente de
absorción sonora y la superficie efectiva para un material dado. La absorción cuantifica la
energía extraída del campo acústico, cuando la onda sonora atraviesa un medio
determinado o el choque de la misma con las superficies límites del recinto. Está dada por
(función de la frecuencia):
78
n
A=
∑α S
i i
1
A: absorción [=] sabines
α: coeficiente de absorción sonora
S: superficie
n: número de superficies
También existe una expresión para la absorción teniendo en cuenta las personas y los
objetos ya que también son obstáculos en un recinto e interfieren en la propagación del
sonido.
n
A=
∑α p
i
i
1
A: absorción [=] sabines
α: coeficiente de absorción sonora
p: personas u objetos
n: número de superficies
Las personas aportan aproximadamente 0.4m2 por individuo de área de absorción a una
frecuencia de 1kHz. El área de absorción para objetos en general depende del material,
tamaño y frecuencia.
2.4.1.1.5 Reverberación. Las reflexiones tempranas corresponden a las primeras
reflexiones en un recinto, pero después de un determinado tiempo comienzan a aparecer las
reflexiones de las reflexiones y posteriormente las reflexiones de las reflexiones de las
reflexiones y así sucesivamente. Esto genera un campo sonoro complejo debido a la
densidad de reflexiones. La permanencia del sonido debido a las múltiples reflexiones es
llamada reverberación.
Solo una fracción del sonido es reflejada (la otra es absorbida) en cada incidencia sobre una
superficie. Esto es válido para cada reflexión. La parte de la energía sonora absorbida o es
transmitida a otro medio (a otra habitación por ejemplo), o es convertida a otro tipo de
energía como energía mecánica (vibraciones) o energía térmica (calentamiento). Solamente
las ondas reflejadas se mantienen como energía sonora hasta extinguirse eventualmente.
79
Figura 38 Estructura del campo sonoro en el eje del tiempo
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
2.4.1.1.6 Eco. El eco es el resultado de una única reflexión que retorna al punto donde se
encuentra la fuente sonora cuando el retardo (el tiempo que demora en ida y vuelta) es
mayor a 100ms. La onda sonora parte de un punto y es reflejada por una superficie. La
expresión para la velocidad del sonido como espacio recorrido sobre tiempo es:
c=
2d
t
donde c es la velocidad del sonido, t el tiempo y d la distancia entre la fuente y la superficie
reflectora. Nótese que el espacio se escribe 2d pues interesa el recorrido de ida y vuelta del
sonido. De la anterior ecuación y reemplazando t por 100ms y c por 345m/s, obtenemos la
distancia mínima para obtener un eco: 17 m.
2.4.1.2 Estructura del campo sonoro en el espacio. En el estudio de la acústica
arquitectónica es fundamental conocer como se distribuye el campo sonoro en el ambiente
como por ejemplo, de un recinto. Es importante resaltar que el estudio de la estructura del
campo sonoro en el espacio no es independiente del estudio en el tiempo pues también se
deben tener en consideración las reflexiones que son función del tiempo.
Para efectuar este análisis, el campo sonoro se debe dividir en dos componentes: campo
directo y campo reverberante. El campo directo contiene el sonido generado directamente
desde la fuente, sin haber sufrido alguna reflexión. El campo reverberante por el contrario
contiene el sonido desde la primera reflexión, hasta extinguido el sonido. Aunque estos dos
80
campos son complementarios, tienen comportamientos distintos. El campo directo (en
intensidad sonora) está dado por:
Idirecto=
W
[=]w/m2
4πd 2
W: potencia acústica de la fuente
d: distancia de la fuente al punto donde se realiza la medición.
Tomando puntos a y b separados a una distancia d y 2d respectivamente de la fuente y se
calculan sus respectivas intensidades en el campo directo se obtiene:
Ia=
W
W
y Ib=
2
4πd
4π(2d) 2
Ahora se toma el nivel de intensidad sonora en decibeles y calculamos la diferencia. De
esta forma se obtiene el número de decibeles que ha disminuido Ib con respecto a Ia:
(Ia-Ib)dB= 10log(
W
W
)-10log(
)= 10log4= 6dB
2
4πd
4π(2d) 2
En conclusión, también se define el campo directo como la región donde la intensidad
disminuye 6dB por cada duplicación en la distancia. También es llamado campo cercano.
Otra característica importante del campo directo es que es direccional, es decir, se puede
determinar con relativa facilidad la procedencia del sonido. Existe un parámetro que
cuantifica la direccionalidad o directividad de la fuente sonora. Es Q,
un número
adimensional que se define como:
Q=
intensidad de la fuente en una dirección determinada
intensidad de una fuente omnidireccional
La directividad es importante porque ayuda a indicar cuanto sonido será direccionado hacia
un área específica comparada con toda la energía generada por la fuente. Q=1 significa que
la fuente se comporta como una fuente omnidireccional, o radiación esférica. Q mayores
81
que 1 implican que la fuente es muy direccional pues la energía sonora se concentra hacia
una dirección determinada. Este parámetro depende tanto de la forma geométrica de la
fuente, como de su disposición respecto a las superficies en un recinto. Q también se puede
expresar en decibeles y es llamado índice de directividad (ID).
ID=10logQ
Teniendo en cuenta el parámetro Q, la ecuación más general para el campo directo es:
Idirecto=
WQ
[=]w/m2
2
4πd
Nótese que esta ecuación se reduce a la primera dada cuando Q =1 (la fuente es
omnidireccional)
El campo reverberante se comporta de manera muy distinta al campo directo pues es
aproximadamente constante, e independiente de la distancia. Esto, debido a las numerosas
reflexiones que se superponen entre sí para una distribución aproximadamente uniforme del
sonido. Lo anterior es equivalente a decir que el flujo de energía sonora es equiprobable en
todas las direcciones, a diferencia del campo directo que es directivo. El campo
reverberante se cuantifica de forma muy distinta al campo directo pues como se vio, este es
inversamente proporcional a la distancia al cuadrado mientras que el campo reverberante
debe depender exclusivamente de las reflexiones (y no de la distancia).
Ireverberante=
4W
W
=
[=] w/m2
aS
R
(
)
1- a
(con R=(
a: coeficiente de absorción sonora
W: potencia acústica de la fuente
S: el área de la superficie interior del recinto.
R: constante del recinto
aS
)[=] Sabines)
1− a
82
(En el caso de un recinto con varios materiales absorbentes, a se reemplaza por a prom ,el
coeficiente promedio).
Es claro de la ecuación para el campo reverberado que éste depende de la forma acústica
del recinto y no de la distancia. El campo reverberado, a diferencia del campo directo es
difuso o adireccional.
En el aire libre existe solamente el campo directo. La ausencia de reflexiones en el aire
libre (debido a la ausencia de superficies reflectoras) hace imposible la existencia de un
campo reverberante. Sin embargo, si consideramos ambientes cerrados, debemos considerar
la superposición de ambos campos, el sonoro y el reverberante.
En general se tiene
I sonoro = I directo + I reverberante=
4W
WQ
+
2
R
4πd
Esta ecuación también es útil expresarla en decibeles
Isonoro(dB)=10log(
4W
WQ
+
)
2
R
4πd
La región donde predomina el campo directo y la región donde predomina el campo
reverberante depende de la distancia. De hecho, existe una distancia que delimita las
regiones (sirve como frontera), llamada distancia crítica. Para valores menores a la
distancia crítica predomina el campo directo mientras que para distancias mayores
predomina el campo reverberante. La distancia crítica se obtiene de la siguiente manera.
Considérese la superposición de ambas intensidades (sonora y reverberante). La distancia
crítica se define como la distancia en la cual se equiparan el campo directo con el campo
reverberante:
I directo = I reverberante
4W
WQ
=
2
4πd crítica
R
83
d crítica= 0.141 QR
Figura 39 Campo directo, campo reverberante y distancia crítica
Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004..
La distancia crítica depende tanto de la directividad de la fuente como del parámetro R de
absorción. En general, en el diseño acústico de recintos es deseable que esta distancia sea
grande. Cuando el campo reverberante predomina y es muy intenso, la inteligibilidad del
habla se pierde. Para minimizar este efecto, se aumenta la distancia crítica para que
predomine en una región considerable el campo directo. R es la constante del recinto,
función del coeficiente de absorción. Cuando el recinto es muy absorbente, R es grande
mientras que cuando el recinto es muy reverberante R es pequeño. De la ecuación se
deduce que en recintos absorbentes la distancia crítica es grande mientras que para recintos
reverberante la distancia es pequeña. Otras afirmaciones respecto la distancia crítica son:
•
La distancia crítica, al depender del coeficiente de absorción sonora, depende
también de la frecuencia y por lo tanto existen varias distancias críticas para varias
frecuencias.
•
Es importante notar que la distancia crítica no depende de la potencia acústica que
genera la fuente. Era de esperarse pues la potencia acústica influye de igual manera
al campo directo como al reverberante. Por esta razón, si aumentamos el volumen
en un recinto no mejoraremos la inteligibilidad pues también estaríamos
aumentando el campo reverberante.
84
•
Para aumentar la distancia crítica se tienen básicamente dos opciones: aumentar la
directividad Q o aumentar el factor del recinto R. La primera opción generalmente
resulta más sencilla (y económica) que un tratamiento con materiales acústicos.
Ya se definieron los términos necesarios para entrar en materia con respecto a las
consideraciones de diseño de recintos según su aplicación específica. El estudio del diseño
de recintos se puede subdividir en categorías según la longitud de onda de la señal sonora
pues el análisis es distinto. Las categorías son las siguientes:
Acústica de grandes recintos: análisis de recintos cuando la longitud de onda es pequeña
respecto a las dimensiones del recinto
Acústica de pequeños recintos: análisis de recintos cuando la longitud de onda es
comparable a las dimensiones del recinto.
Dispositivos de control acústico: estudio de algunos de los dispositivos más importantes
en el diseño y tratamiento acústico de recintos
Características generales del diseño de recintos: se estudiarán los aspectos más
relevantes a tener en cuenta en el diseño de recintos y el aislamiento acústica.
2.4.2 Acústica de grandes recintos
La acústica de grandes recintos se refiere al análisis y el diseño de situaciones en la cual la
longitud de onda sonora es pequeña respecto al tamaño del recinto. Obviamente, ésto
depende tanto de la frecuencia sonora como de las dimensiones reales del
recinto.
Generalmente, se acepta que recintos con superficie interior mayor a 300m2 son
considerados recintos grandes. Estos incluye teatros, iglesias, auditorios, salas de concierto,
museos, etc.
El análisis de grandes recintos incluye dos aspectos fundamentales:
85
-
acústica geométrica
-
reverberación
2.4.2.1 Acústica geométrica. La acústica geométrica, también llamada acústica de rayos,
es el análogo de la óptica geométrica en el sonido. La acústica geométrica tiene ciertas
consideraciones que la diferencian del análisis de pequeños recintos:
•
los métodos utilizados en el análisis son geométricos y no físicos
•
el estudio de la resonancia y modos de resonancia y de difracción no son
importantes
•
el análisis de la reverberación es fundamental
El método geométrico utilizado es el de trazado de rayos. Es un método simplificado
solamente útil en el análisis de recintos grandes, que supone que las ondas sonoras viajan
en líneas rectas. Además, este método supone reflexiones especulares sobre las superficies
reflectoras a diferencia de reflexiones difusas en las cuales la onda es reflejada en múltiples
direcciones. Por lo tanto, para grandes recintos, se cumple la ley de Snell de la reflexión
que relaciona el ángulo de incidencia con el ángulo de reflexión:
a incidencia = a reflexión
Aunque esta ley es válida para todo tipo de reflexión, en las reflexiones difusas el análisis
se complica pues existen demasiadas normales asociadas a la superficie y la reflexión no se
origina desde un solo punto sino que se distribuye: se generan patrones de difracción. De
ahí el nombre de difuso. Además debido a que las longitudes de onda son pequeñas
relativas al tamaño del recinto, las resonancias son numerosas y distribuidas
aproximadamente uniformemente en el espacio. Por lo tanto, con el análisis de rayos se
ignoran patrones de difracción y los modos de resonancia.
El trazado de rayos o “ray tracing” es relativamente simple. Se parte desde el punto donde
existe una fuente sonora y se trazan múltiples rayos que inciden sobre superficies
potencialmente reflectoras: paredes, pisos, etc. La única consideración que se debe hacer es
respetar la Ley de Snell para la reflexión. La siguiente figura ilustra el procedimiento.
86
Figura 40 Aplicación del método de “ray tracing” en el Royal Albert Hall
Fuente: DIANI, Felipe. s.l.:s.n. 1998.
< www.zainea.com/knudsen.htm> [consulta: 14 Abr. 2005]
La técnica de trazado de rayos sirve para determinar a groso modo algunas fallas acústicas
como enfoque excesivo o insuficiente del sonido en algunas áreas y las formas geométricas
que optimizan la distribución del sonido en un recinto (planas, cóncavas, convexas)
2.4.2.2. Reverberación. La reverberación es un parámetro importante para tener en cuenta
en recintos grandes. Se definió anteriormente como la permanencia del sonido debido a
múltiples reflexiones. Esto se vuelve importante en recintos grandes pues el sonido tiende a
permanecer por mucho tiempo debido a retardos mayores en dimensiones más grandes.
Existe un parámetro para estimar y cuantificar la duración de extinción del sonido y por lo
tanto el de la reverberación. Este es llamado tiempo de reverberación y se define como el
tiempo necesario para que el sonido caiga 60dB debajo de su intensidad inicial. Este valor
en decibeles (60 dB) fue escogido experimentalmente ya que cuando una señal cae 60dB,
se da la sensación que el sonido se extinguió (se vuelve inaudible). Esto principalmente por
el fenómeno de enmascaramiento del ambiente y/o del ruido. Si el nivel inicial (intensidad
sonora) es muy intenso se debe escoger otro valor para definir el tiempo de reverberación.
Se escribe tiempo de reverberación = RT60 debido a su sigla en inglés, “reverberation
time”, y haciendo alusión a 60dB.
El tiempo de reverberación debe ser función del coeficiente de absorción sonora a de las
superficies ya que el tiempo de reverberación depende de la densidad e intensidad de las
87
reflexiones. Si las superficies son muy reflectoras (a pequeño), existirán muchas
reflexiones y existirán muchas antes de que se extinga completamente el sonido. En este
caso RT será grande. Si en cambio las superficies son muy absorbentes (a grande), en cada
reflexión habrá una fracción considerable absorbida por la superficie y en pocas reflexiones
el sonido se hará inaudible. Esto implica una RT pequeña. Dada la dependencia de RT con
el coeficiente de absorción se puede concluir que para recintos recubiertos de materiales
como el hormigón (muy reflectores, bajo coeficiente de absorción), el tiempo de
reverberación será largo. Por oposición, para recintos recubiertos de materiales como lana,
alfombras, etc. (malos reflectores, alto coeficiente de absorción), el tiempo de
reverberación será corto. Una fórmula describe de manera más exacta la función que
relaciona RT con a (atribuida a Sabine, físico norteamericano):
RT=
0.161V
[=]s
aS
V: volumen del recinto
a: coeficiente de absorción sonora
S: área de la superficie interior.
Nótese que el tiempo de reverberación depende del cociente V/S. (volumen/superficie).
Este cociente no es constante sino que crece a medida que crece el recinto ya que el
volumen depende de una distancia cúbica mientras que la superficie depende de una
distancia cuadrática. En recintos grandes existirá reverberación considerable y es un
parámetro que se debe controlar de acuerdo a la aplicación específica.
La fórmula de Sabine se puede generalizar para el caso en que el recinto esté formado por
distintos materiales y por lo tanto RT debe depender de distintos coeficientes de absorción
sonora. La fórmula más general de Sabine es:
RT=
0.161V
a1S1 + a2S2 + ....anSn
88
donde los ai (i=1,2 . .n) son los coeficientes de absorción para cada Si (cada superficie con
recubrimiento). Esta ecuación no tiene en cuenta la absorción adicional del aire y por eso
existe una fórmula de Sabine con un factor adicional para corregir la absorción:
RT=
0.161V
a promedio S - 4mV
donde a promedio es el coeficiente de absorción promedio, S el área de la superficie interior, V
el volumen
y m es un parámetro asociado al aire que depende de la humedad, la
temperatura, y de la frecuencia del sonido. Otros autores después de Sabine han formulado
otras ecuaciones que tienen en cuenta más factores y por lo tanto son más exactas:
RT=
- 0.161V
debido a Eyring
Sln(1 - a ) - 4mV
RT= (
0.161V
) debida a Milintong
∑ − Si ln(1 − ai)
donde Si es el área de superficie i-ésima y ai es el coeficiente de absorción sonora para cada
superficie.
RT=
Sy
Sx
Sz
0.161V
+
+
) debida a Fitzroy
(
2
− ln(1 − ax ) − ln(1 − a y ) − ln(1 − az )
S
S x : área de la superficie de las paredes laterales
S y: área de la superficie de las paredes posterior y anterior
S z: área del piso y del techo
a x: coeficiente de absorción promedio de las paredes laterales
ay: coeficiente de absorción promedio de las paredes posterior y anterior
az: coeficiente de absorción promedio del piso y del techo
Esta última ecuación es la que más se utiliza actualmente por tomar muchos parámetros a
consideración. El tiempo de reverberación no es un concepto absoluto en el sentido en que
89
no se puede determinar para todas las situaciones un único tiempo de reverberación:
depende del recinto y la aplicación específica. Por eso se habla de un tiempo de
reverberación óptimo, dependiendo de la situación. El tiempo de reverberación óptimo
depende de si es una sala de grabación, una sala de concierto, un edificio, un salón de clase
y se toman en cuenta parámetros como la inteligibilidad de la palabra, la presencia de
música, etc. Por ejemplo, en un salón de conferencias no se puede tener un tiempo de
reverberación demasiado grande pues hace que la vocales se prolonguen demasiado y
enmascaran a las consonantes. Esto resulta en poca inteligibilidad de una conversación por
ejemplo. Por el contrario, una sala de concierto se beneficia con un tiempo de reverberación
alto pues se aumenta la reverberación en la música es deseable además de disimular algunas
imperfecciones.
Se han realizado estudios para obtener el tiempo de reverberación óptimo para múltiples
escenarios, y se logró tabular los resultados de tiempo en función del volumen del recinto.
Figura 41 Tiempo de reverberación óptimo en función del volumen para varias salas
Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004..
La figura anterior muestra cinco contornos distintos correspondientes a cinco salas
distintas. El contorno a corresponde a un estudio de radiodifusión para voz, b salas de
conferencia, c estudios de radiodifusión para música, d salas de concierto y e iglesias. Las
aplicaciones que requieren mayor inteligibilidad de la palabra como a y b, necesitan un
tiempo de reverberación pequeño para no comprometer la comunicacion.
2.4.2.3 Frecuencia de recinto grande. Existe un parámetro que cuantifica cuando un
recinto se comporta como un recinto grande. Conocido el tiempo de reverberación es
90
posible hallar la frecuencia límite a partir de la cual el recinto se comporta como un recinto
grande; el número de modos de resonancia es muy grande.
f recinto grande =2000
RT
[=] Hz
V
Frecuencias superiores a esta frecuencia tendrán un número elevado de modos de
resonancia, suficientes para que esta resonancia sea considerada uniforme en el espacio.
Debido a esta uniformidad, el análisis de resonancias no es considerado en recintos
grandes. Ondas sonoras con frecuencias inferiores (longitudes de onda grandes comparadas
con el recinto) tendrán un número discreto de modos de resonancia en puntos específicos
del espacio y su estudio corresponde a la acústica de pequeños recintos. f
recinto grande
delimita las regiones de grande recinto y pequeño recinto.
Existen otros parámetros asociados a la reverberación y las reflexiones que se mencionarán
a continuación.
2.4.2.4 Camino promedio libre (Mean Free Path). El camino promedio libre es definido
como la distancia promedio que un rayo de sonido viaja antes de que encuentre un
obstáculo y se refleje. Un valor aproximado debido a Sabine es:
MFP=4
V
[=]m
S
V es el volumen del recinto y S el área de la superficie interior.
2.4.2.5 Tasa promedio de reflexiones. Indica cuantas reflexiones existen por segundo en
un recinto (valor promedio). Su valor está dado por
T reflexion =
c
[=]reflexiones/s
MFP
donde c es la velocidad del sonido y MFP es camino promedio libre
91
2.4.2.6 Pérdida promedio por reflexión. Parámetro que cuantifica las pérdidas de la
energía sonora debido a la absorción en cada reflexión. Está dada por:
P promedio=10log(
1
1 - apromedio
) [=] dB/reflexión
donde a promedio es el coeficiente de absorción sonora promedio.
2.4.2.7 Tasa promedio de pérdidas. Cuantifica las pérdidas de la energía sonora por
segundo.
T pérdidas = Treflexión P promedio =
c
1
) [=]dB/s
10log(
1 - apromedio
MFP
Ahora se retomará el tema de los materiales acústicos absorbentes haciendo énfasis en su
forma, composición y su construcción.
2.4.3 Materiales absorbentes acústicos
Los materiales de construcción y los revestimientos tienen propiedades acústicas muy
diversas. Algunas aplicaciones específicas como salas de grabación por ejemplo, necesitan
unas cualidades acústicas que requieren de materiales especialmente formulados para lograr
una elevada absorción sonora.
La absorción aumenta tanto con la densidad como con el espesor del material siendo los
materiales porosos muy buenos absorbentes. La absorción también depende de la forma en
que esté montado o el material . La figura muestra a un material poroso a una distancia de
una estructura rígida, como por ejemplo una pared.
92
Figura 42 Montaje de un material poroso a una distancia de una estructura rígida
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
El coeficiente de absorción sonora puede ser calculado así:
a=
4
2
2
⎡ rs
ρc ⎤ ρc ⎛
2ππf ⎞
+
⎟
⎢
⎥ + ⎜ cot
rs ⎦
rs ⎝
c ⎠
⎣ ρc
rs: resistencia al flujo del material
ρc: impedancia acústica del aire
d: distancia del material a la pared
f: frecuencia de la onda
Nótese de la anterior ecuación que el coeficiente de absorción sonora depende de la
frecuencia y las tablas de absorción sonora deben incluir para cada frecuencia (o intervalo
de frecuencias) un valor distinto.
93
Tabla 4 Coeficiente de absorción para diversos materiales en función de la frecuencia
Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004..
A la clase de materiales absorbentes también pertenece la lana de vidrio que además de
permitir absorciones sonoras altas, resulta económico. Sin embargo, este material debe estar
separado del ambiente acústico mediante paneles protectores pues partículas de este
material son dañinas para la piel y para los pulmones. Los protectores son en general
planchas perforadas de Eucatex u otros materiales celulósicos.
La espuma de poliuretano o melamina son otros materiales con gran absorción sonora.
Estos se fabrican en forma de cuñas anecoicas (sin ecos). Con esta estructura, es posible
lograr una gran absorción sonora ya que el sonido incide sobre la superficie de una cuña y
se refleja varias veces en esa cuña y en la contigua. Esta configuración funciona como una
trampa sonora.
94
Para el cubrimiento de cielorrasos se utilizas plafones de materiales celulosos y porosos
basados en fibras minerales, fibra de vidrio, fibras celulósicas o corcho.
Figura 43 Material absorbente en forma de cuña anecoica
Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004..
También se puede utilizar lana de vidrio intercalada con estos materiales para optimizar la
absorción. Para los pisos se utilizan alfombras pues además de absorber el sonido, atenúan
el ruido de pisadas o elementos como cables sobre ellas. La absorción de una alfombra
aumenta considerablemente con su espesor pero no es muy dependiente de su material de
construcción (nylon, lana, etc. ) Las cortinas también influyen en el tratamiento acústico de
un recinto como absorbentes sonoros, aunque su principal función sea otra (parte del diseño
arquitectónico, estética). Se debe tener en cuenta que entre más distantes estén las cortinas
de las paredes, será mejor la absorción sonora. Materiales porosos como tela o terciopelo
son mucho más absorbentes que materiales como el plástico. También aumenta la
absorción si la cortina está fruncida o drapeada debido al fenómeno de la trampa sonora. Se
puede lograr una acústica variable o dinámica si la cortina cubre una superficie altamente
reflectora. A medida que se destape la cortina y la pared reflectora se revele, la absorción
disminuirá. Esto es muy importante en recintos que son utilizados para varios propósitos y
para cada propósito es mejor una determinada absorción. Es importante notar que algunas
reflexiones son útiles y algunas superficies no requieren materiales con absorción sonora.
2.4.4 Acústica de pequeños recintos
Cuando la longitud de onda es comparable con las dimensiones del recinto, el recinto deja
de comportarse como “grande”. El parámetro para determinar el tamaño relativo del recinto
es la frecuencia de recinto grande: por debajo de esta frecuencia las ondas se tratan
95
mediante acústica de pequeño recintos. Se acepta como un recinto pequeño aquella con
fc<200Hz. Algunos tipos de pequeños recintos incluyen salones de clase, salones de
grabación, “home theaters”, etc.
La acústica de pequeños recintos es más complicada que el análisis de grandes recintos
pues debe incluir fenómenos físicos ondulatorios que se habían ignorado en los grandes
recintos, siendo la resonancia el más notorio. La reflexión deja de ser especular y no se
puede hacer el análisis mediante el trazado de rayos de la acústica geométrica. Se deben
hacer consideraciones físicas y la reverberación deja de ser un factor importante.
2.4.4.1 Resonancias. Las resonancias o modos normales de vibración son resultado de las
reflexiones sucesivas en las paredes. Se definen las frecuencias resonantes como las
frecuencias en las cuales las ondas forman mínimos y máximos de presión sonora en
distintos puntos del recinto. La existencia de estos máximos y mínimos afecta
considerablemente la calidad acústica de un recinto pues la sonoridad de la fuente se
concentra en ciertos puntos y en otros se elimina. Además, la reverberación para puntos
donde tienen lugar los máximos es mayor creando un desbalance acústico en el recinto.
Ya se ha comentado que las resonancias también ocurren en recintos grandes, pero debido a
la densidad de resonancias el sonido se escucha uniforme. Esto porque en recintos grandes
las frecuencias de resonancia son muy pequeñas y sus armónicos respectivos se
conglomeran. En cambio, en un recinto pequeño las resonancias son discretas y la difusión
del sonido no es satisfactoria: la distribución espacial del sonido no es uniforme. Los
modos de vibración se dividen en tres: axial, tangencial, oblicuo.
Axial: Las reflexiones ocurren en superficies (2) opuestas y paralelas. Son las más
frecuentes.
Tangencial: Las reflexiones ocurren entre cuatro superficies adyacentes, no paralelas.
Suele aparecer cuando las superficies son muy macizas.
Oblicuas: Las reflexiones ocurren en cualquier dirección entre cualquier conjunto de
superficies (hasta 6). No son muy comunes y su estudio suele ser irrelevante.
96
El fenómeno de resonancia se asocia con la generación de una onda estacionaria de una
frecuencia definida, lo que se escuchará como un tono a esa frecuencia y posiblemente,
alguno de sus armónicos. Un recinto tiende a amplificar frecuencias cercanas al modo
(frecuencia natural) de la sala. Un recinto puede tener más de una frecuencia de resonancia
dependiendo de su geometría. El análisis que sigue supone un recinto rectangular con
dimensiones Lx, Ly, y Lz por simplicidad.
z
Lz
y
Lx
Ly
x
Figura 44 Recinto rectangular para analizar las frecuencias de resonancia
De la ecuación de onda, se tiene que:
∂ 2p ∂ 2p ∂ 2p
+ 2 + 2 + k 2p = 0
2
∂x
∂y
∂z
Ahora se supone una solución separable:
p(x, y, z) = p1 (x)p2 (y)p3 (z)
para obtener tres ecuaciones diferenciales de la forma
d 2 p1
2
+ k x p1 = 0
2
dx
(y otro tanto para y y para z)
La reflexión en las fronteras de la caja rectangular debe cumplir con que la presión en esos
puntos es máxima, es decir:
dp1 (x)
=0
dx
en x=0 y en x=Lx
Con esta condición se obtiene:
p1 (x) = A1cos(k 1x)
97
kx =
nxπ
Lx
Así se obtiene
la solución general, siguiendo un procedimiento análogo para las
dimensiones y y z:
⎛ n πx ⎞ ⎛ n πy ⎞ ⎛ n πz ⎞
p n x n y n z (x, y, z) = Acos⎜⎜ x ⎟⎟cos⎜ y ⎟cos⎜⎜ z ⎟⎟
⎟
⎜
⎝ L x ⎠ ⎝ L y ⎠ ⎝ Lz ⎠
donde nx, ny y nz son números enteros positivos. La condición de resonancia establece que
la dimensiones del recinto sean múltiplos enteros de la longitud de onda característica de la
onda (2π/k). Esto, y el hecho que la frecuencia es igual a c/λ, conlleva al siguiente
resultado para las frecuencias de resonancia:
f n xn yn z
c
c
k n x n ynz =
=
2π
2
⎛ nx
⎜⎜
⎝ Lx
2
2
⎞ ⎛ ny ⎞ ⎛ nz ⎞
⎟⎟ + ⎜ ⎟ + ⎜⎜ ⎟⎟
⎜ ⎟
⎠ ⎝ L y ⎠ ⎝ Lz ⎠
2
La terna constituida por (nx,ny,nz), es denominada modo para la respectiva frecuencia de
resonancia. Es decir, cada modo describe una determinada frecuencia de resonancia. El
modo será axial si dos de las tres componentes son iguales a cero. El modo será tangencial
si solamente una de las tres componentes es igual a cero y será oblicuo cuando ninguna de
las tres componentes es igual a cero. El caso anteriormente descrito incluye las tres
dimensiones pero a veces es útil simplificar la situación y considerar únicamente dos
paredes opuestas (modo axial). Si la distancia entre las dos paredes es L, la longitud de
onda de la onda estacionara en la pared será 2L (condición de onda estacionaria) y se tiene
f=
c
2L
Si por ejemplo las paredes están separadas por una distancia de 3m implica que (tomando
345m/s como la velocidad del sonido) la frecuencia de resonancia será de 57.5Hz. Otras
frecuencias de resonancia corresponden a los armónicos de este tono: 115Hz, 172.5Hz, etc.
Nòtese que se hubiera llegado al mismo resultado si en la ecuación general de frecuencias
de resonancia consideramos el caso en que ny y nz son iguales a cero (modo axial). Para
calcular el número de modos aproximado por debajo de cierta frecuencia se utiliza la
siguiente ecuación:
98
N≈
4ππV3 πSf 2 Lf
+
+
3c 3
4c 2
8c
N: número de modos
f: frecuencia límite
S: área de la superficie
V: volumen del recinto
L: suma de las aristas del recinto
c: velocidad del sonido
La distribución de las frecuencias resonantes en el espectro no es uniforme. Para
frecuencias pequeñas (relativas a la frecuencia crítica) el espectro es discreto mientras que
para frecuencias grandes el espectro es considerado continuo debido a la cantidad de modos
asociados. A medida que crece el tamaño del recinto las resonancias se vuelven más densas,
convirtiéndose en reverberación y mejorando por ende la difusión. La presencia de
resonancias en general no es deseable pues amplifica ciertas frecuencias y genera un patrón
no uniforme de sonoridad en un recinto Existen algunas recomendaciones para mejorar de
alguna forma problemas relacionados con resonancias y con difusión:
-
evitar paralelismos para evitar reflexiones axiales. Esto puede lograrse
inclinando una o dos paredes
-
evitar simetrías entre las longitudes de las aristas en el caso de un recinto
rectangular. Las aristas deben ser de longitudes distintas y existen algunas
proporciones satisfactorias (propuestas por diversos autores ):
1:1.17:1.47, 1:1.45:2.10 (Ahrae)
1:1.28:1.54 (Bolt)
1:1.25:1.6 (IAC)
1:1.14:1.41(Sepmayer)
99
-
utilizar materiales absorbentes pues al disminuir la reflexión, disminuye la
intensidad de la onda estacionaria y por ende los modos de resonancia son más
débiles
2.4.5 Dispositivos para el control acústico
La acústica de una sala o recinto depende de varios factores que incluyen la geometría y
disposición de los elementos, así como de los materiales de construcción. Sin embargo,
modificar estos parámetros no solo resulta laborioso sino que muchas veces también
insuficiente. Por eso existen unos dispositivos especialmente diseñados para afrontar
alguno de los problemas más comunes en el tratamiento acústico de salas como son las
reflexiones, la reverberación y la resonancia. Estos dispositivos se dividen en:
-
Absorbentes (Los materiales absorbentes ya fueron examinados).
-
Resonadores
-
Páneles
-
Difusores
2.4.5.1 Resonadores. Los resonadores son dispositivos de banda estrecha (selectivos en
frecuencia) que tienen la propiedad de controlar frecuencias graves. Utilizan una cavidad
resonante para disipar la energía acústica. Al ser dispositivos de banda estrecha, son útiles
para tratar los modos de resonancia de recintos. Debido a que estas frecuencias suelen ser
frecuencias graves, los resonadores también son comúnmente llamados trampas de graves
(“bass traps” en inglés). Las trampas de graves, aunque pueda sonar contradictorio, pueden
ayudar a reforzar los graves en un recinto. Esto puede ocurrir, porque la trampa ayuda a
eliminar la reflexión de tonos graves. Estas reflexiones tienden a cancelarse con las ondas
originales, eliminando los bajos. Por eso al eliminar la reflexión, se elimina la cancelación
y por lo tanto se escuchan los bajos como si no existiese paredes (como en el campo libre).
100
Figura 45 Resonador de Helmholtz
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
En la figura se muestra un resonador Helmholtz. El resonador Helmholtz funciona como
una cavidad sintonizada, es decir, atrapa frecuencias dominantes resonantes en un recinto.
Está diseñada para atrapar frecuencias graves. La frecuencia fo sintonizante está dada por:
f0 =
c
S
2π LV
S: área del cuello
V: volumen de la cavidad
L: longitud del cuello
c: velocidad del sonido
2.4.5.2 Páneles . Los páneles son también estructuras absorbentes basadas en una lámina
separada de una estructura rígida como una pared.
Figura 46 Pánel resonante
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
101
La frecuencia de resonancia (o de absorción) de la configuración anterior, es:
f res =
6000
md
m: densidad lineal de la lámina
d: distancia de la pared
Los páneles vibrantes se pueden combinar con los resonadores Helmholtz para poder
absorber o atrapar un conjunto más amplio de frecuencias graves en el espectro. El pánel es
particularmente útil para frecuencias graves-graves mientras que el resonador Helmholtz
está diseñado para frecuencias medias-graves. También se puede añadir material poroso a
esta configuración para mejorar la absorción con respecto a frecuencias medias y altas.
2.4.5.3 Difusores. En algunos tipos de recintos la difusión del sonido no es homogénea o
envolvente. Incluso, en algunos puntos del recinto se perciben sonoridades muy altas
debido a reflexiones especulares, y algunas de estas reflexiones (especialmente las de un
retardo<20ms) interfieren con el sonido directo. Los difusores son dispositivos utilizados
para redireccionar de forma conveniente la energía sonora para lograr una distribución mas
uniforme del sonido. El objetivo es obtener una superficie que sea capaz de reflejar una
onda incidente en todas las direcciones. Los difusores en general, constan de una serie de
páneles o rendijas de longitudes y profundidades definidas para lograr una reflexión no
especular o difusa. Se pueden clasificar de la siguiente manera:
2.4.5.3.1 Difusores convexos. Las superficies convexas (o cilíndricas) reflejan las ondas
sonoras de manera divergente, convirtiendo a este tipo de superficies en difusores naturales.
El espesor de estos difusores influye en la absorción de algunas frecuencias (en especial las
graves) lo que significa que funciona como difusor además de trampa de graves. El campo
de difusión es perpendicular al eje del cilindro.
102
Figura 47 Difusión resultado de la reflexión sobre una superficie convexa
2.4.5.3.2 Difusores por secuencias numéricas. El estudio de difusores por secuencias
numéricas tiene como pionero al Prof. Schroeder. El combinó el estudio acústico de
recintos con la teoría de números y de Fourier para encontrar un difusor óptimo. La
dispersión de la onda depende de la forma como se refleja la onda en los canales del
difusor. El problema entonces se limita a encontrar cual debe ser la secuencia numérica de
las profundidades de los canales para que el patrón de difracción sea lo más uniforme
posible.
Figura 48 Patron de difracción (polar) de un difusor por secuencias numéricas
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
2.4.5.3.3 Difusores por residuos cuadráticos (QRD). El difusor de residuo cuadrático
(QRD) es un tipo de difusor con rendijas rectangulares basado en una secuencia llamada
secuencia de residuos cuadráticos. Genera una campo de difusión en el sentido
perpendicular a las lamas o canales. La frecuencia mínima de operación está relacionada
con la profundidad de los canales mientras que la frecuencia máxima está relacionada con
el ancho. Schroeder investigó algunas de las propiedades notorias de la secuencia Sn
(residuos cuadráticos):
103
Sn=n2mod(N)
n: índice de la secuencia
N: número primo
Por ejemplo, los primeros términos de esa secuencia para N= 17 son:
Sn=0, 1, 4, 9, 16, 8, 2, etc.
El Prof. Schroeder demostró que esa secuencia de números se puede relacionar con las
dimensiones del difusor de tal forma que se genere un patrón de difracción
aproximadamente uniforme en el espacio. El diseño del difusor QRD se resume en los
siguientes pasos:
•
Se selecciona la frecuencia mínima de operación f0 (la frecuencia sonora más
pequeña en el recinto). Este factor incidirá directamente en la profundidad máxima
del difusor. Las profundidades seguirán una secuencia dada por:
dn =
Snλ0
2N
dn: secuencia de profundidades
λ0: longitud de onda de operación
Sn: secuencia de residuos cuadráticos
•
La frecuencia máxima de operación será f
max
=
c
donde W es el ancho de cada
2W
rendija y c es la velocidad del sonido. En otras palabras W es igual a la media
longitud de onda de la frecuencia máxima. Si se desea tomar en cuenta el ancho de
las láminas separadoras de las rendijas debe utilizarse la siguiente expresión:
f max =
c
donde T es el ancho (espesor) de las láminas.
2(W + T)
104
Se selecciona el número primo considerando que mientras mayor sea se tendrá más lóbulos
de difracción, pero se complicará su construcción. En general se utilizan números primos
comprendidos entre 17 y 31. Si el lugar donde debe colocarse el difusor es muy grande, se
pueden repetir varios períodos del mismo.
Figura 49 Difusor de residuo cuadrático (QRD)
Fuente: WILES, John. s.l.:s.n. 2004
<www.rpgdiffusorsystems.com> [consulta: 23 Abr. 2005]
Su construcción suele ser en MDF aunque se pueden hacer en madera maciza, metacrilato,
vidrio, escayola, mármol, etc. Se utilizan sobre todo en paredes traseras de controles y
donde se precise aumentar la difusión como escenarios, locutorios, platós y salas de
grabación.
2.4.5.3.4 Difusores birradiales. El análisis hecho para los difusores QRD es válido para
una dimensión. Si se tiene en cuenta dos dimensiones, la secuencia para las profundidades
se convierte en un matriz:
d h,k = (h 2 + k 2 )mod(N)
λ
2N
h,k: número del sector (0,1, . .N-1)
d h,k : profundidad del sector h,k
λ: longitud de onda asociada
105
Los difusores birradiales son producto de la combinación de dos difusores QRD con 90º de
cruce uno respecto al otro. Permiten distribuir la energía acústica en todo el espacio. Esta
configuración genera un campo de difusión semiesférico y son ideales en los techos de las
salas.
Figura 50 Difusor birradial
Fuente: WILES, John. s.l.:s.n. 2004
<www.rpgdiffusorsystems.com> [consulta: 23 Abr. 2005]
También es muy común hacer pequeños difusores dentro de las celdas del difusor mismo,
técnica conocida como difusores con fractales.
2.4.5.4.5 Difusores basados en raíces primitivas. Este tipo de difusores (también
investigados por Schroeder) utiliza otra secuencia numérica que demuestra ser más óptima
en cuanto a su patrón de difracción. El procedimiento de diseño es similar al de difusores
QRD, pero ahora la secuencia Sn es:
Sn = g n mod(N)
g: raíz primitiva de N
N: número primo
El concepto de raíz primitiva es el siguiente: para que g sea raíz primitiva de N debe
cumplirse que, para n entre 1 y N-1 no debe repetirse ningún resultado de gn mod (N).
2.4.5.4.6 Difusores acústicos perforados. Los difusores acústicos perforados están
formados por una superficie reflexiva pero perforada a otra interna absorbente. Debido a
que el sonido incidente encuentra diferentes impedancias a la reflexión, se altera el ángulo
106
de fase, lo que le hace comportarse como difusor al cambiar la trayectoria especular por una
difusa.
Figura 51 Difusores perforados
Fuente: WILES, John. s.l.:s.n. 2004
<www.rpgdiffusorsystems.com> [consulta: 23 Abr. 2005]
2.4.6 Características generales en el diseño de recintos
Para que un recinto se comporte de manera ideal en el sentido acústico, algunas
condiciones se deben cumplir:
-
el campo acústico consta de un gran número de ondas reflejadas combinadas con la
original, pero se deben evitar algunas fallas acústicas como los ecos y los
zumbidos. Esto se puede lograr evitando paralelismos entre superficies reflectoras
-
la densidad media de energía acústica debe ser uniforme en cualquier punto
del campo, evitando sonoridades concentradas debido a reflexiones o amplificación
de frecuencias de resonancia. Esto puede mejorarse con materiales absorbentes para
disminuir la reflexión o bien ubicar reflectores y difusores en posiciones adecuadas
para no concentrar el sonido (o el opuesto, producir sombra acústica). Los modos de
resonancia se pueden manejar con las dimensiones del recinto (utilizar proporciones
adecuadas para el largo, altura, y profundidad) y también con resonadores
-
el tiempo de reverberación debe ser óptimo para el volumen del recinto dado y
para la aplicación específica. (la reverberación para una iglesia o auditorio musical
debe ser mayor que para un salon de clase) El tiempo de reverberación se puede
107
controlar a partir de la directividad de la fuente o R, el parámetro de absorción
sonora.
-
la inteligibilidad del habla debe ser alta en aplicaciones que la requiera. Las
reflexiones que inciden en el oído antes de 50ms no pueden ser distinguidas como
diferentes por el cerebro y por lo tanto refuerzan el sonido directo. Las reflexiones
posteriores a 50ms son consideradas parte de la reverberación e influyen en la
inteligibilidad. El índice de claridad (o inteligibilidad) se define como: 10log
E
,
L
donde E es la energía sonora incidiendo entre 0 y 50 ms y L es la energía sonora que
incide posterior a 50ms. Entre más alto sea este índice, existirá mayor
entendimiento del habla. Esto se puede lograr reduciendo el tiempo de
reverberación.
Hasta ahora se ha tratado mejorar una sala o recinto respecto a la calidad acústica
dentro de ella. La otra problemática que trata la acústica arquitectónica es el aislamiento
acústico; aislar acústicamente significa impedir que los sonidos generados dentro del
mismo trascienda hacia el exterior y recíprocamente, que los ruidos externos se
perciban desde su interior. Esto es importante en auditorios grandes escenario de
espectáculos donde es importante impedir que el sonido se propague como ruido
molesto para la gente fuera de él; el ruido es un contaminante más. También es
importante por ejemplo en salas o estudios de grabación donde ruido externo puede
repercutir en la calidad de la grabación.
Básicamente, el aislamiento sonoro se logra interponiendo un material denso entre la
fuente sonora y el receptor. El aislamiento es mayor a medida que crece la densidad
superficial del material y también a mayor frecuencia. Esto da una razón de porqué se
escucha más la base rítmica y los bajos provenientes de una habitación contigua.
Estudios físicos han demostrado que se puede aprovechar mejor el material (la pared)
por medio de paredes múltiples. Es decir, dividir el material en varias partes y
separarlos con aire, o algún material absorbente.
El tipo de material utilizado para construir las paredes o tabiques es roca de yeso. Una
estructura muy utilizada es la de dos placas de yeso separadas por una distancia y ese
108
espacio relleno de algún material absorbente, como lana de vidrio. Se puede obtener
mayor aislamiento aún si se colocan más placas de yeso. Además si se coloca la lana de
vidrio entre las placas de tal forma que no haya rigidez en la conexión, evita que se
transmitan vibraciones de un lado a otro.
Figura 52 Estructura para el aislamiento acústico
Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004..
En este punto es importante aclarar que un material absorbente no necesariamente es
buen aislante acústico. Esto debido a que parte de la energía absorbida (la energía no
reflejada) se convierte en energía térmica o mecánica, pero la otra parte puede ser
transformada en energía que se transmite al otro medio. Por eso son importantes los
materiales rígidos y densos a parte del material absorbente que se coloca entre ellos.
Existen básicamente tres formas para transmitir el sonido de un medio a otro
(suponiendo una estructura que separa a los dos medios):
•
transmisión directa: consiste en percutir o golpear la estructura convirtiéndose ésta
en transmisor de sonido.
•
transmisión indirecta: el sonido, proveniente del aire del primer medio, incide sobre
la estructura haciéndola vibrar y esta a su veces transmite el sonido al aire del
segundo medio.
•
transmisión por flancos: el sonido se filtra a través de fisuras o se propaga por
tuberías de ventilación, por caños de distribución de energía eléctrica, etc.
Para cuantificar la cantidad de aislamiento sonoro se utilizan dos parámetros: la pérdida
de transmisión (PT) y la clase de transmisión sonora (STC).
La pérdida de transmisión indica que tanta energía acústica incidente se pierde al
atravesar un tabique que separa a dos recintos, por ejemplo. La pérdida de transmisión,
expresado en dB, depende tanto del material como de la frecuencia de la onda sonora.
109
Una aproximación para la pérdida de transmisión (también llamado índice de
reducción) es:
R ≈ 20log(fM) − 47dB
f: frecuencia de la onda sonora
M: masa de la estructura.
La clase de transmisión sonora (STC) es un parámetro promedio de PT a varias
frecuencias. Mientras que PT es función de la frecuencia, STC es un único valor que
permite evaluar rápidamente la calidad del aislamiento sonoro que ofrece un tabique. Es
aproximadamente un valor ponderado de varios valores de PT para un conjunto de
frecuencias. Es muy importante tener en cuenta estos parámetros y otros más, para el
diseño óptimo de salas o recintos con aislamiento acústico.
Tabla 5 PT(pérdida de transmisión) y STC (clase de transmisión sonora) para distintos materiales
Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004..
110
2.5 RUIDO ACÚSTICO
El ruido acústico se puede entender como el sonido no deseado. La diferencia entre sonido
y ruido depende tanto del nivel de presión sonora como de la respuesta subjetiva del oído.
El grado de molestia del ruido aumenta al aumentar el nivel de presión sonora y la
respuesta subjetiva del oído depende de la naturaleza del sonido.
Debido a la naturaleza indeseada del ruido, éste se considera un contaminante y es deseable
atenuarlo en gran medida. Es imposible eliminar el ruido por completo y además se debe
evitar ya que el organismo humano necesita “algo” de ruido.
2.5.1 Tipos de ruido acústico
2.5.1.1 Ruido de fondo. El ruido de fondo es el ruido circundante asociado con un
ambiente. Es generalmente una composición de ruidos provenientes de fuentes cercanas y
lejanas.
2.5.1.2 Ruido aleatorio. Este tipo de ruido es fluctuante cuyas amplitudes instantáneas
aparecen como función del tiempo de acuerdo con una distribución gaussiana.
Nivel de Presión Sonora
dB
distribución gaussiana
t
Figura 53 Ruido aleatorio
111
2.5.1.3 Ruido blanco. El ruido blanco es aquel cuya presión sonora cuadrática media es
uniforme y continua con la frecuencia.
Nivel de Presión Sonora
dB
f (Hz)
Figura 54 Ruido blanco
2.5.1.4 Ruido rosa. Este ruido se define como el ruido que tiene igual energía por octava
dentro del rango de frecuencias audibles. Es análogo al ruido blanco pero con una
pendiente de –3dB.
Nivel de Presión Sonora
dB
f (Hz)
Figura 55 Ruido rosa
2.5.1.5 Ruido continuo constante. Este ruido es aquel cuyo nivel de presión sonora
medido en bandas de octava es continuo y aproximadamente constante a lo largo del
tiempo.
Nivel de Presión Sonora
dB
t
Figura 56 Ruido continuo constante
112
2.5.1.6 Ruido continuo intermitente. Es análogo al continuo pero fluctúa en un margen
moderado a lo largo del tiempo.
Nivel de Presión Sonora
dB
t
Figura 57 Ruido continuo intermitente
2.5.1.7 Ruido fluctuante periódicamente. Es análogo al continuo pero fluctuando
periódicamente con el tiempo.
Nivel de Presión Sonora
dB
t
Figura 58 Ruido fluctuante periódicamente
2.5.1.8 Ruido fluctuante no periódico. Este es ruido con fluctuaciones irregulares no
periódicas.
Nivel de Presión Sonora
dB
t
Figura 59 Ruido fluctuante no periódico
113
2.5.1.9 Ruido impulsivo. Este tipo de ruido es de muy corta duración < 1s.
Nivel de Presión Sonora
dB
t
Figura 60 Ruido impulsivo
2.5.2 Fuentes de ruido
Los ruidos se producen en unos focos sonoros denominados fuentes. Se transmiten a través
de un medio (sólido, líquido o gaseoso) y por último llega a un receptor. En lo últimos años
se ha tratado de estudiar y conocer con profundidad las fuentes sonoras y todas sus
características físicas para disminuir los niveles de ruido que generan. Esto es importante
pues el ruido es un contaminante que produce grandes problemas sociales, económicos,
psicológicos, fisiológicos, etc.
Las fuentes de ruido pueden ser externas a los edificios o internas a los edificios.
2.5.2.1 Ruido debido al tráfico rodado. Este es el ruido producido por los vehículos en
movimiento. Esto puede producirse en el motor, órganos de transmisión, neumáticos, etc.
El caso más importante es el del tráfico, en el cual confluyen camiones, furgones, carros,
motocicletas,etc. produciendo grandes niveles de presión sonora. Para hacer el análisis de
presión sonora se deben tener en cuenta múltiples aspectos como: velocidad de los
vehículos, porcentaje de camiones en las vías, presencia de edificios en zonas urbanas (pues
las reflexiones refuerzan el sonido),etc.
2.5.2.2 Ruido de tráfico aéreo. Este es el ruido producido por los aviones en sus fases de
despegue, vuelo y aterrizaje. En las fases de despegue y aterrizaje es cuando más se
produce ruido debido a que los aviones se encuentran en el suelo o muy próximos a el. Los
114
aviones pueden alcanzar niveles de potencia acústica hasta de 170dB. Si el avión vuela a
velocidades supersónicas (mayores a la velocidad del sonido) se produce un “boom” sónico
con un gran nivel de ruido que puede originar enormes vibraciones de las edificaciones en
el suelo.
2.5.2.3 Ruido debido a obras públicas y a actividades industriales. Las fuentes de ruido
debido a obras públicas existen en la construcción por la maquinaria pesada que se emplea
produciendo diversos tipos de ruido: continuos de nivel fluctuante y ruidos impulsivos.
Estos son normalmente causados por martillos neumáticos que da un nivel de potencia
acústica de 120dB, taladros, sierras,etc.
Las fuentes de ruido debido a actividades industriales corresponden a todos aquellos
generados por la industria en general: industrias electromecánicas, industrias de procesos
químicos, industrias de construcción, etc. Por el ruido que generan las industrias, éstas han
sido desplazadas fuera de las poblaciones lejos de las zonas urbanas de vivienda.
2.5.2.4 Ruido debido a actividades comunitarias urbanas. Estos ruidos se dan por la
concentración de personas en determinadas zonas de confluencia pública. Son intermitentes
y con variación de niveles como por ejemplo en mercados, centros comerciales, cines,
teatros, discotecas, etc.
2.5.2.5 Ruido debido a agentes atmosféricos. El agente atmosférico más productor de
ruido es la tormenta, con la lluvia, granizo y obviamente los truenos. Producen ruido áreo
(ruido que se propaga en el aire) que alcanzan niveles muy elevados. El viento también
genera elevados niveles de ruido y genera sonidos de muy alta frecuencia cuando atraviesa
ventanas.
2.5.2.6 Ruido debido a las personas. Las personas, dentro de un edificio, al hablar
generan ruido de presiones sonoras muy variadas. El nivel de presión sonora depende tanto
de la persona emisor (potencia acústica) como de las características del recinto (absorción
sonora, tiempo de reverberación, modos, etc.). Los animales domésticos también generan
ruidos que pueden llegar a ser muy molestos.
115
2.5.2.7 Ruido de impactos. Es el ruido que se transmite a través de las estructuras como
pisadas, movimiento de objetos, golpes dentro de un edificio. Los ruidos con grandes
componentes de baja frecuencia se transmiten con facilidad de un local a otro.
2.5.2.8 Ruido debido a televisión, radio y equipos musicales. Los ruidos de estos
artefactos depende del tipo de programa sintonizado (en el caso de televisores y radios) y
del tipo de música en el caso de los equipos.
2.5.2.9 Ruido debido a aparatos electrodomésticos. Estos aparatos producen ruido aéreo
y estructural (propagación por los sólidos por contacto con paredes y suelo). Las fuente más
importantes de ruido son : lavaplatos, lavadoras y ventiladores. El electrodoméstico menos
ruidoso es la nevera.
2.5.2.10 Ruido debido a instalaciones de fontanería. Este ruido se origina en el sistema
de tuberías y se transmite a través de las mismas a toda la estructura (por la canalización y
el fluido). El nivel de ruido depende de varios factores como el diámetro de la tubería, la
densidad del fluido y la velocidad de flujo. Otra fuente importante de ruido en las
instalaciones de fontanería son los grifos. Se produce ruido en los grifos a medida que
aumenta la presión y la velocidad al abrirse y cerrarse las válvulas.
2.5.2.11 Ruidos debido a instalaciones de calefacción. Las calderas y los quemadores son
fuentes importantes de ruido produciendo niveles elevados en el recinto donde se
encuentran ubicados con componentes de bajas frecuencias. Los radiadores eléctricos
originan sistemas vibrantes mecánicos resonantes, produciendo ruidos a frecuencias
discretas que se transmiten a las paredes.
2.5.2.12 Ruido debido a los ascensores. Las principales fuentes de ruido de los ascensores
son los motores de accionamiento y el mando eléctrico. Los ruidos de accionamiento se
producen por el motor eléctrico, los engranajes, poleas y en la conducción del cable. Los
aparatos de mando molestan debido a los golpes del relé.
116
2.5.2.13 Ruido debido a vertederos de basura. Los vertederos de basura son fuentes de
ruido aéreo y estructural de tipo esporádico. La caja de caída de la basura debe estar aislada
acústicamente del edificio y hecho de materiales de poca resonancia.
2.5.2.14 Ruido debido a instalaciones de ventilación y climatización. Los conductos de
ventilación y climatización facilitan la transmisión de sonidos provenientes de otros locales.
Estos conductos deben estar aislados acústicamente del edificio para evitar la infiltración
del ruido.
2.5.2.15 Ruido debido a las instalaciones eléctricas. Las instalaciones eléctricas son una
fuente de ruido importante. Por una parte, los sistemas de iluminación contienen relés,
dispositivos electromecánicos que producen ruidos impulsivos que alcanzan elevados
niveles. Por otra parte, la red de alimentación de frecuencia 60Hz resuena y es amplificada
por objetos de montaje y mantenimiento.
2.5.3 Cuantificación del ruido
Es necesario crear una escala que relacione la respuesta subjetiva de las personas ante el
ruido con alguna propiedad física medible de la fuente sonora. Esto se hace con el fin de
hacer una caracterización sobre la medida del ruido que permita obtener más información
sobre éste:
-
las molestias que causa el ruido
-
la medida debe ser aplicable a cualquier fuente de ruido
-
los parámetros deben ser fácilmente medibles
Existen básicamente dos escalas para de cuantificar el ruido: nivel de presión acústica
(SPL) y nivel de presión acústico ponderado.
2.5.3.1 Nivel de Presión Acústica en toda la banda. Es el nivel de presión acústica (sin
ponderar) para el rango de frecuencias audibles. Se da en NPSdB.
117
2.5.3.2 Nivel de Presión Acústica Ponderado. Es el nivel de presión acústica siguiendo
alguna curva de ponderación para compensar diferencias de sensibilidad que el oído
humano tiene para las distintas frecuencias dentro del campo auditivo. Existen varios tipos:
A, B, C, D, E pero se utiliza casi que exclusivamente la ponderación A para estimar el
ruido y sigue aproximadamente a la curva isofónica de 40 fonios. El nivel de ruido para
esta ponderación se da en dB(A). La ponderación D se utiliza para medir el ruido de
aviones.
2.5.4 Criterios de caracterización del ruido
Éstos son los diversos criterios con que se puede analizar un ruido o un conjunto de ruidos.
2.5.4.1 Nivel global. Es el nivel de ruido total en todo el espectro del sonido. Se calcula
generalmente como la suma de los niveles en octavas o tercios de octava. (Los niveles están
en dB(A)).
LG=10log ∑i 100.1Li
donde
LG: Nivel global de ruido
Li: Nivel de ruido por octava
2.5.4.2 Nivel continuo equivalente. Es el nivel de ruido constante que genera la misma
energía acústica que un ruido fluctuante durante un intervalo dado de tiempo.
∑ t (10)
o.1Li
i
Leq=10log
i
T
Leq: Nivel de ruido continuo equivalente
118
ti: Tiempo de observación durante el cual el nivel sonoro es Li
Li: Nivel sonoro (dB(A))
2.5.4.3 Nivel percentil de sonido en exceso. Es una medida estadística que indica con que
frecuencia se sobrepasa un nivel concreto de ruido. Se expresa así:
Lx=NdB(A)
x: percentil
N: número arbitrario
Esto indica que NdB(A) es el nivel de presión acústica que se ha sobrepasado durante x%
del tiempo de observación. Por ejemplo, si el tiempo de medida son 10 minutos y
L50=30dB(A), esto significa que durante cinco minutos se han tenido niveles superiores a
30dB(A).
2.5.4.4 Nivel de exposición sonora. Es el nivel de ruido constante con un segundo de
duración que genera la misma cantidad de energía que un sonido pasajero.
LE=Leq+10log(
T
)
tc
donde
T: intervalo de tiempo en que se hizo la medición del ruido equivalente
tc: duración del sonido pasajero
2.5.4.5 Dosis sonora. Es la energía recibida en periodo de tiempo dado. Su valor suele
darse en porcentaje respecto a una referencia.
10 0.1Leq
D(%)= 0.1Leqr 100%
10
donde
D(%):dosis sonora
119
Leq: Nivel de presión sonora equivalente en dB(A)
Leqr: Nivel de presión sonora de referencia en db(A)
Para efectuar las mediciones sobre los parámetros mencionados, se debe utilizar un
instrumento para medir las presiones sonoras. Este instrumento, denominado sonómetro,
está provisto de un micrófono amplificador, un detector de RMS, un integrador y un
indicador de lectura.
2.5.5 Efectos del ruido sobre el hombre
El excesivo nivel sonoro tiene efectos nocivos para el hombre. Este elevado nivel puede
provenir tanto de una fábrica como de un equipo reproductor de música. Se han realizado
muchos estudios del efecto que puede tener un elevado nivel sonoro en la salud física y
mental del ser humano. Estas afecciones se dividen en:
-
efectos no clínicos
-
efectos clínicos no auditivos
-
efectos Auditivos
2.5.5.1 Efectos no clínicos. Los efectos no clínicos no se manifiestan a través de síntomas
o patologías. El efecto no clínico más común es la molestia. Se puede afirmar que existe
confort auditivos hasta los 80dB(A). Obviamente, este dato varía dependiendo del tipo de
sonido y la motivación para escucharlo. Por encima de 120dB(A) se percibe dolor y un
sonido ensordecedor.
Con relación al ambiente laboral, los trabajadores pierden eficiencia cuando son expuestos
al ruido, siendo más afectadas las labores intelectuales que las labores manuales.
Otro efecto importante del ruido es que crea dificultades para la comunicación oral.
Por otra parte, por encima de 90dB(A), las distorsiones propias del oído impiden una
escucha fiel de la música. Además los sonidos de elevados niveles sonoros enmascaran a
los sonidos más débiles. Por estas razones desaparece la alta fidelidad.
120
2.5.5.2 Efectos clínicos no auditivos. Los efectos clínicos no auditivos (aquellos que se
manifiestan a través de síntomas o patologías) son muy diversos y han sido ampliamente
estudiados. Entre ellos están: hipertensión arterial, taquicardias, estrés, cefaleas, pérdida de
concentración, variaciones del ritmo respiratorio, disminución de la secreción salival y del
tiempo de tránsito intestinal. También se producen afecciones en la garganta resultado de
forzar la voz al tratar de comunicarse en ambientes ruidosos.
Los ruidos intensos también inciden en el sentido de equilibrio, llegando a producirse
mareos e inestabilidades.
2.5.5.3 Efectos auditivos. Estos efectos quizá son los más correlacionados con el ruido y
también son los más graves. La consecuencia más importante es la pérdida de la audición
conocida como hipoacusia. Esta condición de resulta de la exposición durante poco tiempo
ante sonidos fuertes de corta duración (bombas, estallidos, despegue de aviones) o ante
exposición prolongada sonidos menos fuertes (ambiente laboral, música con mucho
volumen).
La pérdida auditiva se determina midiendo por medio de una audiometría, cuánto sube el
umbral de audición en cada frecuencia respecto al considerado normal. (Si sube el umbral
de audición significa que se necesita más presión sonora para percibir el sonido). Después
se promedian los valores a 500Hz, 1kHZ y 2kHz para obtener la pérdida promedio auditiva,
PAP. Existe hipoacusia cuando la PAP supera los 25dB ya que a partir de ahí comienzan
las dificultades para la comprensión de la palabra.
121
3. ELECTROACÚSTICA Y PROCESAMIENTO DE AUDIO
La electroacústica es la parte de la acústica que se ocupa del estudio, análisis, diseño de
dispositivos que convierten energía eléctrica en acústica y viceversa, así como de sus
componentes asociados. Entre estos
se encuentran los micrófonos, acelerómetros,
altavoces, excitadores de compresión, auriculares, audífonos, calibradores acústicos y
vibradores.
Los micrófonos y altavoces son sus máximos representantes. Estos son denominados
genericamente transductores: dispositivos que transforman sonido en electricidad y viceversa. Esta conversión de entes de naturaleza completamente distinta, se realiza
acudiendo a principios electromecánicos y electromagnéticos que se discutirán cuando se
estén analizando los micrófonos y posteriormente los altavoces.
Los elementos de procesamiento de audio son dispositivos que alteran o modifican de
alguna forma características del sonido, cuando éste está representado por una variable
eléctrica. Las características que modifican son de índole variada como: amplitud, rango
dinámico, respuesta en frecuencia, respuesta en el tiempo, timbre, etc. El procesamiento
se lleva a cabo de manera electrónica, utilizando la tecnología de semiconductores y la
tecnología digital.
Fig. 61 Micrófono de propósito general
Fuente: WATKINSON, John. An introduction to digital audio. Londres: Clays, 1995
122
3.1 MICRÓFONOS
Los micrófonos son transductores que convierten energía sonora en energía eléctrica.
Específicamente, convierten presión sonora en tensión eléctrica. Esta tensión eléctrica
(convertible a una corriente utilizando un resistor) es análoga al sonido en cuanto a su
forma de onda. El criterio general para determinar si un micrófono es bueno o no, es si al
comparar las formas de onda de entrada (presión acústica) con las formas de onda de salida
(voltaje/corriente) resultan análogas (similares en sus características en el tiempo y en la
frecuencia). Los micrófonos permiten
el registro, almacenamiento, transmisión y
procesamiento electrónico de las señales de audio para diversas aplicaciones como
amplificación y comunicación a distancia.
Un micrófono consta de una cápsula que contiene un diafragma o membrana móvil. De
acuerdo al desplazamiento o velocidad de desplazamiento de la membrana, se produce la
conversión acústica-eléctrica. En un micrófono también existe circuitería electrónica
(amplificadores, transformadores de impedancia,etc.) utilizada para procesar la señal
eléctrica resultado de la conversión. La construcción y el funcionamiento de los micrófonos
esta relacionado con el principio de transducción utilizado, es decir, el principio físico que
gobierna la transformación de la energía acústica en energía eléctrica. Se hará a
continuación una clasificación de acuerdo al principio de transducción y posteriormente se
analizaran los parámetros más relevantes para la selección de un micrófono para una
aplicación especifica.
3.1.1 Micrófonos de carbón
Estos micrófonos fueron los primeros utilizados pero ya otro tipo de micrófonos los estan
reemplazando. El micrófono de carbón está compuesto por un diafragma y por pequeños
granos de carbón. Al comprimirse el diafragma debido a la presión sonora incidente, se
comprimen a su vez los granos de carbón, modificando su resistencia. Este cambio en
resistencia se ve reflejado por un cambio de tensión ya que la configuración diafragma-
123
carbón se comporta como un resistor variable. Las variaciones en tensión son
proporcionales a las variaciones en presión.
Figura 62 Micrófono de carbón
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
Se necesita una fuente interna de voltaje para traducir las variaciones de resistencia en
corriente. Este tipo de micrófonos tiene una respuesta en frecuencia (la respuesta en
frecuencia de un micrófono en general será analizado posteriormente) muy pobre y hoy en
día se utilizan solamente en algunos tipos de teléfonos.
.
3.1.2 Micrófonos piezoeléctricos
Los micrófonos piezoeléctricos se basan en la propiedad que tienen los materiales
piezoléctricos (efecto piezoeléctrico) de convertir torsiones, presiones y esfuerzos
mecánicos en corrientes eléctricas. (piezoin=presión en griego). Los micrófonos
piezoeléctricos se utilizan en aplicaciones donde es necesario captar sonidos a través de
superficies duras, como mesas.
Figura 63 Estructura interna de un micrófono piezoeléctrico
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
124
La respuesta en frecuencia es superior que la de los micrófonos de carbón pero aún no tiene
las características suficientes para grabaciones profesionales de voz.
Fig. 64 Micrófono piezoeléctrico
Fuente: BARTH, John. s.l.:s.n. 2002
<www.globalspec.com> [consulta: 20 Abr. 2005]
3.1.3 Micrófonos dinámicos
Los micrófonos dinámicos funcionan de acuerdo a la ley de inducción electromagnética de
Faraday. La ley de Faraday establece que un flujo magnético variable en el tiempo produce
una fem (fuerza electromotriz). Esta ley es equivalente a decir que en un conductor aparece
un voltaje eléctrico inducido cuando éste se encuentre en movimiento relativo respecto a un
campo magnético.
V=BvL
donde:
V:voltaje inducido(fem) [=] Voltios
B:campo magnetico [=] Tesla
v: velocidad del conductor [=] m/s
L:longitud del conductor [=]m
Los micrófonos dinámicos tienen la propiedad de generar electricidad y por eso, no
necesitan de fuentes adicionales en el micrófono.
125
Existen dos tipos básicos de micrófonos dinámicos: micrófonos de bobina móvil y
micrófonos de cinta (“ribbon”).
3.1.3.1 Micrófono de bobina móvil. Este micrófono consta de una bobina (móvil) que se
desplaza debido a variaciones de presión en el diafragma (una membrana en la superficie
del micrófono)
debido a ondas sonoras incidentes. En el interior del micrófono se
encuentra un imán permanente que genera un campo magnético uniforme. Los
desplazamientos de la bobina (adherida al diafragma) dentro del micrófono generan
voltajes proporcionales a la velocidad con que se desplaza la bobina, de acuerdo a la ley de
Faraday. Entre más rápido se mueve la bobina, más voltaje (o corriente) se generará. Por
esta razón también son llamados micrófonos de velocidad. Debido a que las bobinas están
hechas con un número específico de vueltas, la cantidad de corriente es mayor a medida
que incremente este número; un micrófono de bobina móvil generará más corriente que el
micrófono de cinta con las misma velocidad de movimiento. Se utilizan potentes imanes de
neodimio para aumentar la sensibilidad de este tipo de micrófonos.
Figura 65 Micrófono de bobina móvil
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
Los micrófonos de bobina móvil son muy utilizados en la actualidad principalmente por su
robustez que permite tener buena respuesta ante altos niveles SPL. Además debido a que
están completamente inmersos en el mercado de micrófonos, resultan muy económicos.
Como desventaja se debe mencionar que debido a la inercia de la bobina, es difícil que se
mueva con mucha rapidez. Por lo tanto la respuesta en frecuencia para tonos agudos no es
la mejor.
126
3.1.3.2 Micrófono de cinta. El micrófono de cinta es otro tipo de micrófono que funciona
de acuerdo al principio de inducción de Faraday. Este micrófono responde a cambios de
presión en dos lados de la cinta. Por eso, también se le conoce como micrófono
bidireccional o de gradiente de presión. En el caso del micrófono de cinta, la membrana es
la cinta misma, que generalmente es de aluminio. Una cinta o “ribbon” de aluminio se
mueve cuando está conectado a dos polos de un imán. Debido a la inducción
electromagnética una corriente se genera en el diafragma (cinta) debido a cambios de
presión en ella.
Figura 66 Micrófono de cinta
Fuente: MARTIN, Geoff. Introduction to Sound Recording.Washington:s.n. 2004.
Este tipo de micrófono es muy directivo debido a que solo responde a variaciones de
presión frontales. Como ventajas adicionales se puede anotar, que debido a la delgadez de
la membrana o diafragma (“ribbon”), el micrófono de cinta tiene muy buena respuesta en
las altas frecuencias. Sin embargo, debido a la fragilidad de la cinta es propensa a daños y a
rupturas. Además, no tiene buena respuesta en las bajas frecuencias y es muy susceptible a
los sonidos de la respiración y de “handling”. Debido a que la corriente generada (inducida)
es de muy poco valor, se debe utilizar un amplificador y un acople con un transformador.
3.1.4 Micrófono capacitivo
El micrófono capacitivo se basa en el funcionamiento de un capacitor o condensador. Un
condensador es un dispositivo formado por dos conductores (placas) que almacena energía
en forma de campo eléctrico. Un condensador almacena carga cuando le es suministrado
127
una diferencia de potencial a traves de sus placas. El voltaje (diferencia de potencial) esta
relacionado con la carga Q y la capacitancia C:
C=
Q
V
Cuando un condensador esta cargado, variaciones en la capacitancia implica variaciones en
el voltaje. La capacitancia varía al variar la distancia entre las placas (La capacitancia
solamente depende de la geometría de la configuración).
Figura 67 Micrófono capacitivo
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
Cuando la presión sonora incide sobre el diafragma del micrófono, una de las placas del
condensador (móvil) se mueve modificando la distancia respecto a la otra (estática). Estos
cambios en la distancia producen cambios en la capacitancia y esto se traduce en cambios
de voltaje. Debido a que responden directamente a los cambios de presión, son también
llamados micrófonos de presión. El micrófono capacitivo requiere fuente de polarizacion
(para cargar el condensador) ya que el mecanismo no permite generar electricidad, a
diferencia de los micrófonos dinámicos. La fuente externa necesaria para el funcionamiento
del micrófono puede provenir de una batería, pero hoy en día se utiliza un sistema
denominado Phantom Power. Phantom Power es un sistema remoto de abastecimiento de
energía (DC) para la polarización de los micrófonos de condensador y el funcionamiento de
circuitería electrónica adicional. Los voltajes de abastecimiento varían de 11 a 54 DC y la
forma de transmisión de ese voltaje se explicará en la sección de circuitos balanceados.
Los micrófonos de condensador tienen muy buena respuesta en frecuencia, especialmente
para las frecuencias altas. Como desventaja, se puede anotar la necesidad de una fuente
128
adicional(phantom power) para su funcionamiento y su precio. El patrón de estos
micrófonos es omnidireccional.
3.1.5 Micrófonos Electret
Los micrófonos Electret son un tipo especial de micrófonos capacitivos con una ventaja
adicional: las placas permanecen polarizadas una vez cargadas. El efecto Electret se basa en
que algunos materiales son capaces de retener la carga en la superficie, aún después de
desconectados. La placa cargada Electret servirá como diafragma para el micrófono. Sin
embargo, circuitería interna del micrófono (un transformador de impedancias) requiere una
fuente de polarización. Generalmente utiliza “Phantom Power”.
Figura 68 Micrófono Electret
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
Se realizó un bosquejo general de la clasificación de los micrófonos de acuerdo al principio
de transducción. Ahora se hará una clasificación de los micrófonos de acuerdo a la forma
como perciben o detectan la presión sonora. Esta forma incide directamente en el patrón de
direccionalidad de ellos.
129
3.1.6 Micrófonos de presión y de gradiente de presión
En un medio isotrópico como el aire, la presión sonora en un punto no depende de la
dirección en que viaja una onda sonora en específico. Los transductores que responden a la
presión en un punto por ende captarán (teóricamente) sonidos de cualquier dirección.
Los micrófonos de presión son aquellos con la capacidad de detectar presiones sonoras,
independientemente del ángulo de incidencia.
Debido
a
esta
cualidad,
los
micrófonos
de
presión
son
llamados
omnidireccionales(omni=todo).
En los micrófonos de presión, un lado del diafragma está expuesto al campo acústico
donde se captará el sonido, mientras que el otro lado está encerrado en el micrófono a una
determinada presión de referencia. El movimiento del diafragma está condicionado solo a
cambios de presión de la parte expuesta. Es importante aclarar que lo anterior supone que
un micrófono es puntual, es decir, que cualquier onda sonora cruzará ese punto, que es
completamente imposible. Los micrófonos responden solamente a ondas incidentes en el
diafragma frontal (la otra parte del diafragma está inmersa en el micrófono) y el patrón
omnidireccional es obtenido debido a que las ondas que no son frontales se difractan
alrededor del micrófono. Es decir, las ondas provenientes de todas las direcciones (frontales
y difractadas) inciden en el diafragma y el micrófono las capta. Resulta que este tipo de
micrófonos son sensibles a cambios de la frecuencia, volviéndose más directivos a medida
que crece la frecuencia. Esto ocurre debido a que las ondas de mayor frecuencia (menor
longitud de onda) se difractan menos y el micrófono interfiere con el campo acústico
creando sombra acústica. En altas frecuencias, el micrófono tiene dificultad para captar
sonidos posteriores.
Los primeros micrófonos del mercado eran nominalmente de presión (omnidireccionales).
Sin embargo, surgieron aplicaciones en que se requerían micrófonos de naturaleza
direccional: que capten sonidos provenientes de algunas direcciones, mientras que ignoren
de otras. De esto surge el concepto de micrófono de gradiente de presión.
Los micrófonos de gradiente de presión responden a la diferencia de presión entre dos
puntos A y B.
130
A B
Figura 69 Diafragma de un micrófono de gradiente de presión
Fuente: MARTIN, Geoff. Introduction to Sound Recording. Washington:s.n. 2004.
Esto puntos (A y B) suelen ser la parte frontal y la parte trasera del diafragma. Nótese que
en los micrófonos de presión, la parte trasera del diafragma está aislada del campo acústico
y por lo tanto la presión es constante en ese punto. Por eso los micrófonos de presión
detectan presión absoluta en una sola parte del diafragma (la parte expuesta al campo
acústico). En cambio, en los micrófonos de gradiente de presión ambas partes del
diafragma están expuestas al campo acústico y por lo tanto sujetos a cambios de presión.
Supongamos que una onda incide paralelamente al plano del diafragma. Por simetría,
existirán iguales componentes de presión a ambos lados y la presión neta diferencial
(gradiente) es cero, por lo cual el micrófono no detectará ese sonido. Por esta razón, el
patrón de sensibilidad espacial en este tipo de micrófonos es la de un ocho
(bidireccional).Nótese en la figura que para incidencias paralelas al plano (90°, 270°), no
existe respuesta por parte del micrófono.
0°
90°
270°
180°
Figura 70 Patrón bidireccional de un micrófono de gradiente de presión
Los micrófonos de gradiente de presión también son sensibles a cambios en la frecuencia.
Cuando una onda de una determinada frecuencia incide sobre uno de los dos puntos del
diafragma, digamos A, la onda tendrá una presión determinada en A y otra presión
determinada en B. La diferencia de estas presiones está caracterizada por la fase relativa de
131
la onda entre ambos puntos. A medida que la frecuencia aumenta, la fase relativa aumenta y
la diferencia de presión también.
Una variedad de micrófonos se pueden obtener al superimponer las características de los
micrófonos de presión con las características de los micrófonos de gradiente de presión y
será explicado posteriormente cuando se estudie la direccionalidad.
3.1.7 Parámetros en los micrófonos
Ahora se analizarán algunos parámetros relevantes de los micrófonos: sensibilidad,
direccionalidad, ruido, impedancia, , distorsión y conexión.
3.1.7.1 Sensibilidad. La sensibilidad de los micrófonos es uno de los parámetros más
importantes pues definen la respuesta ante los niveles de presión sonoro existentes y la
eficiencia en la transducción ya estudiada. En general el proceso transducción permite
obtener una salida de tensión (o corriente en algunos casos) a partir de una entrada de
presión (acústica). La sensibilidad determina la relación que hay entre la tensión y la
presión.
S=
V
P
donde
S: sensibilidad del micrófono [=]voltios/Pa
V: voltaje o tensión producida [=] voltios
P: presión incidente [=] Pa
La expresión de la sensibilidad en decibeles exige una referencia de sensibilidad
Sref=1
V
V/Pa:
Pa
132
SdB=20log(
S
)
S ref
Un micrófono es más sensible a medida que S es mayor. Sin embargo, debe aclararse que
las tensiones de salida suelen ser demasiadas pequeñas y se deben utilizar
preamplificadores para que éstas puedan ser tratadas con mayor facilidad. Debido a
distintos factores, algunos analizados cuando se miraron los principios de transducción, la
sensibilidad cambia para distintos valores de frecuencia. Por eso es útil representar la
sensibilidad (en dB) en función de la frecuencia. El resultado es denominado respuesta en
frecuencia del micrófono.
Figura 71 Respuesta en frecuencia de un micrófono
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
Para los micrófonos en general, se define la frecuencia inferior de la respuesta en
frecuencia como la frecuencia por debajo de la cual la sensibilidad cae 3dB. Similarmente,
la frecuencia superior se define como la frecuencia por encima de la cual la sensibilidad cae
3dB. Con el conocimiento de la frecuencia inferior y la frecuencia superior de un
micrófono (respecto a su respuesta en frecuencia), se puede saber a groso modo cual
micrófono es mejor para determinada aplicación . La diferencia entre la frecuencia superior
y la frecuencia inferior es llamada ancho de banda.
En general, los micrófonos sufren cierta caída en sensibilidad cuando la frecuencia es
superior a los 10KHz debido a sombras acústicas generadas por el micrófono. Esto ocurre
133
porque las longitudes de onda a esas frecuencias son comparables con el tamaño del
micrófono.
3.1.7.2 Direccionalidad y patrones direccionales. La direccionalidad en el contexto de los
micrófonos es la capacidad que tienen éstos para captar sonidos provenientes de distintos
ángulos (también llamado sensibilidad espacial.) La sensibilidad máxima está limitada por
la sensibilidad propia o natural del micrófono. Los patrones direccionales dependen si el
micrófono es de presión o de gradiente de presión. A cada patrón direccional se asocia un
patrón polar, una gráfica polar que indica como varía la sensibilidad con la dirección de
procedencia del sonido, respecto a la sensibilidad máxima. La grabación de sonido
requerirá determinado patrón según sea la aplicación.
Existen básicamente dos tipos de patrones:
direccional: captación del sonido proveniente
de algunas direcciones (asociados a
micrófonos de gradiente de presión). Se deben utilizar cuando se quiera reducir el ruido de
fondo y para captar sonidos lejanos.
omnidireccional: captación del sonido proveniente de cualquier dirección (asociados a
micrófonos de presión). Son particularmente útiles cuando se quiere grabar la acústica
ambiental.
Obviamente, existen patrones intermedios resultado de la combinación de patrones
direccionales y omnidireccionales, y para clasificarlos, se usa la siguiente ecuación polar
(normalizada) que representa el patron direccional general para un micrófono:
r=A+Bcosφ
donde
r: distancia de un punto perteneciente al patron polar al origen
A,B: constantes tal que A+B=1
Utilizando el hecho que A+B=1, se pueden lograr en teoría infinitos patrones polares
direccionales entre los cuales se destacan:
134
A=1, B=0
r=1 (patrón omnidireccional)
Esta figura polar es una circunferencia pues puede captar el sonido desde cualquier
dirección de incidencia.
A=0, B=1
r=cosφ (patron bidireccional)
Esta figura polar es referida comunmente como “figura ocho” por su semejanza con el
número. El lóbulo frontal y posterior indican que los micrófonos con este patrón captan
sonidos en la dirección del eje del micrófono, e ignoran sonidos que inciden
perpendicularmente. (90° y 270°). Esta figura se vio cuando se analizaron micrófonos de
gradientes de presión.
A=B=0.5
r=0.5+0.5cosφ (patron unidireccional)
Esta figura polar se conoce como cardioide. Los cardioides son sensibles a los estímulos
sonoros en un rango amplio al frente del micrófono, pero relativamente insensibles a los
sonidos detrás del mismo.
A=0.375, B=0.675
r=0.375+0.675cosφ (patron unidireccional con lóbulo trasero)
Esta figura polar se conoce como supercardioide. El supercardioide es mas direccional que
el patrón sensitivo del cardioide. Cuando este tipo de micrófono es apuntado hacia una
fuente sonora la interferencia de los sonidos fuera del foco de percepción es eliminada.
A=0.25, B=0.75
r=0.25+0.75cosφ (patron unidireccional con lóbulo trasero pronunciado)
Esta figura polar se conoce como hipercardioide). El patrón es aún mas direccional que los
anteriores y por lo tanto micrófonos con este patrón sirven para captar sonidos distantes.
135
a) omnidireccional b) cardioide c) supercardioide d) hipercardioide e) bidireccional
Figura 72 Patrones polares de direccionalidad
A los patrones polares se asocian algunos parámetros que de forma distinta, evalúan las
características direccionales de ellos con respecto a un patrón polar omnidireccional.
Ángulo de Captura (Acceptance angle): Describe el ángulo desde el cual un micrófono es
capaz de captar sonidos a una sensibilidad específica, por ejemplo –3dB.
Angulo para salida=0: Es el ángulo de incidencia para el patrón en el cual la atenuación se
hace infinita.
REE(Random Energy Efficiency): Se define como la cantidad de
ruido ambiente que capta el micrófono en relación a lo que captaría un micrófono
omnidireccional a la misma distancia y con la misma sensibilidad ( se indica en dB ).
DF(Distance Factor): Es un parámetro que cuantifica cuanto debemos alejar un micrófono
para que capte la misma relación de sonido directo respecto a ruido ambiente teniendo
como referencia a un micrófono omnidireccional colocado a un metro de la fuente.
Estas características se resumen a continuación en una tabla para los diversos patrones
polares estudiados.
136
Tabla 6 Características direccionales de diversos patrones
Omnidireccional Cardioide
Supercardioide
Hipercardioide
Bidireccional
r=1
r=0.5+0.5cosa
r=0.375+0.625cosa r=0.25+0.75cosa r=cosa
131°
115°
105°
90°
para ______
180°
126°
110°
90°
REE (dB)
0
-4.8
-5.7
-6
-4.8
DF
1
1.7
1.9
2
1.7
Patrón Polar
Ecuación
Ángulo
de ______
Captura(-3dB)
Angulo
salida =0
Fuente: MARTIN, Geoff. Introduction to Sound Recording. Washington:s.n. 2004.
Para determinar el patrón direccional de un micrófono se realizan ensayos en una camara
anecoica (sin ecos) y una fuente sonora emitiendo un sonido de una frecuencia
determinada. Teniendo el micrófono completamente en frente de la fuente sonora (ángulo
de 0° de incidencia) se toma la tensión generada por el micrófono. Esta tensión se
denomina tensión de referencia y se le asocia un valor de 0dB. Después se va rotando el
micrófono para obtener la tensión de salida del micrófono para distintos ángulos. Estos
valores son atenuados respecto a la tensión de referencia y por lo tanto representan valores
negativos dB. Este proceso se repite para varias frecuencias para obtener el patrón polar
completo.
Existe un efecto de considerable importancia que se presenta en los micrófonos
direccionales. Cuando la fuente sonora está a unos milímetros de la cápsula (como cuando
cantantes o locutores ponen sus labios en el micrófono), las frecuencias bajas tienden a
amplificarse. Este efecto se conoce como efecto de proximidad, en el cual se incrementa la
sensibilidad del micrófono respecto a las bajas frecuencias. Aunque en general este efecto
es indeseable (pues “colorea” el sonido al amplificar alguna región del espectro), algunos
cantantes masculinos aprovechan este efecto para que su voz suene mejor.
137
3.1.7.3 Ruido. El ruido en el caso más general, es la presencia de una señal no deseada. En
los micrófonos existen dos tipos de ruido principalmente que deben minimizarse o
controlarse: el ruido acústico y el ruido eléctrico. El ruido acústico proviene del ambiente y
es muy difícil eliminarlo e imposible eliminarlo por completo. Una solución es utilizar
micrófonos directivos de tal forma que no capten todo el ruido (ya que el ruido ambiental es
omnipresente) y concentrarse en el elemento a grabar.
El ruido eléctrico se puede definir como potencia eléctrica no deseada. Es un elemento
intrínseco de la construcción del micrófono y está presente cuando no hay señal externa
para excitarlo. La medida de este ruido se realiza en una cámara anecoica. Esta medida se
expresa como si el ruido fuese una señal sonora generando una tensión de salida.
El ruido se puede disminuir escogiendo un micrófono con baja impedancia y que contenga
en su interior circuitería electrónica muy refinada. (El ruido eléctrico para un micrófono de
100ohms es mínimo de .18microvoltios, debido al ruido térmico de los electrones en un
circuito). El ruido eléctrico debe hacer parte de las especificaciones de un micrófono pero
el ruido ambiental no, pues no es atribuible al micrófono. El parámetro utilizado para
especificar el ruido de un micrófono es la relación señal a ruido
S/RdB=20log(
señal
)
ruido
3.1.7.4 Impedancia. La impedancia de un micrófono es la resistencia que opone el
micrófono al paso de la tensión. No se debe confundir con la impedancia acústica que es un
parámetro del medio. La impedancia de un micrófono es una caracterísitica eléctrica
cuando se considera al micrófono como un circuito o parte de un circuito. Se mide en ohms
y los micrófonos están clasificados por baja, alta y muy alta impedancia.
Lo-Z Baja impedancia (alrededor de 200 Ohm)
Hi-Z Alta impedancia (1 K o 3 K e incluso 600 Ohm)
Muy alta impedancia (más de 3 K).
Esta viene a convertirse en una característica importante del micrófono cuando se requiere
conectar éste a un preamplificador o a una mesa de mezcla. El preamplificador o la mesa
138
de mezcla tienen asociados una impedancia llamada impedancia de carga de entrada. Esta
es la impedancia que va a “ver” el micrófono cuando se conecte.
+
V
-
Zmic
Zentrada
+
Vamp
-
Figura 73 Equivalente circuital de un micrófono conectado a un amplificador
Sea V el voltaje o tensión generado por el micrófono, Zmic la impedancia del micrófono,
Zentrada la impedancia de carga de entrada del amplificador, y Vamp el voltaje efectivo que
aparece en el amplificador. Estos parámetros están relacionados mediante el siguiente
divisor de tensión:
Vamp=V
Zentrada
Zmic + Zentrada
El objetivo es que Vamp sea lo más parecido a V para que no haya pérdidas. (aunque
siempre va a ser un poco menor según la ecuación anterior). La forma de mejorar esta
situación es haciendo que Z entrada sea considerablemente mayor (de 3 a 10 veces) que
Zmic. En el caso que se utilice un cable para conectar el micrófono a distancia, la
impedancia del cable (modelado como una resistencia más) es agregada a la impedancia
que ve el micrófono al conectarlo. Si el micrófono es de alta impedancia, las pérdidas por la
longitud del cable son muy grandes, aumentado a medida que crece la distancia entre el
micrófono y la mesa o amplificador. Esta es una de las razones por la cual se prefieren los
micrófonos de baja impedancia. Para disminuir la impedancia se utiliza transformadores de
impedancia que son amplificadores de corriente. Si la corriente incrementa, la razón voltaje
sobre corriente (resistencia o impedancia) disminuye. Esto es comunmente utilizado en
micrófonos capacitivos. La salida de la cápsula (que contiene el condensador) ingresa a un
transformador de impedancias (amplificador de corriente) para reducir la impedancia a
unos pocos cientos de ohm.
139
Otra razón para preferir los micrófonos de baja impedancia es que son menos susceptibles
al ruido pues el ruido inherente a los sistemas eléctricos (ruido térmico) aumenta cuando las
resistencia aumenta.
3.1.7.5 Distorsión. La distorsión es una especificación que cuantifica cuanto se deforma
una onda. Una onda (por ejemplo senoidal) se deforma cuando aparece cierta cantidad de
armónicos. Aunque todas las señales sonoras son complejas y contienen un determinado
número de armónicos, los micrófonos tienden a agregar aún más, modificando la onda
original. Esto no es deseable pero es imposible eliminarla por completo. La distorsión está
asociada también al nivel de presión sonora pues a niveles altos, la onda tiende más a
deformarse por saturación de los sistemas eléctricos (micrófonos, amplificadores,
parlantes).
La distorsión se expresa mediante la siguiente expresión (distorsión armónica total):
THD=
f2 2 + f32 + ...fn 2
x100%
f12
donde f1 es el valor eficaz de la componente fundamental y f2, f3 y siguientes son los
valores eficaces de los armónicos.
Básicamente la THD indica cuanto porcentaje de la señal está contenida en los armónicos.
La especificación de THD se suele dar asociada con el máximo nivel de presión sonora
(NPS).
Una especificación podría ser:
THD: 0.5% a 120dB NPS
3.1.7.6 Conexión. La conexión de los micrófonos no es un parámetro intrínseco del
micrófono en sí, pero si afectará su rendimiento general en la cadena de audio. Existen dos
formas básicas de conexión: conexión simple o no balanceada y conexión balanceada. La
conexión no balanceada consiste en dos cables conductores que unen al micrófono con el
amplificador. Un cable está a potencial eléctrico 0 (se dice también que está conectado a
masa) y por el otro viaja la señal eléctrica alterna producto de la transducción del
micrófono. Para minimizar el ruido de captación por efecto antena, uno de los cables rodea
140
al otro creando una malla o blindaje electrostático. Sin embargo, este tipo de conexión
sigue siendo susceptible al ruido pues por el ruido se añade al cable que lleva la seña.
El otro tipo de conexión es la conexión balanceada que utiliza tres conductores en vez de
dos. Uno de los conductores está conectado a masa (potencial 0) y un segundo conductor
lleva la señal. Ahora, un tercer conductor lleva también señal pero con polaridad opuesta.
El ruido se adiciona de forma aproximadamente igual a ambos conductores con señal,
suponiendo que la fuente de ruido se encuentra a la misma distancia que ambos
conductores. Los conductores llegan al equipo y se encuentra con un amplificador
diferencial, que amplifica la diferencia entre las señales de los dos conductores. El
resultado es que el amplificador duplica la señal y elimina el ruido. El proceso se esboza en
la siguiente tabla.
Tabla 7 Conexión balanceada
Conductor 1: S+R
Salida del amplificador:
Conductor 2: -S+R
S+R-(-S+R)=2S
Fuente: WATKINSON, John. An introduction to digital audio. Londres: Clays, 1995
La señal balanceada se desarrolló para solucionar el problema del ruido captado por los
cables que conectan equipos. Este tipo de cables son llamados XLR.
3.1.7.7 Phantom Power. Algunos micrófonos, como los capacitivos necesitan de una
fuente externa para el mecanismo de transducción. Esta fuente remota llamada fantasma
(phantom) se utiliza en micrófonos con conexión balanceada.. La fuente remota (fantasma)
generalmente está ubicada en la mesa de mezcla o consola. Se utilizan tres cables
conductores de tal forma que un conductor está conectado a tierra y los otros dos llevan la
señal de audio. Adicional, a la señal de audio, estos dos conductores llevan un voltaje
idéntico de DC respecto a tierra. Se llama fantasma porque va en la misma línea que la
señal de audio. Los cables entonces sirven para dos propósitos: entregan la señal captada
por el micrófono a la consola y entrega energía desde la consola hasta el micrófono. Los
micrófonos dinámicos, debido a que no necesitan alimentación externa para generar
tensión, simplemente ignoran este voltaje siempre y cuando también tengan conexión
141
balanceada. Los voltajes nominales más utilizados son 12V, 24V y 48V para el voltaje DC
“fantasma”.
3.1.8 Micrófonos para aplicaciones
Para algunas aplicaciones específicas, se deben tener en cuenta aspectos dimensionales y
geométricos además de otros aspectos discutidos anteriormente. Es por eso que existe una
variedad de micrófonos en el mercado que según su tamaño y forma, son más convenientes
para una situación determinada.
Micrófono de Lavaliere: Son los micrófonos comunmente utilizados en presentaciones y
locuciones. Los más famosos son los micrófonos de clip o de corbata.
Figura 74 Micrófono de Lavaliere
Fuente: BARTH, John. s.l.:s.n. 2002
<www.globalspec.com> [consulta: 20 Abr. 2005]
Micrófono de cañón: Son utilizados en locaciones de producción de películas para captar
sonidos a distancia de la cámara.
Figura 75 Micrófono de cañón
Fuente: BARTH, John. s.l.:s.n. 2002
<www.globalspec.com> [consulta: 20 Abr. 2005]
142
Micrófonos de contacto: Son micrófonos que están directamente en contacto con la fuente
sonora. Estos micrófonos se encuentran generalmente montados en instrumentos musicales.
Figura 76 Micrófono de contacto
Fuente: BARTH, John. s.l.:s.n. 2002
<www.globalspec.com> [consulta: 20 Abr. 2005]
Micrófonos Parabólicos: Un micrófono parabólico es una configuración de un micrófono
y un reflector parabólico utilizado para concentrar el sonido en el micrófono. Es utilizado
generalmente para la cobertura de eventos deportivos.
Figura 77 Micrófono parabólico
Fuente: BARTH, John. s.l.:s.n. 2002
<www.globalspec.com> [consulta: 20 Abr. 2005]
Micrófonos Inalámbricos: Estos micrófonos incorporan una antena transmisora de radio
frecuencias para utilizar el micrófonos a distancias moderadas y grandes sin necesidad de
cables.
Figura 78 Micrófono inalámbrico
Fuente: BARTH, John. s.l.:s.n. 2002
<www.globalspec.com> [consulta: 20 Abr. 2005]
143
3.2 ALTAVOCES
Los altavoces son los dispositivos duales a los micrófonos: convierten la energía eléctrica
nuevamente en energía acústica. Los altavoces son también denominados altoparlantes o
simplemente parlantes. En general, estos constan de un mecanismo para convertir la energía
eléctrica en energía mecánica ( de movimiento) y otro mecanismo para convertir los
movimientos en sonido para su propagación en el aire. En la cadena de audio, los altavoces
son considerados como el elemento más delicado para la reproducción fiel del sonido. Esto
debido a la cantidad de parámetros que se deben manejar que incluyen: direccionalidad,
sensibilidad, impedancia. Los altavoces en teoría deben ser capaces de reproducir todo el
espectro de audición humana que abarca desde 20Hz hasta 20kHz (longitudes de onda
desde 1.7cm hasta 17 m). Además deben reproducir todo tipo de sonidos, música, voz
humana con la máxima calidad posible. Esto no siempre es posible con un solo tipo de
altavoz por lo que, al igual que los micrófonos, se escogen altavoces de acuerdo a la
aplicación específica.
En esta sección se tratarán las características más importantes de los altavoces y también las
cajas acústicas que son los recintos donde se ubican los altavoces. (Algunos autores
consideran la caja acústica como parte del altavoz pero aquí se analizará por aparte).
3.2.1 Clasificación de los altavoces (mecanismo de transducción)
Los altavoces se pueden clasificar de acuerdo a su mecanismo de transducción al igual que
los micrófonos. Esta clasificación está directamente relacionada con el rango de frecuencias
que puede manejar dicho altavoz. Los mecanismos de transducción más comunes en los
altavoces son:
electrodinámico: excitación por movimientos debido a fuerzas magnéticas
electrostático: excitación por atracciones electrostáticas
piezoeléctrico: excitación por efecto piezoléctrico
144
3.2.1.1 Altavoz de bobina móvil. Los altavoces más comunes son los de bobina móvil
(generalmente denominados como altavoces dinámicos) cuyo mecanismo de transducción
es electrodinámico. El altavoz esta constituido por un circuito magnético y un cono o
diafragma.
Figura 79 Corte transversal de un altavoz de bobina móvil
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
El circuito magnético está conformado básicamente por: un imán permanente, una bobina
móvil, y un entre hierro. En el entrehierro se aloja la bobina, sobre cual existe un poderoso
campo magnético. Cuando circula corriente magnética por la bobina (corriente proveniente
por ejemplo de un micrófono), se genera una fuerza magnética debido a la interacción de
esta corriente con el campo magnético (Ley de Biot-Savart). El movimiento de la bobina se
transmite al cono o diafragma. El cono, hecho generalmente de cartón, está suspendido
mediante unas cuerdas elásticas para mantener su posición de reposo. Todas las
movimientos de la bobina debido a la fuerza magnética variable se convierten en
movimientos y vibraciones en el cono al cual está sujeta. Esta es la parte mecánica del
altavoz y los movimientos son el efecto motor o excitador del altavoz. Dicho cono actúa
como pistón impulsando el aire hacia afuera o hacia dentro, dependiendo de la polaridad de
la corriente aplicada a la bobina. El proceso de impulsión de aire es que en ultima instancia
145
genera la propagación del sonido. Esta estructura se conoce como un altavoz de radiación
directa pues está expuesta al aire sin algún tipo de caja acústica.
Los altavoces de bobina móvil son útiles para reproducir sonidos de bajas frecuencias así
como sonidos con grandes niveles de presión sonora. Una ventaja de este tipo de altavoces
es que son robustos y por lo tanto resistentes al mal trato. Su construcción es relativamente
fácil y son económicos.
Debido a la inercia del cono, los sonidos de alta frecuencia son difíciles de producir pues
requieren movimientos rápidos del cono. Además, el cono deja de vibrar como un todo y
pasa a ondularse, es decir, algunas partes del cono vibran con una polaridad y otras con otra
polaridad. Esto resulta en una cancelación parcial de la onda y la energía sonora efectiva
radiada será menor para altas frecuencias. Para solucionar este inconveniente, en altas
frecuencias se utiliza una variante de la estructura denominada “compression driver” o
excitador de compresión, que evita las cancelaciones del sonido y mejora la respuesta en
frecuencia. . Esto se logra modificando la geometría del diafragma de cono a forma de
cúpula. Así se mejora significativamente los movimientos al disminuir la inercia del
diafragma. Además incorpora otro elemento denominado un corrector de fase que permite
compensar las diferentes distancias que debe recorrer el sonido desde el diafragma hasta la
garganta del excitador, y de esta forma evitar las cancelaciones del sonido. El excitador
genera presiones elevadas que luego son llevadas a una bocina. La bocina actúa como un
adaptador de impedancia acústica o acople entre el excitador y el aire ambiental y permite
la obtención de mayor direccionalidad.
3.2.1.2 Altavoz de cinta o membrana metálica. Los altavoces de cinta o membrana
metálica funcionan de acuerdo al mismo principio de transducción electrodinámica que los
altavoces de bobina móvil. Se suspende una lámina de aluminio en un campo magnético. Al
pasar una corriente (AC) a través de la membrana, se genera una fuerza magnética que hará
que la membrana se mueva dependiendo de la polaridad de la corriente. En esta
configuración, la membrana es el mismo diafragma para el altavoz (excitador). Debido a la
pequeña masa asociada a la membrana, esta configuración es útil para reproducir altas
frecuencias pues la inercia es pequeña. Sin embargo, la construcción es delicada pues la
146
membrana en sí es muy frágil. Además, la impedancia de la membrana es muy pequeña
(debido a que es metálica) y se necesitaría un transformador de impedancias.
Figura 80 Altavoz de cinta
Fuente: MARTIN, Geoff. Introduction to Sound Recording. Washington:s.n. 2004.
3.2.1.3 Altavoz electrostático. El altavoz electrostático utiliza la fuerza electrostática como
elemento motor y excitador. La fuerza electrostática es la fuerza que experimentan las
cargas eléctricas debido presencia de otras cargas. El sistema consta de tres placas
conductoras, una de las cuales está cargada con un voltaje positivo de polarización (DC) y
está libre para moverse entre dos placas. Las otras dos placas que son fijas están conectadas
a la salida de audio (tensión de AC).
entrada de audio
(A.C.)
Figura 81 Estructura de una altavoz electrostático
Fuente: MARTIN, Geoff. Introduction to Sound Recording. Washington:s.n. 2004.
A medida que cambia la tensión entre las placas debido a la naturaleza variable de AC, la
placa intermedia se mueve debido a fuerzas electrostáticas. Debido a que el voltaje de las
147
placas fijas cambia en el tiempo, el movimiento de la placa móvil es alternadamente hacia
la derecha y hacia la izquierda, produciendo compresiones y rarefacciones que se traducen
en la propagación del sonido. Este esquema de transducción permite reproducir una buena
gama de frecuencias del espectro. Debido a que el diafragma (placa móvil) es delgado, se
pueden obtener movilidades grandes (buena velocidad de respuesta) necesario para
reproducir frecuencias altas. También tiene poca distorsión armónica comparada con los
otros tipos de altavoces. Como desventajas se debe anotar que se necesitan voltajes
extremadamente altos (miles de voltios) para su polarización. Además resultan ser costosos
comparados con los otros altavoces.
3.2.1.4 Altavoces piezoeléctricos. Los altavoces piezoeléctricos basan su funcionamiento
en el efecto piezoeléctrico: deformaciones en materiales piezoeléctricos cuando se aplica
tensión entre las caras del material (Nótese que el efecto piezoeléctrico también fue
aprovechado para algunos micrófonos, pero en dirección inversa: deformaciones crean
tensiones). El altavoz piezoeléctrico es utilizado en aplicaciones donde se requieren
reproducir exclusivamente tonos agudos.
3.2.2 Cajas acústicas
Las cajas acústicas o bafles son los recintos donde están ubicados los altavoces. Cumple
tres propósitos principalmente:
-
mejorar la respuesta en frecuencia
-
mejorar la eficiencia de la energía sonora radiada
-
facilitar la maniobrabilidad y proteger a los altavoces
En lo que sigue, se tomará como ejemplo el altavoz de bobina móvil de radiación directa.
En este altavoz ambos lados del diafragma o cono está expuesto al ambiente. Cuando se
produce un movimiento del cono hacia adelante se produce una compresión de aire delante
del cono, pero en la parte posterior se produce una descompresión. Esta configuración se
148
denomina dipolo acústico. El dipolo acústico crea una onda sonora en la parte delantera y
otra en la parte trasera pero con presiones positiva y negativa respectivamente (equivalente
a tener fase inversa). Esta situación crea cancelación de las ondas debido a la superposición
de ambas (positiva y negativa) en algunos puntos del espacio.
Figura 82 Fenómeno del corto acústico
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
Se puede observar que hacia los lados del altavoz se produce interferencia destructiva entre
las ondas sonoras generadas por el frente y las generadas por la parte posterior. El
fenómeno se denomina corto acústico. Este fenómeno ocurre para las longitudes de onda
suficientemente grandes para que puedan bordear el altavoz, o cualquier superficie donde
éste se coloque. Esto disminuye el rendimiento sonoro y crea un patrón direccional
irregular. Por esta razón se deben agregar bafles(cajas acústicas) al altavoz para corregir el
problema. Sin embargo, al meter el altavoz en la caja surge un problema adicional pues la
onda creada en la parte interior(parte posterior del diafragma) puede ser reflejada en la
parte posterior del bafle y encontrarse con la onda exterior(parte frontal del diafragma). La
suma de estas dos ondas genera distorsión y se compromete la fidelidad de los sonidos que
se quieren reproducir. Existen varios tipos de bafles tanto para corregir el problema del
corto acústico como para afrontar otros problemas. Se explicarán a continuación haciendo
énfasis en los problemas que corrigen así como sus limitaciones.
3.2.2.1 Bafle infinito. El bafle infinito es un bafle simple que consiste en montar el altavoz
al ras de una pared sobre un agujero perforado en ésta. De esta forma, las ondas de
149
compresión y descompresión no podrán mezclarse. La ventaja de este sistema es el evitar el
corto acústico y por lo tanto ampliar el rango de frecuencias bajas.
Figura 83 Bafle infinito
De hecho, la frecuencia de corte inferior (bajas frecuencias) está relacionada con el
diámetro del diafragma:
fc=
c
πD
c: velocidad del sonido
D: diámetro del diafragma
Si se aumenta el tamaño del diafragma, se puede disminuir la frecuencia de corte lo que es
deseable para ampliar el espectro que puede reproducir el altavoz. Sin embargo, con un
bafle infinito se desperdicia la energía sonora irradiada detrás del diafragma (la parte que
está montada sobre la pared).
3.2.2.2 Bafle sellado. El bafle sellado es el tipo de caja más básico. Consiste en una caja
cerrada llena de material absorbente. El objetivo es anular la onda que se genera en el
interior de la caja.
Figura 84 Caja sellada
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
150
Como ventajas se puede decir que la pendiente de atenuación de la respuesta no es muy
pronunciada(suave descenso) y la respuesta temporal es satisfactoria. El recinto cerrado
tiene varios inconvenientes además del poco rendimiento (la radiación posterior es
convertida a calor y a vibraciones al ser absorbida). Por un lado, se producen en el interior
ondas estacionarias al coincidir las dimensiones del recinto con la mitad de la longitud de
onda (condición de onda estacionaria). Además el aire contenido en la caja actúa como un
muelle y a grandes niveles SPL, el sonido se distorsiona. Como desventaja adicional se
debe anotar que la frecuencia de corte no es muy baja y para reproducir bajas frecuencias se
deben utilizar bafles muy grandes.
3.2.2.3 Bafle “Bass-reflex”. Este tipo de caja está especialmente diseñada para reforzar los
bajos. Es el tipo de caja más extendido, junto a la caja sellada. El bafle consiste de una caja
cerrada parcialmente llena de material absorbente, pero con un tubo con salida al exterior.
Este tubo actúa como una resistencia entre el aire del interior y del exterior y permite
orientar el sonido proveniente de la parte posterior del diafragma de tal forma que no se
produzca cancelación sino refuerzo de las bajas frecuencias.
Figura 85 Caja “Bass-reflex”
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
La configuración con el agujero actúa como el resonador Helmholtz, que produce sonido
cuando es convenientemente excitado. La frecuencia de resonancia es directamente
proporcional a la superficie del tubo e inversamente proporcional al volumen de aire en la
caja. Para lograr la máxima efectividad, se debe hacer coincidir la frecuencia de resonancia
151
del altavoz con la frecuencia de la caja. Esto se puede hacer o variando el volumen de aire
en la caja, o modificando la superficie del tubo (este último procedimiento es el más
utilizado).
La caja bass-reflex tiene como característica principal su buen rendimiento en graves,
causado por una frecuencia de corte menor que en las cajas selladas y su capacidad para
manejar grandes SPL sin distorsión. Sin embargo tiene el problema que la pendiente de
atenuación de su respuesta es muy alta: 18-24dB/Oct.
La respuesta temporal no es
demasiado buena.
3.2.2.4 Caja con radiador pasivo. Es una variante de la caja bass-reflex. Fue inventado
por Celestion. Consiste en una caja “bass-reflex” en la que se ha sustituido el tubo o
agujero por un radiador pasivo. Un radiador pasivo es un altavoz adicional, pero sin imán y
sin bobina(por eso es pasivo). Sólo tiene el chasis, la suspensión y el diafragma.
Figura 86 Bafles comerciales con sistema de radiador pasivo
Fuente: SAKE, Rudy. s.l.:s.n. 2003
<www.bafflemania.com> [consulta: 20 Abr. 2005]
Para hacer que el radiador pasivo ofrezca la misma resistencia al aire que el tubo de un
sistema bass-reflex, se le añade una masa al altavoz pasivo. Su misión es reforzar los graves
que se crean en el interior de la caja. Este refuerzo se hace de una manera más exacta que
en los bafles bass-reflex pues en estos últimos el aire se mueve de manera descontrolada
mientras que el radiador pasivo depende de la masa que es un parámetro más exacto y
152
confiable. La distorsión para bajas frecuencias es menor que para el bass-reflex. El bafle
con radiador es considerablemente más caro.
3.2.2.5 Caja ELF. ELF es un acrónimo de Extended Low Frequency. Son utilizadas
específicamente para trabajar a frecuencias menores que la frecuencia inferior donde el
nivel SPL ha caído 3dB. Esto significa que esa frecuencia, que generalmente es una
frecuencia inferior, se convierte en una frecuencia superior pues solo interesa la banda de
frecuencias menor a ella Debido a ésto, se pueden hacer bafles de tamaño sumamente
reducido(el subwoofer de Bang&Oluffsen es un ejemplo, un cubo de 25-30 cm de lado),
pagando el precio de incrementar la potencia necesaria para el funcionamiento.
El elemento básico del sistema ELF es un integrador que predice el comportamiento del
altavoz a frecuencias bajas y mejora la respuesta en frecuencia. Otra ventaja es que la
eliminación de la onda producida por la parte trasera se produce por la propia elasticidad
del aire.
Figura 87 Bafles comerciales con sistema ELF
Fuente: SAKE, Rudy. s.l.:s.n. 2003
<www.bafflemania.com> [consulta: 20 Abr. 2005]
Los inconvenientes son serios: al reducir el SPL a -12dB/oct, el nivel para la corrección
debe ser muy fuerte. Se deben utilizar amplificadores de potencia con valores muy
elevados. Además existen serias limitaciones por desplazamiento de la membrana, pues las
excursiones para baja frecuencia deben ser mayores y se genera mucha distorsión.
3.2.2.6 Cajas Paso banda o de carga simétrica. Las cajas Paso banda consisten en una
caja con una pared interior donde está el “woofer” (altavoz especialmente diseñado para
153
bajas frecuencias). En uno de los lados hay una sub-caja “bass-reflex” y en el otro, puede
haber una bass-reflex o una caja sellada.
Figura 88 Caja de carga simétrica
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
Se han hecho muy populares últimamente, sobre todo en los sistemas Home Cinema, que
constan de un “sub-woofer” (en caja paso banda) y cinco satélites de agudos y medios. El
problema de estos sistemas es la baja consistencia del sonido, sobre todo en espacios
grandes, donde no se llega a percibir homogeneidad en el sonido. Este tipo de caja sólo deja
salir el sonido por el conducto. Un efecto no deseable es que la caja actúa como un
resonador de Helmholtz, y por lo tanto sintoniza una única frecuencia que se destaca de las
otras. Otros inconvenientes son la eficiencia baja y la respuesta temporal (la señal sufre
retrasos muy altos)
3.2.2.7 Caja laberinto. La caja laberinto consiste en un tubo largo lleno de material
absorbente. El material absorbente elimina la onda en el interior del tubo. Este tubo o caja
guía la onda (que se comporta como onda plana) de tal forma que no se generen ondas
estacionarias y así evitando coloraciones y brindando mejores respuestas para las bajas
frecuencias. Sin embargo, a niveles SPL suficientemente altos si existirá reflexión y por
tanto algunas ondas estacionarias. Como criterio de diseño, la longitud del tubo debe ser
aproximadamente igual a ¼ de la longitud de onda de Fc, la frecuencia de resonancia, para
que no se cancele la onda sino que se refuerce.
154
Como ventajas, se puede decir que el diseño de la caja permite anular, por lo menos
teóricamente, las resonancias. Tiene buena respuesta en frecuencia, especialmente respecto
a los graves. También, el laberinto al tener un único punto de emisión sonora evita
interacción con el recinto. Una desventaja es que las cajas de laberinto son sumamente
grandes y tienen muchos materiales y estructuras complejas en su interior.
Figura 89 Caja laberinto
Fuente:PATTON, Todd. s.l.:s.n. 1999
<www.pcpaudio.com/pcpfiles > [consulta: 20 Abr. 2005]
3.2.2.8 Caja “Línea de TX”. Esta caja recibe su nombre debido a la analogía con líneas de
TX: líneas que transportan energía eléctrica o información con la menor pérdida posible.
Este tipo de cajas son las mejores que existen para preservar la cualidad del sonido, pero su
construcción es muy laboriosa.
Figura 90 Caja de línea de Tx
Fuente:PATTON, Todd. s.l.:s.n. 1999
<www.pcpaudio.com/pcpfiles > [consulta: 20 Abr. 2005]
155
El mecanismo básico de estas cajas es hacer que la onda delantera producida por el
diafragma entre en fase con la onda trasera de tal forma que el sonido se refuerce. Esto se
controla mediante la longitud de la línea o tubo para controlar los desfases dependiendo de
la frecuencia. A una fase o retardo determinado, la onda trasera refuerza el sonido de la
onda delantera. Esta configuración tiene muchas ventajas:
-
no existen resonancias por ondas estacionarias
-
la pendiente de atenuación es tan solo de 6dB/octava
-
genera poca distorsión para niveles SPL elevados
-
la respuesta temporal es buena
-
tiene buena respuesta en frecuencia para los bajos
La desventaja más notoria como se había indicado anteriormente es que la construcción
requiere de muchos materiales, además del tamaño de la caja que la hace poco
comercializable.
Ahora se hará una breve mirada a los materiales más comunmente utilizados en la
fabricación de cajas acústicas.
3.2.3 Materiales de las cajas
El material de las cajas es un parámetro importante pues influye directamente en la calidad
de la caja para la reproducción del sonido que genera el altavoz. Algunas características que
se tienen en cuenta en el material son la densidad, el grosor, y rigidez. Históricamente se
han utilizado solo una poca cantidad de materiales pero han dado buenos resultados. Estos
materiales son:
-
Aglomerado
-
MDF
-
Contrachapado
-
Madera
156
3.2.3.1 Aglomerado. El aglomerado es el material más económico de los mencionados. El
aglomerado no es muy sólido por lo que generalmente requiere algún tipo de refuerzo para
aumentar su rigidez. La rigidez aumenta con el grosor y los mejores aglomerados parten
desde 30mm de grosor. Una ventaja es que no hay resonancias marcadas como las que
existen cuando la caja es de MDF.
3.2.3.2 MDF. MDF está compuesto por fibras de madera pegadas de una manera especial.
La rigidez del MDF es superior a la del aglomerado. También tiene un buen índice de
absorción. Sin embargo, este material no es homogéneo ni lineal por lo que es susceptible a
resonancias cuando el sonido en una caja de MDF está en el rango de 200-400Hz. Estas
resonancias tienden a cancelar los sonidos de estas frecuencias (recordando el corto
acústico). Esto no es deseable pues esa banda de frecuencias le da mucho cuerpo al sonido
y son eliminadas por la resonancia que ocurre debido al material.
3.2.3.3 Contrachapado. El contrachapado es otro material de uso común para fabricar
cajas acústicas. Es poco absorbente y se curva muy fácil (poca rigidez).
3.2.3.4 Madera. La madera es un material cuyo comportamiento es difícil de predecir
debido a la cantidad de factores relacionados como: el tipo de madera, el grosor, contenido
de humedad, etc. La madera en general, posee menor coloración que la brindada por
materiales como el aglomerado o MDF. Sin embargo, las cajas de madera son de 3 a 10
veces más caras que las otras. También se deben utilizar muchos materiales absorbentes
pues el índice de absorción es bajo.
3.2.4 Impedancia de los altavoces
La impedancia que presenta a la entrada el altavoz brinda información sobre el tipo de
carga que este puede ofrecer, por ejemplo a un amplificador. La impedancia de un altavoz
157
depende de su tipo y de su forma constructiva. La configuración básica (para un altavoz
dinámico) depende de varios factores:
-
resistencia óhmica del hilo: El hilo en la cual está suspendida la bobina tiene una
resistencia dependiente del material, longitud y área de sección transversal.
-
reactancia de la bobina: La reactancia de la bobina es dependiente de la frecuencia y
del coeficiente de autoinducción (L). XL(reactancia)=L2πf
-
corrientes inducidas en la bobina: Debido a que la bobina se desplaza en un campo
magnético, se inducen corrientes en ella. Estas son difíciles de mantener constante y
alteran la impedancia.
Para una frecuencia de 1KHz, la impedancia de un altavoz dinámico varía entre 2 y 16
ohms.
Muy relacionado con la impedancia está la frecuencia de resonancia: la frecuencia natural
de vibración de la configuración cono-bobina. La frecuencia de resonancia depende tanto
del tamaño del diafragma como de la rigidez del mismo. Es inversamente proporcional al
tamaño del diafragma. Un diafragma rígido tiene una frecuencia de resonancia más elevada
que un diafragma suave. En este valor de frecuencia, la impedancia es máxima debido a
componentes reactivos en el altavoz.
Z
Zmáxima
Znominal
f resonancia
f (Hz)
Figura 91 Diagrama típico de impedancia de un altavoz
Las curvas de impedancia indican la reactancia que tiene el altavoz según la frecuencia de
operación. Estas presentan un pico que corresponde a la frecuencia de resonancia del
altavoz. Por encima de dicha frecuencia la impedancia decrece, llega a un mínimo, y luego
aumenta nuevamente. El mínimo de impedancia después de una resonancia se denomina
impedancia nominal. Esta impedancia nominal es utilizada para hacer los cálculos de
158
potencia pues donde se da el mínimo de impedancia corresponde a un tipo resistivo (donde
no hay desfase entre la tensión y la corriente).
La curva de impedancia se modifica cuando el altavoz se monta en una caja acústica debido
a la influencia del gabinete sobre las características mecánicas del altavoz (la frecuencia de
resonancia se modifica). Generalmente es deseable que la frecuencia de resonancia sea baja
para poder resaltar los tonos graves que son los más expuestos al efecto de cancelación por
corto acústico. También se busca que la curva de impedancia sea lo más plana posible
alrededor de la frecuencia de resonancia. Algunas veces se coloca más de un altavoz en una
misma caja lo que se traduce en una curva con varias frecuencias de resonancia (picos de
impedancia).
3.2.5 Parámetros de Thiele-Small
Esta sección está basada en los trabajos de Neville Thiele y Richard Small. Se busca un
modelo circuital para simular el comportamiento de los altavoces dinámicos. Para hacer
ésto, primero se analiza el comportamiento electromecánico de la bobina, el imán, el cono,
la suspensión y el aire. De la bobina se especifica su inductancia (capacidad de
almacenamiento de energía en forma de campo magnético), la resistencia en D.C:
(disipación de calor). El campo magnético del imán depende de su diámetro, el material
(generalmente Ferroxdure) y de la densidad de flujo proporcionado por él. La ecuación
resultante es equivalente a la ecuación de un sistema eléctrico, descrito mediante bobinas,
resistencias y condensadores. El sonido obtenido por el altavoz, la impedancia y la
frecuencia de resonancia se obtienen a partir de un análisis circuital. Además estos
parámetros se pueden modificar para obtener una respuesta en frecuencia deseada a partir
del diseño del altavoz.
Existen tres ecuaciones básicas:
-
La relación entre el movimiento de la bobina y el voltaje inducido por el imán(ley
de Faraday)
-
La ecuación para presión dentro de la caja
-
La relación entre las fuerzas y el movimiento de la configuración cono-suspensión
159
A partir de estas ecuaciones se obtiene un modelo circuital que pretende generalizar el
comportamiento de los altavoces con sus respectivas cajas acústicas, aunque, el circuito se
modifica dependiendo del tipo de caja (sellada, infinita, bass-reflex,etc.)
Uno de los parámetros más importantes es el factor Q. Q es el factor de amortiguamiento
del altavoz y tiene influencia en la respuesta de las bajas frecuencias del sistema. Este valor
depende de las características del altavoz y de la caja acústica. Q es el resultado de
considerar dos Q parciales: un Q considerando características eléctricas (bobina e imán)y
otro Q considerando características mecánicas (cono y suspensión). Es importante resaltar
que existe un valor de Q dependiendo del tipo de caja acústica (o la ausencia de ella).
Valores de Q cercanos a 1 indican que la respuesta se mantendrá plana hasta la frecuencia
de resonancia. Valores superiores a 1 indican un aumento de señal en la frecuencia de
resonancia y son causa de un mal amortiguamiento del altavoz. Un valor de Q cercano a 0.5
se considera óptimo para un sistema de alta fidelidad. Otros factores importantes son el
volumen de aire desplazado por el cono, las dimensiones del cono, masa de la
configuración y la elasticidad. A partir de estos valores se hace el modelo circuital
Figura 92 Ejemplo de un sistema eléctrico para modelar un altavoz con caja bass-reflex
Fuente: BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad Simón Bolívar, Departamento de
electrónica.1995.
No se entrará en detalle con todos los parámetros pues son muchos y son tema del diseño
específico de altavoces.
160
3.2.6 Sensibilidad
La sensibilidad está relacionada con el nivel de presión sonora que se puede obtener de la
caja acústica con una potencia dada. Se define como el nivel de presión sonora a 1m de
distancia cuando se aplica una potencia eléctrica de 1W. Sin embargo no es sencillo
determinar el nivel de presión sonora a distancias superiores a 1m pues entran en juego
tanto el campo directo(proveniente del bafle) como el campo reverberante (proveniente de
las reflexiones). La medición de sensibilidad se debe realizar en una cámara anecoica, un
recinto donde se han eliminado todos los ecos y reflexiones. Si no se tiene una cámara
anecoica, la medición se hace en un recinto donde se deben tener en cuenta la presión
sonora tanto del campo directo como del campo reverberante . Se puede estimar la
variación del nivel de presión sonora al pasar de una distancia de 1m a una distancia d
cualquiera en un ambiente reverberante mediante la siguiente fórmula:
Q
4
+
2
R
∆NPSdB=10log 4πd
Q
4π (1m) 2
R: constante acústica del recinto (dependiente del área y coeficiente de absorción
promedio)
Q: factor de directividad de la fuente (altavoz: para bajas frecuencias Q=1 y para altas
frecuencias Q>>1 dependiendo del ángulo de cobertura de la bocina)
Entonces, para calcular el nivel de presión sonora simplemente se suma el ∆NPS con la
sensibilidad:
NPSdB= SdB + ∆NPSdB
La sensibilidad es en general un dato del bafle (especificada a una distancia de 1m y 1W),
pero debe tenerse en cuenta que esa especificación es para una frecuencia o banda de
frecuencias. Nótese que si usamos la anterior fórmula para calcular la presión sonora a 1m
de distancia, predomina el campo directo sobre el reverberante y el NPS coincide con la
sensibilidad.
161
3.2.7 Respuesta en frecuencia
La curva de respuesta informa el comportamiento del altavoz en toda la gama de
frecuencias. Nos permite conocer la intensidad sonora proporcionada para las frecuencias
que se deben reproducir. Esto se realiza al especificar la variación de la presión acústica
radiada (dada en dB) a una frecuencia determinada, a una tensión constante y en una
determinada dirección. La curva de respuesta se toma en una cámara anecoica y se utiliza
un trazador de curvas.
Figura 93 Respuesta en frecuencia de tres altavoces para graves (“woofers”)
Fuente: SAKE, Rudy. s.l.:s.n. 2003
<www.bafflemania.com> [consulta: 20 Abr. 2005]
La respuesta en frecuencia del altavoz es irregular y varía dependiendo del número de
altavoces (en el caso de un altavoz integrado) y de la caja acústica utilizada. En el inicio de
la curva, encuentra un máximo correspondiente a la frecuencia de resonancia del diafragma
(generalmente de unos cientos de Hz) y luego oscila en mayor o menor grado hasta llegar a
la frecuencia de corte. Las oscilaciones carecen de importancia siempre y cuando no exista
una diferencia superior a 10dB entre pico y valle. En sistemas de alta fidelidad, se exige
que las diferencias sean menores a 5dB.
Las frecuencias de corte inferior y superior de la respuesta en frecuencia se ubican teniendo
el cuenta el criterio de 3dB. La banda de frecuencias considerada útil en un altavoz está
comprendida entre la frecuencia inferior y la frecuencia superior.
162
Una manera de especificar la respuesta en frecuencia es como rango de frecuencias:
35Hz a 18kHz, +/- 3dB
Por último, es importante anotar que una buena selección de caja acústica influye en el
desempeño del altavoz en la frecuencia.
3.2.8 Direccionalidad
La direccionalidad de un bafle es un parámetro importante que indica como varía la
sensibilidad del mismo dependiendo del ángulo de salida. Es decir, indica la dirección o
direcciones donde es enviada la energía. La sensibilidad fluctúa debido a fenómenos de
interferencia o cancelación entre las ondas provenientes de distintos puntos del diafragma.
También influye la interferencia de la caja acústica, especialmente notoria en altas
frecuencias . Todo lo anterior da origen a un patrón direccional que a su vez se divide en
dos: un diagrama (patrón) horizontal y un diagrama vertical debido a que los bafles no son
simétricos. El diagrama horizontal es simétrico mientras que el diagrama vertical es
asimétrico. Estos diagramas se realizan en una cámara anecoica.
200 Hz
1kHz
Figura 94 Patrón direccional de un altavoz en función de la frecuencia
Fuente: SAKE, Rudy. s.l.:s.n. 2003
<www.bafflemania.com> [consulta: 20 Abr. 2005]
163
La figura muestra que la direccionalidad es fuertemente dependiente de la frecuencia. A
frecuencias bajas, el altavoz se comporta aproximadamente omnidireccional. Esto debido a
que las ondas de baja frecuencia se refractan más fácilmente. En cambio, a frecuencias altas
el altavoz se comporta de manera muy direccional. Las cajas acústicas incorporan muchas
veces una bocina que incrementa la direccionalidad de la fuente.
Una bocina es un
elemento que permite acoplar dos medios con impedancias acústicas distintas para que se
de una propagación óptima de energía sonora.
Figura 95 Bocina que acopla dos medios a y b
El aire tiene menor impedancia acústica que el altavoz (diafragma). La función de la bocina
es acoplar los dos medios. La bocina que muestra la figura tiene forma exponencial. Esta
forma está demostrada que optimiza la propagación de las vibraciones provenientes del
diafragma hasta el contacto con el aire.
Un parámetro importante al hablar de direccionalidad es el ángulo de cobertura. Se suele
especificar el ángulo de cobertura o ancho de haz como el ángulo que puede cubrir un
altavoz con una caída de sensibilidad no mayor a 6dB. La capacidad que tiene un altavoz
para cubrir con sonido una determinada área se conoce como dispersión. (Se debe
especificar la banda de frecuencias para esta medida. Las bandas de frecuencia de medida
se han normalizado a los valores de las frecuencias centrales de las octavas: 125Hz, 250Hz,
500Hz, 1KHz, 2KHz, 4KHz, 8KHz y 16KHz). Este concepto es dual al de ángulo de
captura de un micrófono.
Otra especificación importante es el índice de directividad. El índice de directividad,
expresado en decibelios, es la razón de la intensidad acústica radiada (a una distancia
determinada) del altavoz en cuestión, a la intensidad acústica radiada a la misma distancia
164
del un altavoz omnidireccional. Se realizan generalmente dos medidas: uno en campo libre
y otra en campo difuso (reverberante).
3.2.9 Especificaciones de potencia
Existen varias formas de especificar la potencia, o mejor dicho, hay varias potencias por
especificar, cada una con distintas interpretaciones.
3.2.9.1 Potencia media máxima o potencia de régimen. Corresponde a la potencia
máxima que se puede aplicar al altavoz de forma continua. Determina la potencia máxima
que puede disipar la bobina (en forma de calor) sin que ésta se queme por exceso de
temperatura. A veces se encuentra como Potencia RMS, pero esto es incorrecto pues el
apelativo RMS solo tiene sentido para voltajes y corrientes (no para potencias).
3.2.9.2 Potencia de pico máximo o potencia admisible. Corresponde al valor máximo
instantáneo de potencia que puede aplicarse durante un tiempo muy corto. Este valor está
muy relacionado con otra limitación de los altavoces que es el máximo recorrido de la
bobina sin que se destruya el diafragma (esto se denomina desconado del altavoz). Esta
potencia es mayor que la potencia media máxima.
Estas dos anteriores son quizás las más importantes pero existen otras cuya medida es
importante para conocer el comportamiento de los altavoces a corto, mediano y largo plazo.
3.2.9.3 Potencia PMPO. Es una especificación de potencia común en equipos de consumo
como radiograbdadores o minicomponentes y representa una especie de valor pico durante
un tiempo extremadamente muy corto dando valores mayores a la de la potencia pico
máximo. Es importante aclarar que esta especificación es del parlante y no del amplificador
que lo alimenta, lo que puede dar falsas expectativas al comprar un equipo.
165
3.2.9.4 Potencia eléctrica a corto plazo (PMUS). Especifica el máximo valor de la
potencia con que puede trabajar el altavoz (sobre la impedancia nominal) sin que sufra
daños permanentes, cuando se le excita con una señal de prueba que simula el espectro
musical durante 1 segundo.
3.2.9.5 Potencia eléctrica a largo plazo (PNOM). Especifica el máximo valor de la
potencia con que puede trabajar el altavoz (sobre la impedancia nominal) sin que sufra
daños permanentes, cuando se le excita con una señal de prueba que simula el espectro
musical durante 1 minuto.
3.2.9.6 Potencia continua senoidal: Especifica el máximo valor de la potencia con que
puede trabajar el altavoz (sobre la impedancia nominal) sin que sufra daños permanentes
(mecánicos y/o térmicos), cuando se le excita con una señal senoidal continua en una
determinada banda de frecuencias.
3.2.9.7 Potencia de ruido: Especifica el máximo valor de la potencia con que puede
trabajar el altavoz (sobre la impedancia nominal) sin que sufra daños permanentes
(mecánicos y/o térmicos), cuando se le excita con una señal ruidosa en alguna banda del
espectro.
Un parámetro importante (y muy relacionado con la potencia) de los altavoces es la
eficiencia. La eficiencia es una medida del rendimiento de la transducción eléctricaacústica. Es la relación de la potencia acústica del altavoz y la potencia eléctrica necesaria
para ello:
Eficiencia =
Pacústica
x100%
Peléctrica
La eficiencia de un altavoz nunca supera el 50% y generalmente es menor al 10%. En
equipos domésticos (inclusive de alta calidad), la eficiencia es del orden de 0.5-1%.
Afortunadamente, no se requiere una potencia acústica elevada para obtener un elevado
volumen sonoro.
166
3.2.10 Distorsión armónica
Este parámetro es análogo a la distorsión armónica de los micrófonos. La distorsión
armónica se produce por la no linealidad del altavoz que hace que se introduzcan una
cantidad de armónicos que modifican la forma de onda (la distorsionan) de la señal. La
distorsión armónica se expresa de la siguiente manera:
THD=
f2 2 + f32 + ...fn 2
x100%
f12
donde f1 es el valor de presión acústica radiada a la frecuencia fundamental y f2,f3. . . son
los valores de presión acústica correspondientes a los distintos armónicos de la señal. La
distorsión armónica total es importante mantenerla debajo de cierto nivel (porcentaje) pues
influye en la calidad y la fidelidad del sonido a reproducir. En equipos de alta fidelidad, se
requiere que
TDH<0.5%
Para realizar la medida de la distorsión armónica total, se excita el altavoz con una señal
senoidal de frecuencia conocida. Después se capta con un micrófono y se analiza utilizando
un analizador de espectros para reconocer los armónicos. (El micrófono para esta medición
debe ser de excelente calidad porque si no, la distorsión armónica propia del micrófono
influye en la medida).
La distorsión armónica es un parámetro muy complejo porque la detección (por parte de un
ser humano) de la distorsión armónica (en una canción por ejemplo) depende de varios
factores como SPL, la distancia entre las componentes de frecuencia, el umbral de audición
individual, etc. Esto implica que leer la especificación de THD en un equipo de audio,
aunque da una idea general de la fidelidad del equipo, no predice el comportamiento
completo del equipo.
167
3.2.11 Clasificación de los altavoces (según el rango de frecuencias)
3.2.11.1 Altavoces para bajos(“woofers”). Estos altavoces están especialmente diseñados
para funcionar adecuadamente en bajas frecuencias. Esto se logra haciendo que la
frecuencia de resonancia sea muy baja. La frecuencia de resonancia es inversamente
proporcional al tamaño del diafragma. Esta frecuencia se debe ubicar alrededor de los 20Hz
e idealmente la curva de respuesta de frecuencia debe ser plana hasta el límite inferior de
las frecuencias vocales (alrededor de 100Hz). La frecuencia de corte se debe ubicar
alrededor de 4KHz. Para realizar ésto existen básicamente dos formas constructivas. Un
sistema consiste en colocar un anillo delgado que desacopla una parte del diafragma que se
encuentra alrededor de la bobina móvil con el fin de eliminar los tonos altos. Este sistema
no es muy utilizado en la actualidad. Un mejor sistema consiste de una bobina móvil de
diámetro grande y larga. El diafragma es pesado pero hecho de un material blando. Se
construye así porque la bobina (especialmente en bajas frecuencias) debe efectuar
excursiones que pueden sobrepasar los 20mm. Debido al tamaño de la bobina, el
entrehierro debe construirse aún más grande para que el campo magnético mantenga su
uniformidad para la reproducción fiel del sonido. Este diseño es complicado y por lo tanto
caro. Las frecuencias bajas son las frecuencias más delicadas y por eso la tecnología ha
dedicado mucho esfuerzo en mejorar los altavoces para bajos (comunmente llamados
“woofers”) y en el diseño de cajas acústicas (como “bass-reflex”) para mejorar aún más la
respuesta. Los “subwoofers” son altavoces especialmente diseñados para cubrir las
frecuencias más graves del espectro.
Figura 96 Altavoces para bajos “woofers”
Fuente: SAKE, Rudy. s.l.:s.n. 2003
<www.bafflemania.com> [consulta: 20 Abr. 2005]
168
3.2.11.2 Altavoces para medios (“squawkers”). Los altavoces para medios son
sumamente importantes pues reproducen la parte del espectro más incidente en las
canciones y en la voz. Se dice que el sonido de éstas frecuencias define el carácter de la
grabación pues el oído humano es muy sensible a este rango de frecuencias. La frecuencia
de resonancia debe ser no superior a 200Hz y la frecuencia de corte debe ser alrededor de
8KHz. Debido a la sensibilidad del oído a estas frecuencias, la distorsión debe mantenerse
en niveles muy bajos y por lo tanto el diseño de estos altavoces es muy delicado.
Figura 97 Altavoz para medios “squawker”
Fuente: SAKE, Rudy. s.l.:s.n. 2003
<www.bafflemania.com> [consulta: 20 Abr. 2005]
3.2.11.3 Altavoces para agudos(“tweeters”). Los altavoces para agudos tienen la función
de reproducir los sonidos más altos (mayor frecuencia) del espectro. El diafragma debe ser
pequeño pues las longitudes de onda de las señales a reproducir. La frecuencia de
resonancia de estos altavoces se sitúa alrededor de 2KHz y la frecuencia de corte mayor a
20KHz. Para mejorar el diseño, se suele agregar una bocina especial para alta frecuencia
llamada trompeta. Son hechas de un material rígido y mejoran la respuesta en
alta
frecuencia respecto a calidad y fidelidad. Las trompetas son caras y se pueden dañar si son
excitadas con una señal de baja frecuencia.
Los diversos altavoces discutidos anteriormente son utilizados conjuntamente pues es
deseable reproducir todo el espectro de la mejor forma posible.
Figura 98 Altavoz para agudos “tweeter”
Fuente: SAKE, Rudy. s.l.:s.n. 2003
<www.bafflemania.com> [consulta: 20 Abr. 2005]
169
3.2.12 Configuración y cuidado de los altavoces
Hay que tener en cuenta ciertas consideraciones cuando se maneja más de un altavoz :
-
Se deben utilizar filtros adecuados cuando se tienen altavoces con distintas
respuestas en frecuencia
-
No es recomendable una conexión en serie de un grupo de altavoces ya que los
voltajes transitorios son lo suficientemente altos como para provocar chispas en las
unidades impulsoras. Es preferible la conexión en paralelo.
-
Cuando se conectan solamente dos altavoces, la decisión de la conexión no es tan
fundamental. Se debe tener en cuenta que en la conexión en serie, las impedancias
de las bobinas se suman mientras que en paralelo se divide a la mitad (asumiendo
altavoces idénticos)
-
Cuando se operan altavoces múltiples es importante que se encuentren en fase para
evitar interferencia destructiva y cancelación parcial. Esto depende de la dirección
de movimiento de los conos y de la corriente que genera la fuerza sobre la bobina.
-
Se debe tener cuidado al operar los altavoces pues éstos se pueden deteriorar debido
a fallas térmicas y/o mecánicas. Las fallas térmicas se pueden dar debido a:
exceso de potencia de entrada, señales fuera de la banda de frecuencias a la que está
diseñada reproducir el altavoz (la energía que no se convierte en sonido y se
convierte en calor), y excesiva ecualización de agudos, pues en estas frecuencias la
eficiencia es muy baja y se necesita mucha potencia eléctrica para generar una
potencia acústica suficiente.
-
Las causas de fallas mecánicas son debido a la excesiva excursión del altavoz
(diafragma y bobina). El altavoz tiene más excursión a medida que la frecuencia sea
más baja. Una señal con la frecuencia suficientemente baja y con un nivel SPL
suficientemente alto, es capaz de sacar a la bobina del entrehierro resultando en
daños algunas veces irreversibles. Para evitar esta condición, no se deben utilizar
señales por debajo de la especificación de la configuración altavoz-caja acústica y
se debe utilizar un amplificador de potencia adecuado.
170
3.3 AMPLIFICADORES
Un amplificador es un dispositivo o circuito con la capacidad de aumentar la magnitud o
nivel de potencia de una señal variable en el tiempo sin distorsionar la forma de la onda.
Esto es necesario para poder obtener un nivel de intensidad sonora suficiente para que el
contenido acústico (voz, música,etc.) llegue de igual forma a los oyentes en un recinto o un
auditorio por ejemplo. El amplificador es el primer bloque procesador de señal puramente
eléctrico y precede al altavoz en la cadena de audio. Se puede hacer una clasificación de los
amplificadores de acuerdo a:
-
configuración
-
aplicación
-
el ancho de banda y el rango de frecuencias a amplificar
En esta sección se analizarán amplificadores para aplicaciones de audio hechos a partir de
transistores y/o tubos de vacío para amplificar frecuencias del espectro audible (20Hz hasta
20kHz).
3.3.1 Amplificadores con transistores y con tubos de vacío
La estructura o configuración de un amplificador depende de la utilización de transistores o
tubos al vacío para su operación. Los transistores son dispositivos semiconductores de tres
terminales. Son componentes electrónicos muy importantes debido a las numerosas
aplicaciones de las cuales se destaca la amplificación de señales. Los transistores se dividen
básicamente en dos tipos:
•
BJT (transistores de unión bipolar): Son dispositivos formado por tres bloques de
material semiconductor dopado. Puede ser material P(material dopado con
impurezas para facilitar la conducción por medio de “huecos”) y/o material
N(material dopado con impurezas para facilitar la conducción por medio de
171
electrones). Existen dos tipos: NPN y PNP y las terminales se denominan base,
colector y emisor.
•
FET (transistores de efecto de campo): En el FET existen tres terminales llamadas
drain, source y gate. Source y drain son los puntos extremos del canal que es una
trayectoria dentro del semiconductor. La conductividad del canal es controlada por
el voltaje aplicado en el gate. Un pequeño cambio en el voltaje de control en el gate
se traduce en una variación grande de corriente en el canal. De esta forma, el FET
puede amplificar las señales.
Existen en dos clasificaciones para los FETs: JFET (FET de unión) y MOSFET(FET con
metal y óxido de silicio.
Figura 99 Transistor BJT
Fuente: TERRY, William. Audilab. s.l.:s.n. 1999.
www.audilab.bmed.mcgill.ca [consulta: 10 May. 2005]
Un tubo de vacío consiste en una cápsula de vidrio que se la extraído el aire con varios
electrodos metálicos dentro. Existen tubos de dos terminales (díodos) y de tres terminales
(tríodos). Estos últimos, formados por ánodo, cátodo y rejilla, son los utilizados para la
amplificación de señales.
Figura 100 Tubo de vacío
Fuente: TERRY, William. Audilab. s.l.:s.n. 1999.
www.audilab.bmed.mcgill.ca [consulta: 10 May. 2005]
172
La utilización de transistores o tubos al vacío depende de la aplicación específica. Se
anotarán las ventajas y desventajas de cada uno a continuación:
Ventajas de utilizar transistores
•
son más económicos
•
brindan mayor confiabilidad
•
los amplificadores a base de transistores son más pequeños consumen menos
potencia y disipan menos calor
Desventajas de utilizar transistores
•
al reproducir se oye muy opaco; sin cuerpo
•
tienen mayor distorsión armónica
Ventajas de utilizar tubos al vacío
•
la calidad del sonido es superior
•
se escucha con mayor fidelidad toda la gama de frecuencias se pueden utilizar para
salidas de alta potencia en equipos de audio
Desventajas de utilizar tubos al vacío
•
los amplificadores a base de tubos al vacío son muy grandes
•
consumen mucha potencia y emiten mucho calor
•
brindan menor confiabilidad
•
no son económicos
Las características de los transistores y de los tubos al vacío son complementarias y la
elección depende de varios factores como exigencia de calidad, presupuesto, y uso.
173
3.3.2 Características generales de los amplificadores
Existen diversas características comunes a todos los amplificadores que se discutirán a
continuación.
3.3.2.1 Ganancia. La ganancia, también llamada amplificación, es el cociente entre la
tensión de salida y la de entrada:
G=
Vsalida
Ventrada
La señal que se quiere amplificar se aplica a la entrada entre dos terminales del
amplificador y la señal de salida se obtiene entre otras dos terminales del amplificador. Para
esta definición se tomaron como referencia el voltaje de salida y el de entrada pero se puede
definir ganancia para corrientes. La ganancia comunmente se expresa en decibeles:
GdB=20logG=20log
Vsalida
Ventrada
En un amplificador ideal, la onda resultante (señal de salida) no se ve afectada en su forma;
unicamente en su amplitud. Cuando la forma de onda se conserva y no hay distorsiones, se
dice que el amplificador tiene un comportamiento lineal. De lo contrario, la onda se
distorsiona (cambia de forma).
3.3.2.2 Nivel de señal. Los amplificadores manejan distintos tipos de señales de acuerdo a
su nivel de señal. Existen tres niveles de señal característicos: bajo nivel, nivel de línea, y
nivel de potencia. La señales de bajo nivel son señales de baja potencia producida por un
micrófono por ejemplo, en el proceso de transducción. También pueden provenir de los
fonocaptores para los discos de vinilo. Las señales de nivel de línea son el resultado de
aplicar una etapa de preamplificación a señales de bajo nivel. También son las señales que
producen distintos equipos como casseteras, reproductores de CD (compact disc),
174
instrumentos electrónicos, etc. Este nivel es el nivel que manejan las entradas y salidas de
las consolas de mezcla. El nivel de potencia es el nivel requerido para excitar los altavoces.
Para cuantificar los valores de potencia (o tensión) de estos niveles es necesario introducir
unos nuevos tipos de decibeles que no se habían discutido. Estos decibeles representan una
variable física y por lo tanto necesitan un valor de referencia. Un ejemplo ya conocido es el
de nivel de presión sonora (NPS) cuyo valor de referencia es de 20µPa. En audio se utilizan
otros tres decibeles referenciados: dBm , dBu , dBV.
El dBm permite expresar el nivel de potencia eléctrica referenciado a una potencia de 1mW.
P
)
1mW
N dBm=10log(
donde P es la potencia eléctrica
Por ejemplo, una potencia de 1W corresponde a 30 dBm
El dBu permite expresar el nivel de tensión referenciado a una tensión de 0.775V.
N dBu=20log(
T
)
0.775V
donde T es la tensión eléctrica
El valor de referencia de 0.775V se debe a que con este voltaje se disipa una potencia de
1mW (0 dBm) sobre una resistencia de 600ohms (P =V2/R). Este valor de resistencia es un
valor normalizado que corresponde al valor de impedancia de una línea telefónica clásica.
El dBV permite expresar un nivel de tensión referenciado a una tensión de 1V
N dBu=20log(
T
)
1V
donde T es la tensión eléctrica
Debido a que tanto dBu como dBV expresan relaciones entre tensiones, existe una relación
básica que las relaciona a ambas.
N dBu= N dBV +2.2dB
Recuérdese dos cosas muy importantes acerca de decibeles:
175
•
se utiliza 10log( . . .) cuando se trata de relaciones de potencias y 20log( . . .) cuando
se trata de relaciones de tensiones
•
un valor de 0dB no significa ausencia de señal sino que ésta coincide con el valor de
referencia
Ahora se puede dar mayor precisión a los tres niveles de señal. En audio se utiliza como
criterio los dBu
•
las señales de bajo nivel son las que tienen un nivel de tensión inferior a –40dBu
(valores de tensión menores de 7.75mV
•
las señales de nivel de línea son las que tienen niveles de tensión comprendidos
entre -10 dBu y 30 dBu (tensiones entre 245mV y 24.5V)
•
las señales de nivel de potencia son niveles de tensión superior a 30 dBu (tensiones
superiores a 24.5V)
Los amplificadores se pueden clasificar según la señal que pueden manejar: los
preamplificadores y amplificadores de potencia. Los preamplificadores tienen como
finalidad llevar las señales de bajo nivel a nivel de línea. Los amplificadores de potencia
reciben la señal a nivel de línea y la amplifica hasta el nivel de potencia.
Nivel de
Línea
Bajo Nivel
Preamplificador
Nivel de Potencia
Amplificador de
Potencia
Figura 101 Esquema de pre-amplificación y amplificación
3.3.2.3. Potencia de salida. Existen varias formas de especificar la potencia de salida del
amplificador.
3.3.2.3.1 Potencia continua. Esta se refiere a la potencia media que puede entregar de
forma continua el amplificador a una carga, normalmente un altavoz. Para que esta
especificación esté completa se debe incluir el rango de frecuencias en la cual es válida el
176
dato de potencia además de la impedancia del altavoz (la carga). Esta potencia también se
le denomina Potencia RMS, pero recordemos que no es correcto denominar a una potencia
RMS pues ésto es característico únicamente de tensiones y/o corrientes.
3.3.2.3.2 Potencia musical (“musical power”). Esta especificación es una medida de la
potencia máxima que puede entregar el amplificador en impulsos breves. Por lo tanto, este
valor es superior al valor de potencia continua. El valor de la potencia musical indica la
facilidad que tiene el amplificador para dar picos de volumen en breves períodos de tiempo.
Existen otras especificaciones de potencia: de cresta, instantánea, de pico, etc. que en
realidad no informan sobre el comportamiento del amplificador pues son datos aislados que
incluyen información acerca de la carga, frecuencias y distorsiones.
3.3.2.4 Nivel de saturación de entrada. Es un dato que define en gran medida la calidad
del amplificador al que se refiere. Indica cual es el máximo nivel de señal que puede
admitir la entrada del amplificador sin que exista saturación, es decir, sin recortar la señal.
Está dado en voltios o en dBV.
3.3.2.5 Sensibilidad. La sensibilidad es otro parámetro de gran importancia en un
amplificador y se define como el valor de la tensión de entrada necesaria para producir la
máxima potencia. Se puede especificar tanto en voltios como en dBV (o dBu). Por ejemplo,
si se tiene un amplificador de 200W sobre una carga de 4ohms con una sensibilidad de
1.5V se puede calcular la ganancia del amplificador:
V2/R=200W implica que el voltaje de salida es: 28.2 voltios. Debido a que la sensibilidad
es la tensión de entrada necesaria para producir la máxima potencia, se tiene que:
G=28,2V/1.5V=18.8 o
GdB=20logG=26dB
3.3.2.6 Relación Señal a Ruido. La relación señal a ruido (S/R) es el cociente entre
determinado valor de la señal y valor del ruido propio del amplificador:
177
S/R=Vseñal/Vruido
S/RdB=20logS/R
La relación señal a ruido es distinta según sea la potencia que esté entregando el
amplificador. Normalmente, se supone que la señal respecto a la cual se especifica S/R es la
máxima señal; la que proporciona la máxima potencia. Supóngase que se tiene un
amplificador con una potencia de 200W (máxima) con una S/RdB= 90dB. Se quiere saber
cuanta es S/RdB del amplificador cuando este entregue solamente 100W. Teniendo en
cuenta que la potencia es cuadrática con la tensión, si la potencia se reduce a la mitad, la
tensión se reducirá en (2)1/2. Esto en decibeles es:
20log(2)1/2= 3dB
Si la tensión se reduce en 3dB, también lo hará la S/RdB obteniendo:
S/RdB (100w)=90dB-3dB=87dB
Este ejemplo confirma que en un mismo amplificador se pueden tener distintos valores de
S/RdB según la potencia que esté entregando.
3.3.2.7 Rango dinámico. El rango dinámico se define como la diferencia en dB entre el
máximo y mínimo nivel de salida. El mínimo nivel normalmente es el nivel asociado a
algún tipo de ruido sea del generador de la señal (micrófono, cassettera,etc.) o el ruido del
ambiente. El criterio de selección de un amplificador es que su S/R sea superior al rango
dinámico de la señal a amplificar, para el nivel de salida al que va a funcionar.
3.3.2.8 Respuesta en frecuencia. La respuesta en frecuencia de los amplificadores indica
la variación de la ganancia con la frecuencia. La ganancia usualmente se da en dB. La
especificación de la respuesta en frecuencia se puede dar de dos maneras. La primera, es un
gráfico donde se muestra el comportamiento de la ganancia en función de la frecuencia. La
segunda forma es dar los límites inferior y superior con una tolerancia, por ejemplo:
178
20Hz a 20kHz, +/-0.5dB
Esto significa que la respuesta estará dentro del rango 20Hz-20kHz con una tolerancia a lo
sumo de 0.5dB hacia arriba y 0.5dB hacia abajo de su valor nominal. El valor nominal es
un valor de ganancia especificado o deducido de otras especificaciones. Es claro que el
método gráfico brinda más información pero dar el rango y la tolerancia es más sencillo y
muchas veces es suficiente para seleccionar un amplificador. Además de la respuesta en
frecuencia, se debe incluir la potencia a la cual se realizó la medida ya que a grandes
niveles (de potencia) la respuesta en frecuencia empeora. Normalmente se utiliza la
potencia máxima (la peor) para caracterizar la respuesta. .
La respuesta en frecuencia de los amplificadores de audio suele ser muy plana y cubren
ampliamente el espectro audible.
3.3.2.9 Distorsión. La distorsión en general es la deformación de la señal al atravesar algún
elemento procesador de la señal, en este caso el amplificador. Existen diversos tipos de
distorsiones dependiendo de que manera se ve deformada la señal.
3.3.2.9.1 Distorsión de fase. Esta distorsión se produce cuando las señales de salida sufren
retardos o adelantos en fase con la señal original. Esto es debido a componentes reactivos
presentes en el amplificador (bobinas, condensadores).
3.3.2.9.2 Distorsión de frecuencia. Esta distorsión se produce cuando las señales de salida
no guardan la misma relación en frecuencia que las de entrada. Esta distorsión también es
consecuencia de la presencia de componentes reactivos en el amplificador.
3.3.2.9.3 Distorsión de amplitud. Se produce cuando la ganancia no es igual para todas la
amplitudes de la forma de onda de la señal de entrada.
3.3.2.9.4 Distorsión de cruce por cero. Este tipo de distorsión ocurre únicamente en
amplificadores clase B y clase AB (aunque en estos últimos en menor proporción). En los
amplificadores clase B existen dos transistores complementarios: mientras uno está activo
179
(polarizado) el otro está apagado y viceversa. Cuando la señal cruza por cero, existe un
tiempo en el cual ninguno de los transistores está polarizado y la señal se distorsiona.
3.3.2.9.5 Distorsión Armónica Total (THD): Este tipo de distorsión, al igual que en
micrófonos y altavoces, se manifiesta como la aparición de nuevos armónicos a la señal que
no estaban presentes y fueron añadidos a la señal por la no linealidad del amplificador. La
proporción que representan todos estos armónicos frente a la señal pura (en la entrada) se
denominada THD y se expresa en %. La distorsión armónica depende tanto de la frecuencia
de la señal como de la potencia de salida del amplificador. Generalmente la THD aumenta
al aumentar la potencia y la frecuencia.
Los amplificadores con relación a los altavoces tienen una distorsión armónica muy baja,
pero debido al efecto acumulativo de la distorsión se debe tratar que cada elemento de la
cadena de audio aporte la mínima posible. Valores por debajo de 0.1%
pueden
considerarse buenos y por debajo de 0.01% se consideran excelentes y aptos para el sonido
profesional.
3.3.2.9.6 Distorsión por intermodulación (IMD). La distorsión por intermodulación se
origina en la interferencia mutua que se produce entre dos tonos de diferente frecuencia
sumados en un mismo canal. Cuando se aplica a la entrada de un amplificador dos señales
de frecuencias distintas, aparecen unas nuevas señales que resultan de la suma y diferencia
de los armónicos de las señales originales. Es decir, si se aplica una señal de frecuencia f1 y
una señal de frecuencia f2 aparecen a la salida del amplificador las frecuencias nf1+/-mf2
(donde m y n son números enteros). La amplitud de cada una de estas frecuencias (o el
hecho de que cada una esté presente) depende de cada amplificador. La distorsión por
intermodulación tiende a ser más nociva para un sistema de sonido que la distorsión total
armónica. Esto debido a que la distorsión por intermodulación introduce sonidos que no
están armónicamente relacionados con ninguno de los sonidos originales produciendo un
efecto desagradable para el oído. La mayoría de los amplificadores actuales tiene valores
de IMD menores al 0.1%
180
3.3.2.10 Realimentación negativa. La realimentación negativa es el proceso en el cual la
señal de salida se reinyecta a la señal de entrada pero en fase opuesta (negativa). Este
proceso es utilizado en varios sistemas físicos y es de particular importancia en los
amplificadores pues:
-
ayuda a reducir la distorsión por intermodulación
-
hace que la ganancia sea menos sensible a parámetros que son difíciles de controlar
y variables con la temperatura
Sin embargo la realimentación negativa tiene algunas desventajas:
-
puede comprometer la calidad del sonido al producir distorsión por las diferencias
temporales entre la señal original y la señal de salida reinyectada.
-
la ganancia global disminuye
3.3.2.11 Impedancia de entrada. La impedancia de entrada es la impedancia que se mide
externamente en los terminales de entrada. Esta es una especificación muy importante
porque indica cual es la tensión efectiva aplicada al amplificador. Esto se puede ver en el
siguiente modelo circuital de la conexión entre un generador de señal (por ejemplo un
micrófono) y un amplificador:
Zseñal
Vseñal
Zentrada
+
Vamp
Figura 102 Modelo circuital de conexión entre un generador y un amplificador
Se puede plantear la ecuación del divisor de tensión para obtener la tensión efectiva
aplicada al amplificador:
Vamp=
Zentrada
Vseñal
Zentrada + Zseñal
181
Conviene por lo tanto que la Zentrada sea lo más grande posible relativa a la impedancia de
la señal para que haya una mínima reducción de la tensión aplicada al amplificador.
Típicamente la impedancia de entrada de los amplificadores está en el rango entre 10kΩ y
50kΩ. La impedancia de las consolas (Zseñal) es de algunos cientos de Ω por lo que la
reducción de la señal es del orden del 5% (0.5dB) la cual no es muy significativa. En
amplificadores con entradas balanceadas se especifican dos valores de impedancia: una
correspondiente a entradas balanceadas y otro correspondiente a entradas no balanceadas.
3.3.2.12 Factor de amortiguamiento. Los amplificadores tienen una impedancia de salida
(interna) que depende de la construcción del amplificador. Esta impedancia de salida no
debe confundirse con la impedancia nominal de carga que será conectada a la salida del
amplificador, generalmente un altavoz. La impedancia de salida de un amplificador es muy
baja (menor a 1ohm) mientras que la impedancia de un altavoz está comprendida entre 4 y
16 ohms. El factor de amortiguación relaciona la impedancia nominal de carga y la
impedancia real de salida. Por ejemplo, un amplificador que le entrega potencia a una carga
de 4ohms y cuya impedancia de salida es de 0.04ohms posee un factor de amortiguación de
F.A.=
4ohms
=100
0.04ohms
Son considerados aceptables valores superiores a 4 pero los factores de amortiguación de
los amplificadores actuales pueden superar a 100. Es deseable un amplificador con un
factor de amortiguación alto para lograr que la impedancia del altavoz no modifique
significativamente la tensión real sobre él.
3.3.2.13 Separación entre canales o diafonía (“crosstalk”). Existe diafonía cuando al
aplicar señal a uno sólo de los canales se observa la señal de salida en el canal contrario. Es
una medida que indica la separación real existente entre los dos canales de un sistema
estereofónico. La diferencia de niveles (en dB) es la separación entre canales. Valores
superiores a 60dB son recomendados para un óptimo funcionamiento. Una correcta
182
especificación de la separación de canales requiere que se indique a que frecuencia se hizo
la medición (en general se utiliza 1kHz).
3.3.3 Preamplificadores
La función principal de los preamplificadores es la de llevar la señal de bajo nivel a nivel
de línea. Los preamplificadores normalmente vienen incorporados en las consolas o
equipos generadores de señal. Mientras la señal recorre ese camino sufre distintas
transformaciones en cuanto a nivel absoluto, nivel de las señales de unas frecuencias con
respecto a otras, volumen, balance, etc. Los preamplificadores además de llevar la señal de
bajo nivel a nivel de línea tiene otras funciones y se subdivide en varias partes.
3.3.3.1 Selector de entradas. Existen diversas fuentes de señal en un sistema de audio
como lo son: micrófonos, sintonizadores, magnetófono, etc. y éstas confluyen directamente
en el selector de entradas. La función del selector de entradas es de dejar pasar solo una de
estas señales(o algunas en el caso de los mezcladores) hacia el resto del sistema. .
3.3.3.2 Conformador de señal. Un conformador de señal es un dispositivo destinado a
variar la señal original en alguno o algunos de sus parámetros. Esto se hace tanto para
suprimir efectos molestos como para atenuar los deseados. El conformador a su vez se
divide en: controles de tono, compensador, filtros, control de volumen y balance
3.3.3.2.1 Controles de tono. Los controles de tono permiten compensar los posibles
desequilibrios existentes entre los diversos elementos del sistema, la deficiencia acústica en
recintos de grabación, corregir errores de grabación o simplemente adaptar el sonido
resultante al gusto particular de cada oyente. La tendencia normal debe ser que el conjunto
del sistema de una respuesta frecuencial plana. Esto se hace mediante unos controles que
varían el nivel (en dB)en una banda de frecuencia específica (un control por cada banda).
183
Los valores típicos de variación son de –10dB (atenuación máxima) hasta 10dB
(amplificación máxima). Si el número de controles es pequeño (menor a cinco) se hablará
de controles de tono pero si el número es mayor, se hablará de ecualizadores.
3.3.3.2.2 Compensador. Como se vio anteriormente en la sección de psicoacústica, el oído
no responde igual a todas las frecuencias. Es más fácil dada una intensidad sonora, escuchar
los tonos medios que los agudos y mucho más difícil, los graves. (Esto se puede verificar
analizando las curvas de Fletcher y Munson). Para compensar este efecto, la mayoría de los
amplificadores
disponen
de
un
mando
llamado
compensador
que
amplifica
automaticamente las frecuencias graves y agudas manteniendo constante las frecuencias
medias. La actuación de un compensador depende de muchos factores como el NPS, la
sensibilidad de los altoparlantes, la calidad acústica del recinto, etc.
3.3.3.2.3 Filtros. Los filtros son dispositivos utilizados para eliminar o atenuar una
determinada gama de frecuencias. Esto en principio parecería comprometer la calidad y
fidelidad del audio a reproducir. El uso de filtros se justifica para eliminar efectos molestos
para el oído. El filtro subsónico suprime las frecuencias debajo de 20Hz y por lo tanto no
afecta el contenido que el oído puede detectar (20Hz es el umbral de audición). Estas
frecuencias, sin embargo pueden sobrecargar al amplificador como al altoparlante,
generadas por el motor de un giradiscos o alguna resonancia. El filtro de graves trabaja en
un rango de frecuencias un poco más alto, alrededor de los 50 o 60Hz . Afecta el contenido
sonoro
que el oído puede detectar, pero esto no es demasiado grave pues pocos
instrumentos y personas son capaz de generarlas y altavoces para reproducirlos. Este filtro
elimina el ruido de la red eléctrica que se puede filtrar por inducción. Un último tipo de
filtro, el filtro de agudos, trabaja sobre frecuencias superiores a 10kHz y suprime ruidos
molestos como soplidos, sonido de rayado en un disco, etc. Aunque estos filtros si
deforman la onda (y su contenido), es preferible utilizarlo para eliminar ruidos molestos. En
todos los casos, se requiere que la pendiente de actuación del filtro sea muy pronunciada
para obtener la cancelación del efecto.
184
3.3.3.2.4 Control de volumen. El control de volumen permite la obtención del nivel de
escucha deseado por el oyente. También permite calibrar con alguna exactitud el nivel de
señal de entrada al amplificador(de potencia). Suele calibrarse de 0 a 10. (0 corresponde a
la potencia mínima y 10 corresponde a la potencia máxima). No es aconsejable trabajar a la
potencia máxima pues el amplificador se saturará recortando la señal de salida resultando
en una degradación notoria del sonido. Algunos amplificadores incorporan junto al control
de volumen un limitador de volumen. El limitador impone un límite en la cantidad de
potencia que pueda entregar el control de volumen. Es útil para proteger pantallas acústicas
que no puedan soportar el nivel máximo de potencia del preamplificador. Aunque
accidentalmente se lleve el mando del volumen al máximo, el amplificador estará limitado
en potencia evitando el riesgo de averiar las pantallas. También es común encontrar en
junto al control de volumen un silenciador. El silenciador permite reducir el nivel de salida
en un valor fijo (generalmente 20dB) instantáneamente y recuperar nuevamente el nivel sin
actuar sobre el control de volumen. Esto es útil cuando se requiera atender una
conversación por ejemplo durante un intervalo de tiempo, y posteriormente recuperar el
nivel original.
3.3.3.2.5 Balance. En un sistema estereofónico existen dos canales. Aunque las potencias
por ambos canales fueran idénticas, es posible escuchar de distinta forma el sonido de
salida de los canales por diversos factores, que incluyen: la posición de los parlantes, la
situación de los oyentes y las características acústicas del recinto. Para corregir o
compensar este efecto, se dispone de un mando (balance) para atenuar la señal de uno de
los canales y así la señal resultante se desvía más hacia una canal que otro. Esto es
equivalente a tener un mando de volumen para cada canal.
3.3.4 Amplificadores de potencia.
La tensión entregada por el preamplificador (nivel de línea) debe ser amplificada para
conseguir la potencia necesaria para lograr el funcionamiento adecuado de los altavoces.
185
Los amplificadores de potencia se pueden clasificar de acuerdo al ángulo de conducción, es
decir, el intervalo de tiempo que están funcionando los elementos activos que conforman el
circuito del amplificador (transistores o tubos). Dependiendo de este ángulo de conducción,
se hacen conclusiones respecto a la potencia utilizada y al funcionamiento.
3.3.4.1 Amplificadores clase A. En el amplificador clase A el dispositivo (transistor o
tubo) conduce todo e l periodo de la señal. Es decir, el dispositivo está activo (conduciendo
y amplificando) todo el tiempo que dura la señal de entrada. La eficiencia de potencia de un
amplificador está dada por:
η=Palterna/Pcc
Esta cuantifica que tanta potencia de señal puede generar a partir de la potencia de la fuente
de alimentación. En estos amplificadores la eficiencia de potencia no es muy buena. En el
mejor de los casos es del orden de 50%. En estos amplificadores se desperdicia mucha
potencia pero compensa con que el sonido carece de distorsiones.
3.3.4.2 Amplificadores clase B. En el amplificador clase B el dispositivo conduce
unicamente mitad del ciclo. Por esta razón se deben utilizar dos transistores (o tubos)
idénticos que trabajen de manera complementaria (push-pull). Un transistor conduce (está
activo) en una mitad del ciclo y se ocupa del semiciclo positivo de la onda mientras que el
otro transistor conduce mientras el semiciclo negativo de la señal. Con esta configuración
se puede lograr una eficiencia de hasta 78.5% superando de esta forma al amplificador
clase A. Sin embargo, debido a que se utilizan dos transistores, existe un tiempo “muerto”
en el cual ninguno de los dos está activo pues la polarización debe superar el Vce de aprox
0.5 V. Esto se traduce en un tipo de distorsión llamada “crossover” o de cruce por cero.
Esto añade armónicos indeseados a la señal y la forma de onda se ve distorsionada.
3.3.4.3 Amplificadores clase AB. El amplificador clase AB es un intermedio entre los dos
amplificadores ya mencionados. Utiliza al igual que en el amplificador clase B dos
transistores. Cada transistor de salida trabaja con más del 50% de la señal pero sin
186
amplificarla entera. Para obtener la señal entera se disponen de dos transistores
complementarios que suman sus señales y restituyen la señal original. Con esta
configuración se suman las ventajas de cada amplificador (clase A y clase B): mayor
eficiencia de potencia que en clase A y menor distorsión que en clase B.
3.3.4.4 Amplificadores con muestreo digital. Estos utilizan modulación de pulsos
conmutados a una frecuencia ultrasónica. Es decir, modulan el ancho de una señal cuadrada
de alta frecuencia (portadora) para reproducir la señal de audio. Con este tipo de
amplificadores se pueden lograr altas potencias de salida con mínima disipación térmica.
La distorsión es relativamente baja. El mayor inconveniente es de carácter constructivo y
que no son muy económicos. Aparte de esto, estos amplificadores muestran unas ventajas
suficientes para tenerlos en cuenta en equipos de alta fidelidad.
3.3.5 Multiamplificación.
La multiamplificación es una técnica en la cual cada altavoz (en un sistema de varios
altavoces) está manejada por una etapa de potencia (amplificación) individual. Para lograr
ésto, se debe dividir la frecuencia mediante filtros antes de ser amplificada la señal de
excitación de los altavoces. Aunque puede ser dispendioso utilizar muchos amplificadores
(especialmente por el tamaño y el precio), ésto trae consigo muchas ventajas como:
-
mayor potencia
-
mayor eficiencia
-
mayor factor de amortiguación
-
menor distorsión
-
posibilidad de conexión óptima de varios altavoces
187
3.4 FILTROS Y ECUALIZADORES
Los filtros son dispositivos que modifican el contenido espectral de la señal. Están
diseñados para atenuar o eliminar ciertos componentes del sonido (intensidad sonora) en
función de la frecuencia. La utilización de filtros en los sistemas de audio es muy
importante ya que son muchas las situaciones en las cuales se requiere acentuar o atenuar
determinadas frecuencias. Aparecen filtros a la entrada de los amplificadores para evitar la
presencia de señales de muy baja o muy alta frecuencia que, sin ser útiles, son ruido para el
sistema. También aparecen filtros para separar la señal en sus componentes espectrales de
baja, media y alta frecuencia para sistemas acústicos de múltiples altavoces. Por último, una
gran aplicación de los filtros se encuentra en los ecualizadores: dispositivos que permiten
corregir deficiencias en la respuesta en frecuencia en un sistema.
3.4.1 Filtros análogos (o analógicos)
Un filtro análogo es un sistema determinístico (bloque de proceso) que modifica el
contenido espectral de una señal en el dominio continuo del tiempo. Los filtros análogos a
su vez se dividen en filtros pasivos y filtros activos.
3.4.1.1 Filtros pasivos. Los filtros pasivos utilizan condensadores, bobinas y resistencias
(elementos pasivos) para su funcionamiento. No requieren de fuente de alimentación.
3.4.1.2 Filtros activos. Los filtros activos utilizan amplificadores operacionales (elemento
activo) condensadores y resistencias. Los filtros activos tienen dos ventajas sobre los filtros
pasivos:
-
amplifican y filtran en una sola etapa
-
se pueden conectar varios en cascada
A diferencia de los filtros pasivos, los filtros activos al contener un amplificador requieren
una fuente de alimentación.
188
3.4.2 Clasificación según su banda de operación
Los filtros también se pueden clasificar según su banda (de frecuencia) de operación en:
3.4.2.1 Filtros pasabajo. Los filtros pasabajo son filtros que únicamente dejan pasar
frecuencias desde 0Hz hasta una frecuencia denominada frecuencia superior de corte del
filtro. Frecuencias superiores a esta frecuencia son atenuadas o eliminadas en el caso ideal.
Los filtros pasabajos reales no bloquean totalmente las altas frecuencias sino que las
atenúan a razón de cierta cantidad de dB por octava. Los valores típicos de atenuaciones
son –6dB/octava, -12dB/octava y –18dB/octava. La frecuencia de corte (superior) de un
filtro pasabajo varía entre 3kHz y 20kHz.
3.4.2.2 Filtros pasaalto. Los filtros pasaalto por oposición a los filtros pasabajo bloquean
(atenúan) las frecuencias por debajo de una frecuencia denominada frecuencia inferior de
corte, dejando pasar inalteradas las frecuencias superiores. Los valores típicos de
atenuaciones al igual que en los filtros pasabajo son –6dB/octava, -12dB/octava y –
18dB/octava. La frecuencia de corte (inferior) de un filtro pasabajo varía entre 20Hz y
100Hz.
3.4.2.3 Filtros pasabanda. Un filtro pasabanda es un filtro diseñado para permitir que una
banda de frecuencias pase a través del filtro inalterada mientras que frecuencias fuera de
esa banda son bloqueadas. La banda de frecuencias está localizada entre la frecuencia de
corte inferior y la frecuencia de corte superior del filtro.
3.4.2.4 Filtros eliminabanda. Tienen un comportamiento dual al Filtro pasabanda.
Bloquea (elimina) una banda de frecuencias comprendida entre la frecuencia de corte
inferior y la frecuencia de corte superior y deja inalteradas las frecuencias fuera de la
banda.
189
3.4.3 Diseño de filtros.
El diseño de filtros es un proceso que requiere tres pasos:
-
establecer las especificaciones del filtro para unas determinadas exigencias
(atenuación máxima y mínima, ganancia, frecuencias de corte, etc.)
-
determinar la función de transferencia a partir de las especificaciones
-
implementar el filtro ya sea en hardware o en software
Los diversos filtros clasificados según la banda de frecuencias se pueden obtener a partir de
especificaciones para un filtro pasabajo. Es decir, primero se modela el filtro tomando
como referencia un filtro pasabajo y luego se aplica una técnica denominada
transformación del filtro, ya sea para convertirlo en pasa alto, pasabanda, eliminabanda o
dejarlo como pasabajo. Por esta razón, el filtro pasabajo ha sido objeto de estudio de varios
investigadores con el fin de obtener un filtro con las mejores características. Los filtros
están caracterizadas por magnitud y por fase. Se desea que la magnitud del filtro represente
de la manera más cercana un sistema para atenuar todas las frecuencias superiores a la
frecuencia de corte. Se distinguen dos bandas de frecuencias separadas por la frecuencia de
corte. La banda de las frecuencias inferiores a la frecuencia de corte se denomina banda de
paso, pues deja pasar las frecuencias. La banda de las frecuencias superiores a la frecuencia
de corte se denomina banda de stop o banda atenuada.
Ganancia
banda de paso
banda de stop
f corte
f (Hz)
Figura 103 Filtro pasabajos ideal
La fase se desea que sea lineal para evitar distorsión. Sin embargo, esto hace parte de una
idealización del filtro. Los filtros reales no tienen caídas abruptas desde la banda de paso
190
hasta la banda de stop. La transición se hace mediante una pendiente de caída en dB/octava.
Entre mayor sea el valor de la pendiente, más rápida es la transición. Los filtros reales
tampoco tienen atenuación infinita en la banda de stop como si tiene el filtro ideal. Se habla
de una atenuación mínima en la banda de stop y una atenuación máxima en la banda de
paso. Existen varias aproximaciones al filtro pasabajo y las más relevantes se discutirán a
continuación.
3.4.3.1 Butterworth. Los filtros tipo Butterworth tienen una pendiente de caída (de
atenuación) de 20ndB/década donde n es el orden del filtro. Además admite respuesta plana
en la banda de paso, la banda de frecuencias inferior a la frecuencia inferior de corte. La
fase es lineal.
3.4.3.2 Chebychev. Los filtros tipo Chebychev tienen una pendiente de atenuación mayor
que 20ndB/década lo que se traduce en filtros superiores con órdenes más bajos. Sin
embargo, tiene rizado en la banda de paso. La fase del filtro no es lineal lo que conduce a
distorsión por retraso de grupo.
3.4.3.3 Filtros elípticos. Los filtros elípticos tienen como característica principal que tienen
rizado tanto en la banda de paso como en la banda atenuada. La transición de la banda de
paso a la banda atenuada es óptima (superior a Chebychev). Aún así, la fase es no lineal.
3.4.3.4 Bessel. En los filtros tipo Bessel la fase es lineal en la banda de paso pero la
transición es más suave a la banda atenuada. Esto es un sacrificio por obtener una mejor
respuesta transitoria (respuesta ante cambios repentinos de señal).
Los detalles de la obtención de la función de transferencia y de la implementación de los
filtros no es objeto de este libro.
191
3.4.4 Filtros digitales
Un filtro digital es el procesamiento realizado a una señal de entrada digital, entrada cuyo
dominio son valores discretos del tiempo. Consta de un arreglo de números (vector) que
modela una ecuación en diferencias. Los filtros digitales tienen muchas ventajas sobre los
filtros análogos:
-
Alta inmunidad al ruido
-
Alta precisión (limitada por los errores de redondeo en la aritmética empleada)
-
Fácil modificación de las características del filtro
-
Muy bajo costo
Existen dos tipos de filtros digitales: Filtros IIR y filtros FIR
3.4.4.1 Filtros FIR(Finite Impulse Response). Un filtro FIR de orden M se define
mediante la siguiente ecuación en diferencias:
y[n]=B0x[n]+B1x[n-1] . . .+BMx[n-M].
A esta ecuación en diferencia corresponde la función de transferencia (mediante
Transformada Z): H(z)= B0+B1z-1 . . .+BMz-M La secuencia {Bk}son los coeficientes
(vector) del filtro.
La salida del filtro depende unicamente de la entrada y no de valores pasados de la salida.
Por lo tanto, se dice que el filtro es no recursivo. La respuesta es de duración finita.
3.4.4.2 Filtros IIR(Infinite Impulse Response). Un filtro IIR de orden N se define
mediante la siguiente ecuación en diferencia:
y[n]+A1y[n-1]+ . . .ANy[n-N]= B0x[n]+B1x[n-1] . . .+BMx[n-M]
cuya función de transferencia correspondiente es:
B 0 + B1 z -1 . . . + B M z -M
H(z)=
1 + A 1 z -1 . . . + A N z - N
192
Los filtros IIR son recursivos ya que la salida es función de tanto los valores de la entrada
como de los valores pasados de la salida. Para este propósito, el filtro debe tener
realimentación. Este filtro es de duración infinita.
La decisión entre implementar un filtro FIR o un filtro IIR se basa en las ventajas y
desventajas que cada uno posee.
Filtros FIR
Filtros IIR
son de fase lineal
producen distorsión de fase
la convergencia es más lenta el orden de un filtro IIR es
que la de un filtro IIR menor que la de un filtro FIR
(requiere un mayor orden)
para la misma aplicación
son siempre estables
la estabilidad depende de las
condiciones del sistema
3.4.5 Filtros adaptativos
El diseño de filtros se complica cuando no se conoce por completo las características de la
señal cuyo espectro se quiere modificar. Esto sucede, por ejemplo, en sistemas que
requieran filtrar la señal en tiempo real. Para resolver este problema, se utilizan filtros
adaptativos que son dispositivos con la capacidad de auto-diseñarse a través de un
algoritmo recursivo. Este tipo de filtros tienen condiciones iniciales y después converge a la
solución óptima. El proceso se divide en dos partes:
un proceso de filtrado en el cual se obtiene un dato de salida en respuesta a datos de
entrada.
un proceso adaptativo en el cual se ajustan los coeficientes del filtro de acuerdo a un
algoritmo.
Los filtros adaptativos pueden ser análogos o digitales.
193
3.4.6 Redes divisoras de frecuencia
Al estudiar los altavoces, se indicó que muchas veces era necesario utilizar dos o más
altavoces para cubrir el rango de frecuencias de la señal de audio debido a dificultades del
comportamiento de un altavoz en alta y baja frecuencia. Cada altavoz del sistema responde
acústicamente a la porción de la señal comprendida en su rango de frecuencias específico.
Sin embargo, no es deseable enviar toda la señal al altavoz pues se desperdicia potencia
eléctrica y se somete al altavoz a una gran sobrecarga. Las redes divisoras de frecuencia o
redes “crossover” permiten efectuar una separación de la señal en rangos de frecuencia
según los altavoces a utilizar.
En los sistemas de pequeña o mediana potencia, las cajas acústicas contienen dos o más
altavoces para cubrir los distintos rangos de frecuencia. La caja recibe un única señal de
potencia proveniente de un único amplificador y la división de frecuencias se efectúa en la
caja acústica (posterior a la etapa de amplificación). La red en este caso es pasiva; utiliza
solamente condensadores, bobinas y resistencias.
En los sistemas de grandes potencias (superiores a 100W) se utiliza el esquema de
multiamplificación, ya discutido cuando se analizaron los amplificadores. En este esquema
se realiza la división de frecuencias antes de la etapa de amplificación y luego se amplifica
por separado cada una de las señales así obtenidas. Los filtros utilizados para la
multiamplificación
funcionamiento.
son
activos;
utiliza
amplificadores
operacionales
para
su
194
Preamplificador
Pasabajo
Pasabajo
Pasaalto
Pasaalto
Amplificador
Amplificador
bajos
medios
Amplificador
agudos
Figura 104 Sistema multiamplificado
Los sistemas multiamplificados tienen muchas ventajas frente a los tradicionales (algunas
ya anotadas anteriormente en el capítulo de amplificadores):
-
la potencia se reparte en dos o más amplificadores y por lo tanto cada uno resulta de
menor potencia que si se usara un solo amplificador. (esto es particularmente útil
para el amplificador del “tweeter” que es de menor potencia (mayor rendimiento)
que el amplificador del “woofer”
-
la distorsión se reduce pues la distorsión en una de las vías no tiene ninguna
repercusión en el resto.
-
la característica de los amplificadores para cada vía (para agudos y graves por
ejemplo) pueden tener respuesta en frecuencia más restringida lo que reduce el
ruido y el costo del equipo al ser una especificación más flexible
Las especificaciones de las redes “crossover” (activas) incluyen parámetros habituales ya
discutidos en el capítulo de amplificadores:
impedancias, relación señal a ruido, etc.
respuesta en frecuencia, distorsión,
195
3.4.7 Ecualizadores
Un ecualizador es un dispositivo que permite alterar (aumentar o reducir) la ganancia
selectivamente en tres o más bandas de frecuencia. Son una parte fundamental de un
sistema de audio ya que permite:
-
enfatizar o atenuar bandas determinadas de frecuencia (particularmente útil para
algunos tipos de música)
-
compensación de filtrados previos o posteriores
-
facilitar la mezcla de sonidos
-
reducción de ruido
3.4.7.1 Control de tono. El Control de tono es el tipo de ecualizador más sencillo. Permite
controlar tres bandas fijas de frecuencia del espectro denominadas graves (bajas
frecuencias), medios (medias frecuencias) y agudos (altas frecuencias). Es usual
encontrarlo en los preamplificadores. El Control de Tono, al dividir el espectro sonoro en
bandas muy grandes, no es muy preciso ni muy selectivo. De hecho, el término ecualizador
se reserva para los dispositivos que manejen 5 o más bandas.
graves medios agudos
Figura 105 Control de tonos
3.4.7.2 Ecualizador gráfico o de bandas. Los ecualizadores gráficos están divididos en
bandas de frecuencias, generalmente de 5 hasta 31 bandas. Cada banda está centrada en
una frecuencia determinada, denominada frecuencia central de la banda. Las frecuencias
centrales se seleccionan de tal forma que exista una relación aproximadamente constante
entre frecuencias consecutivas. Existen varias formas de dividir el espectro en bandas. La
196
más común es dividir el espectro en bandas de octava; las frecuencias centrales están
elegidas de modo que cada frecuencia sea el doble de la anterior (por analogía con la octava
musical): 31.5, 63, 125, 250, 500, 1k, 2k, 4k, 8k, 16k.. Nótese que el ancho de cada banda
aumenta con la frecuencia. Si estas bandas se sitúan en una gráfica lineal, se nota que las
primeras bandas están muy comprimidas. En cambio si estas bandas se sitúan en una
gráfica logarítmica (como normalmente se utiliza en las especificaciones de respuesta en
frecuencia), es espaciado es uniforme.
En los ecualizadores por bandas de tercio de octava, cada frecuencia central es
aproximadamente 25% mayor que la anterior. También existen ecualizadores de ½ octava y
de 2/3 de octava. La resolución del ecualizador depende del número de bandas de
frecuencia en la cual está divido el espectro. En orden de mayor a menor resolución, los
ecualizadores se ordenan así:
1/3 de octava
½ de octava
2/3 de octava
octava
Para el ajuste de la ganancia o de atenuación, los ecualizadores gráficos cuentan en cada
banda con un potenciómetro graduado en dB. La posición central o de reposo corresponde a
0dB(ganancia =1). En la posición más alta se tiene la ganancia máxima(típicamente 18dB
ó 12dB ó 6dB) y en la posición más baja se tiene la atenuación máxima (típicamente –18dB
ó –12dB ó –6dB). Si se eleva una de las bandas hasta la ganancia máxima dejando
inalteradas las demás (0dB), la frecuencia central se amplificará con la ganancia máxima
pero el resto de la banda lo hará en menor proporción. La ganancia inclusive puede afectar
las bandas contiguas pero se atenúa muy rápidamente a medida que se aleja de la frecuencia
central.
Figura 106 Ecualizador gráfico
197
Existen varias aplicaciones de los ecualizadores gráficos. Entre éstas están:
-
el retoque tonal de composiciones musicales
-
utilización del ecualizador como complemento de diversos efectos y procesadores
-
compensación de deficiencias de un sistema de audio
Esta última es la aplicación más importante. Un sistema de audio está conformado por
micrófonos, altavoces, amplificadores, redes “crossover” y otros equipos electrónicos.
Todas estas partes involucradas contribuyen con defectos respecto a la respuesta en
frecuencia. Los ecualizadores proporcionan una solución a este problema atenuando
frecuencias que resuenan o enfatizando aquellas que son absorbidas.
Para especificar los ecualizadores gráficos, se utilizan las comunes a los sistemas de audio
estudiados anteriormente: impedancias de entrada y de salida, distorsión armónica (con
salida máxima), respuesta en frecuencia con todos los controles en 0dB (planos), relación
señal a ruido.
3.4.7.3 Ecualizadores paramétricos. Los ecualizadores paramétricos permiten ajustar la
frecuencia central de una banda. Esto implica la posibilidad de ubicar de forma precisa un
defecto acústico y corregirlo (una resonancia, por ejemplo). También es posible ajustar el
ancho de banda y la ganancia. Sin embargo, tienen menos bandas que los ecualizadores
gráficos. El factor de calidad Q de un filtro paramétrico relaciona la frecuencia central con
el ancho de banda.
Q=
f0
AB
donde
f0: frecuencia central del filtro
AB: ancho de banda de actuación del filtro
Un valor de Q alto implica que el filtro es muy selectivo y abarca pocas frecuencias. Esto es
muy deseable cuando se quiere corregir un error acústico en una banda de frecuencias
estrecha.
La aplicación de los ecualizadores paramétricos está en corregir defectos acústicos en
frecuencias específicas. Esto puede resultar de una resonancia en una caja acústica (es
198
deseable atenuarla) o un rango de frecuencias que son excesivamente absorbidas (es
deseable enfatizarlas). Otras aplicaciones pueden ser eliminar zumbidos de línea y el
“feedback” de los altavoces. Las especificaciones de los ecualizadores paramétricos son
similares a las de los altavoces gráficos.
3.4.7.4 Ecualizadores paragráficos. Los ecualizadores paragráficos combinan las
características de los ecualizadores gráficos y de los ecualizadores paramétricos: tienen
varias bandas de frecuencia con frecuencias ajustables independientemente y control del
factor de calidad Q.
La aplicación de estos ecualizadores está en los
sistemas
electroacústicos complejos, en donde pueden aparecer varios defectos acústicos a varias
frecuencias específicas.
199
3.5 UNIDADES DINÁMICAS
Las unidades dinámicas son procesadores que modifican el rango dinámico de una señal. El
rango dinámico se define como la diferencia en dB de la señal más intensa con respecto a
más débil. Esta especificación está relacionada con la capacidad que tiene un sistema de
audio de reproducir todas las intensidades perceptibles por el ser humano. El rango
dinámico del ser humano y de los instrumentos musicales acústicos es de alrededor de
130dB. Sin embargo, el rango dinámico de los formatos de grabación y reproducción es
menor:
Eléctricos análogos 80dB
Magnéticos análogos 60dB
Digitales 120dB
Las unidades dinámicas pueden tener control manual o control automático. Las unidades de
control manual dependen de un experto que modifica aspectos del rango dinámico
manualmente al escuchar la señal. En este caso, el hombre actúa como un procesador: la
señal proveniente de alguna fuente es procesada por el sistema auditivo y por el cerebro.
Este último envía una señal de control que es traducida en es la modificación manual del
rango dinámico. El procesador “humano” de dinámica tiene ciertos inconvenientes:
-
el operador debe conocer de antemano la señal
-
solo puede controlar un canal a la vez
-
las acciones no pueden ser exactamente repetibles
-
es lento
Por estas razones se recurre a un control automático independiente del hombre para la
modificación del rango dinámico. Aún así, se tienen algunas desventajas de utilizar control
automático. Las unidades de control automático son sistemas electrónicos “feedforward”,
es decir, sin retroalimentación. Se comentó anteriomente que lo sistemas sin
retroalimentación son más propensos a ruidos y a distorsiones. Además, debido a la
200
naturaleza electrónica de las unidades dinámicas, existen ruidos eléctricos característicos de
los dispositivos semiconductores que lo conforman muy difíciles de eliminar.
Existen cuatro tipos de unidades dinámicas que modifican de alguna forma el rango
dinámico de la señal y se clasifican en dos grupos:
Compresores y Limitadores
Compuertas y Expansores
3.5.1 Compresores
Un compresor de audio es un procesador electrónico capaz de reducir el rango dinámico de
la señal. Esto se hace atenuando la amplitud de señales (tensiones) superiores a una
amplitud de referencia denominada umbral.
VCA
Entrada
Salida
Control de
Ganancia
Detector de
Nivel
Relación de
Compresión
Figura 107 Esquema del funcionamiento de un compresor
El compresor funciona de la siguiente forma. El VCA es un amplificador controlado que
posee una entrada por medio de la cual se pude variar la ganancia. Existe un Detector de
Nivel que verifica continuamente si la señal de entrada supera o no un nivel de referencia
establecido (umbral). Si el umbral no se supera, el VCA tienen ganancia unitaria (0dB). Si
sí se supera el umbral, el VCA deberá modificar su ganancia de tal modo que el nivel que
excede del umbral se reduzca en una proporción llamada relación de compresión. Por
ejemplo, si la relación de compresión es de 3:1, un exceso de 15 dB se atenúa a un exceso
de 5dB. A partir del umbral, el compresor se comporta como un amplificador de ganancia
variable. El nivel de umbral y la relación de compresión son parámetros ajustables por el
usuario y definen la forma en que actuará el compresor.
201
1:1
Entrada
2:1
3:1
∞ :1
UMBRAL
Salida
Figura 108 Relación entrada-salida para un compresor
A partir del gráfico se puede observar que antes del umbral, no hay ninguna modificación
en la salida con respecto a la ganancia. Una vez alcanzado el umbral, el amplificador
modifica la ganancia atenuando el exceso en dB de la señal con respecto al umbral. Nótese
que la máxima compresión es la de ∞ :1 que corresponde a un limitador (los limitadores se
discutirán posteriormente). La pendiente de la parte de la gráfica mayor al umbral es la
relación de compresión.
Cuando se sobrepasa el umbral, el VCA responde disminuyendo la ganancia. Sin embargo,
el compresor no responde instantáneamente. Existen dos razones por lo cual ésto no sucede.
Por una parte, el detector de nivel del compresor debe esperar un ciclo por lo menos para
reconocer el nivel de la señal. De lo contrario, si la ganancia varía demasiado rápido se
produce distorsión de la onda. Por otra parte, una variación brusca y abrupta de la ganancia
produce un efecto auditivo claramente perceptible. Por estas razones, el compresor
incorpora cambios graduales de la ganancia a través de un generador de envolventes. El
generador tiene dos intervalos de transición: un intervalo inicial en el cual se llega de
manera gradual a la ganancia establecida por la relación de compresión denominada ataque
o “attack” y un intervalo final en el cual se regresa también de manera gradual a la ganancia
original denominada relevo o “release”.
202
Compresión
Ataque
Relevo
t
tA
tR
Figura 109 Envolvente para la compresión
En el diagrama de la envolvente se pueden distinguir dos tiempos importantes: el tiempo de
ataque (tA) y el tiempo de relevo (tR). El tiempo de ataque es el tiempo que transcurre
desde que se detecta una señal de alta intensidad que supera el umbral hasta que el
compresor ajusta la ganancia a un valor determinado. Los tiempo mínimos de ataque
oscilan entre 50 y 500 microsegundos mientras que los máximos oscilan entre 20 y
100milisegundos. El tiempo de relevo es el tiempo que transcurre desde que se detecta una
señal de baja intensidad (menor al umbral) hasta que la ganancia del compresor vuelve a ser
unitaria (0dB). El tiempo de relevo es mayor al tiempo de ataque; suele ser del orden de
60ms hasta inclusive entre 2 y 5 segundos. En algunos compresores también existe un
tiempo de sostén o “hold”. Consiste en un retardo desde que la señal deja de superar el
umbral y el instante que comienza el relevo. El objetivo de este retardo es evitar
distorsiones en las señales de baja frecuencia.
Existen otras características de los compresores que vale la pena mencionar.
3.5.1.1 Ganancia de salida. Los compresores poseen un control de ganancia para
compensar las atenuaciones del compresor. Muchas veces en etapas previas se ha reducido
la ganancia para no saturar al amplificador VCA con la señal de entrada. Después del
proceso de compresión, es necesario restituir la ganancia mediante un control de ganancia
(amplificador) a la salida del compresor. Es importante también este control para
aprovechar el rango dinámico de los dispositivos que se conectan al compresor.
203
3.5.1.2 Codo (“Knee”). Algunos compresores tienen un control para regular la transición
entre el estado de no procesamiento y el estado de procesamiento. Se puede tener una
transición suave (codo suave o “soft knee”) o una transición fuerte (codo duro o “hard
knee”). La transición suave es necesaria cuando la señal fluctúa alrededor del umbral donde
la compresión se pude hacer muy notoria. Hacer una transición suave equivale a una
compresión gradual.
3.5.1.3 Cadena Lateral (“Side Chain”). Los compresores permiten acceder exteriormente
a la entrada de control mediante un conector de inserción. Esta entrada de control
denominada “Side Chain” permite utilizar una señal externa para utilizar en el circuito de
detección. Esto hace posible controlar la compresión de una señal por medio de otra. Este
mecanismo, llamado “ducking” permite que se comprima una orquesta sinfónica en el
momento que a parezca un solista o cuando comienza a hablar el presentador. También es
posible mediante el “side chain” intercalar varios procesadores de tal forma que se
comprima una señal procesada. Es común utilizar un ecualizador (como procesador previo).
De esta forma, se puede utilizar el compresor como un de-esser; un dispositivo que
comprime las altas frecuencias donde está presente la consonante “s” y de esta forma
eliminar excesos de esta consonante frente al micrófono. Análogamente, se puede utilizar el
compresor como anti-pop; un dispositivo que comprime las bajas frecuencias donde están
los soplos y “pops” debido al manejo del micrófono.
3.5.1.4 Enlace estéreo (“Stereo Link”). El enlace estéreo es un mecanismo para procesar
una señal de dos canales (“stereo”) de tal forma que se aplique compresión a ambos canales
de igual forma y simultáneamente. Si esto no se hace, la imagen sonora cambia y se percibe
que el sonido se desplaza de un lado hacia otro.
3.5.1.5 Bypass. Permite una conexión directa de la entrada a la salida sin pasar por el
compresor. Esto hace posible comparar la señal original con la señal comprimida.
3.5.1.6 Medidores. En algunos compresores es posible encontrar indicadores luminosos
que indican el estado de la descompresión así como la ganancia de la señal.
204
3.5.2 Limitadores
Los limitadores son un caso especial de los compresores. Son compresores cuya relación de
compresión es ∞ :1. Esta razón es válida únicamente en teoría porque es imposible atenuar
indefinidamente el exceso sobre el umbral. Compresiones superiores a 10:1 son
consideradas en la práctica como limitaciones. El limitador actúa como una barrera para
todas las señales que superen el umbral. Esto se hace con el fin de evitar que los picos de la
señal saturen al amplificador.
1:1
Entrada
∞ :1
Limitador
Salida
UMBRAL
Figura 110 Relación entrada-salida para un limitador
El limitador no recorta la onda como lo hace un amplificador cuando se satura.
Simplemente reduce la ganancia de las señales que superen el umbral para llevar el nivel a
un valor constante igual al umbral.
La aplicación general de los compresores/limitadores es de reducir el rango dinámico de
una señal. Esto se hace necesario en diversas situaciones:
-
cuando se requiera grabar sobre un sistema que no soporta tanto rango dinámico
como la fuente original
-
como protección ante saturaciones
-
suavizar ataques
-
cuando se tengan instrumentos o voces con grandes rangos dinámicos y se desee
minimizar las variaciones de nivel ocasionadas por cambios en la distancia entre la
fuente sonora y el micrófono o por un aumento abrupto de la intensidad sonora
205
3.5.3 Compuertas
El ruido en los sistemas de audio debe mantenerse en niveles muy bajos. El ruido propio de
los componentes electrónicos es afortunadamente casi siempre inaudible. Sin embargo el
ruido acústico captado por el micrófono sumado al ruido interno de éste son superiores al
resto de los ruidos de los otros componentes. Este ruido se puede eliminar en gran parte
utilizando un procesador dinámico llamado compuerta. La compuerta es un procesador que
realiza la función inversa del limitador. Es básicamente un interruptor que conecta la
entrada solamente si tiene el nivel suficiente para considerarse como señal. Cuando la
entrada no tiene el nivel suficiente se considera como ruido y el interruptor se cierra. Esto
mejora la relación señal a ruido (S/R) y por esta razón también se denomina compuerta de
ruido. Una compuerta abierta equivale a una ganancia 1 (0dB) y una compuerta cerrada
equivale a una ganancia 0 (- ∞ dB).
Nivel de
Entrada
Umbral
ruido
t
Compuerta
Abre
Cierra Abre
t
Figura 111 Funcionamiento de una compuerta
Existe un umbral por debajo del cual la compuerta se cierra y por encima del cual se abre.
El umbral debe ajustarse apenas por encima del ruido para no eliminar las señales de bajo
206
nivel. La compuerta se abre (conecta la salida a la entrada) cuando el nivel de la señal es
superior al umbral y se cierra (desconecta la salida de la entrada) cuando el nivel de la señal
es inferior al umbral. Sin embargo, este proceso en la práctica no puede ocurrir de esta
forma por dos razones:
-
un cambio abrupto del estado de la compuerta provoca un efecto audible molesto
-
señales que fluctúan con niveles cercanos al umbral provoca que la compuerta se
abra y se cierre repetidamente generando inestabilidad de la compuerta
Para solucionar estos inconvenientes, se añaden dos elementos a la compuerta: una
histéresis y una envolvente. La histéresis consiste en la existencia de dos umbrales
distintos: el umbral de cierre y el umbral de apertura. El umbral de cierre solamente
funciona cuando la compuerta está abierta. Cuando la señal se hace menor que este umbral,
la compuerta conmutará al estado cerrado. Entonces, pasa a ser operativa el umbral de
apertura. Es necesario superar el umbral de apertura para conmutar la compuerta a estado
de apertura.
Nivel de
Entrada
Umbral
Apertura
Umbral
Cierre
Compuerta
Abre
Abre
Cierra
Figura 112 Compuerta con dos umbrales
207
Nótese que debido a la existencia de dos umbrales (uno para cierre y otro para apertura), las
fluctuaciones de la señal no genera conmutación lo que incrementa la estabilidad de la
compuerta. La diferencia entre los dos umbrales se denomina ventana de histéresis. Esta
debe seleccionarse mayor que las fluctuaciones promedio debido al ruido para que éste no
conmute la compuerta innecesariamente.
La envolvente en las compuertas, al igual que en los compresores, controla los cambios de
conmutación de manera gradual. La ganancia se reduce de 1 a 0 gradualmente en un tiempo
de relevo y vuelve a la ganancia original en un tiempo de ataque. La situación es análoga a
la de compresión, pero con la diferencia que en la compuerta la envolvente representa
ganancia.
3.5.4 Expansores
Los expansores son dispositivos que convierten el rango dinámico de la señal que está por
debajo del umbral en un rango dinámico mayor. Es decir, expande el rango dinámico.
Existe un umbral por debajo del cual la señal es atenuada en un factor llamado relación de
expansión. Por ejemplo, si una señal baja del umbral con una diferencia de 6dB y la
relación de compresión es de 1:3, la salida del expansor deberá bajar a 6x3=18dB: atenúa
los valores debajo del umbral. Es una variación de la compuerta en la cual la ganancia
cuando se cierra la compuerta no es cero sino un valor intermedio entre 0 y 1. De hecho, la
compuerta es un expansor en el cual la atenuación del expansor es infinita (relación de
expansión 1: ∞ ).
Los expansores/compuertas también al igual que los compresores tienen acceso a la cadena
lateral mediante la cual pueden controlar la operación del dispositivo con una señal externa
distinta a la señal que se quiere procesar. Algunos también poseen un enlace estéreo para
poder efectuar la expansión de igual forma y simultánea a ambos canales.
208
Entre las aplicaciones de los expansores/compuertas pueden citarse
-
eliminación de ruido con las compuertas
-
restitución de señales excesivamente comprimidas
-
pares compresor-expansor se utilizan para eliminar ruidos de grabación
209
3.6 AUDIO DIGITAL
El audio digital es una de las aplicaciones más importantes que han tenido las técnicas
digitales respecto a la generación, el procesamiento, el almacenamiento y el análisis del
sonido. Esto ha sido consecuencia de los progresos de la microelectrónica que ha podido
revolucionar la forma en que se manejan y transforman cada vez con más precisión y
rapidez la enorme cantidad de información contenida en el sonido. Una gran contribución
de las técnicas digitales fue el desarrollo de sistemas de almacenamiento de sonido de gran
inalterabilidad y fidelidad. Otra gran contribución fue la introducción de nuevas técnicas de
procesamiento sonoro de naturaleza digital y efectos como retardos, reverberaciones y
envolventes.
Existen varias características que hacen al audio digital superior al audio análogo:
durabilidad: La durabilidad de los datos obtenidos de un sistema digital son en teoría
eternos pues pueden ser almacenados en diversos dispositivos de almacenamiento de
memoria como ROM, disco duro y pueden ser recuperados a la voluntad del usuario en
cualquier momento. Por oposición , los datos en un sistema analógico se guardan
físicamente sobre un sustrato que es vulnerable al paso del tiempo.
tiempo: En la reproducción analógica hay que prestar especial interés a los desfases y
oscilaciones que pueden aparecer en el tiempo como el “flutter” y otras imperfecciones
mecánicas naturales del sistema de reproducción .
precisión: La precisión de un sistema basado en el audio digital es mayor que su
contraparte análogo respecto a varios de los parámetros establecidos en capítulos
anteriores: relación señal a ruido, separación entre canales, linealidad de la respuesta, etc.
3.6.1 Conversión análoga digital
La conversión análoga digital es el método empleado para pasar del mundo continuo al
mundo discreto. Se basa en digitalizar (volver en número) una muestra de alguna señal
210
continua. En términos generales, una señal análoga se puede convertir en digital
combinando tres operaciones: muestreo, cuantificación y codificación.
3.6.1.1 Muestreo. El muestreo o “sampling” es un proceso en el cual se reemplaza una
señal continua por una serie de muestras tomadas a intervalos regulares. La frecuencia con
que se toman las muestras se denomina frecuencia de muestreo.
a)
b)
Figura 113 Muestreo de una onda senoidal a)señal original b)señal muestreada
Si la frecuencia de muestreo se incrementa, esto significa que se pueden obtener más
muestras de la señal y la señal muestreada es fiel a la origina. De hecho, existe un criterio
que se debe cumplir en todo proceso de muestreo. Este criterio se llama criterio de Nyquist
y establece que la frecuencia de muestreo debe ser mayor que el doble de la máxima
frecuencia presente en la señal a muestrear.
fM>2fmax
Si no se cumple el criterio de Nyquist, se produce “aliasing” una condición en la cual
aparecen frecuencias que no se encontraban en la señal original . Por esta razón es muy
importante respetar el criterio de Nyquist. Afortunadamente, existe un filtro denominado
filtro anti-alias que elimina componentes altas de frecuencia alias.
En audio digital, son muy comunes las siguientes frecuencias de muestreo: 24kHz, 30kHz,
44.1kHz,
3.6.1.2 Cuantización. Una vez la señal es muestreada, se procede a cuantizarla. La
cuantización es el proceso en el cual se asigna un número a cada una de las muestras
tomadas. La amplitud después del muestreo sigue siendo continua, y debe ser convertida a
211
amplitudes discretas. Para hacer esto, la amplitud de la señal de audio es representada por
pasos discretos. La cuantización mas usual es la cuantización uniforme, en el cual cada
nivel discreto de amplitud es igual al anterior y al siguiente. Sea x el número de bits. Por lo
tanto, el número de niveles será: 2x
3.6.1.3 Codificación. Cada nivel discreto de amplitud producto de la cuantización se
representa mediante un número binario. Dependiendo del número de bits utilizados, se
logra mayor resolución.
111
110
101
100
011
010
001
000
Figura 114 Cuantización y codificación de una muestra
3.6.2 PCM
PCM es modulación por codificación de pulsos. PCM es básicamente una técnica de
muestreo para digitalizar señales análogas, en especial audio. PCM muestrea la señal 8000
veces por segundo y cada muestra está representada por 8 bits para un total de 64kbps.
El audio digital con PCM permite la transmision de audio vía microondas, satélite, láser,
fibra óptica, etc. Los procesadores PCM tomand dos canales de audio y los convierte en
señales tipo video que puede ser transmitida con altísima confiabilidad y fidelidad.
PCM es una técnica que suministra mejores valores de señal a ruido y de rango dinámico
cuando se compara con otras técnicas análogas para transmisión sonora
212
3.6.3 Dither
Cuando se muestrean y codifican señales de bajo nivel, se produce distorsión en la onda de
salida. Esto es en parte por errores de cuantización al aproximar una señal muestrada al
nivel más cercano. Para solucionar esto, se utiliza “dithering” que es agregarle ruido a la
señal. Si se agrega ruido a la muestra señal de manera más o menos uniforme, esto forza a
los niveles bajos truncados al próximo nivel. De esta forma, los bits menos significantes
representarán el ruido (“dither”), pero los niveles bajos originales de la muestra pasan al
umbral siguiente (bits más significativos). En resumen, se añade ruido para rellenar
espacios vacíos en el espectro para suavizar los errores de cuantización,
3.6.4 Efectos de audio digital
Los procesadores como los compresores y las compuertas procesaban la totalidad de la
señal que pasaban a través de ellos. En cambio, en los procesadores de efectos se mezcla la
señal procesada de alguna forma (“wet”), con la señal sin procesar (“dry”). El resultado es
lo que comunmente se denomina como efecto. Los efectos brindan mayores posibilidades
expresivas, dinámicas y sonoras en general al alterar diversos parámetros de la onda sonora
como amplitud, envolvente, espectro, etc. A los procesadores que procesan la señal en su
totalidad se denominan efectos en serie o efectos de inserción. Por el contrario, se le
denomina efectos en paralelo a los procesadores de efecto propiamente dichos.
a)
entrada
efecto
salida
b)
entrada
Σ
salida
efecto
Figura 115 Esquema general de un procesador de efecto a) efecto serie b) efecto paralelo
213
Tabla 8 Algunos efectos en serie y en paralelo
Efectos en serie
Efectos en paralelo
Ecualizador de bandas
Retardo
Ecualizador paramétrico
Reflexiones tempranas
Compresor
Reverberación
Compuerta
Ambiencia
Expansor
Coro
Limitador
Flanger
Vibrato
Phaser
Wah-wah
Trémolo
Distorsión
Resaltadores
Excitadores
Fuente: MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.
3.6.4.1 Retardo digital. La función de este dispositivo consiste en retardar una señal un
tiempo determinado TD generalmente ajustable. El retardo consiste en grabar digitalmente
en una memoria y leerla después. Esto consta de un conversor análogo digital, un conversor
digital análogo, una memoria RAM y un reloj. Es útil para realizar múltiples efectos. De
ahora en adelante, el retardo se representa por el siguiente bloque funcional:
Retardo (TD))
Figura116 Retardo digital
3.6.4.2 Eco sencillo. El eco consiste en la repetición de un sonido a causa del retardo entre
la onda directa y la reflejada (>100ms)
Σ
Retardo (TD))
Figura 117 Eco sencillo
214
3.6.4.3 Eco múltiple. El eco múltiple es el resultado de varias reflexiones, por ejemplo
entre superficies paralelas opuestas. El esquema es similar al anterior.
Σ
Σ
Retardo (TD))
Figura 118 Eco múltiple
3.6.4.4 Trémolo. El trémolo es un efecto que consiste en una fluctuación periódica de la
amplitud. La frecuencia de la fluctuación se logra por medio de un oscilador de baja
frecuencia. (LFO por sus siglas en inglés: Low Frequency Oscillator). La oscilación del
LFO es inyectada en la entrada de control de un amplificador controlado por tensión.
(VCA) para de esta forma modular la amplitud. Este efecto es muy utilizado en algunos
sonidos sintetizados ya que ayuda a brindar una mayor expresividad del sonido.
Σ
VCA
LFO
Figura 119 Trémolo
3.6.4.5 Vibrato. Vibrato es un efecto que consiste en una vibración periódica de la
frecuencia del sonido. Para conseguir este efecto, se introduce un retardo al efecto del
trémolo. Al retrasar la señal se produce una reducción aparente de la frecuencia, similar a la
frecuencia aparente en el efecto Doppler.
215
Retardo (TD))
LFO
Σ
Figura 120 Vibrato
3.6.4.6 Coro. El coro es un efecto de la suma de una señal sin procesar con esa señal con
vibrato. El resultado es una señal con envolvente irregular que simula instrumentos o voces
al unísono
Retardo (TD))
LFO
Σ
Σ
Figura 121 Coro
3.6.4.7 Wah-wah. Este efecto se obtiene al modularla frecuencia de corte de un
filtropasabajos por medio de un LFO. De esta forma se permite el paso de mayor o menor
cantidad de armónicos dependiendo si el LFO esté pasando por un máximo o por un
mínimo.
LFO
frecuencia de
corte central
Σ
Figura 122 Wah-wah
216
3.6.4.8 Phaser. Este efecto está dentro de los que se obtienen modulando un filtro. En este
caso, se trata de un filtro pasabanda de banda estrecha cuya frecuencia central es modulada
por el oscilador de baja frecuencia. Esta configuración da la sensación de cancelación de la
onda.
Σ
LFO
frecuencia de
corte central
Σ
Figura 123 Phaser
217
4. FORMATOS DE GRABACIÓN
4.1 ORÍGENES
La primera grabación de sonido fue realizada por Thomas Edison en el año de 1877 en un
repetidor telefónico. Ese mismo año, el señor Edison se inventó el fonógrafo (Reproductor
de discos), un equipo mas complejo en el cual el sonido pasaba de la bocina a la boquilla
central, provocando la vibración del diafragma. El punzón de este equipo grababa en surcos
en una fina lámina de latón que recubría el tambor giratorio. Simultáneamente, el fonógrafo
contaba con un segundo punzón y diafragma que podían acoplarse para reproducir la
grabación.
Figura 124 Fonógrafo
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.1.1 Cilindro de Edison
Con este cilindro rotando a una velocidad de 90 rpm era posible registrar casi 4 minutos de
voz hablada. Los primeros cilindros se podían reproducir unas doce veces. Después era
necesario suavizarlos para volver a ser grabados.
218
Figura 125 Cilindros de Edison
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.1.2 Alambre
En este tipo de almacenamiento de audio análogo, la grabación se hacía en alambre delgado
que podía ser reproducido por horas. Los carretes de alambre se grababan y reproducían a
24 pulgadas por segundo. Una hora de sonido gastaba 7200 pies de alambre.
El auge de este tipo de grabación fue en los años 30 y 40 fue remplazado posteriormente
por la cinta magnética.
4.1.3 Gramófono
Inventado por el alemán Emile Berliner en 1887 y denominado en un principio como
fonógrafo, este instrumento electromecánico reproducía discos de vinilo grabados con
surcos en espiral con pequeños realces en ambas caras. El gramófono consta de un plato
giratorio, un brazo, la aguja y el amplificador, aunque éste último no siempre iba
incorporado al instrumento. Fueron denominados posteriormente como tocadiscos.
Figura 126 Gramófono
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
219
4.1.4 Disco 78
Las primeras grabaciones en este formato (78 revoluciones por minuto) fueron
comercializadas en 1885, fecha a partir de la cual se convirtieron en el medio de grabación
mas popular, reemplazando el cilindro de Edison por ser más económico, menos frágil y
más fácil de almacenar.
Fueron construidos en un principio con ebonita, material que posteriormente fue
reemplazado por el shellac o la goma laca. Este material se obtenía a partir de un líquido
que segregaba el insecto Laca o Laccifer Lacca, el cual habitaba en las selvas de Asma,
India y Tailandia.
Figura 127 Disco 78
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.1.5 Disco de vinil
Construido en cloruro de polivinilo (de ahí su nombre), y de 30 centímetros de diámetro, el
disco de vinil reemplazó los discos fonográficos que se usaban desde 1895 porque era
irrompible, lo cual le brindaba una ventaja.
La calidad de sonido en este tipo de formato depende de la calidad del vinilo usado para su
fabricación. En la mayoría de aplicaciones se usaba vinilo reciclado, lo cual daba una
menor calidad. Para obtener mejor fidelidad de audio se usaba vinilo virgen o “pesado”
220
como se le conoce. En la actualidad todos los discos de vinilo son fabricados con vinilo
virgen.
Figura 128 Disco de vinil
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
221
4.2 REGISTRO MAGNÉTICO ANÁLOGO
El registro magnético hace referencia al registro de señales en algún soporte basado en la
magnetización. Hay sustancias en la naturaleza que son imanadas (adquieren el carácter de
un imán) bajo el efecto de un campo magnético. Estas sustancias son sustancias
ferromagnéticas. La imanación en las sustancias ferromagnéticas sigue un proceso de
histéresis, en el cual la exposición a un campo magnético y su posterior retiro deja un
magnetismo residual en la sustancia, denominada magnetismo remanente. El principio de
registro magnético es utilizar ese magnetismo remanente para almacenar información
proveniente de una señal de audio (corriente alterna). Existen formatos análogos y digitales
según sea la información a grabar. Algunos formatos análogos incluye a la cinta y al
cassette y formatos digitales a DAT y 8mm.
El proceso de registro magnético básicamente se divide en dos subprocesos: grabación
magnética y reproducción magnética.
4.2.1
Grabación magnética
El principio de la grabación magnética es el de generar una fuerza magnética proporcional a
la señal a grabar y aplicarla mediante el cabezal de grabación en una pequeña región de una
cinta recubierta de partículas ferromagnéticas. El cabezal es el elemento encargado de
producir la fuerza. El cabezal está compuesto por una bobina, el núcleo y el entrehierro.
Cuando una corriente i pasa a través de la bobina, se produce un campo magnético en el
cabezal, más específicamente en el entrehierro. Este campo varía en intensidad y polaridad
de acuerdo con los cambios de la señal (i). El máximo flujo magnético coincide con el
máximo de la señal i. La cinta magnética se desplaza a una velocidad constante por debajo
del cabezal. Las partículas ferromagnéticas son afectadas por el campo magnético
constantemente variable en el entrehierro. Estas son orientadas magnéticamente a medida
que se desplaza la cinta. Debido a la naturaleza ferromagnética de las partículas, la cinta es
imanada de forma permanente (magnetismo remanente). En definitiva, el movimiento de la
222
cinta continúa y las variaciones de señal quedan registradas como una serie de impulsos
magnéticos que dependen de la intensidad, polaridad y frecuencia de la señal.
cabezal
magnético
cinta
Figura 129 Mecanismo de grabación del cabezal sobre la cinta
Fuente: MIYARA, Federico. Registro magnético. Bogotá: Fundación Decibel, 2004
4.2.2 Reproducción magnética
La idea de la reproducción magnética es inversa a la de grabación. Al pasar la región
magnetizada frente al núcleo de la bobina, existe un flujo variable y se genera una fuerza
electromotriz. Esta fuerza electromotriz es variable y corresponde a la señal previamente
grabada.
4.2.3 Factores que intervienen en el proceso de grabación/reproducción
4.2.3.1 Variación de la impedancia de la cabeza de grabación. La cabeza magnética es
una bobina enrollada a un material ferromagnético. Por lo tanto, su impedancia es reactiva
y varía con la frecuencia. Se suele disponer de una resistencia de gran valor en serie con la
bobina que permite estabilizar la intensidad que circula por el conjunto.
4.2.3.2 Relación señal a ruido. Este factor es de gran importancia en todos los sistemas de
transmisión sonora. En el registro magnético, existe ruido tanto en el cabezal como en el
soporte magnético (cinta). El ruido de las cabezas magnéticas proviene de campos
magnéticos cercanos. El ruido de la cinta es inherente a la construcción de ésta. Se pude
223
aumentar la relación señal a ruido si se aumenta la superficie de la pista grabada o
aumentando la longitud del entre hierro.
4.2.4 Componentes de las cintas magnéticas
Las cintas magnéticas de audio se componen de una base de poliéster y una serie de capas
superpuestas de distinta composición química y de diversa flexibilidad y resistencia a la
tracción. Estos elementos son:
-
Base de poliéster (polietilterephtalato, Mylar).
-
Adhesivo aglomerante (poliuretano).
-
partículas de óxidos metálicos (dióxido de cromo, dióxido de hierro, etc.), que están
integradas en el adhesivo (en las cintas de alta calidad, se incorpora adicionalmente
una sustancia antifúngica para prevenir la proliferación de hongos).
-
capa inferior de carbono, para proteger la cinta de arañazos, minimizar las cargas de
electricidad estática y disminuir los rozamientos mecánicos.
4.2.4.1 Efectos del calor. La temperatura afecta las cintas magnéticas, haciendo que éstas
se expandan y se arruinen. Perdiendo su aglomerante a causa de la exposición al calor.
4.2.4.2 Pérdida del aglomerante. La humedad del ambiente es absorbida por el
aglomerante causando hidrolización. Este fenómeno deja residuos pegajosos en las cabezas
de reproducción ocasionando que se traben.
224
4.2.5 Formatos
4.2.5.1 Cinta abierta. Primer formato usado por los pioneros alemanes de AEG en sus
magnetófonos en 1934.
A pesar de la aparición de la cinta en cartucho o cassette en 1963, el formato de carrete
abierto fue el medio preferido por los profesionales del audio hasta 1980, fecha en la cual
apareció el audio digital.
4.2.5.2 Cartucho RCA. En 1958 la RCA (Radio Corporation of America) introdujo este
tipo de formato como un primer intento de introducir la cinta dentro de un contenedor que
fuera portátil y más cómodo de transportar.
Las medidas de este cartucho eran de 5’’ x 7 1/8’’ x ½’’ y su velocidad era de 3 ¾’’
pulgadas por segundo, obteniéndose 30 minutos de audio en una cinta de ¼’’, o de 7/8
pulgadas por segundo moviendo una pequeña palanca en el dispositivo reproductor y
grabador.
RCA fracasó en su intento de popularizar este formato y para 1960 abandonó su
producción.
Figura 130. Cassette RCA
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.2.5.3 Cartucho de cuatro pistas. Este formato fue desarrollado en 1954 por George
Eash, pero fue hasta el año de 1956 que Earl “Madman” Muntz, un mercader de autos
usados, vio la oportunidad de incrementar la venta de autos implementando un sistema
capaz de reproducir este tipo de formatos, mejorando los sistemas actuales que sólo tenían
225
radio. El Cartucho de 4 pistas fue popular en los automóviles, pero no tuvo un gran auge
por el pronto lanzamiento del cartucho de 8 pistas y el cassette compacto, que lo desplazó
definitivamente del mercado.
4.2.5.4 Cartucho de 8 pistas. Ahora obsoleto, este formato tuvo su mayor auge en los años
60s y 70s. La idea de crear los cartuchos de 8 pistas surgió cuando su creador, Bill Lear, dio
un paseo a bordo de uno de los automóviles que poseían sistemas de reproducción de
cartuchos de 4 pistas. Fue así como propuso a Ampex, Ford, Motorola y RCA Records que
juntos con su compañía Lear Jet, desarrollaran un sistema de audio para autos de lujo.
Los cartuchos de 8 pistas o Estereo-8 fueron desarrollados en 1956 y consistían de un
carrete donde se enrollaba la cinta, la cual tenía sus dos extremos adheridos a un trozo de
cinta de lámina conductiva metálica de manera que se formara un “loop” continuo. Cuando
la cinta metálica pasaba a través de un par de contactos cercanos a la cabeza de lectura del
equipo reproductor, se enviaba una señal que indicaba terminación de la pista y la cabeza
lectora se desplazaba a la siguiente pista, permitiendo una reproducción continua sin
necesidad de rebobinar. Fue el primer formato en utilizar la automatización para obtener
una reproducción continua.
Figura 131 Cartucho de ocho pistas
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.2.5.5 Play Tape. En 1966 el formato dominante del mercado era el cartucho de 8 pistas,
aunque no era lo suficientemente pequeño como para considerarlo portátil. El Playtape,
nombre que llevaban tanto el reproductor como el formato, tenían la virtud de ser en
226
realidad portátiles, llegando a considerarse como el reemplazo del radio de transistores o
mas bien convirtiéndose en una alternativa de éste.
El creador del Playtape, Frank Stanton, concibió la idea durante los años 40s mientras
prestaba servicio en la marina de los Estados Unidos durante la segunda guerra mundial,
pero fue hasta 1966 que Sears y MGM records, después de perfeccionar el primer modelo
funcional adquirido años antes de Stanton, presentaron al mundo desde Nueva York el
Playtape con un éxito casi inmediato.
Figura 132 Play-tape
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.2.5.6 Audio cassette compacto. Medio de almacenamiento análogo presentado por la
compañía Phillips en el año de 1963. Se compone de una tira de cinta BASF enrollada
dentro de una cubierta protectora de plástico la cual tiene dos lados conocidos como A y B.
Este formato que un principio no fue concebido para comercializarse, adquirió una
popularidad tal que aún en la actualidad es utilizado. Su tamaño compacto, fiabilidad, bajo
costo de manufactura y capacidad de grabar audio estereo le dio a este formato gran
aceptación en el mercado.
Para 1965 se comenzó su producción en masa aunque su popularización no fue inmediata,
fue sólo hasta principio de los años 70s que se convirtió en el formato de cinta magnética
más utilizado.
En un principio la cinta se fabricó en ferrita (Fe2O3), pero luego se usaron otros materiales
como el dióxido de cromo (CrO2) y el metal para obtener mejor calidad en el sonido.
Fueron utilizados igualmente sistemas de reducción de ruido que se implementaban tanto
227
en grabadoras como en las máquinas reproductoras, de los cuales el más conocido es el
Dolby Noise Reduction (Dolby NR).
Figura 133 Audio cassette compacto
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.2.5.7 Microcassette. Es un formato que posee las mismas características de un cassette
compacto pero con la diferencia de ser más pequeño y poseer una velocidad de grabación
más lenta,
lo que implica que debe ser grabado exclusivamente en grabadoras de
microcassette.
Figura 134 Microcassette
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.2.5.8 L-Cassette. El L-Cassette fue un formato de corta vida creado por la compañía
Sony en 1976 con la intención de superar la calidad del cassette compacto, el cual no
presentaba la misma fidelidad del carrete abierto. El L-Cassette era muy similar al cassette
compacto, sólo que más grande.
228
4.3 REGISTRO DIGITAL
La ventaja del audio digital sobre el audio análogo respecto al almacenamiento es que la
información se codifica digitalmente haciéndola virtualmente incorruptible por sistemas de
ruido y distorsión propios de los medios de almacenamiento. Los sistemas de grabación
digital han sido ampliamente difundidos últimamente debido a sus características inherentes
como calidad, fidelidad e inalterabilidad del sonido. Existen varias clasificaciones para los
sistemas de grabación digital. Se pueden clasificar según el fenómeno físico involucrado, y
de esta forma tener sistemas:
-
electrónicos (memorias)
-
magnéticos (cintas, DAT)
-
ópticos (CD, DVD, minidisc)
También se pueden clasificar según el acceso temporal en:
-
temporarios (RAM)
-
editables (cinta, discos magnéticos)
-
definitivos (CD de solo lectura, ROM)
En esta sección se analizarán las tecnologías más difundidas actualmente en el mercado,
atendiendo a sus características más relevantes.
229
4.3.1 Compact Disc
4.3.1.1 Origen. En 1968, durante la Digital Audio Convention, Phillips decidió proyectar el
disco compacto. Es un formato fabricado con Policarbonato. En 1979 nace el Disco
Compacto de Audio y con él la primera revolución en la era digital.
En 1980 se estandariza el formato CD-DA. Posteriormente en 1983 se fabrica el CD-ROM
como medio de almacenamiento masivo de datos de sólo lectura, constituyendo la segunda
revolución digital. En 1984 se presenta el Libro Amarillo para el formato CD-ROM, para
luego editarse el Libro Verde para especificar el estándar CD-I (Disco Compato Interactivo
que combina video y sonido esterofónico).
En el año de 1990 se publica el Libro Naranja para especificar el formato de disco grabable,
el primero en aparecer es el CD-MO (Magneto-Ópticos), seguido por el CD-R que puede
almacenar hasta 650 MB. (no puede ser borrado ni volver a grabarse). Finalmente, llega el
CD-RW, el cual permite grabar y borrar datos hasta 1000 veces.
4.3.1.2 Sistema de lectura. El mecanismo de lectura del CD se basa en la utilización de un
fotosensor y un fotodiodo emisor de láser. Visto desde abajo, un CD presenta un espiral con
fosas (“pits”) y llanuras (“lands”) en un material aluminoreflectante. Un haz de láser incide
sobre el material que es reflejado en mayor o menor grado dependiendo si incide en el
borde de la fosa o no. El foto sensor detecta ésto como un uno o un cero dependiendo del
grado de intensidad de la reflexión.
La pista de un CD es leída desde el interior del disco hacia el exterior, permitiendo discos
de tamaño variable y maximiza el rendimiento de producción. La pista se lee a 1,2 m/s, de
forma que los bits tienen duración constante, exigiendo que el disco gire a menor velocidad
angular cuando se esté leyendo la periferia que cuando se lee el centro. Esta función la
realiza un servo motor de velocidad lineal constante (CLV), apoyándose en la señal leída
por los fotodetectores.
•
El foco debe mantenerse con precisión de ±0.5 µm.
•
La superficie de un disco tiene desviaciones de ±0.4 µm
230
•
Es necesario un mecanismo de enfoque que mueva el objetivo de forma automática
para mantener el foco.
4.3.1.3 Formatos CD
•
CD-DA (Compact Disc Digital Audio –Libro Rojo) Pertenece al Libro Rojo y fue
desarrollado por Phillips y Sony a principios de los años 80s. Está destinado al
formato de audio.
•
CD-ROM (ISO 9660 - Libro Amarillo) Este formato es el utilizado habitualmente
para datos. Su denominación fue plasmada en la norma ISO 9660, norma para la
estructura de archivos en un disco compacto.
•
CD-I (Interactive – Libro Verde) Formato multimedia que integra texto, gráficos,
video, audio y datos binarios (juegos, enciclopedias, películas, etc)
•
CD-ROM XA (Extended Architecture) Combinación del formato CD-ROM y el
CD-I, extensión del estándar Yellow Book, consistente con el formato ISO 9660,
pero diseñado para mejorar las capacidades de audio y video (tomadas del estándar
CD-I). Puede ser utilizado para el almacenamiento de datos solamente.
•
CD-R (Multisession –Libro Naranja) Derivación de los formatos anteriores, a
efectos de ser utilizados en grabadores de CD-ROM y aprovechar de este modo la
posibilidad de agregar datos a un CD-ROM
•
CD-RW (Multissesion –Libro Azul) Similar a la norma definida por el Libro
Naranja. La diferencia es que agrega la posibilidad de realizar una multisesión con
datos y audio. Al ser el formato más moderno puede presentar inconvenientes de
reconocimiento en varias lectoras.
231
Tabla 9 Velocidades de transferencia para CD convencional
1X
2X
4X
6X
8X
10X
12X
16X
20X
24X
32X
150 KB/s
300 KB/s
600 KB/s
900 KB/s
1200 KB/s
1500 KB/s
1800 KB/s
930 KB/s 2400 KB/s
1170 KB/s 3000 KB/s
1400 KB/s 3600 KB/s
2100 KB/s 4800 KB/s
Figura 135 Compact disc
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.3.2 Digital Audio Tape (DAT).
Digital Audio Tape es, como su nombre en inglés lo indica, una cinta de audio digital. Es
un formato de audio grabable introducido por la compañía Sony a final de los 80. La
intención era reemplaza en definitiva al cassette compacto, pero no obtuvo la popularidad
esperada, especialmente por la introducción de los sistemas ópticos (CD). Sin embargo,
DAT hoy en día se utiliza principalmente en estudios profesionales de grabación.
DAT surgió por la necesidad de un gran ancho de banda para el registro magnético de
señales de audio digital. El estándar DAT permite grabar a una tasa de 32kHz a 12 bits en 2
pistas, 44.1kHz o 48kHz a 16 bits en 2 o 4 pistas. A menor tasa de grabación, mayor
duración de grabación pero menor calidad. DAT supera al cassette convencional por el gran
232
ancho de banda que tiene que le permite grabar una porción mucha más amplia del
espectro. Además, debido a su naturaleza digital, es fácil reproducir una pista específica y/o
rebobinar.
4.3.2.1 Funcionamiento. El DAT tiene, a diferencia de los formatos análogos magnéticos
convencionales, un cabezal magnético rotativo. Esto permite tener una velocidad relativa
más grande entre el cabezal y la cinta lo que permite tener un ancho de banda superior para
la grabación.
Figura 136 DAT Cinta de audio digital
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.3.3 Digital Compact Cassette(DCC)
El cassette compacto digital es otro formato digital en cinta magnética. Fue introducido por
Philips en 1991. DCC difiere de DAT básicamente por dos razones. Primero, emplea una
cabeza magnética estática. Segundo, utiliza un algoritmo de compresión de datos.
4.3.4 DASH
Es un formato digital magnético. Es un formato versátil que acepta varias frecuencias de
muestro, velocidades de cinta y número de pistas.
233
4.3.5 Minidisc
Como su nombre lo indica, minidisc es una versión pequeña del CD. El objetivo es
disponer de la misma cantidad de audio que un CD en un área menor. Para ésto se utiliza
una tecnología óptico magnética. Se magnetiza una película delgada. La lectura de la
película hace uso del efecto Kell, por el cual un campo magnético introduce una rotación en
la polarización del haz láser. El cambio de polarización es detectado en forma similar al
CD. Este formato utiliza compresión psicoacústica.
Figura 137 Minidisc
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.3.6 DVD (Digital Versatile Disc)
DVD es un medio óptico de almacenamiento de todo tipo de información (video, datos,
sonido, etc.). El mecanismo de lectura y escritura es similar a la del CD, pero en el caso de
DVD los “lands” y los “pits” son mucho más pequeños lo que se traduce en mayor
información almacenable. DVD no es un medio exclusivamente diseñado para el sonido
sino para datos en general. Existen variedades de formatos de DVD: DVD-RAM, DVD-R
(grabable una vez), DVD-RW (regrabable)
234
Figura 138 DVD Digital Versatile Disc
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
4.3.7 Blu-Ray
Blu-ray es otro medio óptico de almacenamiento de todo tipo de información. Sin embargo,
utiliza un tipo de láser distinto al utilizado por el CD y por el DVD. Utiliza un haz de rayo
azul-violeta que tiene una longitud de onda más corta que el láser rojo convencional. De
esta forma, el láser puede ser concentrado en espacios más pequeños y por ende, se puede
grabar más información.
Figura 139 Blu-ray
Fuente: SCHOENHERR, Steve. Recording history. s.l.:s.n. 2003
< http://history.acusd.edu/gen/recording/notes.html> [consulta: 20 Abr. 2005]
235
4.3.8 HDVD (“High definition volumetric display”)
HDVD es el resultado de la fusión entre las compañías Sonic y Revisent. Es básicamente
un formato de almacenamiento masivo que supera al DVD convencional. La resolución de
HDVD es cuatro veces superior lo que permite una alta definición. Es actualmente la
competencia directa de Blu- Ray.
236
5. CONCLUSIONES
El curso Principios de Audio le abre las puertas a los estudiantes de Ingeniería Electrónica e
Informática para comenzar una nueva ruta electiva en el vasto terreno del audio. Este
proyecto es una pieza fundamental para la continuidad de los cursos y está orientado a el
diseño de una metodología óptima para la enseñanza.
Es necesario un fundamento teórico sólido para abordar la inmensidad de temas
relacionados con el sonido y la acústica. Por esta razón, aquellos ingenieros con propósitos
de incursionar en temas avanzados en sonido y acústica encontrarán en este libro un apoyo
conceptual que les servirá como un importante punto de partida.
Los temas presentados en el texto fueron compendiados de acuerdo a criterios de enseñanza
en pregrado. Sin embargo cabe aclarar que cada uno de los temas puede ser explorado e
intensificado mucho más en términos de complejidad matemática y física y de nuevas
tecnologías. Aún así, el texto trata de manera exhaustiva y con un grado alto de
profundización los temas seleccionados.
La manera más óptima de exponer los temas tratados en el libro es a través de recursos que
permitan la participación entusiasta del estudiante: presentaciones con diapositivas,
ejemplos sonoros, simulaciones, animaciones, videos, etc. Además, la parte teórica del
curso debe ir acompañada de una parte de laboratorio para aplicar los conceptos
aprendidos.
237
BIBLIOGRAFÍA
BORÉ, Gerhart and PEUS, Stephan. Microphones. Berlin: Druck-Centrum Fürst, 1999.
78p.
BRUSCIANELLI, Calogero. Acústica, psicoacústica y electroacústica. s.l. Universidad
Simón Bolívar, Departamento de electrónica., 1995. 260p.
CASTAÑEDA, Carlos y RODRÍGUEZ, Juan. Audio digital. Medellín.1985. 212p. Tesis.
(ingeniero electrónico). UPB. Facultad de Ingeniería Eléctrica y Electrónica.
CORREA, Juan. Electrónica musical. Medellín. 1999. 183p.Tesis. (ingeniero electrónico).
UPB. Facultad de Ingeniería Eléctrica y Electrónica.
MARTIN, Geoff. Introduction to sound recording. sl:sn. 2004, 843p.
MIYARA, Federico. Acústica y sistemas de sonido. Bogotá: Fundación Decibel, 2004.
319p.
MOMPÍN POBLET, José. Manual de alta fidelidad y sonido profesional. Barcelona:
Marcombo, 1984. 241p. (serie Mundo Electrónico)
RECUERO LÓPEZ, Manuel. Ingeniería acústica. Madrid: Paraninfo, 1995. 654p.
SAPOSHKOV, M.A. Electroacústica. Barcelona: Reverté, 1983. 273p.
WATKINSON, John. An introduction to digital audio. Londres: Clays, 1995. 385p.
238
ANEXOA
Principios de audio
José Ricardo Zapata
Jorge H. Jaramillo Hoyos
Facultad de Ingeniería Electrónica de la UPB
Abstract—This article describes the most relevant
aspects of an introductory course in audio. The first
part includes an introduction to sound with
emphasis on its wavelike nature. Also, the human
mechanisms of voice production and hearing are
discussed pointing out physical and physiological
characteristics. After the introduction, an overview
of acoustics, as an independent branch of physics, is
presented. Acoustics, as a multidisciplinary field is
very broad so only four topics shall be analyzed:
psychoacustics, architectural acoustics, musical
acoustics, and acoustic noise. After studying
acoustics, several audio processing devices are
described: microphones, loudspeakers, compressors,
etc. as well as an introduction to digital audio.
Finally, modern recording techniques are presented
along with a brief history of its origin.
I. GENERALIDADES DEL SONIDO
U
na onda es un ente físico que permite la
propagación de energía entre dos puntos sin
necesidad de transferir masa. Las ondas
mecánicas son aquellas que necesitan de un medio
elástico (aire por ejemplo) para su propagación.
Existen dos tipos básicos de ondas mecánicas:
-ondas longitudinales: Ondas en el cual el
movimiento de las partículas es paralelo a la
dirección de propagación.
-ondas transversales: Ondas en el cual el
movimiento de las partículas es perpendicular a la
dirección de propagación.
El sonido es un ejemplo de onda mecánica
longitudinal y por eso de ahora en adelante se
referirá a este tipo de ondas.
El sonido tiene su origen en las vibraciones en un
medio elástico, es decir, las vibraciones deben
ocurrir en un medio que sea capaz de transmitir
esas vibraciones.
Estos son los dos elementos esenciales para la
existencia de un sonido:
• un ente vibrante
• un medio con capacidad de transmitir
esas vibraciones
(Existe un tercer elemento, la capacidad humana
de percibir esas vibraciones, relacionado con un
campo fundamental de la acústica (la
psicoacústica) el cual será tratado posteriormente.)
El ente vibrante puede ser de naturaleza muy
diversa como: las cuerdas vocales en la garganta,
las cuerdas de un violín, una descarga eléctrica,
golpes, pájaros, etc. El medio también es de
índole muy variada como aire, madera, agua,
metal, etc. (siendo el aire el medio elástico más
común).
Las ondas sonoras son ondas longitudinales de
presión. Sin embargo, para poder representarlas
gráficamente, se dibuja una onda transversal ya
que es más fácil de visualizar. Para hacer ésto, los
movimientos característicos de una onda
longitudinal hacia adelante y hacia atrás se
representan por movimientos por encima y por
detrás de una línea de referencia que corresponde
a la posición de reposo.
posición
de reposo
Fig. 1 Onda de presión (sonora)
239
Las flechas en la figura representan los
desplazamientos de las partículas de aire en
sentido longitudinal, aunque aparecen en la
gráfica en sentido transversal (solamente por
facilidad visual).
El análisis de las ondas sonoras se puede realizar
en el dominio del tiempo o en el dominio de la
frecuencia. El análisis en cada dominio tiene
características complementarias y se puede
intercambiar de dominios utilizando las técnicas
de Fourier. Todas las ondas periódicas se pueden
sintetizar a partir de la función seno mediante el
Análisis de Fourier. Jean-Baptiste Joseph Fourier,
barón de Auxerre (1768-1830), desarrolló un tipo
de análisis matemático por el que cualquier onda
periódica compuesta, puede descomponerse en
una suma de ondas senoidales de amplitud,
frecuencia y fase adecuadas. Las frecuencias de
estas ondas senoidales guardan una relación
estrecha pues son todas múltiplos enteros de la
frecuencia fundamental. Es decir, cualquier
función periódica se puede escribir como una
sumatoria (finita o no) de términos seno pues estas
funciones son base ortogonal para el espacio de
las funciones periódicas. El espectro de estas
señales (es decir el conjunto de frecuencias
asociadas) es discreto: contiene solo los múltiplos
enteros de la frecuencia fundamental.
Las ondas se pueden clasificar de acuerdo a su
geometría. El criterio es la forma del frente de
onda. El frente de onda es el lugar geométrico de
los puntos en un medio que se encuentran en un
mismo estado vibratorio en un instante dado.
Dependiendo de la forma del frente de onda, se
tendrán distintos tipos de ondas: planas, esféricas
y cilíndricas.
Las siguientes propiedades son características de
todas las ondas, pero en el sonido cobran gran
relevancia al explicar varios efectos que serán
explicados en posteriores capítulos. Estas
propiedades son:
-
Principio de Huygens
Teorema de Malus
Superposición
Reflexión
Refracción
Absorción
Interferencia
-
Difracción
Efecto Pulsatorio
Efecto Doppler
Resonancia
II. VOZ HUMANA
La fuente del sonido para la voz humana es la
vibración de las cuerdas vocales y efectos
adyacentes producidos por todo el tracto vocal:
laringe, faringe, boca y cavidad nasal. El principio
físico relevante para la producción de sonido en el
hombre es el de Bernoulli. Este principio
establece que en el movimiento de un fluido la
presión es menor en lugares donde la velocidad es
mayor, y viceversa. La diferencia de presiones
ocasiona una fuerza efectiva, llamada fuerza de
Bernoulli. En el caso de las cuerdas vocales, el
aire que pasa a través de ellas proveniente de los
pulmones hace que las cuerdas vocales se cierren.
Inmediatamente después que éstas se cierran,
presión de aire se acumula en la tráquea haciendo
que se vuelvan a abrir nuevamente. Este ciclo se
repite una y otra vez. La tasa a la cual se abre y se
cierran las cuerdas vocales determina la
frecuencia de los sonidos resultantes. El sistema
vibratorio produce una rápida oscilación de la
presión de aire en el aparato vocal generando. La
voz también está determinada por las posiciones
de los labios, la mandíbula, la lengua y la laringe.
Fig. 2 Diagrama del tracto vocal
240
De acuerdo con lo expuesto, el órgano de la voz
se puede dividir en tres grandes unidades que son:
- los pulmones que aportan energía
- las cuerdas vocales que actúan como
osciladores al vibrar
el tracto vocal completo que actúa como una caja
de resonancia
III. EL OÍDO HUMANO
El oído humano es uno de los órganos más
impresionantes del cuerpo pues posee un rango
increíble de sensibilidad, tanto en frecuencia
como en amplitud. El oído responde a frecuencias
entre 20Hz y 20kHz y responde a una rango de
variación de presiones de 1,000,000 a 1. El
fenómeno de la percepción sonora en los humanos
es un proceso complejo que requiere un análisis
que se desarrolla en tres etapas básicas:
•
•
•
captación de las ondas sonoras
conversión de la señal acústica en
impulsos nerviosos y la transmisión de
esos impulsos hasta el cerebro
procesamiento neural de la información
Las primeras dos etapas se producen en el oído
mientras que la última ocurre en el cerebro
propiamente dicho. Las variaciones de presión del
aire causadas por las ondas sonoras se convierten
en vibraciones mecánicas que a su vez producen
vibraciones de un fluido. Estas generan impulsos
eléctricos, y el cerebro los transforma en
sensaciones auditivas.
Solamente se discutirá la fisiología del oído, el
cual se divide en tres partes que operan de manera
complementaria: el oído externo, el oído medio y
el oído interno.
Estas tres partes del oído constituyen el sistema
periférico de audición.
IV. PSICOACÚSTICA
La psicoacústica estudia la relación entre los
parámetros físicos del sonido y nuestra percepción
subjetiva de ellos. Los parámetros psicoacústicos
más relevantes son:
-
sonoridad
altura
timbre
La sonoridad es la percepción subjetiva de la
intensidad sonora. La altura o tono está ligada a la
gravedad o que tan agudo es un de sonido. Está
relacionado con la frecuencia fundamental de la
señal sonora. El timbre es caracterizado por la
forma de la onda, o su componente armónico. Sin
embargo, debido a la sensibilidad y respuesta en
frecuencia del oído humano, estos términos en el
contexto de la psicoacústica no son totalmente
independientes. Nuestra habilidad para percibir
cualquier estímulo utilizando nuestros sentidos
está limitada por dos situaciones principalmente:
-
limitaciones físicas
la habilidad del cerebro para procesar la
información
Las limitaciones físicas determinan las fronteras
absolutas de rango de sensibilidad para nuestra
audición. El hecho que los humanos percibamos
frecuencias desde los 20 Hz hasta los 20kHz
(aunque estos valores pueden variar de persona a
persona debido a la edad, sexo, etc.) está
establecido por la construcción física de nuestro
oído y sus componentes internos. Igualmente, no
podemos detectar todas las intensidades.
La habilidad del cerebro para procesar
información es un poco más difícil de analizar,
pero se puede observar la deficiencia de éste
cuando en el cerebro se enmascaran ciertas
frecuencias (es decir escuchamos unas pero otras,
aún estando ahí, las ignoramos).
V. ACÚSTICA MUSICAL
Fig. 3 Diagrama completo del oído
241
La acústica musical es un capítulo importante de
la acústica y estudia la relación entre los sonidos,
haciendo particular énfasis en el tono y la cualidad
tímbrica de éstos. Hace parte de la acústica
musical el estudio de la consonancia y disonancia,
las escalas musicales y el comportamiento de los
distintos instrumentos musicales, acústicos y
electrónicos. Un instrumento musical consiste en
la combinación de uno o más sistemas resonantes
capaces de producir uno o más tonos, además de
los medios para excitar estos sistemas. Estos se
pueden clasificar según la familia a la cual
pertenecen (dependiendo del modo en que se
produce el sonido): instrumentos de percusión,
instrumentos de cuerda, instrumentos de viento y
instrumentos electrónicos. Cada una de estas
categorías a su vez pueden ser subdivididas en
otras más específicas atendiendo a alguna
característica.
VI. ACÚSTICA ARQUITECTÓNICA
La acústica arquitectónica estudia todos los
fenómenos relacionados con la propagación del
sonido en un recinto es decir, el comportamiento
de las ondas sonoras respecto al espacio que la
rodea. El estudio parte desde la generación del
sonido por parte de la fuente hasta el instante en
que llega la onda sonora hasta los oídos. Los
recintos son la interfase entre una fuente de
sonido, sea natural o electrónica, y nuestro oído.
Los fenómenos sonoros más importantes
relacionados con propagación en un recinto son:
la reflexión, la refracción, la absorción y la
difracción, siendo la reflexión la más importante.
Esto debido a las numerosas reflexiones de la
energía sonora en un recinto en el piso, las
paredes, personas, obstáculos en general, creando
un campo sonoro complejo que merece especial
atención La acústica arquitectónica también
analiza todos los parámetros que influyen en la
calidad acústica de un recinto y así diseñar un
óptimo tratamiento acústico. La calidad acústica
se refiere a la transmisión fiel y funcional del
sonido, obviamente dependiendo de la aplicación.
Existen distintas aplicaciones específicas en el
diseño de recintos como por ejemplo diseño de
salas de grabación, salas de cine, auditorios,
salones de clase, etc. que deben tener unas
cualidades acústicas determinadas y específicas
para dicha aplicación. Por cualidad acústica se
entienden una serie de propiedades relacionadas
con el sonido en un recinto como los ecos, la
reverberación, las reflexiones tempranas, el
campo sonoro generado, etc. Estas propiedades
dependen a su vez de la geometría del recinto así
como de los materiales empleados en su
construcción y recubrimiento. El objetivo del
tratamiento acústico de recintos es modificar la
respuesta del recinto al estímulo de ondas sonoras
en un sentido conveniente.
VII. RUIDO ACÚSTICO
El ruido acústico se puede entender como el
sonido no deseado. La diferencia entre sonido y
ruido depende tanto del nivel de presión sonora
como de la respuesta subjetiva del oído. El grado
de molestia del ruido aumenta al aumentar el nivel
de presión sonora y la respuesta subjetiva del oído
depende de la naturaleza del sonido.
Debido a la naturaleza indeseada del ruido, éste se
considera un contaminante y es deseable atenuarlo
en gran medida.
VIII. ELECTROACÚSTICA Y
PROCESAMIENTO DE AUDIO
La electroacústica es la parte de la acústica que se
ocupa del estudio, análisis, diseño de dispositivos
que convierten energía eléctrica en acústica y
viceversa, así como de sus componentes
asociados. Entre estos
se encuentran los
micrófonos, acelerómetros, altavoces, excitadores
de
compresión,
auriculares,
audífonos,
calibradores acústicos y vibradores.
Los micrófonos y altavoces son sus máximos
representantes.
Estos
son
denominados
genericamente transductores: dispositivos que
transforman sonido en electricidad y vice-versa.
Esta conversión de entes de naturaleza
completamente distinta, se realiza acudiendo a
principios electromecánicos y electromagnéticos
que se discutirán cuando se estén analizando los
micrófonos y posteriormente los altavoces.
Los elementos de procesamiento de audio son
dispositivos que alteran o modifican de alguna
forma características del sonido, cuando éste está
representado por una variable eléctrica. Las
características que modifican son de índole
variada como: amplitud, rango dinámico,
respuesta en frecuencia, respuesta en el tiempo,
242
timbre, etc. El procesamiento se lleva a cabo de
manera electrónica, utilizando la tecnología de
semiconductores y la tecnología digital.
Los micrófonos son transductores que convierten
energía
sonora
en
energía
eléctrica.
Específicamente, convierten presión sonora en
tensión eléctrica. Esta tensión eléctrica
(convertible a una corriente utilizando un resistor)
es análoga al sonido en cuanto a su forma de
onda.
la señal. Esto se hace atenuando la amplitud de
señales (tensiones) superiores a una amplitud de
referencia denominada umbral.
VCA
Entrada
Salida
Control de
Ganancia
Detector de
Nivel
Relación de
Compresión
Fig. 6. Estructura de un compresor
Fig. 4 Micrófonos
Los altavoces son los dispositivos duales a los
micrófonos: convierten la energía eléctrica
nuevamente en energía acústica. Los altavoces
son también denominados altoparlantes o
simplemente parlantes. En general, estos constan
de un mecanismo para convertir la energía
eléctrica en energía mecánica ( de movimiento) y
otro mecanismo para convertir los movimientos
en sonido para su propagación en el aire. En la
cadena de audio, los altavoces son considerados
como el elemento más delicado para la
reproducción fiel del sonido.
Fig. 6 Altavoces
Un compresor de audio es un procesador
electrónico capaz de reducir el rango dinámico de
El audio digital es una de las aplicaciones más
importantes que han tenido las técnicas digitales
respecto a la generación, el procesamiento, el
almacenamiento y el análisis del sonido. Esto ha
sido consecuencia de los progresos de la
microelectrónica que ha podido revolucionar la
forma en que se manejan y transforman cada vez
con más precisión y rapidez la enorme cantidad de
información contenida en el sonido. Una gran
contribución de las técnicas digitales fue el
desarrollo de sistemas de almacenamiento de
sonido de gran inalterabilidad y fidelidad. Otra
gran contribución fue la introducción de nuevas
técnicas de procesamiento sonoro de naturaleza
digital y efectos como retardos, reverberaciones y
envolventes.
IX. FORMATOS DE GRABACIÓN
La primera grabación de sonido fue realizada por
Thomas Edison en el año de 1877 en un repetidor
telefónico. Ese mismo año, el señor Edison se
inventó el fonógrafo (Reproductor de discos), un
equipo mas complejo en el cual el sonido pasaba
de la bocina a la boquilla central, provocando la
vibración del diafragma. Actualmente se utilizan
popularmente el registro magnético y el registro
óptico. El principio de la grabación magnética es
el de generar una fuerza magnética proporcional a
la señal a grabar y aplicarla mediante el cabezal de
grabación en una pequeña región de una cinta
recubierta de partículas ferromagnéticas. El
cabezal es el elemento encargado de producir la
fuerza. El cabezal está compuesto por una bobina,
el núcleo y el entrehierro. Cuando una corriente i
pasa a través de la bobina, se produce un campo
243
magnético en el cabezal, más específicamente en
el entrehierro.
cabezal
magnético
en pregrado. Sin embargo cabe aclarar que cada
uno de los temas puede ser explorado e
intensificado mucho más en términos de
complejidad matemática y física y de nuevas
tecnologías. Aún así, el texto trata de manera
exhaustiva y con un grado alto de profundización
los temas seleccionados.
cinta
REFERENCIAS
Fig. 8 Diagrama del cabezal
El mecanismo óptico es un medio utilizado en los
discos compactos por ejemplo. El mecanismo de
lectura del CD se basa en la utilización de un
fotosensor y un fotodiodo emisor de láser. Visto
desde abajo, un CD presenta un espiral con fosas
(“pits”) y llanuras (“lands”) en un material
aluminoreflectante. Un haz de láser incide sobre el
material que es reflejado en mayor o menor grado
dependiendo si incide en el borde de la fosa o no.
El foto sensor detecta ésto como un uno o un cero
dependiendo del grado de intensidad de la
reflexión.
La pista de un CD es leída desde el interior del
disco hacia el exterior, permitiendo discos de
tamaño variable y maximiza el rendimiento de
producción.
[1]
[2]
[3]
F. Miyara. Acústica y sistemas de sonido. Fundación
decibel, 1998
M.Recuero. Ingeniería Acústica.Paraninfo, 1995
M.Saposhkov. Electroacústica, Reverté, 1983
Jorge Jaramillo nació en Rionegro, Antioquia
en 1982. Cursó estudios de primaria y bachillerato en el
Colegio Albania de La Guajira. Es egresado de la Facultad de
Ingeniería Electrónica de la UPB. Sus campos de interés son
las matemáticas y la investigacion en ciencias exactas en
general
José Ricardo Zapata nació en Medellín en 1981. Es ingeniero
electrónico de la UPB y está optando al título de Magister en
Telecomunicaciones. Actualmente se desempeña como
docente en el área de Audio.
Fig. 9 Disco compacto
X. CONCLUSIONES
Es necesario un fundamento teórico sólido para
abordar la inmensidad de temas relacionados con
el sonido y la acústica. Por esta razón, aquellos
ingenieros con propósitos de incursionar en temas
avanzados en sonido y acústica encontrarán en
este libro un apoyo conceptual que les servirá
como un importante punto de partida.
Los temas presentados en el texto fueron
compendiados de acuerdo a criterios de enseñanza
244
ANEXO B
PROYECTO DE TRABAJO DE GRADO
PRINCIPIOS DE AUDIO
Estudiante:
CC. 8’162,904 de Envigado
Carné: 00154975
Teléfono: 313 22 71
Celular: 300 556 0003
Jorge Hernán Jaramillo Hoyos
Facultad de Ingeniería Electrónica
Universidad Pontificia Bolivariana
e-mail: [email protected]
Director:
CC. 71’375.690 de Medellín
Teléfono: 415 90 95 Ext. 111
Celular: 300 773 81 00
IEO. José Ricardo Zapata González
Grupo de Investigación GIDATI
Universidad Pontificia Bolivariana
e-mail: [email protected]
Asesor:
CC. 91’425.195 de Barrancabermeja
Teléfono: 2657000 Ext.269
Magister Tony Peñarredonda
Universidad Pontificia Bolivariana
e-mail: [email protected]
Universidad Pontificia Bolivariana
Medellín
Febrero 2005
245
1. INVOLUCRADOS
Estudiante
Nombre:
Facultad:
Situación:
Promedio acumulado:
Jorge Hernán Jaramillo Hoyos
Ingeniería Electrónica
Egresado
4.2
Director
Nombre:
Grado:
Cargo:
Institución:
José Ricardo Zapata
Ingeniero Electrónico Universidad Pontificia Bolivariana
Docente tiempo completo
Universidad Pontificia Bolivariana
Asesor
Nombre:
Grado:
Cargo:
Institución:
Tony Peñarredonda Caraballo
Ingeniero Electrónico Universidad Pontificia Bolivariana
Jefe de ingeniería
Discos Fuentes
2. MODALIDAD
Asistencia a la Docencia
3. TEMA DEL PROYECTO
La Facultad Eléctrica y Electrónica de la Universidad Pontificia Bolivariana ofrece a partir
de Enero de 2005 la nueva línea optativa de Audio que comprende tres cursos: Principios
de Audio, Sistemas de Audio y Audio y sus Aplicaciones. El primero de estos cursos,
Principios de Audio, es el objeto de este proyecto. El curso será documentado
completamente mediante un texto guía que sirva como apoyo pedagógico para los
estudiantes. (ver numeral 8 para detalles del contenido). Como ayuda al docente para la
exposición de los temas, se realizarán presentaciones en Powerpoint ilustrativas y
didácticas. También se buscarán formas de hacer interactivas las clases a través de ejemplos
varios relevantes al audio como lo son simulaciones, ejemplos sonoros, videos, etc.
246
Tipo de trabajo
%
Teórico
Búsqueda/Estudio
Desarrollo
70
30
Áreas
Ciencias Básicas
Circuitos
%
30
30
Procesamiento de
señales
40
4. ANTECEDENTES
La Ingeniería de Audio se centra en los fenómenos acústicos desde su generación y
propagación hasta sus aplicaciones en el diseño de recintos, eliminación de ruido y
distorsión, implementación de hardware especializado, etc. La Ingeniería de Audio aparece
como una rama de la Ingeniería Eléctrica y Electrónica y su estudio es fundamental en
sistemas de transmisión de información al ser la voz el primer tipo de comunicación y uno
de los tres grandes tipos de tráfico en redes e interconexiones utilizados como parte integral
del proceso de comunicación. Por esta razón, la Ingeniería de Audio ha cobrado mucha
importancia en los últimos años con relación a sistemas de telecomunicaciones e
informáticos.
La Universidad Pontificia Bolivariana ha fomentado la participación de los estudiantes de
último semestre en la elaboración de tesis de grado concerniente al audio y sus
aplicaciones. Los trabajos citados a continuación servirán como referencia para la
realización de este proyecto:
Audio digital elaborada por Carlos Eduardo Castañeda R. y Juan José Rodríguez
Plataforma para el procesamiento digital de señales de audio elaborada por Ricardo
Antonio García Ortega
Electrónica musical elaborada por Juan Diego Correa
Manual de estudio e implementación de practicas de procesamiento digital de
señales con tms320c3x, elaborada por Luis David Emiliani y Maria Cecilia Jaramillo
(trabajo de asistencia a la docencia.)
247
No había existido hasta ahora materias que trataran de manera sistemática y exhaustiva los
sistemas de audio y en el ámbito regional no se había trabajado cursos de este tipo. Por esta
razón existe la propuesta de documentar el curso Principios de Audio con el fin de asistir en
esta etapa pionera e introductoria de la nueva línea de Audio.
5. OBJETIVOS
5.1 Objetivo general
ƒ Asistir en la metodología y preparación de material didáctico para la enseñanza de la
materia Principios de Audio, materia de la nueva línea de Audio de la Universidad
Pontificia Bolivariana.
5.2 Objetivos específicos
ƒ Recolectar y analizar información concerniente a los temas tratados en la asignatura
Principios de audio.
ƒ Redactar un texto guía con el contenido del curso Principios de Audio para su posterior
utilización por parte de los estudiantes que asistan la materia en cuestión.
ƒ Realizar presentaciones del curso en Powerpoint con el fin de asistir directamente al
docente para facilitar la exposición de los temas.
ƒ Buscar la participación interactiva con los estudiantes a través de ejemplos en audio,
simulaciones, videos, etc. relevantes al contenido del curso.
ƒ Constatar la relevancia de los sistemas de Audio en la Ingeniería, concretamente en
sistemas de telecomunicaciones e informáticos.
5. JUSTIFICACIÓN Y BENEFICIOS
El curso Principios de Audio le abre las puertas a los estudiantes de Ingeniería Electrónica e
Informática para comenzar una nueva ruta electiva en el vasto terreno del audio. Para el
óptimo aprovechamiento del curso, éste debe ser documentado de una manera explícita y
precisa mostrando claramente los conceptos e ilustrándolos mediante una adecuada
diagramación y una serie de ejemplos que los estudiantes puedan asimilar. Es una
oportunidad para brindarle a la comunidad académica un apoyo en las labores de docencia
(para el profesor) y de aprendizaje (para los estudiantes.) El proyecto es una pieza
fundamental para la continuidad de los cursos y está orientado a el diseño de una
metodología óptima para la enseñanza.
6. ALCANCE
Comprende la recolección de la información necesaria para la elaboración de un texto
completo y de alta calidad como respaldo pedagógico al curso Principios de Audio. Este
deberá ir en perfecta concordancia con el manual de laboratorio, proyecto en elaboración.
Además se generará un mecanismo pionero para la investigación en diversos tópicos de
audio.
248
7. TABLA DE CONTENIDOS
UNIDAD 1: NIVELATORIO
- Matemática para Audio.
- Física de ondas.
- Medidas.
- Teoría musical (solfeo, instrumentos).
- Tecnología musical (Tecnología que se usa actualmente)
- Sistema Auditivo
UNIDAD 2: ACUSTICA
- Propagación y principios acústicos
- Fundamentos de arquitectura.(Factores que afectan la calidad acústica de un recinto,
aislamientos acústicos, materiales y estructuras absorbentes de sonido)
- Psicoacústica
- Ruido acústico
- Técnicas de reducción de ruido
UNIDAD 3: ELEMENTOS PARA PROCESAMIENTO DE AUDIO
(Hardware y Software)
- Amplificadores
- Atenuadores
- Filtros
- Ecualizadores
- Retardadores
- Efectos de audio
- Fuentes
- Unidades dinámicas
- Consolas
- Transductores
UNIDAD 4: GRABACION Y EDICION DE AUDIO
- Formatos de grabación análoga (cassettes, discos de vinilo.)
- Formatos de grabación digital ( DAT, DASH, Disco Duro,CD,DVD,Minidisc)
- Sistemas de Grabación.
- Sistemas de Edición de Audio.
249
8. PRESUPUESTO Y RECURSOS NECESARIOS
TABLA DE RECURSOS NECESARIOS
Recurso presupuestado
Participación (Miles de Pesos)
Estudiante
Fotocopias y bibliografía
Internet, llamadas y fax larga distancia
200
240
Servicios de Cómputo (200h @
5k$/h)
1000
Implica desembolso
SI
NO
(Existente)
(Nuevo)
200
240
1000
U.P.B.
Trabajo Asesor (30h @ 40k$/h
Magíster)
1200
1200
Trabajo Director (80h @ 25k$/h
Profesional)
2000
2000
Imprevisibles(10%)
144
1584
Subtotales por columna
320
3520
44
484
5104
Totales
420
4620
5104
9. FINANCIACIÓN
La financiación de los recursos para la elaboración del proyecto provendrán del estudiante
y por parte del grupo de investigación GIDATI.
10. CRONOGRAMA DE OCUPACIÓN
Actividades/Meses
Feb Mar
2005
Abr May
1. Busqueda
Bibliográfica
2. Formulación del
Proyecto
3. Redacción
Documento
4. Preparación
Exposiciones y
ejemplos
5. Revisión del
informe por parte
de los jurados
Horas Totales
Numero de
Graduandos
Jun
Jul
Aug
Ocupación
(horas)
200
100
250
200
---
750
1
250
11. BIBLIOGRAFÍA
Libros
[1] Curso Práctico de Luces y Sonido
Audio Digital
Cekit
[2] Electroacústica
M.A. Saposhkov
Editorial Reverté
Biblioteca Universidad Pontificia Bolivariana
[3] Ingeniería Acústica
Manuel Recuero López
Paraninfo
[4] Sound System Engineering
Don Davis, Carolyn Davis
Sams, 1987
Biblioteca Universidad Nacional de Colombia
[5] Tesis
Audio Digital
Carlos Eduardo Castañeda
Juan José Rodríguez 1985
Biblioteca Universidad Pontificia Bolivariana
[6] Tesis
Electrónica Musical
Juan Diego Correa 1999
[7] Tratamiento Digital de Señales
John G. Proakis
Prentice Hall
Biblioteca Universidad Pontificia Bolivariana
Sitios en Internet
http://www.aes.org
http://www.diac.upm.es/asignaturas/sistaudio/TFC%20Ignacio/index.html
251
http://www.epanorama.net/links/audiocircuits.html
http://www.eumus.edu.uy/docentes/maggiolo/acu/acuvin.html
http://www.eumus.edu.uy/docentes/maggiolo/acuapu/
http://www.kettering.edu/%7Edrussell/demos.html
http://www.silcom.com/~aludwig/contents.htm
http://www.tic3tac.com/acustica_curso.htm
252
12. PROPIEDAD INTELECTUAL Y DESTINACIÓN DEL PROYECTO
Debido a la modalidad de este proyecto (Asistencia a la Docencia), debe quedar explícito
que la autoría del proyecto es del Ingeniero José Ricardo Zapata (Director) y el estudiante
Jorge Hernán Jaramillo, que trabaja en un objetivo propuesto por el director, obtiene como
consecuencia un reconocimiento moral como asistente en la elaboración del proyecto.
A continuación se presenta un acta de reconocimiento de las partes involucradas:
ACTA DE PROPIEDAD INTELECTUAL DEL PROYECTO : PRINCIPIOS DE
AUDIO
Los derechos de autor corresponden al Director del proyecto : El Ingeniero Electrónico José
Ricardo Zapata González, y al estudiante de Ingeniería Electrónica: Jorge Hernán Jaramillo
Hoyos, el cual hará aportes intelectuales en los avances y en el resultado final del proyecto
como asistente del mismo.
1. Director y el graduando serán autor y coautor respectivamente de todas las
publicaciones Nacionales e Internacionales que genere el proyecto. Asumirán la
responsabilidad ética y profesional de darle los créditos a los asesores y entidades
que directa o indirectamente apoyen el proyecto; tanto como a la Universidad
Pontificia Bolivariana, Facultad de Ingeniería Eléctrica - Electrónica.
2. Los derechos patrimoniales pertenecerán al docente José Ricardo Zapata y a la
Universidad Pontificia Bolivariana.
3. Cláusulas de confidencialidad: Toda información entregada por el director a el
estudiante, para la elaboración del trabajo dirigido de grado deberá ser manejada
con la máxima confidencialidad. Cualquier uso que el estudiante le de a la
información, deberá ser consultado previamente con el director y éste dar
consentimiento para su uso.
4. Causales de retiro. El retiro podrá ser voluntario o ser motivado por el
incumplimiento de las obligaciones de una de las partes.
5. Constancias. Todos los participantes conocen y aceptan el reglamento de
elaboración de trabajos de grado de IEE.
Jorge Hernán Jaramillo Hoyos
José Ricardo Zapata González
CC. 8’162.904 de Envigado
CC. 71’375.690 de Medellín
253
ANEXO C
DIARIO DE CAMPO
# SEMANA EN DESCRIPCIÓN
EL MES
DE
LABOR
REALIZADA
1 FEBRERO
preparación del
anteproyecto.
2 FEBRERO
preparación del
anteproyecto
3 FEBRERO
búsqueda
bibliográfica y
asistencia a clase
4 FEBRERO
búsqueda
bibliográfica en
biblioteca UPB y
asistencia a clase
1 MARZO
búsqueda
bibliográfica,
asistencia a clase
y
redacción
primer capítulo
2 MARZO
redacción primer
capítulo
y
asistencia a clase
3 MARZO
redacción
segundo capítulo
correcciones del
primer capítulo
4 MARZO
redacción
segundo
capítulo,
asistencia a clase
1 ABRIL
redacción
segundo
capítulo,
búsqueda
bibliográfica
biblioteca UPB
2 ABRIL
redacción
y
corrección
HORAS
DEDICADAS
(APROX.)
20
20
20
20
30
20
20
20
20
10
FIRMA
DIRECTOR
254
3 ABRIL
1 MAYO
2 MAYO
3 MAYO
4 MAYO
1 JUNIO
2 JUNIO
3 JUNIO
redacción
y
corrección,
búsqueda
bibliográfica
Universidad
EAFIT
redacción tercer
capítulo
redacción
y
corrección
redacción tercer
y cuarto capítulo
redacción tercer
y cuarto capítulo
corrección
y
preparación
diapositivas
corrección,
preparación de
diapositivas
y
ejemplos
corrección
preparación de
diapositivas
y
ejemplos
40
20
30
40
40
40
40
40
255
ANEXO D
Carta cumplimiento de objetivos
Medellín, Julio de 2005
Señores
FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
COMITÉ DE ASUNTOS ACADÉMICOS
UNIVERSIDAD PONTIFICIA BOLIVARIANA
La ciudad
Referencia: Cumplimiento de objetivos del trabajo de grado “Principios de audio”.
Como director del proyecto de grado “Principios de audio”, realizado por el estudiante
Jorge H. Jaramillo Hoyos con carné número 00154975 y ID 000017819, comunico a
ustedes el cumplimiento de los objetivos planteados y acepto que el informe cumple con los
estándares de presentación exigidos por la facultad en la presentación de trabajos de grado.
José Ricardo Zapata.
Director del proyecto.
256
Descargar