Fundamentos matemáticos de la música Cristian Manuel Bañuelos Hinojosa (versión 1, 11 abril 2011) “Tanto el matemático como el músico son creadores libres de un mundo de belleza ordenada” - Bertrand Russell Introducción El objetivo de este curso es comprender mejor la música desde el punto de vista matemático, especialmente geométrico y algebraico. Las artes musicales se caracterizan por su expresividad y habilidad de capturar sentimientos muy abstractos. Es interesante imaginar que la matemática, siendo tan objetiva y aparentemente fría, tenga alguna relación con las emociones evocadas por la música. Sin embargo, al estudiar a detalle las propiedades de las obras musicales es innegable la noción de que se encuentran plagadas de simetrías. Podemos pensar a la matemática como una herramienta que organiza los sonidos en el tiempo. De la misma forma que un pintor conoce las relaciones de los colores y de que modo interactúan entre sí; la matemática abre una puerta al análisis de los sonidos y sus relaciones, que utilizados correctamente, sirven para capturar la esencia de un sentimiento. Es la intención de este curso, conocer las nuevas técnicas de estudiar la música para poder entender mejor las estructuras de las obras del pasado y utilizar los métodos en nuevas formas interesantes de composición. Tomando en cuenta siempre, que la música es un arte y nuestro último objetivo, es la creación de obras que permitan expresar de manera abstracta algún concepto o sentimiento. 1 - Fundamentos Acústicos La primera sección consiste en las definiciones físicas y acústicas sobre las que se fundamenta la música. Exploraremos el concepto de sonido, y abordaremos las preguntas: ¿por que los instrumentos suenan distinto aunque toquen la misma nota?, ¿por que ciertos pares de notas suenan mejor que otros? y ¿por que escogemos el piano tiene sólo doce notas diferentes?. 1.1 Sonido Podemos definir la música como la forma en que organizamos los sonidos en el tiempo para generar obras artísticas. La música tiene como unidad fundamental de creación al sonido. Como sabemos, este es un fenómeno físico que surge de la vibración de un medio. Generalmente se propaga en el aire, pero de igual forma puede transportarse en líquidos y sólidos. El sonido es una onda longitudinal, lo cual significa que las moléculas de aire vibran de forma periódica. El patrón de compresión y relajación a los cuales es sometido el aire se puede expresar por medio de la función seno, como se muestra en la figura anterior. Ls propiedades del sonido que nos interesan de momento son: su frecuencia, que nos dice lo agudo o grave de un sonido; y su amplitud, que es una referencia de que tan fuerte o débil lo percibimos. Dichos parámetros se pueden ver en la siguiente ecuación donde “v” es la frecuencia, que se mide en Hertz (ciclos por segundo) y Ao que es una interpretación de los decibeles. Es de notar que el oído humano percibe sonidos en un rango de frecuencias entre 20 y 20kHz, por lo que todo el contenido musical se encuentra encapsulado en ese pequeño intervalo. A continuación se muestra una gráfica con las frecuencias de las notas musicales tradicionales. En secciones posteriores se explicará por que se utilizan estas frecuencias de forma predominante. Ejercicio 1.1.1: Generar en pure data diferentes ondas osciladores con frecuencias entre 20-20khz. Referencias: Para la explicación detallada ver la sección 1.1, 1.2 y 1.3 del libro “Music, a mathematical offering”, del autor Dave Benson. 1.2 Timbre Hemos definido a las funciones sinusoidales como unidad básica de la que se forma el sonido, sin embargo basta realizar un pequeño ejercicio para notar sus limitaciones. Le propongo que en un archivo de Pure Data, genere un oscilador y trate de escuchar los tonos puros con diferentes frecuencias entre 20 y 20,000hz. Como podrá notar, es curioso como si usted selecciona la frecuencia 440hz, que corresponde a la nota 'la' de acuerdo a la tabla anterior; se escucha muy diferente al sonido de un violín, clarinete, guitarra y casi cualquier instrumento. De manera natural, surge la pregunta ¿Qué es lo que hace que distintos instrumentos suenen tan diferente, a pesar de que toquen la misma nota? La respuesta es muy interesante, ya que de éstas propiedades surge gran parte de las estructuras armónicas de la música, como las escalas, acordes y armonías. Cuando tocamos la nota 'la' en un instrumento, lo que escuchamos es mucho más que la frecuencia 440hz. En realidad lo que se percibimos es dicha frecuencia, así como sus múltiplos enteros: 440, 880, 1320, 1760, 2200, 2640 (hz). A éstas frecuencias se les conoce como armónicos. Sin embargo, cada una tiene una amplitud, o volumen diferente, que en general van disminuyendo. Por esta razón al mezclarse todos estos armónicos, el sonido que predomina es el fundamental, ya que es quien suele tener la amplitud mayor. Definición: Si f es una frecuencia dada, llamaremos armónicos a la colección de las frecuencias {nf} donde n es un número entero positivo. A la combinación de los volúmenes de los armónicos y sus cambios en el tiempo lo llamaremos el timbre o espectro de un instrumento, o sonido. Definición: Llamaremos nota a un una frecuencia fundamental junto con su timbre. Cada familia de instrumentos tiene timbres característicos, por ejemplo en los instrumentos de cuerdas como el violín, se escuchan todos los armónicos, cada uno con una amplitud menor. Sin embargo en los instrumentos de aliento es diferente, en algunos se escuchan sólo los armónicos impares, lo cual les da un sonido característico diferente. En ésta figura se muestra una gráfica del timbre de un instrumento de aliento. En el eje horizontal se encuentra la frecuencia, mientras que el vertical indica la amplitud de cada una de ellas. Observe como cada frecuencia tiene un volumen diferente que va disminuyendo mientras se hace más agudo. Ejercicio 1.2.1: Encontrar las frecuencias de los primeros seis armónicos de la nota Sol, cuya frecuencia fundamental es 392hz Ejercicio 1.2.3: Generar en pure data un archivo donde se pueda modificar el timbre de un sonido con seis armónicos, para ello crear seis osciladores, que correspondan a los múltiplos de una frecuencia fundamental definida. A cada uno de ellos asignarle un controlador de volumen. Intentar varias combinaciones de timbres. Referencias: Para la descripición física del sonido y las propiedades de los armónicos de distintos instrumentos ver “Física 1” Resnick 5ta edición, sección 19-7. Para la descripición de timbres ver “Tunning timbre and spectre”, sección 2. 1.3 Consonancia Una vez definidas las características principales del sonido, la siguiente pregunta natural es ¿de que forma se relacionan las distintas notas y sonidos entre sí?, ¿podemos clasificarlos de acuerdo a alguna propiedad que compartan? La respuesta es muy variada, y dichas clasificaciones han cambiado a través de la historia. Comenzaremos con la noción de la dicotomía consonanciadisonancia, que es un concepto generalmente aceptado en los estilos de música formal que van del siglo XVII a inicios del siglo XX. La consonancia se refiere a la noción intuitiva de que un par de sonidos simultáneos presentan un grado de estabilidad, es decir, no hay tensión entre ellos. Mientras que la disonancia representa el concepto inverso, donde el resultado de la combinación es un sonido muy tenso, como si las notas no soportaran estar juntas entre sí. La definición de la consonancia es un concepto controversial, ya que en términos coloquiales se suele decir que dos sonidos son consonantes si suenan “bien” juntos. Sin embargo, esta es una caracterización injusta ya que la belleza es algo subjetivo, y la disonancia aplicada correctamente genera sonidos muy bellos. Sin embargo, más allá de la ambigüedad del bien y el mal, existe un fenómeno físico del cual resulta ésta dicotomía de disonancia y consonancia. Para explicarlo, comenzaremos por describir el fenómeno de las pulsaciones de un sonido. Para esto le sugiero un pequeño ejercicio: genere un archivo de pure data con dos osciladores, ambos con una frecuencia de 440hz. Gradualmente valla aumentando la frecuencia del segundo oscilador: 441, 442, 443, 444. Observe que curiosamente cuando las notas tienen una diferencia de 1hz se escucha claramente un sonido que pulsa cada segundo; si la diferencia es de 2hz, por ejemplo 440 y 442, la pulsación se escucha dos veces por segundo si 3hz, tres pulsos por segundo; y así consecutivamente. Al continuar éste proceso a frecuencias lejanas, con distancias de más de 100hz, llega un punto donde ya no se escuchan los pulsos, sino que percibimos dos sonidos independientes. Es de notar que hay un punto entre escuchar pulsos solitarios, y dos notas separadas, donde las pulsaciones son más intensas. A continuación se muestra una gráfica donde se modela este efecto. En el eje horizontal se mide la distancia entre un par de frecuencias, mientras que en la vertical la percepción de los pulsos por el oído. Ahora imagine lo que pasaría si mezclamos más de un par de sonidos. Las relaciones de los pulsos serían bastante complejas. De hecho, si tomamos la combinación de todos los armónicos de un instrumento, obtendríamos la siguiente gráfica: Para crear ésta imagen se tomaron un par de sonidos con los primeros seis armónicos. De igual forma, el eje horizontal representa la diferencia de hertz entre las frecuencias fundamentales de las notas. Los valles indican los lugares donde se escuchan una menor cantidad de pulsaciones colectivas, mientras que las crestas son solo puntos donde la interferencia es más agresiva. A estas gráficas se les conoce como “Curvas de Plomp & Levelt”. Desde el punto de vista físico, existe una cantidad medible que muestra la interacción entre los sonidos. Lo interesante es que los valles y las crestas corresponden a lo que por siglos se consideró consonante y disonante respectivamente. Definición: Llamaremos consonancia a el sonido característico de los valles de las curvas Plomp & Levelt, y disonancia al sonido de las crestas. En términos generales, la idea de la consonancia como la estamos definiendo consiste en que dos notas son consonantes si sus armónicos se encuentran en relaciones que no generan gran cantidad de pulsaciones. Ejercicio 1.3.1: Tomar el instrumento creado en el ejercicio 1.2.2 y copiarlo, de modo que se tengan dos instrumentos con el mismo timbre, y experimentar los sonidos que surgen al al combinar distintas frecuencias fundamentales. Ejercicio 1.3.2: Tomar un piano y presionar pares de notas distintas simultáneas y escribir cuales suenan intuitivamente consonantes y disonantes. En secciones posteriores, compaginaremos éstos conceptos de consonancia disonancia, con los que tradicionalmente se utilizan en la teoría musical, pero para ello es necesario definir los conceptos de intervalo, escala y acorde. Referencias Para una lectura más detallada ver el capítulo 4 de: “Music, a mathematical offering”, del autor Dave Benson. Para una explicación detallada de las pulsaciones ver el capítulo 3 de “Tunning timbre and spectre”. Para las ecuaciones asociadas a éstas gráficas ver el artículo “Local Consonance and the relationship between timbre and scale” de William Sethares (Journal of the acoustic society). Escalas y afinaciones Las notas que usamos regularmente para hacer música es un conjunto finito de sonidos, ya sea una canción popular con guitarra, una pieza para piano o una sinfonía. En general suele usarse un rango de frecuencias entre 291.35 y 3729.3hz, que se distribuyen como se muestra en la siguiente figura. A continuación veremos de donde surge esta distribución de las notas. Los antiguos griegos definan su consonancia como las notas que tienen un relación de cocientes sencillos entre ellos, en especial las relaciones 1:2 y 2:3. De hecho, con éstas dos simples relaciones podemos fundamentar gran parte de la teoría musical, como lo veremos más adelante. La relación 1:2 se conoce como “intervalo de octava”, mientras que la 2:3 se llama “intervalo de quinta”. Ambos nombre de momento no tienen sentido, pero más adelante se aclarará el misterio. Definición: Decimos que dos notas son equivalentes por octavas si sus frecuencias fundamentales están en una relación de múltiplos de dos. Es decir si $fo=2^qf1$ donde q es un número entero Z. Debido a que el primer armónico de cualquier nota es multiplicar la frecuencia por dos, el oído reconoce una relación natural entre el par de notas. De hecho al escuchar un par de notas equivalentes por octavas se puede reconocer que en realidad es la misma nota, sólo en una versión más aguda o grave. Es como si fueran dos tonos del mismo azul, uno más brillante que el otro. La equivalencia por octavas es nuestro primer concepto fundamental para el desarrollo de la teoría musical. De ahora en adelante sólo diremos que dos notas son equivalentes, y omitiremos la octava, por brevedad, pero nos referimos al mismo concepto, una surge de la otra al dividir o multiplicar por una potencia de 2. Ejemplo: Si tomemos la nota 'la' con frecuencia fundamental 440hz, sus frecuencias equivalentes son: Múltiplo 1/8 ¼ ½ 1 2 4 8 16 32 Frecuencia 55 110 220 440 880 1760 3520 7040 14080 todas estas notas son representantes de la familia 'la'. Proposición: La equivalencia por octavas es una relación de equivalencia en el conjunto de frecuencias. La demostración se deja como ejercicio, o va a venir en el examen =P. Debido a la esta relación, podemos decir que en realidad el espacio de estudio que nos interesa es el que surge con las clases de equivalencia, por ejemplo si tomamos una frecuencia inicial, por ejemplo, la nota 'do' con frecuencia 261.63hz, para fines de análisis, sólo nos interesan las notas que están después de ésta y antes del siguiente 'do' = 2(261.63)hz=523.26hz. Definición: Llamaremos intervalo fundamental al intervalo de frecuencias entre dos notas equivalentes consecutivas, sin inclu Por ejemplo, el intervalo fundamental de 'do' 261.63 hz, es [261.63,523.26) en los números reales. Proposición: En un intervalo fundamental, se encuentra uno y sólo un representante de cada clase de equivalencia de la relación por octavas. [demostración como ejercicio]. En términos generales, podemos definir la estructura del intervalo fundamental como el intervalo [1,2), ya que las frecuencias están entre los múltiplos 1 y 2 de la frecuencia fundamental. En conclusión, la relación de frecuencias 1:2 es la que nos permite clasificar las notas en conjuntos equivalentes, de la misma forma que clasificamos los colores en tonos de azul, verde y rojo. Cabe destacar que las notas equivalentes por octava son las más consonantes entre sí. Retomando el diagrama del piano donde se muestran las notas que se utilizan en la música, podemos ver que su estructura es periódica y se repite cada doce notas. Por lo que las notas equivalentes por octavas se encuentran separadas entre sí por doce teclas. Para encontrar de donde surgen las demás once notas, pasaremos a la relación de frecuencias 2:3, llamado intervalo de quinta. En este caso, las notas no son equivalentes, pero es el siguiente par de notas más consonante, de acuerdo a las curvas de Plomp & Levelt, así como la tradición histórica. De hecho es el valle que se encuentra en el centro de la gráfica. Definición: Decimos que dos notas son equivalentes por quintas si sus frecuencias fundamentales están en una relación de múltiplos de 3/2. Es decir si $fo=(3/2)^q f1$ donde q es un número entero Z. Llamaremos secuencia de quintas de la frecuencia fo a la sucesión {(3/2)^n fo}, con n en los naturales. El proceso para llenar la octava consiste en los siguientes pasos: a) tomar una frecuencia inicial, por ejemplo la nota 'do' =261.63, b) encontrar su secuencia de quintas hasta hasta tener 12 elementos, c) encontrar las frecuencias equivalentes de cada una en el intervalo fundamental de 'do', d) ordenar el resultado en orden ascendente. Este proceso se muestra en la siguiente tabla: Paso b 261.63 392.45 588.67 883.00 1324.50 1986.75 2980.13 4470.19 6705.29 10057.94 15086.90 22630.36 Paso c 261.63 392.45 294.33 441.50 331.13 496.69 372.52 279.39 419.08 314.31 471.47 353.60 Paso d 261.63 279.39 294.33 314.31 331.13 353.6 372.52 392.45 419.08 441.50 471.47 496.69 Cociente 1.068 1.053 1.068 1.054 1.068 1.054 1.054 1.068 1.053 1.068 1.053 A este proceso de construir las notas musicales se le conoce como el método de los Pitagóricos, ya que se utiliza su idea de utilizar las relaciones de frecuencias 1:2 y 3:2. Dicha selección de notas ha evolucionado con el tiempo y actualmente se utiliza una aproximación de la misma, llamada escala cromática temperada. La idea de de la escala moderna es uniformizar los cocientes entre todos los pares de notas consecutivas. Como podemos ver en la tabla anterior, en la última columna se muestran estos cocientes, que si bien son muy similares, su irregularidad presenta ciertos problemas al componer música, que de momento no son de nuestro interés, basta con comprender cómo se estructura la escala. Para uniformizarlos, utilizaremos el hecho de que 2^{7/12}=1.498 es una aproximación muy cercana del intervalo de quinta 3/2=1.5. Al realizar un proceso similar al de los pitagóricos llegamos a una versión muy cercana a la escala pitagórica, donde el cociente entre pares de notas consecutivas es 2^{1/12}. Pitagórica 261.63 279.39 294.33 314.31 331.13 353.6 372.52 392.45 419.08 441.50 471.47 496.69 Temperada 261,63 277,19 293,67 311,13 329,63 349,23 370,00 392,00 415,31 440,01 466,17 493,89 De esta forma se construyen las notas musicales que se utilizan actualmente, utilizando dos conceptos básicos, la equivalencia por octavas, y la secuencia de quintas. Ambos principios se basan en la consonancia intrínseca de los mismos. Probablemente, para este punto ya lo ha notado, la equivalencia por octavas y las secuencias por quintas se analizan más naturalmente en una escala logarítmica, de hecho la idea de normalizar los cocientes entre notas, significa que cada par de notas tengan la misma distancia entre si. Por convención a la nota 'la' 440 se le asigna el número 69, y la demás numeración surge de dividir el intervalo fundamental en doce partes iguales. Con esta numeración, los números enteros 'm' corresponden a las teclas del piano, que es el conjunto de notas musicales; mientras que 'f' representa las frecuencias. Las ecuaciones correspondientes son las siguientes: Al utilizar esta conversión, es mucho más fácil trabajar con intervalos, ya que el logaritmo convierte los productos en sumas, por lo que la equivalencia por octavas puede re definirse como las notas logarítmicas que tengan la misma distancia lineal. A continuación se muestra dichas notas: Temperada Distancia Logaritmica 261,63 60 277,19 15,56 61 293,67 16,48 62 311,13 17,46 63 329,63 18,50 64 349,23 19,60 65 370,00 20,77 66 392,00 22,00 67 415,31 23,31 68 440,01 24,70 69 466,17 26,16 70 493,89 27,72 71 PUNTO.