La música de las esferas: de Pitágoras a Xenakis... y más acá Apuntes para el coloquio del Departamento de Matemática Federico Miyara Resumen Música y matemática suelen ser consideradas disciplinas muy diferentes. Una apela al sentimiento espontáneo, a la expresión pura, privada inclusive de significado abstracto, a la belleza; la otra al razonamiento, al rigor lógico, a la abstracción extrema. Sin embargo, en todas las épocas se han sospechado, buscado, rechazado o confirmado profundas conexiones entre una y otra. Algunas veces las conexiones se han utilizado como andamios normativos, otras como la chispa que inflama la inspiración estética. Intentaremos un fugaz recorrido sobre esta multifacética cuestión desde Pitágoras hasta nuestros días. 1. Filosofías musicales antiguas La palabra música tenía un significado más amplio en la antigua Grecia que en la actualidad. En la mitología, las Musas eran nueve diosas hermanas protectoras de las artes y las ciencias: Clío, Euterpe, Talía, Melpómene, Terpsícore, Erato, Polimnia, Urania y Calíope. Euterpe era la protectora de lo que hoy llamamos música; Urania, de la astronomía. Las otras musas protegían diversas formas de poesía y danza. La música era inseparable de la poesía y, como veremos, también de la astronomía. Las enseñanzas de Pitágoras (ca.570-497AC) incluían la aritmética y la música en forma conjunta. La aritmética permitía la comprensión del universo físico y espiritual, en tanto que la música era un ejemplo de la armonía universal.1 Recíprocamente, Arquitas (428-347AC)2 describía la matemática como integrada por el estudio de la astronomía, la geometría, la aritmética y la música. Su contemporáneo Platón (427-347AC), en su República hace una subdivisión parecida. Más adelante estas cuatro ramas pasarán a conocerse como el quadrivium.3 La escuela de Pitágoras se interesó principalmente en la canónica o ciencia de los intervalos musicales, es decir, las relaciones entre pares de sonidos. En la actualidad se sabe que dichas relaciones pueden ser caracterizadas mediante el cociente entre sus frecuencias. En aquella época las relaciones entre los sonidos se estudiaban mediante el monocordio, instrumento formado por una sola cuerda, para lo cual se procedía a subdividir la cuerda en un número pequeño de partes iguales. En la terminología actual, si una cuerda tiene un modo fundamental de vibración con frecuencia f, al dividirla en n partes la frecuencia pasará a ser nf. El descubrimiento crucial de Pitágoras fue que la subdivisión de la cuerda en partes cuyas longitudes estaban en proporción (n + 1):n (es decir, en relación superparticular) y n:1, con n número natural pequeño daba origen a sonidos armoniosos o consonantes entre sí. Esto dio gran impulso a la idea de que el número gobernaba el universo. En la tabla 1 se muestran las relaciones de frecuencias de las diversas consonancias con su nombre actual.4 1 2 3 4 Grout, D. “A History of Western Music”. W.W. Norton & Company - Inc. New York, 1960. Según Aristóteles, en su Política, Arquitas fue el inventor del sonajero, juguete para apaciguar a los niños. Hundt, F. “Origins in Acoustics”, Acoustical Society of America. Woodbury, 1978. Los nombres surgen de la cantidad de notas comprendidas entre los extremos del intervalo. 1 Tabla 1. Relaciones de frecuencia entre los sonidos de las diversas consonancias Intervalo Unísono f2 / f1 1 va 5 ta 4 2 3 /2 4 8 ta /3 ra ra ta ta 3 mayor 3 menor 6 mayor 6 menor 5 /4 6 /5 5 /3 8 /5 Durante muchos siglos estas relaciones no pasaron de ser una evidencia empírica. Diversas teorías intentaron explicarlo en formas que oscilaban entre lo ingenuo y lo absurdo, incluyendo intentos por parte de científicos de la talla de Euler. Recién a mediados del siglo XIX Helmholtz (1821-1894) logra una explicación satisfactoria,5 reforzada ya en el siglo XX por los experimentos de Plomp.6 Según Helmholtz dos sonidos son tanto más consonantes cuanto mayor cantidad de armónicos comparten entre sí. Así, en un intervalo de quinta (relación de frecuencias 3:2) los armónicos de orden múltiplo de 3 del sonido más grave coinciden con los de orden par del sonido más agudo. La disonancia surge, por el contrario, cuando dos armónicos tienen frecuencias f1 y f2 muy próximas, ya que en ese caso se produce el fenómeno de batido7 que causa una sensación de agitación. Aunque los pitagóricos formaban una especie de cofradía secreta que guardaba celosamente sus posturas filosóficas, por lo cual no dejaron registros escritos de sus teorías y descubrimientos, las crónicas de seguidores y detractores permiten reconstruir parcialmente sus ideas. Así, Aristóteles (384-322AC) explica, en tácita referencia a la escuela pitagórica, que “algunos pensadores suponen que el movimiento de los cuerpos celestes debe producir un sonido, dado que en la Tierra el movimiento de cuerpos de mucho menor tamaño produce dicho efecto. Afirman, también, que cuando el sol, la luna y las estrellas, tan grandes y en tal cantidad, se mueven tan rápidamente ¿cómo podrían no producir un sonido inmensamente grande? A partir de este argumento y de la observación de que sus velocidades, medidas por sus distancias, guardan igual proporción que las consonancias musicales, aseveran que el sonido proveniente del movimiento circular de las estrellas corresponde a una armonía.”8 Se trata de la denominada música de las esferas o armonía de las esferas, comentada también por Platón en La República. Al parecer, el hecho de que dicho sonido no se escuchara era resuelto por Pitágoras mediante el argumento de que al ser un sonido permanente desde el mismo instante del nacimiento, no era distinguible del silencio. Aristóteles ridiculiza esta teoría sin proponer una más creíble. La teoría de la música de las esferas sobrevivió casi 20 siglos, es decir, hasta la época de Kepler, quien se haría eco de la misma a raíz de sus descubrimientos en astronomía.9 5 6 7 8 9 Helmholtz, H. “On the Sensations of Tone”. Dover. New York, 1954. (Editado originalmente en alemán en 1862). Plomp, K.H.; Levelt, W.J.M. “Tonal consonance and critical bandwidth”. J. Acoust. Soc. Am 38:548. 1965. Una superpopsición de sonidos puros (senoidales) de frecuencias f1 y f2 puede expresarse en la forma sen 2πf1t + sen 2πf2t = 2 cos π (f1 − f2) sen π(f1 + f2). Si f1 ≅ f2 la amplitud varía lentamente con frecuencia f1 − f2. Esa lenta fluctuación es percibida aun para diferencias de frecuencia tan pequeñas como 0,5 Hz. De Caelo, Libro II.9, de Aristóteles. Citado por Hundt, F., op. cit. No es inverosímil la existencia de sonidos en la materia interestelar del espacio exterior, debido a que ésta forma una especie de gas sumamente tenue. Sin embargo, la gran diferencia de impedancia acústica entre ese gas y la atmósfera terrestre harían despreciable la energía acústica transmitida hacia la superficie terrestre. 2 2. La escala pitagórica La escala sistematizada por Pitágoras tiene siete notas obtenidas por encadenamiento de quintas y de octavas, es decir que, partiendo de un sonido, se toma primero su quinta (multiplicando su frecuencia por 3/2), luego la quinta de la quinta, y así sucesivamente hasta completar un número deseado de sonidos. Para la escala más simple, se toman siete sonidos, que en notación musical son: Re Fa Do La Mi Si Sol Luego se sube o baja la cantidad de octavas que haga falta para que todos los sonidos se encuentren dentro de una misma octava10 (multiplicando o dividiendo la frecuencia por 2). Así, el Fa se sube una octava, el Do y el Sol no se modifican, el Re y el La se bajan una octava, y el Mi y el Si se bajan dos octavas. Se obtiene la escala recuadrada en línea de puntos: Re Fa Do La Mi Si Sol Las frecuencias resultantes, tomando como referencia la frecuencia fDo del Do son f Fa = 4 f Do 3 f Sol = 3 f Do 2 f Re = 3 3 1 f Do = 9 f Do 2 2 2 8 f La = 3 3 3 1 f Do = 27 f Do 2 2 2 2 16 f Mi = 3 3 3 3 1 1 f Do = 81 f Do 2 2 2 2 2 2 64 f Si = 3 3 3 3 3 1 1 f Do = 243 f Do 2 2 2 2 2 2 2 128 10 La relación de octava puede considerarse, desde el punto de vista funcional, una relación de equivalencia (reflexiva, simétrica y transitiva), es decir, están en una misma clase de equivalencia los sonidos que difieren en cualquier número entero de octavas. 3 El último paso sería reordenar las notas de modo que sus frecuencias vayan en aumento. La escala así obtenida se llama escala de Pitágoras, o escala pitagórica. En la tabla 2 se indican las frecuencias referidas a la frecuencia del Do. Tabla 2. Frecuencias con respecto a la frecuencia del Do y relaciones de frecuencia entre los sonidos de la escala pitagórica fn fn/fn−1 Do f Re /8 f Mi /64 f 9 9 /8 Fa /3 f 81 9 256 /8 Sol /2 f 4 /243 La /16 f 3 9 /8 Si /128 f 27 9 /8 Do' 2f 243 9 /8 256 /243 Esto proporciona una estructura en la cual hay dos tipos de intervalos: 9 256 /8 = 1,125 /243 = 1,05349794238683... Estos se denominan tono (T) y hemitono (h).11 Se tiene, entonces, una estructura de escala del tipo T T h T T T h luego de lo cual la estructura se repite cíclicamente en las octavas superiores e inferiores. 3. La escala natural o pura En un estadio más avanzado de la evolución de la música surge la necesidad de combinar sonidos simultáneos, al intentar varias personas cantar una misma melodía. Entre cantantes de igual tesitura vocal era posible cantar al unísono (igual altura). Pero, por ejemplo, entre las voces masculinas y las femeninas hay una diferencia promedio de una octava, de modo que el primer intervalo de uso simultáneo (además del caso trivial del unísono) fue la octava (relación de frecuencias 2:1). Luego fueron surgiendo otros intervalos, como la quinta (3:2) y la cuarta (4:3), y posteriormente surgió la polifonía, en la cual se superponían diferentes melodías, formando en cada instante diversos intervalos simultáneos. El principio de funcionalidad válido para esta aplicación requiere que la mayor cantidad posible de superposiciones de sonidos de la escala que se adopte resulte “agradable”, concepto desde luego muy relativo. En la época en que se consolidaron las escalas sobre las que se basan las hoy en uso, el criterio era el de la consonancia. Las consonancias disponibles son, en orden decreciente de perfección, las ya indicadas en la Tabla 1 (dicho orden coincide aproximadamente con el orden histórico en que fueron siendo aceptadas en la evolución de la música). En una música polifónica desarrollada, es de esperar que cada una de estas consonancias aparezca con cierta frecuencia, por lo que es preciso elegir los sonidos de la escala de manera de lograr la mayor cantidad posible de superposiciones consonantes. En la escala de Pitágoras, las oc11 Es de notar que el intervalo formado por dos hemitonos es menor que un tono: ( 256/243) × ( 256/243) = 1,10985791461329... 4 tavas, las quintas y las cuartas son acústicamente perfectas, pero las terceras y sextas no. Si tomamos por ejemplo, el intervalo entre un Do y un Mi pitagóricos, que parecería ser una tercera mayor, resulta la siguiente relación de frecuencias: f MI f DO 81 = 3⋅3⋅3⋅3⋅1⋅1 = , 2 2 2 2 2 2 64 donde los cuatro primeros factores 3/2 corresponden al encadenamiento de cuatro quintas desde el do hasta el Mi agudo, y los factores 1/2 corresponden a bajar dos octavas. Vemos que el resultado difiere de una tercera mayor acústicamente perfecta, a la cual correspondería una relación de 5/4 , es decir 5 80 81 = ≠ . 4 64 64 La diferencia, correspondiente a una relación 81/80 = 1,0125 se denomina coma sintónica o, también, coma de Didymus (siglo I AC) y es un pequeño intervalo de alrededor de 1/10 de tono. Esta diferencia es claramente perceptible, produciendo una consonancia no tan perfecta como el intervalo acústicamente exacto.12 Este inconveniente aparece porque al construir la escala pitagórica no se utilizaron terceras perfectas. Para subsanarlo, en lugar de generar la escala por encadenamiento de 6 quintas, se utilizan sólo 3 quintas, lo cual origina 4 notas. Las tres notas que faltan se logran tomando las terceras mayores perfectas sobre las tres primeras notas: ra 3 3 La Fa 3 ra Do Mi ta ra Si Sol ta 5 Re ta 5 5 Luego se procede igual que en la escala de Pitágoras, subiendo o bajando la cantidad de octavas que haga falta para que todos los sonidos se encuadren dentro de una misma octava. Así, el Fa y el La se suben una octava, y el Re se baja una octava. Finalmente se reordenan. Esta escala se denomina escala natural, escala perfecta o escala de Ptolomeo (70-147 DC). Tabla 3. Frecuencias con respecto a la frecuencia del Do y relaciones de frecuencia entre los sonidos de la escala natural fn fn/fn−1 12 Do f Re /8 f 9 9 /8 Mi /4 f 5 10 /9 Fa /3 f Sol /2 f 4 16 /15 3 9 /8 La /3 f Si /8 f 5 10 /9 Do' 2f 15 9 /8 16 /15 Que la tercera mayor debía corresponder a una relación 5:4 fue propuesto por Didymus en el siglo I AC, aunque entonces no era reconocida como una consonancia. 5 Se observa que la estructura de la escala es más compleja que la de la escala pitagórica, ya que no hay un solo tono sino dos, denominados tono mayor (T) y tono menor (t). En cambio, se simplifica el intervalo más pequeño, que pasa a denominarse semitono (s): T t s T t T s La sucesión de un tono mayor y un tono menor forman una tercera mayor exacta, y si se les agrega un semitono, se obtiene una cuarta. Sin embargo, no todos los intervalos son perfectos. En efecto, la quinta Re-La corresponde a una proporción 40/27 = 1,481481..., que difiere de la quinta justa en un una coma pitagórica, es decir, en un 1,25%. Este error es más tolerable que el que sucedía en las terceras mayores de los acordes principales. 4. El problema del cambio de escala Tanto la escala pitagórica como la natural poseen siete notas en cada octava. Al ir evolucionando la música, ya no fue suficiente con estas siete notas. Así, la denominada música ficta fue introduciendo algunas notas falsas (“ficta” significa “fingida” o “falsa”) no pertenecientes a la escala. Hay varias razones por las cuales resulta interesante agregar algunas notas más. La primera es la necesidad de la transposición, es decir, subir o bajar una melodía para adaptarla a la tesitura de una voz o instrumento diferente de aquel para el que fue concebida. Otra razón importante es la necesidad de realizar modulaciones. En música, modular significa realizar un cambio de tonalidad, es decir de escala, dentro de una misma pieza, de manera que algunos pasajes de la pieza utilizan una escala, y otros, otra escala. La transposición más simple es la transposición a la octava superior o inferior según el caso, pero a veces tal transposición resulta excesiva, ya que quizás resulte suficiente con transportar una quinta o una cuarta. Para realizar una transposición con esos intervalos asegurando que la nueva escala tiene la misma estructura hace falta agregar un sonido nuevo en la escala de Pitágoras y dos en la natural. En efecto, en la escala de Pitágoras, para comenzar la escala una quinta más arriba es necesario agregar un sonido nuevo entre el Fa y el Sol de cada octava, denominado Fa sostenido (Fa#): Do Re Mi Fa Sol La Si Do Re Mi Fa Sol La Si T T h T T T h T T h T T T Sol La Si Do Re Mi T T h T T T Fa# Sol h y, análogamente, si se desea empezar una cuarta más arriba debe agregarse un sonido entre el La y el Si de cada octava, denominado Si bemol (Sib): Do Re Mi Fa Sol La Si Do Re Mi Fa Sol La Si T T h T T T h T T h T T T Fa T Sol La Si b Do Re Mi Fa T T T h h T En el primer caso el sonido agregado coincide con el que se hubiera obtenido agregando una quinta más al encadenamiento de quintas (la quinta de Si es Fa#). En el 6 segundo caso, equivale a extender el encadenamiento hacia abajo (la quinta inferior de Fa es el Si b). Esto sugiere la extensión de la escala continuando con el encadenamiento de quintas. Se observa que 12 quintas coinciden con bastante aproximación con 7 octavas. En efecto (3/2)12 = 129,746337890625... en tanto que 27 = 128. Ello significa que si arrancamos con un Fa, luego de 12 quintas tendremos un sonido aproximadamente igual al Fa 7 octavas más agudo. Este sonido, igual al Mi#, se califica como enarmónico del Fa y, en principio, podría sustituirse por el Fa. Sin embargo, la diferencia es suficiente como para resultar notoriamente desafinado, ya que (3/2)12 / 27 = 531441 /524288 = 1,01364326477051... Esta diferencia de 1,36% en la frecuencia, denominada coma pitagórica, es claramente perceptible, ya que está por encima del umbral de discriminación de frecuencias que es normalmente del 0,3%.13 Si pretendemos respetar el principio de equivalencia de todas las tonalidades, es decir, que cualquiera sea la nota de la escala en la que empecemos podamos construir una escala con la estructura T T h T T T h, será preciso agregar una infinidad de sonidos. En efecto, si hemos alcanzado un último sonido Sn, para construir una escala a partir de él debemos bajar una quinta y a partir de allí subir 7 quintas (y luego acomodar las octavas, por supuesto). La única esperanza de terminar el proceso constructivo con un número finito de sonidos por octava es encontrar dos números enteros n y m tales que (3/2)n = 2m, (1) lo cual equivale a 3n = 2n + m. Esto es claramente imposible porque 2 y 3 son números primos. Podría, desde luego, adoptarse el criterio de continuar el proceso hasta que la diferencia entre el último sonido construido y su enarmónico resulte imperceptible al oído humano. Este método resulta muy ineficiente ya que la cantidad de sonidos a agregar por esta vía es muy grande. La solución práctica, el temperamento, se analiza en la sección siguiente. 5. Las escalas temperadas El método imaginado anteriormente para extender la escala se basaba en seguir agregando quintas hasta lograr alguna cuya diferencia sea imperceptible con su enarmó13 Este umbral es para sonidos en sucesión. Para sonidos superpuestos o simultáneos aparece el fenómeno de las pulsaciones o batido (ver nota 7 al pie). La fluctuación de amplitud con frecuencia igual a la diferencia de las frecuencias de los sonidos es percibida aun para diferencias de frecuencia tan pequeñas como 0,5 Hz, lo cual hace perfectamente audible la desafinación. A esto se agrega el hecho de que los armónicos homólogos también están muy próximos, pero a diferencias múltiplos de la diferencia entre las fundamentales. Así, un La de 440 Hz y un La’ de 440,5 Hz batirán a 0,5 Hz pero sus armónicos lo harán a 1 Hz, 1,5 Hz, 2 Hz, 2,5 Hz, etc, provocando una disonancia apreciable. 7 nico. Un método más ingenioso consiste tomar el error hallado entre las 12 quintas y las 7 octavas y repartirlo entre las 12 quintas, que dejarían entonces de ser quintas perfectas para ser sólo aproximadas. En efecto, si q es la relación de frecuencias de esta quinta aproximada, deberá ser q12 = 27, (2) es decir, q = (12 2 )7 = 1,49830707687668... (3) Vemos que q / ( 3/2) = 0,998871384584454... que corresponde a un error de −0,11%, 12 veces menor que el anterior. Este error es virtualmente imperceptible, produciéndose sólo batidos muy lentos entre el tercer armónico del sonido más grave (por ejemplo Do) y el segundo armónico del más agudo de la quinta (por ejemplo Sol). La escala así obtenida, denominada escala temperada o, más propiamente, escala uniformemente temperada, tiene una estructura similar a la pitagórica, reemplazando el hemitono por un semitono (s): T T s T T T s El tono y el semitono corresponden a T = (12 2 )2 = 1,12246204830937... s = 12 2 = 1,0594630943593... (4) (5) Vemos que dos semitonos forman exactamente un tono. La tercera mayor D está formada por dos tonos: D = (12 2 )4 = 1,25992104989487... (6) Este valor excede en un 0,8% al correspondiente a una tercera mayor perfecta. Aunque la diferencia es menor que en la escala de Pitágoras es, definitivamente, audible. No obstante el error es lo suficientemente pequeño como para que se haya aceptado en la música occidental desde hace más de 200 años.14 El germen de la idea del temperamento de repartir errores quizás se remonta a Aristógenes (ca 320 AC), quien introdujo las denominadas diesis cromática menor (un tercio de tono) y diesis enarmónica menor (un cuarto de tono) con las que era posible corregir las escalas de cuatro sonidos denominadas tetracordios para que un instrumento de cuerda como la lira pudiera tocar en varias tonalidades sin requerir modificar la afinación.15 En tiempos modernos la idea es retomada en occidente por el español Bartolomé Ramos de Pareja (ca 1440-1521), en su “Música Práctica” de 1482, quien da 14 15 Curiosamente, Inglaterra fue uno de los últimos países en aceptar el temperamento uniforme. Obsérvese que no se buscaba en principio la posibilidad de modular, sino de ejecutar diferentes piezas en diferentes modos 8 instrucciones al respecto para la distribución de los trastes de la vihuela, y posteriormente por Gioseffo Zarlino (1519-1590), quien propone la idea básica de repartir el error entre varias quintas. Mersenne (1588-1648), en su “Harmonie Universelle” de 1636, quien obtiene las leyes empíricas de vibración de una cuerda, calcula también los intervalos del temperamento uniforme. A pesar de que desde fines del siglo XVII se hayan aplicado sistemáticamente diversas variantes de temperamento, el temperamento uniforme no fue adoptado universalmente desde el principio. Previamente se utilizaban otros temperamentos, como el mesotónico, consistente en repartir la coma pitagórica entre las cuatro quintas que dan origen a una tercera mayor. De esa manera, las terceras son perfectas, en detrimento de las quintas, que pasan a diferir en −1,5% de las quintas justas. Este temperamento permitía realizar modulaciones a varias tonalidades (escalas) diferentes, pero no a todas. De hecho el Sol sostenido que es enarmónico del La bemol, produce con el Mi bemol una disonancia conocida como “quinta del lobo” por los notorios batidos causados por una considerable diferencia de frecuencias. A fines del siglo XVII comienza a hacerse sentir la necesidad de poder acceder a todas las tonalidades posibles. Esto no era posible con el temperamento mesotónico, que privilegiaba unas pocas tonalidades haciéndolas muy perfectas a costa de las otras. En 1691 Andreas Werckmeister publicó un tratado sobre temperamento, que si bien no era el temperamento uniforme, permitía discrepancias razonablemente bajas. En estos temperamentos no todas las tonalidades eran equivalentes. Con este tipo de temperamento en mente escribió Johann Sebastian Bach su célebre Clave bien temperado, un conjunto de 48 preludios y fugas que explotan todas las posibles tonalidades.16 Sin embargo, contrariamente a lo que se creyó durante más de dos siglos, parece que el temperamento de Bach no es ni el temperamento uniforme ni los de Werckmeister.17 La escala temperada de 12 notas resulta bastante satisfactoria y, de hecho, debido a que lleva ya más de 200 años en vigencia en la música occidental, los oídos de músicos y no músicos se encuentran completamente habituados a ella, al punto de que una escala pura suena hoy extraña cuando se la utiliza melódicamente, si bien es fácil constatar que las armonías son mucho más perfectas, en especial las armonías consonantes. Es posible especular sobre la posibilidad de extender la cantidad de sonidos por octava de manera de mejorar aún más las quintas y las terceras mayores. Para ello podemos partir de la aproximación (3/2)n ≅ 2m, (7) Hemos visto que si n = 12 y m = 7 la aproximación es bastante buena. Para obtener otras aproximaciones podemos razonar así. Para valores muy grandes de n y m es de suponer que la aproximación debería ser cada vez mejor. Si tomamos logaritmos, dicha aproximación puede reescribirse como m log(2) ≅ ≅ 1,70951129135145... n log(3 / 2 ) 16 17 (8) Bach no fue el primero en escribir un conjunto de preludios y fugas en todas las tonalidades. Bernhard Christian Weber, a principios del siglo XVIII escribió una obra similar. Bradley Lehman, en su artículo “Bach’s extraordinary temperament: our Rosetta Stone1”, publicado en febrero de 2005 en Early Music, realiza un análisis del enigmático ornamento ubicado en el borde superior del frontispicio de su “Clave bien temperado” y concluye que contiene instrucciones precisas de cómo realizar la partición de la octava a través de una distribución no uniforme de la coma pitagórica. La escala por encadenamiento de quintas parte del Fa y utiliza 5 quintas menores en 1/6 de coma pitagórica con respecto la pura (3/2), luego tres quintas puras, y por último dos quintas 1/12 de coma pitagórica menores que la pura. 9 Existen muchas combinaciones posibles de m y n capaces de satisfacer con mayor o menor error esta aproximación. Por ejemplo, podríamos tomar m = 17 y n = 10, ó m = 171 y n = 100. Sin embargo, existe un formalismo de la teoría de números que permite obtener las mejores aproximaciones de este tipo: las fracciones continuas. Un número irracional r puede descomponerse en una fracción continua del tipo r = a0 + 1 a1 + (9) 1 1 a3 + a2 + donde los ak son los cocientes parciales. Los ak son, para k > 0, enteros positivos que pueden obtenerse del siguiente modo, donde [] es la parte entera: a 0 = [r ] r0 = 1 r − a0 a1 = [r0 ] r1 = 1 r0 − a1 a n = [rn −1 ] rn = (10) 1 rn −1 − a n Se suelen anotar abreviadamente como {a0; a1, a2, ..., an, ...}. Los valores An Bn = a0 + 1 a1 + (11) 1 a2 + 1 an + son las n-ésimas convergentes, y se demuestra que sus numeradores y denominadores se pueden calcular mediante la fórmula recursiva An = An −1a n + An − 2 (12) Bn = Bn −1a n + Bn − 2 También se demuestra que son las mejores aproximaciones posibles para r, en el sentido del siguiente teorema: Teorema: Si n > 1, 0 < B < Bn y A/B ≠ An/Bn, entonces r − An Bn < 10 r − A B . (13) En otras palabras, cualquier convergente es la mejor aproximación entre todas las posibles de la forma A/B con denominador menor que su denominador. Aplicando el algoritmo anterior a log(2)/log(3/2) obtenemos los 10 primeros cocientes parciales: r = {1; 1, 2, 2, 3, 1, 5, 2, 23, 2, ...} y las siguientes convergentes: 1, 2 5 12 41 53 306 665 15601 , , , , , , , 1 3 7 24 31 179 389 9126 Vemos que la convergente 12/7 coincide con el cociente m/n correspondiente a la escala temperada en uso, con 12 semitonos por octava. También vemos que son posibles las escalas de 41 microtonos por octava y 53 microtonos por octava. Las que siguen subdividen la octava en intervalos demasiado pequeños para ser diferenciados auditivamente. Particularmente, la escala de 53 tonos no sólo minimiza el error de las quintas sino que también proporciona un mínimo local para las terceras mayores. Si bien las primeras convergentes para log(2)/log(5/4), 3 28 59 146 643 , , , , 1 9 19 47 207 no incluyen el numerador 53, si se grafica la suma de los valores absolutos del error de ambos se obtiene un mínimo local muy bajo. La escala de 53 microtonos es, por consiguiente, la mejor posible dentro de la discriminación del oído humano. Tomando 17 microtonos se obtiene una tercera mayor que difiere de la perfecta en −0,08%, y tomando 31 microtonos se obtiene una quinta que difiere de la perfecta en −0,004%. Es notable que en el siglo II AC el chino King-Fang descubrió esta escala. No se sabe si le dio alguna aplicación práctica, aunque debido a la predilección de los chinos por las escalas microtonales no sería improbable que se la hubiera utilizado. 6. La notación musical Los griegos utilizaban letras para nombrar los sonidos usados en música. Los romanos también. Boecio (∼480-524), consejero y estadista de Teodorico el Grande, fue el último estudioso romano de la cultura griega. Escribió un tratado en 5 volúmenes sobre teoría de la música. En ese entonces se reconocían 15 notas, que eran representadas por Boecio con las primeras letras del alfabeto. Este sistema se conoce como notación de Boecio, aunque no es claro si fue quien lo introdujo o quien lo popularizó en su tratado. Luego se utilizaron las siete primeras letras, de la A a la G. Las octavas siguientes se representaron con a, ..., g y aa, ..., gg. Es la denominada notación inglesa o alemana. Posteriormente, Guido de Arezzo (ca.905 - ca.1050) introdujo los nombres adoptados por Italia, Francia y otros países, ut, re, mi, fa, sol, la, si, utilizando las primeras sílabas de los versos de un himno a San Juan, aprovechando que era muy conocido y que tales sílabas empezaban con los sonidos de la escala.18 Se argumenta que estos sistemas son en realidad nomenclaturas y no notaciones. 18 Los versos del himno son: “Ut queant laxis Resonare fibris / Mira gestorum Famuli tuorum / Solve polluti Labii reatum / Sancte Iohannes.” El nombre ut fue posteriormente cambiado por do. 11 Los músicos de iglesia introdujeron a partir del siglo VII el sistema de notación gráfica de los neumas para anotar el canto llano (melodía ritual sin refinamientos ni polifonía), el cual fue usado también por músicos seculares en el siglo XIII. Consistía en dibujos aproximados de grupos de notas y motivos rítmicos conocidos que formaban la línea melódica. Eran más bien ayudamemorias para indicar qué grupos cantar. Para dar precisión a la altura de los sonidos se introdujeron las pautas, al principio una sola línea y más tarde cuatro (tetragrama). Otras músicas utilizaron diferentes números de pautas. El pentagrama usado en la actualidad se asentó hacia el siglo XVII. A partir del siglo IX se fue consolidando la necesidad de una notación rítmicamente más exacta y ya en el siglo X aparece, con la introducción de la polifonía (varias melodías diferentes simultáneas), la notación proporcional. Ésta estaba constituida por una sucesión de figuras representativas de diferentes duraciones: la doble longa, la longa, la breve y la semibreve. Cada una de ellas representaba una subdivisión en dos o en tres de la duración de la anterior según cierta indicación especificada en la partitura. Con el advenimiento del Ars nova en el siglo XIV se introduce una notación similar a la actual: máxima, longa (cuadrada), breve (redonda), semibreve (blanca), mínima (negra), semimínima (corchea), fusa (semicorchea), semifusa (fusa). La longa se dividía en 2 ó 3 breves (según indicación específica), y el resto se dividía en 2 para pasar a la siguiente. La notación que utiliza la combinación de pautas y las figuras de alguna manera constituye una representación gráfica bidimensional de dos variables: tiempo y altura (correspondiente a la frecuencia. El eje horizontal, sin embargo, no posee una escala lineal de tiempo sino una escala en la cual se especifican los tiempos diferenciales entre eventos (notas o silencios) sucesivos, estando dicho tiempo codificado con ciertos símbolos más o menos arbitrarios: las figuras (redonda, blanca, negra, etc.). La ubicación horizontal de cada figura obedece a una cuestión tipográfica más que analógica. Se ha comparado esto con la numeración romana. El eje vertical, en cambio, posee una escala quasi-logarítmica en frecuencia, es decir, a igual distancia vertical se tiene aproximadamente el mismo factor multiplicativo de la frecuencia. En la figura 1 se muestra el espectrograma de los primeros tres compases de la Fuga 1 del Clave bien temperado de Bach, junto con la notación musical correspondiente. A pesar de la forma rudimentaria e imperfecta, el sistema notacional de la música de alguna manera se anticipa en varios siglos a la geometría analítica de René Descartes (1596-1650). 7. Sucesión de Fibonacci y relación áurea La sucesión de Fibonacci (a veces mal llamada serie de Fibonacci), debida a Leonardo Fibonacci (1170-1250DC)19 está definida por la relación recursiva f1 = 1 f2 = 1 fn = fn−1 + fn−2 19 (14) Fibonacci incluye estos números en su Liber Abaci, publicado en 1202, en el cual da cuenta de la matemática hindú. En realidad, Virahānka, en el siglo VII da los primeros números de la sucesión y Gopāla (c. 1135) y Hemachandra Sūrī (1150) obtienen la fórmula recursiva. 12 Figura 1. Los primeros tres compases de la Fuga Nº 1 de “El clave bien temperado de J. S. Bach. Arriba, su espectrograma (tiempo en el eje horizontal, frecuencia en el eje vertical e intensidad representada con colores). Obsérvese que cada nota está acompañada por armónicos. Abajo, su representación en notación musical. Nótese la relativa analogía entre ambas. Los primeros valores se calculan fácilmente, siendo 1, 1, 2, 3, 5, 8, 13, 21, 34... Esta sucesión aparece como solución a varios problemas, por ejemplo el de la cantidad de ramas de un árbol cada una de cuyas ramas produce una nueva rama a intervalos regulares (por ejemplo cada 1 año). La relación áurea, también conocida como razón áurea, proporción áurea, sección áurea, media áurea o número áureo, φ, es el límite del cociente entre números de Fibonacci sucesivos: φ = lím fn n → ∞ f n −1 . (15) Dividiendo por fn−1 ambos miembros de la ecuación (14) se obtiene fn f n −1 = 1 + fn−2 f n −1 de modo que si φn = fn/ fn−1, podemos escribir φn = 1 + 1 φ n −1 . (16) Repitiendo este procedimiento se llega a que el término xn es una convergente de orden n de una fracción continuada cuyos cocientes parciales son todos 1: {1;1,1,1,1,1, ...} 13 Éstas siempre convergen,20 lo que permite tomar límite en (16) para obtener φ = 1 + 1 φ es decir φ2 − φ − 1 = 0 (17) cuya solución positiva es φ = 1 + 5 2 = 1,61803398874989... (18) Ésta es la relación áurea. Esta proporción aparece también al dividir un segmento en dos partes de modo que la razón entre la mayor y la menor sea igual a la razón entre el segmento completo y la parte mayor (figura 2). Es decir, si AB es el segmento y C el punto intermedio, debe ser AB AC = AC CB = x Dado que AB = AC + CB, resulta x = 1 + es decir, 1 x x2 − x − 1 = 0. Esta ecuación es igual a la que permite obtener la relación áurea. A C B Figura 2. Subdivisión de un segmento según la sección áurea. La sección áurea aparece frecuentemente en la arquitectura y en la música. Se argumenta, por ejemplo, que mucha música de compositores con una fuerte concepción arquitectónica o estructural, como Bach o Mozart, con frecuencia dividen su música en secciones cuyas extensiones guardan aproximadamente una proporción áurea. Por ejemplo, la sonata Nº 1 de Mozart para piano subdivide su primer movimiento en 38 y 62 compases. El cociente, 62/38 = 1,6315, difiere en menos de un 1% de la proporción áurea. Lo mismo puede decirse de su segundo movimiento, que con 28 y 46 compases en sus dos secciones principales arrojan una proporción 46/28 = 1,6428, también muy cercana a φ. La sonata Nº 2 subdivide el primer movimiento en 56 y 88 com20 Si hay infinitos cocientes parciales no nulos tiende a un número irracional, ya que todo racional admite una fracción continua con un número finito de cocientes parciales. 14 pases, cuyo cociente es 88/56 = 1,5714, también bastante próximo a la relación áurea. Aunque desde luego no toda la música se secciona de esta manera, es uno de los posibles principios para la organización del tiempo en la música. Otro es la simetría, según el cual las secciones tienen igual duración. Curiosamente, la simetría funciona mejor en el corto plazo (a nivel de frases o motivos), mientras que la relación áurea domina las grandes extensiones. Se ha argumentado que en tiempos considerables el ser humano es incapaz de percibir objetivamente la duración, pero es posible que sí exista una percepción inconsciente de la estructura general. En el siglo XX, Béla Bartok, célebre compositor húngaro, adoptó la relación áurea como principio rector para la estructuración de varias de sus obras. No sólo utilizó este principio para establecer las proporciones entre los diferentes segmentos, sino que la utilizó para construir acordes y melodías. En la figura 3 se reproduce el análisis gráfico efectuado por Larry Solomon de la Fuga de la Música para Cuerdas, Percusión y Celesta de Bartok,21 donde se observa que la proporción áurea ha sido sistemáticamente utilizada para segmentar temporalmente la obra. Figura 3. Análisis gráfico de la Fuga de la “Música para Cuerdas, Percusión y Celesta” de Béla Bartok según Solomon. 8. Música estocástica Guido de Arezzo, el ya mencionado inventor de los nombres de las notas utilizadas en los países latinos, fue, probablemente, el primero en introducir, alrededor de 1026, un método de composición basado en recursos aleatorios. Su método se basaba en asociar sonidos musicales a las sílabas de un texto, con lo cual la evolución de la melo21 Solomon, Larry. “Symmetry as a Compositional Determinant” Chapter 7. Disponible en Internet. (http://wc.pima.edu/~Elsolomon/diss7.htm) 15 día estaba controlada, más que por reglas específicamente musicales, por el fluir del discurso seleccionado. Otro ejemplo es la obra “Juego de dados musical para escribir valses con la ayuda de dos dados sin ser músico ni saber nada de composición” K. 294, en apariencia escrita por Mozart en 1777 (la atribución es, no obstante, dudosa). El método se basa en dos tablas y un repertorio de 176 compases cifrados. La tabla 1 permite escribir la primera sección del vals y la tabla 2, la segunda. Las columnas, numeradas en romano, indican el número de orden del compás. Para obtener el primer compás se arrojan dos dados y se suman, obteniéndose un número de fila que intersectada con la columna I da la cifra de compás a seleccionar. Por ejemplo, si la suma dio 8, se debe seleccionar el compás 152 del repertorio. Se procede igual con el segundo compás y así sucesivamente. 1. 2 3 4 5 6 7 8 9 10 11 12 I 96 32 69 40 148 104 152 119 98 3 54 II 22 6 95 17 74 157 60 84 142 87 130 III 141 128 158 113 163 27 171 114 42 165 10 IV 41 63 13 85 45 167 53 50 156 61 103 2. V 105 146 153 161 80 154 99 140 75 135 28 VI VII VIII 122 11 31 46 134 81 55 110 24 2 159 100 97 36 107 68 118 91 133 21 127 86 169 94 129 62 123 47 147 33 37 106 5 2 3 4 5 6 7 8 9 10 11 12 I II 70 121 117 39 66 139 90 176 25 143 138 71 16 155 120 88 65 77 102 4 35 20 III 26 126 15 7 64 150 57 48 19 31 108 IV V 9 112 56 174 132 73 34 67 125 76 29 101 175 43 166 51 82 137 164 144 92 12 VI VII VIII 49 109 14 18 116 83 58 145 79 160 52 170 136 1 93 162 23 151 168 89 172 115 72 111 38 149 8 59 173 78 124 44 131 El método funciona porque los compases correspondientes a una misma columna son variaciones sobre una misma base armónica, y dichas bases armónicas constituyen una frase armónicamente coherente. Es un ejemplo en el que se proporciona material que cumple ciertas reglas (las de la armonía y melodía tradicional) pero se lo compagina al azar. Abundan los ejemplos de este tipo y al parecer constituían un juego popular en el siglo XVIII. Ya en el siglo XX, el compositor griego Iannis Xenakis (1922-2001) aplicó procedimientos sistemáticos de aleatorización en la composición musical. En este caso los principios formales para dar cohesión y unidad a la obra dejan de ser los de la armonía tonal para dar lugar a las distribuciones de probabilidad. Así, parámetros como la altura, la duración y el instante de comienzo de cada sonido son controlados estadísticamente. La composición en sí consiste en especificar la evolución general de los sonidos por medio de las distribuciones probabilísticas. A partir de dicha especificación se simula el proceso dando así origen a una instancia de la obra. Una segunda instancia de la misma obra no necesariamente sonará igual en cuanto a las notas puntuales, pero en cambio poseerá una “personalidad” reconocible, de igual manera en que cada ejecución de una obra tradicional no aleatoria suena similar pero no idéntica a otras ejecuciones. Debido a la función diversa de los diferentes parámetros se utilizan diferentes distribuciones para cada uno. Así, la distribución de instantes de comienzo de las notas está determinado por la distribución de Poisson, según la cual la probabilidad de que el número de notas en un intervalo de tiempo dado t sea m es pm (t ) = e − λ t (λ t ) m . m! 16 (19) donde λ es la cantidad media de notas por unidad de tiempo. Este tipo de distribución puede simularse computacionalmente sumando los sucesivos valores de una variable aleatoria h distribuida exponencialmente, ya que los tiempos entre eventos sucesivos corresponden al caso m = 0. En otras palabras, el instante de la nota n-ésima será tn = h1 + h2 + ... + hn . (20) La variable h se calcula a partir de una variable aleatoria u distribuida uniformemente en el intervalo (0, 1) mediante la fórmula22 ln(1 − u ) , −λ h = (21) La variable u se obtiene mediante un generador de números aleatorios tal como las funciones rand o random disponibles en los diversos lenguajes de programación. ϕ(t) λ P(h ≤ t) 1 P(h ≤ t) 1 − e−λ t t t t t Figura 4. Distribución de probabilidades de los tiempos entre eventos sucesivos en una distribución de Poisson y su correspondiente función de probabilidad acumulada. Para determinar la altura de cada sonido es preferible especificar los saltos entre notas sucesivas, los cuales pueden responder, convenientemente, a una distribución lineal a ambos lados del origen. Si x es la magnitud del salto (por ejemplo, expresada en semitonos) y si a es el máximo salto admisible, la densidad de probabilidad viene dada por (figura 5): x 1 . 1 − a a p( x) = (22) p(x) 1/a −a 22 a x Figura 5. Distribución lineal de probabilidades de los saltos de altura (en semitonos) entre −a y a. La probabilidad de que h < ho es igual a la probabilidad de que ln(1 − u) > −λho, es decir de que 1 − u > e−λho. Finalmente, es la probabilidad de que u < 1 − e−λho, probabilidad que, por ser u una distribución uniforme, es igual a 1 − e−λho, que corresponde a una distribución exponencial respecto a h. 17 Esta distribución privilegia los saltos pequeños, permitiendo los saltos grandes (de mayor dificultad técnica para un intérprete humano) con menor frecuencia. Puede obtenerse una variable aleatoria x con esta distribución a partir de una variable u con distribución uniforme entre 0 y 1 mediante23 − 1 + 2u x = 1 − 2(1 − u ) si u ≤ 1 2 si u > (23) 1 2 Similares técnicas se aplican para seleccionar la dinámica (pp, p, f, ff) y los instrumentos que ejecutarán cada nota. Habitualmente, el compositor deberá adaptar los resultados obtenidos a la notación musical tradicional. Otra forma posible consiste en utilizar cadenas de Markov. Una cadena de Markov parte de un espacio de n estados posibles (por ejemplo, n − 1 alturas o silencio) y asigna una probabilidad condicional de transición desde el estado j al estado k. 9. Medida estética George Birkhoff, en su Medida estética publicada en 1933 (editada en castellano por nuestra Facultad en 1945 como Monografía Nº 3 de la colección dirigida por Cortés Plá), introduce una medida estética, M, definida como M = O , C (24) donde O es el orden y C es la complejidad. Es decir, sería una especie de densidad de los elementos de orden con respecto ala complejidad. Birkhoff hace notar que Luego de analizar la estética de las formas poligonales, los vasos, los ornamentos y los mosaicos, se aboca a la de los acordes, la armonía y la melodía. Si bien Birkhoff aclara debidamente que cualquier intento por establecer una medida estética está necesariamente restringido a “un conjunto definido de recursos musicales”, por ejemplo los correspondientes a la armonía tonal tradicional, se apoya en una serie de supuestos de carácter axiomático que no parecen adecuados para describir un fenómeno empírico como es el de la percepción estética. Así, por ejemplo, al analizar acordes individuales, asigna arbitrariamente una complejidad C = 1 y pasa a enunciar los siguientes componentes del orden O: 1 si es un acorde mayor; 1 si está en posición fundamental (la nota fundamental del acorde en el bajo); −1 si el acorde es disonante; y −1 si el acorde es incompleto o irregular. Los pesos relativos de estos factores son arbitrarios. No declara evidencia empírica que apoye estos valores. Quizás deberían haberse realizado experimentos controlados de percepción estética de acordes variando sistemática y aleatoriamente dichos factores, determinando las constantes que mejor representan el peso relativo de cada factor en un modelo lineal como el propuesto (los componentes se suman). 23 Esto se demuestra calculando la probabilidad acumulada de la densidad de (22) y expresándola como P(x ≤ xo) = G(xo) Luego se tiene en cuenta que una variable distribuida uniformemente cumple P(u ≤ G(xo)) = G(xo), por lo que P(G−1(u) ≤ xo) = G(xo). Tomando x = G−1(u) se obtiene una variable que satisface la expresión deseada, P(x ≤ xo) = G(xo). 18 10. Modelos teóricos Por último, se han propuesto también modelos teóricos formales de la música, en algunos casos planteando las obras o fragmentos con determinada estructura formal como elementos dentro de un espacio sonoro, susceptibles inclusive de experimentar transformaciones (por ejemplo traslaciones, simetrías, etc.) que reflejan los procedimientos típicos utilizados en la composición musical. Existen trabajos monumentales como el Topos of Music, de Mazzola, que abarcan un espectro demasiado amplio de formalización como para intentar siquiera una descripción somera, incluyendo desde la composición hasta la ejecución, el ensayo, la expresión, etc. Bibliografía Bach, Johann Sebastian. “El clave bien temperado”. Academia Bach de Buenos Aires. Ricordi Americana. Buenos Aires, 1984 Birkhoff, George. “Medida estética”. Monografía Nº 3 de la Facultad de Ciencias Matemáticas, Físicoquímicas y Naturales aplicadas a la Industria, Universidad Nacional del Litoral. Rosario, 1945. Campanna, Alessandra. “Iannis Xenakis. Architect of Light and Sound”, Nexus Network Journal, vol. 3, no. 2 (Spring 2001), http://www.nexusjournal.com/Capanna-en.html Fischer, J. Cree. “Piano tuning. A simple and Accurate Method for Amateurs”. Dover Publications. New York, 1975. Grout, D. “A History of Western Music”. W.W. Norton & Company - Inc. New York, 1960. Helmholtz, H. “On the Sensations of Tone”. Dover. New York, 1954. (Editado originalmente en alemán en 1862). Hundt, F. “Origins in Acoustics”, Acoustical Society of America. Woodbury, 1978. Huntley, H, E. “The Divine Proportion: a Study in Mathematical Beauty”. Dover Publications. New York, 1970. Jeans, James. “Science & Music” Dover Publications. New York, 1968. Lehman Bradley. “Bach’s extraordinary temperament: our Rosetta Stone1”. Early Music. Febrero de 2005. LeVeque, William J. “Teoría elemental de los números”. Herrero Hermanos, Sucesores, S.A. Editores. México, 1968. Plomp, K.H.; Levelt, W.J.M. “Tonal consonance and critical bandwidth”. J. Acoust. Soc. Am 38:548. 1965. Scholes, Piercy. “Diccionario Oxford de la Música”. Edhasa/Hermes/Sudamericana. Barcelona, septiembre de 1984. Mazzola, Guerino. “Topos of Music”. Edición GPL. Vulpera, June 2002. 19