miércoles, 7 de agosto de 2013

¿Por qué hay doce notas?

La música es un arte bien conocido, y no son pocos los que han estudiado sus elementos principales (las notas, las escalas, los acordes...). Sin embargo, pocas veces se pregunta la gente de dónde viene toda esa estructura. Cuando uno aprende música, lo asume como algo establecido y deja su origen a los físicos, sin pararse a preguntar por qué un Do es un Do tanto si suena más grave como si es más agudo, tanto si lo toca un piano como un violín. O por qué se escogen las 7 notas de la escala mayor de Do habitualmente, y no cualquier otra combinación de las 12 notas de la escala cromática completa, e incluso, en definitiva, por qué la escala cromática tiene 12 notas y no 11 o 13.

Esta última pregunta siempre me había intrigado desde que comencé a estudiar música, y no fue hasta mucho más tarde cuando entendí de dónde venía todo. Algunas páginas por Internet explican bastante bien toda esta teoría, pero van directamente a los resultados, sin explicar el proceso de búsqueda. Creo que es más bonito ir siguiendo todo el avance científico, desde la ignorancia, pasando por la observación del fenómeno, los intentos teóricos de crear un sistema coherente, y finalmente los resultados; así que hoy lo explico aquí, por si a alguien le interesara tanto como a mí esta curiosidad y quiere descubrirla siguiendo los pasos que seguramente guiaron, primero a los pitagóricos, y más tarde a los demás investigadores de este tema.

Buscando un primer sonido

El sonido es una onda, una alteración del aire que sigue las leyes del movimiento ondulatorio. Las ondas vienen definidas por su amplitud, su frecuencia y su fase. Lo que más caracteriza a un sonido desde el punto de vista musical es la frecuencia, de modo que nos olvidaremos de la amplitud (que correspondería al volumen de la música) y de la fase (que no tiene interés musicalmente, ya que no altera la nota).

Existen infinitas frecuencias audibles. Pero si queremos hacer música, necesitamos trabajar con unas frecuencias concretas e identificables, no con infinitos sonidos arbitrarios. Para ello debemos escoger entre los sonidos audibles (aproximadamente entre los 20 Hz y los 20 KHz) unos cuantos que nos permitan hacer música. Por lo general, el que se toma como referencia es el de 440 Hz, al que se llama La (o, en la notación anglosajona, A). Así que esa será nuestra primera nota, a la que a veces se denomina tónica.

Los armónicos

Pero con una nota no hacemos nada, necesitamos más sonidos. ¿Qué otra frecuencia escogeremos? ¿441 Hz? ¿1000 Hz? ¿33,67 Hz? No podemos hacerlo arbitrariamente, sino que lo lógico sería escoger un sonido que fuera lo más consonante posible con La. Un sonido consonante es aquel que suena "bien" con otro, que provoca un efecto agradable, como si ambos sonidos tuvieran algo en común. En cambio, un sonido disonante es aquel que suena "mal", que produce un efecto violento y desagradable al sonar con otro. En la música se usan ambos efectos, según la impresión que se quiera crear en el oyente. Los sonidos disonantes vienen bien para momentos de tensión o emoción, mientras que los consonantes se usan para provocar un efecto de tranquilidad y armonía. Pero de momento nos interesan más los consonantes, porque queremos crear una estructura básica en la que todo "encaje"; para crear disonancias siempre estamos a tiempo.
Lógicamente, la consonancia tiene que ver con la relación de las frecuencias. Si la forma de la onda de ambos sonidos tiene alguna relación, serán consonantes; si no, se crea una disonancia. Parece lógico, por tanto, probar de entrada con la frecuencia justamente doble, 880 Hz. Si escuchamos ambos sonidos veremos que tienen una bonita similitud; uno más agudo que otro, por supuesto, pero nos provocan una sensación muy parecida. Lo mismo ocurre si probamos con la mitad de la frecuencia, 220 Hz. La nueva nota es más grave, pero se parece mucho a La. Hay razones físicas que provocan este efecto, entre ellas el hecho de que un cuerpo (en este caso el instrumento musical) sometido a una vibración, normalmente no vibra en una sola frecuencia perfecta, sino que aparte de la frecuencia principal, vibra también en todo un conjunto de frecuencias que son las que le dan el timbre característico. A la izquierda podéis ver un gráfico en el que diferentes ondas puras se suman para crear la vibración real que se produce en el instrumento. La mayor parte de estas frecuencias son armónicos de la frecuencia principal, es decir, ondas que guardan una proporción exacta con la frecuencia básica (el doble, el triple, etc.). Por eso vamos a buscar entre esos armónicos las frecuencias adecuadas para crear una escala. El primer armónico que encontramos es el que tiene el doble de frecuencia, aunque en realidad se suele hablar de primer armónico para referirse a la nota principal (en este caso la de 440 Hz) y al siguiente (800 Hz) ya se le llama segundo armónico, al de frecuencia triple tercero, etc.

El segundo armónico: La octava

La similitud entre una onda y su segundo armónico sugiere una idea que es fundamental: Puesto que ambos sonidos se parecen mucho, ¿por qué no consideramos que son en realidad la misma nota y buscamos otras que estén entre las dos para formar una escala? De este modo, repitiendo el mismo esquema pero multiplicando las frecuencias de todas esas notas, volveríamos a tener la escala de nuevo, pero en un registro más agudo. Pues bien, a este intervalo de frecuencias entre la nota tónica y su segundo armónico, se le llama una octava, y de hecho al segundo armónico mismo se le denomina octava.

La octava nos ofrece dos cosas muy interesantes: primero, un espacio más limitado en el que trabajar (ya no estamos entre los 20 Hz y los 20 KHz, sino entre 440 Hz y 880 Hz), y segundo, la posibilidad de reproducir la escala en tonos más graves o más agudos (una vez escojamos las notas dentro de la octava, sólo tenemos que ir multiplicando o dividiendo por 2 todas las frecuencias, y mágicamente tendremos la escala en un registro más agudo o más grave).

Podemos convenir entonces en que el sonido de 220 Hz y el de 880 Hz también son La, solo que de otras octavas. Al de 440 se le suele llamar La4, para distinguirlo de los demás. Así, el de 220 sería el La3, etc. Los franceses y los belgas son algo especiales y usan una notación desplazada, así que para ellos el de 440 es el La3.

Bien, pero no podemos hacer música con unas notas que suenan prácticamente igual (recordemos que, aunque se cambie de octava, el sonido resulta muy parecido al oído humano y que, aunque más grave o más agudo, provoca una sensación parecida). Necesitamos más "colorido", más variedad, necesitamos llenar el espacio de la octava con notas diferentes, pero... ¿qué nueva frecuencia escogeremos?

El tercer armónico: La dominante

Una opción bastante lógica es escoger un armónico, es decir, un múltiplo o un divisor exacto de la frecuencia de la nota La. De este modo, aunque la onda no sea tan consonante como la octava, probablemente conseguiremos un efecto bastante armónico. Por tanto, lo lógico es escoger ahora el triple, igual que antes escogimos el doble, es decir, 1320 Hz. A esta nota la llamaremos Mi. Pero esta frecuencia no nos interesa, porque buscamos frecuencias dentro de la octava (entre 440 Hz y 880 Hz). ¿Qué podemos hacer? Fácil: usar el Mi de la octava anterior, es decir, 660 Hz. Ya tenemos una escala de dos notas: La (440) y Mi (660). A esta segunda nota de la escala se la llama a veces dominante, y más frecuentemente, la quinta (luego veremos por qué).

Fijémonos en un detalle curioso. Si a la frecuencia de nuestra nota principal la llamamos f, La frecuencia de este Mi es justamente f+
f / 2
o, si se prefiere,
3f / 2
.

Vale la pena ver la correspondencia que tiene esto en la vibración de una cuerda. Dado que la longitud de onda es la inversa de la frecuencia, sabemos que si la longitud de onda de La era L la nueva longitud de onda será
2L / 3
. En este gráfico podéis ver cómo los diferentes armónicos van multiplicando siempre la frecuencia de la tónica. Desgraciadamente, para volver a encontrar una frecuencia que sea múltiplo exacto, tendríamos que ir hasta el quinto armónico, a frecuencias bastante altas. Si lo que queremos es obtener fracciones lo más "enteras" posibles, podemos seguir la regla
nL / n+1
, o si se prefiere en frecuencia f
n+1 / n
.

Buscando la tercera nota: La subdominante. "Los tres acordes".

Fijémonos que esta serie de números nos viene bien porque mientras usemos una fórmula del estilo de f+f/n, siempre nos estaremos moviendo dentro de la octava, e iremos encontrando las fracciones más "exactas" en relación a la frecuencia fundamental. Para n=3 el resultado será aproximadamente (vamos a trabajar con números más o menos redondos para que se entienda mejor) 440+146=586. A esta nota de 586 Hz la llamaremos Re, y a veces se la denomina subdominante, y más frecuentemente la cuarta.

Ya tenemos tres notas. Estas tres notas son muy importantes, y de hecho se han convertido en un clásico de la música. A menudo escuchamos la expresión despectiva: esta canción está hecha sólo con tres acordes. Y realmente es cierta: muchísimas canciones populares tienen sólo tres acordes. ¿Adivinamos cuáles? En efecto, el de la tónica, el de la dominante y el de la subdominante. No en vano las tres notas encajan bien entre sí, mejor que cualquier otra combinación. 

El intervalo

Aparentemente, una solución fácil sería repetir el proceso hasta tener tantas notas como nos interese en nuestra escala musical. Vamos a intentarlo con los siguientes divisores, a ver qué ocurre:

n=4: 440 + 110 = 550
n=5: 440 + 88 = 528
n=6: 440 + 73 = 513
n=7: 440 + 62 = 502
n=8: 440 + 55 = 495
n=9: 440 + 48 = 488

La primera de ellas (550 Hz) sí podemos identificarla con una nota (más adelante veremos que corresponde a Do#), pero si nos fijamos en el resto de la serie, vemos que las diferencias se hacen ya muy pequeñas, hasta el punto de que la diferencia entre un sonido y el siguiente es de 7 u 8 Hz, una diferencia apenas apreciable. Eso es un problema, porque nos convendría tener una escala repartida uniformemente, es decir, que la "diferencia de tono" entre una nota y la siguiente sea más o menos la misma, escojamos la nota que escojamos, de modo que todo el "espacio tonal" quede dividido de una manera más o menos uniforme. ¿Qué podemos hacer? Es aquí donde aparece el concepto de intervalo. Un intervalo es la "diferencia de tono" entre dos notas.

Bien, una posibilidad matemática es dividir el espacio de frecuencia entre f y 2f en n intervalos regulares. De entrada a uno se le ocurre que cada intervalo valdría f/n, y que para cada nota musical m su frecuencia sería f+(mf/n), donde m vale entre 0 y n. Sin embargo, sabemos que no podemos hacerlo así, porque la frecuencia va aumentando exponencialmente. Por ejemplo, la frecuencia de cada octava no es igual a la de la nota base más una cantidad, sino a la base multiplicada por 2. Como todo aumenta a base de factores, no podemos hacer una división aritmética de la octava, sino geométrica. Entre una nota y la anterior no habrá que sumar una cantidad constante, sino multiplicar por una cantidad constante, K. Como partimos de f y debemos llegar a 2f, K será igual a la raíz n-ésima de 2. Por ejemplo, si sólo queremos tener 3 notas en la escala (4 si contamos la octava), usaríamos la raíz cúbica de 2, de modo que las notas tendrían las frecuencias f , fK, fK2. La sigiente ya sería fK3=2f.

Arriba podéis ver un gráfico de la octava de La dividida en 6 notas equidistantes (desde el punto de vista musical) y que, sin embargo, corresponden a valores no proporcionales en el eje de frecuencias. Evidentemente, lo mismo que se aplica a la frecuencia se aplica inversamente a la longitud de onda, y eso explica que los trastes de una guitarra no estén separados por la misma distancia, sino que van siguiendo una progresión característica.

La escala bien temperada

Fijémonos en que al querer dividir la escala en intervalos exactamente iguales (lo cual parece lógico musicalmente), el resultado no encaja con las fracciones de los armónicos. Esto crea una pequeña discrepancia numérica que explica en parte la pequeña desviación que veis en los valores que vamos calculando. Por ejemplo, sabemos que Mi acabará siendo la séptima nota de la escala de 12 notas, y también sabemos que la frecuencia de Mi es 3/2 de la de La (660 a 440); sin embargo, si tomamos K como la raíz doceava de 2 y calculamos 440·K7, no da exactamente 1,5 sino más bien 1,498. En definitiva, nos encontramos ante un compromiso: o dividimos la escala mediante factores racionales, pero entonces los intervalos resultantes no serán exactamente iguales (aunque pueden ser casi iguales), o bien la dividimos en intervalos exactamente iguales, pero mediante un factor irracional, con lo que las frecuencias resultantes no encajarán exactamente con las de la serie armónica, que obteníamos multiplicando por fracciones exactas. No hay alternativa, hay que escoger entre un método u otro. En la antigüedad se usaba bastante el primer método, pero desde los tiempos de J.S. Bach se usa el segundo tipo de escala "equidistante", a la que se denomina escala bien temperada. Esta pequeña divergencia de cualquiera de los dos métodos puede parecer un problema, pero es más bien un problema teórico; en la práctica se corrige en la afinación definitiva del instrumento que hace el músico, y no supone un gran inconveniente.

Por tanto la fórmula de la frecuencia de una nota m será: f Km, donde K es la raíz n-ésima de 2. Ahora la pregunta sería, ¿qué n queremos?, es decir ¿cuántas notas debe tener la escala?

Primer intento: el tono

Si miramos la diferencia de frecuencias entre las notas que ya teníamos, veremos que La (440) está bastante "lejos" de las otras dos. Sin embargo, el intervalo que forman Re (586) y Mi (660) no es muy elevado. En efecto, este intervalo es muy importante en la música, y se lo denomina tono. ¿Y si consideramos el tono como el intervalo básico de la escala e intentamos dividir la octava con él? Bien, si tenemos en cuenta que la frecuencia de una nota de la escala se puede obtener multiplicando la de la nota anterior por K, eso significa que K=660/586, que es aproximadamente 1,126. Bien, vamos a ver qué pasa si intentamos dividir la octava en tonos. En realidad, y aunque no pretendo entrar a fondo en el tema del cálculo, es inevitable que perdamos algo de precisión. Recordemos que la frecuencia de Re era 440+440/3, lo que en realidad sería 586,666... Pero para comprender la teoría ya nos sirve:

0: 440
1: 440 · K = 495,56
2: 440 · K2 = 558,14
3: 440 · K3 = 628,62
4: 440 · K4 = 708
5: 440 · K5 = 797,41
6: 440 · K6 = 892

Esta tabla nos lleva a varios resultados curiosos. En primer lugar, parece que realmente hemos conseguido dividir bastante bien la octava, puesto que la frecuencia de la última nota (892) es casi la de la octava (880). La diferencia de 12 Hz es apenas un 1% de la frecuencia misma de la nota. Esto podría dar lugar a una escala de 6 notas (la misma que se habíamos visto en el gráfico de la distribución exponencial de las frecuencias), lo cual estaría bastante bien.

Sin embargo, observamos un detalle bastante desagradable: ni Re ni Mi están en los resultados obtenidos. Ninguna de las frecuencias está próxima a ellas. Y evidentemente, no nos interesa una escala que no incluye ninguna de las dos notas más consonantes con la tónica.

Segundo intento: el semitono y el ciclo de cuartas

Como el tono no nos ha funcionado, vamos a intentar otra estrategia. Vamos a volver al criterio inicial de las fracciones enteras, y vamos a buscar la nota más consonante posible con las que tenemos. Puesto que ya sabemos que la más consonante con La es Mi, vamos a ver cuál sería la más consonante con Mi, que probablemente será también bastante consonante con La. Si buscamos la dominante de la escala de Mi, tendremos que 660·3/2 = 990, que trasladada a nuestra octava sería 495. A esta nota la llamaremos Si. Ya puestos, podríamos buscar la subdominante de Mi: 660·4/3 = 880. Vaya, resulta que es justamente la octava de La.

Vamos entonces a probar con los armónicos de Re, a ver qué pasa. Su dominante sería 586 + 586/2 = 879. Vaya, está claro que si usáramos toda la precisión decimal, sería en realidad 880, es decir, nuevamente La. No es sorprendente que todo cuadre, puesto que f·(3/2)·(4/3)=f·(4/3)·(3/2)=2f. Y aquí es donde vemos una vez más la importancia de la cuarta: resulta que el intervalo de cuarta es justamente el complementario del de quinta.

Parece, por tanto, que si vamos buscando siempre la quinta de la quinta (y corrigiéndola para que entre en nuestra octava) o bien la cuarta de la cuarta, esto va generando nuevas notas. Iremos multiplicando siempre por 3/2, 3/4 o 3/8, según nos convenga para que el resultado entre en la octava. Vamos a ver los resultados (una vez más, pongo cifras enteras e ignoro las desviaciones del cálculo):

Por quintas: La (440), Mi (660), Si (495), Fa# (742), Do# (556), Sol# (834), Mi♭ (625), Si♭(468), Fa (702), Do (526), Sol (789), Re (591), La (443).

Hay una cierta desviación por el cálculo con decimales, pero puede verse que, tras los doce pasos, llegamos a la nota original. Si intentáis hacer el mismo proceso con las cuartas, veréis que salen las mismas notas, pero en sentido contrario: La, Re, Sol, Do, Fa, etc. A este ciclo de notas se le llama ciclo de cuartas (e igualmente se puede hablar de ciclo de quintas para el de más arriba), y lo usan bastante los músicos para un cambio de escala llamado modulación, que va más allá del objetivo de este artículo.

La escala cromática

Es evidente que si hemos conseguido encontrar 12 notas tanto a través de las quintas como de las cuartas, y cerrar el ciclo, estas notas son buenas candidatas para formar una escala. Desgraciadamente, las hemos encontrado desordenadas. Vamos a intentar ordenarlas para formar la escala tal y como la usan los músicos:

La (440), Si♭(468), Si (495), Do (526), Do# (556), Re (591), Mi♭ (625), Mi (660), Fa (702), Fa# (742), Sol (789), Sol# (834), La (443)

En la notación anglosajona, esta escala es: A, A#, B, C, C#, D, D#, E, E#, F, F#, G, G#, A.

Si dividís dos frecuencias consecutivas, veréis que dan un resultado parecido, aproximadamente de 1,060 que es más o menos la raíz duodécima de 2. Esto cuadra bastante con lo que vimos más arriba de que un buen candidato para ir obteniendo las frecuencias es usar la raíz n-ésima de 2 como factor. En aquel momento escogimos el tono e intentamos dividir la octava en 6, y no nos sirvió. Entonces usamos K=660/586, que es aproximadamente 1,126, aproximadamente la raíz sexta de 2. Ahora vemos que si la dividimos en 12 intervalos y usamos la raíz duodécima, para obtener una escala bien temperada, cuadra bastante bien. Esta diferencia tonal es justo la mitad del tono, y por eso se llama semitono, y es el intervalo fundamental de la música occidental. La escala que forman estas 12 notas se llama cromática. Y ahora ya sabemos la fórmula para obtener la nota n-ésima de la escala de La4, que puede escribirse de esta bonita manera:

f = 440 · 2n/12

Lógicamente, cambiando 440 por la frecuencia de la nota deseada, podremos obtener las de su escala correspondiente. Aquí también vemos una explicación de por qué la división de la octava en intervalos iguales no cuadra con el método de los armónicos. Recordad que el método de los armónicos usa siempre multiplicaciones con fracciones enteras. En cambio, este método usa números irracionales. Por ejemplo, la sexta nota de la escala se obtendría multiplicando 440 por la raíz cuadrada de 2, que sabemos que es un número irracional. De todos modos, esta discrepancia es tan pequeña que no resulta relevante para el músico, y se puede afinar cuadrando bastante bien las dos reglas.

Vemos pues una primera explicación de por qué hay 12 notas. Ahora bien, desde pequeños vemos que en un piano se distinguen siete notas con teclas blancas, más grandes, y otras cinco con teclas negras, más pequeñas. Aquellas que no forman parte de las 7 notas de la escala mayor de Do, se escriben como una alteración de otras notas, con el símbolo sostenido (#) para aumentar un semitono, o bemol (♭) para bajarlo. Por cierto: formalmente se podría usar indistintamente uno u otro; no pasa nada por escribir Re# en lugar de Mi♭. Simplemente, por tradición se tiende a usar el bemol sobre Mi y Si, y el sostenido sobre Do, Sol y Fa.
Vamos a ver ahora la razón de esta separación entre las 7 notas básicas y las 5 restantes.

La escala diatónica

Nos puede parecer que, matemáticamente, desde un punto de vista formal, la escala cromática es el no-va-más. Sin embargo, para un músico tiene dos pequeños inconvenientes. El primero es que el intervalo de semitono es bastante pequeño. Esto hace, por un lado, que surjan demasiadas notas (nos hubiera bastado con 7 u 8) y por el otro, que los tonos estén demasiado juntos, ya que en música suele venir bien que el "salto" entre las notas de una melodía no siempre sea tan pequeño.

El segundo inconveniente es que la escala no tiene "carácter". Es totalmente regular. Si uno toca la escala con un instrumento, nota como si simplemente hubiera una progresión de un sonido que se hace cada vez más agudo, no transmite nada. Para que una escala resulte emotiva, viene bien que ella misma sea una especie de melodía, con saltos irregulares previamente escogidos para causar una sensación.

De alguna manera puede parecer contradictorio que hayamos comenzado buscando la máxima consonancia y la máxima regularidad, y ahora queramos introducir irregularidades. Pero al principio se trataba de sentar unas bases lógicas, un fundamento teórico, y ahora ya necesitamos algo más práctico, que nos sea útil musicalmente. En la música, aunque el intervalo de semitono se usa, es conveniente basarse más bien en el de tono, e incluso a veces en el de tercera menor (tono + semitono). ¿Cómo podemos crear una escala con estos intervalos? Ya lo intentamos más arriba al dividir la escala en 6 y fracasamos, porque resultaba que la nota cuarta está a dos tonos y medio de la primera, y la quinta a tres tonos y medio, y nos conviene que tanto una como la otra pertenezcan a la escala.

Para ello vamos a volver al ciclo de quintas: La, Mi, Si, Fa#, Do#, Sol#, Mi♭, Si♭, Fa, Do, Sol, Re, La... Pero como la que verdaderamente tiene importancia para nosotros es la tónica (La) vamos a mirar el ciclo centrándonos en ella:

...Mi♭, Si♭, Fa, Do, Sol, Re, La, Mi, Si, Fa#, Do#, Sol#, Mi♭...

Fijémonos en un detalle: todas las notas "no diatónicas" están juntas, y bastante alejadas del La. Es como si la escala diatónica mayor (Do-Re-Mi-Fa-Sol-La-Si) se hubiera definido centrándose en el ciclo de quintas y escogiendo unas cuantas notas por encima y unas cuantas por debajo de la tónica deseada. Y en efecto, así es como se construye. En concreto, escogiendo Do como tónica, su cuarta (Fa) y las siguientes cinco quintas, se obtiene esa escala. A su vez, la escala diatónica menor en La se obtiene centrándose en el La, y escogiendo las dos siguientes quintas y las cuatro anteriores cuartas.

Para completar la octava sin que haya intervalos mayores que el tono, nos basta con escoger siempre siete notas. He aquí la explicación de por qué la música occidental se basa en escalas de siete notas precisamente. Lo que diferencia a cada una de las escalas que se suelen escoger son los lugares en los que caen los intervalos de semitono, ya que para completar la octava es necesario que dos de los intervalos sean de semitono. De lo contrario, no podremos incluir las notas dominante y subdominante, y eso sería un problema.

En el caso de la escala mayor, se prefiere un esquema del tipo tono-tono-semitono-tono-tono-tono-semitono, mientras que en la escala menor se prefiere tono-semitono-tono-tono-semitono-tono-tono. Existen también otras muchas modalidades de la escala, llamadas modos, cada una con su "carácter", eso que la escala cromática no nos ofrecía y que el músico ha de saber escoger en sus composiciones. Pero escribir sobre los modos y su carácter ya entraría en una discusión puramente musical, más allá de la teoría que he intentado explicar en este texto.

Imágenes: