Mathématiques et harmonie musicale : de Pythagore à la gamme tempérée

Problématique

Comment la recherche de l’harmonie musicale a-t-elle conduit à résoudre le problème de la dissonance par des outils algébriques comme les suites géométriques et les logarithmes, et en quoi la rupture moderne du dodécaphonisme a-t-elle réintroduit les permutations mathématiques dans l’art de la composition ?

Introduction

Depuis l’Antiquité, la musique et les mathématiques entretiennent une relation d’une incroyable intimité. Dans la Grèce antique, Platon classait la musique parmi les quatre disciplines scientifiques du Quadrivium, aux côtés de l’arithmétique, de la géométrie et de l’astronomie. Pythagore lui-même affirmait : « Il y a de la géométrie dans le bourdonnement des cordes, il y a de la musique dans l’espacement des sphères ».

Pourtant, cette relation ne va pas sans heurts. En cherchant à concevoir des échelles musicales harmonieuses, physiciens et mathématiciens se sont heurtés à des contradictions mathématiques insolubles par de simples fractions, créant des dissonances naturelles indésirables. Ce n’est qu’au XVIIe et XVIIIe siècles que des outils algébriques plus avancés ont permis de trouver un compromis universel : la gamme tempérée. Plus tard, au XXe siècle, la rupture avec les règles traditionnelles a fait de la combinatoire le moteur même de la création musicale.

Dès lors, nous pouvons nous poser la question suivante : Comment la recherche de l’harmonie musicale a-t-elle conduit à résoudre le problème de la dissonance par des outils algébriques comme les suites géométriques et les logarithmes, et en quoi la rupture moderne du dodécaphonisme a-t-elle réintroduit les permutations mathématiques dans l’art de la composition ?

Pour répondre à cette problématique, nous étudierons dans un premier temps la physique du son et la construction géométrique de la gamme de Pythagore, basée sur des fractions simples. Dans un second temps, nous analyserons le compromis de la gamme tempérée, formalisé par les suites géométriques et la perception logarithmique de l’oreille. Enfin, nous explorerons la révolution dodécaphonique d’Arnold Schoenberg et ses applications de la combinatoire modulaire.

I. Physique du son et gamme pythagoricienne : La géométrie des fractions

A. Acoustique physique : Vibration et consonances

D’un point de vue physique, un son musical est un signal périodique caractérisé par sa fréquence fondamentale $f$ exprimée en Hertz (Hz). Lorsqu’une corde de longueur $L$ et de tension constante est pincée, elle vibre. Pythagore a découvert que la hauteur du son perçu est intimement liée à la géométrie de la corde :

Si on divise sa longueur par 2 ($L/2$), la fréquence double ($2f$). Acoustiquement, il s’agit d’une octave (rapport de fréquences de $\frac{2}{1}$). Les deux notes, bien que de hauteurs différentes, ont le même nom et sont perçues comme fusionnelles.
Si on prend les deux tiers de sa longueur ($2L/3$), la fréquence est multipliée par $\frac{3}{2}$ ($1{,}5f$). C’est la quinte juste (par exemple, de Do à Sol), l’intervalle le plus consonant après l’octave.

B. Le cycle des quintes et la création de la gamme

Pour construire une gamme de 12 notes, Pythagore a imaginé un processus itératif simple appelé le cycle des quintes. On part d’une fréquence fondamentale $f_0$ (par exemple, Do) et on monte de quinte en quinte en multipliant par $\frac{3}{2}$. Si la note obtenue sort de l’octave de référence (c’est-à-dire si sa fréquence dépasse $2f_0$), on la divise par 2 pour la ramener dans l’intervalle $[f_0\ ; 2f_0[$.

C. Le comma pythagoricien et la quinte du loup

Sur le papier, en enchaînant 12 quintes, on devrait théoriquement revenir à la note de départ après avoir parcouru 7 octaves. Cependant, d’un point de vue arithmétique, égaler 12 quintes et 7 octaves revient à écrire :

$$\left(\frac{3}{2}\right)^{12} = 2^7 \iff 3^{12} = 2^{19}$$

Or, d’après le théorème fondamental de l’arithmétique (unicité de la décomposition en facteurs premiers), un nombre impair ($3^{12} = 531,441$) ne peut être égal à un nombre pair ($2^{19} = 524,288$). L’écart entre ces deux valeurs est appelé le comma pythagoricien :

$$\text{Comma} = \frac{(3/2)^{12}}{2^7} = \frac{3^{12}}{2^{19}} \approx 1{,}01364$$

Cette différence d’environ $1{,}36\ %$ représente près d’un quart de demi-ton, ce qui est tout à fait audible et dissonant. Pour boucler sa gamme, Pythagore a dû sacrifier le dernier intervalle, appelé la quinte du loup, si fausse qu’elle « hurle » à l’oreille. Au Moyen Âge, cela restreignait grandement les possibilités harmoniques des musiciens, qui devaient éviter certaines tonalités sous peine de dissonance.

II. Le tempérament égal : Le compromis des suites géométriques et des logarithmes

A. La modélisation par les suites géométriques

Pour éliminer la quinte du loup et permettre aux musiciens de jouer et de transposer librement dans toutes les tonalités, les mathématiciens du XVIIe siècle (dont Simon Stevin et Marin Mersenne) ont développé le tempérament égal. Le principe est de diviser l’octave (rapport 2) en 12 intervalles de rapports de fréquences strictement identiques : les demi-tons.

Notons $f_n$ la fréquence de la $n$-ème note de l’octave. Pour que les intervalles soient identiques, la suite $(f_n)$ doit être une suite géométrique de premier terme $f_0$ et de raison $q$ :

$$f_n = f_0 \cdot q^n$$

Comme la douzième note ($n=12$) correspond précisément à l’octave supérieure ($2f_0$), on a :

$$f_{12} = f_0 \cdot q^{12} = 2f_0 \implies q^{12} = 2 \implies q = \sqrt[12]{2} \approx 1{,}059463$$

Chaque demi-ton est donc défini par le rapport irrationnel constant $q = 2^{1/12}$. La fréquence d’une note située à $N$ demi-tons de la note de référence $f_0$ (par exemple, le La 3 à $440\text{ Hz}$) s’exprime par la fonction :

$$f(N) = f_0 \cdot 2^{\frac{N}{12}}$$

B. La perception logarithmique de l’oreille

Le choix de diviser l’octave par une suite géométrique est conforté par la physiologie humaine. Notre système auditif ne perçoit pas les variations de fréquences de manière linéaire, mais de façon logarithmique (selon la loi psychophysique de Weber-Fechner). La sensation de distance entre deux sons (l’intervalle) est proportionnelle au logarithme du rapport de leurs fréquences.

Pour mesurer cette perception, on utilise une unité logarithmique appelée le cent (noté c). L’intervalle $I$ en cents entre deux fréquences $f_1$ et $f_2$ est défini par :

$$I = 1200 \cdot \log_2\left(\frac{f_2}{f_1}\right) = 1200 \cdot \frac{\ln(f_2 / f_1)}{\ln(2)}$$

Une octave vaut exactement $1200$ cents, et chaque demi-ton de la gamme tempérée vaut précisément $100$ cents. Grâce à cette régularité logarithmique, un piano possède des touches uniformes, et transposer une mélodie ne modifie pas sa nature harmonique.

III. La rupture moderne : Atonalité, dodécaphonisme et combinatoire de Schoenberg

A. Sortir de l’ancrage tonal

Pendant des siècles, la musique occidentale a reposé sur la tonalité : une hiérarchie où une note pivot (la tonique) polarise l’ensemble de l’œuvre. Au début du XXe siècle, Arnold Schoenberg cherche à s’affranchir de cette contrainte et proclame « l’émancipation de la dissonance ». Il crée pour cela le dodécaphonisme, un système où les 12 notes de l’échelle tempérée doivent être traitées avec une égalité absolue.

B. Le jeu des permutations

Pour garantir cette équité de traitement, Schoenberg impose l’utilisation d’une « série dodécaphonique » : une succession ordonnée des 12 notes de l’octave. La contrainte mathématique est la suivante : aucune note de la série ne peut être rejouée tant que les 11 autres n’ont pas été entendues.

Déterminons le nombre de séries initiales distinctes qu’un compositeur peut construire. Il s’agit du nombre de permutations d’un ensemble de 12 éléments distincts :

$$P_{12} = 12! = 12 \times 11 \times 10 \times \dots \times 1 = 479,001,600\text{ séries}$$

C. Algèbre modulaire $\mathbb{Z}/12\mathbb{Z}$ et symétries géométriques

Pour développer son œuvre sans tomber dans la répétition monotone, le compositeur applique à la série initiale des transformations formelles qui correspondent à des symétries géométriques dans un plan. En identifiant les 12 notes de la gamme à des entiers compris entre 0 et 11 dans le groupe additif modulaire $\mathbb{Z}/12\mathbb{Z}$ (où $12 \equiv 0$), on peut formaliser ces transformations :

La transposition ($T_k$) : Elle décale toute la série d’un nombre $k$ de demi-tons. $$x \mapsto (x + k) \pmod{12}$$
L’inversion ($I$) ou miroir : Elle remplace chaque intervalle par son opposé (symétrie par rapport à un axe horizontal). $$x \mapsto (-x) \pmod{12} \equiv (12 - x) \pmod{12}$$
La rétrogradation ($R$) : La série est lue de droite à gauche (symétrie par rapport à un axe vertical).
L’inversion rétrograde ($IR$) : La série est inversée puis lue à l’envers.

À partir d’une seule série de départ, le compositeur génère ainsi une matrice de 48 séries apparentées ($12\text{ transpositions} \times 4\text{ formes}$). La composition musicale devient alors un exercice de logique pure et de combinatoire matricielle.

Conclusion

En conclusion, la quête de l’harmonie sonore montre comment les mathématiques et la physique se complètent pour façonner l’art. Du rêve pythagoricien d’un univers régi par des fractions simples, la musique a dû faire le deuil de la perfection acoustique pour adopter le compromis algébrique de la gamme tempérée, basée sur la raison irrationnelle $\sqrt[12]{2}$.

Au XXe siècle, ce système tempéré a permis la révolution dodécaphonique de Schoenberg, transformant l’acte d’écrire en un jeu de permutations algébriques modulaire dans $\mathbb{Z}/12\mathbb{Z}$. Aujourd’hui, cette alliance se poursuit dans l’ère numérique : que ce soit à travers les algorithmes de compression audio ou les intelligences artificielles génératives, la musique continue de s’écrire en équations.

Questions potentielles du jury

1. Pourquoi la gamme tempérée n’est-elle pas acoustiquement parfaite ?

Bien que la gamme tempérée résolve le problème de la quinte du loup et permette de moduler dans tous les tons, elle présente un défaut acoustique : ses intervalles ne correspondent pas à des fractions d’entiers simples. Par exemple, une tierce majeure pure (physique) correspond au rapport harmonique $\frac{5}{4} = 1{,}25$. Dans la gamme tempérée, une tierce majeure vaut 4 demi-tons, soit un rapport de $2^{4/12} = 2^{1/3} \approx 1{,}2599$. La tierce tempérée est donc légèrement trop haute d’environ $0{,}8\ %$ (soit 14 cents), ce qui crée un léger battement acoustique. Les instruments à cordes sans frettes (comme le violon) choisissent souvent de jouer des intervalles purs plutôt que tempérés lorsqu’ils jouent non accompagnés pour retrouver cette pureté harmonique.

2. Comment calcule-t-on la différence en cents entre la quinte pythagoricienne et la quinte tempérée ?

La quinte pythagoricienne a un rapport de fréquences exact de $r_p = \frac{3}{2} = 1{,}5$.
La quinte tempérée (qui correspond à 7 demi-tons) a un rapport de $r_t = 2^{7/12} \approx 1{,}4983$. Calculons leurs valeurs respectives en cents avec la formule logarithmique $I = 1200 \cdot \log_2(r)$ :
Pour Pythagore : $I_p = 1200 \cdot \log_2(1{,}5) = 1200 \cdot \frac{\ln(1{,}5)}{\ln(2)} \approx 701{,}96\text{ cents}$.
Pour la gamme tempérée : $I_t = 1200 \cdot \log_2(2^{7/12}) = 1200 \cdot \frac{7}{12} = 700\text{ cents}$. L’écart est de seulement $1{,}96\text{ cents}$ (environ $0{,}11\ %$ de différence de fréquence). C’est un écart extrêmement faible, ce qui explique pourquoi l’oreille humaine tolère si bien la quinte du tempérament égal.

3. D’où vient la formule physique de l’octave et de la quinte ? Pouvez-vous la démontrer à partir de la physique des ondes sur une corde vibrante ?

La fréquence fondamentale d’une corde vibrante fixée à ses deux extrémités est donnée par la formule physique : $$f = \frac{v}{2L}$$ Où $v$ est la vitesse de propagation de l’onde dans la corde et $L$ sa longueur.

Si on réduit la longueur de moitié ($L’ = \frac{L}{2}$) sans changer la tension ni la masse de la corde (donc à $v$ constante), la nouvelle fréquence $f’$ devient : $$f’ = \frac{v}{2L’} = \frac{v}{2 \cdot (L/2)} = 2 \cdot \frac{v}{2L} = 2f$$ On démontre ainsi que diviser la longueur par 2 double la fréquence (l’octave).
Si on prend les deux tiers de la longueur ($L” = \frac{2}{3}L$), la fréquence $f”$ devient : $$f” = \frac{v}{2 \cdot (2/3)L} = \frac{3}{2} \cdot \frac{v}{2L} = 1{,}5f$$ On démontre ainsi que le rapport de longueur de $\frac{2}{3}$ produit la quinte (rapport $\frac{3}{2}$).

4. Qu’est-ce que le groupe modulaire $\mathbb{Z}/12\mathbb{Z}$ et en quoi est-il adapté à la musique ?

Le groupe $\mathbb{Z}/12\mathbb{Z}$ est l’ensemble des classes d’équivalence des entiers relatifs modulo 12, muni de l’addition modulaire. En musique, il y a 12 notes dans une octave (Do, Do#, Ré, etc.). Dès que l’on monte de 12 demi-tons, on retrouve la même note à l’octave supérieure. Ainsi, Do (représenté par 0) et le Do supérieur (représenté par 12) sont considérés comme la même note. L’arithmétique modulaire modulo 12 est donc parfaite pour modéliser les hauteurs de notes indépendamment de l’octave dans laquelle elles se situent. Par exemple, transposer de 5 demi-tons vers le haut correspond simplement à l’opération additionnelle : $$x’ \equiv (x + 5) \pmod{12}$$

5. Comment la transformée de Fourier intervient-elle dans le traitement numérique de la musique aujourd’hui ?

La transformée de Fourier est l’outil mathématique fondamental permettant de passer du domaine temporel (l’enregistrement de la vibration de l’air au cours du temps) au domaine fréquentiel (la décomposition de ce son en ses différentes fréquences harmoniques). Un signal sonore complexe $s(t)$ est décomposé en une somme de fonctions sinusoïdales (les harmoniques) : $$S(f) = \int_{-\infty}^{+\infty} s(t) \cdot e^{-i \cdot 2\pi f t} , dt$$ Cet outil est utilisé par les logiciels d’accordage (qui détectent la fréquence fondamentale d’une note), par les algorithmes de compression (comme le MP3, qui éliminent les fréquences inaudibles pour l’oreille humaine selon des modèles psychoacoustiques) ou par les logiciels de reconnaissance musicale (comme Shazam).

Attention : Ce sujet n'est qu'un exemple !

Mathématiques et harmonie musicale : de Pythagore à la gamme tempérée

Mathématiques et harmonie musicale : de Pythagore à la gamme tempérée

Problématique

Introduction

I. Physique du son et gamme pythagoricienne : La géométrie des fractions

A. Acoustique physique : Vibration et consonances

B. Le cycle des quintes et la création de la gamme

C. Le comma pythagoricien et la quinte du loup

II. Le tempérament égal : Le compromis des suites géométriques et des logarithmes

A. La modélisation par les suites géométriques

B. La perception logarithmique de l’oreille

III. La rupture moderne : Atonalité, dodécaphonisme et combinatoire de Schoenberg

A. Sortir de l’ancrage tonal

B. Le jeu des permutations

C. Algèbre modulaire $\mathbb{Z}/12\mathbb{Z}$ et symétries géométriques

Conclusion

Questions potentielles du jury

1. Pourquoi la gamme tempérée n’est-elle pas acoustiquement parfaite ?

2. Comment calcule-t-on la différence en cents entre la quinte pythagoricienne et la quinte tempérée ?

3. D’où vient la formule physique de l’octave et de la quinte ? Pouvez-vous la démontrer à partir de la physique des ondes sur une corde vibrante ?

4. Qu’est-ce que le groupe modulaire $\mathbb{Z}/12\mathbb{Z}$ et en quoi est-il adapté à la musique ?

5. Comment la transformée de Fourier intervient-elle dans le traitement numérique de la musique aujourd’hui ?