Musique, mathématiques et informatique : témoignage d’un élève

On peut faire de la musique ou en composer à côté d’une formation polytechnicienne ou en exerçant un métier qui découle de cette formation et qui n’a rien de musical. On peut aussi délaisser la voie du scientifique ou de l’ingénieur pour se consacrer exclusivement à la musique. Mais l’exemple d’Augustin Bouquillard montre qu’on peut faire encore mieux : on peut utiliser sa formation d’X et les compétences qu’elle développe au bénéfice de la musique elle-même ; c’est la fusion rêvée entre l’activité musicale et l’activité scientifique, dont les natures sont finalement sous certains angles très proches. En voici la démonstration par l’exemple.
Lorsque Jérôme Bastianelli m’a proposé de participer au dossier de La Jaune et la Rouge consacré aux X et la musique, j’ai ressenti tout à la fois de la joie, de la fierté aussi, et beaucoup d’embarras. Je fais bien pâle figure aux côtés d’illustres anciens, compositeurs et musiciens. Aussi témoignerai-je ici simplement de mon rapport intime à la musique et de ce que notre école peut apporter par son ouverture à des élèves qui, comme moi, sont partagés sinon tiraillés entre un ardent désir de musique et une irrépressible soif de sciences.
Un engagement premier pour la musique
Si, depuis mon plus jeune âge, la musique occupe une place centrale dans ma vie, j’ai toujours nourri une très grande curiosité à l’égard de la nature, des sciences du vivant et plus tard des mathématiques. Entré à huit ans au Chœur d’enfants de la Maîtrise Notre-Dame de Paris, j’ai tout d’abord vécu la musique émotionnellement, chantant l’immense répertoire de la musique sacrée aux côtés de chefs et compositeurs, fervents et engagés, qui nous ouvraient à des langages musicaux multiples et à des expériences sonores intenses. Puis j’ai intégré, en piano, orgue et accompagnement, le conservatoire à rayonnement régional de Paris, travaillant avec Jean-Marie Cottet, musicien fascinant à l’avant-garde, alors que dans le même temps Vincent Warnier, remarquable titulaire des orgues de Saint-Étienne-du-Mont, m’initiait à l’univers wagnérien pour lequel je nourris une vraie passion, ce qui m’a d’ailleurs conduit en 2023 à Bayreuth.
« Moi qui me rêvais chef de chant à l’opéra, j’ai commencé à m’interroger sur le sens de ma quête artistique. »
À quatorze ans, alors que je préparais le Conservatoire national supérieur de musique et de danse de Paris (CNSMDP), David Lively, pianiste éclectique et virtuose, m’a proposé de me faire travailler à l’École normale de musique de Paris dans le cadre de Vocations, cursus intensif assorti d’une bourse d’études. Disciple de Claudio Arrau, il m’a fait prendre conscience de l’engagement du corps tout entier dans la création du son et le soutien du phrasé, m’inculquant aussi un certain idéal de dépassement de soi. J’ai poursuivi ma formation en classe d’Artist Diploma auprès de Philippe Bianconi, magnifique soliste, avec qui j’ai travaillé sur les couleurs et les textures, la beauté et la ligne du son, me plongeant dans les harmonies délicieuses et subtiles d’une musique française trop souvent oubliée.
À ce moment toutefois – j’avais 19 ans – j’ai douté. Moi qui me rêvais chef de chant à l’opéra, j’ai commencé à m’interroger sur le sens de ma quête artistique, au-delà du simple bonheur personnel de pratiquer la musique.

La musique des mathématiques
Étudiant parallèlement les mathématiques, je ressentais la même excitation que j’avais éprouvée adolescent en découvrant l’harmonie, le contrepoint et la fugue. C’est tout un monde, à peine dévoilé pour moi, d’abstraction, de rigueur, de beauté et d’infinies possibilités qui s’offre là, que je souhaite pouvoir explorer. C’est aussi l’universalité des mathématiques et la virtualité de nombreux liens avec d’autres disciplines, telles l’informatique et aussi la musique, qui m’attirent. Enfin, le processus de création au centre de l’activité de mathématicien me fascine. En effet la contrainte, catalyseur de la création, lie profondément invention mathématique et invention musicale.
C’est la nature fortement contrainte du langage mathématique qui garantit la rigueur et la non-ambiguïté des raisonnements. Sans elle, l’intuition laissée à elle-même ne pourrait s’appuyer sur des constructions prouvées pour bâtir plus avant la compréhension au-delà des sens. De même pour le compositeur, comme le souligne Stravinski dans sa Poétique musicale, « plus on s’impose de contraintes et plus on se libère de ces chaînes qui entravent l’esprit ».
De la contrainte avant toute chose
S’il est une constante dans l’histoire de la musique, de la tétractys pythagoricienne au tempérament égal, de la discrétisation des hauteurs des tétracordes grecs à celle des durées avec l’avènement de la notation mesurée de l’Ars nova de Philippe de Vitry, de l’hégémonie monodique antique et médiévale au contrepoint rigoureux, de l’harmonie classique au dodécaphonisme, du système tonal au sérialisme intégral, c’est celle de la contrainte comme moteur et condition de la création.
La Tétractys pythagoricienne
Représentation géométrique du 4e nombre triangulaire, elle aurait recelé de multiples significations pour les pythagoriciens, en particulier tardifs. Les lignes de la tétractys valant chacune l’un des quatre premiers entiers naturels non nuls, le ratio de chaque paire de rangées consécutives correspond au rapport de fréquences définissant l’une des consonances parfaites : 4⁄3 (quarte), 3⁄2 (quinte), 2⁄1 (octave), seuls intervalles requis pour construire toutes les notes de la gamme de Pythagore.
À cette importance de la contrainte est liée l’idée d’une musique qui se définit en structurant l’écoulement du temps, en ordonnant le chaos. Alors que pour certains, comme Messiaen dans son Traité de rythme, de couleur et d’ornithologie, le bruit ferait partie intégrante de la musique qui, loin d’être une création proprement humaine, proviendrait des résonances de la nature – vision qui fait d’ailleurs écho aux antiques conceptions de l’harmonie des sphères pythagoricienne –, l’adaptation fructueuse du concept d’entropie au matériau musical dénoterait même une véritable affinité entre composition et recherche d’équilibre selon cette mesure du désordre venue de la thermodynamique et étendue par la théorie de l’information.
“Des affinités nombreuses entre objets mathématiques et concepts musicaux.”
Aussi, au-delà des problématiques liées à la nature physique du son et des relations arithmétiques et analytiques bien connues qui en découlent, des affinités nombreuses entre objets mathématiques et concepts musicaux, et sans même évoquer l’incursion explicite et délibérée des mathématiques dans l’écriture musicale à partir de la seconde moitié du XXe siècle, je perçois dans les mathématiques une perspective d’études vertigineuse qui se rapprocherait de l’activité du compositeur, les deux ayant vocation à convaincre, tout en mobilisant et en libérant toutes sortes d’expériences émotionnelles et esthétiques, l’inspiration et le doute conduisant le cheminement du chercheur comme du compositeur.
La notation mesurée de l’Ars nova de Philippe de Vitry
Au XIIIe siècle à Notre-Dame de Paris, Pérotin avait déjà poussé plus avant les innovations de son maître Léonin et mesuré les rythmes des différentes voix de sa polyphonie nouvelle. Philippe de Vitry généralise vers 1320 les principes d’écriture de l’École de Notre-Dame et théorise un système de notation cohérent des durées introduisant le « mode imparfait », c’est-à-dire la division binaire, qui sera condamné par l’Église en 1324, accusé de détourner des mystères divins l’esprit du fidèle. La division ternaire, traditionnelle, était en effet considérée comme le « mode parfait », à l’image de la Trinité.

La mathématisation de l’écriture musicale
Nombreux sont aujourd’hui les domaines de recherche qui conjuguent musique, informatique et mathématiques. Ainsi, comme stagiaire, j’ai travaillé avec Florent Jacquemard, chercheur Inria, sur la transcription automatique de la musique, c’est-à-dire le passage d’un enregistrement audio ou d’un fichier MIDI d’une performance musicale à une partition correctement écrite et lisible par tout musicien. Le projet vise notamment à la conservation du répertoire le plus vaste possible, en particulier celui subsistant seulement sous forme d’enregistrement, comme les soli de jazz, ou sur des supports électroniques d’une pérennité incertaine car menacés par l’abandon de technologies vieillissantes. Il facilite également la constitution à partir d’audios de bases de données multimodales pour la recherche musicologique et l’analyse musicale.
L’une des sous-tâches du mécanisme global de transcription de la musique polyphonique nécessitait le développement d’un algorithme de séparation en voix afin de pouvoir construire une partition bien formatée. On considère pour chaque instant où un nouveau son se fait entendre toutes les distributions possibles entre différentes voix des notes audibles à cet instant. Chacune de ces configurations possibles constitue un sommet dans le graphe des configurations, graphe orienté où toutes les configurations d’un instant i sont initialement reliées à toutes celles de l’instant i + 1. Une valuation est calculée sur chaque sommet (coût vertical) et chaque arête (coût horizontal), reflétant le respect des principes d’écriture par les nœuds considérés.
« Traduire mathématiquement au sein de fonctions de coût les différentes règles de conduite de voix et de contrepoint, modulant leur importance relative selon le style d’intérêt. »
Ce travail m’a donné l’occasion non seulement de mobiliser des outils d’algorithmique dans les graphes, mais aussi et surtout de traduire mathématiquement au sein de fonctions de coût les différentes règles de conduite de voix et de contrepoint, modulant leur importance relative selon le style d’intérêt. Cette mathématisation des règles d’écriture permet une robustesse largement accrue, en particulier face aux croisements de voix, ainsi qu’une grande souplesse stylistique, l’évolution des pratiques en fonction de l’époque considérée se traduisant par des coefficients variables entre les différentes pénalisations.
La représentation symbolique de la musique
J’ai également pu mettre l’informatique au service de la didactique en aidant Jean-Paul Despax, directeur du département de pédagogie du CNSMDP, à automatiser le calcul de descripteurs de difficulté de nature variée sur un large corpus de dictées musicales afin de conduire une étude approfondie des paramètres critiques pour la formation de l’oreille des musiciens. Enfin, j’ai travaillé sur le pitch spelling, autre sous-tâche passionnante du processus de transcription, souvent traitée comme problème indépendant : il s’agit de déterminer à partir des seules hauteurs de sons leur orthographe (ou spelling) correcte en notation occidentale, intimement liée au contexte tonal ou modal de la pièce étudiée – lorsqu’il existe.
Ce processus, nécessaire à une transcription automatique de qualité, doit accroître la lisibilité de la partition obtenue pour l’interprète et renseigner sur les intentions du compositeur via la fonction tonale induite par les noms de notes et altérations retenus. L’algorithme part d’une première idée naïve de minimisation du nombre de signes inscrits sur la partition et, sachant qu’une altération accidentelle dure au maximum le temps de la mesure où elle apparaît, on peut procéder à un calcul de plus court chemin, mesure par mesure, évitant ainsi une explosion du temps de calcul.
« Ce processus, nécessaire à une transcription automatique de qualité, doit accroître la lisibilité de la partition obtenue pour l’interprète. »
Des solutions proposées à l’issue de cette première étape, on déduit différentes armures, i.e. tons globaux envisageables. Afin d’affiner les résultats, on introduit donc d’autres mesures de coût reposant cette fois sur des distances entre séquence de notes et tonalité ainsi qu’entre tons eux-mêmes, qu’on utilise pour calculer une grille des tons locaux au cours de la pièce et grâce à eux choisir le spelling à préférer. L’algorithme conjugue ainsi pitch spelling et détection de tonalités globales comme locales. On étend la notion de distance tonale pour comparer entre eux d’autres modes et accroître la robustesse de l’algorithme au contact de répertoires sortant du cadre tonal.
Ces recherches sur la transcription m’ont conduit à m’interroger sur la représentation symbolique de la musique et la définition d’une partition : Florent Jacquemard tire par exemple parti de la nature arborescente des rythmes usuels pour mettre au point un modèle de partition univoque à l’aide d’arbres syntaxiques, faisant appel à des outils venus du champ des méthodes formelles. De même, la conférence TENOR 2024 m’a ouvert des perspectives insoupçonnées sur la nature protéiforme de la notation musicale et l’unité que peuvent constituer l’œuvre, la partition et la performance quand sont remises en question les distinctions établies.
Les fondements de tous ces ponts jetés entre musique, mathématiques et informatique recèlent de nombreuses questions sur la proximité intrinsèque entre ces domaines de connaissance, dans leur essence et dans leur pratique. C’est justement pour travailler aux interfaces que j’ai souhaité intégrer l’École polytechnique qui, outre l’excellence de sa formation scientifique, nous offre une pluridisciplinarité particulièrement précieuse pour mettre en relation les champs de la pensée.