3. Avant d'aller plus loin...

3.1. Sur le concept de cible

Un des principes fondateurs d'Orchidée est d'exploiter au maximum les résultats issus de la psychoacoustique et relatifs à la perception du timbre. Ce choix se justifie par la double de volonté de réduire au maximum les paramètres de contrôle et d'associer dans la mesure chaque paramètre à une signification perceptive.

Depuis environ une trentaine d'années, plusieurs études psycho-perceptives ont tenté d'identifier les dimensions perceptives sous-jacentes aux jugements de similarité entre timbres. Le principe de ces expériences est en général le suivant. Il s'agit dans un premier temps de construire un corpus de timbres qui vont être présentés par paires aléatoires à un sujet humain, lequel devra en donner une mesure subjective de similarité. Dans un second temps, une transformation mathématique [15] permet de placer chaque stimulus dans un espace géométrique de faible dimension (deux ou trois) et communément appelé « espace de timbres ». Dans un tel espace, les distances correspondent aux similarités perceptives mesurées dans l'expérience d'écoute : plus les stimuli sont proches dans cet espace plus leur timbre est similaire, et vice-versa. Dans un troisième temps, on cherche à corréler chaque dimension de l'espace de timbre à une paramètre quantitatif que l'on peut mesurer directement sur le signal audio des stimuli, en d'autres termes, un descripteur.


Espace de timbre de Grey (16). Dimension 1: étendue spectrale, dimension 2: temps d'attaque, dimension 3: inharmonicité de l'attaque.

En partant des descripteurs audio, Orchidée tente le chemin inverse de celui emprunté par la psychoacoustique, lequel ne conduit qu'à des distances perceptives entre paires de timbres, non à leurs caractéristiques « en-soi ». C'est donc (au moins dans un premier temps) toujours par référence à un « son premier » qu'on pourra évaluer objectivement une proposition d'orchestration. Et ce son premier, c'est précisément la « cible » qui en supporte la fonction.

Ainsi le paradigme de la « cible sonore » n'est-il pas aussi restrictif qu'il apparaît de prime abord. Il doit être considéré comme un point de référence, une direction dans laquelle se déplacer dans l'espace des possibles, plutôt qu'un but à atteindre à tout prix. De l'« idée de timbre », abstraite, que le compositeur a en tête, la cible constitue un exemple concret, une « instanciation ». Le calcul de ses descripteurs définit alors implicitement, par réduction d'information, une classe de sons dont Orchidée va chercher d'autres instanciations concrètes à l'aide de sons instrumentaux. Le cible permet ainsi de créer un « contexte » musical, de cerner la région de l'espace sonore dans lequel le compositeur travaille. Nous montrons ci-après qu'elle sert également à en construire une carte.

3.2. Sur la géométrie des espaces de timbres

Dans la plupart des études psychoacoustiques basés sur des tests d'écoute pour construire un espace de timbres, la brillance et le temps d'attaque sont les descripteurs majoritairement identifiés pour en expliquer les deux premières dimensions. En général, les stimuli sont des sons instrumentaux harmoniques, entretenus, enregistrés dans un mode de jeu ordinaire. Que se passe-t-il cependant lorsqu'on considère d'autre types de sons ? Tentons, à partir de quelques enregistrements d'instruments présentés dans la vidéo suivante, de construire une « carte » des timbres sur laquelle les distances reflètent les similarités perceptives.

Les trois premiers timbres (trompette avec sourdine straight, alto sul tasto et violoncelle sul ponticello) sont relativement similaires. Ils se distinguent les uns des autres par des différences subtiles de brillance et de niveau de bruit. Trompette et alto sont très proches, le violoncelle sensiblement plus distant. La tâche se complique avec le waterphone: il est incontestablement plus éloigné des térois précédents, mais duquel est-il le plus proche ? Difficile de répondre, car ce quatrième timbre introduit de nouvelles dimensions perceptives (la décroissance temporelle, l'inharmonicité, la modulation d'amplitude) le long desquelles les comparaisons avec les trois premiers sont davantage qualitatives que quantitatives. Le problème se répète, à une échelle supérieure, avec la caisse claire et la cuica. Leurs timbres respectifs sont très différents et très éloignés des précédents, mais nous ne pouvons les placer précisément sur la carte, étant donné l'impossibilité de quantifier ces dissemblances.

Estimer les distances perceptives au sein d'un ensemble de sons suppose ainsi une certaine homogénéité entre les stimuli présentés. Un espace de timbres n'est donc sans doute valable que dans un voisinage restreint (le « contexte » que nous évoquions en supra), hors duquel les jugements quantitatifs deviennent qualitatifs, et les dimensions qui le structurent ne sont plus nécessairement significatives. Pas d'espace de timbres (tel que les études psychoacoustiques l'entendent) unique et valable pour tous les sons semble-t-il donc, mais un ensemble d'espaces sous-tendus par des dimensions différentes. Pas non plus de carte du timbre à grande échelle, mais une collection de cartes locales, comme autant de projections sur un nombre restreint de dimensions perceptives, à lire à chaque fois différemment.

A considérer les choses d'un point de vue géométrique, nous dirons que s'il existe une structure théorique unique capable de représenter tous les timbres, alors les distances ne se mesurent pas de la même manière en des points proches ou éloignés de la structure. De même que, à la surface de la Terre, le plus court chemin entre deux points n'est pas la ligne droite et nécessite un calcul de géodésique, de même la distance entre deux timbres éloignés n'est peut-être calculable qu'en sommant une suite de distances élémentaires entre voisinages restreints. Les mathématiciens appellent ce type de structure une « variété », et l'utilisation de distance euclidienne, qui sert traditionnellement à la construction d'espaces de timbre, implique une projection implicite de la variété sur un espace localement euclidien. Sur les projections azimutales du globe terrestre par exemple, les distances sont respectées au voisinage du point de projection, mais d'autant plus faussées qu'on s'en éloigne. La projection azimutale de Postel par exemple, peut être utilisée pour la navigation en zone polaire. Mais on prendra soin de changer de point de projection pour rallier Devonport depuis Melbourne!


Projection azimutale de Postel.

Ramenée à notre problème d'orchestration, cette digression cartographique illustre comment la donnée d'un son de référence permet de définir un « point de rpère » dans une variété de timbres. Autour de ce point, nous pouvons alors construire une carte locale des sons, sur laquelle les distances reflètent des dissimilarités perceptives. A la notion cognitive de « contexte » fait donc ici écho celle, topologique, de « voisinage ». Deux concepts qui semblent justifier le besoin d'une « cible » comme préalable au calcul.

3.3 Sur la complexité du problème

L'orchestration assistée par ordinateur est-elle un problème complexe ? Assurément oui, ne serait-ce qu'à en en considérer la dimension combinatoire. Dès que la collection d'échantillons sonores représentant la connaissance musicale dépasse le millier d'éléments (et actuellement Orchidée rassemble plus de 17000!), il devient impossible d'explorer systématiquement l'ensemble de l'espace de recherche si l'orchestre considéré comporte plus de quatre instruments. Orchidée a ainsi recours à des algorithmes d'optimisation stochastique [17], dont l'exécution comporte une part d'aléatoire, et qui permettent de découvrir en un temps raisonnable des configurations s'approchant de l'optimalité.

A cette difficulté s'en ajoute une autre, le fait que les dimensions perceptives du timbre (brillance, rugosité, harmonicité, coefficient cepstraux, niveau de bruit, irrégularité spectrale, profil temporel, etc.) ne sont pas toutes mobilisées de même manière, aussi bien quantitativement que qualitativement, selon les situations musicales (des différences d'écoute pouvant également apparaître entre différents sujets pour un même objet sonore). Orchidée, nous l'avons vu, répond à ce problème à l'aide d'une approche multicritère, et permet à l'utilisateur de ne considérer que les descripteurs qui lui semblent pertinents pour telle ou telle cible sonore.

Mais ces deux aspects de complexité, explosion combinatoire et multidimensionnalité du timbre, ne constituent peut-être pas l'essentiel de la difficulté de notre problème. D'après nous, le défi scientifique lancé par l'orchestration assistée par ordinateur tient au fait suivant : l'espace symbolique dans lequel sont prises les décisions d'écriture musicale (quels instruments, quelles notes, quels modes de jeu, quelles dynamiques ?), et l'espace imaginaire des descripteurs dans lequel on « mesure » l'impact de ces décisions, ont des structures radicalement différentes. Le premier est un réseau d'entités discrètes, le second une collection de cartes locales ne « recouvrant » qu'imparfaitement la variété des timbres. Tant que l'on se restreint à une cible sonore stable dans le temps (et Orchidée se cantonne aujourd'hui à ce cas très simple), il est toujours possible de travailler sur la « projection locale » du monde sonore. Mais si nous voulons prendre en compte la dimension temporelle tout en conservant le socle psychoacoustique sur lequel s'appuie Orchidée, il nous faudra alors, au delà des nouveaux enjeux combinatoires, pouvoir associer un trajet dans le réseau symbolique à un déplacement sur la variété des timbres. Déplacement que l'on ne pourra sans doute pas suivre à grande échelle, étant donné la différence de nature entre les niveaux local et global dans les jugements de similarité perceptive entre les sons.

 

Page précédente | Page suivante