texte

3. L’analyse de STRIA de John Chowning : préparation des fichiers

La reconstruction philologique (Zattra 2007) a identifié les raisons pour lesquelles la version CCRMA est plus courte que la version WERGO (figure 2). Deux sections diffèrent en durée : la deuxième section T286 commence à 2’43", elle dure 4’15" dans la version 4 pistes et 3’25" dans la version WERGO. Elle a été tronquée à cause d’un problème de calcul numérique donnant lieu à un bruit soudain dans la conversion DAC (numérique-analogique). Les sections T754G diffèrent aussi : la version WERGO utilise une section alternative plus longue (durée 3’53", à partir de 10’48"). Dans la version CCRMA cette section dure 1’45" (à partir de 11’42").

La reconstruction que Kevin Dahan a faite en 2007 sous la supervision de John Chowning dure 15’46", c’est-à-dire que la version révisée par l’auteur même considère la version CCRMA comme la meilleure version (en considérant le paramètre de la durée). Les durées différentes sont bien visibles dans l’image suivante, comme les éléments plus généraux de l’œuvre. Par exemple, la qualité audio des fichiers est différente : elle est très propre dans la version numérique de 2007, elle est plus bruitée dans la version CCRMA qui est la numérisation d’une bande analogique ; des effets de compression de 2’20" à 6’ sont évidents dans la version WERGO. Toutefois, tout le reste (la comparaison spectrale, les durées précises, c’est-à-dire le détail) reste à peine lisible.

Figure 2 : comparaison des sonagrammes. De haut en bas on voit la version CCRMA, la version WERGO et la version 2007. Dimension FFT 4096 ;
fréquence d’échantillonnage à 44100 Hz et 48000 Hz (Dahan 2007), même si la fréquence la plus haute de l’œuvre est de 17500 Hz (visualisation réalisée avec le logiciel libre Audacity 1.2.6 – http://audacity.sourceforge.net).

ACAME permet donc d’avancer dans la comparaison des versions. La nouvelle version 2007 de Stria, avec ses fichiers audio (Dahan 2007) et les codes réalisés avec Csound par Kevin Dahan (CMJ DVD 2007), permet d’envisager un travail analytique qui, on l'espère, résoudra dans la recherche future quelques aspects obscurs du processus historique de réalisation de cette œuvre. Dans ce chapitre on explique la préparation des trois fichiers, qui demandent à être ajustés pour l’application Matlab. Dans le prochain chapitre on va tester l’outil pour analyser la section T0.

Tout d’abord on va repérer les sections T0 à l’intérieur du flux sonore, cela est nécessaire pour les versions CCRMA et WERGO dont on ne possède que les versions complètes : le fichier stéréophonique du CD (WERGO 1988) et les quatre pistes numérisées dans un CD-ROM à partir de la bande analogique. L’œuvre étant caractérisé par un flux sonore constant, à l'écoute il est difficile de découvrir lorsqu'une section commence et se termine. Grâce à l’analyse des données informatiques qui nous ont été transmises par Chowning (Dahan 2007, Meneghini 2007, Zattra 2007) on est arrivé à connaître les durées des sections et les temps d’initialisation. On les a donc facilement repérés et on a gardé deux secondes après chaque section dans CCRMA et WERGO.

Quant à la version 2007, on a analysé les données de la re-synthèse avec Csound calculées par Kevin Dahan à partir des données informatiques originelles de 1977. Les données sont contenues dans un DVD publié par le Computer Music Journal (CMJ 2007). Les codes reconstruits par Dahan séparent l’orchestre ("stria-lowrev_org.orc") et la partition ("stria-total-v24.sco"). Il est donc facile de trouver la section T0 dans la liste des données de la partition. A notre tour, on a re-synthétisé la seule section T0 à une fréquence d’échantillonnage de 44100 Hz au lieu de 48100Hz afin de la normaliser avec les autres ; en outre on a enlevé le silence après la section. Pour faire tout cela, on a utilisé Csound Version 5.06.

Notre premier objectif étant la comparaison des versions dans leur unité (au lieu de la comparaison de différents canaux), on a réalisé un mix-down mono des trois fichiers audio : de 4 à 1 pour la version CCRMA et pour la version 2007 (les données de Kevin Dahan produisent en sorties des pistes séparées), et de 2 à 1 pour la version WERGO.

L’image suivante montre les trois sections visualisées avec le sonagramme (on a aussi normalisé les trois sections à -3 dB pour permettre une visualisation plus homogène ; la version CCRMA est toujours la plus bruitée).

Figure 3 : comparaison des sonagrammes de la section T0. De haut en bas on voit la version CCRMA, la version wergo et la version 2007.
Dimension FFT 4096 ; fréquence d’échantillonnage à 44100, normalisation à -3 dB (visualisation réalisée avec le logiciel libre Audacity 1.2.6 – http://audacity.sourceforge.net).

Les sonogrammes montrent les caractéristiques générales des trois sections. Il est plus ou moins possible de déduire que les données informatiques utilisées dans les trois versions produisent les mêmes flux sonores (un flux tronqué dans la version CCRMA de 2007). Mais la comparaison devient vraiment ardue lorsque l'on veut comparer les détails des timbres des trois fichiers. ACAME va nous secourir dans le chapitre suivant.

Chapitre précédent - Chapitre suivant