mercoledì 13 marzo 2013

La ricostruzione spaziale - II Parte

Per chi ha effettuato i test proposti nel precedente articolo e ha percepito in modo più o meno conforme alle premesse gli effetti dichiarati, magari chiedendo conferma a famigliari e amici con la tecnica del blind test, in questo post è proposto un tentativo di analisi sulle premesse e possibilità della ricostruzione spaziale nell'audio.

Ingannare l'orecchio
Come è possibile ottenere da due semplici diffusori le riproduzioni apparentemente a 3D provate nel post precedente? In tutti i casi è stato, ovviamente, ingannato il nostro sistema uditivo. Così come una serie di fotografie in sequenza rapida da' l'impressione del movimento, o una serie di riflessioni delle onde sonore da' l'impressione che il suono provenga da una direzione diversa (l'eco), anche in questi casi si sono utilizzate tecniche mirate, come la somma di segnali sonori, l'abbassamento progressivo del volume o altri artifici legati alle riflessioni in ambiente o alle somma di suoni in contro fase, che vanno sotto il nome di "3D audio effects" o "3D sound synthesis". Il più semplice e ovvio dei quali è inviare lo stesso segnale a tutti e due i diffusori, ottenendo come risultato una sorgente sonora, tipicamente il cantante o la cantante, apparentemente in mezzo alla stanza e davanti a noi, dove non c'è nessun diffusore.

Un compendio efficace di cosa si è realizzato in questo campo si può leggere in questo articolo pubblicato sul sito di una università americana (di Washington D.C.). Se il link fosse modificato nel frattempo e' possibile anche leggerlo qui. Ben fatta, pur se molto sintetica, anche la voce di Wikipedia versione inglese sui "3D audio effect".
Sono sviluppi in parte sperimentali, che hanno però in massima parte scopi diversi dalla riproduzione di musica. In particolare, riuscire a posizionare i suoni nello spazio in modo efficace può servire per creare interfacce computer e sistemi di comando e controllo per ipovedenti e non vedenti. O anche ludici, per essere inseriti in videogiochi.

Il test LEDR Lateral sulla scala temporale
Lo spettrogramma del test LEDR Lateral - Prevalenza di frequenze alte
Sistemi audio 3D in campo aperto
Con questi sistemi e con soli due diffusori si può arrivare però solo fino ad un certo livello di simulazione di suoni "tridimensionali". Per andare oltre è necessario uno spiegamento di forze superiore, ed in particolare l'utilizzo di più diffusori. Come nell'audio multicanale, che l'industria del settore propone almeno dagli anni '70 (quando si chiamava quadrifonia) con alterne fortune. Con 4 o 5 diffusori nella stanza si possono registrare e riprodurre anche le riflessioni delle onde sonore ottenendo un effetto di suono avvolgente. Con impianti 7+1 e una disposizione dei diffusori a diverse altezze si possono riprodurre con una certa efficacia gli effetti di suono tridimensionale usati spesso nel cinema (si pensi alla sequenza della battaglia nella foresta nel terzo episodio del primo ciclo di Guerre stellari).

Chi si occupa professionalmente di riproduzione audio in 3D non considera però sufficiente questa tecnologia. I diffusori, per poter riprodurre quelle composizioni di onde sonore che il nostro sistema uditivo utilizza per individuare la provenienza dei suoni (vedere l'elenco nell'articolo citato prima) secondo la maggior parte degli studi del settore devono essere posizionati in una specie di cubo sonoro ("Audio Image Sound Cube") e le registrazioni devono seguire specifici criteri. Una serie di articoli esaurienti su queste tecniche e ricerche si possono leggere sul sito di Audio Central Magazine, dedicato soprattutto alla musica elettronica, segnalato a suo tempo anche da un visitatore del blog, dove si può apprendere anche che la tecnica del cubo sonoro è stata messa a punto dallo studioso britannico Michael Gerzon, con il sistema di registrazione e riproduzione Ambisonics (parecchia documentazione in rete per chi voglia approfondire).

Il test LEDR più discusso, UpR. Come si vede i suoni non sono
emessi solo sul canale destro
Sistemi audio 3D in cuffia
Di questa alternativa ho già scritto in un precedente post dedicato all'ascolto binaurale. Utilizzando una testa artificiale (dummy head) si può catturare la maggior parte delle informazioni che il nostro sistema uditivo utilizza per individuare la provenienza dei suoni e per mezzo di un sistema di riproduzione strettamente controllato, senza riflessioni in campo aperto o regole di posizionamento particolari per i diffusori, si possono poi riprodurre per un ascoltatore. Ottenendo un risultato molto realistico, come può verificare chiunque sperimenti i molti esempi di uso di questa tecnica presenti in YouTube e in Internet.

Audio binaurale in campo aperto
Usando due diffusori invece della cuffia non si riesce a ricreare del tutto lo stesso insieme di suoni dell'evento originale a causa del "crosstalk": l'ascolto con l'orecchio destro dei suoni che erano stati registrati con il microfono sinistro, e viceversa, a causa delle riflessioni nell'ambiente d'ascolto. Questo degrado di efficacia si può diminuire modificando la disposizione dei diffusori. Avvicinando la posizione di ascolto ai diffusori e avvicinandoli tra loro, allontanandoli contemporaneamente dalle pareti, si dovrebbe, secondo alcuni articoli in rete di esperti, diminuire il crosstalk e ricreare in parte la condizione di un ascolto in cuffia. Più interessanti per un uso pratico, e studiate e proposte da anni, sono le tecniche di post-processing per ridurre o eliminare il cross-talk, il più noto sistema si chiama Ambiophonics e vi ho accennato nel post dedicato all'ascolto binaurale. E' stato implementato recentemente come DSP (Digital Signal Processor) ed è disponibile ora anche come app per iPad, consentendo quindi una sperimentazione accessibile che mi riprometto di fare prima o poi. Aggiungo solo che i primi test hanno evidenziato una notevole complessità di messa a punto.

Che utilità hanno tutte queste tecniche per l'ascolto della musica?
Nessuna. Per i sistemi più efficaci non sono stati mai proposti commercialmente sistemi di riproduzione casalinga né materiale audio per alimentarli. Per impianti multicanale 7+1 il software disponibile è rappresentato quasi soltanto da film per grande schermo. Anche l'audio binaurale è una rarità, se si parla di musica. Pochissimi titoli anche nei cataloghi delle etichette audiophile come Chesky Records e, a quanto sembra, nessun interesse neanche nel settore della musica classica.
Non mi risultano neanche esperimenti "fai da te" (che sarebbero probabilmente realizzabili) da parte di autocostruttori (magari qualcuno che capita su questa pagina mi smentirà).
Quindi l'interesse per queste tecniche è al momento puramente teorico e di sperimentazione.
Anni luce di distanza dal mondo del video e del cinema dove il 3D è stato ed è un controverso punto di forza della tecnologia attuale. Peccato perché l'audio 3D è forse anche più spettacolare, come sa chi ha assistito anche ad una demo in multicanale, solo in parte 3D.

Accontentiamoci del nostro stereo
Che non potrà offrire una riproduzione pienamente 3D (gli addetti ai lavori sono precisissimi su questo) ma utilizza raffinati tweeter con dispersione quasi a 180°, progetti che tengono conto delle riflessioni della stanza e in definitiva hanno la possibilità di restituire buona parte del contenuto informativo dell'evento musicale originario, consentendo nei casi migliori di "suggerire" in modo efficace la disposizione dei musicisti (soprattutto per chi la conosce frequentando anche concerti dal vivo e non solo a casa propria), la cosiddetta "immagine spaziale", con risultati già soddisfacenti e che non richiedono eccessive complicazioni ulteriori, come sostiene da anni la nota rivista online TNT-Audio con la campagna "real stereo" che ha ottenuto nel corso degli anni un gran numero di adesioni.

Dalla teoria alla pratica
Personalmente non sono così negativo sulle possibilità del multicanale, come ho scritto su questo blog a suo tempo. Ma la cruda realtà è in effetti dalla parte di Lucio Cadeddu e di TNT-Audio. Perché per ascoltare un suono stereo con un impianto stereo è necessario che le case discografiche producano materiale stereo, e questo negli anni '60 e '70 l'hanno fatto, abbandonando presto il mono. Ma anche per ascoltare in multicanale o con una registrazione che preservi l'ambienza dell'evento originale è necessario che avvenga la stessa cosa. Ma, con l'eccezione della solita musica classica e in minima parte del jazz, non è affatto così.

Come si registra (in stereo)
La ripresa dell'immagine spaziale non pare essere un obiettivo primario, a giudicare dal fatto che non viene mai o quasi mai dichiarata e commentata la tecnica di registrazione ed eventualmente evidenziato come un plus una ripresa fedele all'evento originale (sempre al di fuori della classica). Vediamo una sintesi delle tecniche di registrazione in uso (l'opinabile raggruppamento adottato, in un tentativo di sintesi, è mio):
  1. multitraccia studio: strumenti e voci sono registrati singolarmente, con microfoni (o con connessione diretta, se strumenti elettronici), e poi oggetto di operazioni di editing e di missaggio; le registrazioni possono essere anche effettuate in tempi diversi;
  2. multitraccia live: come sopra ma con registrazione, ovviamente in contemporanea, di tutto l'ensemble strumentale o vocale; può anche essere registrata e mixata in modo opportuno l"ambienza" per consentire di ricreare l'impressione dell'ascolto dal vivo;
  3. due tracce acustica live/studio: utilizzo di due microfoni disposti in "Blumlein pair" (o ad Y) sistemati nella posizione d'ascolto ottimale; l'obiettivo è registrare l'evento sonoro nel modo in cui l'ascolterebbe un umano nella stessa posizione, suoni diretti e riflessi assieme; 
  4. sostituendo alla coppia di microfoni una "dummy head" si può realizzare una registrazione binaurale.
La maggior parte del software musicale è registrato con le tecniche (1), inclusa parte della musica classica e jazz. La modalità (2) è usata soprattutto per la classica e il jazz, la (3) sempre per classica, jazz e acustica in genere soprattutto in produzioni "audiophile", la (4) solo per pochissime produzioni di musica vera e propria. Salvo che in pochissimi casi, confinati alla classica e alle produzioni audiophile, non vengono fornite informazioni né sulla tecnica di registrazione adottata né sulla collocazione spaziale dei musicisti nella esecuzione o nell'evento originale.
L'immagine spaziale nelle registrazioni della musica pop
Nel processo di editing, di progettazione del risultato sonoro a cui si vuole arrivare, è inserita anche la ricostruzione spaziale? Una ricostruzione che sarà evidentemente "inventata" nel primo caso e "rimessa assieme" nel secondo. L'impressione, non solo per le note polemiche sulla loudness war, è che non sia certo questo l'obiettivo durante la produzione di un album di musica pop.
Ma quello che conta è cosa viene venduto. Nel cinema il 3D, che sia poi efficace o meno, nativo o ricostruito, viene dichiarato e fatto anche pagare di più. Nella musica, come accennato prima, la ricostruzione spaziale viene dichiarata come obiettivo solo per la produzione multi canale e in genere per la produzione cosiddetta "audiophile" mentre è del tutto ignorata, e quindi priva di valore percepito, per tutta la produzione restante, quella di più ampia diffusione (ma non necessariamente di minore qualità, non faccio certo una distinzione di valore in base alla tecnica di registrazione): la musica moderna, suonata quasi sempre con un mix di strumenti acustici ed elettronici, registrata in studio e non dal vivo.

Il concerto live nella musica pop
Sembra che oltre a non essere venduto dalle case discografiche come un plus, non sia neanche cercato dagli ascoltatori / consumatori. In effetti, nella quasi totalità dei casi non esiste un riferimento per la ricostruzione d'immagine. In un concerto di musica moderna tutti gli strumenti, anche quelli acustici, sono amplificati: il suono proviene dagli altoparlanti. Che sono disposti di solito su un piano orizzontale, coerentemente con la posizione degli esecutori sul palco, che è anch'essa orizzontale con la sola eccezione, a volte, di una pedana per il batterista (che altrimenti non vedrebbe nessuno). In più gli altoparlanti sono anche disposti spesso in altezza, per raggiungere gli spettatori più lontani. In questo modo può capitare, stando tra le prime file, di ascoltare la voce del cantante, che sarebbe davanti a noi, provenire dai potenti altoparlanti in alto.
Non c'è quindi nessun riferimento reale che ponga il problema della ricostruzione spaziale all'ingegnere del suono.
L'ascoltatore di musica moderna non si aspetta niente sotto questo aspetto, a parte la collocazione sul piano orizzontale, in "stereo", e questo è un bene per l'industria discografica perché per vendere il suo prodotto non richiede al suo cliente altro che cuffie e impianti da scrivania per PC o coordinati di bassa qualità e basso prezzo.

Il concerto di musica classica
L'unico genere musicale che è ancora proposto in concerto senza amplificazione è la classica (musica barocca e antica inclusa). Il frequentatore di concerti di questi generi può quindi pretendere di ascoltare a casa una immagine spaziale che ricordi quella dal vivo. Dove di solito sui complessi strumentali più ampi i musicisti sono disposti su una gradinata, con gli archi in prima fila, i legni dietro e più in alto, gli ottoni ancora più in alto e infine le percussioni, che poi sono anche gli strumenti con i suoni più direttivi (quelli sul registro acuto, triangolo, piatti, xilofono) assieme alle trombe (vedi immagini seguenti).
Ma non sempre, per esempio in un teatro dell'Opera non è così. E non sempre chi ascolta può stare in una posizione che, anche dal vivo, possa consentirgli di riconoscere facilmente la provenienza degli strumenti. Ad esempio all'Auditorium di Roma, nella sala più grande (Santa Cecilia), una delle più ampie d'Europa, dalla platea non si vedono i suonatori in fondo, dalla galleria si vede tutto ma il palco è piuttosto lontano e la posizione degli strumenti meno direzionali si percepisce con difficoltà. Nel vecchio auditorium della RAI, più piccolo, la collocazione era invece più facile da percepire.
Una riproduzione casalinga di una registrazione con una ambienza corretta può quindi persino fornire più informazioni, grazie al diverso punto di ripresa.

La disposizione dell'orchestra nella Sala Santa Cecilia dell'Auditorium di Roma
in un recente concerto diretto da Battistoni, vista dalla prima galleria
La disposizione al Teatro Petruzzelli di Bari per il concerto di Capodanno,
con l'Orchestra della Bielorussia

In sintesi
La ricostruzione spaziale dell'immagine è possibile con tecniche esistenti da anni, accessibili, e in alcuni casi anche economiche (con riferimento in particolare all'audio binaurale). Il mercato della musica, a parte il tentativo della quadrifonia di molti anni fa ('70) non ha mai spinto la transizione a queste nuove tecnologie, a differenza di quanto fece negli anni '60 con lo stereo. Anche gli ascoltatori di musica non sembrano interessati ad ampliare l'emozione dell'ascolto con una riproduzione audio che vada oltre le potenzialità (comunque elevate) dello stereo, tranne che quando l'audio è un complemento ad un film. Non si sa se questo dipenda dalla non conoscenza delle potenzialità della riproduzione audio o da altri motivi.
Fanno eccezione gli appassionati di musica classica e acustica in genere (e, si spera, anche gli appassionati e cultori dell'alta fedeltà) che sono a conoscenza della potenzialità e la ricercano. In misura percentuale sono in numero però insufficiente, ad esclusione dei cultori della classica, per costituire un target interessante per le case discografiche.



0 commenti:

Posta un commento