sabato 14 giugno 2014

L'ascolto selettivo

Una riproduzione fedele di un evento musicale è la premessa per un ascolto in alta fedeltà o high fidelity. Che deve garantire, per definirsi tale, una restituzione il più possibile simile all'evento originale. Una restituzione perfetta non è possibile perché la perfezione non esiste in natura (anche se spesso è presente nella pubblicità) ma vorremmo che fosse il più possibile fedele nei parametri che caratterizzano maggiormente quel tipo di suono complesso che chiamiamo musica.

I parametri di valutazione
Nelle recensioni i giornalisti specializzati usano parametri come microdinamica, microdettaglio, colorazione, timbrica, spazialità, che a volte fanno riferimento a parametri fisici, cioè misurabili, a volte ad un insieme di elementi collegati tra loro, e si tratta in questo caso di "grandezze "multidimensionali" non facilmente descrivibili e non misurabili. Avviene lo stesso in campo enologico o di valutazione dei cibi o dei profumi, dove sono coinvolti sensi che non usiamo o usiamo solo parzialmente per una comunicazione codificata, a differenza di quanto avviene con la vista.



Parametrare la musica
Quello che chiamiamo musica è una organizzazione ordinata dei suoni secondo regole, suoni generati da strumenti (inclusa la voce umana) in grado di generare una gamma di suoni virtualmente infinita. L'insieme di regole consente di individuare i parametri che nel tempo sono stati proposti per giudicare il suono. Alcuni di questi sono misurabili e definibili.

L'altezza dei suoni e la pressione sonora: la linearità
L'altezza è il nome che in musica si da' alla frequenza di un suono. Nel più classico degli strumenti, il pianoforte, è una sequenza discreta di 88 suoni corrispondenti agli 88 tasti, dal suono a minore frequenza (più grave o basso) pari a 27,5Hz, a quello a maggiore frequenza (più acuto o alto) pari a 4186Hz. Questi "suoni" non sono altro che le note della notazione musicale occidentale. Altri strumenti possono arrivare a frequenze inferiori, come l'organo da chiesa (16,3Hz) o superiori, come l'ottavino (oltre 10KHz). La gamma in frequenza è ovviamente coerente con la risposta del sistema uditivo umano: 20Hz-20KHz per udito perfetto e da giovani, ridotto a 16KHz o meno con l'avanzare dell'età.

Ogni suono elementare o nota è poi generato con una diversa intensità, regolabile in modo continuo dal musicista. Non a caso il principale strumento in orchestra si chiama proprio piano-forte.
Il primo parametro che un sistema in alta fedeltà deve rispettare è di conseguenza la linearità, cioè la capacità di riprodurre tutta la gamma dei suoni alla stessa intensità in cui li ha generati il musicista sullo strumento originale. Una grandezza relativamente semplice da misurare, utilizzando un suono convenzionale, è la famosa risposta in frequenza. Una risposta in frequenza dovrebbe essere ovviamente lineare, o "piatta", da 20 a 20.000Hz, questo è tecnicamente possibile per i componenti elettronici, ma molto più difficile da ottenere per i diffusori acustici, come si vede ad esempio dal grafico qui di seguito riprodotto.



La risposta, come si vede nel grafico (tratto dalla rivista Audio Review), pur trattandosi di un diffusore di elevato livello, non è lineare ai bassi livelli, che non possono essere riprodotti alla stessa intensità originale al di sotto dei 70Hz, e presenta alcune deviazioni, chiamate appunto non linearità, sulle frequenze medio-alte. Per questo modello della italiana Sonus Faber la risposta in frequenza è lineare  da 70Hz a 20KHz entro un range di +-4dB. Nonostante le apparenze la misura denota una cassa molto lineare, altri modelli anche di gran pregio hanno deviazioni più pronunciate.

La dinamica (e la distorsione)
La dinamica è la differenza tra il suono a minore e maggiore intensità o pressione sonora. Per il pianoforte il "piano" corrisponde a meno di 60dB (una stanza silenziosa ma "abitata" è circa 35dB) e il "forte" arriva fino a 100dB. Una intera orchestra, o suoni generati elettronicamente, possono arrivare sino alla soglia del dolore per il nostro sistema uditivo, quindi 110 dB (è una scala logaritmica che raddoppia ogni 3dB, lo ricordiamo).
Quindi il secondo importante parametro fisico che un sistema hi-fi deve possedere è una gamma dinamica indistorta, cioè la capacità di riprodurre suoni a livello uniforme sulla intera gamma coperta dalla musica, che è praticamente la massima con cui un umano può convivere, da 35 a 110dB, e senza distorsione.

Cos'è la distorsione? Non un parametro musicale, ma una caratteristica non completamente eliminabile del sistema con cui viene riprodotto il suono: la differenza, misurabile, tra il suono originale e quello riprodotto. Oltre un certo livello di incidenza e di pressione sonora è facilmente avvertibile in ascolto e rende prima sgradevole e poi quasi impossibile l'ascolto. Il livello immediatamente precedente è la massima pressione indistorta.



Per esemplificare questo parametro, ancora per le casse acustiche, ecco nella immagine qui sopra una misura di MOL (Maximum Output Level). Come si vede questo ottimo diffusore, sempre il modello Liuto della Sonus Faber, riesce a generare una pressione indistorta da 56Hz a 20KHz, in modo lineare sino al livello di 107dB.

La ricostruzione spaziale
Ascoltiamo la musica in stereo almeno dagli anni '50 per un motivo: ottenere una simulazione più o meno fedele dell'evento sonoro originale anche come individuazione dell'origine dei suoni. Per quanto a molti può sembrare strano, con solo due diffusori e sfruttando le riflessioni in ambiente si può "ingannare l'orecchio" e farci credere che il suono provenga dal centro, tra i due diffusori, più avanti o più indietro di essi, all'esterno dei medesimi o anche (con qualche difficoltà) a diversa altezza. Il tema è stato dibattuto sul blog in molti altri post a cui rimando per approfondimenti, ma qui interessa soltanto perché questo parametro, che alcuni chiamano anche ambienza, è particolarmente selettivo. Nel senso che impianti o software con differente codifica possono generare differenze percepibili e garantire quindi una riproduzione più o meno realistica, quindi più o meno vicina al concetto teorico di "alta fedeltà".

La timbrica o il timbro
Questo è il parametro più facile da descrivere ma più difficile da misurare. Facile da descrivere perché è esattamente come il timbro della voce, quel particolare mix di altezza, articolazione e modo di emettere i fonemi che ci permette di riconoscere la nostra compagna o nostra figlia anche quando da un telefono disturbato ci dice "Ciao, come va?". Per gli strumenti musicali è la stessa cosa. Il tipo di legno, di corde, di vernice, il livello di vibrazioni e molti altri elementi concorrono a definire un timbro dello strumento che lo rende unico e distinguibile rispetto ad un altro. Ad esempio il violoncello Maggini del 1600 di Mario Brunello rispetto ad uno strumento moderno perfettamente prodotto. Non perché emettono suoni diversi, accordati con precisione emetteranno le note alla stessa altezza e con la stessa precisione, ma il "colore" del suono, come cercano di definirlo gli anglosassoni, sarà diverso e riconoscibile anche sulla stessa melodia. Come un'aria interpretata da Cecilia Bartoli e la stessa interpretata da Anna Netrebko. Soltanto che qui a differenza che con la voce dei nostri amici e amiche, per riconoscere le differenze tra voci "educate" al canto occorre un sistema uditivo educato ad ascoltare la musica (e una conoscenza della musica) mentre il riconoscimento del timbro della voce di chi ci circonda lo apprendiamo in modo naturale nei primi anni di vita.

Il parametro più significativo?
Un parametro decisivo per la verifica di un impianto hi-fi, apparentemente. Basterebbe registrare la voce di qualcuno che si conosce e riascoltarla. O magari di uno strumento suonato dal vero e poi riprodotto. Effettivamente test di questo tipo si facevano anni fa nelle mostre hi-fi. Ma contrariamente alle apparenze non sono così decisive. Il nostro sistema uditivo è molto raffinato ed è programmato per minimizzare le differenze. Proprio per riconoscere una voce amica anche quando chiama da un telefono disturbato o da grande distanza. Ed inoltre gli impianti moderni sono a un livello superiore a quello necessario per riconoscere il parlato, che è limitato alle frequenze medie. Lo stesso avviene, in misura diversa, per gli strumenti musicali, con la ulteriore difficoltà dei confronti a memoria.

Sarebbe invece più utile individuare i parametri singoli che compongono questo parametro multidimensionale, perché alcuni tra essi dovrebbero essere i più significativi. E qui la ricerca di definizioni si è applicata estesamente: il microdettaglio, la velocità, la microdinamica, la risposta ai transienti e così via. Non facilmente definibili anche perché sembra che recensori abbiano idee in parte diverse in merito (e sicuramente criticherebbero queste righe temerarie se si imbattessero in queste pagine). Il noto recensore Mark Wheeler , collaboratore di TNT-Audio, ha elaborato 24 parametri suddivisi in 6 gruppi per analizzare il suono riprodotto. Parametri in gran parte soggettivi e personali, un po' come quelli degli assaggiatori dei vini, parametri quindi utili per il recensore, per confrontare componenti diversi, ma difficilmente generalizzabili. Il suo sistema di valutazione si può leggere qui assieme a molte altre interessanti considerazioni sulla specificità dell'evento sonoro e musicale.

Torniamo alla musica
Se quello che vogliamo valutare è la musica, quanto fedelmente viene riprodotta, per provare a definire cosa si intende per alcuni di questi parametri possiamo partire dalla osservazione del contenuto musicale e dall'esame degli elementi di complessità che possono rendere difficile registrarla e riprodurla. L'obiettivo è individuare quelli più evidenti all'ascolto (ed evitare possibilmente di dover valutare con un voto 24 parametri). Senza pretese di essere esaustivi o di dare una specie di metodo definitivo (non c'è) proviamo a partire da una composizione molto nota, dalle prime 14 battute della sonata per pianoforte K330 di Mozart .


Nella prima battuta (sapete riconoscere una battuta vero?) notiamo che la prima nota per la mano destra, un SOL, ha una lineetta sopra, così come le stesse due note in terza battuta, e nella quarta battuta, nella scala che inizia con un LA, le prime 5 note hanno un puntino al di sopra, e la quinta una lineetta. Inoltre all'inizio della prima e della quarta battuta si possono leggere le lettere f e p. In altri gruppi di note nella prima e terza battuta le note sono invece collegate tra loro con una linea ad arco. Come sa chiunque sia in grado di suonare anche come dilettante, questi sono tutti segni di espressione per l'esecutore. I segni sopra le note indicano che le note stesse devono essere suonate staccate, e non legate senza interruzione come nelle note raggruppate, e lo staccato deve essere più incisivo nel caso della lineetta verticale. Le lettere poi indicano che le prime battute devono essere suonate a volume più elevato (forte) e la quarta a volume ridotto (piano) da uno strumento che non a caso si chiama pianoforte come già scrivevo prima.



L'effetto si può verificare ascoltando anche su YouTube una delle molte esecuzioni di questa notissima sonata, come ad esempio questa dal vivo di Barenboim. E questi sono soltanto alcuni dei molti segni di espressione usati dai compositori.

Perché questa lunga pseudo lezione di musica?
Perché le note del pianoforte (i tasti) suonate da me o da Noriko Ogawa (la valida pianista giapponese ritratta nella prima foto) suoneranno uguali, se il pianoforte è il medesimo. Ma l'espressione, quanto piano e quanto forte, quanto breve lo stacco e a quale differenza di volume con le note successive, suonerà invece diversa anche tra lei, Evgeny Kissin o qualsiasi altro interprete. Sono queste sfumature, percepibili dagli ascoltatori nel loro insieme, che rendono diversa una interpretazione dall'altra e che un buon sistema di riproduzione deve essere in grado di non livellare. Per questo scopo serve una delle caratteristiche che abbiamo visto prima, la microdinamica, non quindi la dinamica tra il punto più basso e più alto di una intera composizione (questa è la dinamica) ma tra una variazione anche repentina tra una nota e la successiva. Con una transizione con gli stessi tempi garantiti dallo strumento, con un meccanismo specializzato di corde e martelletti, in questo caso. Quindi con la velocità di risposta ai transienti, spesso citata nelle prove soprattutto dei diffusori.

Continuando questo piccolo esame possiamo anche osservare il secondo rigo, quello di basso, per la mano sinistra. Altre note che vengono suonate assieme a quelle della mano destra, e dalla undicesima battuta, anche due note assieme, cioè accordi (anche se qui di sole due note anziché di tre), la caratteristica di base del nostro sistema tonale occidentale. Che nel segnale musicale si trasformano in un inviluppo, una somma di suoni di base (le note) e delle relative armoniche. Una somma assai gradevole ma che rende il segnale audio più complesso, perché dobbiamo continuare a distinguere i singoli suoni e la loro origine. Ancora più complesso se assieme al pianoforte suona, ad esempio un violino, o una intera orchestra. Qui il parametro che indica una buona riproduzione è il secondo citato prima, il microdettaglio (il dettaglio, inteso come riconoscimento del violino e del pianoforte, ma anche del violino dalla viola, lo diamo per scontato in un sistema hi_fi).

Cosa ci facciamo di tutte queste informazioni
Si potrebbe continuare analizzando altri parametri, anche se per alcuni, come la "corporeità delle voci" o la "chiarezza degli alti" non sarebbe molto semplice, ma l'obiettivo è un altro: arrivare da queste considerazioni per quanto possibile oggettive a indicazioni utili per un ascolto selettivo.
Rivediamo i cinque parametri base alla luce di questo ambizioso obiettivo.

Ascoltare e verificare la linearità
Forse non sarebbe neanche necessario. La non linearità infatti e come abbiamo visto nell'esempio si
presenta essenzialmente sulle basse frequenze.
La verifica in questo caso si può fare anche ad occhio, semplicemente osservando la dimensione dei diffusori e degli altoparlanti deputati alla riproduzione delle basse frequenze, i woofer. Il limite difatti è puramente fisico, un woofer da 13 o 15 cm, tipico dei mini-diffusori da scaffale (bookshelf) o delle mini-tower non potrà mai riprodurre a livello percepibile le frequenze inferiori di un organo da chiesa, del pianoforte, del basso tuba, del controfagotto  o dei timpani. Potrà essere aiutato a scendere oltre i suoi limiti fisici con varie tecnologie, in particolare quelle adottate nelle casse attive con equalizzazione sui bassi, ma per arrivare ad una riproduzione lineare fino a 40Hz e anche più in basso servono diffusori di grandi dimensioni e/o subwoofer specializzati.

Grandi dimensioni, grandi problemi di convivenza in casa, grandi costi, che devono essere ben valutati in base a quello che si ascolta. Difatti ben di rado nella musica che ascoltiamo si arriva a queste frequenze inferiori. Non posso certo controllarlo, ma dubito che Mozart in tutte le centinaia di ore di musica per piano che ha composto abbia mai utilizzato il primo tasto del pianoforte, il LA a 27,5Hz citato prima (anche perché i fortepiano della sua epoca arrivavano ad una estensione di cinque ottave, forse sei negli ultimi). Il basso potente e presente che apprezziamo nella musica rock e nel jazz è in realtà un medio-basso. Per questo i diffusori tower con risposta fino a 60-70Hz vanno benissimo per tutte le esigenze o quasi. Anche se è chiaro che chi può permettersi sistemi a gamma completa come le Wilson Audio Alexandria della foto potrà spaziare al meglio su qualsiasi genere di musica e anche avere benefici sulla musica meno estesa. Ma non si può aver tutto nella vita, come noto.

Rimangono le non linearità sulle medio alte che molti diffusori presentano. Qui però bisogna chiarire che la risposta in frequenza non è quella reale che percepiamo nella nostra stanza d'ascolto, ovviamente, ma una risposta standardizzata, tipica del diffusore, misurata in camera anecoica. In ambiente la risposta sarà integrata dalle riflessioni della stanza e le alterazioni saranno attenuate (o enfatizzate) in dipendenza della efficacia del progetto.
Non è sicuramente questo il parametro decisivo per valutare una cassa o un impianto. Ma per chi volesse divertirsi a verificare la risposta in ambiente "ad orecchio" in questa pagina del sito audio-clips.it ho messo a disposizione una serie di segnali di prova in formato Wav su tutta la gamma audio, più le note più gravi e più acute degli strumenti da orchestra più comuni. Sono tracce che si trovano in molti dischi test, questo è un disco test della RCA di diversi anni fa.

Ascoltare e verificare la gamma dinamica
La gamma dinamica può essere critica sia verso l'alto sia verso il basso e quindi è un parametro più interessante da valutare. Partendo da materiale musicale su vinile la limitazione teoricamente potrebbe nascere già all'origine, perché la gamma dinamica di un normale LP arriva all'incirca a 60 dB. Che è però già comunque impegnativa per un impianto medio. Stesso discorso si può fare con qualche approssimazione per il supporto CD. Mentre per i supporti in alta definizione, fisici o liquidi che siano, il range è molto più ampio, più ampio anche di qualsiasi programma musicale. Perché esiste anche questo limite non tecnologico. Come noto buona parte della musica moderna è "incisa" con una gamma dinamica volutamente compressa, la famosa loudness war delle case discografiche (contro gli ascoltatori esigenti) della quale abbiamo scritto già nel blog proponendo delle misure oggettive.

Volendo si potrebbe anche usare un fonometro per misurare il volume raggiunto ai due estremi, per iPhone esiste una buona app sufficientemente precisa per questi scopi amatoriali chiamata Vumeter. Oppure usare i dischi test dove di solito c'è un brano musicale ripetuto con attenuazione progressiva da 0 a -60dB. Ma si possono anche semplicemente utilizzare le nostre orecchie. Una volta scelto un file musicale o un disco ad elevata dinamica, tipicamente un brano di classica che passa dal pianissimo al fortissimo (come il celebre passaggio nel primo movimento della IV di Beethoven) o più semplicemente due brani con queste caratteristiche. Ci si accorgerà che verso l'alto con impianti hi-fi anche di livello medio non si riuscirà ad arrivare ai suoi limiti. Molto prima di percepire una udibile e non sopportabile distorsione (che alcuni chiamano anche compressione), vicini di casa, familiari o altri clienti del negozio, se siamo in negozio, saranno intervenuti per capire cosa sta succedendo. Con mini diffusori, amplificatori in classe T o mono triodo e altre scelte hi-fi particolari il pieno orchestrale sarà invece fuori portata. Come era già probabilmente noto.



Più interessante la capacità di riprodurre in modo fedele anche i bassi livelli, che pure in musica esistono. Qui l'ascolto deve essere più attento (e in un ambiente silenzioso) per verificare, ad esempio, se strumenti o voci di accompagnamento si percepiscono ancora con la stessa chiarezza. Attenzione però al fatto che l'orecchio umano è meno sensibile alla parte bassa e alta dello spettro sonoro ai bassi livelli, quindi se il contrabbasso tende a sparire è un fenomeno naturale. La curva di loudness citata indirettamente prima serviva in origine proprio a compensare questo fenomeno fisico.

La ricostruzione spaziale
Questo è invece un parametro di importanza fondamentale, per giudicare sia un impianto nel suo complesso, sia l'inserimento di nuovi componenti, sia le differenza tra un formato digitale ed un altro. Non è misurabile in alcun modo, perché la ricostruzione spaziale è una simulazione che "inganna" il nostro sistema uditivo. Il metodo tipico è confrontare il livello di realismo tra due soluzioni alternative e individuare quella che appare migliore "a sensazione".
Ci manca però quasi sempre il riferimento oggettivo: come erano posizionati i musicisti nell'evento originale dal vivo o in studio? In un altro post (tra i più visitati del blog) sono state fornite informazioni sul posizionamento tipico degli strumenti in vari generi musicali, ma una informazione di dettaglio e specifica non è quasi mai presente nelle note che accompagnano la registrazione.


Si può quindi soltanto procedere in modo indiretto, utilizzando un sistema di riferimento di elevata qualità. Ascoltandolo con attenzione verificheremo, e segneremo su un taccuino (o su un tablet) il posizionamento degli strumenti sul piano orizzontale, in profondità, ai lati esterni rispetto alle casse e in altezza.
Nei test si annoteranno quindi le variazioni rispetto al riferimento, verificando anche la stabilità del posizionamento, quindi se gli strumenti o le voci rimangono apparentemente nella stessa posizione al variare della intensità o dell'altezza del suono. Con questo sistema il test potrebbe essere anche effettuato a distanza di tempo. Per la scelta della musica su cui effettuare il test, tenendo conto delle caratteristiche tipiche delle registrazioni e dei propri gusti musicali si sceglieranno uno o più brani musicali significativi per verificare la ricostruzione spaziale. Ad esempio un piccolo complesso di musica da camera, una registrazione jazz dal vivo o altri set acustici.

La timbrica
Più che individuare la corretta restituzione del timbro di un violoncello Maggini o di un violino Guarneri del Gesù, compito fuori dalla portata, credo, per la maggior parte degli audiofili anche in una esecuzione dal vivo (1), l'obiettivo può essere più semplicemente la verifica del timbro di uno strumento "standard". Per un confronto efficace bisogna conoscerne il suono reale dal vivo, che sia un pianoforte, un sax, un violino, un violoncello, una chitarra o quello che vogliamo. L'ascolto attento ai dettagli cercherà di verificare a memoria quanto il suono riprodotto sia realistico, per volume di suono, intonazione, capacità di riprodurre le variazioni di suono, in particolare se molto rapide, e così via.
Anche in questo caso una via alternativa potrebbe essere quella di ricorrere ad un sistema di riferimento di sicura qualità, da prendere come esempio di timbrica correttamente riprodotta. Il problema, rispetto alla ricostruzione spaziale, è che la valutazione di questi sotto-parametri che abbiamo elencato è meno oggettiva e difficilmente riportabile su un taccuino per un confronto a memoria. Al massimo potremmo dare un valore numerico su una scala come propone Wheeler nel suo articolo. Con tutte le indeterminatezze e i possibili ripensamenti del caso in ascolti successivi, però.
Per questo tipo di verifica è più efficace il confronto on-line, possibilmente in cieco, che abbiamo descritto in un altro post per diverse configurazioni. 



Il dettaglio
Uno strumento da solo è relativamente facile da valutare, si può concentrare l'attenzione su un solo elemento per quanto complesso e sfaccettato. La musica è però di solito creata attraverso l'apporto sinergico di più voci e strumenti che in una esecuzione dal vivo siamo in grado di isolare abbastanza efficacemente, percependone il singolo suono e direzione. La musica riprodotta dovrebbe raggiungere lo stesso risultato, obiettivo, come intuibile, niente affatto semplice.
Non c'è per questo obiettivo da aggiungere molto di più a quanto scritto prima, conoscenza del suono del piccolo o grande complesso orchestrale dal vivo, attenzione ai dettagli e alla riconoscibilità delle singole voci, e valutazione per ciascuna di esse. Un ascolto ancor più complesso e che probabilmente eccede dalle possibilità di una classica seduta di ascolto di valutazione a confronto. Conviene forse concentrarsi sul proprio genere musicale preferito piuttosto che su un genere rivelatore, e confrontare in più passaggi la naturalezza e piacevolezza dell'ascolto.

Ma che fine hanno fatto la microdinamica e il microdettaglio?
E' già difficile individuare quelle differenze nella riproduzione che possono modificare la timbrica di una voce o di uno strumento e seguire il suono di specifici strumenti o sezioni di orchestra, la valutazione generale e sintetica del microdettaglio o della microdinamica è probabilmente meglio lasciarla ai recensori professionisti e ai loro numerosi emuli. Anche se queste sono, come cercavo di esemplificare, caratteristiche che fanno la differenza nella tecnologia di riproduzione sonora. Concentrarsi su alcuni aspetti dell'ascolto, come nei suggerimenti riportati sinteticamente nell'articolo, è già abbastanza impegnativo. Per chi voglia andare oltre l'approccio umanistico che rappresenta comunque a mio parere una interessante alternativa.

Note
(1) L'affermazione non deriva da una cattiva opinione preconcetta sulle capacità di ascolto degli "audiofili", ma dai risultati di un test in doppio cieco molto noto di alcuni anni fa effettuato con diversi violinisti professionisti che in buon numero hanno avuto difficoltà a riconoscere il suono di uno Stradivari da quello di un buon violino moderno.

Le immagini sono ovviamente dedicate ai musicisti citati, la pianista Noriko Ogawa, le cantanti liriche Anna Netrebko e Cecilia Bartoli, il violoncellista Mario Brunello.


0 commenti:

Posta un commento