venerdì 24 agosto 2012

Analisi di file audio in alta risoluzione

Cosa caratterizza un file audio in alta risoluzione (o in alta definizione) rispetto ad un file audio a risoluzione standard, quella definita a fine anni '70 per il CD? Come noto, il numero di bit, o lunghezza parola, utilizzata per ogni campione, che passa da 16 bit a 24 (con un incremento enorme del numero di campioni diversi a disposizione) e la frequenza di campionamento, ovvero il numero di campioni effettuati nell'unità di tempo, che passa da 44.100 al secondo a 96.000, 192.000 ed oltre. Tutto ciò con il metodo di campionamento più utilizzato, il PCM, altrimenti con il DSD utilizzato per il SACD le cose sono un po' diverse, ma si possono approfondire, per chi è interessato, su Wikipedia.

Il più sensibile incremento qualitativo si ottiene con l'aumento della lunghezza di parola, ma l'effetto non è di immediata percezione né facilmente misurabile. L'incremento della frequenza di campionamento consente invece di registrare in digitale frequenze superiori ai 20KHz, che erano circa il limite fisico gestibile con la frequenza di campionamento del CD (22,050KHz). La presenza di queste frequenze ultrasoniche nei file audio è misurabile e quindi per approfondire questo aspetto sono state fatte analisi e misure del materiale audio in HD da parte di riviste specializzate (H-FI & Record Review, Audio Review) e sono sorte discussioni tra appassionati.

Cogliendo l'occasione di una discussione con un visitatore del sito ecco in questo articolo alcune misure commentate di file audio di varia provenienza. Rimandando alle conclusioni le considerazioni sulla effettiva utilità di questo tipo di analisi ai fini della selezione del miglior materiale in HD, e più in generale della massima qualità di ascolto della musica.

Le misure sono state eseguite con l'editor audio open source Audacity (sourceforge) che include anche questa funzionalità. I diagrammi presentano la distribuzione spettrale del segnale audio per una porzione di musica di circa 50 secondi o meno, sull'asse delle ordinate l'attenuazione in decibel delle frequenze presentate sull'asse delle ascisse. La scala usata è a volte logaritmica e a volte lineare (è indicato nel grafico) a seconda degli elementi da mettere in evidenza. Come suggerito dalle misure effettuate da Audio Review nel numero 317 del 2010, viene analizzata in alcuni casi anche la coda dei file audio dove la musica non c'è più o quasi, per isolare il rumore.

Linn Records
Portabandiera dell'alta risoluzione e con una propria etichetta discografica, propone materiale audio di ottima qualità musicale con risoluzione 24/96 e anche 24/192. Un classico della produzione Linn sono i concerti per pianoforte di Beethoven nella esecuzione della Scottish Chamber Orchestra con il pianista Artur Pizarro.
Vediamo l'analisi dello stesso movimento scelto da Audio Review, e analizzato con strumenti sicuramente più potenti, il largo del 3° concerto, in scala lineare.


Aggiungiamo uno spettro del numero 5, questa volta su scala logaritmica.


Infine l'analisi della coda del largo del 3° concerto, alla ricerca del rumore.


Come si vede la banda in frequenza del segnale musicale arriva sino a quasi 40 KHz, quindi meno del limite teorico che in questo caso sarebbe 96KHz. Ma d'altra parte non si vede come la Scottisch Chamber Orchestra e il pianista potrebbero generare queste frequenza ultrasoniche, a patto che i microfoni usati nella registrazione fossero in grado di raccoglierli. Oltre i 30 KHz c'è soltanto rumore a un livello però bassissimo, quasi a -100dB. Stavo per usare l'aggettivo "inudibile" ma in realtà a queste frequenze per l'orecchio umano a qualsiasi livello sarebbe comunque inudibile.

Un secondo esempio sempre della Linn Records mostra una certa presenza del rumore in alta frequenza. Il brano è tratto dalle musiche per il teatro di Sibelius, Pelleas et Melisande, ed era registrato a 24/96 sempre con la Scottish Chamber Orchestra (nel 2003).


Come si vede oltre i 25KHz inizia rumore (riconoscibile anche perché non ad andamento frastagliato) che rimane comunque sotto gli 84 dB rispetto allo zero a 40KHz. Questo andamento si ritrova in tutto l'album.

HDtracks
Continuiamo con altro materiale audio registrato all'origine in digitale, in questo caso dalla Chesky Records. L'album è il noto Take This Journey della cantante soft jazz Christy Baron.


Anche in questo caso analizziamo la coda a musica terminata,


Come si vede l'analisi di spettro mostra una registrazione che comprende anche frequenze molto elevate, oltre i 45KHz, nell'analisi della coda si vede che si tratta in buona parte di rumore, apparentemente predominante oltre i 30-35 KHz.

Vediamo ora un file proveniente da una registrazione con tecnologia DSD sempre commercializzato da HDtracks, i quartetti per oboe di Mozart interpretati da Keisuke Wakao. La frequenza di campionamento equivalente in questo caso sarebbe quella del SACD, vale a dire 88,2KHz.


Anche in scala lineare.


In questo caso la coda presenta musica a bassissimo volume, e quindi una analisi comparata non è possibile, ma comunque si può supporre che quello che si vede oltre i 20KHz sia in gran parte, se non del tutto, rumore, anche dalla forma del grafico. Quindi potrebbe essere stato effettuato in fase di trasferimento in Flac un filtraggio a 20KHz, non sfruttando tutta la potenzialità del formato. Oppure ciò dipende dalla conversione da DSD a PCM, un aspetto da approfondire. Oppure semplicemente nella registrazione originale è stato usato un set che non puntava a catturare le frequenze ultrasoniche, peraltro per un quartetto oboe, violino,viola, violoncello, tutto nella parte media dello spettro come contenuto musicale. Registrazione che comunque dovrebbe essere stata molto accurata, come si vede dalle note.


Conversione fai-da-te
Numerosi appassionati con tanto tempo libero a disposizione si sono dedicati in questi ultimi anni alla conversione in digitale in HD a partire da dischi in vinile, mettendo poi in rete gratuitamente e per pura passione il risultato del loro lavoro. Quindi originale analogico, presumibilmente di buona qualità audio, e tutta una catena composta da giradischi, testine, convertitori da analogico e digitale, e processori per la produzione di output solitamente a 24/96 (nel seguito le note tecniche sulla conversione dell'esempio utilizzato). Viene la curiosità di vedere come hanno lavorato e cosa ne è delle frequenze ultrasoniche, che qui proprio non ci aspetteremmo.
Tra i diversi album disponibili scegliamo la conversione effettuata da un appassionato che si fa chiamare Doctor Robert del classico album di Joan Baez Diamonds And Rust.


E infine l'analisi della coda.


Come si vede il contenuto a frequenza superiore ai 25 KHz è costituito da rumore, comunque a livello bassissimo. Il lavoro di conversione sembra eseguito in modo pienamente corretto, e fa ricorso anche a un compressore / decompressore audio professionale dbx per attenuare il rumore di fondo.

Note sul trasferimento in digitale fornite da chi lo ha eseguito
Nitty Gritty RCM 1.5
Technics SL-1200MK2 Turntable with KAB Fluid Damping and KAB record grip
Ortofon 2M Black cartridge
Pro-Ject Tube Box SE II Preamp
dbx model 224 dbx II decoder
Tascam US-144 external USB 2.0 Audiointerface
Bias Peak LE 6 recording software
iZotope RX Advanced 1.21 for Redbook conversion
xACT 1.71 for Redbook SBE correction

RCM>TT > Ortofon 2M Blk> Tube Box preamp> dbx decoder> ADC> Mac Pro Dual Xeon> Peak LE @ 24/96 > analyze (no clipping, no DC Bias offset, each side maximized to -0.3 dB) > 
split into individual Tracks > Click Repair 3.02 used in Manual Mode, 30 Rev, Pitch Protection, X2 > 
FLAC encoded Level 5 with XLD Version 20100505 (119.1)
All de-clicking software used in full manual mode to preserve musical transients.
No music was harmed in the making of this vinyl rip.
No silence been removed, please burn gapless to match original track layout.


Conclusioni
Da questi grafici si ricava una qualche scala di qualità per il materiale audio esaminato? Facciamoci prima altre 2-3 domande. Se il sistema uditivo non riesce a percepire suoni oltre i 20 KHz, per soggetti giovani, e questa soglia si riduce a 16 KHz e anche meno con il procedere dell'età, perché preoccuparsi delle frequenze ultrasoniche? E inoltre, se una parte consistente, forse maggioritaria, degli appassionati di alta fedeltà considera tuttora il vinile, che certo le frequenze oltre i 20 KHz non può registrarle e riprodurle, allo stesso livello di eccellenza della musica in HD, per quale motivo dovremmo preoccuparci di questa parte dello spettro audio? E infine, anche ammesso che abbia una qualche influenza, come potrebbe arrivare fino a noi, se casse acustiche e cuffie sono progettate per riprodurre suoni sino a questi famosi 20KHz o poco oltre?

D'altra parte, secondo studi ed esperimenti citati da Wikipedia e penso attendibili si è appurato che ascoltatori attenti pur non riuscendo a percepire suoni ultrasonici sono in grado di individuare in alcuni casi come "migliori" registrazioni che li contengono, ovviamente proposti da impianti in grado di riprodurle. 

Una conclusione che forse si può trarre è che, se contenuti audio ultrasonici ci sono, e si è visto che armoniche superiori di vari strumenti sono presenti, seppur a livello bassissimo, anche per musica classica strumentale eseguita con strumenti acustici, ci si aspetta che vengano registrati sui file audio, visto che l'alta definizione tecnicamente lo consente. Pur se il vantaggio in termini di ascolto è tutto da verificare. Da questo punto di vista non dovrebbe essere proposto materiale tagliato rispetto alle potenzialità del formato, come pare avvenga con alcune registrazioni in DSD, cosa comunque da approfondire. E mantenendo sempre come prevalente l'attenzione alla qualità musicale.

Rimane inoltre da approfondire la presenza di rumore ad alta frequenza e bassissimo livello in alcune registrazioni, non sappiamo per quale scelta o motivo inserito o lasciato e con quali effetti. Su questo se qualche lettore del post ha ulteriori elementi il suo contributo o parere sarà il benvenuto.

(Nota: l'analisi spettrale è materia complessa e qui per esigenze di inserimento in un articolo di un post tutto è molto semplificato, chiarimenti o approfondimenti. se ritenuti necessari, sono sempre graditi, così come altri esempi di analisi spettrale).

mercoledì 8 agosto 2012

L'alta fedeltà costa poco

Un'affermazione non così assurda come può sembrare. E' vero che negli ultimi numeri di Audio Review i componenti più economici in prova richiedevano per essere acquistati due mesi di stipendio di un impiegato medio. Ed erano per giunta solo una parte di in impianto. Ma la musica liquida, assieme al mondo globalizzato e tenuto insieme dalla grande rete può essere anche una risorsa per abbassare il costo del primo impianto. Quell'impianto minimale, ma già rispondente ai parametri dell'alta fedeltà che ai tempi della prima affermazione di questo settore le riviste non mancavano mai di proporre. E che ora, in tempo di crisi e di difficile scelta tra priorità da conciliare, ci sembra giusto provare a riproporre.

Il primo impianto
Scontando alcuni limiti inevitabili, deve essere in grado di far apprezzare al proprietario almeno le basi della riproduzione fedele (o più fedele): la correttezza timbrica e la ricostruzione spaziale.
La musica liquida consente di raggiungere questo risultato avendo già fatto un buon tratto di strada. Il
lettore infatti c'è già, e' il notebook o il PC con cui leggiamo blog o partecipiamo a forum, opportunamente attrezzato con un buon media player con caratteristiche hi-fi, che può essere Foobar2000 o anche iTunes,e consente di riprodurre anche materiale in alta definizione.
Quindi questo lo abbiamo già, gli elementi da acquistare rimangono solo tre: un convertitore da digitale ad analogico, un DAC, un amplificatore, una coppia di casse. Più tre accessori indispensabili: un cavo di segnale, un cavo di potenza, due piedistalli per le casse. E pazienza ed attenzione sufficiente per installare il tutto in modo ottimale. Costo orientativo dell'impianto minimale: 550 €. Meno del notebook che comunque abbiamo acquistato, ma con la opportunità di ascoltare la musica com'e'.

I componenti minimali
In questo tipo di articoli non si può essere generici, e i nomi bisogna farli. Con il rischio quindi che l'impianto invecchi con l'arrivo di nuovi modelli. Ma le alternative per questi tre componenti sono talmente numerose e così frequenti i nuovi prodotti che non ci sarà problema ad individuarne altri, simili, in futuro. Fanno parte infatti di classi ben consolidate, ormai:
- DAC Made in China (o Hong-Kong) assemblato sulla base di chip specializzati
- amplificatore in classe D tipo T-amp o derivati
- casse compatte a 2 vie bass reflex progettate in Europa e costruite eventualmente in Cina.

I componenti
Per il DAC scegliamo tra le molte alternative disponibili il Musiland Monitor 02 US. Ho provato a suo tempo lo 01 e andava bene, e altri in rete lo confermavano. Questo e' il nuovo modello. Si può avere qualcosa di più dell'integrato che si occupa dell'uscita analogica, spendendo più dei 120 € inclusa spedizione che costa su eBay, ma e' già hi-fi.

Per l'amplificatore l'economicissimo T-amp scoperto da TNT audio e' la soluzione ideale ed e' perfino ormai quasi caduto l'ostracismo da parte delle riviste tradizionali. Unico problema era la bassa potenza che rendeva necessario il ricorso a diffusori molto efficienti, caratteristica difficilmente conciliabile col costo molto basso.
Ma nel frattempo sono stati proposti anche ampli in classe D di potenza adeguata, come il Dayton Audio DTA-100a che costa anche lui circa 120 € e fornisce circa 30W per canale.

Con i quali si può pilotare agevolmente una cassa compatta come la Tannoy Mercury V1 che, come tutte le le altre di questa classe ha il limite di una bassa efficienza.  Come le altre è un mini diffusore a due vie con un piccolo woofer da 15 cm e un tweeter a cupola e caricamento in bass reflex. Un mini diffusore con queste caratteristiche non e' un componente complesso e quindi può costare poco, bastano 200 € per la coppia, ma in questo caso conviene comprarle in qualche negozio perché anche se mini, pesano, e la spedizione può essere costosa.
Un'alternativa italiana? Le Indiana Line Nota 250, sulle quali i commenti in rete sono meno unanimamente sul positivo spinto, ma da approfondire. Prezzo comunque molto simile.


L'installazione
Con questi tre componenti ce la possiamo cavare con 450 € o poco più, ma per arrivare a un effetto hi-fi e' fondamentale la installazione, sulla quale e' necessario quindi spendere qualche parola.
Le casse compatte, o mini diffusori, consentono infatti di ottenere ottime prestazioni con costi bassi ma per raggiungerle effettivamente e' necessario rispettare alcuni pre requisiti: 1) una stanza non troppo grande, massimo 20 mq, 2) un posizionamento delle casse all'altezza delle orecchie di una persona seduta , 3) una distanza dalle pareti laterali e posteriori di 60-100 cm (varia con i modelli).
Per ottenere gli ultimi due requisiti serve quindi un piedistallo, o stand, stabile e in grado di assorbire le vibrazioni. I mini diffusori di pregio che costano più di 1000 € e a volte anche molto di più li prevedono, sono progettati assieme ad essi, ma costano più delle casse che abbiamo proposto.
Per i mini diffusori economici gli stand sono il componente più critico, per chi non ha capacita' anche minime di bricoleur. Perché chi e' in grado di tagliare o far tagliare alcuni pannelli di truciolare può agevolmente costruirli da solo, esistono in proposito innumerevoli progetti. Come ad esempio quelli proposti da TNT-Audio.
Per gli altri sarà giocoforza cercare in internet o nei negozi stand usati previsti per altre casse di dimensioni simili, o individuare altre soluzioni artigianali. L'importante e' che siano stabili, quindi pesanti ed esenti da vibrazioni.

I cavi
L'ultima inevitabile esigenza sono i cavi. Quello USB dal notebook al DAC di solito e' incluso nel DAC, non e' critico, e' meglio che sia corto.
Anche gli altri due e' meglio che siano corti. Se li andate a comprare in un negozio di hi-fi, anche scegliendo tra i prodotti entry level dei principali operatori del settore rischiano di costare più di 100 € l'uno compromettendo l'economicità dell'impianto.
Poiché e' ormai coscienza comune nel settore che un cavo non migliorerà mai il suono, ma potrebbe al massimo peggiorarlo se e' proprio scadente, in questo caso e' sufficiente rivolgersi a buoni negozi di materiale elettrico ed elettronico, scegliendo i tipi di migliore qualità. In questo modo, con 100 € o anche meno dovrebbero essere sufficienti. Anche in questo caso chi abbia un minimo di pratica col saldatore e una discreta dose di pazienza ed attenzione può tentare l'autocostruzione spendendo molto poco, sempre su TNT-Audio sono presenti diversi progetti.

L'ascolto
Musica acustica, jazz, il nuovo folk contaminato che va ora, il canto e la voce maschile e femminile, sono tutti generi che si potranno ascoltare con grande soddisfazione con questo impianto. In modo non ottimale e migliorabile (questo vale per ogni impianto) ma già hi-fi.
La grande orchestra classica, il rock a tutto volume, la musica corale, rimarranno fuori portata e si potranno ascoltare solo per approssimazione, in scala ridotta, ma ancora timbricarmente corretti nel registro medio.