mercoledì 24 settembre 2014

La differenza che interessa

La differenza che interessa e suscita dibattito nel mondo della musica (riprodotta e non) è quella tra i formati compressi e non compressi, e tra i formati in qualità CD e in alta definizione. Una differenza che evidentemente si può apprezzare solo all'ascolto, e all'ascolto abbiamo dedicato numerosi approfondimenti negli ultimi tempi (in fondo ci sono tutti i link agli altri post).

Un articolo relativamente recente sul quotidiano inglese The Guardian ha rilanciato il tema, sostenendo (non sono i primi) che la differenza non si sente. Possibile? Tante informazioni in più ma, a differenza che nel cinema e nella fotografia digitale, il nostro pur raffinato sistema uditivo non riesce ad individuarle e ad utilizzarle? Ci torno sopra partendo da alcuni test eseguiti da istituti universitari statunitensi e tedeschi nei dipartimenti che si occupano dell'ingegneria dell'audio.

Premessa: come eseguire un test a confronto
La progettazione di un test influenza il risultato e lo rende più o meno attendibile, questo è noto ed è verificabile in qualsiasi test soggettivo, con questionari e partecipanti umani. Nel nostro campo il test tipico e più intuitivo è la prova a confronto, si ascolta un estratto di 10-20" in un formato e poi lo si riascolta subito dopo per il formato da confrontare. Per rendere la prova più oggettiva si evita di dichiarare quale formato si sta ascoltando (doppio cieco) e poi (ma questo è obbligatorio) si normalizza il volume tra i due test (il nostro sistema di giudizio tende a preferire il suono più forte, come noto).
Più efficace è il metodo basato sul confronto istantaneo, che avevo applicato nel primo test a confronto pubblicato su questo blog. I due formati sono riprodotti in parallelo da due sistemi di lettura diversi, con il medesimo programma musicale, sincronizzati e con il volume normalizzato, e l'ascoltatore può passare dall'uno all'altro più volte, alla ricerca delle differenze.
Entrambi gli esperimenti che presento qui adottano la tecnica degli ascolti successivi a confronto su un panel di più partecipanti.

Il test dell'Audio Engineering Society (AES)
L'AES, in collaborazione con il  McGill Audio Quality Lab della omonima università di Montreal, ha svolto nel 2009 questo interessante test, progettato per un convegno internazionale e citato da diverse parti e per il quale, soprattutto, è disponibile una esauriente documentazione. Il test si chiama "Subjective Evaluation of MP3 Compression for Different Musical Genres". Lo scopo era determinare se gli ascoltatori erano in grado di percepire la differenza tra musica riprodotta a qualità CD e la stessa compressa in formato MP3 a 96, 128, 192, 256 e 320kbps.
Il test utilizzava estratti di musica in diversi generi che veniva fatta ascoltare in doppio cieco con un impianto hi-fi di elevato livello, ad un panel di ascoltatori differenziato per esperienza di ascolto: ascoltatori esperti (tipo noi che partecipiamo a questo blog), musicisti, tecnici del suono.
Un testo apparentemente un po' datato ma molto interessante, perché il fatto che una differenza sia avvertibile tra CD e MP3 è stato raramente messo in discussione.

La McGill University di Montreal

I risultati
Cominciamo dai risultati e poi vediamo come sono stati ricavati. Dalla presentazione (che si può leggere integralmente seguendo i link in fondo) apprendiamo che: a) aumentando la esperienza di ascolto aumenta la capacità di riconoscere senza incertezza il suono non compresso: gli ascoltatori esperti riconoscono con sicurezza la differenza tra formato CD e MP3 fino a 96Kbps, i musicisti fino a 128Kbps, i tecnici del suono fino a 256Kbps; b) la preferenza è avvertita più con la musica di genere pop e rock che con la musica acustica; c) la compressione in MP3 a 96Kbps viene riconosciuta come peggiore anche rispetto all'MP3 a 320Kbps con la stessa percentuale rilevata per il CD (>70%); d) i tecnici del suono riconoscono i campioni CD come superiori a quelli compressi nell'80% dei test complessivamente, la percentuale scende per le altre due categorie.


Se ne deduce quindi che con questa modalità di test il formato MP3 a 320Kbps è difficilmente distinguibile dal CD, e anche che risultano più rivelatori delle differenze estratti di musica creata in studio con strumenti elettronici piuttosto che musica acustica. Infine, anche la specifica conoscenza di un genere musicale non ha aiutato nel riconoscimento rispetto all'ascolto con un genere musicale o con un brano non noto.

Risultati quindi che in parte confermano le aspettative (il peggioramento con l'MP3 si sente) ma in parte le smentiscono, portando l'MP3 a bitrate elevato allo stesso livello del CD (buona notizia per Spotify e soci, e per le case discografiche, se fosse vero) e smentendo la nostra preferenza per la musica acustica nei test (almeno se lo scopo è il confronto tra formati).
Ma il test sarà stato veramente efficace?

La modalità di effettuazione del test
A differenza di altri storici ed opinabili test qui si è partiti da ascoltatori che almeno avevano gli strumenti per valutare un messaggio musicale, quindi in primis, ascoltatori di musica. Il panel era abbastanza ampio: 13 ascoltatori esperti (età media 28 anni), 4 musicisti, 9 tecnici del suono. I generi musicali scelti erano 5 (Pop, Metal, Contemporanea, Orchestra, Opera) con brani poco noti, 1 per genere. La tecnica usata per il test era molto semplice: ogni partecipante entrava nella sala di ascolto attrezzata con un impianto di elevata qualità (Classè e B&W 902D) e dava il via al confronto. Veniva presentato in modo randomico, e quindi in doppio cieco, uno dei possibili confronti e alla fine doveva scegliere il migliore tra i due. Ogni confronto, di durata di 10" circa, veniva presentato due volte, in ordine inverso, e l'intera prova si concludeva dopo aver completato il totale delle possibili combinazioni previste, 150 in tutto.
In più, alla fine di ogni ascolto veniva chiesto di indicare con un questionario i difetti (artifacts) del campione giudicato peggiore.

L'impianto usato per i test alla università di Montreal

L'efficacia del test
Una prima osservazione riguarda l'assenza di test orientati alla voce maschile o femminile non impostata (e non filtrata) e alla mancanza di test orientati alla ricostruzione spaziale. Uno dei due campioni audio di musica acustica (quello per l'opera) è addirittura registrato in camera anecoica (penso per far concentrare l'ascolto sulla voce) mentre l'altro è per grande orchestra mahleriana, che puntava ad un amalgama del suono secondo la scuola di Wagner, come noto.
Sono invece i tipici test che si fanno (e che adotto anche io) per evidenziare al massimo le differenze più individuabili. D'altra parte in 10" non sarebbe stato possibile far attenzione anche a questo.

Un'altra osservazione nasce dalla curiosa maggior efficacia del pop e del rock per evidenziare le differenze. Anche qui occorre ricordare che la compressione MP3 tra le altre cose comprime anche la dinamica, e che una dinamica più ristretta comporta una impressione di suono "più forte". Dando per scontato che il volume nei due confronti sia stato normalizzato (la presentazione non lo dice), è possibile quindi che la differenza avvertita meno per la musica acustica, nasca dal fatto che il campione in MP3 sia stato "migliorato" soggettivamente all'ascolto (così breve) dalla compressione dinamica. Effetto minore per i campioni pop / rock già presumibilmente più compressi all'origine. E minore incidenza per gli ascoltatori più esperti che difatti riescono con maggiore sicurezza ad individuare il campione compresso.

Gli altri tre campioni di musica pop, rock e contemporanea rappresentano scelte difficili da valutare: a parte il brano dei Rage Against The Machine sono infatti brani quasi sconosciuti di autori molto poco noti. Comunque introvabili sia su YouTube sia su Spotify e quindi difficile da valutare quanto siano adatti ad evidenziare le differenze. Il brano rock è un classico pezzo metal con chitarre distorte e basso elettrico in evidenza e a mio parere (e come confermano i risultati) le differenze possono essere individuate solo da un ascoltatore molto esperto.

I campioni musicali selezionati per il test AES

Infine si nota uno strano andamento nei giudizi tra i musicisti, con l'MP3 a 320Kbps valutato allo stesso modo del 128 (ma il 256Kbps migliore del CD al 70%). Sembrerebbe che qualcuno dei 4 musicisti sia crollato dopo decine di test e abbia dato risultati a caso.

Gli "artifatti"
E' interessante riportare anche l'elenco delle distorsioni che si chiedevano di individuare, e che sono state individuate dai partecipanti al termine delle brevi sessioni di ascolto. In ordine di segnalazioni riportate (vedi il dettaglio nella slide) sono:
- distorsioni a frequenze elevate
- distorsione in genere
- transienti distorti o non realistici
- immagine stereo non stabile
- compressione della gamma dinamica
- riverbero eccessivo o innaturale
- rumore di fondo

Questo elenco può essere anche un buon suggerimento in ascolto sugli aspetti a cui prestare maggiore attenzione durante un confronto per qualsiasi scopo.



In sintesi
Meno test, più lunghi e più mirati penso che avrebbero dato risultati diversi e fatto emergere la superiorità in genere da tutti riconosciuta del formato non compresso su quello compresso. Rimane il fatto oggettivo che la compressione normalmente usata comporta un degrado avvertibile e che però già a 320Kbps la differenza si avverte, ma solo con un ascolto attento e continuativo. Da notare inoltre che altri formati di compressione (Ogg Vorbis soprattutto) sono superiori come qualità al più anziano MP3.

Il test dell'Istituto di musicologia dell'Università di Amburgo
Questo test invece è stato effettuato per una tesi di laurea collettiva. Più recente, risale al 2011, il titolo è "Subjective audibility of MP3-compression artefacts in practical application". In fondo all'articolo anche in questo caso il link per leggere integralmente il report. La modalità di rilevamento dei dati è molto simile, con prove a confronto di breve durata, una differenza significativa è rappresentata dal sistema di riproduzione, che in questo caso è una cuffia dinamica di elevata qualità (Senheiser HD 800, nella foto sotto) e nel panel dei partecipanti che è rappresentato (come c'era da aspettarsi) da studenti della stessa facoltà (2 dei quali musicisti e tecnici del suono).

Più o meno simile il numero di partecipanti (21), più ampia e variegata invece la lista dei campioni musicali (12 per 4 generi: elettronica, rock, classica, jazz). Le restanti modalità di test sono molto simili, incluso i campioni di 10", da notare solo che era incluso per confronto un "falso" test di controllo CD-CD e che è esplicitamente citato il livellamento preliminare del volume. Il report fa anche un riepilogo degli altri test effettuati nel mondo a questo scopo (incluso quello dell'AES) ed evidenzia anche la variabilità dei risultati e la dipendenza dalla tecnica di test.

I risultati del test effettuato in Germania
Sono apparentemente anche più netti di quelli del test precedenti, relativamente alla difficoltà di individuare le differenze, almeno con questo sistema di misura, ma le elaborazioni sul campione dei partecipanti forniscono alcune interessanti spiegazioni a questo risultato inaspettato.
Il test individua il confine tra differenza individuabile con certezza ancora più in basso, a 48Kbps, già a 96 e a 128Kbps la variabilità e il numero di "false" risposte è simile a quello ottenuto dai test di controllo CD-CD.

L'auditorium della università di Amburgo

Veniva richiesto però anche in questo caso di compilare un questionario sulle differenze individuate tra i campioni e da questo ulteriore elemento si è verificato che sia a 96 sia a 128Kbps la grande maggioranza dei partecipanti individuava differenze con sicurezza tra i due campioni ascoltati. Il fatto è che queste differenze non venivano valutate come indicatori di un suono "migliore". Spesso la differenza introdotta dalla compressione (ad esempio la compressione dinamica, penso io) veniva interpretata come migliorativa.
I risultati sono stati quindi correlati con le abitudini di ascolto dei partecipanti (come non pare abbiano fatto quelli dell'AES) e hanno verificato una marcata differenza tra gli ascoltatori che usavano in prevalenza per l'ascolto lettori portatili e musica compressa e quelli abituati ad ascoltare in qualità CD. Scoprendo che chi individuava con maggior sicurezza la differenza erano questi ultimi.

I tesisti e il prof. Rolf Bader che ha guidato la ricerca nelle conclusioni ipotizzano quindi che la spinta psicologica ad individuare comunque una differenza (anche quando non c'è: test CD-CD) e la familiarità col suono ottenuto della compressione MP3 (compresso e "semplificato") hanno condotto al giudizio che possiamo considerare "falso" in termini tecnici, ma non soggettivi, ma che la differenza comunque gli ascoltatori la percepiscono.

Sintesi finali
Non c'è molto da aggiungere ai risultati dei due test che sono trasparenti ed oggettivi nella loro esecuzione, ma ovviamente soggettivi nelle valutazioni. Che peraltro ognuno può verificare sul proprio impianto e con le proprie orecchie, perché è un test molto facile da replicare. Come evidenziato dalle conclusioni del test tedesco, che condivido, molto dipende dalla educazione all'ascolto dei partecipanti ai test, confermando anche l'opinione di un professionista e tecnico del suono come Masciarotte citato in precedenza. Una maggiore qualità del media rappresenta quindi sempre un miglioramento e una volta acquisito questo livello di qualità è più difficile tornare indietro.
Vale lo stesso anche nel successivo upgrade da CD a HD? La risposta ha provato a darla un successivo test sempre dell'AES che commenterò in un successivo post.

Appendice 1 - Gli altri articoli sull'ascolto


Appendice 2 - I link ai due test commentati