Nel variegato universo della musica esistono svariati formati musicali di file audio compressi: MP3, WMA, ecc... ce ne sono davvero molti e tutti quanti si prefiggono lo stesso scopo: ottenere una drastica diminuzione delle dimensioni dei file musicali senza comprometterne la qualità audio.

Se le ragioni di questa massiccia diffusione sono sin troppo ovvie (la necessità di poter scaricare in rete file non troppo grossi, l'utilizzo su lettori MP3, ecc...) quello di cui non si è universalmente certi è il fatto che un file audio compresso... se "COMPRESSO BENE" possa considerarsi o meno (a tutti gli effetti) un file audio di alta qualità musicale.

Vediamo di scoprirlo insieme e partiamo dalla definizione pura del formato audio compresso più diffuso al mondo: il famigerato MP3.
Definizione: l'MP3 (Moving Picture Expert Group-1/2 Audio Layer 3, noto anche come MPEG-1 Audio Layer III o MPEG-2 Audio Layer III) è un algoritmo di compressione audio (di tipo lossy) sviluppato dal gruppo MPEG, in grado di ridurre drasticamente la quantità di dati richiesti per memorizzare un suono, consentendo comunque una riproduzione accettabilmente fedele del file originale non compresso.

Dopo la codifica in mp3 il file ottenuto (cioè la successione di byte) non assomiglia affatto al file iniziale anche se il suono che si ottiene appare (quasi) quello di prima: tutte le informazioni superflue sono state tolte!
In genere più basso è il rapporto di compressione migliore dovrebbe essere anche la qualità del suono. Gli esperti usano il termine bitrate, per intendere la misura della compressione.
Il bitrate indica il numero medio di bit che un secondo di segnale audio occupa nel file compresso. L'unità di misura si chiama kbps (kilobit al secondo). Un basso valore del bitrate indica una qualità inferiore ed un file di dimensioni minori, mentre al contrario un alto valore del bitrate indica una migliore qualità del suono ma anche maggiori dimensioni del file. Il valore standard, un compromesso che permette di avere un segnale di buona qualità senza appesantire troppo il file, è 128 kbps.

Naturalmente esistono vari tipi di file MP3: è opinione diffusa che, per una resa soddisfacente dell'MP3, il bit rate deve essere almeno di 128 Kbps. La qualità di un MP3 compresso a questo bit-rate, tuttavia, non si avvicina a quella di un CD-audio, pur garantendo delle discrete prestazioni con dimensioni del file molto ridotte. Questo bit rate è il risultato di un tasso di compressione che si avvicina al rapporto di 11:1. Test di ascolto mostrano che si è facilmente in grado di distinguere un formato MP3 a 128 kbit/s da un CD originale.
Da un'analisi condotta dalla rivista SUONO l'opinione fornita dai conduttori al termine della prova risulta essere che solo ad almeno 256 kbit/s ci si può avvicinare al termine di "alta fedeltà".

Un codificatore che ha bassa qualità lo si riconosce ascoltando persino un brano a 320 kbit/s. Per questo non ha senso parlare di qualità di ascolto di un brano di 128 kbit/s o 192 kbit/s. Una buona codifica MP3 a 128 kbit/s prodotta da un buon codificatore produce un suono migliore di un file MP3 a 192 kbit/s codificato con uno scarso codificatore.

Nei moderni codificatori MP3 gli algoritmi più efficaci fanno di tutto per assicurare che i suoni rimossi siano quelli che non possono essere rilevati e/o che vengono rilevati meno dall'orecchio umano. Questo risultato è stato ottenuto anche grazie alla scienza della psicoacustica.

In buona sostanza: con un ottimo algoritmo di compressione, hardware appropriato e cognizione di causa nel sapere come operare... si è in grado di creare file in formato MP3 che si avvicinano moltissimo al brano originale.

Il tutto ce lo si gioca su quel "si avvicinano moltissimo" che, ahimè, non significa "sono copia perfetta".

Se nella maggior parte dei casi la compressione può essere sufficientemente appagante... questo non avviene nel caso in cui abbiate le "orecchie allenate" e anche il "cervello allenato" nel cogliere tutte le sfumature della traccia audio.
Ovviamente il tutto a condizione di avere la fortuna (o maledizione) di possedere un impianto Hi-Fi in grado di farVi cogliere queste differenze.
Perche le differenze sono piccole... ma ci sono.
E chiunque tenti di convincerVi che è possibile creare un file audio compresso che mantenga la stessa resa dell'originale... non sa di che cosa sta parlando... perche il concetto di compressione audio è un concetto "universale" di compressione.
Provate, ad esempio, ad ottenere un file compresso di tipo immagine ".JPG" uguale, ad esempio, al relativo file sorgente immagine ".TIF"... impossibile vero? Certamente. E quindi perché ci si potrebbe riuscire nel campo della compressione audio?

Le differenze non solo si "sentono" ma possono essere anche misurate in modo oggettivo.

Prima di procedere ad una dimostrazione della cosa è necessario introdurre alcuni concetti che ci aiuteranno nel comprendere con completa cognizione di causa i test successivi.

Ci sono vari tipi di rappresentazione grafica che ci consentono di "misurare un suono", ma il sistema più diffuso e che universalmente viene riportato nei manuali dei più blasonati impianti Hi-Fi è il classico DIAGRAMMA (O GRAFICO) DELLA RISPOSTA IN FREQUENZA:
 


Il grafico indica, in asse X, le frequenze udibili (in teoria) all'orecchio umano e in asse Y il relativo livello di "suono" espresso in Decibel (dB).

Diciamo che l'ascoltatore ideale è in grado di captare suoni che partono da frequenze ultra basse poco superiori ai 20Hz per arrivare a frequenze molto acute in prossimità dei 20KHz.
 


I grafici sono sviluppati seguendo questo riferimento che è, nella maggior parte dei casi, un po' troppo velleitario.
Difficile, infatti, arrivare a percepire frequenze vicino ai 20 KHz: non tutti sono in grado di percepirle e non si tratta semplicemente di "allenamento acustico", è proprio una questione fisiologica (tipo la vista per intenderci).
Per quello che riguarda poi le frequenze basse... è già un miracolo essere in grado di percepire i 40Hz: si è già fortunati se si arriva a tale soglia.

Quindi?
E' sufficiente prenotare un esame audiometrico (costa pochissimo) presso il Vostro ospedale: il tecnico Vi fornirà, alla fine, proprio i limiti della "risposta in frequenza" che siete in grado di percepire (valore medio per una persona in età adulta: da 40Hz a 18KHz).
Sapere "cosa si è in grado di sentire" può aiutare molto nella scelta di un impianto Hi-Fi...

Vediamo un esempio di risposta in frequenza reale:
 


Come si può osservare il grafico non è lineare: significa che la percezione in un determinato punto della scala delle frequenze è falsata "in più" o "in meno" rispetto la "realtà" di alcuni dB.
Il grafico ideale, quindi, deve essere lineare il più possibile (l'esempio riportato sopra è piuttosto disastroso dal punto di vista acustico).

Quindi come si legge un grafico di risposta in frequenza?
Considerando TRE PARAMETRI FONDAMENTALI.
1) La linearità del grafico (come abbiamo appena appurato).
2) Determinando l'estensione della risposta:
 


Non tutti i grafici arrivano a "toccare" frequenze molto basse o molto alte: il nostro grafico non è granché per quello che concerne la linearità ma vanta un'estensione di tutto rispetto, soprattutto in gamma delle basse frequenze.

3) L'intervallo di dB entro cui si ottiene la risposta:
 


E' importantissimo! Spesso nei manuali si legge... risposta in frequenza: da 25Hz a 19 KHz +/- 5 dB.
Questo "+/- 5 dB" indica proprio il valore evidenziato nel grafico soprastante: l'intervallo, cioè, di variazione del grafico di risposta in frequenza.
Inutile dire che minore è l'intervallo, migliore sarà il risultato!

Ora siamo in grado di valutare scientificamente le differenze che si possono misurare tra un tipo di suono e l'altro. Concentriamoci quindi sulle differenze tra una traccia non compressa e la relativa codifica in formato MP3.

Vediamo un esempio chiarificatore: prendiamo in esame un suono bizzarro... e cioè un cigolio di una porta (prelevato da Examples of Audio Spectrum Analysis) perché contiene molte frequenze elevate e quindi particolarmente interessante per analizzare l'effetto degli algoritmi di compressione (banda passante).

Il nome del file che andremo ad analizzare è facilmente reperibile in rete: creak.wav; formato: .wav (windows PCM);
dimensione del file: 391 KB; durata 4.546 secondi;
campionamento: 44100 Hz, 16-bit, mono.
I file mp3 sono ottenuti con Lame 3.91 ed analizzati con CoolEditPro-Demo.

Confrontiamo le relative risposte in frequenza:
 


Il grafico parla da se: mentre "in basso" (relativamente alle basse frequenze) la codifica è abbastanza fedele, in alta frequenza la differenza è evidente. Il file MP3 "taglia" (ossia smette di riprodurre) a circa 19 KHz rispetto i 20 KHz del file non compresso.
Le differenze "ci sono"! E si evidenziano in svariati punti.
Sono le differenze... che poi vengono colte durante l'ascolto...

Un file in formato compresso è comunque sempre leggermente degradato rispetto al relativo file originale.

Bisogna tenere in considerazione un frequente paradosso che è tutt'altro che banale: migliore sarà l'impianto Hi-Fi più si coglieranno le differenze!
Avere un ottimo impianto Hi-Fi è parecchio condizionante: è fondamentale, infatti, avere sempre una qualità altissima nei supporti che si ascolta (CD o Vinili non ha importanza) o tutto il progetto... verrà irrimediabilmente vanificato!

Questo significa niente musica scaricata dalle rete e niente codifiche compresse ma solo ed esclusivamente sorgenti audio originali o copie perfette...

 

 




 


COMMENTA IL CAPITOLO:
LASCIA UN POST SUL "MURO"
UTILIZZANDO IL LINK A FIANCO...