Privacy Policy
 
IN EVIDENZA
Album

Iamthemorning
The Bell
Demo

Break Me Down
The Pond
CERCA
ULTIMI COMMENTI
FORUM
ARTICOLI
RECENSIONI
NOTIZIE
DISCHI IN USCITA

24/10/19
PLATEAU SIGMA
Symbols - The Sleeping Harmony of the World Below

25/10/19
CLOAK
The Burning Dawn

25/10/19
VISION DIVINE
When All Heroes Are Dead

25/10/19
LEPROUS
Pitfalls

25/10/19
RINGS OF SATURN
Gidim

25/10/19
NOVERIA
Aequilibrium

25/10/19
MELTDOWN (NOR)
Deadringer

25/10/19
DAWN RAY`D
Behold Sedition Plainsong

25/10/19
EDELLOM
Sirens

25/10/19
STEVE HACKETT
Genesis Revisited Band & Orchestra: Live at the Royal Festival Hal

CONCERTI

25/10/19
MACHINE HEAD
LIVE CLUB - TREZZO SULL'ADDA (MI)

25/10/19
INTER ARMA
LIGERA - MILANO

25/10/19
ARBORES AUTUMNALES FESTIVAL
GRIND HOUSE CLUB - PADOVA

25/10/19
FOLKSTONE
VIPER THEATRE - FIRENZE

25/10/19
HELLRETIC + BRVMAK
500CAFFE' - PIEDIMONTE S. GERMANO (FR)

26/10/19
DESTROYER 666 + ABIGAIL + DEAD CONGREGATION + GUESTS
MU CLUB - PARMA

26/10/19
MACHINE HEAD
HALL - PADOVA

26/10/19
INTER ARMA
FREAKOUT - BOLOGNA

26/10/19
SOUL SELLER + GUESTS
DEDOLOR MUSIC HEADQUARTER - ROVELLASCA (CO)

26/10/19
CRISALIDE + INNERLOAD + PERPETUAL FATE
KRACH CLUB - MONASTIER (TV)

COSA STIAMO REALMENTE ASCOLTANDO? - PARTE 2 - I formati lossy, cosa stiamo sacrificando?
18/12/2015 (1730 letture)
Nel corso della prima parte di questo articolo abbiamo approfondito i principi della psicoacustica, i limiti dei sensi umani e parlato dei mezzi e dei metodi di ascolto migliori per fruire al meglio della musica, cercando così il modo migliore per avvicinarci il più possibile alle idee che i nostri artisti preferiti concepiscono.
Abbiamo interrotto la spiegazione poco prima di iniziare ad approfondire il vasto mondo dei formati lossy, prima di riflettere su quanto il loro design influenzi la nostra esperienza di ascoltatori.
Ora è arrivato il momento di addentrarci più a fondo in questo territorio.


Che cos'è un formato lossy?
Si tratta di una definizione piuttosto comune che raccoglie tutte quelle estensioni, già citate in precedenza, che privilegiano un basso contenuto di informazioni (dunque un basso bit-rate ottenuto con frequenze di campionamento inferiori e minor numero di bit) per salvare spazio sul vostro hard-disk e contemporaneamente cercare di restituire una qualità accettabile (sfruttando i principi di psicoacustica descritti nella prima parte dell'articolo).
Cosa succede quando un file .wave proveniente da un cd viene codificato in un formato lossy?
Cercando di semplificare per non entrare troppo nel tecnico: essenzialmente, la forma d'onda viene divisa in una serie di bande e sottobande che delimitano fasce di frequenze precise, ognuna di queste bande viene poi analizzata secondo dei parametri diversi per ogni formato (ispirati ai principi psicoacustici analizzati nell'episodio precedente), questo processo determina quale sia il margine di udibilità in ogni fascia di frequenze.
Tutto quello che dall'algoritmo viene considerato al di sopra del margine viene salvato. Tuttavia, ciò avviene in base ai bit a disposizione del formato, che potrebbero essere inferiori ai 16 di partenza e quindi, qualora il bit-rate prefissato nella conversione fosse troppo basso, l'algoritmo taglierebbe anche parti considerate udibili, mentre ovviamente tutto quello che già si trovava sotto la soglia di udibilità verrebbe chiaramente ignorato e dunque non salvato a prescindere.

Tutto questo a cosa porta nei fatti?
La lista di inconvenienti è lunga, ma tra i più importanti troviamo:

1. Perdite considerevoli di frequenze, concentrate soprattutto nella parte alta dello spettro, che potrebbero eliminare parti in realtà udibili.
2. Creazione di effetti eco artefatti in corrispondenza dei picchi più energici.
3. Perdite di dinamica che appiattiscono il suono in maniera irreparabile.
4. Generale perdita di sfumature timbriche e di dettagli che a volte alterano decisamente il mix.
5. Perdita di solidità e potenza dei bassi.
6. Problemi diffusi nella fase dovuti all'annullamento arbitrario di certe parti dell'immagine stereo, che portano ad una certa confusione e a piccoli episodi di contro-fase, che possono annullare in determinati momenti alcune frequenze che altrimenti sarebbero risultate udibili.
Piccolo approfondimento: quando parliamo di fase/controfase -semplificando davvero moltissimo- ci riferiamo al fatto che ogni segnale (ad esempio una nota) ha una fase che è relativa alla durata del segnale stesso, quindi, andando a sovrapporre due segnali uguali emessi in momenti diversi, si può verificare talvolta un annullamento totale di entrambi. All'interno di una fonte sonora complessa come una canzone possono talvolta capitare piccoli episodi simili, ma è compito dell'ingegnere che si occupa del mix limitarli al minimo con strumenti appositi, lavoro che appunto può venire vanificato -in modo incontrollabile ed imprevedibile- durante una conversione verso un file lossy.
7. Creazione -in certi casi- di rumori artefatti in zone casuali dello spettro.

Appare chiaro come si tratti di problematiche in grado di pregiudicare parecchio l'ascolto di un disco. Dunque, quando stiamo ascoltando un file lossy, dobbiamo chiaramente sapere quali possono essere le differenze rispetto all'originale .wave del cd.
Di fronte ad una così lunga serie di problematiche diventa anche più interessante (in negativo) notare come moltissimi gruppi vengano proposti o propongano a critici e giornalisti album in formati lossy, soprattutto considerando quanto questa scelta possa pregiudicare la valutazione, non solo sulla produzione, ma anche sull'arrangiamento, visto che potrebbero venire eliminate parti molto importanti.

C'è da dire che non tutti i file lossy sono uguali, dunque eccovi una panoramica dei più comuni.
Per rendere la spiegazione più intuitiva ho deciso di estrapolare una canzone a caso da un cd che ritenevo ben prodotto (non che abbia importanza ai fini dell'analisi, ma per chi fosse curioso si tratta di Sapari, da The Neverending Way of Orwarrior degli Orphaned Land) e l'ho poi esportata in una serie di formati lossy, analizzando alcuni importanti parametri audio da mostrarvi. Chiaramente, al di là di queste analisi più tecniche ciò che conta è l'orecchio di chi ascolta, ma vi posso assicurare che via via che i file si facevano più “tagliati” la qualità percepita si è abbassata in modo notevole.

Iniziamo dal file .wave (la qualità che troviamo sul cd) che ci servirà da pietra di paragone per tutti gli altri.
Il file pesa oltre 61 MB e in pratica occupa da solo uno spazio sufficiente ad ospitare -mediamente- un intero album in mp3. Nella prima immagine (contrassegnata dal numero 1) sono presenti i suoi dati, evidenziati da degli indicatori rossi.
In alto a sinistra, si possono notare i picchi massimi della forma d'onda, ovvero l'immagine che si è creata alla fine della riproduzione della canzone. Come è possibile osservare, non ci sono cali verticali del segnale, segno che le frequenze ci sono tutte, nonostante siano state smorzate in fase di mix e mastering le sub basse e le altissime per venire incontro agli impianti commerciali di ascolto, ma quello che vedete è esattamente quello che il produttore (Steven Wilson) intendeva farvi sentire.
In seguito, è presente una rappresentazione grafica dei i picchi massimi dell'immagine stereo (destra e sinistra) divisa tra suoni in fase (in blu) e in controfase (rosso): si può constatare con facilità come le due aree siano ben distinte. Chiaramente c'è qualcosa in controfase ma è assolutamente normale visto che è impossibile -specie in una registrazione così densa- che nessuna frequenza si annulli, pur prestando tutta l'attenzione possibile.
A destra, in alto, sono presenti i picchi del segnale espressi in real peak. Come alcuni di voi probabilmente sapranno, il massimo livello (in db) raggiungibile nel dominio digitale è 0, ma questo non vuol dire che però i segnali non possano superarlo, anche se ovviamente in caso di superamento tutto quello che eccederà lo 0 verrà brutalmente compresso, creando problemi alla dinamica e/o svariate distorsioni.
In questo caso il mastering ha spinto parecchio i segnali (sia a destra che a sinistra), ma il picco massimo registrato durante tutta la riproduzione della traccia è essenzialmente 0 (tranne che quel leggero +0,1 sulla sinistra).
L'ultimo valore che ci interessa è la lufs integrata. La lufs è la nuova unità standard di misura della loudness (rumorosità) di un suono e quella integrata è la lufs media calcolata dall'inizio alla fine della riproduzione della traccia. Più è alta più “rumorosa” suonerà la traccia.
Senza voler divagare parlandovi della loudness war, sappiate che una lufs integrata di -7,4 è per gli standard della musica in generale piuttosto alta (per un pezzo in cui tutte le dinamiche sono state pienamente rispettate difficilmente dovrebbe eccedere i -11 o -12). D'altro canto risulta però relativamente bassa quando si considera solo la musica metal (dove si può facilmente arrivare a -4). Ciò considerato, e tenendo a mente il real peak prossimo allo 0 di cui parlavo prima, siamo quindi di fronte ad una registrazione piuttosto pompata che però -pur nel suo suonare possente- ha mantenuto un buon rispetto delle dinamiche.

Cosa succede però quando analizziamo in questo modo la stessa canzone esportata in un formato lossy?

La seconda immagine vi mostra l'analisi della stessa canzone esportata in Ogg Vorbis, algoritmo di compressione audio libero non molto diffuso, ma con i suoi pregi.
Il file ora pesa appena 4,4 MB e infatti all'ascolto suona decisamente più scarno rispetto al .wave.
Come è possibile osservare, inizia ad esserci un taglio più verticale delle altissime frequenze (per quanto non drammatico) e la fase presenta qualche piccola modifica, ma appare ancora molto ordinata. Giungendo però ai picchi del segnale, si può notare come questa volta si spingano fino a + 0,5 e + 0,3 db, segno che le dinamiche sono state intaccate da una maggiore compressione, mentre il livello di loudness è sostanzialmente invariato.

La terza immagine invece è riferita ad un file Wma (il formato con cui salva le vostre canzoni il noto software Windows Media Player). Il peso è di 3,7 MB, il suono anche qui decisamente scarno (è quasi inutile che lo segnali). Il taglio delle altissime frequenze inizia ad essere molto più evidente (diventa quasi verticale appena oltre i 16 kHz), così come la fase inizia ad essere molto più alterata e confusa (guardate la differenza nella forma rispetto alle immagini precedenti). I real peak sono ancora più alti rispetto all'Ogg Vorbis, segno di una degenerazione delle dinamiche ancora più accentuata, mentre la loudness complessiva anche qui è sostanzialmente invariata.

La quarta immagine è quella di un mp3 (il più comune formato lossy) con un bit rate di 320 kbps.
Il file pesa 9,3 MB e rappresenta forse il miglior formato di file lossy che possiate trovare (insieme all'Ogg Vorbis che ‘salva’ maggiormente frequenze e fase, ma rovina più le dinamiche).
Il taglio delle frequenze è anche qui molto accentuato, la fase migliore rispetto Wma, ma comunque più confusa e -a sostanziale parità di loudness- la dinamica appare molto meno intaccata rispetto ai formati precedenti.

Per non tediarvi troppo, dal momento che avete ora gli strumenti adatti per leggere le restanti immagini (riferite a file mp3 con bit rate sempre più bassi) vi darò solo le informazioni più importanti:

La quinta immagine è riferita ad un mp3 con un bit rate di 256 kbps e un peso di 7,4 MB.
La sesta immagine è riferita ad un mp3 con un bit rate di 128 kbps e un peso di 3,7 MB.
La settima immagine è riferita ad un mp3 con un bit rate di 90 kbps e un peso di 2,6 MB.
L'ottava immagine è riferita ad un mp3 con un bit rate di 16 kbps e un peso di 476 kB.

Come potrete notare ci sarà una costante diminuzione delle frequenze alte, così come delle variazioni nella fase estremamente instabili, delle grandi differenze altalenanti nel real peak (che però considerando la quantità di frequenze tagliate a questi livelli diventa un indicatore sostanzialmente inutile) e sempre una sostanziale parità di loudness.
128 kbps è l'ultimo bit rate commercialmente utilizzato. I casi più bassi sono molto più rari e vi posso garantire che ascoltare mp3 a 90 o 16 kbps è veramente qualcosa di pittoresco.
L'analisi con questi strumenti diventa praticamente inutile perché al di là dei meri numeri e dei grafici, quello che lo nostre orecchie sentono è niente meno che un'imitazione grottesca del pezzo originale.

Siamo dunque giunti alla fine della nostra lunga panoramica, spero abbia soddisfatto la vostra curiosità, potete consultare le fonti qualora voleste leggere qualcosa di più tecnico ed accurato.
Dal canto mio spero di non aver semplificato troppo la materia, ma tengo a precisare che chi scrive è un appassionato dell'argomento e non un fonico abilitato, per cui se aveste ulteriori segnalazioni, appunti o aggiunte siete caldamente invitati a discuterne nei commenti per condividere con tutti la vostra esperienza.

Fonti principali:
http://www.maurouberti.it/psicoacustica/psicoacustica.html
http://www.soundonsound.com/sos/apr12/articles/lost-in-translation.htm
http://www.gennarovespoli.it/transitori_di_attacco_e_di_estinzione.htm
http://www.elemania.altervista.org/adda/campionamento/shannon.html



Masterburner
Mercoledì 23 Dicembre 2015, 10.35.01
11
Dovrebbe essere 1Volt rms
Ulvez
Mercoledì 23 Dicembre 2015, 9.56.35
10
@Masterburner mi pare di ricordare che esista un riferimento standard sia per tensione che per potenza, che corrisponde alla soglia minima (convenzionale) di udibiltà. non ti so dire quale sia, ma presumo sia lo stesso per tutti gli apparecchi audio.
Masterburner
Mercoledì 23 Dicembre 2015, 9.23.55
9
Una curiosità: visto che i dB sono il logaritmo del rapporto tra due potenze o due tensioni (0 dB indica che le due potenze o tensioni sono uguali), quale è il riferimento sul quale si basa la misura? è uguale per tutte le apparecchiature audio?
Room 101
Martedì 22 Dicembre 2015, 18.07.35
8
@Bassi: I vinili sono un argomento piuttosto interessante, perché per loro costituzione (ovvero un'entità fisica su cui è riprodotto il suono analogico) devono necessariamente avere un processo separato. Rispetto ai file che ho presentato in questo articolo (.wave compresi) il suono di un vinile non può per costituzione del supporto eccedere gli 0 db, non è possibile con i vinili fare come per i file digitali che vengono pompati e poi semplicemente trattati con un limiter a 0 db (cosa che ammazza le dinamiche) e che crea quei "real peak" tutti oltre gli 0 che si vedono nelle immagini. Dunque non si possono semplicemente incidere dei vinili partendo da un file digitale masterizzato come su cd (anche se di alta qualità), e in generale tutto il processo di registrazione dev'essere mirato per rendere bene su vinile, cercando di rispettare le dinamiche di tutti gli strumenti sia in registrazione che in fase di mix. Se vuoi approfondire puoi innanzitutto leggere l'articolo "I Supporti Musicali", scritto dal nostro Giomaster circa 3 anni fa! Altrimenti cercando articoli che parlino di vinile e loudness war (che spesso sono mirati nello spiegare questo tipo di differenze nella produzione visto il ritorno in auge del vinile)!
Vitadathrasher
Lunedì 21 Dicembre 2015, 14.44.09
7
Il mastering per il vinile è certamente diverso da quello del CD, semplicemente perché sono supporti diversi ed ognuno ha le sue peculiarità: Ovvero una resa sulle varie frequenze in maniera diversa. Con il digitale, nella catena audio, è di fondamentale importanza il convertitore A/D: Ovvero la conversione da analogico in digitale. I Khz superiori a 44.1 contano il giusto, ciò che conta è il processamento della conversione.
Bassi
Lunedì 21 Dicembre 2015, 10.43.21
6
Sai qualcosa al riguardo dei vinili? c'è un processo di produzione separato dai cd? puoi indicarmi qualche documento buono per approfondire?
Room 101
Sabato 19 Dicembre 2015, 17.09.03
5
@Bassi: Sì se si parla di conversione da cd a mp3 (ad esempio) ci sono già chiaramente i campioni quantizzati e viene ridotto il numero di bit (anche se certi formati lossy subiscono pure un downsampling ancora sotto i 44.1KHz, oltre a disporre di un minor numero di bit per salvare le informazioni). Ma se vogliamo, molto più a monte, si ha a che fare con i "numeri" già nel momento in cui il segnale entra nella scheda audio dello studio di registrazione per essere convertito, anche se si possono usare talvolta frequenze di campionamento ben superiori ai 44.1 KHz, chiaro, poi ci sarà un downsampling per permettere al tutto di essere riversato su cd, qualche studio addirittura usa esportare master finali diversi già per gli mp3, evitando quindi il passaggio da cd.
Bassi
Sabato 19 Dicembre 2015, 14.08.11
4
Secondo me andrebbe spiegato un po' meglio questa cosa, non so quanto si possa capire altrimenti. Nel cd non c'è alcuna forma d'onda ma una serie di campioni quantizzati del segnale di partenza, ovvero dei numeri che rappresentano il più fedelmente possibile la canzone. Nel passaggio da wave a qualsiasi altra cosa, non si va a guardare la banda del segnale di partenza perchè si ha già a che fare con dei numeri. Più chè altro la conversione consiste nel ridurre il numero di bit usati per ogni campione in modo da ridurne la dimensione del file cercando di ridurre il meno possibile l'informazione del segnale di partenza, ovvero quello della musica (che già ha subito una perdita per entrare nel cd).
Ulvez
Sabato 19 Dicembre 2015, 12.11.18
3
altro articolo molto interessante. avendo delle basi di telecomunicazioni posso dire che i concetti sono molto semplificati ma c'è tutto quanto sia necessario sapere. complimenti
Third Eye
Sabato 19 Dicembre 2015, 10.35.51
2
W i files ape!!
Gokronikos
Sabato 19 Dicembre 2015, 10.06.52
1
W i files flac! Per me i migliori per media tra grandezza del file e qualità audio! Ottimo compromesso.
IMMAGINI
Clicca per ingrandire
Cosa stiamo realmente ascoltando?
ARTICOLI
18/12/2015
Articolo
COSA STIAMO REALMENTE ASCOLTANDO?
PARTE 2 - I formati lossy, cosa stiamo sacrificando?
18/12/2015
Articolo
COSA STIAMO REALMENTE ASCOLTANDO?
PARTE 1 - La psicoacustica e i mezzi di ascolto
 
 
[RSS Valido] Creative Commons License [CSS Valido]