Articolo - COSA STIAMO REALMENTE ASCOLTANDO? - PARTE 2 - I formati lossy, cosa stiamo sacrificando?

Il tuo link qui?

ARTICOLI INTERVISTE LIVE REPORTS Tutti

Piu' Letti Piu' Commentati

ULTIME USCITE ALBUM RISPOLVERATI AUTOPRODOTTI LOW GAIN Tutte

Piu' Lette Piu' Commentate

NOTIZIE

ARTICOLI

RECENSIONI

FORUM

CONCERTI

DISCHI IN USCITA

STAFF

CONTATTI

IN EVIDENZA

Album

Lords of Black
Mechanics of Predacity

Autoprodotti

King Gizzard and The Lizard Wizard
PetroDragonic Apocalypse

CERCA

ULTIMI COMMENTI

FORUM

:
SUPER Ð¡ASUAL DATING - AUTHENTIC MAIDENS

Tatore77:
FILM WESTERN

Galilee:
CIAO!!

ARTICOLI

LIVE REPORT
JUDAS PRIEST + SAXON + PHIL CAMPBELL AND THE BASTARD SONS

Dariomet: Stavolta me li sono persi ..ma conservo il meraviglioso ricordo del rock the Cas...

LIVE REPORT
JUDAS PRIEST + SAXON + PHIL CAMPBELL AND THE BASTARD SONS

Tino: Quella sugli imbecilli non la sapevo...

RECENSIONI

TESTAMENT
Demonic

DaveHC: Riascoltato oggi. Assieme a Low e ancor più the Gathering questo periodo dei tes...

LORDS OF BLACK
Mechanics of Predacity

paolo: Tony Hernando un chitarrista da cardiopalmo...

NOTIZIE

THE ALLMAN BROTHERS BAND
è scomparso Dickey Betts

Graziano: Un altra leggenda che se ne va. Uno dei simboli del Southern....

NEW HORIZON
presentano un nuovo singolo

AlinoSky: pezzone, alla faccia di chi dice che il power sia morto. Dalla svezia arriva sem...

DISCHI IN USCITA


20/04/24 COREY TAYLOR CMF2B… Or Not 2B


21/04/24 JETHRO TULL RökFlöte


22/04/24 FULL OF HELL Coagulated Bliss


26/04/24 DEICIDE Banished By Sin


26/04/24 BLACK TUSK The Way Forward


26/04/24 PARTY CANNON Injuries Are Inevitable


26/04/24 EXHUMATION Master`s Personae


26/04/24 SIX BY SIX Beyond Shadowland


26/04/24 STORMBORN Zenith


26/04/24 ACCEPT Humanoid

Lista Dischi in Uscita

CONCERTI


20/04/24 MONSTERS OF REZ ASSOCIAZIONE CULTURALE CASEIFICIO LA ROSA - POVIGLIO (RE)


20/04/24 INCHIUVATU + LAMENTU + AGGHIASTRU ALCHEMICA MUSIC CLUB, VIA DEI LAPIDARI 8/B - BOLOGNA


20/04/24 MARLENE KUNTZ TPO, VIA CAMILLO CASARINI 17/5 - BOLOGNA


20/04/24 GOATBURNER + ACROSS THE SWARM DEFRAG, VIA DELLE ISOLE CURZOLANE 75 - ROMA


20/04/24 LOGICAL TERROR + BREAK ME DOWN DEDOLOR MUSIC HEADQUARTER - ROVELLASCA (CO)


20/04/24 KARMA THE FACTORY, VIALE DEL LAVORO 7 - SAN MARTINO BUON ALBERGO (VR)


20/04/24 THE OSSUARY CENTRO STORICO, VIA VITTORIO VENETO - LEVERANO (LE)


20/04/24 DIOCLETIAN + WHISKEY RITUAL + NECROMORBID + NECROBLASPHEMER + Guests SLAUGHTER CLUB, VIA A.TAGLIABUE 4 - PADERNO DUGNANO (MI)


20/04/24 ROSSOMETILE + MOSTRA ANNALILLA XXXV LIVE, VIA GUERRITORE 35/37 - CAVA DE\' TIRRENI (SA)


20/04/24 NOBRAINO VOX CLUB, VIA VITTORIO VENETO 13 - NONANTOLA (MO)

Lista Concerti

COSA STIAMO REALMENTE ASCOLTANDO? - PARTE 2 - I formati lossy, cosa stiamo sacrificando?
18/12/2015 (2094 letture)

Nel corso della prima parte di questo articolo abbiamo approfondito i principi della psicoacustica, i limiti dei sensi umani e parlato dei mezzi e dei metodi di ascolto migliori per fruire al meglio della musica, cercando così il modo migliore per avvicinarci il più possibile alle idee che i nostri artisti preferiti concepiscono. Abbiamo interrotto la spiegazione poco prima di iniziare ad approfondire il vasto mondo dei formati lossy, prima di riflettere su quanto il loro design influenzi la nostra esperienza di ascoltatori. Ora è arrivato il momento di addentrarci più a fondo in questo territorio. Che cos'è un formato lossy? Si tratta di una definizione piuttosto comune che raccoglie tutte quelle estensioni, già citate in precedenza, che privilegiano un basso contenuto di informazioni (dunque un basso bit-rate ottenuto con frequenze di campionamento inferiori e minor numero di bit) per salvare spazio sul vostro hard-disk e contemporaneamente cercare di restituire una qualità accettabile (sfruttando i principi di psicoacustica descritti nella prima parte dell'articolo). Cosa succede quando un file .wave proveniente da un cd viene codificato in un formato lossy? Cercando di semplificare per non entrare troppo nel tecnico: essenzialmente, la forma d'onda viene divisa in una serie di bande e sottobande che delimitano fasce di frequenze precise, ognuna di queste bande viene poi analizzata secondo dei parametri diversi per ogni formato (ispirati ai principi psicoacustici analizzati nell'episodio precedente), questo processo determina quale sia il margine di udibilità in ogni fascia di frequenze. Tutto quello che dall'algoritmo viene considerato al di sopra del margine viene salvato. Tuttavia, ciò avviene in base ai bit a disposizione del formato, che potrebbero essere inferiori ai 16 di partenza e quindi, qualora il bit-rate prefissato nella conversione fosse troppo basso, l'algoritmo taglierebbe anche parti considerate udibili, mentre ovviamente tutto quello che già si trovava sotto la soglia di udibilità verrebbe chiaramente ignorato e dunque non salvato a prescindere. Tutto questo a cosa porta nei fatti? La lista di inconvenienti è lunga, ma tra i più importanti troviamo: 1. Perdite considerevoli di frequenze, concentrate soprattutto nella parte alta dello spettro, che potrebbero eliminare parti in realtà udibili. 2. Creazione di effetti eco artefatti in corrispondenza dei picchi più energici. 3. Perdite di dinamica che appiattiscono il suono in maniera irreparabile. 4. Generale perdita di sfumature timbriche e di dettagli che a volte alterano decisamente il mix. 5. Perdita di solidità e potenza dei bassi. 6. Problemi diffusi nella fase dovuti all'annullamento arbitrario di certe parti dell'immagine stereo, che portano ad una certa confusione e a piccoli episodi di contro-fase, che possono annullare in determinati momenti alcune frequenze che altrimenti sarebbero risultate udibili. Piccolo approfondimento: quando parliamo di fase/controfase -semplificando davvero moltissimo- ci riferiamo al fatto che ogni segnale (ad esempio una nota) ha una fase che è relativa alla durata del segnale stesso, quindi, andando a sovrapporre due segnali uguali emessi in momenti diversi, si può verificare talvolta un annullamento totale di entrambi. All'interno di una fonte sonora complessa come una canzone possono talvolta capitare piccoli episodi simili, ma è compito dell'ingegnere che si occupa del mix limitarli al minimo con strumenti appositi, lavoro che appunto può venire vanificato -in modo incontrollabile ed imprevedibile- durante una conversione verso un file lossy. 7. Creazione -in certi casi- di rumori artefatti in zone casuali dello spettro. Appare chiaro come si tratti di problematiche in grado di pregiudicare parecchio l'ascolto di un disco. Dunque, quando stiamo ascoltando un file lossy, dobbiamo chiaramente sapere quali possono essere le differenze rispetto all'originale .wave del cd. Di fronte ad una così lunga serie di problematiche diventa anche più interessante (in negativo) notare come moltissimi gruppi vengano proposti o propongano a critici e giornalisti album in formati lossy, soprattutto considerando quanto questa scelta possa pregiudicare la valutazione, non solo sulla produzione, ma anche sull'arrangiamento, visto che potrebbero venire eliminate parti molto importanti. C'è da dire che non tutti i file lossy sono uguali, dunque eccovi una panoramica dei più comuni. Per rendere la spiegazione più intuitiva ho deciso di estrapolare una canzone a caso da un cd che ritenevo ben prodotto (non che abbia importanza ai fini dell'analisi, ma per chi fosse curioso si tratta di Sapari, da The Neverending Way of Orwarrior degli Orphaned Land) e l'ho poi esportata in una serie di formati lossy, analizzando alcuni importanti parametri audio da mostrarvi. Chiaramente, al di là di queste analisi più tecniche ciò che conta è l'orecchio di chi ascolta, ma vi posso assicurare che via via che i file si facevano più “tagliati” la qualità percepita si è abbassata in modo notevole. Iniziamo dal file .wave (la qualità che troviamo sul cd) che ci servirà da pietra di paragone per tutti gli altri. Il file pesa oltre 61 MB e in pratica occupa da solo uno spazio sufficiente ad ospitare -mediamente- un intero album in mp3. Nella prima immagine (contrassegnata dal numero 1) sono presenti i suoi dati, evidenziati da degli indicatori rossi. In alto a sinistra, si possono notare i picchi massimi della forma d'onda, ovvero l'immagine che si è creata alla fine della riproduzione della canzone. Come è possibile osservare, non ci sono cali verticali del segnale, segno che le frequenze ci sono tutte, nonostante siano state smorzate in fase di mix e mastering le sub basse e le altissime per venire incontro agli impianti commerciali di ascolto, ma quello che vedete è esattamente quello che il produttore (Steven Wilson) intendeva farvi sentire. In seguito, è presente una rappresentazione grafica dei i picchi massimi dell'immagine stereo (destra e sinistra) divisa tra suoni in fase (in blu) e in controfase (rosso): si può constatare con facilità come le due aree siano ben distinte. Chiaramente c'è qualcosa in controfase ma è assolutamente normale visto che è impossibile -specie in una registrazione così densa- che nessuna frequenza si annulli, pur prestando tutta l'attenzione possibile. A destra, in alto, sono presenti i picchi del segnale espressi in real peak. Come alcuni di voi probabilmente sapranno, il massimo livello (in db) raggiungibile nel dominio digitale è 0, ma questo non vuol dire che però i segnali non possano superarlo, anche se ovviamente in caso di superamento tutto quello che eccederà lo 0 verrà brutalmente compresso, creando problemi alla dinamica e/o svariate distorsioni. In questo caso il mastering ha spinto parecchio i segnali (sia a destra che a sinistra), ma il picco massimo registrato durante tutta la riproduzione della traccia è essenzialmente 0 (tranne che quel leggero +0,1 sulla sinistra). L'ultimo valore che ci interessa è la lufs integrata. La lufs è la nuova unità standard di misura della loudness (rumorosità) di un suono e quella integrata è la lufs media calcolata dall'inizio alla fine della riproduzione della traccia. Più è alta più “rumorosa” suonerà la traccia. Senza voler divagare parlandovi della loudness war, sappiate che una lufs integrata di -7,4 è per gli standard della musica in generale piuttosto alta (per un pezzo in cui tutte le dinamiche sono state pienamente rispettate difficilmente dovrebbe eccedere i -11 o -12). D'altro canto risulta però relativamente bassa quando si considera solo la musica metal (dove si può facilmente arrivare a -4). Ciò considerato, e tenendo a mente il real peak prossimo allo 0 di cui parlavo prima, siamo quindi di fronte ad una registrazione piuttosto pompata che però -pur nel suo suonare possente- ha mantenuto un buon rispetto delle dinamiche. Cosa succede però quando analizziamo in questo modo la stessa canzone esportata in un formato lossy? La seconda immagine vi mostra l'analisi della stessa canzone esportata in Ogg Vorbis, algoritmo di compressione audio libero non molto diffuso, ma con i suoi pregi. Il file ora pesa appena 4,4 MB e infatti all'ascolto suona decisamente più scarno rispetto al .wave. Come è possibile osservare, inizia ad esserci un taglio più verticale delle altissime frequenze (per quanto non drammatico) e la fase presenta qualche piccola modifica, ma appare ancora molto ordinata. Giungendo però ai picchi del segnale, si può notare come questa volta si spingano fino a + 0,5 e + 0,3 db, segno che le dinamiche sono state intaccate da una maggiore compressione, mentre il livello di loudness è sostanzialmente invariato. La terza immagine invece è riferita ad un file Wma (il formato con cui salva le vostre canzoni il noto software Windows Media Player). Il peso è di 3,7 MB, il suono anche qui decisamente scarno (è quasi inutile che lo segnali). Il taglio delle altissime frequenze inizia ad essere molto più evidente (diventa quasi verticale appena oltre i 16 kHz), così come la fase inizia ad essere molto più alterata e confusa (guardate la differenza nella forma rispetto alle immagini precedenti). I real peak sono ancora più alti rispetto all'Ogg Vorbis, segno di una degenerazione delle dinamiche ancora più accentuata, mentre la loudness complessiva anche qui è sostanzialmente invariata. La quarta immagine è quella di un mp3 (il più comune formato lossy) con un bit rate di 320 kbps. Il file pesa 9,3 MB e rappresenta forse il miglior formato di file lossy che possiate trovare (insieme all'Ogg Vorbis che ‘salva’ maggiormente frequenze e fase, ma rovina più le dinamiche). Il taglio delle frequenze è anche qui molto accentuato, la fase migliore rispetto Wma, ma comunque più confusa e -a sostanziale parità di loudness- la dinamica appare molto meno intaccata rispetto ai formati precedenti. Per non tediarvi troppo, dal momento che avete ora gli strumenti adatti per leggere le restanti immagini (riferite a file mp3 con bit rate sempre più bassi) vi darò solo le informazioni più importanti: La quinta immagine è riferita ad un mp3 con un bit rate di 256 kbps e un peso di 7,4 MB. La sesta immagine è riferita ad un mp3 con un bit rate di 128 kbps e un peso di 3,7 MB. La settima immagine è riferita ad un mp3 con un bit rate di 90 kbps e un peso di 2,6 MB. L'ottava immagine è riferita ad un mp3 con un bit rate di 16 kbps e un peso di 476 kB. Come potrete notare ci sarà una costante diminuzione delle frequenze alte, così come delle variazioni nella fase estremamente instabili, delle grandi differenze altalenanti nel real peak (che però considerando la quantità di frequenze tagliate a questi livelli diventa un indicatore sostanzialmente inutile) e sempre una sostanziale parità di loudness. 128 kbps è l'ultimo bit rate commercialmente utilizzato. I casi più bassi sono molto più rari e vi posso garantire che ascoltare mp3 a 90 o 16 kbps è veramente qualcosa di pittoresco. L'analisi con questi strumenti diventa praticamente inutile perché al di là dei meri numeri e dei grafici, quello che lo nostre orecchie sentono è niente meno che un'imitazione grottesca del pezzo originale. Siamo dunque giunti alla fine della nostra lunga panoramica, spero abbia soddisfatto la vostra curiosità, potete consultare le fonti qualora voleste leggere qualcosa di più tecnico ed accurato. Dal canto mio spero di non aver semplificato troppo la materia, ma tengo a precisare che chi scrive è un appassionato dell'argomento e non un fonico abilitato, per cui se aveste ulteriori segnalazioni, appunti o aggiunte siete caldamente invitati a discuterne nei commenti per condividere con tutti la vostra esperienza. Fonti principali: http://www.maurouberti.it/psicoacustica/psicoacustica.html http://www.soundonsound.com/sos/apr12/articles/lost-in-translation.htm http://www.gennarovespoli.it/transitori_di_attacco_e_di_estinzione.htm http://www.elemania.altervista.org/adda/campionamento/shannon.html Discutine con noi sul FORUM

Gianluca Leone "Room 101"

Commenta

	Masterburner	Mercoledì 23 Dicembre 2015, 10.35.01		11
Dovrebbe essere 1Volt rms

	Ulvez	Mercoledì 23 Dicembre 2015, 9.56.35		10
@Masterburner mi pare di ricordare che esista un riferimento standard sia per tensione che per potenza, che corrisponde alla soglia minima (convenzionale) di udibiltà. non ti so dire quale sia, ma presumo sia lo stesso per tutti gli apparecchi audio.

	Masterburner	Mercoledì 23 Dicembre 2015, 9.23.55		9
Una curiosità: visto che i dB sono il logaritmo del rapporto tra due potenze o due tensioni (0 dB indica che le due potenze o tensioni sono uguali), quale è il riferimento sul quale si basa la misura? è uguale per tutte le apparecchiature audio?

	Room 101	Martedì 22 Dicembre 2015, 18.07.35		8
@Bassi: I vinili sono un argomento piuttosto interessante, perché per loro costituzione (ovvero un'entità fisica su cui è riprodotto il suono analogico) devono necessariamente avere un processo separato. Rispetto ai file che ho presentato in questo articolo (.wave compresi) il suono di un vinile non può per costituzione del supporto eccedere gli 0 db, non è possibile con i vinili fare come per i file digitali che vengono pompati e poi semplicemente trattati con un limiter a 0 db (cosa che ammazza le dinamiche) e che crea quei "real peak" tutti oltre gli 0 che si vedono nelle immagini. Dunque non si possono semplicemente incidere dei vinili partendo da un file digitale masterizzato come su cd (anche se di alta qualità), e in generale tutto il processo di registrazione dev'essere mirato per rendere bene su vinile, cercando di rispettare le dinamiche di tutti gli strumenti sia in registrazione che in fase di mix. Se vuoi approfondire puoi innanzitutto leggere l'articolo "I Supporti Musicali", scritto dal nostro Giomaster circa 3 anni fa! Altrimenti cercando articoli che parlino di vinile e loudness war (che spesso sono mirati nello spiegare questo tipo di differenze nella produzione visto il ritorno in auge del vinile)!

	Vitadathrasher	Lunedì 21 Dicembre 2015, 14.44.09		7
Il mastering per il vinile è certamente diverso da quello del CD, semplicemente perché sono supporti diversi ed ognuno ha le sue peculiarità: Ovvero una resa sulle varie frequenze in maniera diversa. Con il digitale, nella catena audio, è di fondamentale importanza il convertitore A/D: Ovvero la conversione da analogico in digitale. I Khz superiori a 44.1 contano il giusto, ciò che conta è il processamento della conversione.

	Bassi	Lunedì 21 Dicembre 2015, 10.43.21		6
Sai qualcosa al riguardo dei vinili? c'è un processo di produzione separato dai cd? puoi indicarmi qualche documento buono per approfondire?

	Room 101	Sabato 19 Dicembre 2015, 17.09.03		5
@Bassi: Sì se si parla di conversione da cd a mp3 (ad esempio) ci sono già chiaramente i campioni quantizzati e viene ridotto il numero di bit (anche se certi formati lossy subiscono pure un downsampling ancora sotto i 44.1KHz, oltre a disporre di un minor numero di bit per salvare le informazioni). Ma se vogliamo, molto più a monte, si ha a che fare con i "numeri" già nel momento in cui il segnale entra nella scheda audio dello studio di registrazione per essere convertito, anche se si possono usare talvolta frequenze di campionamento ben superiori ai 44.1 KHz, chiaro, poi ci sarà un downsampling per permettere al tutto di essere riversato su cd, qualche studio addirittura usa esportare master finali diversi già per gli mp3, evitando quindi il passaggio da cd.

	Bassi	Sabato 19 Dicembre 2015, 14.08.11		4
Secondo me andrebbe spiegato un po' meglio questa cosa, non so quanto si possa capire altrimenti. Nel cd non c'è alcuna forma d'onda ma una serie di campioni quantizzati del segnale di partenza, ovvero dei numeri che rappresentano il più fedelmente possibile la canzone. Nel passaggio da wave a qualsiasi altra cosa, non si va a guardare la banda del segnale di partenza perchè si ha già a che fare con dei numeri. Più chè altro la conversione consiste nel ridurre il numero di bit usati per ogni campione in modo da ridurne la dimensione del file cercando di ridurre il meno possibile l'informazione del segnale di partenza, ovvero quello della musica (che già ha subito una perdita per entrare nel cd).

	Ulvez	Sabato 19 Dicembre 2015, 12.11.18		3
altro articolo molto interessante. avendo delle basi di telecomunicazioni posso dire che i concetti sono molto semplificati ma c'è tutto quanto sia necessario sapere. complimenti