Loudness e sua normalizzazione

Misuratore di Loudness

di Marco Sacco / Logo Facebook Marco Suono

In questa sezione approfondiamo alcuni aspetti relativi alla misura e alla percezione dell'ampiezza del suono.

La questione è meno evidente di quanto si possa pensare poiché quando si misura il suono bisogna sempre contestualizzare la finalità della misura stessa. Se da un lato infatti il suono esiste come fenomeno fisico e in quanto tale ha ben precise caratteristiche (fisiche, appunto), dall'altro ciò che noi esseri umani percepiamo del suono è una nostra versione alterata rispetto alla realtà (già il fatto di poter ascoltare solamente il range di frequenze compreso tra 20Hz e 20KHz conferma la soggettività della nostra percezione). All'origine di questa alterazione vi è la peculiare conformazione del nostro apparato uditivo (formato da orecchio esterno, medio e interno [vedi: orecchio umano] oltre che gli innumerevoli meccanismi di decodifica del suono messi in atto dal cervello), e dunque una misura relativa alla nostra percezione del suono deve tenere conto di questi aspetti.

Riassumendo, possiamo indentificare misure oggettive del suono (con finalità sia di test che operative) e misure soggettive del suono (ad esempio se dobbiamo stimare l'intensità sonora percepita da parte di un'ascoltatore).

Focalizziamo ora la nostra attenzione sulla misura dell'ampiezza del segnale audio (analogico o digitale che sia) che, come si è visto in altre sezioni [vedi: ampiezza], può essere di tipi diversi. La grandezza oggettiva che più si avvicina alla percezione soggettiva della pressione sonora è l'ampiezza rms, che indica la media quadratica dell'ampiezza del segnale in una data finestra temporale. L'ampiezza di picco è rappresentata da tutti i valori massimi che il segnale audio assume di momento in momento (nei segnali periodici è pari allo scostamento massimo dalla posizione di equilibrio) e non è indicativa più di tanto della pressione sonora percepita.

A titolo esemplificativo riportiamo qui di seguito i valori di picco e rms delle principali forme d'onda periodiche:

Forma d’onda

Valore di picco

Valore RMS

Tensione continua

A

A

Sinusoidale

A

valore RMS onda sinusoidale

Triangolare

A

valore RMS onda triangolare

Dente di sega

A

valore RMS onda dente di sega

Quadra (duty cycle 50%)

A

A

Tabella 1. Valori di ampiezza di picco e rms delle principali forme d'onda periodiche

Dalla tabella si può evincere ad esempio che a parità di ampiezza dell'onda prodotta, l'intensità percepita sarà maggiore nel caso dell'onda quadra rispetto ad esempio di quella a dente di sega.

In diversi contesti tuttavia, l'ampiezza rms non è ancora sufficientemente rappresentativa della percezione della pressione sonora. Tale percezione infatti dipende fortemente dal comportamento non costante dell'orecchio a seconda del tipo di suono percepito (che varia per ampiezza, frequenza, composizione armonica ecc). Dunque, se il livello rms definisce l'ampiezza media del segnale audio, definiamo con il termine loudness (dall'inglese loud=forte) la percezione soggettiva umana di questa ampiezza media, ossia una misura media che tenga anche conto anche delle caratteristiche fisiologiche del nostro apparato uditivo.

Programmi sonori diversi avranno verosimilmente valori di ampiezza rms diversi e anche loudness diverse, dunque se venissero riprodotti in sequenza, l'ascoltatore dovrebbe continuamente ricalibrare il volume del suono per livellare gli sbalzi della loudness (ampiezza percepita). Inoltre, per un curioso effetto psicoacustico, il nostro orecchio percepisce i suoni più forti come "più belli". Dunque, in una sequenza di programmi sonori diversi, quelli con livello minore verrebbero percepiti (dall'orecchio e dal cervello) come meno accattivanti degli altri.

In ambito musicale, tutto ciò ha portato negli ultimi 20 anni al fenomeno della Loudness war. In questa "guerra", l'obiettivo è stato prevalentemente quello di far suonare il proprio brano più forte degli altri, cosicché in una eventuale sequenza (oggi si chiama playlist) non avrebbe sfigurato e anzi avrebbe attirato maggiormente l'attenzione dell'ascoltatore.

Dato che i sistemi audio (sia analogici che digitali) hanno una soglia massima che non può essere superata, l'operazione principale per aumentare la loudness è stata quella di aumentare il livello rms del brano, lasciando inalterato quello di picco. La conseguenza è stata una a volte eccessiva diminuzione della dinamica complessiva [vedi: dynamic range] che, essendo un importante elemento espressivo, ha spesso (non sempre) causato un impoverimento della qualità sonora.

In questo scenario entra in gioco il termine normalizzazione della loudness che indica una uniformazione del volume percepito di tutti i diversi programmi sonori riprodotti in successione. Dunque l'obiettivo è di regolare automaticamente in fase di riproduzione il livello di loudness di programmi sonori diversi in modo da evitare sbalzi di volume percepito tra un programma e l'altro (o anche cambiando da un fornitore di contenuti all'altro: canali TV, radio, streaming audio su Internet).

Per rispondere a queste necessità sono state dunque introdotte nuove misure del livello sonoro che estendono il concetto di livello rms includendo anche l'aspetto psicoacustico. Vediamo quali sono.

L'organismo ITU (International Telecommunication Union) ha definito un'unità di misura della loudness, in particolare in ambito broadcast (trasmissioni radio/televisive), che cerca di risolvere le incongruità appena descritte. L'obiettivo pratico era quello di evitare che la loudness degli inserti pubblicitari fosse più alta dei normali contenuti delle trasmissioni (aspetto che viene puntualmente disatteso dai produttori di spot che volutamente alzano il livello dei loro contenuti pubblicitari rispetto ai valori indicati dagli standard per farli risaltare maggiormente, ma questo è un altro discorso).

Tale misura è denominata LKFS, Loudness, K-weighted, relative to Full Scale, ossia una misura della loudness mediata nel tempo che tiene traccia al suo interno dei diversi momenti di loudness del programma sonoro e ne calcola una media che risulta confrontabile con quella di un altro materiale sonoro.

La misura è effettuata in ambito digitale, dunque ci si riferisce alla scala dei decibel Full Scale [vedi: dinamica digitale], ed è effettuata applicando una curva di pesatura di tipo "K" (analoga alle diverse curve di pesatura dei fonometri [vedi: misuratori di dBspl]). Dunque il materiale sonoro, prima viene filtrato applicando la seguente curva (e altri processi) e poi viene misurato con un apposito algoritmo descritto nei documenti ufficiali[1].

curva di pesatura K
Fig 1. K-Weighting Curve

Le misure di loudness ricavabili in questo modo sono diverse, a seconda della durata della misurazione:

  • Momentary loudness: calcola il valore della loudness su un intervallo di 400ms dando una lettura simile a quella del VU meter [vedi: VU Meters].
  • Short term loudness: la loudness sul breve periodo (intervallo di 3 secondi).
  • Integrated loudness: la loudness mediata sul lungo termine, che tiene conto dell'intero programma sonoro.
  • LRA Loudness RAnge : misura statistica della dinamica sull'intero programma.

Esistono sul mercato molti misuratori dei valori ora descritti. La figura seguente ne riporta uno gratuito della casa di produzione Melda:

MLoudnessAnalyzer plugin by Melda
Figura 2. MLoudnessAnalyzer plugin by Melda

In ambito broadcast, i valori di riferimento ai quali tutti i programmi sonori si devono conformare sono definiti nella direttiva europea R128[2] definita dall'organismo europeo EBU (European Broadcasting Union) la cui prima versione risale al 2011. In essa si parla in termini di LUFS (Loudness Unit Full Scale) introducendo la grandezza Loudness Unit (LU) in analogia con quanto previsto nelle scale di misurazione analogiche espresse in Volume Units e misurate dai VU Meters.

Nella direttiva R128, la misura standard delle trasmissioni televisive europee di lunga durata è la Integrated loudness e il suo valore deve attestarsi su -23dB LUFS (+/- 0.5dB) (per completezza aggiungiamo che il valore massimo di picco consentito è di -1dB True Peak/dBTP). Nelle trasmissioni di breve durata la misura da utilizzare è la Short Term Loudness e il valore di riferimento è -18dBfs[3].

Riprendendo dunque l'analogia con le scale analogiche espresse in Volume Units, possiamo dire che come in quelle lo 0VU (Volume Units) corrisponde allo Standard Operating Level [vedi: Standard Operating Level] (ad esempio +4dBu, che è il valore di segnale elettrico consigliato per le macchine analogiche) così il valore consigliato per l'ambito broadcast digitale è pari allo 0LU (Loudness Units) che corrisponde al valore di -23LUFS. Si noti che in ambito broadcast statunitense, lo standard utilizzato è denominato A/85[4] (definito dall'ente ATSC, Advanced Television Systems Committee) e prevede un livello consigliato pari a -24LKFS[5] , dunque in questo caso, lo 0LU corrisponde a -24LKFS (per completezza aggiungiamo che il valore massimo di picco consentito in questo caso è di -2dB True Peak).

Negli ultimi anni, complice anche il proliferare delle piattaforme di distribuzione di musica digitale su Internet (iTunes, Spotify, Tidal ecc) che permettono di aggregare sequenze di brani in base ai più svariati criteri, è nata l'esigenza di una normalizzazione della loudness anche in ambito musicale, in modo che una successione di brani diversi offra all'ascoltatore una loudness percepita costante da un brano all'altro.

Oggi dunque anche le maggiori piattaforme di streaming musicale online vanno verso una uniformazione della normalizzazione della loudness, anche se non esiste ancora uno standard ufficiale al quale tutti devono fare riferimento. Attualmente la situazione è la seguente:

Piattaforma di Streaming Livello di riproduzione
Apple Music -16 LUFS
YouTube -14 LUFS
Spotify -14 LUFS
Tidal -14 LUFS

Tabella 2. Valori LUFS standard aggiornati a Maggio 2017

Fissato dunque un valore standard per la LUFS di riferimento (prendiamo ad esempio -14dB della piattaforma Spotify), se un brano musicale avesse una loudness maggiore, ad esempio -8dB LUFS, prima di essere trasmesso verrebbe attenuato di 6dB. Diversamente, un brano di musica classica con una LUFS più bassa prossima al valore di riferimento non verrebbe attenuato.

Descriviamo la questione con un esempio:

Loudness non normalizzata
Figura 3. Livelli indicativi di diversi generi musicali in assenza di normalizzazione della loudness

L'immagine precedente illustra i dynamic range medi di diversi generi musicali negli ultimi decenni. Come si vede sono molto diversi e la loro riproduzione in sequenza restituirebbe livelli di loudness a favore dei dynamic range più bassi (il valore di picco è sempre portato al massimo possibile, ossia 0dBfs o -1dBfs a seconda degli standard) e dunque per aumentare il livello rms (che spesso ha come conseguenza un aumento della loudness) diminuisce il dynamic range. Nella figura sono anche indicati degli ipotetici valori per la Integrated Loudness di ognuno dei tre brani.

Con la normalizzazione della loudness, ad esempio sul valore di -14LUFS i livelli di riproduzione dei tre brani in un'unica sequenza sarebbero quelli descritti nella figura seguente:

Loudness normalizzata
Figura 4. Livelli indicativi di diversi generi musicali dopo la normalizzazione della loudness

Come si vede in questo caso, un eventuale brano che fosse stato vittima della loudness war (il primo: pop degli anni 2010) verrebbe riprodotto con un livello inferiore in quanto il suo valore di integrated LUFS risulterebbe molto più alto degli alti due brani. In particolare, da un livello di loudness pari a -8dBfs passerebbe a -23dBfs, perdendo ben 15dB, mentre il brano di musica classica da un livello di loudness pari a -20dBfs passerebbe a -3dBfs perdendo solo 3dB.

La normalizzazione della loudness musicale forse pone definitivamente fine all'era della loudness war restituendo alla musica la sua espressività dinamica che non è più messa in pericolo dalla necessità di massimizzare la loudness a tutti i costi.


NOTE
[NOTA 1]
Documento ITU 1770 www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1770-4-201510-I!!PDF-E.pdf
Documento EBU tech 3343 tech.ebu.ch/docs/tech/tech3343.pdf

[NOTA 2]
Documento EBU R128 tech.ebu.ch/docs/r/r128.pdf

[NOTA 3]
Documento EBU R128s tech.ebu.ch/docs/r/r128s1.pdf

[NOTA 4]
Documento ATSC A/85 www.atsc.org/wp-content/uploads/2015/03/Techniques-for-establishing-and-maintaining-audio-loudness.pdf

[NOTA 5]
Alcuni standard (es: R128) fanno riferimento ai LUFS, altri (es: ATSC A/85) fanno riferimento ai LKFS ma le due grandezze sono equivalenti e indicano la stessa cosa: la loudness su una scala digitale.