Su richiesta di numerosi lettori, pubblichiamo un resoconto dell’interessante intervento alla convention DAB in Franciacorta (Bs) di sabato 21/01/2023 curato da Alessandro Tomassini di ITEL a riguardo della gestione della catena audio della radiodiffusione sonora in tecnica digitale.
I consigli: allo stato attuale, nonostante i “miracoli” fatti dai codificatori audio, rimane un “collo di bottiglia” nella qualità della catena audio.
Occorre alimentare la catena audio con sorgenti della miglior qualità possibile, evitando di inserire nell’archivio della radio files già compressi.
No a processo audio aggressivo: è del tutto inutile continuare la cosiddetta loudness war anche in DAB+.
E’ preferibile installare l’encoder DAB+ presso l’emittente piuttosto che inviare un flusso streaming verso il multiplexer per poi farsi codificare in loco.
La convention sul DAB
Da lunedì scorso, dopo la pubblicazione del resoconto dell’evento del 21/01/2023, è stato un susseguirsi di richieste di approfondimento a riguardo degli interventi dei numerosi relatori presenti alla convention organizzata dai consorzi Mediadab, Spacedab, Godab in collaborazione con Consultmedia, 22HBG, ITEL, GatesAir.
Alessandro Tomassini
In particolare, l’intervento sull’audio curato da Alessandro Tomassini di ITEL, ha destato molto interesse, sicché abbiamo deciso, con la sua collaborazione, di realizzare un approfondimento testuale.
I temi
Dall’ingresso audio all’uscita nel multiplexer: come funziona e perché è necessaria la codifica AAC+, come calcolare le CU di un canale DAB+, qualche consiglio su come mantenere la qualità nella catena audio.
Cenni sul campionamento
La conversione di un qualsiasi segnale analogico in digitale passa attraverso il processo di “campionamento”, attraverso il quale, ad intervalli regolari, ne viene estrapolato il valore.
Il teorema di Nyquist dice che possiamo avere una ricostruzione matematicamente corretta del segnale analizzato nel momento in cui quest’ultimo venga campionato un numero di volte pari ad almeno il doppio della massima frequenza che contiene.
Nel caso di un CD audio la frequenza di campionamento utilizzata è di 44100Hz, che permette di rappresentare correttamente una banda di 44100 / 2 = 22050Hz, ma al prezzo di avere un flusso di dati pari a:
44100 (campioni al secondo) x 2 (canali) x 16 (bit per canale) = 1,4112 Megabits/secondo
Considerando che la capacità totale di un sistema DAB+ è di circa 1,5Mb/s, il trasmettere un segnale audio che possa essere ricostruito in maniera matematicamente corretta, occuperebbe praticamente la totalità della capacità del sistema per un singolo programma!
La psicoacustica, oltre il rigore matematico
Per comprimere efficacemente l’audio, va abbandonato il concetto di ricostruzione matematicamente corretta ed adottato un sistema che sia stato studiato appositamente per le caratteristiche della destinazione: l’orecchio umano.
Spunti
La psicoacustica, la scienza che studia come il suono venga percepito, ha dato interessanti spunti a tal fine:
-l’orecchio è meno sensibile alle frequenze acute, pertanto queste si possono riprodurre in maniera più approssimativa.
-alcuni suoni possono, in alcune circostanze essere “mascherati” da altri, quindi possono essere eliminati senza che questo venga notato.
Considerando questi aspetti, il codificatore prevede al suo interno un cosiddetto modello psicoacustico, componente che in seguito deciderà cosa venga percepito, cosa no, cosa debba essere riprodotto fedelmente, cosa possa essere riprodotto grossolanamente.
La “codifica percettiva” o “con perdita”
Nella codifica percettiva, quindi, il segnale da comprimere viene tradotto nel suo spettro, confrontato col modello psicoacustico, e, in base alla risposta di questo, compresso nel risultato finale.
Si è quindi superato il concetto di ricostruzione “matematicamente corretta” di Nyquist, giungendo alla ricostruzione “percettivamente corretta”, dove i dati prodotti possono essere sensibilmente ridotti, pur cercando di mantenere la stessa fedeltà iniziale.
La codifica AAC
La codifica AAC già permetteva una miglior qualità audio, a parità di bitrate, se confrontata al formato MP3.
Viene definita AAC LC, dove LC sta per Low Complexity.
SBR (HE-AAC v1 o AAC+)
Alla codifica AAC, nella successiva versione 1, si è aggiunto il sistema Spectral Band Replication (o SBR) che permette un’ulteriore riduzione dei dati.
Il sistema SBR codifica accuratamente una sola parte di banda; della parte superiore viene preso l’inviluppo (la “forma” dello spettro in quella banda), ne viene calcolata l’energia e queste informazioni vengono inviate al decodificatore.
Banda inferiore e superiore
All’atto della decodifica, il segnale viene ricostruito, nella banda inferiore, utilizzando la maggior parte dell’informazione codificata in precedenza, mentre nella banda superiore esso viene ricostruito leggendo le informazioni SBR inviate.
PS (HE-AAC-v2)
La successiva implementazione della codifica AAC+ v2, introduce il sistema “Parametric Stereo” (PS) che utilizza la maggior parte della banda in uscita per codificare il canale mono, mentre utilizza solo 2/3 Kbps per codificare la differenza fra i canali.
Il “PS” è utile solo nel caso in cui si desideri trasmettere un segnale a bassi bitrates, sotto ai 48Kbps.
Le “CU” (Capacity Units)
Una volta codificato in AAC+, il segnale viene inviato al multiplexer (il quale assembla tutti i canali in un unico flusso) che, per specifica, ha una capacità massima di 864 CU.
Occupazione
L’occupazione in CU di ogni singola emittente dipende dal bitrate audio con cui trasmette e dal livello di protezione assegnato a questa.
Livello di protezione EEP3-A
Il livello di protezione EEP3-A è il livello normalmente usato e quello che rappresenta il miglior compromesso fra CU occupate e il risultato in termini di copertura di area di servizio.
Calcolo
Il calcolo delle CU, partendo dal rapporto di protezione scelto ed il bitrate del canale audio è semplice: CU = (BitRate / 8) * N. Dove N è il valore indicato in tabella.
Esempi
Qualche esempio di configurazione mux, supponendo che tutti i canali utilizzino il medesimo bitrate:
Considerazioni finali e qualche consiglio
Allo stato attuale, nonostante i “miracoli” fatti dai codificatori audio, rimane comunque un “collo di bottiglia” nella qualità della catena audio, pertanto bisogna alimentare la catena audio con sorgenti della miglior qualità possibile, evitando di inserire nell’archivio della radio files già compressi.
Stop War
Un ulteriore degrado della qualità è dovuto al processore audio, specie se utilizzato in maniera “aggressiva”: se in FM spesso questo era voluto per aumentare il rapporto S/N del canale analogico, per chi scrive, è del tutto inutile continuare la cosiddetta “loudness war” anche in DAB+.
100dB
In DAB+ si hanno più di 100dB di S/N in ogni condizione di ricezione, pertanto è opportuno privilegiare la qualità ed utilizzare appieno le potenzialità del canale digitale.
Encoder
Infine, è preferibile installare l’encoder DAB+ presso la sede dell’ emittente piuttosto che inviare un flusso streaming al multiplexer per poi farsi codificare in loco. Se non fosse possibile installare fisicamente un encoder, la soluzione potrebbe essere uno stream dedicato ad alta qualità (es: MP3 320Kbps) o, se la banda lo consentisse, anche non compresso. (M.R. per NL)