Abbiamo partecipato ad un test con MeWay, la tech company di Francesco Triolo che offre servizi di sintesi vocale controllata per impieghi audio/video (radio tv, audio on demand).
Alcune ore di registrazione con varie tonalità di un redattore di NL ne hanno consentito la clonazione della voce. Il risultato è stato entusiasmante ed inquietante allo stesso tempo.
Attraverso il governo della Intelligenza Artificiale, i contenuti imposti alla lettura erano indistinguibili da quelli della voce umana. Solo che alla prima si poteva far dire qualsiasi cosa. Anche compromettente.
Presto pubblicheremo gli esempi di questa prova, che, tuttavia, impone riflessioni.
Sintesi
Come distinguere la voce sintetizzata dalla Intelligenza Artificiale da quella umana? Un problema che diventerà estremamente attuale, a brevissimo.
Quello che sembrava fantascienza (per i più) solo un anno fa, ora è tremendamente attuale.
Non solo diritto d’autore
Non parliamo solo di aspetti connessi al diritto d’autore, ma di quelli, per esempio, morali, etici e penali connessi a dichiarazioni che potrebbero essere fatte con la nostra voce clonata senza autorizzazione (o abusando delle autorizzazioni stesse).
Autenticazione della voce
Comprensibile che si parli quindi di soluzioni di autenticazione della voce umana o, per converso, di modalità di individuare quelle sintetizzate dalla intelligenza artificiale.
Francesco Triolo
Ne parliamo con un precursore I.A. applicata all’audio: Francesco Triolo di MeWay, società di cui NL si è occupato più volte.
L’intervista
(Newslinet) – Come proteggerci dalla clonazione non autorizzata della nostra voce?
(Francesco Triolo) – Dall’inizio dell’integrazione della A.I. con il nostro sistema automatico di sonorizzazione, MashUp, abbiamo da subito avuto la necessità di distinguere i contenuti prodotti artificialmente. La verosimiglianza dei risultati, infatti, ci ha subito fatto riflettere sugli aspetti legati alla autenticità delle tracce vocali e dei messaggi prodotti (ma anche clip video) che sicuramente potrebbe diventare un problema superiore a quello delle fake news.
La voce marchiata
(NL) – Come funziona?
(Francesco Triolo) – Con la consapevolezza del potenziale, fin da subito abbiamo deciso di introdurre un sistema di analisi delle tracce audio: Mashup, infatti, sfrutta diverse tecnologie per rendere identificabili i campioni vocali elaborati dai nostri modelli di A.I. e in qualche modo creare una sorta di “certificazione” tracciabile. E’ chiaro che si tratta di un’autoregolamentazione.
L’A.I Act
Ma anche in relazione alle previsioni del recente A.I. Act, la prima legge quadro al mondo che disciplinerà l’impiego dell’intelligenza artificiale, è presumibile che sarà imposto a tutti gli operatori di adottare strumenti di identificazione delle voci sintetiche.
Gli abusi
Mi rendo conto che ciò non può preservare da abusi, ma è comunque un primo passo.
Identità vocale
(NL) – E per quella umana?
(Francesco Triolo) – Probabilmente, seguendo la logica che stiamo adottando per patentare le voci artificiali la strada più “veloce” potrebbe essere associata ad una identità, un po’ come il codice fiscale o, se vogliamo estremizzare (ma proprio tanto) al DNA…
Voce firmata
(NL) – Medio tempore ci sarà una sorta di certificazione della voce umana, quindi?
(Francesco Triolo) – Sicuramente si potrà firmare digitalmente le produzioni autentiche: i cloni non avranno il certificato o ne avranno uno che attesta la natura artificiale… (M.R. per NL)