La notizia bomba di inizio marzo è l’annuncio di Google sotto forma di blog post intitolato “Tracciare una rotta verso un web dove la privacy viene per prima”. Si tratta della conferma della prossima disattivazione dei cookie da parte del gigante di Mountain View che ha scatenato il panico tra molti attori del mondo web.
Google promette che non continuerà a tracciarvi dopo l’abolizione dei cookie
Scritto da David Temkin, il post è stato ripreso dalla stampa specializzata e non, oltre che da molte testate italiane, con titoli quali “Google promette che non continuerà a tracciarvi dopo l’abolizione dei cookie”.
La notizia si può inquadrare nell’ambito delle varie vicissitudini legali di Google. Vale pertanto la pena di fare un approfondimento.
Abolizione dei cookie
Facciamo un passo indietro a gennaio 2020 quando Google annunciava l’intenzione di mettere al bando i cookie di terze parti entro due anni. I cookie (WEB cookie o HTTP cookie, tradotto in italiano corrisponde a dolcetti o biscotti, in francese gâteau) sono dei piccoli file depositati sul device utente per mantenere informazioni che saranno utili in futuro.
Indicatori univoci della nostra identità
Ad esempio il contenuto di un carrello, informazioni di login per un sito, preferenze o password. In breve indicatori univoci della nostra identità associati a qualche informazione rilevante. Fin qui tutto bene.
Google e i cookie di terze parti
Tutto bene se si tratta di un sito che stiamo esplicitamente visitando. Esistono però cookie di terze parti. Essi sono generati da pagine che non si sono consultate, ma che in qualche modo sono inglobate nei siti visitati.
La pubblicità relativa ad un prodotto di cui ci sembra aver solo discusso con un collega il giorno precedente
E sono questi ad essere responsabili di un fenomeno che tutti abbiamo almeno una volta sperimentato. Visitiamo il sito del Corriere, ed ecco apparire una pubblicità di Amazon relativa ad un prodotto di cui ci sembra aver solo discusso con un collega il giorno precedente.
Il mare magnum dei cookie
Il numero di cookie che infestano i nostri computer è astronomico. In uno solo dei browser del computer utilizzato per redigere questo articolo se ne contano oltre mille. Ecco un breve estratto (facilmente visualizzabile tramite i “setting” di Chrome):
Nuovi cookie
Analizziamo come esempio un sito da noi mai visitato: vanityfair.com. Questo ne ha depositati due; il primo per tenere traccia dell’edizione da proporci (FR), il secondo (CN_xid) e’ il nostro identificatore unico: “630bfcd5-7c4d-449b-868f-b6da9556c211″. Sarà utile più avanti o ad altri.
Sono questo tipo di cookie, quelli di terze parti, che a breve non saranno più accettati.
Ambiguità risolta da Google
Dopo l’annuncio restava un dubbio: Google manterrà attivi i propri cookie? La risposta è contenuta nel blog post del 3 marzo, dove troviamo un’affermazione categorica:
“Oggi ufficializziamo il fatto che quando i cookie di terze parti saranno bloccati non costruiremo identificativi alternativi per il tracciamento individuale, né li useremo nei nostri prodotti”
Google e Il mondo dopo i cookie
I servizi di centinaia di migliaia di società web ed editoriali sono basati sulle funzionalità di tracciamento utente fornite dai cookie. Logico quindi che queste si siano allarmate davanti a una prospettiva molto pericolosa per il proprio business. Ma Google ha pronto – almeno in bozza – qualcosa di alternativo.
FLoC
L’OTT intende rimpiazzare i gâteau incorporando e promuovendo una nuova tecnologia, dall’affascinante nome di “Privacy Sandbox technology for interest-based advertising (FLoC)”. Dove FLoC sta per “Federated Learning of Cohorts”.
Cohort?
Cohort in italiano ha svariate traduzioni: corte, gruppo, compagno. Quindi un FLoC e’ un gruppo omogeneo e dinamico di utilizzatori accomunati, tramite l’onnipresente Intelligenza Artificiale, da qualcosa.
Tracciamento di gruppo
L’idea di base è questa: anziché tracciare i singoli individui, si tracciano gruppi di utilizzatori simili anonimizzati localmente. Per spiegare ancora meglio il concetto utilizziamo le parole esatte di Google: “un FLoC cohort è un nome condiviso da un gran numero (migliaia) di persone, derivato dal browser a partire dalla singola “browsing history”. Questo cohort è aggiornato nel tempo, ed è reso disponibile ai siti terzi”.
Quanti sono i possibili cohort?
Le cose però non sono così semplici, perché il cohort viene creato non solo in base alla storia della navigazione, ma anche dal contenuto delle pagine visitati ed “altri fattori”. In ogni caso – afferma Google – il numero di cohort non deve essere sterminato, in modo da garantire la genericità delle informazioni contenute. Viene fatto il seguente esempio: 43A7, il che lascerebbe pensare ad un numero massimo globale di circa 16^4 = 65.000 cohort.
Anonimizzazione
Si noterà l’espressione chiave “anonimizzati localmente”. Questo processo è ottenuto tramite una funzione calcolata sul device dell’utente (ad esempio, sul telefono cellulare) dove vengono creati degli identificativi univoci (cohort-id) condivisi da “k” utenti. Dove K deve essere abbastanza ampio da garantire l’anonimato, ma abbastanza piccolo da non creare gruppi disomogenei.
Word Cloud
Ecco dunque una visualizzazione di cohort che accomuna persone con interessi simili in campo letterario. L’inserzionista pubblicitario non conosce l’identità dei singoli, ma certamente eviterà, ad esempio, di promuovere verso questo gruppo di individui libri sullo sport o sul “fai da te”.
Due anni di tempo
Ad oggi si stima che oltre il 60% della pubblicità online venga generata in base ai cookie di terze parti, senza parlare del mercato dei servizi correlati e del vero e proprio commercio di identità online. Questa iniziativa di Google probabilmente cambierà numerosi assetti nel mercato relativo. Restano quasi due anni di tempo per prepararsi, dunque un’eternità nel mondo del web: non perdiamoli. (M.H.B. per NL)