Molti siti di contenuto (espressione che contempla l’informazione nel senso più ampio del termine) negli ultimi mesi hanno visto crescere notevolmente le proprie performance. Altri, storicamente molto attivi sul SEO (Search Engine Optimization), sono invece stati penalizzati.
Da qui siamo partiti per verificare se, come pensiamo, recentemente siano stati (ri)classificati dalle IA di Google e Facebook/Meta come fonti autorevoli e pertanto favoriti nelle ricerche esplicite e implicite da parte degli utenti.
E lo abbiamo fatto partendo dall’analisi del Digital Services Act.
Le novità giuridiche
L’entrata in vigore del Digital Services Act dell’Unione Europea impone alle grandi piattaforme di fornire trasparenza sui famosi algoritmi, i sistemi che decidono se e cosa far vedere ai propri utenti, determinando spesso il successo (o meno) di un articolo. Algoritmi che la recente accelerazione nell’uso dell’intelligenza artificiale ha profondamente modificato. L’occasione giusta per approfondire i vari “transparency hub“, che senza dubbio saranno densi di informazioni, come richiesto dal DSA. O forse no.
DSA
Il Digital Services Act (DSA), considerato dai suoi promotori la più importante e ambiziosa serie di regole al mondo riguardanti la qualità dei contenuti online e la protezione dei diritti fondamentali degli utenti, è entrato in vigore il 25 agosto 2023.
Gli obiettivi
Tra gli obiettivi anche la trasparenza sugli algoritmi utilizzati per la “content moderation“: nell’articolo 27 si afferma infatti che le piattaforme devono comunicare agli utenti i “principali parametri utilizzati nei content recommender systems, oltre alle opzioni per modificare questi parametri”.
Il mitico algoritmo
In pratica, il DSA chiede trasparenza sul famoso e sempre citato “algoritmo” che guida l’ordine e la rilevanza di quanto piattaforme quali Google e Facebook ci mostrano nei nostri “feed“.
Reality check
L’occasione giusta per fare un rapido reality check, basandoci su sistemi di monitoraggio di siti web e su quanto possiamo osservare “dall’interno” di alcuni importanti siti che seguiamo per motivi professionali.
Non più vendita al Kg…
Partiamo da un evento di cui NL si è recentemente occupata.
Durante la convention annuale di Giornale Radio, il direttore responsabile della stazione Massimo Lualdi (e direttore anche di NL) ha affermato tra l’altro che “La logica della vendita a kg (di link N.d.R.) ha lasciato da tempo il posto ad un altro, ben più interessante (economicamente parlando), commercio di traffico.
... ma prestige e…
E’, infatti, l’autorevolezza (o il prestige, come si dice nel web marketing) ad essere oggi ricercata e premiata”.
…fonti autorevoli
Considerazione nata dall’analisi delle statistiche relative ad accessi e interazioni social di numerosi siti afferenti al mondo dell’informazione.
L’ipotesi
La tesi è che i più performanti siano stati recentemente classificati dalle IA di Google e Facebook/Meta come fonti autorevoli e pertanto favoriti nelle ricerche esplicite e implicite da parte degli utenti.
Fine dei guru del SEO
Contenuti curati, profondi e sistematici sarebbero ormai gli elementi che contano per guadagnare posizioni nelle ricerche Google e nelle visualizzazioni sulle varie timeline: la fine dell’era dei guru del SEO e dei facili trucchetti per salire in graduatoria.
Quanto è segreto l’algoritmo?
Un grande cambiamento rispetto al passato – che peraltro avevamo anticipato da tempo -, quando il ranking non impiegava Intelligenze Artificiali, ma solo “misteriosi” algoritmi quali quello di Google: il famoso “Page Ranking” descritto da Page e Brin prima ancora di fondare la società.
Ispirazione
Fonte ovviamente di ispirazione anche per la timeline di Facebook.
Il Page Ranking
Il cuore del Page Ranking è classico descritto in poche parole, che vale la pena rileggere, se la parola “autovettore” non ci spaventa: altrimenti appuntamento al prossimo titoletto.
Le formule
“Assumiamo che la pagina A abbia le pagine T1…Tn che puntano ad essa (cioè che siano citazioni). Il parametro d è un fattore di smorzamento che può essere impostato tra 0 e 1. Di solito impostiamo d a 0.85. Inoltre definiamo C(A) come il numero di link in uscita dalla pagina A.
Il PageRank di una pagina A è dato come segue:
PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))
PR
Si noti che i PageRank formano una distribuzione di probabilità sulle pagine web, quindi la somma di tutti i PageRank delle pagine web sarà uno.
Il PageRank o PR(A) può essere calcolato usando un semplice algoritmo iterativo e corrisponde all’autovettore principale della matrice di collegamento normalizzata del web.
Meta
Veniamo a Facebook. Non sono pubblici paper simili, ma recentemente parte dell’algoritmo di ranking di Meta è stato descritto in alcuni post come questo.
Arriva l’IA
Come si può leggere siamo entrati nell’era del ranking basato sui sistemi delle reti neuronali: prova ne è la citazione dell’algoritmo Word2vec, ampiamente utilizzato per il fine tuning di GPT 3.x e 4.x. Dovremmo dunque essere in grado, grazie alla trasparenza imposta dalle UE, di indagare a fondo sull’utilizzo della IA e sui suoi effetti sulla viabilità dei nostri siti e articoli.
Digital Services Act
E infatti il 29 giugno Meta ha annunciato tramite il sito transparency.fb.com il proprio “ongoing commitment to transparency“, pubblicando una serie di schede che parlano anche del ranking: la risposta alle richieste del Digital Services Act.
Ottime premesse
Abbiamo passato due giorni a studiare gli articoli oggetto di trasparenza usando questo come punto di partenza. La frase iniziale promette bene: “When you view and interact with Facebook, one of the underlying AI systems delivers the connected content you see in your Feed”.
Segnali e punteggi
All’inizio della descrizione sono presenti due punti importanti, il 2 e il 4, dove si pretende di descrivere come l’algoritmo decide cosa fare vedere, a chi e in quale ordine.
Infinite loop
Ma si tratta di poco più che di titoli. I dettagli dovrebbero essere nelle varie transparency card, qui. Ma cercando di approfondire ci ritroviamo con dei bellissimi link… al punto di partenza: un vero e proprio infinite loop.
Niente numeri né formule
Il nostro parere, condiviso anche da alcuni esperti della Mozilla Foundation è che questi sforzi di trasparenza siano molto ma molto parziali. Mancano numeri, formule, dettagli.
Informazioni incomplete
Le spiegazioni fornite sono incomplete e non chiariscono adeguatamente i trade-off impliciti nelle decisioni di ranking. Ad esempio, non è specificato come viene bilanciato l’interesse commerciale della piattaforma con l’interesse specifico degli utenti e come i vari possibili articoli candidati siano effettivamente pesati.
Essenziale
Un dato essenziale, al fine di comprendere le motivazioni per l’aumento del traffico (o la sua diminuzione) su un determinato sito.
Info utili a nessuno
Come affermato dalla Mozilla Foundation, le cosiddette “system cards” pubblicate da Meta non costituiscono una reale trasparenza secondo gli standard condivisi nel settore.
Criptico
Non mostrano nel dettaglio come il sistema elabora i segnali in ingresso e in definitiva non forniscono informazioni utilizzabili né dagli utenti né dai regolatori o dalle altre parti interessate.
Transparency washing
Per usare un termine da poco tempo in voga, Meta pare aver fatto un’operazione di “transparency washing“, volta a dare un’illusione di trasparenza senza realmente rendere comprensibili le logiche dei sistemi di raccomandazione.
Conclusioni
La prima conclusione che ci viene da trarre, dopo i nostri giorni di approfondimento, è che l’Unione europea non dovrebbe accontentarsi, ma formalizzare una richiesta a Meta: quella di fare decisamente di più (e magari da un unico “hub” informativo, in quanto oggi tutto è distribuito in molti, diversi articoli).
Elon Musk
L’altra osservazione è che, anche se alcuni commissari detestano Elon Musk e dirigono solo contro X/Twitter i propri moniti, sarebbe invece opportuno chiedere a Meta di fare esattamente la stessa operazione effettuata dal fondatore di Tesla e proprietario di X: rendere pubblico il codice sorgente dei propri algoritmi.
Totale trasparenza
Solo in questo modo si otterrà la totale trasparenza e solo in questo modo – a nostro avviso – si darà una risposta adeguata allo spirito della legislazione europea. (M.H.B. per NL)