Media. Perché stanno cambiando le classifiche dei siti web? C’è forse lo zampino della IA di Meta e Google? C’entra il Digital Services Act?

Digital Services Act

Molti siti di contenuto (espressione che contempla l’informazione nel senso più ampio del termine) negli ultimi mesi hanno visto crescere notevolmente le proprie performance. Altri, storicamente molto attivi sul SEO (Search Engine Optimization), sono invece stati penalizzati.
Da qui siamo partiti per verificare se, come pensiamo, recentemente siano stati (ri)classificati dalle IA di Google e Facebook/Meta come fonti autorevoli e pertanto favoriti nelle ricerche esplicite e implicite da parte degli utenti.
E lo abbiamo fatto partendo dall’analisi del Digital Services Act.

Le novità giuridiche

L’entrata in vigore del Digital Services Act dell’Unione Europea impone alle grandi piattaforme di fornire trasparenza sui famosi algoritmi, i sistemi che decidono se e cosa far vedere ai propri utenti, determinando spesso il successo (o meno) di un articolo. Algoritmi che la recente accelerazione nell’uso dell’intelligenza artificiale ha profondamente modificato. L’occasione giusta per approfondire i vari “transparency hub“, che senza dubbio saranno densi di informazioni, come richiesto dal DSA. O forse no.

DSA

Il Digital Services Act (DSA), considerato dai suoi promotori la più importante e ambiziosa serie di regole al mondo riguardanti la qualità dei contenuti online e la protezione dei diritti fondamentali degli utenti, è entrato in vigore il 25 agosto 2023.

Gli obiettivi

Tra gli obiettivi anche la trasparenza sugli algoritmi utilizzati per la “content moderation“: nell’articolo 27 si afferma infatti che le piattaforme devono comunicare agli utenti i “principali parametri utilizzati nei content recommender systems, oltre alle opzioni per modificare questi parametri”.

Il mitico algoritmo

In pratica, il DSA chiede trasparenza sul famoso e sempre citato “algoritmo” che guida l’ordine e la rilevanza di quanto piattaforme quali Google e Facebook ci mostrano nei nostri “feed“.

Reality check

L’occasione giusta per fare un rapido reality check, basandoci su sistemi di monitoraggio di siti web e su quanto possiamo osservare “dall’interno” di alcuni importanti siti che seguiamo per motivi professionali.

Non più vendita al Kg…

Partiamo da un evento di cui NL si è recentemente occupata.
Durante la convention annuale di Giornale Radio,  il direttore responsabile della stazione Massimo Lualdi (e direttore anche di NL) ha affermato tra l’altro che “La logica della vendita a kg (di link N.d.R.) ha lasciato da tempo il posto ad un altro, ben più interessante (economicamente parlando), commercio di traffico.

... ma prestige e…

E’, infatti, l’autorevolezza (o il prestige, come si dice nel web marketing) ad essere oggi ricercata e premiata”.

…fonti autorevoli

Considerazione nata dall’analisi delle statistiche relative ad accessi e interazioni social di numerosi siti afferenti al mondo dell’informazione.

L’ipotesi

La tesi è che i più performanti siano stati recentemente classificati dalle IA di Google e Facebook/Meta come fonti autorevoli e pertanto favoriti nelle ricerche esplicite e implicite da parte degli utenti.

Fine dei guru del SEO

Contenuti curati, profondi e sistematici sarebbero ormai gli elementi che contano per guadagnare posizioni nelle ricerche Google e nelle visualizzazioni sulle varie timelinela fine dell’era dei guru del SEO e dei facili trucchetti per salire in graduatoria.

Quanto è segreto l’algoritmo?

Un grande cambiamento rispetto al passato – che peraltro avevamo anticipato da tempo -, quando il ranking non impiegava Intelligenze Artificiali, ma solo “misteriosi” algoritmi quali quello di Google: il famoso “Page Ranking” descritto da Page e Brin prima ancora di fondare la società.

Ispirazione

Fonte ovviamente di ispirazione anche per la timeline di Facebook.

Screenshot 2023 09 11 at 16.53.28 - Media. Perché stanno cambiando le classifiche dei siti web? C'è forse lo zampino della IA di Meta e Google? C'entra il Digital Services Act?

Il Page Ranking

Il cuore del Page Ranking è classico descritto in poche parole, che vale la pena rileggere, se la parola “autovettore” non ci spaventa: altrimenti appuntamento al prossimo titoletto.

Le formule

Assumiamo che la pagina A abbia le pagine T1…Tn che puntano ad essa (cioè che siano citazioni). Il parametro d è un fattore di smorzamento che può essere impostato tra 0 e 1. Di solito impostiamo d a 0.85. Inoltre definiamo C(A)  come il numero di link in uscita dalla pagina A.

Il PageRank di una pagina A è dato come segue:

PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

PR

Si noti che i PageRank formano una distribuzione di probabilità sulle pagine web, quindi la somma di tutti i PageRank delle pagine web sarà uno.

Il PageRank o PR(A) può essere calcolato usando un semplice algoritmo iterativo e corrisponde all’autovettore principale della matrice di collegamento normalizzata del web. 

Meta

Veniamo a Facebook. Non sono pubblici paper simili, ma recentemente parte dell’algoritmo di ranking di Meta è stato descritto in alcuni post come questo.

1678104440573 - Media. Perché stanno cambiando le classifiche dei siti web? C'è forse lo zampino della IA di Meta e Google? C'entra il Digital Services Act?

Arriva l’IA

Come si può leggere siamo entrati nell’era del ranking basato sui sistemi delle reti neuronali: prova ne è la citazione dell’algoritmo Word2vec, ampiamente utilizzato per il fine tuning di GPT 3.x e 4.x. Dovremmo dunque essere in grado, grazie alla trasparenza imposta dalle UE, di indagare a fondo sull’utilizzo della IA e sui suoi effetti sulla viabilità dei nostri siti e articoli.

Digital Services Act

E infatti il 29 giugno Meta ha annunciato tramite il sito transparency.fb.com il proprio “ongoing commitment to transparency“, pubblicando una serie di schede che parlano anche del ranking: la risposta alle richieste del Digital Services Act.

Ottime premesse

Abbiamo passato due giorni a studiare gli articoli oggetto di trasparenza usando questo come punto di partenza. La frase iniziale promette bene: “When you view and interact with Facebook, one of the underlying AI systems delivers the connected content you see in your Feed”.

Segnali e punteggi

All’inizio della descrizione sono presenti due punti importanti, il 2 e il 4, dove si pretende di descrivere come l’algoritmo decide cosa fare vedere, a chi e in quale ordine.

1678104440573 1 - Media. Perché stanno cambiando le classifiche dei siti web? C'è forse lo zampino della IA di Meta e Google? C'entra il Digital Services Act?

Infinite loop

Ma si tratta di poco più che di titoli. I dettagli dovrebbero essere nelle varie transparency card, qui. Ma cercando di approfondire ci ritroviamo con dei bellissimi link… al punto di partenza: un vero e proprio infinite loop.

Niente numeri né formule

Il nostro parere, condiviso anche da alcuni esperti della Mozilla Foundation è che questi sforzi di trasparenza siano molto ma molto parziali. Mancano numeri, formule, dettagli.

Informazioni incomplete

Le spiegazioni fornite sono incomplete e non chiariscono adeguatamente i trade-off impliciti nelle decisioni di ranking. Ad esempio, non è specificato come viene bilanciato l’interesse commerciale della piattaforma con l’interesse specifico degli utenti e come i vari possibili articoli candidati siano effettivamente pesati.

Essenziale

Un dato essenziale, al fine di comprendere le motivazioni per l’aumento del traffico (o la sua diminuzione) su un determinato sito.

Screenshot 2023 09 11 at 18.05.57 - Media. Perché stanno cambiando le classifiche dei siti web? C'è forse lo zampino della IA di Meta e Google? C'entra il Digital Services Act?

Info utili a nessuno

Come affermato dalla Mozilla Foundation, le cosiddette “system cards” pubblicate da Meta non costituiscono una reale trasparenza secondo gli standard condivisi nel settore.

Criptico

Non mostrano nel dettaglio come il sistema elabora i segnali in ingresso e in definitiva non forniscono informazioni utilizzabili né dagli utenti né dai regolatori o dalle altre parti interessate.

Transparency washing

Per usare un termine da poco tempo in voga, Meta pare aver fatto un’operazione di  “transparency washing“, volta a dare un’illusione di trasparenza senza realmente rendere comprensibili le logiche dei sistemi di raccomandazione.

Conclusioni

La prima conclusione che ci viene da trarre, dopo i nostri giorni di approfondimento, è che l’Unione europea non dovrebbe accontentarsi, ma formalizzare una richiesta a Meta: quella di fare decisamente di più (e magari da un unico “hub” informativo, in quanto oggi tutto è distribuito in molti, diversi articoli).

Elon Musk

L’altra osservazione è che, anche se alcuni commissari detestano Elon Musk e dirigono solo contro X/Twitter i propri moniti, sarebbe invece opportuno chiedere a Meta di fare esattamente la stessa operazione effettuata dal fondatore di Tesla e proprietario di X: rendere pubblico il codice sorgente dei propri algoritmi.

Totale trasparenza

Solo in questo modo si otterrà la totale trasparenza e solo in questo modo – a nostro avviso – si darà una risposta adeguata allo spirito della legislazione europea. (M.H.B. per NL)

 

Questo sito utilizza cookie per gestire la navigazione, la personalizzazione di contenuti, per analizzare il traffico. Per ottenere maggiori informazioni sulle categorie di cookie, sulle finalità e sulle modalità di disattivazione degli stessi clicca qui. Con la chiusura del banner acconsenti all’utilizzo dei soli cookie tecnici. La scelta può essere modificata in qualsiasi momento.

Privacy Settings saved!
Impostazioni

Quando visiti un sito Web, esso può archiviare o recuperare informazioni sul tuo browser, principalmente sotto forma di cookies. Controlla qui i tuoi servizi di cookie personali.

Questi strumenti di tracciamento sono strettamente necessari per garantire il funzionamento e la fornitura del servizio che ci hai richiesto e, pertanto, non richiedono il tuo consenso.

Questi cookie sono impostati dal servizio recaptcha di Google per identificare i bot per proteggere il sito Web da attacchi di spam dannosi e per testare se il browser è in grado di ricevere cookies.
  • wordpress_test_cookie
  • wp_lang
  • PHPSESSID

Questi cookie memorizzano le scelte e le impostazioni decise dal visitatore in conformità al GDPR.
  • wordpress_gdpr_cookies_declined
  • wordpress_gdpr_cookies_allowed
  • wordpress_gdpr_allowed_services

Rifiuta tutti i Servizi
Accetta tutti i Servizi

Ricevi gratis la newsletter di NL!

ATTENZIONE! Il 14/12/2024 scade termine per iscrizione in lista SIG (Servizi di Interesse Generale) istituita da Agcom per rilevanza in elenchi dei device smart: [email protected]

ISCRIVITI ALLA NEWSLETTER