Quantcast

A che punto siamo con gli algoritmi per individuare “fake news”?

Dopo le elezioni statunitensi del 2016, abbiamo (tristemente) imparato ad associare la parola "fake news" a Brexit, Donald Trump, troll russi, vaccini, cambiamento climatico e altri shenanigan che imperversano sui social media. Siamo in grado di identificarle tempestivamente e rimuoverle prima che facciano guai?

Francesco Pierri è originario di Salerno e ha 27 anni (quasi). Dottorando al 3° anno del corso multidisciplinare “Data Analytics and Decision Sciences” al Politecnico di Milano, ingegnere informatico di formazione, il suo lavoro consiste nell’analizzare la diffusione di disinformazione e il suo impatto sui social network on-line. Nel tempo libero pratica capoeira a ritmo di pandeiro e berimbau.

 

Dopo le elezioni statunitensi del 2016 il numero di contributi scientifici sul tema delle fake news è letteralmente schizzato verso l’alto, contando ormai più di 15,000 articoli, di cui oltre 100 riguardanti la recente pandemia di COVID-19. Siamo ormai abituati ad associare questa parola a temi controversi nel dibattito pubblico, in particolare politica e scienza, e secondo alcuni siamo entrati inesorabilmente in una cosiddetta era post-verità in cui contano più le opinioni che i fatti. Per una riprova recente di tutto questo, basti pensare che probabilmente Donald Trump è una delle fonti più autorevoli e prolifiche di fake news sulla recente pandemia di COVID-19 (ma non solo). Anche i politici nostrani non scherzano.

Negli ultimi anni, la comunità scientifica ha identificato parecchi fattori che contribuiscono ad esacerbare il problema della cattiva informazione, dal funzionamento stesso delle piattaforme social (i cosiddetti algoritmi personalizzati) alla presenza di agenti “malvagi” (social bots e trolls), nonché a problematiche prettamente “umane” (i cosiddetti bias cognitivi che influenzano ognuno di noi, compreso l’autore di questo articolo).

Nonostante l’enorme interesse per questo problema, ci sono ancora enormi difficoltà a convergere su definizioni, raccolta dati e valutazione di metodologie per identificare automaticamente informazioni non attendibili e potenzialmente dannose per gli utenti. Che vuol dire?

Ad esempio, termini come disinformazione e misinformation (che non ha una sua traduzione in italiano) vengono spesso utilizzati in maniera diversa da autori diversi: solitamente il primo indica informazioni dannose che vengono intenzionalmente condivise con lo scopo di confondere i lettori, mentre il secondo fa riferimento ad errori “sinceri” di giornalismo e interpretazione dei fatti.

Inoltre, in uno scenario in cui è già difficile assegnare un punteggio di “verità” ad un articolo, pensare di poter classificare “manualmente” migliaia di contenuti è impensabile. Questo è un primo enorme ostacolo, in quanto gli algoritmi più sofisticati (le celeberrime reti neurali che permettono al vostro smartphone di sbloccarsi quando inquadrate il viso) avrebbero bisogno di milioni di esemplari per funzionare correttamente.

Aggiungiamo a questo anche la multimedialità con cui la cattiva informazione prende forme diverse: dalle foto ai video, ritoccati (cosiddetti deep-fakes) e non (teorie cospirazioniste su Youtube), ma anche meme e catene di Sant’Antonio su WhatsApp.

 

Nonostante questo, possiamo dire di aver raggiunto negli anni risultati interessanti sul tema. Sappiamo che la presenza di comunità polarizzate favorisce la diffusione di disinformazione, che esistono bots molto “cattivi”, che gli individui più attivi politicamente sono più vulnerabili e che il testo non è fondamentale per individuare contenuti dannosi (e che basta guardare al modo in cui vengono condivisi).

A questo punto molti di voi penseranno anche che i principali social networks hanno fatto troppo poco per contrastare questo problema, e che peggiorano il mondo. E forse non avrebbero tutti i torti.

In fin dei conti, sappiamo che sarebbe molto facile proteggersi, controllando la fonte di una storia e/o confrontando con altri articoli sullo stesso tema o ascoltando “voci autorevoli”, ma con la crisi dell’informazione, e la conseguente rincorsa dei giornali a contenuti acchiappa-click, testate tradizionali che un tempo avremmo definito attendibili e veritiere sono sempre più spesso vittime di casi di cattiva informazione, a cominciare dai titoli. Disinformazione o misinformation? Chissà…