martedì 6 settembre 2016

INCONSAPEVOLMENTE DOMINATI DALLA STATISTICA AUTOMATICA

Cosa fate se non funziona più il vostro smartphone? Entrate in crisi. Cosa fate se - dopo aver messo in moto l'auto per recarvi in un posto in cui non siete mai stati - scoprite che il navigatore non funziona più? Vi sentite quasi "spacciati". Ciò succede in quanto i nostri gesti quotidiani sono sempre più orientati, e talvolta addirittura affidati ad infrastrutture di calcolo, che si basano su algoritmi.

Un algoritmo consiste essenzialmente in una serie di istruzioni che ci consentono di ottenere un risultato. Quanto più gli algoritmi lavorano per noi, tanto meno siamo in grado di muoverci senza, e perdiamo quindi conoscenza utile. Dobbiamo quindi necessariamente capire come funziona il nostro mondo, in cui tutto sta diventando misurabile e calcolabile. Un esempio per tutti: le classifiche. Provate a scrivere un libro. Sono pronto a scommettere che vi verrà la dipendenza da classifica di Amazon: quasi ogni giorno andrete a verificare le oscillazioni, ieri al 121° posto nella classifica specifica, oggi al 3° e domani al 72°...

È questa l'idea su cui si basa il nuovo libro di Dominique Cardon, "Cosa sognano gli algoritmi - le nostre vite all'epoca dei big data", pubblicato da Mondadori Education. Non si tratta di far a meno degli algoritmi, ma di comprenderli - senza tuttavia entrare nel dettaglio matematico - per verificare se siamo noi a decidere o se sono loro. D'altronde, se non riusciamo ad immaginarci senza tutta la dotazione tecnologica di cui disponiamo, non è perché non ne possiamo far a meno, ma bensì - come spiega l'autore - perché le macchine sono diventate parte di noi. A tal proposito, chi fra voi fa l'insegnante ha mai provato a togliere lo smartphone ad uno studente che non seguiva la lezione? Io ci ho provato, e non ho parole per descrivere come lo studente mi ha guardato. Sembrava che gli stessi staccando un braccio...

Se è innegabile che gli algoritmi siano diventati molto importanti nel nostro mondo, è altrettanto vero che ne sappiamo poco. Ecco alcune domande: gli algoritmi rispettano le regole della statistica? Possiamo quindi fidarci di tutte le misurazioni, degli indicatori di popolarità, di reputazione e di autorevolezza sul web? Quando delle formule sono in grado di predire le nostre prossime mosse, come lo fanno? E poi, ci azzeccano? Se sulla rete lasciamo tantissime tracce, gli algoritmi ci chiudono in una sorta di bolla, oppure siamo noi - così abitudinari, prevedibili e conformisti - a chiuderci dentro una gabbia?

Cominciamo a distinguere quella disciplina scientifica - figlia della matematica e ricca di teoremi, dimostrazioni e formule - comunemente denominata Statistica, dall'output di algoritmi, che io definirei "Statistica Automatica".

In generale, per giungere alla conoscenza di un fenomeno variabile (se fosse costante sarebbe necessariamente prevedibile, e quindi non sarebbe interessante per la statistica), occorre partire dalla raccolta dei dati. E già qui gli esperti di statistica (delle persone, non delle macchine) devono prendere numerose decisioni: raccogliere i dati da tutta la popolazione o solo da un campione? Con quale metodo è opportuno raccogliere i dati? Poi, naturalmente occorre decidere con quali tecniche statistiche elaborare i dati. E infine, come presentare i risultati? Questa, molto in sintesi, è la Statistica.

La Statistica Automatica non prende in considerazione una popolazione (che - in senso statistico - potrebbe essere anche costituita dai laureati in medicina a Torino nel 2000 oppure da tutti coloro che risultano iscritti ad un determinato albo professionale...), né un campione attendibile ovvero estratto casualmente da una popolazione, ma bensì solo gli internauti attivi, ovvero tutti coloro che sono connessi ad internet e lasciano tracce. Peraltro, tali internauti, consapevoli di essere oggetto di misurazione, talvolta agiscono per modificare i risultati delle misure, al fine di promuovere i loro siti e blog (o la loro reputazione) tenendo d'occhio le oscillazioni degli indicatori.

Se consideriamo il sistema delle recensioni (di alberghi, ristoranti e simili), anche qui troviamo un problema alla base: solo alcuni scrivono recensioni, per altri è una perdita di tempo. Oltretutto alcuni scrivono solo per denunciare la propria insoddisfazione, dimenticandosi poi di commentare anche le situazioni in cui si sono trovati bene. L'insieme dei recensori sembra un campione che si è autoselezionato (e ciò non va bene), invece di esser selezionato dal caso. Come se non bastasse non tutti i prodotti e servizi vengono recensiti: di alcuni - che potrebbero essere altrettanto validi - nessuno scrive nulla. Per non parlare del modo in cui le recensioni vengono "riunite" in unico punteggio finale. Se la "sintesi dei voti" non fosse matematicamente accettabile, neanche lo score finale andrebbe preso in considerazione.

La Statistica (inferenziale) si è sempre basata sull'applicazione di tecniche sofisticate per estendere i risultati ottenuti nel campione alla popolazione da cui quel campione è stato estratto. Perché è sempre stata la popolazione, nel senso della società, l'interesse di tutti. Ora invece prevalgono i dati individuali, le tracce delle persone, che sono "singoli clienti" e non è più così importante stabilire a quale categoria appartengano, né come l'insieme delle categorie costituisca la nostra società. In un certo senso gli statistici sono stati sostituiti da macchine, che però non sono laureate in Scienze Statistiche.


Walter Caputo
Laureato in Scienze Statistiche
e autore di altri articoli divulgativi di Statistica:

Cos'è la statistica?
La nascita della statistica
Influenza A: l'ignoranza della Statistica genera mostri
L'importanza della biostatistica
Il caso e la statistica: matematica e omicidi
Probabilità zero?
La probabilità di successo
Stima del rischio tramite il valore atteso e lo scarto quadratico medio
La probabilità di osservare l'esplosione di una stella
L'universo affollato: alla ricerca di pianeti abitati
Cosa stiamo dicendo quando parliamo di probabilità?
Si fa presto a dire probabilità di vita extraterrestre e di impatto asteroidale (1 di 2)
Si fa presto a dire probabilità di vita extraterrestre e di impatto asteroidale (2 di 2)
Non probabilità di vita extraterrestre, ma semplici frequenze basate su stime incerte

e commenti statistici ad articoli vari:

Provate a stabilire se la pasta è di grano duro
I maschi sono migliori delle femmine in matematica?







Nessun commento: