Header Ads

STATISTICA E PROBABILITA': PUNTATA 7 DI "N"

Oggi è Ferragosto: se c'è il sole, si fa la grigliata e se piove si fa la grigliata lo stesso. Perché le tradizioni vanno rispettate. E allora cogliamo la palla al balzo: grigliamo i dati per ottenere informazioni, almeno riusciremo a ricordarci, in modo simpatico, che i dati non sono informazioni. I dati vanno grigliati, altrimenti non ci sono informazioni da mangiare. Diamo così il via alla settima puntata di "Statistica e Probabilità" (non preoccupatevi per le sei precedenti puntate, eccole qui: 1 - 2 - 3 - 4 - 5 - 6).

La Statistica non è facile e c'è chi la ignora completamente. Ma c'è anche chi legge articoli su internet o anche libri cartacei di statistica, senza capirci granché, o - al limite - prendendo fischi per fiaschi. Il punto è che la statistica (come la matematica, la fisica, la chimica, ecc.) richiede molto tempo di studio, elaborazione, applicazione ed esperienza. Ed io son qui proprio per mettere a vostra disposizione i miei anni di studio e di esperienza e le risposte alle innumerevoli domande, che mi sono state poste negli anni, da tanti studenti. 

Oltretutto c'è un'altra questione molto importante: non so se dagli anni Venti del '900 o addirittura da prima, è stata posta una separazione fra umanesimo e scienza. Da una parte la cultura, ovvero arte e letteratura e quindi gli intellettuali e dall'altra parte la scienza, spesso ridotta a tecnologia applicata e quindi i "tecnici" e gli scienziati. E' ora di riconciliare i due fronti opposti e far rientrare la scienza nella cultura. Perché la scienza è cultura. E quindi anche la Statistica è cultura. Di conseguenza il mio (ambizioso) obiettivo è semplicemente parlare di statistica, cioè parlare di cultura, in una parola fare cultura statistica.

Da dove comincio? Oggi mi va di iniziare da "Statistica multivariata - Analisi esplorativa dei dati" di Luigi Fabbris (pubblicato da McGraw-Hill un po' di anni fa). Il motivo è presto detto: Fabbris riesce a far luce (già nella parte iniziale dei suo testo) su alcuni elementi di statistica che spesso vengono equivocati, se non del tutto ignorati. Prima di tutto, del fenomeno di interesse, avete già una certa (buona) conoscenza? Sì? Allora potete procedere con l'approccio confermativo: stabilite delle ipotesi e poi le verificate. La vostra conoscenza iniziale del fenomeno è scarsa? Allora potete usare l'approccio esplorativo. Ciò implica effettuare un'analisi dei dati a priori, per poi trovare delle relazioni fra gli stessi ed (eventualmente) definire un'ipotesi di ricerca. 

Per la ricerca bastano gli statistici? No. "Per realizzare compiutamente una ricerca si debbono, invece, attivare sia le competenze metodologiche appropriate, sia quelle pertinenti alla sostanza del fenomeno investigato" scrive Fabbris. Allo statistico va quindi affiancato l'esperto del tema di ricerca. Ciò in quanto uno statistico è un esperto di statistica, non è esperto di qualunque cosa: ricordiamo qui che i metodi della statistica vengono applicati in una miriade di settori, appunto eterogenei fra loro.

E se dalla ricerca si ottiene un risultato incredibilmente innovativo? Totalmente diverso da ciò che ci si poteva aspettare? Assolutamente in contrasto con tutte le ricerche precedenti? "Un altro suggerimento procedurale è di non fidarsi se i risultati sono così innovativi da porsi in netto contrasto con il buon senso, se non dopo aver analizzato e rianalizzato i dati con altri metodi" afferma Fabbris. Ed io sono d'accordo al 100%.

Ma "l'esito di un'analisi di dati rilevati in una indagine statistica è condizionato dalla qualità dei dati stessi" aggiunge l'autore. D'altronde, è risaputo: se raccogli dati-spazzatura otterrai solo risultati-spazzatura. E le tecniche matematico-statistiche, per quanto sofisticate siano, non sono in grado di supplire alla carenza di dati di qualità.

Infine, se anche i dati raccolti fossero di buona qualità, i risultati dipenderebbero comunque da quanto in origine, sia stato ben messo a fuoco il problema oggetto di indagine. Prima di partire con un'indagine statistica occorre focalizzare il più possibile il problema (informativo) che si vuole risolvere. Altrimenti si rischia di formulare il problema dopo la rilevazione dei dati, e questo non va bene, in quanto i dati vanno raccolti sulla base del problema da risolvere. 

Buon Ferragosto a tutti e arrivederci alla prossima puntata!

Walter Caputo

Divulgatore specializzato in Scienze Statistiche

Autore del libro: "Non è colpa della statistica" edito da C1V Edizioni


Nessun commento