EP.1 Mentire con le statistiche: quello che i dati non dicono

In questo blog navighiamo alla ricerca di tesori nascosti e spunti di management dagli angoli più remoti e improbabili della terra (e non solo!)

EP.1 Mentire con le statistiche: quello che i dati non dicono

Io sono Capitan Cristian e con questo primo articolo inauguro ufficialmente la serie “Pirati del Management”: un viaggio alla ricerca di tesori nascosti, perle di saggezza e spunti di gestione provenienti da ogni angolo del globo… e talvolta anche da territori inesplorati: oltre i confini del mondo “reale”.

E, da buon pirata, non potevo che salpare partendo da un prezioso ritrovamento: un manoscritto del 1954 intitolato “Mentire con le statistiche”. Sfogliandolo, emergono spunti sorprendenti su manipolazioni, fraintendimenti e veri e propri inganni che possono annidarsi nel vasto oceano dei dati.

Tranquilli: non siamo pirati disonesti. E, proprio come l’autore sottolinea, questo libro non è un manuale per imbroglioni. Non contiene trucchi per ingannare clienti o fornitori, ma offre qualcosa di più utile: la capacità di riconoscere quando i dati vengono usati male.

Introduzione: il potere nascosto (e pericoloso) dei numeri

Oggi il concetto di data-driven — prendere decisioni guidate dai dati — è ormai consolidato nella maggior parte delle imprese. L’epoca in cui ci si affidava solo all’intuizione dell’imprenditore o all’esperienza del professionista è finita: il celebre “fiuto per gli affari” deve essere affiancato e confermato dai numeri.

Da temporary manager abbraccio pienamente questa filosofia. Tuttavia, esiste un punto critico che non possiamo ignorare: le statistiche, pur essendo indispensabili, possono ingannare. O meglio, possono essere manipolate per sostenere quasi qualsiasi narrativa.

Nel 1954, Darrell Huff pubblicò un piccolo libro destinato a diventare un classico: “How to Lie with Statistics” (in italiano “Mentire con le statistiche”). A distanza di settant’anni, i principi esposti in quel testo sono più rilevanti che mai. In un’epoca di Big Data, intelligenza artificiale e analisi predittive, la capacità di distinguere le correlazioni reali dalle semplici coincidenze statistiche può fare la differenza.

I due principi fondamentali della manipolazione statistica

Prima di addentrarci negli esempi specifici, è fondamentale comprendere due principi che stanno alla base di quasi tutte le manipolazioni statistiche.

Principio 1: è sorprendentemente facile manipolare i dati

Il primo principio ci ricorda che i numeri sono malleabili. A seconda di come presenti gli stessi dati, puoi raccontare storie completamente diverse. Non serve falsificare i dati per ingannare: basta scegliere il periodo temporale giusto, la metrica appropriata, il gruppo di confronto o la scala del grafico.

Un’azienda può mostrare una crescita impressionante del 300% se consideri solo gli ultimi tre mesi dopo un crollo, ignorando il calo del 70% dell’anno precedente. Oppure può presentare aumenti percentuali invece di valori assoluti (o viceversa) a seconda di cosa suona più impressionante.

Esempio pratico: immagina un’azienda che vuole presentare i risultati delle vendite. I dati reali mostrano:

  • Anno 1: 100.000€
  • Anno 2: 105.000€
  • Anno 3: 108.000€

Versione ottimistica: “Abbiamo registrato una crescita costante dell’8% negli ultimi due anni!” (Tecnicamente vero se sommi il 5% e il 3%, ma fuorviante)

Versione pessimistica: “La crescita sta rallentando: siamo passati dal +5% al +2,8%” (Stesso dato, narrazione opposta)

Versione onesta: “Crescita moderata e stabile intorno al 3-5% annuo”

Principio 2: serve pochissimo per fuorviare

Il secondo principio è ancora più insidioso: non serve molto per portare persone intelligenti a conclusioni completamente sbagliate. Basta omettere un dettaglio cruciale, presentare i dati fuori contesto, sfruttare i bias cognitivi naturali del cervello umano, o confondere correlazione con causalità.

La ragione è semplice: il nostro cervello è programmato per cercare pattern, per creare narrative coerenti, per saltare rapidamente a conclusioni. È un meccanismo evolutivo che ci ha permesso di sopravvivere (“quel rumore nel cespuglio potrebbe essere un predatore → scappo”), ma che ci rende vulnerabili quando si tratta di interpretare dati complessi.

Esempio pratico: un report mostra: “Il 90% dei nostri clienti soddisfatti ci ha valutato 5 stelle!”

Cosa manca? Il fatto che solo il 5% dei clienti ha risposto al sondaggio. È probabile che chi ha risposto fossero principalmente i clienti molto soddisfatti o molto insoddisfatti, rendendo il dato praticamente inutile.

Il tranello più comune: confondere correlazione e causalità

Questo è probabilmente l’errore statistico più diffuso e pericoloso nel mondo del business. Solo perché due fenomeni si muovono insieme non significa che uno causi l’altro.

L’esempio classico: gelati e criminalità

Immagina di essere un consulente che analizza i dati di una città durante il periodo estivo. Scopri una correlazione impressionante e controintuitiva: nei giorni in cui le vendite di gelati aumentano, aumenta anche il tasso di criminalità in strada. La correlazione è forte e statisticamente significativa. I dati sono solidi, verificati e provengono da fonti affidabili.

A questo punto, potresti essere tentato di scrivere un articolo allarmistico. Ovviamente l’assurdità è evidente quando la esprimiamo in questo modo. Ma se non facessimo attenzione, potremmo cadere in questa trappola interpretativa.

Il problema? Stai ignorando la variabile nascosta: la temperatura.

Ecco il meccanismo reale:

  • Quando fa caldo, le persone comprano più gelati (correlazione diretta e ovvia)
  • Quando fa caldo, le persone escono di più e passano più tempo per strada
  • Quando più persone sono in strada per periodi prolungati, aumentano statisticamente le opportunità per crimini di strada (borseggi, furti, rapine)
  • Il caldo stesso può influenzare l’aggressività e il comportamento umano

Le vendite di gelati non causano criminalità. Non esiste alcuna relazione causale diretta tra i due fenomeni. Sono semplicemente due effetti dello stesso fattore sottostante: il clima caldo estivo e le sue conseguenze comportamentali e sociali.

Perché questo errore è così pericoloso:

Nel contesto aziendale, confondere correlazione e causalità può portare a delle decisioni disastrose.

Decisioni sbagliate basate su dati “solidi”: un e-commerce nota che i clienti che visitano la pagina FAQ hanno un tasso di conversione inferiore. Decisione errata: “Rimuoviamo la pagina FAQ per aumentare le conversioni!” Realtà: i clienti visitano la FAQ quando hanno dubbi. Il dubbio causa sia la visita alla FAQ che la minore conversione.

Sprechi di budget: un’azienda nota che i dipendenti che usano di più lo strumento di collaboration X hanno performance migliori. Decisione errata: “Obblighiamo tutti a usare lo strumento X per 4 ore al giorno!” Realtà: i dipendenti ad alte performance sono naturalmente più collaborativi e usano più strumenti.

Interpretazioni errate del successo: un retailer nota che i negozi con più personale vendono di più. Decisione errata: “Assumiamo più personale in tutti i negozi!” Realtà: i negozi nei centri commerciali più trafficati richiedono più personale E hanno naturalmente più vendite.

Come riconoscere e evitare questo errore

Quando ti trovi di fronte a una correlazione, poniti sempre queste domande:

  1. C’è una variabile nascosta? Qual è il fattore sottostante che potrebbe spiegare entrambi i fenomeni?
  2. La relazione è reversibile? Se A causa B, allora modificare A dovrebbe modificare B in modo prevedibile. Puoi testarlo?
  3. Il timing ha senso? La presunta causa precede davvero l’effetto? O si muovono contemporaneamente (suggerendo un terzo fattore)?
  4. C’è un meccanismo plausibile? Esiste una spiegazione logica e verificabile del perché A dovrebbe causare B?
  5. Cosa dicono gli esperimenti controllati? Le correlazioni osservazionali sono solo l’inizio. Hai dati sperimentali che confermano la causalità?

I bias cognitivi che ci tradiscono

Oltre agli errori statistici puri, dobbiamo fare i conti con i nostri stessi processi mentali. Il cervello umano, per quanto sofisticato, è pieno di scorciatoie cognitive che possono portarci fuori strada.

Il bias di associazione

Questo bias rappresenta una tendenza intrinseca del cervello umano a cercare correlazioni tra eventi anche quando non esistono, o quando esiste una spiegazione alternativa più semplice. È una predisposizione profondamente radicata nella nostra psicologia evolutiva.

L’esempio evolutivo della bacca velenosa: immagina i nostri antenati preistorici in un ambiente naturale ostile. Un membro della tribù mangia una bacca particolare di un certo colore e poi, nel giro di poche ore, si ammala gravemente. Il cervello dei suoi compagni crea immediatamente un’associazione potente: “quella bacca specifica = pericolo mortale”.

Questa associazione cognitiva è estremamente veloce (non serve ripetersi l’esperienza 10 volte per imparare), completamente automatica (non richiede ragionamento consapevole o deliberato), fortemente precauzionale (il cervello preferisce l’errore per eccesso di cautela), e difficile da cancellare anche di fronte a evidenze contrarie.

Dal punto di vista evolutivo, questo meccanismo ci ha letteralmente salvato la vita per millenni. Il costo di un “falso positivo” (evitare per sempre una bacca che in realtà era innocua) è assolutamente minimo rispetto al costo devastante di un “falso negativo” (morire avvelenati perché non abbiamo imparato abbastanza velocemente).

Il problema nel mondo aziendale : questo stesso meccanismo cerebrale, che era perfetto per la sopravvivenza nella savana, trasportato nel contesto del business contemporaneo e delle decisioni basate sui dati diventa estremamente problematico. Non verifichiamo se l’associazione è realmente causale o semplicemente casuale. Non cerchiamo spiegazioni alternative o variabili nascoste. Non consideriamo seriamente la possibilità di pure coincidenze statistiche. Saltiamo direttamente alle conclusioni senza un processo analitico rigoroso.

Nel mondo degli affari, a differenza della natura selvaggia, i “falsi positivi” possono costarci molto: opportunità perse, strategie sbagliate, investimenti mal indirizzati, innovazioni bloccate.

Ed è proprio per questo che sono nate superstizioni e credenze infondate nel corso della storia umana. Un gatto nero ti attraversa la strada e poco dopo inciampi e ti fai male. Il cervello crea immediatamente l’associazione: “gatto nero = sfortuna”. Non importa che tu sia inciampato perché distratto dal telefono mentre guardavi il gatto. L’associazione è creata, rinforzata emotivamente, e difficile da cancellare anche razionalmente.

Nel business moderno facciamo esattamente la stessa cosa, solo con numeri e grafici invece che con gatti neri. E il fatto che i numeri sembrino “oggettivi” e “scientifici” ci rende paradossalmente ancora più vulnerabili a queste trappole cognitive.

Strumenti pratici: la checklist del pensatore critico

Quando ti trovi di fronte a statistiche, dati o report che dovrebbero guidare decisioni importanti, usa questa checklist:

Domande sulla fonte dei dati

  • Chi ha prodotto questi dati e con quale scopo?
  • Ci sono conflitti di interesse evidenti?
  • La metodologia di raccolta dati è trasparente?
  • Il campione è rappresentativo?
  • Quante persone/entità hanno risposto? (tasso di risposta)

Domande sulla presentazione

  • Gli assi dei grafici partono da zero o sono manipolati?
  • Vengono mostrati valori assoluti o solo percentuali (o viceversa)?
  • Il periodo temporale scelto è ragionevole o selettivo?
  • Vengono omesse informazioni rilevanti?
  • Il linguaggio è neutro o emotivamente carico?

Domande sulla statistica stessa

  • Si tratta di correlazione o causalità dimostrata?
  • Esistono variabili nascoste non considerate?
  • L’effetto è statisticamente significativo?
  • L’effetto è praticamente rilevante? (una differenza può essere statisticamente significativa ma irrilevante nel mondo reale)
  • Ci sono dati contraddittori che vengono ignorati?

Domande sui bias personali

  • Sto cercando conferme alle mie convinzioni? (confirmation bias)
  • Sto dando troppo peso a informazioni recenti o emotive? (availability heuristic)
  • Sono stato influenzato dal primo numero che ho visto? (anchoring)
  • Sto considerando anche chi “non è sopravvissuto”? (survivorship bias)

Test di validazione

  • Posso replicare l’analisi con dati indipendenti?
  • Un esperto del settore confermerebbe queste conclusioni?
  • Cosa succederebbe se facessi l’opposto di quanto suggerito dai dati?
  • Esistono esperimenti controllati che supportano queste correlazioni?

Come sviluppare un pensiero statistico solido

Strategia 1: abbraccia l’incertezza

Il primo passo per un pensiero statistico maturo è accettare che raramente abbiamo certezze assolute. I migliori decisori non cercano la certezza, ma quantificano l’incertezza, ragionano in termini di probabilità, preparano piani per scenari multipli, e aggiornano le loro credenze man mano che arrivano nuovi dati.

Linguaggio da usare:

  • Non dire “I dati dimostrano che…” ma “I dati suggeriscono che… con un livello di confidenza di…”
  • Non dire “Questo causerà sicuramente…” ma “Questo è correlato con… e potrebbe contribuire a…”

Strategia 2: cerca attivamente controesempi

Il metodo scientifico non cerca conferme, cerca di falsificare le ipotesi. Adotta lo stesso approccio: quando i dati supportano la tua ipotesi, cerca attivamente dati che la contraddicono. Affida a qualcuno il ruolo di “avvocato del diavolo”. Chiedi esplicitamente: “In quali condizioni questa conclusione sarebbe sbagliata?”

Strategia 3: impara le basi della statistica

Non serve diventare uno statistico professionista, ma comprendere alcuni concetti fondamentali: significatività statistica vs rilevanza pratica, correlazione, causalità e confounding variables, campioni rappresentativi e bias di selezione, regressione verso la media, margini di errore e intervalli di confidenza.

Risorse consigliate:

  • “The Signal and the Noise” di Nate Silver
  • “Naked Statistics” di Charles Wheelan
  • Corsi base di statistica su piattaforme come Coursera o Khan Academy

Strategia 4: costruisci una cultura data-literate

A livello organizzativo: forma i team sui principi base della statistica e dei bias cognitivi, incoraggia il pensiero critico e il dissenso costruttivo, crea processi che includano revisioni indipendenti delle analisi importanti, documenta le assunzioni dietro ogni analisi importante, e celebra quando qualcuno identifica un errore o un bias (invece di punirlo).

Red flags: quando diffidare immediatamente

Alcuni segnali dovrebbero far scattare allarmi immediati:

  • “I dati parlano da soli”. No, i dati vanno sempre interpretati in un contesto.
  • Grafici senza assi etichettati o con scale manipolate. Qualcuno sta cercando di ingannare.
  • Percentuali senza numeri assoluti. “Crescita del 500%!” può significare da 2 a 12 clienti.
  • Correlazioni presentate come causazioni senza disclaimer. “Il prodotto X aumenta le vendite del 30%!” (vs “Il prodotto X è associato a vendite 30% superiori”)
  • Campioni non rappresentativi presentati come definitivi. “Il 95% dei nostri clienti è soddisfatto!” (su 20 risposte di 5000 clienti)
  • Mancanza di contesto temporale. “Record di vendite!” (ignorando l’inflazione o la crescita di mercato)
  • Cherry-picking del periodo temporale. Mostrare solo il periodo che supporta la narrativa desiderata.
  • Assenza totale di incertezza. Tutte le previsioni e analisi hanno margini di errore. Se non vengono menzionati, qualcosa non va.

Conclusione: diventa uno scettico costruttivo (non un cinico)

I tre principi guida da ricordare

  1. “Correlation is not causation” – La correlazione non implica causalità. Cercate sempre la terza variabile nascosta.
  2. “All models are wrong, some are useful” – Tutte le analisi statistiche sono semplificazioni della realtà. La domanda non è se sono perfette, ma se sono utili per la decisione in questione.
  3. “In God we trust, all others must bring data” (W. Edwards Deming) – Ma aggiungiamo: “…and we must scrutinize that data carefully.”

Ricorda le parole di Mark Twain (spesso attribuite erroneamente a Benjamin Disraeli): “Ci sono tre tipi di bugie: le bugie, le dannate bugie e le statistiche.”

Ma la verità è più sfumata: le statistiche non mentono di per sé. Siamo noi che possiamo manipolarle, o essere manipolati da loro, se non sviluppiamo gli strumenti intellettuali per interpretarle correttamente.

Ora hai questi strumenti. Usali saggiamente.

Pirati, ci vediamo alla prossima puntata!

pirati del management - il blog

Benvenuto a bordo avventuriero! Io sono capitan Cristian, in questo blog navigo alla ricerca di tesori nascosti e spunti di management dagli angoli più remoti e spesso improbabili della terra (ma non soltanto; fumetti, libri, civiltà antiche, cultura pop… dopo anni di navigazione sono arrivato a una certezza: dirlo con certezza: possiamo trovare delle perle di saggezza, delle linee guida da seguire, dei piccoli insegnamenti e dei validi consigli di management ovunque.

Hai una mappa del tesoro da condividermi, un manufatto antico da farmi analizzare o uno spunto da suggerirmi? Scrivimi!

blank