lunedì 19 ottobre 2020

Uno strumento del demonio: la scala logaritmica!

Uno strumento molto potente, se solo sapessimo come funziona

Guardate questo grafico: mostra il numero delle terapie intensive dall'inizio dell'epidemia fino a metà di agosto 2020.


 

Perfetto, verrebbe da dire: l'epidemia è finita. Basta aspettare qualche altra settimana che guariscano gli ultimi malati, e tutto tornerà come un tempo! 

E infatti tanti lo dicevano, guardando questo grafico, nonostante il leggero aumento di casi dovuto a pullman di discotecari che tornavano dalla Croazia o dalla Grecia. D'altra parte, siamo onesti: come preoccuparsi di fronte a questo grafico? Nessun accenno di incremento di terapie intensive era minimamente visibile!

Questo grafico è realizzato usando, come scala delle ordinate (quella verticale), la scala "lineare". Lineare vuol dire che se ho il doppio di casi rispetto al giorno prima, il punto lo metto il doppio più in alto rispetto al punto del giorno prima. Se ho 10 volte più casi, devo metterlo 10 volte più in alto rispetto al precedente, e così via. Questo implica - cosa che vedremo rivelarsi cruciale - la necessità di avere una scala sufficientemente espansa da mostrarci contemporaneamente sia quando abbiamo dieci casi che quando ne abbiamo diecimila.

Il problema si risolve facilmente usando una scala misteriosa: la scala logaritmica! Misteriosa in un paese dove risolvere una proporzione è per tanti un problema insormontabile. E lo stesso grafico di prima, utilizzando questa scala misteriosa, a metà agosto appariva così.




Vedete quella risalita delle terapie intensive nella seconda metà di agosto? Notate che era totalmente invisibile nel grafico di prima, quello in scala lineare, a meno di non ingrandirlo a dismisura? (il biologo Enrico Bucci lo fece, e fu tacciato di ingannare con un uso improprio della scala! - fonte) E infatti la maggioranza della gente, guardando il grafico in scala lineare diceva "evviva, epidemia finita, il virus è clinicamente inesistente!". 

Per inciso, le terapie intensive non dipendono dal numero di tamponi fatti, dallo screening, dal tracing, da Immuni scaricato o no, dall'efficienza delle ASL, e da niente altro se non dal fatto che si sta molto male. E se si sta male, quello è un dato oggettivo, di fronte al quale il numero molto maggiore di tamponi effettuati rispetto a marzo è del tutto irrilevante.

Solo alcuni uccelli del malaugurio invece dicevano: "Occhio, c'è una leggera ripresa dell'epidemia! Non la vedete nella scala lineare, ma usando la scala logaritmica si vede bene".

Ma come funziona la scala logaritmica? La scala logaritmica è lineare non nel valore che vogliamo riportare, come succede appunto nella scala lineare, ma nel logaritmo di quel numero. Il logaritmo di un numero (in questo caso il logaritmo in base 10), dove il numero, sempre in questo caso, è quello delle terapie intensive, è l'esponente che bisogna dare a 10 per ottenere quel numero.

Quindi se ho 10 casi, l'esponente che devo dare a 10 per ottenere 10 è 1, e quindi il logaritmo in base 10 di 10 è 1. Se ho 100 casi, l'esponente che devo dare a 10 per ottenere 100 è 2, e quindi il logaritmo in base 10 di 100 è 2, e così via. Quindi nella scala logaritmica, se nelle ordinate ho il punto relativo a - mettiamo - 10 terapie intensive, il punto relativo a 100 terapie intensive non starà 10 volte più in alto rispetto a 1, ma solo 2 volte più in alto, quello a 1000 sarà 3 volte più in alto, e così via. In pratica ai punti fra 1 e 10 è riservato nella scala lo stesso spazio che fra 10 e 100, o fra 100 e 1000 etc. La scala logaritmica, si potrebbe dire, tutela le minoranze!

Questo modo di graficare i dati ha un enorme vantaggio in quelle situazioni in cui nello stesso grafico devo mettere numeri piccoli e numeri grandi contemporaneamente, perché permette di valutare l'evoluzione dei dati contemporaneamente sia quando i valori sono bassi, che quando sono alti. Nel nostro caso, sia quando le terapie intensive sono a 10, sia quando sono a 1000.

Infatti, mettiamo che abbia un grafico in scala lineare che ad aprile arrivava a un massimo di 4000 terapie intensive. Se ad agosto ne ho mediamente 40, queste saranno schiacciate giù in basso, compresse dal fatto che la scala deve essere tale da contenere il numero più alto possibile, che è 4000. A quel punto, che il mio dato sia 40 o 60, a meno di non avere la vista da supereroe, non fa differenza. E questo è esattamente il caso delle terapie intensive a metà agosto: il picco di aprile, bello alto, oscurava completamente qualunque variazione dei dati in agosto. Ed ecco che il virus, nella mente di alcuni, diventava clinicamente inesistente.

E quindi se a un certo punto passo in pochi giorni da 40 a 80 terapie intensive, con la scala lineare non me ne accorgo neanche, per colpa di quel 4000 lassù che mi comprime rendendo invisibili tutte le piccole differenze fra i punti. E se passare da 40 a 80 significa, come in questo caso, raddoppiare il numero delle terapie intensive in pochi giorni, accorgersene per tempo può essere un indicatore di un qualche tipo di problema. Avete presente "Huston, we have a problem"? (che poi pare che abbia detto "Huston, we've had a problem", abbiamo avuto un problema, ma è lo stesso). 

Invece, usando la scala logaritmica, riesco a dare pari rilevanza a variazione percentuali del 100%, sia che si passi da 40 a 80, sia che si passi da 1000 a 2000.

Di recente, in una discussione sui social, sono stato accusato di "strumentalizzare e manipolare" i dati (il virgolettato sono le parole esatte), di "imbrogliare facendo apparire un picco più grande di quello che è", di usare "tecniche artificiose per mostrare una tendenza che è diversa", il tutto, insomma, perché avevo usato questo strumento del demonio: la scala logaritmica! Capite cosa vuol dire avere sempre viaggiato fra il 5 e il 6 in matematica a scuola? Vuol dire che poi diventi un medico, un politico, un esponente della cultura, un opinionista su Facebook, e accusi la gente di manipolare i dati perché usa la scala logaritmica!

La scala logaritmica offre anche un'altra opportunità, quella di valutare facilmente, sullo stesso grafico, l'incremento percentuale di quantità i cui valori assoluti sono molto diversi fra loro. In pratica se una data quantità, in un certo tempo passa da 10 a 20, e un'altra quantità passa, nello stesso tempo, da 100 a 200, o da 1 milione a 2 milioni, nella scala logaritmica queste tre quantità avranno pendenze uguali

Nell'ambito di questo aspetto, un'altra caratteristica della scala logaritmica è quello di far apparire una crescita esponenziale come una retta. Interessante questa proprietà, perché una retta sappiamo identificarla bene anche a occhio, anche se a scuola avevamo tra il 5 e il 6, mentre una esponenziale non è così facile da distinguere da una parabola o da una cubica, o da una qualunque altra potenza maggiore di 1. Però c'è un bel po' di differenza pratica fra un aumento esponenziale e una legge di potenza. Perché se l'aumento è esponenziale, e il giorno x hai - mettiamo - 2 casi, e ogni giorno raddoppi il numero dei casi (2 alla x, quindi), dopo un mese ti ritrovi con oltre un miliardo di casi. Se invece quel 2 iniziale crescesse col quadrato del tempo (x alla seconda), dopo un mese i casi sarebbero ancora meno di 1000. Una bella differenza! Eppure se guardi un piccolo tratto della funzione x alla seconda, non è così facile riconoscerla da un'esponenziale, se non fai bene i conti. Ma con la scala logaritmica è invece un attimo.

Facciamo quindi un esempio che spieghi bene il vantaggio dell'usare la scala logaritmica quando si vuole confrontare il tasso di crescita di quantità che numericamente sono molto diverse fra loro.


Questo grafico mostra in scala lineare l'andamento di varie quantità legate all'epidemia in corso. In particolare ci interessano le terapie intensive in viola, piccole piccole e schiacciate in basso, che uno direbbe che non contano nulla, e sono quasi a zero; il totale ospedalizzati in celeste, che è quasi zero, a parte quello sbuffetto di crescita degli ultimi giorni; e gli attualmente positivi in giallo, che loro invece si vede bene che hanno una crescita bella gagliarda! Guardando questo grafico verrebbe quindi da dire che chi sta realmente crescendo sono solo i positivi in giallo, e invece i realmente malati, sia ospedalizzati (in celeste) che in terapia intensiva (in viola), oltre a essere molti di meno non crescono poi nemmeno così tanto rispetto ai positivi, che però, essendo questi ultimi largamente asintomatici, alla fine chi se ne frega! Da questo grafico verrebbe da dire che assistiamo sostanzialmente soltanto a un aumento di positivi largamente asintomatici, e quindi il problema Covid in Italia praticamente non esiste più.

Adesso però guardiamo lo stesso grafico con lo strumento del demonio. Sono gli stessi dati, gli stessi numeri, ma graficati con la scala logaritmica, che ci permette, dicevamo prima, di apprezzare le differenze fra conteggi che avvengono a scale diverse (totale positivi, che sono tanti, totale ospedalizzati, che sono così così, e terapie intensive, che sono pochi), ma soprattutto ci permette di confrontare il modo in cui variano nel tempo queste diverse quantità.

In scala logaritmica, lo stesso grafico di prima appare così.



Magia! Con lo strumento della scala logaritmica, questo artificio fuorviante e manipolatore, scopriamo che terapie intensive, ospedalizzati e perfino gli attualmente positivi seguono tutti lo stesso trend!!! Ma proprio uguale, anche nel crescere, poi calare un pochino la crescita, poi riprenderla, e così via. E lo seguivano anche nei mesi precedenti! E pensare che nella scala lineare sembravano così diversi!

A questo punto, dal grafico in scala logaritmica è perfino molto facile estrapolare cosa succederà al numero delle terapie intensive, se dovesse continuare la crescita attuale, che nell'ultima settimana ci appare crescere come una retta, che però in scala logaritmica rappresenta una crescita esponenziale. Basta metterci un righello, e prolungare il segmento degli ultimi 7 o 8 giorni. Lo possono fare tutti, politici, medici rianimatori e commentatori di Facebook, anche se avevano fra il 5 e il 6 in matematica al liceo. E se lo si fa viene fuori che - se i dati dovessero continuare a evolversi nel tempo come stanno facendo da almeno una settimana - in una ventina di giorni si raggiungerebbe il livello di terapie intensive che avevamo nel momento peggiore ad aprile. 

Che strumento manipolatore, fuorviante e perverso, questa scala logaritmica!




26 commenti:

  1. Grazie Stefano. Anche se mi hai fatto correre un brivido gelido per la schiena...
    Nonostante l'opera omerica, ancora non abbiamo capito, dopo millenni, che Cassandra ha SEMPRE ragione. Non resistiamo alla tentazione di pensare che arriverà una bella bambina dai capelli turchini a risolvere i problemi.

    RispondiElimina
  2. Buongiorno, i suoi articoli sono sempre stimolanti, grazie!

    Secondo me la frase:
    "permette di valutare l'evoluzione dei dati contemporaneamente sia quando i dati sono pochi, che quando sono tanti. Nel nostro caso, sia quando le terapie intensive sono a 10, sia quando sono a 1000."

    può essere fuorviante. Non sono i dati ad essere 'pochi' o 'molti', ovviamente, sono i loro valori ad essere 'alti' e 'bassi' contemporaneamente (separati da vari ordini di grandezza, insomma).

    Mi sbaglio?

    RispondiElimina
    Risposte
    1. si, è corretto quello che dici. Ci avevo pensato, ma ho voluto usare un termine un po' grossolano, sperando di non appesantire troppo il discorso. Magari lo cambio come suggerisci. Grazie

      Elimina
  3. Ai tempi della sperimentazione elettronica audio (ormai chi fa più elettronica sperimentale?), per avere i grafici delle prestazioni degli amplificatori si usava spesso questa scala, ma erano logaritmici entrambi gli assi.
    Forse si trova online da qualche parte nella descrizione di qualche apparecchio del genere.
    Siccome io facevo più elettronica digitale o di potenza (alimentatori), non l'ho mai usata, però. [oops]

    RispondiElimina
    Risposte
    1. È una scala bilogaritmica, è utile per stabilire se due grandezze sono legate da una legge di potenza e, se lo sono, determinare l'esponente.

      Elimina
  4. Spiegato in questo modo, l'andamento della pandemia ha un effetto del tutto diverso dalle notizie che riempiono ogni giorno i notiziari; non c'è da star tranquilli proprio per nulla. Purtroppo temo che i concetti qui espressi in forma comprensibilissima siano comunque fuori dalla portata di gran parte di "medici, politici, esponenti della cultura, opinionisti su Facebook".
    Purtroppo

    RispondiElimina
  5. Penso che prenderò spunto (grafici compresi) per fare un po' di lezioni su esponenziali e logaritmi ai miei studenti, magari prendo tre piccioni con una fava: capiscono un pochino l'importanza della matematica, capiscono che quello che leggono in giro va opportunamente elaborato e filtrato, capiscono che la situazione è grave e si tengono quella cavolo di mascherina sulla faccia quando parlano tra loro.

    RispondiElimina
    Risposte
    1. Un sito con molti grafici in cui puoi cambiare al volo la scala da lineare a logaritmica è questo: https://covid19.infn.it/

      Elimina
    2. Un sito con molti grafici in cui puoi cambiare al volo la scala da lineare a logaritmica è questo: https://covid19.infn.it/

      Elimina
  6. Si potrebbe dire che la scala logaritmica "espande" i valori "piccoli" e "comprime" i valori "grandi" ?

    RispondiElimina
    Risposte
    1. In un certo senso sì. All'intervall fra 1 e 10, o fra 10 e 100, o fra 100 e 1000, etc, è riservato lo stesso spazio nella scala.

      Elimina
  7. Io avevo 5 di matematica.. Ma mi chiedo: per misurare qualcosa che si evolve esponenzialmente, un virus, perché 1 contagia 2,2 contagia 4,ecc.. Sembrerebbe abbastanza logico usare una Scala logaritmica.. E ora volete dirmi che chi dovrebbe saperla usare non solo non l'ha usata ma che le restrizioni vengono emesse in ritardo di 2 mesi?.. Ottimo..

    RispondiElimina
  8. Io ho consegnato il bianco il tema di matematica alla maturità ma anche se non seguo perfettamente tutti i passaggi, il concetto è chiarissimo. Come è chiarissimo il risultato verso il quale stiamo andando. Grazie. Speriamo che tanta gente, soprattutto tra i negazionisti, ne prenda atto

    RispondiElimina
  9. Grazie, davvero interessante. Un’osservazione che poco c’entra con l’argomento, ma che puntualizza quanto da Lei citato: we’ve had a problem è Present Perfect, che NON equivale al nostro passato prossimo, lo cerchi su una grammatica per favore. Questo per dire che forse bisognerebbe parlare di un argomento solo quando lo si conosce e come vede, non riguarda solo la matematica

    RispondiElimina
  10. Ottimo articolo, te lo condivido su Twitter dove mi puoi trovare @Francesco_Dini

    RispondiElimina
  11. Ottima spiegazione! Grazie.

    RispondiElimina
  12. Dall'ultimo grafico si vede che la curva delle morti pero' non segue le altre, anzi e' rimasta pressoche piatta. Che significa?

    RispondiElimina
    Risposte
    1. Giuseppe Rossi1 novembre 2020 03:19

      Ho notato la stessa cosa.
      A me sembra un segnale positivo.

      Elimina
    2. Il numero dei morti non è una quantità confrontabile con il numero delle terapie intensive o degli ospedalizzati, perché non può mai diminuire. Lo stesso vale anche per il totale dei contagiati, che integra fin dall'inizio dell'epidemia. Per entrambe queste quantità il dato del giorno precedente risente infatti di tutto ciò che è successo fin dall'inizio dell'epidemia. Se invece si guarda il numero di malati giornalieri, e il numero dei morti giornalieri, si vede come entrambi crescano.

      Elimina
    3. Giuseppe Rossi1 novembre 2020 11:09

      Se la logaritmica ci indica il tasso di crescita, io vedo che la crescita dei decessi a marzo seguiva parallelamente le altre curve e adesso invece no.

      Elimina
    4. Il numero di morti è un integrale dal tempo zero, esattamente come la curva rossa, che rappresenta il numero di contagiati fin dall'inizio. Sono quantità che per definizione evolvono in modo diverso dalle altre quantità e non possono mai calare (non esistono gli "attualmente morti"). Soltanto all'inizio dell'epidemia, infatti, il numero del totale dei contagiati, dei morti, e degli attualmene positivi, seguiva trend simili. Se uno osserva lo stato della curva rossa (cioè l'integrale dei positivi da sempre) come è adesso, si vede che ha un trend ben diverso dagli attualmente positivi. Il motivo è che, come per i morti, sono due quantità diverse. La prima è l'integrale dei contagiati, la seconda mostra lo stato attuale.

      Elimina
    5. Giuseppe Rossi2 novembre 2020 06:34

      Quindi il fatto che la curva era parallela e adesso non lo è più è irrilevante e in realtà la crescita dei dati quotidiani è rimasta simile?

      Elimina
    6. Non sono sicuro di capire cosa intende. La curva dei decessi quotidiani è in crewscita, come si vede qui: https://www.worldometers.info/coronavirus/country/italy/.
      Nello stesso link si vede invece anche la curva "Total Deaths" (in arancione), che è molto più spianata, perché è l'integrale della curva precedente. I grafici dell'articolo sono invece tratti da https://covid19.infn.it/

      Elimina
    7. Giuseppe Rossi3 novembre 2020 01:27

      Intendo se la crescita è rapida come a marzo oppure più lenta.
      A me sembra nettamente più lenta, tendente alla stabilità sui decessi quotidiani.

      Elimina
  13. bellissimo articolo. Complimenti!
    la scala logaritmica come scala democratica ("tutela le minoranze") mi mancava :)

    RispondiElimina