lunedì 19 ottobre 2020

Uno strumento del demonio: la scala logaritmica!

Uno strumento molto potente, se solo sapessimo come funziona

Guardate questo grafico: mostra il numero delle terapie intensive dall'inizio dell'epidemia fino a metà di agosto 2020.


 

Perfetto, verrebbe da dire: l'epidemia è finita. Basta aspettare qualche altra settimana che guariscano gli ultimi malati, e tutto tornerà come un tempo! 

E infatti tanti lo dicevano, guardando questo grafico, nonostante il leggero aumento di casi dovuto a pullman di discotecari che tornavano dalla Croazia o dalla Grecia. D'altra parte, siamo onesti: come preoccuparsi di fronte a questo grafico? Nessun accenno di incremento di terapie intensive era minimamente visibile!

Questo grafico è realizzato usando, come scala delle ordinate (quella verticale), la scala "lineare". Lineare vuol dire che se ho il doppio di casi rispetto al giorno prima, il punto lo metto il doppio più in alto rispetto al punto del giorno prima. Se ho 10 volte più casi, devo metterlo 10 volte più in alto rispetto al precedente, e così via. Questo implica - cosa che vedremo rivelarsi cruciale - la necessità di avere una scala sufficientemente espansa da mostrarci contemporaneamente sia quando abbiamo dieci casi che quando ne abbiamo diecimila.

Il problema si risolve facilmente usando una scala misteriosa: la scala logaritmica! Misteriosa in un paese dove risolvere una proporzione è per tanti un problema insormontabile. E lo stesso grafico di prima, utilizzando questa scala misteriosa, a metà agosto appariva così.




Vedete quella risalita delle terapie intensive nella seconda metà di agosto? Notate che era totalmente invisibile nel grafico di prima, quello in scala lineare, a meno di non ingrandirlo a dismisura? (il biologo Enrico Bucci lo fece, e fu tacciato di ingannare con un uso improprio della scala! - fonte) E infatti la maggioranza della gente, guardando il grafico in scala lineare diceva "evviva, epidemia finita, il virus è clinicamente inesistente!". 

Per inciso, le terapie intensive non dipendono dal numero di tamponi fatti, dallo screening, dal tracing, da Immuni scaricato o no, dall'efficienza delle ASL, e da niente altro se non dal fatto che si sta molto male. E se si sta male, quello è un dato oggettivo, di fronte al quale il numero molto maggiore di tamponi effettuati rispetto a marzo è del tutto irrilevante.

Solo alcuni uccelli del malaugurio invece dicevano: "Occhio, c'è una leggera ripresa dell'epidemia! Non la vedete nella scala lineare, ma usando la scala logaritmica si vede bene".

Ma come funziona la scala logaritmica? La scala logaritmica è lineare non nel valore che vogliamo riportare, come succede appunto nella scala lineare, ma nel logaritmo di quel numero. Il logaritmo di un numero (in questo caso il logaritmo in base 10), dove il numero, sempre in questo caso, è quello delle terapie intensive, è l'esponente che bisogna dare a 10 per ottenere quel numero.

Quindi se ho 10 casi, l'esponente che devo dare a 10 per ottenere 10 è 1, e quindi il logaritmo in base 10 di 10 è 1. Se ho 100 casi, l'esponente che devo dare a 10 per ottenere 100 è 2, e quindi il logaritmo in base 10 di 100 è 2, e così via. Quindi nella scala logaritmica, se nelle ordinate ho il punto relativo a - mettiamo - 10 terapie intensive, il punto relativo a 100 terapie intensive non starà 10 volte più in alto rispetto a 1, ma solo 2 volte più in alto, quello a 1000 sarà 3 volte più in alto, e così via. In pratica ai punti fra 1 e 10 è riservato nella scala lo stesso spazio che fra 10 e 100, o fra 100 e 1000 etc. La scala logaritmica, si potrebbe dire, tutela le minoranze!

Questo modo di graficare i dati ha un enorme vantaggio in quelle situazioni in cui nello stesso grafico devo mettere numeri piccoli e numeri grandi contemporaneamente, perché permette di valutare l'evoluzione dei dati contemporaneamente sia quando i valori sono bassi, che quando sono alti. Nel nostro caso, sia quando le terapie intensive sono a 10, sia quando sono a 1000.

Infatti, mettiamo che abbia un grafico in scala lineare che ad aprile arrivava a un massimo di 4000 terapie intensive. Se ad agosto ne ho mediamente 40, queste saranno schiacciate giù in basso, compresse dal fatto che la scala deve essere tale da contenere il numero più alto possibile, che è 4000. A quel punto, che il mio dato sia 40 o 60, a meno di non avere la vista da supereroe, non fa differenza. E questo è esattamente il caso delle terapie intensive a metà agosto: il picco di aprile, bello alto, oscurava completamente qualunque variazione dei dati in agosto. Ed ecco che il virus, nella mente di alcuni, diventava clinicamente inesistente.

E quindi se a un certo punto passo in pochi giorni da 40 a 80 terapie intensive, con la scala lineare non me ne accorgo neanche, per colpa di quel 4000 lassù che mi comprime rendendo invisibili tutte le piccole differenze fra i punti. E se passare da 40 a 80 significa, come in questo caso, raddoppiare il numero delle terapie intensive in pochi giorni, accorgersene per tempo può essere un indicatore di un qualche tipo di problema. Avete presente "Huston, we have a problem"? (che poi pare che abbia detto "Huston, we've had a problem", abbiamo avuto un problema, ma è lo stesso). 

Invece, usando la scala logaritmica, riesco a dare pari rilevanza a variazione percentuali del 100%, sia che si passi da 40 a 80, sia che si passi da 1000 a 2000.

Di recente, in una discussione sui social, sono stato accusato di "strumentalizzare e manipolare" i dati (il virgolettato sono le parole esatte), di "imbrogliare facendo apparire un picco più grande di quello che è", di usare "tecniche artificiose per mostrare una tendenza che è diversa", il tutto, insomma, perché avevo usato questo strumento del demonio: la scala logaritmica! Capite cosa vuol dire avere sempre viaggiato fra il 5 e il 6 in matematica a scuola? Vuol dire che poi diventi un medico, un politico, un esponente della cultura, un opinionista su Facebook, e accusi la gente di manipolare i dati perché usa la scala logaritmica!

La scala logaritmica offre anche un'altra opportunità, quella di valutare facilmente, sullo stesso grafico, l'incremento percentuale di quantità i cui valori assoluti sono molto diversi fra loro. In pratica se una data quantità, in un certo tempo passa da 10 a 20, e un'altra quantità passa, nello stesso tempo, da 100 a 200, o da 1 milione a 2 milioni, nella scala logaritmica queste tre quantità avranno pendenze uguali

Nell'ambito di questo aspetto, un'altra caratteristica della scala logaritmica è quello di far apparire una crescita esponenziale come una retta. Interessante questa proprietà, perché una retta sappiamo identificarla bene anche a occhio, anche se a scuola avevamo tra il 5 e il 6, mentre una esponenziale non è così facile da distinguere da una parabola o da una cubica, o da una qualunque altra potenza maggiore di 1. Però c'è un bel po' di differenza pratica fra un aumento esponenziale e una legge di potenza. Perché se l'aumento è esponenziale, e il giorno x hai - mettiamo - 2 casi, e ogni giorno raddoppi il numero dei casi (2 alla x, quindi), dopo un mese ti ritrovi con oltre un miliardo di casi. Se invece quel 2 iniziale crescesse col quadrato del tempo (x alla seconda), dopo un mese i casi sarebbero ancora meno di 1000. Una bella differenza! Eppure se guardi un piccolo tratto della funzione x alla seconda, non è così facile riconoscerla da un'esponenziale, se non fai bene i conti. Ma con la scala logaritmica è invece un attimo.

Facciamo quindi un esempio che spieghi bene il vantaggio dell'usare la scala logaritmica quando si vuole confrontare il tasso di crescita di quantità che numericamente sono molto diverse fra loro.


Questo grafico mostra in scala lineare l'andamento di varie quantità legate all'epidemia in corso. In particolare ci interessano le terapie intensive in viola, piccole piccole e schiacciate in basso, che uno direbbe che non contano nulla, e sono quasi a zero; il totale ospedalizzati in celeste, che è quasi zero, a parte quello sbuffetto di crescita degli ultimi giorni; e gli attualmente positivi in giallo, che loro invece si vede bene che hanno una crescita bella gagliarda! Guardando questo grafico verrebbe quindi da dire che chi sta realmente crescendo sono solo i positivi in giallo, e invece i realmente malati, sia ospedalizzati (in celeste) che in terapia intensiva (in viola), oltre a essere molti di meno non crescono poi nemmeno così tanto rispetto ai positivi, che però, essendo questi ultimi largamente asintomatici, alla fine chi se ne frega! Da questo grafico verrebbe da dire che assistiamo sostanzialmente soltanto a un aumento di positivi largamente asintomatici, e quindi il problema Covid in Italia praticamente non esiste più.

Adesso però guardiamo lo stesso grafico con lo strumento del demonio. Sono gli stessi dati, gli stessi numeri, ma graficati con la scala logaritmica, che ci permette, dicevamo prima, di apprezzare le differenze fra conteggi che avvengono a scale diverse (totale positivi, che sono tanti, totale ospedalizzati, che sono così così, e terapie intensive, che sono pochi), ma soprattutto ci permette di confrontare il modo in cui variano nel tempo queste diverse quantità.

In scala logaritmica, lo stesso grafico di prima appare così.



Magia! Con lo strumento della scala logaritmica, questo artificio fuorviante e manipolatore, scopriamo che terapie intensive, ospedalizzati e perfino gli attualmente positivi seguono tutti lo stesso trend!!! Ma proprio uguale, anche nel crescere, poi calare un pochino la crescita, poi riprenderla, e così via. E lo seguivano anche nei mesi precedenti! E pensare che nella scala lineare sembravano così diversi!

A questo punto, dal grafico in scala logaritmica è perfino molto facile estrapolare cosa succederà al numero delle terapie intensive, se dovesse continuare la crescita attuale, che nell'ultima settimana ci appare crescere come una retta, che però in scala logaritmica rappresenta una crescita esponenziale. Basta metterci un righello, e prolungare il segmento degli ultimi 7 o 8 giorni. Lo possono fare tutti, politici, medici rianimatori e commentatori di Facebook, anche se avevano fra il 5 e il 6 in matematica al liceo. E se lo si fa viene fuori che - se i dati dovessero continuare a evolversi nel tempo come stanno facendo da almeno una settimana - in una ventina di giorni si raggiungerebbe il livello di terapie intensive che avevamo nel momento peggiore ad aprile. 

Che strumento manipolatore, fuorviante e perverso, questa scala logaritmica!