L’analisi dei dati è fondamentale per arrivare ad una lettura più chiara possibile dell’andamento dell’epidemia del virus SARS-CoV-2. Al momento, sono disponibili i dati aggregati del numero di casi positivi identificati di Covid-19, ovvero casi sintomatici o connessi con precedenti casi identificati, del numero dei decessi, del numero di guariti e del numero di tamponi, cioè di test, effettuati. Sulla base dei dati a disposizione abbiamo condotto un’analisi statistica volta alla previsione di breve periodo di nuovi casi positivi identificati di Covid-19 in Italia.
Fino ad oggi non è stato possibile analizzare le serie dei decessi e delle guarigioni, con una certa confidenza dei risultati, vista l’esigua numerosità dei dati registrati. Si potrebbero utilizzare i dati provenienti da altri Paesi, come la Cina, ed utilizzarli come se il virus si comportasse in Italia come negli altri Paesi. Purtroppo non sarebbe realistico: in Italia ogni soggetto affetto da Covid-19 al momento rischia di contagiare circa 2,85 persone (in base al cosiddetto fattore R0), che a loro volta contribuiranno alla diffusione del virus contagiando anch’esse tra le 2 e le 3 persone, e così via. Infatti in questa fase la velocità di trasmissione sembra essere maggiore in Italia rispetto all’intervallo fornito dall’OMS, che è pari a 1,4-2,5.
Il fattore R0, che è una buona misura della velocità di trasmissione del virus, dipende dall’attitudine del virus a diffondersi, dalla durata dell’infezione e dal numero di contatti che una persona ha. Non avendo un vaccino a disposizione e non avendo informazioni attendibili sull’effetto degli antivirali, le prime due determinanti, al momento, non sono però prevedibili. Si può invece intervenire sulla terza componente, ma assumere che i comportamenti sociali in Italia siano simili a quelli in Cina appare davvero azzardato. Dunque con i dati a disposizione al momento è possibile solamente prevedere il numero di futuri casi positivi. Con il passare dei giorni, tuttavia, sarà finalmente possibile fornire anche previsioni accurate anche del numero di decessi e guarigioni.
Qual è, allora, l’andamento dell’epidemia in questo momento? I dati analizzati fanno riferimento al periodo dal 21 febbraio al 9 marzo. Il modello di breve periodo è stato validato sui dati noti e si può prevedere il seguente numero cumulato di nuovi casi positivi: 10.659 come stima puntuale per il 10 marzo (10.455 come limite inferiore e 11.667 come limite superiore), 12.325 per l'11 marzo (11.885-14.545), 14.196 per il 12 marzo (13.348-17.765).
Tali estremi sono una stima approssimata prudente ed ottimistica, suscettibile di variazioni dovuta alla forte variabilità dei dati aggregati attualmente a disposizione. Tecnicamente, il modello utilizzato per la stima dei casi positivi identificati di Covid-19 è una regressione log-lineare Binomale Negativa, in cui il numero di tamponi giornaliero viene stimato attraverso un modello INteger valued AutoRegressive (INAR). Per dare una misura dell’andamento dell’epidemia l’approccio utilizzato è in due fasi. Inizialmente si produce una stima del numero di tamponi effettuati giornalmente, sulla base dei dati dei giorni precedenti. Successivamente, tenendo conto di tale quantità, si determina una stima del numero nuovi casi positivi identificati. Sono stati utilizzati diversi modelli statistici, per verificare la robustezza dei risultati, cioè quanto le stime siano sensibili a diverse ipotesi, viste le poche informazioni a disposizione.
L’incertezza e la variabilità delle informazioni attualmente a disposizione rendono qualsiasi stima soggetta a possibili, più o meno grossolani, errori. Una maggiore disponibilità di dati consentirebbe di fornire informazioni più accurate. In particolare, la disponibilità di dati individuali consentirebbe una stima dei contagiati non diagnosticati, cioè coloro che sono affetti dal Covid-19, ma che ancora non sono stati sottoposti al tampone che ne avrebbe decretato la positività. Riteniamo, sulla base di stime preliminari su dati aggregati, che questa quota di soggetti sia rilevante e possa rappresentare un possibile pericolo per la salute pubblica, laddove non venisse individuata e diagnosticata in tempi rapidi. Questo rischio è accresciuto dalla elevata velocità di contagio del virus attualmente riscontrata.
Per poter ridurre il fattore R0, cioè il numero di persone che ognuno di noi può potenzialmente contagiare, l’unico intervento possibile è ridurre il numero medio di contatti per persona. Più abbiamo contatti, più il virus si trasmetterà velocemente. Se la velocità di diffusione del virus non verrà ridotta in tempi brevi, il sistema sanitario potrebbe entrare in crisi, con evidenti ricadute sulla salute pubblica.
A cura di “Stat-Group-19”: Fabio Divino (Professore Associato di Statistica, Università del Molise), Alessio Farcomeni (Professore Ordinario di Statistica, Università di Roma Tor Vergata), Giovanna Jona Lasinio (Professore Ordinario di Statistica, Università di Roma La Sapienza), Gianfranco Lovison (Professore Ordinario di Statistica, Università di Palermo), Antonello Maruotti (Professore Ordinario di Statistica, LUMSA, Roma)