Previsione della crescita esponenziale dei Covid19-positivi in Italia, Lombardia, Veneto ed E. Romagna

AVVISO IMPORTANTE (7/3/2020): i numeri dei soggetti positivi analizzati e predetti in questo post hanno cessato di essere affidabili da diversi giorni per due ragioni: (i) il cambio di protocollo legato alla decisione di effettuare i tamponi solo per i soggetti sintomatici; (ii) si va verso la saturazione la capacità giornaliera di temponi analizzabili. In queste condizioni, cresce di giorno in giorno la percentuale di contagiati non sintomatici che sfuggono ad ogni rilevazione, rendendo vani i tentativi di sottoporre a conferma le previsioni  relative ai positivi che si basavano su dati raccolti secondo un protocollo oramai abbandonato. I 14.000 da me ipotizzati positivi entro domenica 8 marzo non saranno raggiunti, ma solo perché sta crescedo la quota di asintomatici contagiati di cui non verremo mai a sapere che erano positivi.  La controprova è che i positivi stanno rallentando la crescita rispetto a: 1) ricoverati con sintomi, 2) pazienti in terapia intensiva e 3) morti. Per monitorare l’epidemia, bisogna ormai seguire la strada seguita da Bucci e Marinari, con l’ausilio di Giorgio Parisi, ovvero concentrarsi su queste tre serie storiche, come spiegato nel mio post del 5 maggio: https://statisticallearningtheory.wordpress.com/2020/03/05/covid-19-in-crescita-esponenziale-analizziamo-morti-terapie-intensive-e-ricoveri/

Sintesi: Nel periodo 25/2-1/3 le rilevazioni del numero pazienti positivi al Covid-19 pubblicati sul sito della Protezione civile presentano un chiaro andamento esponenziale che, in assenza di interventi radicali e tempestivi, potrebbe far superare i 14.000 positivi entro domenica 8 marzo. Con lo stesso metodo usato per l’Italia, può essere stimata la curva di crescita esponenziale dei pazienti Covid-19 positivi nelle tre regioni più colpite: Lombardia, Veneto, Emilia Romagna. Se nei prossimi giorni si osserverà una crescita in accordo con queste previsioni, vorrà dire che le misure già adottate dal Governo sono insufficienti a scongiurare scenari insostenibili per il sistema sanitario delle regioni interessate. Inoltre, è del tutto probabile che anche le rimanenti regioni italiane seguiranno lo stesso destino innescando una sorta di effetto domino in cui le ultime regioni a essere colpite non potranno nemmeno beneficiare del sostegno di quelle vicine, ormai alle corde.

L’analisi sviluppata in questo post è in accordo con i risultati ottenuti indipendentemente da Enrico Bucci ed Enzo Marinari, con l’ausilio di Giorgio Parisi, Presidente dell’Accademia Nazionale dei Lincei: Considerazioni sull’evoluzione in corso dell’epidemia da nuovo coronavirus SARS-nCOV-2 inItalia.

Fonte dei dati: Comunicati stampa delle 18:00 della Protezione Civile dal 25/2/2020 all’1/3/2020 (vedi Appendice):

http://www.protezionecivile.gov.it/web/guest/media-comunicazione/comunicati-stampa

Metodo: Regressione lineare sui dati in scala logaritmica (Fig. 1, sinistra).

Nella scala naturale, la curva di crescita è data dalla seguente funzione esponenziale  (Fig. 1, destra)

Npositivi(t) = 1.535 e0,3163 t

dove t indica il numero di giorni a partire da domenica 1 marzo 2020. Sfruttando le proprietà delle potenze, può essere scritta in modo del tutto equivalente come:

Npositivi(t) = 1.535 x 1,372t

Per esempio, se si vuole calcolare la curva di crescita in corrispondenza di domenica 8 marzo, basta inserire t=7 nella formula:

Npositivi(7) = 1.535 x 1,372t= 14.047

Previsione Italia: Se le misure distanziamento sociale nelle sue varie forme (chiusura di scuole, università, sospensione di eventi pubblici, minor uso di mezzi di trasporto pubblici, telelavoro, etc.) non sono sufficientemente radicali o tardano ad avere effetto a causa dei tempi di incubazione, la crescita continuerà a seguire la curva esponenziale. In tal caso, nel corso di una settimana (da 1/3 a 8/3) si avrà all’incirca una decuplicazione del numero dei positivi al Covid-19, che passeranno da 1.577 a 14.000.

Previsioni Lombardia, Veneto, Emilia Romagna: con lo stesso metodo usato per l’Italia, può essere stimata la curva di crescita esponenziale dei pazienti Covid-19 positivi nelle tre regioni più colpite. Per le tre curve regionali, è sembrato più robusto scartare i primi punti con poche decine di pazienti positivi. Pertanto, per avere dati più omogenei e recenti, sono stati utilizzati solo i dati degli ultimi 4 giorni.

I risultati delle previsioni nazionali e regionali sono riassunti nei seguenti grafici.

Figura 2. Numero di pazienti positivi a Covid-19 (asterischi blu) e previsione (cerchi rossi). Grafico in scala logaritmica.

_____

È possibile notare che nella scala logaritmica le quattro osservazioni (blu) sono ragionevolmente allineate lungo una retta, ovvero che stanno seguendo una crescita di natura esponenziale.  Italia, Lombardia e Veneto hanno una pendenza simile e minore di quella dell’Emilia Romagna. Tale pendenza è associata al tempo di raddoppio (doubling time) ovvero il numero di giorni necessario a far raddoppiare i pazienti positivi:

  • Italia: 2,19 giorni
  • Lombardia: 2,45 giorni
  • Veneto: 2,46 giorni
  • Emilia Romagna: 1,91 giorni

I diversi valori del doubling time potrebbero dipendere, almeno in parte, dalle diversa natura ed efficacia delle misure adottate. In ogni caso, se confermati nei giorni a venire, essi risultano fonte di grande preoccupazione per la tenuta del sistema sanitario.

Nell’ultimo grafico sono riportate le curve di crescita in scala naturale, indicando le previsioni relative a domenica 8 marzo.

Figura 3. Numero di pazienti positivi a Covid-19 (asterischi blu) e previsione (cerchi rossi). Grafico in scala naturale.

________

Se nei prossimi giorni si osserverà una crescita in accordo con queste previsioni, vorrà dire che le misure già adottate dal Governo sono insufficienti a scongiurare scenari insostenibili per il sistema sanitario delle regioni interessate. Inoltre, è del tutto probabile che anche le rimanenti regioni italiane seguiranno lo stesso destino innescando una sorta di effetto domino in cui le ultime regioni a essere colpite non potranno nemmeno beneficiare del sostegno di quelle vicine, ormai alle corde.

Published by Giuseppe De Nicolao

Professore ordinario all'Università di Pavia

63 thoughts on “Previsione della crescita esponenziale dei Covid19-positivi in Italia, Lombardia, Veneto ed E. Romagna

  1. Grazie per lo spunto e la riflessione molto interessanti.

    Sugli stessi dati (solo relativi all’Italia) ho applicato un modello di quasi-verosimiglianza con struttura di Poisson. In altre parole un modello di regressione log-lineare nel quale si assume che la variabilità sia proporzionale al numero atteso di contagi e non costante nel tempo, come invece si assume nel modello lineare.
    Le previsioni che ottengo, corredate di intervalli di confidenza al 95% a misurare il grado di incertezza associato alla stima, sono riportate di seguito. Chiaramente, le previsioni non sono molto diverse da quelle che si ottengono dall’applicazione del modello lineare. Alcune differenze, invece, si notano nell’ampiezza degli intervalli di confidenza. Il modello lineare restituisce maggiore incertezza. Anche il doubling time che ottengo è lo stesso 2.19 (circa, con errore standard 0.117). E’ molto interessante riprodurre i grafici con i dati e le previsioni unitamente agli intervalli di confidenza per il numero atteso di contagi

    Modello lineare (applicato su scala logaritmica)

    lower fit upper
    2/3 1853 2106 2393
    3/3 2466 2889 3384
    4/3 3280 3964 4789
    5/3 360 5438 6782
    6/3 5795 7461 9607
    7/3 7699 10237 13611
    8(3 10227 14045 19287

    Modello log-linear (regressione di Poisson con stima del coefficiente di dispersione): intervalli di confidenza ottenuti sulla scala del legame

    lower fit upper
    2/3 1908 2111 2335
    3/3 2542 2897 3301
    4/3 3383 3976 4672
    5/3 4498 5456 6618
    6/3 5979 7488 9379
    7/3 7945 10277 13294
    8/3 10557 14105 18847

    Il codice R utilizzato è il seguente

    y=c(322,400,650,821,1049,1577)
    t=(1:6)

    plot(t,log(y),pch=16)

    #### linear model
    m1=lm(log(y)~t)
    p=predict(m1, newdata=data.frame(t=7:13), se.fit=TRUE)
    low=p$fit-qnorm(.975)*p$se.fit
    upp=p$fit+qnorm(.975)*p$se.fit
    mat1=exp(cbind(low,p$fit,upp))
    colnames(mat1)=c(‘lower’, ‘fit’, ‘upper’)
    round(mat1)
    mat1

    plot(t,y,pch=16)
    curve(exp(m1$coef[1]+m1$coef[2]*x),add=TRUE,lty=3)

    ### Poisson regression
    mod=glm(y~t, family=’poisson’)
    summary(mod)

    #### con sovradispersione
    mod=glm(y~t, family=’quasipoisson’)
    summary(mod)
    pp=predict(mod, newdata=data.frame(t=7:13), type=’response’, se.fit=TRUE)
    low=pp$fit-qnorm(.975)*pp$se.fit
    upp=pp$fit+qnorm(.975)*pp$se.fit
    mat=cbind(low,p$fit,upp)
    colnames(mat)=c(‘lower’, ‘fit’, ‘upper’)
    round(mat)
    mat

    ### metodo alternativo sulla scala del legame
    p=predict(mod, newdata=data.frame(t=7:13), type=’link’, se.fit=TRUE)
    low=p$fit-qnorm(.975)*p$se.fit
    upp=p$fit+qnorm(.975)*p$se.fit
    matb=exp(cbind(low,p$fit,upp))
    colnames(matb)=c(‘lower’, ‘fit’, ‘upper’)
    round(matb)
    matb

    plot(t, y, pch=16)
    curve(exp(mod$coef[1]+mod$coef[2]*x),add=TRUE,lty=3)

    ### Grafico con le previsioni

    plot(1:13, c(y,exp(p$fit)), pch=16, ylab=’Casi positivi’, xlab=’time’, col=2,ylim=c(200,19000))
    points(t,y, pch=16,col=4)
    curve(exp(mod$coef[1]+mod$coef[2]*x),add=TRUE,lty=2)
    sapply(7:13, function(i) segments(i, matb[i-6,1], i, matb[i-6,3]))
    ### praticamente si sovrappongono
    curve(exp(m1$coef[1]+m1$coef[2]*x),add=TRUE,lty=2,col=3)

    #### stesso grafico ma con intervalli di confidenza ottenuti sulla scala della risposta

    plot(1:13, c(y,pp$fit), pch=16, ylab=’Casi positivi’, xlab=’time’, col=2,ylim=c(200,19000))
    points(t,y, pch=16,col=4)
    curve(exp(mod$coef[1]+mod$coef[2]*x),add=TRUE,lty=2)
    sapply(7:13, function(i) segments(i, mat[i-6,1], i, mat[i-6,3]))

    #Il doubling time è

    hatk=log(2)/mod$coef[2]
    hatk
    ### 2.19…..

    ### il suo errore standard (approssimazione ottenuta con metodo delta)
    0.01686058*(hatk^2)/log(2)

    ### 0.117

    Like

    1. Ringrazio molto del commento e dell’analisi supplementare. Quando i dati seguono il modello ipotizzato con grande fedeltà (come nel caso dei dati Italia) è noto che il modello della variabilità incide poco sui parametri stimati. Era quindi prevedibile che la stima di un parametro come ill doubling time risultasse simile a quella ottenuta a partire dalla semplice regressione lineare. È comunque utile avere anche gli intervalli di confidenza, per quanto l’aspetto decisivo è riconoscere che se si mantiene la crescita esponenziale su tempi nemmeno troppo lunghi, le strutture sanitarie verrebbero messe in ginocchio. C’è da sperare che la crescita esponenziale cessi da sola in tempo, ma per non doversi affidare troppo alla sorte, sarebbe opportuno predisporre interventi capaci di allungare il doubling time, per esempio favorendo il distanziamento sociale per un lasso di tempo opportuno.

      Like

  2. sono solo un ingegnere… spero di aver sbagliato qualcosa: basandomi sullo storico di febbraio (in regressione logaritmica trovo che il numero di contagiati al giorno si moltiplica per 1.374 rispetto al giorno precedente) mi viene che – senza misure di contenimento – i contagiati a fine marzo saranno 150 mila, picco di contagio 31/03 (1.5 mln al giorno..) e fine dell’epidemia a inizio maggio. Totale contagiati 16 milioni, decessi 320.000 (!). Ho come l’impressione che presto non ci verrà permesso di uscire di casa.

    Like

    1. Nessuno crede nelle crescite esponenziali infinite. Molto prima che finisca marzo finirebbe a pezzi il sistema sanitario delle regioni colpite dal virus (tutte, in ultima istanza, temo). Al lettore sfugge che lo scopo è fare previsioni di breve – brevissimo periodo per valutare i pericoli di collasso dell’assistenza sanitaria ai malati.

      Like

      1. Perchè fmi attribuisce “esponenziali infinite” mentre nel mio commento riporto la chiara locuzione “fine dell’epidemia a inizio maggio”? Ennesimo epigono di Bagnai? Al di là di ciò, mi pare eccessivo battezzare come “modello” un fit lineare di dati in scala logaritmica… ed estenderlo solo per 7 giorni.. Le faccio un “conto della serva” in tre passaggi, da settimana enigmistica: raddoppio casi ogni 2 giorni, numero casi al 1° giorno 1500—> 3° giorno 3000—>5° giorno 6000—>7° giorno 12000. il mio “modello-settimana-enigmistica” prevede 12000 casi l’8/03, il suo 14000. Senza tanti onanismi accademici. Facciamo un paper?

        Like

      2. “All models are wrong some are useful”, diceva il saggio. Perché estenderlo solo per 7 giorni? Il modello è sicuramente sbagliato (nel medio-lungo periodo) ma molto utile nel breve periodo per anticipare quale Tsunami sta per abbattersi sulla Sanità.


        Like

  3. Questi grafici suggeriscono più o meno esplicitamente l’idea – terrificante – che stiamo osservando la diffusione della malattia in tempo reale, e non ricostruendo ex post la sua propagazione. Se nonostante gli sforzi fatti ad ora la malattia si diffonde al ritmo a cui vediamo crescere i casi, siamo non solo fritti, ma molto peggio dei cinesi nel controllare la diffusione. Se invece stiamo rapidamente ricostruendo una rete di contagi che si è formata prima che le misure fossero implementate, possiamo perlomeno sperare che le misure che stiamo adottando stiano funzionando, anche davanti all’evidenza di un aumento dei casi (noti).

    È importante osservare che entrambi i fenomeni (contagio, e ricostruzione della rete del contagio in base ai sintomi) hanno una crescita attesa dei casi esponenziale! Ma uno dei due va “ad esaurimento”, l’altro no.

    È chiaro che la realtà sta a metà tra i due casi. Il problema (da quel che ho capito) è che è difficile valutare l'”età” dei casi di contagio, e quindi capire quanto c’è dell’uno e quanto dell’altro.

    Forse l’autore ha perfettamente presente questo problema, tutto raccolto nell’ambiguità delle parole “nei prossimi giorni”.

    Like

    1. Un periodo di 30 giorni è decisamente al di là di ogni ragionevole ipotesi di utiizzo di un modello il cui uso è legato alle previsioni di breve-brevissimo periodo. Spiegare che nei prossimi giorni un picco di ammalati può mandare al tappeto i sistemi sanitari regionali, più che allarmismo, è una constatazione utile a evitare il peggio.

      Like

  4. Chiaramente, aggiungo, si tratta di un mero esercizio. Mancano offset per stabilire il tasso di diffusione del contagio e altre variabili che consentano previsioni più accurate.

    Like

    1. Come già risposto ad altri, a fronte del possibile collasso imminente di alcuni sistemi sanitari regionali, la stima del tasso di contagio e/o le previsioni più accurate sono temi di grande interesse, ma al di là delle urgenze indifferibili.

      Like

      1. Quindi mi lasci capire, in base a quali dati lei parla nella sua risposta di “urgenze indifferibili”? Ritiene la risposta di salute pubblica inadeguata? Ritiene che la stampa e le autorità non abbiano allarmato a sufficienza la popolazione? Quali sarebbero le evidenze scientifiche per sostenere che la risposta di salute pubblica messa in atto dalle autorità è inadeguata? Lei ha le competenze adeguate per valutare la bontà o ottimali della risposta di salute pubblica (ambito fortemente interdisciplinare, che richiedere di considerare gli sociologici, economici, politici ed etici della risposta e del modo in cui il rischio viene comunicato)?

        Like

  5. Il virus ha periodo di incubazione di due circa settimane. Le misure contenitive sono state adottate da circa una settimana, quindi per un’altra settimana non potranno avere effetto, perchè per un’altra settimana vedremo manifestarsi i contagi avvenuti prima delle misure preventive. Quindi se nei prossimi giorni si osserverà una crescita in accordo con queste previsioni, non si potrà minimamente giudicare se le misure già adottate dal Governo siano o no sufficienti a scongiurare scenari insostenibili. Se nei prossimi giorni si osserverà un rallentamento, non sarà merito di quelle misure, ma di qualcosa di precedente. Solo tra una settimana l’eventuale effetto inizierà ad essere visibile, e occorrerà attendere alcuni giorni per vedere se la curva cambierà andamento.

    Like

      1. … ma il fatto che il virus possa essere incubato e trasmesso da individui asintomatici allunga il tempo durante il quale può diffondersi non diagnosticato nella popolazione. Di nuovo, il punto non è (solo) che ci sono persone che l’hanno preso e manifestato sopo 2 settimane dopo, ma che ci sono (presumibilmente) catene di contagio formatesi in sordina e rilevate ex post. E questo sembra uno scenario da film horror, ma “conditional on casi osservati” è in realtà una buona notizia.

        Like

  6. Sono sconcertato! Una curva esponenziale per descrivere una diffusione epidemica? Per questo tipo di fenomeni si utilizzano modelli SIR/SIRS/SIS (tempo-continui) o EMOD (tempo-discreti). Usare quel tipo di modelli comporta un’inefficace comprensione della realtà.

    Like

  7. Io vorrei solo capire come fa a ritenere che scrivere su un blog “un picco di ammalati può mandare al tappeto i sistemi sanitari regionali” sia una azione “utile a evitare il peggio”. Cioè, qual è il meccanismo? Non era meglio spedire il suo studio a uno dei suoi colleghi all’Istituto Superiore di Sanità? E poi, perché parla di “urgenze indifferibili” in vista del “collasso imminente di alcuni sistemi sanitari regionali”? Potrebbe essere più chiaro? Ritiene che le misure messe in campo siano inadeguate? In base a quali elementi?
    Grazie per una sua cortese risposta, che sarebbe utile per le tante persone che stanno condividendo questo post su Facebook. E sperando che non censuri questo intervento.
    Michele Loi
    Ricercatore di etica
    Università di Zurigo

    Like

  8. Giuseppe, la disponibilità dei tamponi e la loro frequenza nel passato complica un po’ anche i calcoli, o sbaglio?

    Like

    1. fino a pochi giorni fa venivano fatti anche ai non sintomatici. Da quando è subentrata la regola di farli solo ai sintomatici, vuol dire che la crescita dei contagiati è in realtà ancora più veloce di quello che si vede.

      Like

  9. Non è immaginabile una crescita esponenziale infinita. Come accade in un gran numero di fenomeni, si tratta di una crescita logistica, caratterizzata in una prima fase da un andamento esponenziale, come confermato dalle osservazioni (nel modello a mia disposizione, ho ad oggi un valore di R pari a 0.994) e da una fase di plateau praticamente costante, alla quale seguirà una lenta ma costante discesa. Il modello dà per il 4 marzo un valore complessivo di contagiati pari a 3042 +/- 4 %

    Like

  10. scusate la mia estrema ignoranza, ma quando scrive Npositivi(7) = 1.535 e0,3163 x 7= 14.045 vuol dire 1535 con esponente 0,3163*7? perchè mi viene una cifra completamente diversa? Grazie

    Like

    1. Viene diverso (di non molto) a causa del numero di cifre decimali impiegate per i due parametri del modello. Per leggibilità, non ho riportato tutti i decimali.

      Like

  11. Buongiorno sono un medico Clinico convertito alla matematica per necessità di studio
    Da matematico vorrei ricordare che
    La validità dei modelli matematici nelle epidemie dai tempi di Vito Volterra ( senatore del Regno e premio Nobel) proprio per la curva Prede / predatori è indiscutibile !
    La troppa facilità di calcolo dovuta alla troppa facilità di calcolo ci rende facile proiettare troppo in avanti le previsioni che invece vanno aggiustate di giorno in giorno con i dovuti correttivi
    Primo fra tutti il Clima !
    Sappiamo che le malattie virali iniziano a ottobre e in primavere Morbillo e altri virus hanno il loro Climax
    Quindi la miglior previsione per la fine dell’epidemia resta tuttora Giugno/ Luglio ( a occhio e croce)
    Giusto contenere il Contagio per non sovraffollate le Rianimazioni, ma Catastrofico mettere in quarantena il personale Medico e paramedico. Mi domando qualche volta cosa è successo a queste figure : in una Epidemia chi sta bene va al lavoro ! Esattamente come si curano i prigionieri in battaglia o nei campi di concentramento !

    Da sempre quando le cose vanno male i Medici stanno con i malati , non visitano per telefono per paura del contagio, e possono essere vestiti con maschere ridicole come nel settecento ma girano con coraggio tra gli appestati , perché sanno che finché non c’è immunità di “gregge “ nessuno si salva !

    Mi limito a ricordare alcuni correttivi nelle Epidemie che nella Storia hanno modificato “ il numero dicontagi giornaliero” perché sono i fattori in grado di modificare la Curva che stiamo esaminando con due esempi che tutti conoscono
    Le cure primarie ( riscaldare , nutrire dissetare) è la parte principale di cura in ogni epidemia specie in queste che Cura non hanno! E diverso avere Ebola in Sierra Leone o alla Spallanzani di Roma o a HÜBLER WAN meno fortunata
    L’Impero Romano secondo alcuni crollò per epidemie di morbillo a cui i Romani non erano a ssuefatti
    Chi poteva scappava “ in quarantena “ ( lo stesso Galeno) e le prime sette Cristianae (IV secolo) con coraggio e Controcultura , curavano e dissetavano i febbricitanti abbassando la Mortalità al 50% molti di questi si sentirono “ Miracolati” e si convertirono
    Altro fattore da ricordare : la peste del XVII secolo a Milano finì solo quando le abbondanti piogge stagionali affogarono i Topi vettori della epidemia
    in Conclusione La Matematica e la Medicina sul campo insieme migliorano la Conoscenza !
    Grazie se siete arrivati a leggere fino alla fine
    Dr Claudio Spigarelli – Medico Chirugo

    Like

  12. I positivi al test sono la somma di veri positivi e falsi positivi.
    Qual è la sensibilità e la specificità del test ?
    Se si fa il test anche agli asintomatici il valore predittivo positivo e molto basso.
    La gran parte dei positivi sono perciò falsi positivi.

    Like

  13. Grazie per la chiarezza e sinteticità dello studio . Ho iniziato a raccogliere i dati della Protezione Civile ed a diagrammarli su un foglio Excel assieme alla curva di crescita esponenziale con i parametri indicati .
    Ho pubblicato qui i risultati ed il link a questo blog :

    https://air-radiorama.blogspot.com/2020/03/i-numeri-del-coronavirus-visti-da-un.html

    Prego di indicarmi gli svarioni che avro’ sicuramente connesso in quanto non e’ il mio mestiere , in modo che possa provvedere a correggerli .

    Cordiali saluti .

    Ing. Claudio Re

    Like

  14. Con gli ultimi dati (4 marzo compreso) e una polinomiale di grado 3 con R2=0.997 si ottengono dati meno drammatici sul numero di contagiati tra il 5 e l’11 marzo:
    lower fit upper
    1 3339 3671 4003
    2 3613 4313 5013
    3 3747 5002 6257
    4 3711 5737 7763
    5 3470 6516 9562
    6 2989 7338 11687
    7 2235 8202 14168

    Questo è lo script R:

    #################################################################################
    # Periodo 26 febbraio / 4 marzo
    # https://lab.gedidigital.it/gedi-visual/2020/coronavirus-i-contagi-in-italia/?ref=RHPPTP-BH-I249591240-C12-P2-S1.8-L
    days=8
    y=c(389,650,888,1128,1694,2036,2502,3089) # contagiati
    t=(1:days)
    #### cubica contagiati
    m3=lm(y~poly(t,3))
    summary(m3)
    p=predict(m3, newdata=data.frame(t=(days+1):(days+7)), se.fit=TRUE)
    low=p$fit-qnorm(.975)*p$se.fit
    upp=p$fit+qnorm(.975)*p$se.fit
    mat3=cbind(low,p$fit,upp)
    colnames(mat3)=c(“lower”, “fit”, “upper”)
    round(mat3)
    ##################################################################################

    Like

    1. Il numero di pazienti nCoV positivi è ormai affetto da un bias dovuto al cambiamento dei protocollo (tamponi solo per i sintomatici). Stanno pertanto rallentando la crescita rispetto a ricoverati, terapia intensiva e morti. Per monitorare bisogna ormai guardare queste tre serie storiche, come spiegato nel mio post di oggi: https://statisticallearningtheory.wordpress.com/2020/03/05/covid-19-in-crescita-esponenziale-analizziamo-morti-terapie-intensive-e-ricoveri/

      Like

  15. I dati “blu” di questi diagrammi si fermano al 1° marzo; dopo però i dati comunicati dalla protezione civile nei giorni 2, 3 e 4 marzo hanno mostrato che la curva in realtà si sta “impennando” meno di così. Non è il caso di aggiornare i grafici e le tabelle così da fornire una previsione più realistica?

    Like

    1. Il numero di pazienti nCoV positivi è ormai affetto da un bias dovuto al cambiamento dei protocollo (tamponi solo per i sintomatici). Stanno pertanto rallentando la crescita rispetto a ricoverati, terapia intensiva e morti. Per monitorare bisogna ormai guardare queste tre serie storiche, come spiegato nel mio post di oggi: https://statisticallearningtheory.wordpress.com/2020/03/05/covid-19-in-crescita-esponenziale-analizziamo-morti-terapie-intensive-e-ricoveri/

      Like

  16. La curva ha cominciato presto a spianarsi, rispetto alla previsione a breve periodo di tipo esponenziale. Ad esempio per il 4 marzo il suo modello prevedeva 3964 casi, mentre i dati della Protezione civile dicono che sono 2706. Probabilmente le misure prese hanno, almeno in parte, funzionato.

    Like

    1. Il numero di pazienti nCoV positivi è ormai affetto da un bias dovuto al cambiamento dei protocollo (tamponi solo per i sintomatici). Stanno pertanto rallentando la crescita rispetto a ricoverati, terapia intensiva e morti. Per monitorare bisogna ormai guardare queste tre serie storiche, come spiegato nel mio post di oggi: https://statisticallearningtheory.wordpress.com/2020/03/05/covid-19-in-crescita-esponenziale-analizziamo-morti-terapie-intensive-e-ricoveri/

      Like

  17. Buongiorno, se non ho capito male, questo studio parte dall’analisi delle serie storiche, e stima l’andamento usando il tempo di “raddoppio” dei casi (poco piu’ di 2). Se pero’ confronto questo valore con il valore stimato di R0 vedo che è molto superiore al valore R0 (che si stima a 2.5) con tempo di incubazone da 4 a 14 gg. La stima fatta con R0 porta a una esponenziale un po’ meno ripida (con il raddoppio dei casi a 5 -7 gg).
    Non è possibile che l’uso delle serie storiche su dati affetti da grosso errore di misurazione porti a una sovrastima de l tempo di raddoppio? (in questa settimana si sono trovati molti positivi in quanto si è fatto il tampone ai familiari dei contagiati e quindi con una alta probabilità di trovarli positivi)
    Cordiali Saluti

    Like

    1. Non so che dire: pare che il virus non si fosse documentato su quelli che erano i valori stimati e la sua progressione abbia seguito un tempo di raddoppio più corto, mettendo al tappeto in meno di due settimane la sanità lombarda:
      https://www.lastampa.it/cronaca/2020/03/05/news/coronavirus-in-terapia-intensiva-i-letti-sono-finiti-il-sistema-sanitario-e-al-collasso-1.38550946?fbclid=IwAR1alz3_x62MPqFk58Kj70HF-529nWEkaZcSWLyemIGEqZ8WWXxL1EA7Y0I

      Like

      1. 🙂 “pare che il virus non si fosse documentato su quelli che erano i valori stimati……. ” bella, ammetto….. comunque ricordo cosa diceva la mia prof di modellistica. Considerare un modello uguale alla realtà è come andare al ristorante e mangiarsi il menù . e In ogni caso sia che la crescita sia un raddoppio ogni due o ogni quattro giorni, la crescita è un esponenziale più o meno schiacciato…. e in ogni caso sono guai seri..

        Like

  18. Egr Prof se nei miei calcoli grossolani applico la Sua formula, il numero dei contagiati il 5 marzo, oggi, mi risulta 5439, mentre in realtà risultano 3296; quindi vi è una certa differenza tra le previsioni e la realtà…sbaglio? Grazie!

    Like

    1. Il numero di pazienti nCoV positivi è ormai affetto da un bias dovuto al cambiamento dei protocollo (tamponi solo per i sintomatici). Stanno pertanto rallentando la crescita rispetto a ricoverati, terapia intensiva e morti. Per monitorare bisogna ormai guardare queste tre serie storiche. Ecco le previsioni degli ultimi 3 giorni:


      Per i dettagli rimando al post di oggi: https://statisticallearningtheory.wordpress.com/2020/03/05/covid-19-in-crescita-esponenziale-analizziamo-morti-terapie-intensive-e-ricoveri/

      Like

  19. 8/03/2020 previsione 14’000 casi minimi; casi ufficiali 5’883. Cosa è accaduto al modello matematico?

    Like

    1. Al “modello” (in realtà la stima del profilo rettilineo) non è successo niente. È semplicemente cambiato il modo con cui vengono raccolti i dati. Se si fanno meno tamponi, non è che diminuiscono i contagiati, ma solo quelli registrati ufficialmente. L’ho spiegato con la massima evidenza, aggiungendo un paragrafo in rosso all’inzio di questo post, ma, a scanso di equivoci, ricopio la spiegazione anche qui sotto:
      ________________
      “AVVISO IMPORTANTE (7/3/2020): i numeri dei soggetti positivi analizzati e predetti in questo post sono hanno cessato di essere affidabili da diversi giorni per due ragioni: (i) il cambio di protocollo legato alla decisione di effettuare i tamponi solo per i soggetti sintomatici; (ii) si va verso la saturazione la capacità giornaliera di temponi analizzabili. In queste condizioni, cresce di giorno in giorno la percentuale di contagiati non sintomatici che sfuggono ad ogni rilevazione, rendendo vani i tentativi di sottoporre a conferma le previsioni  relative ai positivi che si basavano su dati raccolti secondo un protocollo oramai abbandonato. I 14.000 da me ipotizzati positivi entro domenica 8 marzo non saranno raggiunti, ma solo perché sta crescedo la quota di asintomatici contagiati di cui non verremo mai a sapere che erano positivi.  La controprova è che i positivi stanno rallentando la crescita rispetto a: 1) ricoverati con sintomi, 2) pazienti in terapia intensiva e 3) morti. Per monitorare l’epidemia, bisogna ormai seguire la strada seguita da Bucci e Marinari, con l’ausilio di Giorgio Parisi, ovvero concentrarsi su queste tre serie storiche, come spiegato nel mio post del 5 maggio: https://statisticallearningtheory.wordpress.com/2020/03/05/covid-19-in-crescita-esponenziale-analizziamo-morti-terapie-intensive-e-ricoveri/

      Like

      1. secondo la Johns Hopkins CSSE i casi sono 28’000 in tutto il mondo fuori dalla Cina

        Like

      2. non sono mai stati affidabili, e in molti glielo hanno fatto notare. Anche il sottosctitto. del quale però non compare il commento…

        Like

      3. Buonasera
        Da un rapido calcolo della mortalità odierna in Cina si ottiene che oggi ( 12/3/20) essa ammonta al il 3,r% contro il 6% dell’Italia .
        Il che conferma che c’é differenza nella raccolta dati e che in Italia ne mancano molti .
        È confermata anche la mancata validità del modello esponenziale fino ad ora ottenuto – in epidemia/pandemia ogni modello esponenziale comunque é destinato a diventare Logistico ( Volterra)
        Negli anni 80 i metereologi hanno scoperto il Caos che rappresenta srmpre il destino della curva Logistica

        Segue poi in una fase sinusoide di alterna durata come dimostrano gli episodi dell’Asiatice e la Spagnola

        L’influenza Asiatica del 56 ( due milioni di morti censiti) ebbe questo andamento fino al raggiungimento della Immunità di Gregge ( individui immunizzati pari al 95% della popolazione )
        Ci vollero tre anni con remissioni della Pandemie nei mesi estivi ( fase sinusosoidale)

        È probabilmente questa la Fase che ci aspetta davanti , a meno che tra un anno non esca un vaccino , ma all’epoca si sarà fatta comunque molta strada verso l’immunità di Gregge
        Grazie per l’attenzione

        Like

  20. Scusate se insisto, ma il modello gompertziano mi sembra ancora il più adatto. Il trend in questo modello tende ad un plateau di 13000 casi, ma il limite deriva dal fatto che si basa sui valori attuali. Se la gente scappa dallo Lombardia, c’è purtroppo da attendersi un aumento incontrollabile ed un innalzamento del valore di plateau.

    Like

    1. È tutto un fiorire di “flessisti” pronti a stimare il flesso prossimo venturo di modelli logistici o di Gompertz sulla base di dati assolutamente non affidabili quali sono i positivi (il perché è spiegato in rosso all’inizio del post). Se da un lato è ovvio che non esistono crescite indefinitamente esponenziali, dall’altro è pure chiaro che questa epidemia ha ancora grandi margini di espansione come mostrato nell’analisi comparata della sua evoluzione in cinque diverse regioni:

      https://statisticallearningtheory.wordpress.com/2020/03/08/covid-19-evoluzioni-regionali-a-confronto-e-romagna-segue-lombardia-a-6-giorni-di-distanza/
      ______
      In estrema sintesi, in Emilia Romagna e Veneto si vede una crescita del tutto simile a quella Lombarda, solo ritardata di 6 e 8 giorni. Quindi, a breve, oltre alla crisi lombarda (che intanto si aggrava) ne avremo altre due di entità più meno pari a quella lombarda attuale. Subito dopo, ci sono Marche e Piemonte. Un effetto domino destinato a far collassare uno dopo l’altro i sistemi sanitari di tutte le regioni, mentre i flessisti si allenano a stimare i parametri delle Gompertz su dati intrinsecamente corrotti.

      Like

    2. Buonasera .
      Con la crescita attuale il 13 corrente mese si prevedono circa 15000 positivi .
      A quel punto si potrà cominciare a verificare quale dei modelli in questa fase rappresenta meglio la situazione reale .
      Cordiali saluti .
      Claudio Re

      Like

  21. professore, buonasera…non vedo più le Sue interessanti proiezioni e valutazioni…ci vuole aggiornare per favore? Grazie, Umberto

    Like

    1. In attesa della risposta del Professore ,dal momento che in maniera banale ho impostato un grafico Excel dove ogni giorno inserisco i dati della protezione civile e li confronto graficamente con una curva di riferimento esponenziale , i dati , se li interpreto correttamente , dicono che la progressione esponenziale nazionale non da ancora segni di flessione ( passaggio da incremento esponenziale a lineare ) .C’e’ stato solo un punto il 10 Marzo in cui sembrava esserci una leggera flessione , ma era dovuta dell’ incompletezza dei dati Lombardia di quel giorno .
      Come scritto , con i dati di domani sera 13 cm sara’ possibile verificare se sara’ superato il “plateau” di 13000 casi che qualcuno aveva ipotizzato impiegando modelli più completi che prevedono nel tempo la fase di assestamento o decrescita .Nella realtà , essendo ieri già quasi a circa 10600 casi , e dovessi scommettere guardando i grafici creati da Excel , non avrei molti dubbi , anche se come dice il Professore , la crescita esponenziale e’ un’approssimazione della prima parte dell’ evoluzione di questa oramai pandemia e non potrà continuare all’infinito per ovvi motivi . Se qualcuno volesse copia del file Excel per controllare l’andamento in tempo reale , lo metto a disposizione per il download . Essendo un Ingegnere Elettronico che non opera in questo settore posso anche permettermi di perdere la faccia e riderci sopra senza pudori , soprattutto perché in tal caso qualcuno mi correggerà e mi insegnerà .
      Claudio Re

      Like

Leave a comment

Design a site like this with WordPress.com
Get started