Čitam u subotnjem Magazinu Jutarnjeg lista potresan dnevnik naših liječnika Davora i Stjepana koji rade na odjelima intenzivne njege u New Yorku. I naiđem na nerazumijevanje elementarne teorije vjerojatnosti, zbog kojega je Stjepan manje zabrinut za svoju sigurnost no što bi trebao biti.
Stjepan koristi „specijalnu masku P100 … koja filtrira 99.97% svega u zraku, za razliku od (standardne) N95 koja filtrira oko 95%.“ On je maksimalno izložen zarazi kada intubira pacijenta. Dosad ih je intubirao 10 i „to je 10 prilično intenzivnih izlaganja virusu, što, kad se zbroji rizik … bude 10×5% s N95 ili 10×0.03% s mojom P100 maskom. Dakle, da sam to radio sa standardnom maskom, rizik od zaraze bi mi samo od te aktivnosti bio oko 50%, ovako mi je otprilike 0.3%“
Prema Stjepanovoj računici nositelj maske N95 u 20 intubacija sigurno dolazi u kontakt s virusom (jer je 20×5% = 100%), a u 100 intubacija on u kontakt s virusom dolazi s 500% vjerojatnosti (jer je 100×5% = 500%). Što bi tih 500% vjerojatnosti uopće trebalo značiti? Takva vjerojatnost nema smisla.
Naime, vjerojatnosti opetovanih događaja ne zbrajaju se, kako to misli Stjepan, nego se množe. Ako je 95% (tj. 0.95) vjerojatnost da s maskom N95 u jednoj intubaciji ne dođete u kontakt s virusom, onda je vjerojatnost da u 10, 20, 40, 60, 80 ili 100 intubacija ne dođete u kontakt s virusom: 0.9510= 0.6 = 60%, 0.9520 = 0.36 = 36%, 0.9540= 0.13 = 13%, 0.9560 = 0.05 = 5%, 0.9580 = 0.017 = 1.7%, 0.95100 = 0.006 = 0.6%. Ili, ako vas zanimaju vjerojatnosti da dođete u kontakt s virusom:
Broj intubacija | Vjerojatnost kontakta s virusom | Stjepanov (pogrešni) račun te vjerojatnosti |
1 | 5% | 5% |
10 | 40% | 50% |
20 | 64% | 100% |
40 | 87% | 200% nema smisla |
60 | 95% | 300% nema smisla |
80 | 98.3% | 400% nema smisla |
100 | 99.4% | 500% nema smisla |
S P100 maskom Stjepan bi u 20 intubacija, prema njegovom računu, u kontakt s virusom došao s vjerojatnošću od 0.6% (jer je 20×0.03% = 0.6%). U 40 intubacija on bi u kontakt s virusom došao s vjerojatnošću od 1.2% (jer je 40×0.03% = 1.2%), u 100 intubacija šanse za kontakt s virusom bile bi mu 3% (jer je 100×0.03% = 3%), a u 1000 intubacija šanse za kontakt s virusom bile bi mu 30% (jer je 1000×0.03% = 30%).
Nažalost ti računi nisu točni. Vjerojatnost da on s maskom P100 u jednom susretu ne dođe u kontakt s virusom je 99,97%, tj. 0.9997, pa vjerojatnost da on u 10, 20, 40, 60, 80,100 ili 1000 susreta ne dođe u kontakt s virusom iznosi: 0.999710 = 0.97 = 97%, 0.94 = 0.999720 = 94%, 0.999740 = 0.88 = 88%, 0.999760 = 0.83 = 83%, 0.999780 = 0.77 = 77%, 0.9997100 = 0.73 = 73%, 0.99971000 = 0.04 = 4%. Ili, ako vas zanimaju vjerojatnosti da dođete u kontakt s virusom:
Broj intubacija | Vjerojatnost kontakta s virusom | Stjepanov (pogrešni) račun te vjerojatnosti |
1 | 0.03% | 0.03% |
10 | 3% | 0.3% |
20 | 6% | 0.6% |
40 | 12% | 1.2% |
60 | 17% | 1.8% |
80 | 23% | 2.4% |
100 | 27% | 3% |
1000 | 96% | 30% |
Nadam se da Stjepan neće doći u kontakt s virusom i da se neće zaraziti.
Nije mi baš jasno što se ovdje dogodilo. Naravno da po Newtonovoj aproksimaciji (binomni teorem), za jako mali x, 1-(1-x)^n jest približno jednako nx. Konkretno, 0.9997^{10} je daleko bliže Stjepanovoj procjeni nego Vašoj. Da je samo jedan račun, vjerovao bih da ste se zabunili u proračunu, no sa 7 računa teško mi je u to povjerovati.
Štoviše, nije teško dokazati da je razlika uvijek u istom smjeru, tako da je nemoguće da prvi primjer (5%) bude u korist Vaše procjene, a drugi (0.03%) u korist Stjepanove. Vrlo jednostavno, “onaj model koji kad-tad predviđa vjerojatnosti veće od 1” _uvijek_ pretjeruje, samo je to najlakše vidjeti nakon što prijeđe 1. 🙂