Ključni problem Fisherove metode jest da ona evaluira samo jednu hipotezu, tzv. nul-hipotezu, uzimajući u obzir sve rezultate eksperimenta koji su se mogli desiti; dok nas zapravo zanima evaluacija svih mogućih hipoteza, na temelju jednog jedinog rezultata eksperimenta, koji se stvarno desio (usp. prethodni post).

Zar ne postoji metoda koja evaluira ono što nas zanima? Postoji i čak je povijesno prethodila onoj koju danas podučavamo. Bitno je jednostavnija, informativnija i matematički objašnjiva. Uveo ju je Laplace. Najprije ćemo pokazati kako se njome rješava naš problem testiranja kovanice, a zatim ćemo objasniti zašto ju je zamijenila današnja složenija, neinformativnija i matematički neobjašnjiva Fisherova metoda.

Laplace bi problem kovanice rješavao primjenjujući Bayesov teorem (gdje == znači „proporcionalno je“):

pr(g|D,I ) == pr(g|I) pr(D|g,I).

(Teorem slijedi iz  pr(g&D|) = pr(g|Ipr(D|g,I) = pr(D|Ipr(g|D,I). Dokazao ga je i uspješno koristio Laplace, iako se zove Bayesovim. No, tako je to s atribucijama.)

Što kaže Bayesov teorem?  On vjerojatnost pr(g|D,I), koja je vjerojatnost da je vjerojatnost glave g, uz uvjet poznatog podatka D (u našem slučaju, pale su 3 glave u 12 bacanja) i općih informacija I (u našem slučaju, kovanica je bačena visoko, na podlogu koja je ravna, itd.), izvodi iz apriorne vjerojatnosti pr(g|I) i vjerojatnosti pr(D|g,I) koja je lako izračunljiva (u našem slučaju to je vjerojatnost da se 3 glave pojave u 12 bacanja uz uvjet da vjerojatnost glave iznosi g).

Vjerojatnost pr(g|I) zove se apriorna vjerojatnost ili  prior i ona predstavlja procjenu vjerojatnosti da je vjerojatnost glave g, prije no što je dostupan rezultat eksperimenta D. Aposteriorna vjerojatnost ili posterior pr(g|D,I) izračunava se množenjem priora s lako izračunljivom vjerojatnosti pr(D|g,I) koja se naziva vjerodostojnost.

Ako nemamo nikakvog razloga da preferiramo bilo koju vrijednost g između 0 i 1, kao vjerojatnost glave, onda je prior pr(g|I) uniformno distribuiran (ispričavam se što na slikama umjesto g piše H):

pr(g | I ) = 1

    fig1.pdf Fig. 1.

Vjerodostojnost je lako izračunati:

pr(D|g,I) == gn(1–g)N-n,

gdje je g vjerojatnost glave, a n broj glava u N bacanja.

Posterior, prema Bayesovu teoremu, nalazimo množenjem:

pr(g|D,I) == gn(1–g)N-n × pr(g|I) = gn(1–g)N-n,

za između 0 i 1 (inače je 0).

Dakle, bacimo li kovanicu jednom i padne li glava, posterior je:

pr(g|{G},I)==g

fig2.pdf    Fig. 2.

Bacimo li kovanicu još jednom i padne li opet glava, posterior je:

pr(g|{G,G},I)==g2

  fig3.pdf  Fig. 3.

Padne li treći put pismo, posterior je:

pr(g|{G,G,P},I)==g2(1–g)

fig4.pdf    Fig. 4.

Još jedno pismo i posterior je:

pr(g|{G,G,P,P},I)==g2(1–g)2

 fig5.pdf  Fig. 5.

I tako dalje. Sljedeće slike pokazuju kako se posterior mijenja sa sve više i više podataka o rezultatima bacanja kovanice. Položaj maksimalne vjerojatnosti sve se više stabilizira što je broj podataka veći. Osim toga, sa sve većim brojem podataka posterior postaje sve uži i uži. Kao što vidimo, nakon 1000 bacanja (uz na slici prikazane eksperimentalne podatke) vjerojatnost da je g=1/4 vrlo je velika:

fig_3x2

Ljudi bez problema prihvaćaju da je vjerodostojnost pr(D|g,I)==gn(1–g)N-n, ali imaju rezerve prema prioru. Što će biti ako krenemo od nekog drugog priora, a ne od uniformno distribuiranog. No, vidjeli bismo da bi rezultat bio isti. Naš prior tj. naše preduvjerenje o kovanici, u početku utječe na posterior (ako ste uvjereni da je kovanica „poštena“, g = 1/2, 3 glave u 12 bacanja neće vas pokolebati), no kako broj bacanja raste rezultati bacanja nadjačaju sva preduvjerenja (30 258  glava u 120 000 bacanja, pokolebati će vašu vjeru u g = 1/2). To je intuitivno jasno, a matematički slijedi iz Bayesovog teorema.

Primijetimo, da za razliku od Fisherove metode koja je odbacila ili nije odbacila samo jednu hipotezu (npr. hipotezu da je g = 1/2), Laplaceova metoda daje vjerojatnost za svaki g, dakle za svaku moguću hipotezu. To je točno ono što smo htjeli!

Kako je uopće došlo do toga da Fisherova ograničena, neprecizna i nematematička metoda zamijeni Laplaceovu generalnu, preciznu i matematičku metodu?

Laplaceova metoda temelji se na tome da su vjerojatnosti racionalne procjene koje se temelje na raspoloživim podacima. Nije odmah jasno zašto bi tako shvaćene vjerojatnosti zadovoljavale uobičajene zakone vjerojatnosti, koje su koristili Laplace i njegovi sljedbenici. Ako vjerojatnosti shvatimo kao granične relativne frekvencije, te je zakone lako dokazati (iako je sam pojam granične relativne frekvencije nekonzistentan).

Kako bilo, statističari s kraja 19. i početka 20. stoljeća počeli su insistirati da se vjerojatnosti moraju shvaćati isključivo kao granične relativne frekvencije u tzv. slučajnim eksperimentima. Takvo shvaćanje čini nelegitimnom ideju da hipoteza ima vjerojatnost. Hipoteza je istinita ili lažna, a ne nešto što može biti manje ili više vjerojatno. (Dakle, g je 1/2 ili g nije 1/2 i nema smisla govoriti o vjerojatnosti da je g=1/2, koja je temelj Laplaceovog pristupa.)

Rezultat je Fisherova metoda.

Spomenimo na kraju da od 50-tih godina 20. stoljeća znamo da vjerojatnost shvaćena kao „racionalna procjena koja se temelji na raspoloživim podacima“ zadovoljava uobičajene zakone vjerojatnosti. To je dokazano Coxovim teoremom i više nema razloga  da ograničenu, nepreciznu i nematematičku Fisherovu metodu upotrebljavamo umjesto generalne, precizne i matematičke Laplaceove metode.

Nažalost ona je i dalje sveprisutna (npr. u medicini). Da se čovjek zamisli.

Odgovori

Please log in using one of these methods to post your comment:

WordPress.com Logo

Ovaj komentar pišete koristeći vaš WordPress.com račun. Odjava / Izmijeni )

Twitter picture

Ovaj komentar pišete koristeći vaš Twitter račun. Odjava / Izmijeni )

Facebook slika

Ovaj komentar pišete koristeći vaš Facebook račun. Odjava / Izmijeni )

Google+ photo

Ovaj komentar pišete koristeći vaš Google+ račun. Odjava / Izmijeni )

Spajanje na %s