Kako odrediti vjerojatnost nekog događaja? Na primjer, vjerojatnost da rezultat bacanja kovanice bude glava. Ako o kovanici ne znamo ništa vjerojatnost može biti bilo što između  g=0 i g=1 (između ta dva ekstrema leži i slučaj „poštene“ kovanice g=1/2).

Naivni način rješavanja našega problema je da vjerojatnost identificiramo s relativnom frekvencijom. Dakle, kovanicu bacimo npr. 12 puta, pa ako je 3 puta pala glava vjerojatnost je 3/12, tj. g=1/4.

To je naivno, jer svatko zna da i „poštena“ kovanica g=1/2 može u 12 bacanja dati 3 glave. No, kako onda na temelju obavljenog eksperimenta (3 glave u 12 bacanja) procijeniti je li vjerojatnost 1/2 (ili 1/4 ili što već želimo procijeniti)?

To današnja školska statistika čini Fisherovom metodom testiranja hipoteza, npr. hipoteze da je g=1/2, na sljedeći način:

  • Provedemo eksperiment, tj. kovanicu bacimo unaprijed zadani broj puta, na primjer 12 puta.
  • Rezultat eksperimenta je npr. PPGPPPGGPPPP. (Ukupno ima 212  takvih nizova glava i pisama duljine 12. Oni ćine prostor mogućih ishoda tog eksperimenta.)
  • Rezultat eksperimenta sažmemo u jedan numerički podatak, npr. u broj glava koje se pojavljuju u ishodu eksperimenta. Taj sažeti podatak o rezultatu eksperimenta zove se statistika testa. U našem primjeru ta je statistika broj 3.
  • Izračunamo vjerojatnosti svih mogućih statistika testa, pod uvjetom da vrijedi naša hipoteza, koja se naziva nul-hipotezom. Podsjetimo se, naša je nul-hipoteza da je kovanica „poštena“, tj. da je g=1/2. Dakle, za svaki n izračunamo vjerojatnost pr(n) da se u 12 bacanja pojavi n glava, ako je vjerojatnost glave 1/2 (to je “12 povrh n puta 1/2 na 12”):

n

pr (n)

n

pr (n)

n

pr (n)

n

pr (n)

0

0.0001441

3

0.053710

6

0.225585

9

0.053710

1

0.0029296

4

0.120849

7

0.193359

10

0.0161132

2

0.0161132

5

0.193359

8

0.120849

11

0.0029296

12

0.0002441

  • Pogledamo rezultate koji su se mogli pojaviti, a koji su uz našu nul-hipotezu ekstremniji od rezultata koji se uistinu pojavio. Preciznije, to su rezultati čija je vjerojatnost manja ili jednaka vjerojatnosti rezultata koji se stvarno pojavio. Izračunamo vjerojatnost pr* da dođe do takvog ekstremnog rezultata. U našem se primjeru stvarno pojavilo n = 3 glave, u 12 bacanja, pa su „ekstremni rezultati“ n=0,1,2,3,9,10,11,12. Dakle, pr* je zbroj vjerojatnosti svih tih ekstremnih rezultata, tj.  pr*=0.15.
  • Nul-hipoteza se odbacuje ako je “vjerojatnost da se desi nešto tako ekstremno” manja od 0.05 tj. ako je pr*<0.05. Dakle, naša nul-hipoteza o „poštenoj“ kovanici nije odbačena jer rezultat našeg eksperimenta “nije tako ekstreman”.

Neki statističari preporučuju 0.01 ili čak 0.001 kao “neprihvatljivi ekstrem” tj. kao kritičnu vjerojatnost pr*. Prihvaćena kritična vjerojatnost zove se razinom signifikantnosti testa, a za nul-hipotezu se kaže da je odbačena na toj razini signifikantnosti, ako je pr* manja ili jednaka prihvaćenoj kritičnoj vjerojatnosti.

Razmislimo što zapravo znači da je „nul-hipoteza odbačena na nekoj razini signifikantnosti“. To znači da je rezultat eksperimenta pao u određeno područje, koje je proglašeno „područjem odbacivanja“.

Što to govori o nul-hipotezi? Danas je (barem među matematičarima) standardno gledište da odbacivanje ili ne odbacivanje nul-hipoteze nije nikakav matematički (čak ni induktivni) zaključak, nego tek „instrukcija o induktivnom ponašanju”. Ako se, uz razinu signifikantnosti 0.01, ponašamo prema toj instrukciji onda ćemo, na duge staze, istinitu hipotezu odbaciti (tj. učiniti ćemo grešku I. tipa) ne više od jednom u 100 puta.

Možemo se brinuti i o greškama II. tipa, tj. o prihvaćanju neistinite hipoteze. Vjerojatnost greške II. tipa je vjerojatnost odbacivanja istinite alternativne hipoteze Ha, prihvaćanjem neistinite nul-hipoteze H0. Komplement razine signifikantnosti odbacivanja  hipoteze Ha zove se snagom testa (dok se, u tom kontekstu, razina signifikantnosti odbacivanja nul-hipoteze H0 zove veličinom testa). Idealno bismo trebali maksimizirati snagu i minimizirati veličinu testa. No, taj je ideal nekonzistentan. Smanjenje veličine testa sa sobom nosi povećanje njegove snage i obratno.

Osim proizvoljnosti određenja „područja odbacivanja“, nekonzistentnosti istovremene redukcije veličine i snage testa, te ispitivanja samo jedne hipoteze, ova metoda ima i drugih problema. Na primjer, različito odabrane statistike testa mogu iz istog eksperimentalnog rezultata izvesti različite zaključke. To je zloglasni problem „izbora statistike“.

Tu je i problem „pravila zaustavljanja“. Razmislimo opet o kovanici bačenoj 12 puta, s ishodom koji sadrži 3 glave i 9 pisama. Gore opisani test ne možemo ni početi primjenjivali ako ne znamo je li eksperimentator planirao kovanicu baciti točno 12 puta. Što ako ju je planirao bacati do pojave 3 glave ili dok mu ne dosadi bacanje? Tada prostor mogućih ishoda iz drugog koraka  izgleda drukčije, a time i svi preostali koraci, pa i konačni zaključak. Sama činjenica da su se u 12 bacanja pojavile 3 glave nije dovoljna. Moramo znati kakav je eksperiment eksperimentator pri tome zamišljao.

No, ključni problem Fisherove metode jest da ona evaluira samo jednu hipotezu (tzv. nul-hipotezu; u našem primjeru „poštenje“ kovanice), uzimajući u obzir rezultate eksperimenta koji su se mogli desiti; dok nas zapravo zanima evaluacija svih mogućih hipoteza, na temelju rezultata koji se stvarno desio.

Fisherova metoda se naprosto ne bavi onim što nas uistinu zanima!

Previše problema za jednu (navodno) egzaktnu metodu.Zar ne postoji metoda koja evaluira ono što nas zanima, na temelju onoga što znamo (umjesto samo djelića onoga što nas zanima, na temelju onoga što ne znamo)?

Postoji i čak je starija od ove standardne, no o tome sljedećeg petka.

Odgovori

Please log in using one of these methods to post your comment:

WordPress.com Logo

Ovaj komentar pišete koristeći vaš WordPress.com račun. Odjava / Izmijeni )

Twitter picture

Ovaj komentar pišete koristeći vaš Twitter račun. Odjava / Izmijeni )

Facebook slika

Ovaj komentar pišete koristeći vaš Facebook račun. Odjava / Izmijeni )

Google+ photo

Ovaj komentar pišete koristeći vaš Google+ račun. Odjava / Izmijeni )

Spajanje na %s