Kathy Wilkes

https://currentsciencedaily.com/stories/639125743-denis-noble-upholds-philosopher-kathy-wilkes-support-for-dissident-academics

Objavljeno u filozofija, znanost | Ostavi komentar

3. VJEROJATNOST KAO STUPANJ PLAUZIBILNOSTI

Plauzibilnost i aksiomi vjerojatnosti

Pascal, Fermat, Bernoulli, Bayes, Laplace i drugi začetnici teorije vjerojatnosti smatrali su da su vjerojatnosti racionalne procjene uvjerenja koje se temelje na raspoloživim informacijama. Dakle:

Vjerojatnost propozicije A njena je plauzibilnosti s obzirom na raspoložive informacije J, oznakom Pr (A|J).

To znači da su vjerojatnosti uvijek uvjetne, jer ovise o raspoloživim informacijama. One, mogu biti subjektivne ili objektivne. Vjerojatnost Pr (A|J) subjektivna je ako je procjena da jest A, pod uvjetom da jest J, subjektivna. Ako je riječ o objektivnoj procjeni onda je vjerojatnost objektivna i tada se još naziva logičkom.

Ovaj pojam vjerojatnosti ne pretpostavlja da one postoje u stvarnome svijetu. Bacanje kovanice u stvarnome svijetu potpuno je determinirano vertikalnom brzinom v i kutnom brzinom  kojima kovanicu bacamo (usp. kraj prvog članka u seriji). Ali ako je kovanica bačena snažno, s dovoljno velikim v i , osjetljivost na početne uvjete je velika, što znači da i vrlo mala promjena početnih uvjeta v i  dovodi do promjene ishoda. Nama informacije o tim malim promjenama nisu dostupne pa za nas ishod nije determiniran, nego je slučajan. Jednaka vjerojatnost glave i pisma racionalna je procjena plauzibilnosti ishoda, jer informacije koje imamo o simetriji kovanice ne daju prednost ni jednoj njenoj strani.  Dakle, jednaka vjerojatnost glave i pisma rezultat je našeg nepoznavanja početnih uvjeta bacanja kovanice i njene simetrije, a ne neko objektivno svojstvo toga bacanja.

Svaka klasična vjerojatnost počiva na informacijama o simetričnosti odgovarajućeg pokusa i te informacije J garantiraju jednaku vjerojatnost svih elementarnih ishoda. Isto tako i relativne frekvencije ponavljanog slučajnog pokusa mogu poslužiti kao pozadinska informacija J o ishodima tog pokusa. Stoga možemo zaključiti da je pojam vjerojatnosti kao plauzibilnosti najobuhvatniji i to mu je velika prednost.  Ali nije odmah jasno zašto bi tako shvaćene vjerojatnosti zadovoljavale uobičajene aksiome vjerojatnosti, osim u zapravo posebnim slučajevima klasične i frekvencijske vjerojatnosti. Frekventisti su to smatrali nepopravljivim nedostatkom vjerojatnosti shvaćene kao plauzibilnosti i svojom velikom prednošću (zanemarujući činjenicu da je pojam granične frekvencije nekonzistentan).

Keynes i Jeffreys

Frekventistička kritika plauzibilnosti kao vjerojatnosti bila je razorna, ali jedna ju je manjina ipak preživjela.

Za Johna M. Keynesa stupanj racionalnog uvjerenja stupanj je djelomične implikacije. Ponekad premise impliciraju konkluziju, ali češće to čine samo djelomično. Keynes tvrdi da konkluzija s premisama stoji u odnosu vjerojatnosti i da je ta relacija logička, jer je vjerojatnost samo produžetak klasične bivalentne logike „istinitosti i neistinitosti”. Ali kako utemeljiti ovaj prošireni logički odnos ili, konkretnije, kako s ove logičke točke gledišta dokazati istinitost aksioma vjerojatnosti? Keynes je mislio da ih mi naprosto percipiramo kao istinite, nekom vrstom logičke intuicije.

Harold Jeffreys imao je isti logički stav prema vjerojatnosti. Bio je jedan od najranijih kritičara frekvencijske statistike, ali nije samo kritizirao. U svojoj knjizi iz 1939. riješio je mnoge statističke probleme potpuno nedostupne frekventistima. To je trebao biti jasan pokazatelj da je na pravom putu (iako mu prvih stotinjak stranica posvećenih logičkom izvođenju aksioma vjerojatnosti nije naročito uspješno). No njegov je pristup odbačen, kao i Keynesov.

Najpoznatiji kritičar bio je Frank Ramsey. Njegov odgovor 1926. na Keynesov stav da postoje logički odnosi vjerojatnosti i da se oni mogu uočiti nekom vrstom logičke intuicije, bio je jednostavan: „ja ne percipiram odnose vjerojatnosti gospodina Keynesa i, štoviše, mislim da ih ni drugi ne percipiraju“.

Riječ je o „percepciji“ aksioma vjerojatnosti koji su sada u sljedećoj formi. Vjerojatnost propozicije A uz uvjet da vrijede pozadinske informacije J, je realan broj iz [0,1], tj.

(1)          Pr (A|J)  [0,1].

 Vjerojatnost logički valjane propozicije je 1, bez obzira na pozadinske informacije J, tj.

(2)       ⊧   A      Pr (A|J) = 1.

Ako su A i B međusobno kontradiktorne propozicije (uz pozadinske informacije J) onda je vjerojatnost njihove disjunkcije aditivna, tj.

(3)         J⊧  – (AB)          Pr (A B|J) = Pr (A|J) + Pr (B|J.

Vjerojatnost konjunkcije je kvazi-multiplikativna, tj.

(4)          Pr (AB|J) = Pr (A| J) Pr (B|AJ).

Ramsey nema problema sa zaključcima teorije vjerojatnosti. Na primjer, da iz (1) – (3) slijedi Pr (A) + Pr (-A) = 1; ili da iz (1) – (3) i A B slijedi da je Pr (A) < ili = Pr (B); ili da iz (1) – (4) slijedi Bayesov teorem; itd. Problematični su aksiomi vjerojatnosti, a ne zaključci o vjerojatnostima koji slijede iz tih aksioma. Ukratko, pitanje je kako opravdati aksiome vjerojatnosti ako su vjerojatnosti racionalne procjene uvjerenja koje se temelje na raspoloživim informacijama.

Ramsey – Finettijev  Dutch book argument

Umjesto nejasnih logičkih intuicija Frank Ramsey (tek u naznaci 1926.) i Bruno de Finetti (mnogo detaljnije 1937.) ponudili su jasnu definiciju vjerojatnosti i dokazali da ona zadovoljava aksiome (1) – (4). Preciznije kazano, vjerojatnosti su definirali kao kladilačke kvocijente i dokazali su da su oni koherentni, tj. da ne dopuštaju nepoštene oklade, ako i samo ako  zadovoljavaju (1) – (4). Bio je to veliki uspjeh pa je logička teorija Keynesa i Jefrreysa zaboravljena.

Često se naglašava da nije nimalo očito da bi se kladilačke kvocijenti, ako su koherentni, trebali pridržavati aksioma vjerojatnosti. No, mislim da je to ipak očito i ponudit ću kasnije jedan očiti dokaz. No, prije toga, predstavit ću standardniju verziju dokaza da koherentnost implicira aksiome (1) – (4), tzv. Dutch book argument. (Ako vas ne zanima taj složeni argument možete ga preskočiti i nastaviti s odjeljkom „Jednostavniji argument“, bez ikakvih gubitaka.)

Dakle, zamislite mene kao kladioničara. Ako ste mi spremni platiti M’ za to da dobijete M ako se dogodi A, onda je u toj okladi na događaj A vaš neto dobitak G (A) = M – M’ ako se A dogodi, odnosno G (A) = –M’ ako se A ne dogodi. Ako definiramo V(A) = 1 ako se A dogodi i V(A) = 0 ako se A ne dogodi, onda je

G (A) = M×V (A) – M’.

Ako ste mi spremni platiti M’ za to da dobijete M samo kada je ispunjen uvjet C i dogodi se A (tj. oklada se poništava ako uvjet C nije ispunjen), tada vaš neto dobitak u okladi na događaj A pod uvjetom C iznosi

G (A|C)) = V (C) (M×V (A) – M’),

tj. oklada se poništava za V (C) = 0, a inače je kao i prije.

Ono što vam nudim, tj. M, vaš je mogući bruto dobitak ili vrijednost oklade. Ono što ste  spremni platiti za okladu, tj. M’, vaše je očekivanje od klađenja. Vaš kladilački kvocijent, u okladi na događaj A, definira se kao

q (A) = M’ / M.

U toj definiciji pretpostavlja se da je vaše očekivanje M’ proporcionalno vrijednosti oklade M, tj. da vaš kladilački kvocijent ovisi samo o propoziciji A (na koju se kladite), a ne o vrijednosti oklade M. Stvarne oklade nisu takve – za milijun puta veći dobitak rijetko je tko spreman uložiti milijun puta veći iznos – i to je slaba točka Dutch book argumenta. Ali idemo dalje s argumentom. Budući da je M’ = q(A) ×M, vaš neto dobitak  može se preformulirati kao

G (A) = M× (V (A) – q (A))

G (A|C) = V(C) ×M× (V (A) – q (A)).

Kaže se da je vaš kladilački kvocijent koherentan, tj. da je klađenje pošteno, ako ja ne mogu izbirati M  0 tako da pobjeđujem što god se dogodi (ili, ekvivalentno, da ga ne mogu izabrati tako da gubim što god se dogodi). To znači da dobitak ili gubitak koji je  0 mora ovisiti o tome što će se dogoditi. Formalno gledano, vaš kladilački kvocijent je koherentan, tj. oklada je poštena, ako G ne ovisi o V samo u slučaju da je G = 0.

Sada, kada smo definirali koherenciju (poštenost), možemo dokazati da su aksiomi vjerojatnosti (1) – (4) posljedice te definicije.

Pretpostavimo da je q (A) < 0. Ako je M > 0 (dokaz se provodi analogno i za M < 0), onda je G (A) = M× (V (A) – q (A)) > 0, neovisno o vrijednosti V (A). To znači da vi dobivate neovisno o tome što se desi, što je u suprotnosti s koherentnošću. Dakle, nemoguće je da je q (A) < 0. Slično se dokazuje  i da je nemogućeg (A) > 1, tj. q (A)  [0,1]. To je aksiom (1).

Ako je A logički valjana propozicija, onda je V(A) = 1 pa G (A) = M× (1– q (A)) ne ovisi o V. To je, zbog koherencije, moguće samo za G (A) = M× (1 – q (A)) = 0. No to znači da je q (A) = 1. To je aksiom (2).

Ako se kladite na A s kvocijentom q (A) za bruto dobitak M1, na B s kvocijentom q (B) za bruto dobitak M2, i na A v B s kvocijentom q (A v B) za bruto dobitak M; onda je vaš ukupni neto dobitak

G = M1 × (V (A) – q (A)) + M2× (V (B) – q (B)) + M× (V (A v B) – q (A B)).

Ako iz vaših informacija slijedi da su A i B međusobno kontradiktorne propozicije, onda je V (A B) = V (A) + V (B). Ako je nadalje, vaša oklada takva da je M1 = M2 = – M  0 onda je, za tu konkretnu okladu,

G = M×q (A) + M×q (B) – M×q (A v B).

Taj dobitak ne ovisi o V pa, zbog koherencije, mora biti nula,

M× (q (A) + q (B) – q (A v B)) = 0.

Iz toga slijedi da je q (A v B) = q (A) + q (B). To je aksiom (3).

Ako se kladite na AB s kvocijentom q (AB) za bruto dobitak M, na B s kvocijentom q (B) za bruto dobitak M1, i na A pod uvjetom B s kvocijentom q (A|B) za bruto dobitak M2; onda je vaš ukupni neto dobitak

G = M× (V (AB) – q (AB)) + M1× (V (B) – q (B)) + V(B) ×M2× (V (A) – q (A|B)).

Naravno, V (AB) = V (A) × V (B), pa ako je vaša oklada takva da je M2 = – M  0, vaš je neto dobitak

G = – M×q (AB) + M1×V (B) – M1×q (B) + V (B) ×M×q (A|B).

Ako je nadalje M1 = – M×q (A|B), onda, za tu konkretnu okladu,

G = – M×q (AB) + M×q (A|B) ×q (B).

Ovaj dobitak ne ovisi o V pa, zbog koherencije, mora biti nula,

M× (-q (AB) + q (A|B) × q (B)) = 0.

Iz toga slijedi da je q (AB) = q (A|B) × q (B). To je aksiom (4).

Ovo je standardni, možda ne i izrazito transparentni izvod aksioma vjerojatnosti (1) – (4) iz uvjeta koherentnosti. Sada predstavljam dokaz koji je trivijalan i potpuno transparentan (i vjerujem oduvijek poznat).

Jednostavniji argument

Umjesto koherentnosti, polazim od njezine jednostavne posljedice: za iste oklade trebate imati ista očekivanja. Ona se lako dokazuje. Naime, ako se kladite na događaj A za iznos M, s različitim očekivanjima M1 i M2, tj. s različitim kvocijentima q1 i q2, onda vam mogu ponuditi M za jedan kvocijent i –M za drugi. Vaš ukupni neto dobitak u složenoj okladi je:

G = M× (V (A) – q1) – M× (V (A) – q2) = M× (q2 – q1).

On je neovisan o V i različit je od nule (jer je q1 ≠ q2 i možemo uzeti M ≠ 0). Dakle, vaši kvocijenti q1 i q2 ne bi bili koherentni kada biste za iste oklade imali različita očekivanja.

Dvije oklade zapravo su iste, ako je vaš bruto dobitak u svakoj mogućoj situaciji isti u obje oklade.

Primjer I: ako su A i B međusobno kontradiktorni, tada je “kladiti se na A v B za M” isto što i “kladiti se na A za M i kladiti se na B za M”. Naime, budući da je AB isključeno, moguće su samo tri situacije A (-B), (-A) B i (-A) (-B) i u svakoj od njih vaš je bruto dobitak isti za obje oklade. On je M ako je A (-B) ili (-A) B, a 0 je ako je (-A) (-B).

Primjer II: “kladiti se na AB za M” isto je što i “kladiti se na B za M, a zatim se nastaviti kladiti na A za ono što ste dobili”. Sada su moguće situacije, A B, A (-B), (-A) B i (-A) (-B).  U obje oklade vaši su bruto dobici isti u svakoj od četiri situacije. Oni su, redom: M, 0, 0, 0.

Prema primjeru I, ono što ste spremni platiti za okladu na A B uz bruto dobitak M (ako se A i B međusobno isključuju), mora biti isto ono što ste spremni platiti za dvije oklade, jednu na A za bruto dobitak M i drugu na B za bruto dobitak M. To znači da je

q (A v B) ×M = q (A) ×M + q (B) ×M

pa (za M ≠ 0) odmah slijedi da je q (A v B) = q (A) + q (B). To je aksiom (3).

Prema primjeru II, ono što ste spremni platiti za okladu na AB za bruto dobitak M, mora biti isto ono što ste spremni platiti za okladu na B za bruto dobitak M, kojoj slijedi oklada na A za ono što ste prethodno dobili. To znači da je

q (AB) ×M = q (A|B) × (q (B) ×M),

pa (za M ≠ 0) odmah slijedi da je q (AB) = q (A|B) ×q (B). To je aksiom (4).

Argumenti za aksiome (1) i (2) su očiti. Ako je vaš q (A) > 1 očito gubite što god se dogodi, a ako je vaš q (A) < 0, očito dobivate što god se dogodi. Za logički valjanu propoziciju A očito dobivate što god da se dogodi, jer ona vrijedi što god da se dogodi.

Dakle, kladilački kvocijenti sasvim očito zadovoljavaju aksiome vjerojatnosti i tu nema nikakvih iznenađenja. Čak vjerujem da su ovi jednostavni argumenti za aksiome (1) – (4) bili dobro poznati od početaka teorije vjerojatnosti, jer su doista iznimno jednostavni. Možda je razlog što ih ne nalazimo u relevantnoj literaturi taj što su kladilački kvocijenti bili oduvijek problematični, jer nisu bili dobro definirani. Pretpostavka da je iznos M’, koji ste voljni platiti za okladu, proporcionalan iznosu M koji je bruto dobitak kojem se nadate, potpuno je neutemeljena (v. gore). Čak je i Ramsey bio svjestan toga kada je bezuspješno pokušao prevladati taj problem uvođenjem oklada na tzv. “ultimativna dobra”, umjesto novčanih oklada.

Coxovo rješenje

Ramseyev i Finettijev (subjektivni) pojam vjerojatnosti nije riješio probleme (objektivne) logičke vjerojatnosti Keynesa i Jeffreysa. Ali Richard Cox je 1940-tih godine izgradio nedostajući temelj za logički pojam vjerojatnosti koji je danas poznat kao bejesovska teorija vjerojatnosti, ili skraćeno BPT. Edwin Jaynes je naziva “teorija vjerojatnosti kao logika” (to je i naslov njegove knjige iz 2003.). Intuitivna privlačnost BPT (koju ćemo ilustrirati usporedbom bejesovskog i frekvencijskog testiranja kovanice u sljedećem članku) te ogromna količina uspješnih rezultata i njihova rigorozna matematička osnova od strane Coxa i drugih, čine je najboljom teorijom probabilističkog zaključivanja koju imamo. Zato je prilično čudno što se BPT uopće ne spominje u novijim udžbenicima filozofije posvećenim probabilističkom zaključivanju. Spominje se u bejesovskim udžbenicima, npr. u  udžbeniku Howsona i Urbacha iz 2006. koji BPT izrijekom proglašava najboljim pristupom „jer od svih ostavlja najmanje otvorenih pitanja“. Ali čak se i tada izostavlja Coxov matematički temelj BPT-a, jer “zahtijeva prilično sofisticiranu matematiku“. Iako matematika jest donekle sofisticirana, iznijet ću osnovnu ideju Coxovog dokaza koja i nije toliko složena.

Cox kreće od pojma „plauzibilnosti propozicije A pod uvjetom da znamo da vrijedi propozicija J“, oznakom A|J, za koju pretpostavlja da ima sljedeća svojstva.

(P1) Plauzibilnosti su realni brojevi između minimuma o, koji je plauzibilnost logičke kontradikcije i maksimuma j, koji je plauzibilnost logične istine.

(P2) Ako su A i B (uz poznate informacije J) međusobno kontradiktorne propozicije onda je plauzibilnost njihove disjunkcije “A ili B”, potpuno određena plauzibilnošću od A (uz poznate informacije J) i plauzibilnošću od B (uz poznate informacije J). Funkcija DJ koja determinira tu vezu ovisi o J.

(P3) Funkcija DJ iz (P2) je kontinuirana i striktno rastuća u oba argumenta.

(P4) Plauzibilnost konjunkcije “A i B” (uz poznate informacije J) potpuno je određena  plauzibilnošću od B (uz poznate informacije J) i plauzibilnošću od A (uz poznate informacije B i J). Funkcija KJ koja determinira tu vezu ovisi o J.

(P5) Plauzibilnost propozicije AJ (uz poznate informacije J) jednaka je plauzibilnosti propozicije A (uz poznate informacije J), tj.  AJ|J = A|J.

Cox je dokazao da iz ovih svojstava logički slijedi da postoji kontinuirana i strogo rastuća funkcija f (x) takva da je f (o) = 0, f (j) = 1 te da za svaku propoziciju J vrijedi:

DJ (x, y) = f (f -1 (x) + f -1 (y))           KJ (x, y) = f ((f -1 (x) ⋅ f -1 (y)).

To je ekvivalentno sa:

f -1(DJ  (x, y)) = f -1 (x) + f -1 (y)           f -1 (KJ (x, y)) = f -1 (x) ⋅ f -1 (y).

Dakle, ako definiramo Pr (x) := f -1 (x), uz odgovarajuće supstitucije za x i y dobivamo:

Pr (A∨B|J ) = Pr (A|J) + Pr (B|J)           Pr (AB|J) = Pr (A|BJ) ⋅ Pr (B|J).

Zaključak je, ako pojam plauzibilnosti zadovoljava (P1) – (P5) tada postoji mjera plauzibilnosti koja zadovoljava aksiome vjerojatnosti (1) – (4). Naime, svaka kontinuirana i strogo rastuća funkcija plauzibilnosti A|J mogla bi biti mjera plauzibilnosti, kao i svaka druga. Od svih tih mogućih mjera odabiremo Pr (A|J), ne zato što je to “ispravnije” nego zato što je to prikladnije, tj. funkcija Pr poštuje najjednostavnija pravila kombinacije: uvjete normalnosti (1), (2), pravilo zbroja (3) i pravilo umnoška (4). Situacija je analogna onoj u termodinamici, gdje između svih temperaturnih ljestvica (koje su kontinuirano rastuće funkcije jedne drugih) odabirimo Kelvinovu ljestvicu jer je najprikladnija, tj. zakoni termodinamike u njoj imaju najjednostavniji oblik. Ili, u matematici, od svih kutnih mjera biramo radijane kao najprikladnije jer je npr. d (sin x) / dx = cos x samo ako se x mjeri u radijanima. I tako dalje.

Razmotrim još zašto bi pojam plauzibilnosti trebao imati svojstva (P1) – (P5).

Zahtjev (P1) je da su plauzibilnosti predstavljene realnim brojevima (sa minimumom koji predstavlja plauzibilnost kontradikcija i maksimumom koji predstavlja plauzibilnost tautologija). Vjerujem da je moguće dokazati da je ovaj zahtjev posljedica još elementarnijih zahtjeva (za one kojima je poznat Hölder-Cartanov dokaz da je svaka kontinuirana linearno uređena grupa bez minimuma i maksimuma izomorfna skupu realnih brojeva ℝ, mogu dodati da mislim kako bi se tu radilo o adaptaciji toga dokaza) .

Što se tiče (P2), primijetite da se uz zadane informacije J proces odlučivanja o tome je li A B istinita propozicija, može podijeliti na elementarne odluke o A i B zasebno (u svakom koraku u zagradama označavam plauzibilnost koja odgovara tom koraku):

(i) Odlučite je li A istinita.    (A|J)

(ii) Odlučite je li B istinita.    (B|J)

Očito je da te dvije odluke u potpunosti određuju vašu odluku o A B i to je (P2). Formalnije:   A∨B|J = DJ (A|J, B|J).

Naravno, ako se plauzibilnost u bilo kojem od dva koraka kontinuirano povećava onda se kontinuirano povećava i plauzibilnost od A∨B. To je (P3).

Što se tiče (P4), uz zadane informacije J, proces odlučivanja o istinitosti propozicije AB možemo podijeliti na jednostavnije odluke o A i B, na sljedeći način:

(i) Odlučite je li B istinita.    (B|J)

(ii) Nakon što prihvatite B kao istinitu, odlučite je li A istinita.    (A|BJ)

Da bi AB bila istinita nužno je da je B istinita. Dakle,  treba odlučiti je li B|J. Nadalje, ako je B istinita, da bi AB bila istinita nužno je je da je i A istinita. Dakle, treba odlučiti je li i A|BJ. Ove dvije odluke u potpunosti određuju vašu odluku o AB i to je (P4).

Formalnije: AB|J = KJ (B|J, A|BJ).

 (P5) je samorazumljiv zahtjev.

Objavljeno u statistika, vjerojatnost | Ostavi komentar

Okrugli stol o udžbenicima logike

Snimka okrugloga stola “Hrvatski gimnazijski udžbenici iz logike” povodom Svjetskoga dana logike (14. siječnja), održanoga 13. siječnja 2023. u organizaciji Hrvatskoga logičkoga udruženja i Instituta za filozofiju. Moderator (na snimci krajnje lijevo) bio je Krešimir Gracin, a sudionici (s lijeva na desno) Marko Kardum, Ines Skelac, Zvonimir Šikić, Srećko Kovač i Davor Lauc.

Objavljeno u logika | Ostavi komentar

World Logic Prizes (on semantic and syntactic foundation of classical logic)

The recording of “Kneale’s natural deductions as a notational variant of Beth’s tableaus” by Zvonimir Šikić for the series World Logic Prizes.

Objavljeno u logika | Ostavi komentar

Simpsonov paradoks i načelo sigurne stvari

Will Rogers: When the okies moved to California, they raised the average intelligence in both states.

Simpsonov paradoks

Simpsonov paradoks prikazat ćemo na artificijelnom primjeru, koji je u biti jednak Simpsonovom originalnom primjeru iz 1951. On se temelji na podacima o 80 pacijenata, 40 muškaraca (M) i 40 žena (Ž).

MO-O ŽO-O  O-O
L73 L921 L1624
-L1812 -L28 -L2020

Liječeno je 10 muškaraca (L) od kojih se 7 oporavilo (LO). Nije liječeno 30 muškaraca (-L) od kojih se 18 oporavilo (-LO). To je prikazano u lijevoj M-tablici.

Liječeno je 30 žena (L) od kojih se 9 oporavilo (LO). Nije liječeno 10 žena (-L) od kojih se 9 oporavilo (-LO). To je prikazano u srednjoj Ž-tablici.

Kombinirana tablica u kojoj su zajedno muškarci i žene je desno. Dakle, liječeno je 40 pacijenata (L) od kojih se 16 oporavilo (LO). Nije liječeno 40 pacijenata (-L) od kojih se 20 oporavilo (-LO).

Stopa oporavka liječenih muškaraca, 7/10 = 70%, viša je od stope oporavka neliječenih muškaraca, 18/30 = 60%.

Stopa oporavka liječenih žena, 9/30 = 30%, viša je od stope oporavka neliječenih žena, 2/10 = 20%.

U cijeloj populaciji stope su obrnute. Stopa oporavka liječenih pacijenata, 16/40 = 40%, niža je od stope oporavka neliječenih pacijenata, 20/40 = 50%.

7/10 = 70% > 18/30 = 60%  

9/30 = 30% > 2/10 = 20%  

——————————–

  16/40 = 40% < 20/40 = 50%

Mnogima je to iznenađujuće, a nekima čak i paradoksalno, pa takve obrate nazivaju Simpsonovim paradoksima. Ljudi očekuju da više stope u sub-populacijama moraju rezultirati višim stopama u populaciji, jer zbrajaju se sub-populacije pa bi se nekako trebale zbrajati i njihove stope, npr. računanjem prosjeka, a ono je monotono.

Dakle, tu definitivno nema nikakvog paradoksa. No, psihološka je činjenica da ljudi ovakve situacije ipak doživljavaju kao paradoksalne i to je dokazano mnogim psihološkim eksperimentima. No, imam neke sumnje i oko tih eksperimenata.

Kako izgledaju ti eksperimenti? Navodim dva tipična.

U prvom „nematematičkom“ eksperimentu ispitanicima je kazano da u jednom školskom okrugu postoje samo dvije srednje škole i da je prolaznost djevojaka na maturi u obje škole bolja od prolaznosti dječaka.

Nakon što su upoznati s ovim činjenicama ispitanicima je postavljeno pitanje, slijedi li da je u tom okrugu prolaznost djevojaka na maturi bolja od prolaznosti dječaka. Ponuđeni su im sljedeći odgovori:

a. Da, u tom okrugu je stopa maturiranja djevojčica veća od stope maturiranja dječaka.

b. Ne, u tom okrugu stopa maturiranja djevojčica manja je od stope maturiranja dječaka.

c. Ne, u tom okrugu stopa maturiranja djevojčica jednaka je stopi maturiranja dječaka.

d. Ne može se zaključiti, jer nema dovoljno informacija.

U drugom „matematičkom“ eksperimentu ispitanicima je kazano da su sljedeće informacije točne.

Zatim su upitani slijedi li iz toga da je

te su im ponuđeni sljedeći odgovori:

(a) Da, prvi izraz je veći od drugog.

(b) Ne, prvi izraz je manji od drugog.

(c) Ne, prvi i drugi izraz su jednaki.

(d) Ne može se zaključiti jer nema dovoljno informacija.

U eksperimentu sa 106 studenata, Bandyoapdhyay i koautori ustanovili su da su na prvo nematematičko pitanje studenti netočno odgovorili (a), u 83% slučajeva, a točno su odgovorili (d), samo u 12% slučajeva. Na matematičko pitanje, netočno su odgovorili (a), u 57% slučajeva, dok su točno odgovorili (d), u 29% slučajeva.  Slične ankete ponovljene su mnogo puta i pokazale su iste obrasce odgovora.

Moje sumnje u ove eksperimente najbolje ću objasnit usporedbom s jednim drugim problemom:

Automobil A vozi brže od automobila B. Koji će automobil sa zajedničkog polazišta prvi stići na zajedničko odredište?

(a) Automobil A će stići prvi.

(b) Automobil B će stići prvi.

(c) Automobil A i automobil B stići će u isto vrijeme.

(d) Ne može se zaključiti, jer nema dovoljno informacija.

Točan odgovor je (d) jer nigdje nismo rekli da automobili kreću u isto vrijeme, iako to svi pretpostavljaju. Da smo dali informaciju da je B krenuo ranije od A broj bi se točnih odgovora radikalno povećao.

Broj točnih odgovora radikalno bi se povećao i da smo dali informacije o disbalansu djevojčica i dječaka u srednjim školama. Te dodatne informacije dole su podebljane.

U jednom školskom okrugu postoje samo dvije srednje škole T i L. Na maturi je prolaznost djevojaka u školi T veća od prolaznosti dječaka u toj školi. Škola T upisuje gotovo isključivo dječake. Prolaznost djevojaka u školi L također je veća od prolaznosti dječaka u toj školi. Škola L upisuje gotovo isključivo djevojke.

Slijedi li da u tom okrugu djevojaka imaju veću prolaznost mature od dječaka?

Dodatne informacije upućuju na to da je prolaznost djevojaka u cijelom okrugu približno jednaka njihovoj prolaznosti u školi L i da je prolaznost dječaka u cijelom okrugu približno jednaka njihovoj prolaznosti u školi T.

PŽ (U) ≈ PŽ (U|L)          PM (U) ≈ PM (U|T)

S obzirom da o odnosu veličina PŽ (U|L) i PM (U|T) nemamo nikakvih informacije slijedi da ništa ne možemo zaključiti ni o odnosu veličina PŽ (U) i PM (U). Dakle, (d) je točan odgovor.

U izvornom problemu nemamo informaciju o disbalansu djevojčica i dječaka u dvije škole pa ljudi po defaultu pretpostavljaju da on ne postoji i zaključuju:

PŽ (U) ≈ ½ PŽ (U|T) + ½ PŽ (U|L) > ½ PM (U|T) + ½ PM (U|L) ≈ PM (U)

Što to dokazuje? Samo da ljudi u nedostatku informacija praznine popunjavaju najjednostavnijim pretpostavkama. To je zdravi razum (common sense) koji ljude razlikuje od strojeva. Iako se ogromna sredstva ulažu u izgradnju common sense algoritama uspjesi su ograničeni, usp. J. Pavlos 2020. Ako vam kažem „Ivan je otišao u restoran, naručio odrezak i ostavio veliku napojnicu“ vi znate da je Ivan pojeo odrezak. Strojevi ne uspijevaju doći do tog  zdravo razumskog zaključka, jer nigdje u toj maloj sceni nije navedeno da je čovjek išta pojeo. Nama zdrav razum dopušta čitanje između redaka. Nas ne treba eksplicitno informirati da se u restoranima hrana jede nakon što se naruči i prije nego što se da napojnica.

No, vratimo se temi. Da se ne radi samo o teorijskim razmatranjima dokazuje sljedeći primjer iz sveučilišnog života. Početkom 1970-ih, kalifornijsko sveučilište Berkeley tuženo je zbog spolne diskriminacije pri upisu na postdiplomske studije. Naime, u jesen 1973. na najveće odjele primljeno je  46% kandidata i 30% kandidatkinja. Na prvi pogled, i pod pretpostavkom da su kvalifikacije podnositelja zahtjeva bile slične, ovi podaci doista bi mogli ukazivati na rodnu diskriminaciju. Međutim, kada se pogledaju podaci unutar tih odjela, predrasuda prema kandidatkinjama nestaje.

Tu je došlo do Simpsonovog „paradoksa“ jer su se žene više prijavljivale na odjele s niskim stopama prihvaćanja, dok su se muškarci više prijavljivali na odjele s visokim stopama prihvaćanja (kao što se vidi u gornjoj tablici).

To možemo još ekstremnije ilustrirati fiktivnim slučajem srednje škole iz koje izlazi 10 izvrsnih i 100 prosječnih maturanata. Od 10 izvrsnih njih se 9 pokušalo upisati na sveučilišta A lige, a uspjelo je njih 5. Pokušao je i 1 prosječni, ali nije uspio. Ostali, tj. 99 prosječnih i 1 izvrsni, pokušali su se upisati na sveučilišta C lige i uspjelo je 80 prosječnih i taj jedan izvrsni.

Iz srednje škole izlazi10 izvrsnih100 prosječnih
Upisuje A ligu5/9=55%0/1=0%
Upisuje C ligu1/1=100%80/99=81%
Ukupno5/10=60%80/100=80%

Iako su izvrsni očekivano uspješniji u obje lige, oni su ukupno neuspješniji. No, istina o uspješnosti očito je u sub-populacijama, a ne u ukupnoj populaciji, o čemu će još biti govora.

No, vratimo se prije toga našoj analizi porijekla „doživljaja paradoksa“. Kao argument da tu nije riječ samo o prešutnim zdravo razumskim pretpostavkama, već da su Simpsonove situacije u najmanju ruku matematički zahtjevne, ako ne i paradoksalne, mogla bi se navesti činjenica da je Simpsonova „paradoksalna“ situacija bila jedan od problema na matematičkoj olimpijadi 2009./2010. Evo problema.

Imate četiri čaše, sa sokom od jabuke, sokom od breskve, sokom od grejpa i sokom od mrkve. Sok od jabuke je slađi od soka od grejpa, a sok od breskve slađi je od soka od mrkve. Je li mješavina soka od jabuke i soka od breskve slađa od mješavine soka od grejpa i soka od mrkve?

Ili jednostavnije, znamo da je J > G i B > M. Je li nužno da je J+B > G+M? Naravno, > tu znači slađe, a ne količinski veće.

Primijetite da ništa ne znamo o G ⋚ B. Dakle, moguće je da je B < G, pa samo trebamo postići B + J ≈ B, G + M ≈ G i tada imamo B+J ≈ B < G ≈ G+M. Dakle, stavite nekoliko kapi J u B i nekoliko kapi M u G i dobit ćete J+B < G+M.

Pretpostavljam da autor problema nije očekivao tako jednostavno rješenje. No problem matematički nije zahtjevan i svodi se na uzimanje u obzir odgovarajućih pretpostavki.

Da zaključim. Primjena pogrešnog načela „stopa u populaciji jednaka je prosjeku stopa u sub-populacijama“ sigurno je odgovorna za pogrešne procjene Simpsonovih situacija. No, držim da važnu ulogu u tome ima i činjenica da ljudi u nedostatku informacija popunjavaju praznine zdravo razumskim pretpostavkama koje često opravdavaju primjenu tog načela. S druge strane, neke možda složenije pretpostavke dovode do drugih rezultata koji mogu biti u suprotnosti s tim načelom i to ga ipak čini nevaljanim.

Načelo sigurne stvari

U vezi sa Simpsonovim paradoksom često se spominje i načelo sigurne stvari koje je formulirao L. J. Savage u Foundation of Statistics, 1954:

Ako osoba preferira f u odnosu na g, bilo znajući da se desio B, ili ne znajući da se desio B, onda bi trebala preferirati f u odnosu na g i ako ništa ne zna o B. … To nije ni logički ni probabilistički princip.

Ne epistemološka varijanta načela glasila bi ovako:

Ako uzrok U povećava vjerojatnost posljedice P u komplementarnim sub-populacijama onda je povećava i u populaciji.

Čini se da Simpsonove „paradoksalne“ situacije obaraju to načelo. U našem medicinskom primjeru kao uzrok imamo liječenje, a kao posljedicu oporavak. Suprotno načelu sigurne stvari, liječenje povećava vjerojatnost oporavka u obje(komplementarne) sub-populacije M i Ž, ali ne i u cijeloj populaciji.

Stope oporavkaL-L
M70%60%
Ž30%20%
Svi40%50%

Ipak, gotovo svi su uvjereni da je prava istina u sub-populacijama. Ali koji su argumenti za tvrdnju da ono što vrijedi u sub-populacijama vrijedi i u cijeloj populaciji, bez obzira na podatke u cijeloj populaciji? Mogli bismo reći da je intuitivno jasno da lijek koji pomaže i muškarcima i ženama mora pomoći svima. Ali na čemu se temelji ta intuicija? Slijedi jedno moguće objašnjenje.

Pretpostavimo da znamo da estrogen ima negativan učinak na oporavak pa je, bez obzira na lijek, vjerojatnost oporavka žena značajno manja nego u muškaraca. Osim toga (što vidimo iz podataka) žene su uzimanju lijeka sklonije od muškaraca. Dakle, razlog zašto se čini da je lijek u cijeloj populaciji štetan jest da je, uz nasumični odabir korisnika lijeka, veća vjerojatnost da se radi o ženi pa je manje vjerojatno da će se odabrana osoba oporaviti. Dakle, da bismo procijenili učinkovitost lijeka, moramo usporediti osobe istoga spola, jer ćemo tako osigurati da se razlika u stopama oporavka između onih koji uzimaju lijek i onih koji ga ne uzimaju ne može pripisati estrogenu.

To je odgovor i na pokušaj C. Blytha iz 1972. da sruši načelo sigurne stvari sljedećim argumentom, vezanim uz naš medicinski primjer. Predložio je dvije oklade:

 Slučajno odabirete pacijenta dok ne naiđete na jednog koji

  • uzima lijek (to je prva oklada L)
  • ne uzima lijek (to je druga oklada -L)

i tada se za 100 eura kladite da će se taj pacijent oporaviti.

Ako je odabrani pacijent muškarac, iz podataka slijedi da vam se više isplati -L oklada. Ako je odabrani pacijent žena, iz podataka opet slijedi da vam se više isplati -L oklada. Ako ne znate je li odabrani pacijent muškarac ili žena, iz podataka slijedi da vam se više isplati L oklada. To, prema Blythu, obara načelo sigurne stvari.

No, to ne obara kauzalno načelo sigurne stvari koje je eksplicitno formulirao J. Pearl 2000, a implicitno ga je podrazumijevao L. J. Savage 1954:

Akcija U koja povećava vjerojatnost događaja P u obje sub-populacije S i -S povećava vjerojatnost od P u cijeloj populaciji, pod uvjetom da ta akcija ne utječe na distribuciju sub-populacija.

 Naime, akcija L = odabiri pacijente dok ne dođeš do jednog koji uzima lijek dovodi do odabira muškarca s vjerojatnošću 12.5%, jer je

Pr (ML) = Pr (M) Pr (L|M) = 50% 25% = 12.5%,

a do odabira žene dovodi s vjerojatnošću 37.5%, jer je

Pr (ŽL) = Pr (Ž) Pr (L|Ž) = 50% 75% = 37.5%.

S druge strane, akcija -L = odabiri pacijente dok ne dođeš do jednog koji ne uzima lijek dovodi do odabira muškarca s vjerojatnošću 37.5%, jer je

Pr (ML) = Pr (M) Pr (L|M) = 50% 75% = 37.5%,

a do odabira žene dovodi s vjerojatnošću 12.5%, jer je

Pr (ŽL) = Pr (Ž) Pr (L|Ž) = 50% 75% = 12.5%.

Dakle, akcije L i L utječu na distribuciju sub-populacija odabranih muškaraca i odabranih žena.

S druge strane, u našem izvornom primjeru, akcije L = daj pacijentu lijek i -L= ne daj pacijentu lijek ne utječu na sub-populacije muškaraca i žena, jer lijek ne utječe na spol.

Ako, kao R. Jeffery 1982, uvjet korektne primjene načela sigurne stvari pojačamo do oblika „akcije i sub-populacije moraju biti stohastički nezavisne“ načelo sigurne stvari svodi se na sasvim jednostavni probabilistički zakon. Naime taj jači uvjet garantira da je Pr (S|U) = Pr (S|-U) = Pr (S) i Pr (-S|U) = Pr (-S|-U) = Pr (-S) pa se standardno probabilističko načelo  

Pr(P|U) = Pr(P|U,S) Pr (S|U) + Pr(P|U,-S) Pr (-S|U)

Pr(P|-U) = Pr(P|-U,S) Pr (S|-U) + Pr(P|-U,-S) Pr (-S|-U)

svodi na

Pr(P|U) = Pr(P|U,S) Pr (S) + Pr(P|U,-S) Pr (-S)

Pr(P|-U) = Pr(P|-U,S) Pr (S) + Pr(P|-U,-S) Pr (-S).

I tada iz Pr(P|U,S ) > Pr(P|-U,S) i  Pr(P|U,-S ) > Pr(P|-U,-S) odmah slijedi Pr(P|U) > Pr(P|-U).

No, Jefreyev uvjet je pretjeran. Njegovo isključivanje svih slučajeva u kojima su sub-populacije i akcije  stohastički ovisne isključio bi istraživanja u kojima pojedinci s određenim karakteristikama (spol, razina obrazovanja i sl.) s većom  vjerojatnošću traže liječenje, što je čest slučaj u opservacijskim istraživanjima. Dovoljno je isključiti samo kauzalne ovisnosti, a dopustiti čisto stohastičke. Ta se razlika ne može izraziti u jeziku teorije vjerojatnosti, ali može u do-calculusu koji formalizira kauzalnost i u njemu je kauzalno načelo sigurne stvari dokazivo (J. Pearl 2000.).

Dakle, odgovor na pitanje treba li u obzir uzimati stope u sub-populacijama ili stopu u cijeloj populaciji, ne nalazi se u podacima. Kako bismo odlučili hoće li lijek naštetiti ili pomoći pacijentu, prvo moramo razumjeti „priču“ koja stoji iza podataka, tj. uzročne mehanizme koji su generirali podatke koje vidimo. Kao što to ispravno tvrde udžbenici statistike, korelacija nije uzročnost, pa najčešće nema statističke metode koja uzročnu priču može odrediti samo iz podataka. Naprosto nema čisto statističke metode odlučivanja pa zato istraživači, uz korištenje statističkih metoda, podatke najčešće moraju  tumačiti i na temelju neformalnih uzročno-posljedičnih pretpostavki.

Postoje, međutim, i ne statističke formalne metode koje se mogu koristiti za izražavanje i tumačenje uzročnosti. Uz njihovu pomoć moguće je matematički opisati uzročne scenarije bilo koje složenosti i odgovoriti na probleme donošenja odluka i u bitno složenijim situacijama od onih koje generiraju Simpsonovi „paradoksi“. Riječ je o matematičkoj teoriji kauzalnosti razvijenoj zadnjih 30-tak godina (u formi već spomenutog do-calculusa) koju mnogi smatraju „kauzalnom revolucijom“. To je posebna tema koja je izvan okvira ovoga članka.

                                              

Objavljeno u logika, matematika, vjerojatnost | 3 komentara

Na konferenciji o sigurnosti, znanosti i miru, Pugwash Hrvatska ugostio čelnike Svjetske akademije, Rimskog kluba i globalnog Pugwasha

Pugwash Hrvatska (Hrvatsko pagvaško društvo) i Svjetska akademija umjetnosti i znanosti organizirali su dvodnevnu konferenciju ‘Security, Science and Peace Conference 2022’, konferenciju o sigurnosti, znanosti, mirovnim politikama, međunarodnim odnosima i odgovornom globalnom upravljanju. Konferencija je održana pod pokroviteljstvom Predsjednika Republike Hrvatske.

Prvog dana konferencije govorili su između ostalih akademik Ivo Šlaus, počasni predsjednik Svjetske akademije umjetnosti i znanosti, član Rimskog kluba i Pugwash savjeta, zatim Garry Jacobs, predsjednik Svjetske akademije umjetnosti i znanosti, Sergio Duarte, predsjednik Pugwash Conferences on Science and World Affairs te Mamphela Ramphele, supredsjedateljica Rimskog kluba.

Teme o kojima je bilo riječi prvog dana bile su globalni sigurnosni izazovi i uloga multilateralnih organizacija u mirovnim aktivnostima, nuklearne prijetnje danas, nova sigurnosna arhitektura, hibridno ratovanje te ideje za učinkovitije globalno upravljanje. Govornici su bili Sebnem Udum, Gotz Neuneck, Wangchu Lama i Gordan Akrap.

Drugog dana konferencije uvodno je govorio Paolo Cotta Ramusino, glavni tajnik Pugwasha, nakon čega su uslijedile sesije o ulozi etike, društvenih znanosti i religije u sigurnosti, na kojoj je posebno istaknuta važnost empatije – govorili su Emilio Marin, Miro Jakovljević, Zohar Navot i Asim Kurjak. Sesija o ljudskoj sigurnosti kao novoj paradigmi okupila je brojne svjetske stručnjake koji su fokus s nacionalne sigurnosti usmjerili na sigurnost čovjeka kao individue – govornici su bili Garry Jacobs, Alyn Ware, Jonathan Granoff, Aleksander Zidanšek i Altay Abibullayev. Zadnja sesija je obuhvatila ekonomski razvoj i budućnost energetike, a svoju viziju ekonomske i energetske sigurnosti predstavili su Velimir Srića i Jose Luis Cordeiro.

Konferenciju su organizirali i moderirali Zvonimir Šikić, predsjednik Pugwash Hrvatska, i Ana Jerković, potpredsjednica Pugwash Hrvatska i suradna članica Svjetske akademije umjetnosti i znanosti.

Konferencija je u cijelosti dostupna na sljedećim poveznicama:

1. dan

Day 1 – Security, Science and Peace 2022 – 23 11 2022 – YouTube

2. dan

Day 2 – Security, Science and Peace 2022 – 24 11 2022 – YouTube

Međunarodna organizacija Pugwash Conferences on Science and World Affairs je dobilaNobelovu nagradu za mir 1995. godine za svoje napore vezane uz nuklearno razoružanje, a danas se bavi analizom suvremenih hibridnih prijetnji, povezivanjem znanosti s donositeljima odluka, poticanjem akademskoga dijaloga i odgovornog globalnog upravljanja, sprječavanjem konflikata i zlouporabe znanosti i tehnologije te drugim aktivnostima. Više se može pronaći na stranicama pugwash.org. Hrvatsko pagvaško društvo ili Pugwash Croatia je hrvatski ogranak Pugwash Conferences, kojeg je utemeljio Ivan Supek, te je najstarija nevladina organizacija u Hrvatskoj.

World Academy of Art and Science (Svjetska akademija umjetnosti i znanosti) međunarodna je organizacija koju su utemeljili Albert Einstein, Robert Oppenheimer i Bertrand Russell s ciljem povezivanja iznimnih ličnosti iz akademskog, znanstvenog, političkog i diplomatskog područja za promišljanja o globalnim pitanjima mira, održivog razvoja i suradnje znanosti s društvom na svim razinama.

Objavljeno u politika | Ostavi komentar

S Mišakom o kalendarima

bez registracije na YouTube

ili s registracijom na hrti

https://hrti.hrt.hr/home?id=0aefd886-d04f-2c36-8862-6e77ff0f899c

Objavljeno u povijest, vjera, znanost | Ostavi komentar

Što je vjerojatnost (2)

2. Vjerojatnost kao frekvencija

Bacimo li čavlić, on može pasti tako da mu vrh gleda gore ili dolje (v. sliku). Ta dva ishoda nisu simetrična, pa ne možemo zaključiti da su jednako vjerojatni. Da bismo otkrili kolika je vjerojatnost ishoda G (vrh gleda gore) i D (vrh gleda dolje), moramo čavliće bacati više puta i iskustveno ustanoviti kolika je relativna frekvencija ishoda G, a kolika ishoda D.

Pr (G) ≈ relativna frekvencija događaja   Pr (D) ≈ relativna frekvencija događaja D

U skladu s tim, mnogi vjerojatnost (približno) definiraju kao relativnu frekvenciju.

Vjerojatnost događaja A približno je jednaka relativnoj frekvenciji pojavljivanja toga događaja pri ponavljanju slučajnoga pokusa velik broj puta (n je ukupni broj pokusa, a n (A) je broj pokusa u kojima se desio A):

Pr(A) = n(A)/n.

Dakle, vjerojatnost događaja jest relativna frekvencija njegovog pojavljivanja u dugom nizu ponovljenih slučajnih pokusa. Ili kraće, vjerojatnost je „dugotrajna relativna frekvencija“. I ova definicija dokaze glavnih svojstava vjerojatnosti, tj. aksioma vjerojatnosti, čini vrlo lakima. Zato ih je i Kolmogorov koristio u “Empirijskoj dedukciji aksioma”, motivacijskom uvodu u svoju aksiomatizaciju teorije vjerojatnosti Kolmogorov 1933.

Naime, ako je n(A) broj događaja A koji su se dogodili u n ponovljenih slučajnih pokusa, ako je fn (A) = n(A)/n odgovarajuća relativna frekvencija i ako je fn (B|A) relativna frekvencija događaja B u slučajevima u kojima se  dogodio A, onda očito vrijedi:      

Naravno, ako je fn = Pr onda su (1) – (4) aksiomi vjerojatnosti:

Ali, ovdje postoji jedan veliki problem. Za koji n je fn vjerojatnost? Je li vjerojatnost glave određena frekvencijom glave u 100 bacanja kovanice tj. sa f100, je li određena sa 1000 bacanja, tj. sa f1000 ili s nekom drugom frekvencijom? Koliko dugo treba biti „dugotrajno“?

„Najduže dugotrajno“ moglo bi zaobići problem, a „najduže dugotrajno“ je beskonačno dugo. Stoga bismo mogli definirati:

No, ovo rješenje problema stvara nove probleme. Za razliku od konačnih frekvencija, granične frekvencije su neopažljive. Granična relativna frekvencija nema empirijski sadržaj. Uostalom, dva beskonačna niza, koji se ne razlikuju na početku, koliko god dug on bio, mogu imati različite granične relativne frekvencije. Dakle, ne postoji veza između graničnih frekvencija i konačnih opažljivih frekvencija. Naravno, mogla bi nas zanimati matematička teorija graničnih relativnih frekvencija, ako nas zanima matematički temelj vjerojatnosti, a ne nužno i njene primjene.

Dakle, istražimo matematiku vjerojatnosti, koja je definirana kao lim fn. Čini se povoljnim da ovako definirana vjerojatnost zadovoljava aksiome vjerojatnosti (jer ih zadovoljavaju sve frekvencije fn). Ali to je tako samo ako postoji lim fn! A lako je konstruirati primjere beskonačnih nizova s nepostojećim graničnim relativnim frekvencijama.

Evo primjera niza glava i pisama bez granične relativne frekvencije glava i pisama:

GP GP GGPP GGGGPPPP GGGGGGGGPPPPPPPP …

Niz počinje s GP GP i nakon toga imamo blokove s 2n G-ova i 2n P-ova, za svaki n > 0. Ako se zaustavimo nakon n-tog bloka, relativna frekvencija glava će biti 1/2 (jer svaki blok ima isti broj glava i pisama). Ako se zaustavimo u sredini n-tog bloka, relativna frekvencija glava će biti:

Dakle, relativna frekvencija pojavljivanja glava u ovom nizu oscilira između 1/2 i 2/3, tj. granična relativna frekvencija pojavljivanja glava u ovom nizu ne postoji.

Nadalje, čak i ako beskonačan niz glava i pisama ima graničnu relativnu frekvenciju, postoji beskonačno mnogo podnizova toga niza s kojom god graničnom relativnom frekvencijom želite (pored beskonačno mnogo njih bez granične frekvencije). To znači da ako na odgovarajući način zanemarite neka bacanja, dobivate što god odaberete (pa je bolje da budete sigurni da ste vidjeli sva bacanja).

Pretpostavimo, nadalje, da su rezultati ponovljenih eksperimenata “glava-pismo” raspoređeni u prostoru i vremenu na sljedeći način:

Glave su predstavljene bijelim točkama. Njihove koordinate su parcijalne sume niza:

(2,3) + (2,3) + (2,3) + (2,3) + (2,3) + …

Pisma su predstavljena crnim točkama. Njihove koordinate su parcijalne sume niza:

(1,1) + (2,1) + (2,2) + (2,1) + (2,2) + (2,1) + (2,2) + …

Ako ste vi bacali kovanicu, vaš vremenski niz glava i pisama je:

PPG PPG PPG …

Granična relativna frekvencija glava, u vremenskom nizu, je 1/3 i to je vaša procjena vjerojatnosti glave.

Ako ja na tlu pregledavam kovanice koje ste vi bacili pomičući se u smjeru osi s, moj prostorni niz glava i pisama izgleda ovako:

GP GP GP GP GP …

Granična relativna frekvencija glava, u prostornom nizu, je 1/2 i to je moja procjena vjerojatnosti glave.

Treba li jedan odgovor biti točan, a drugi pogrešan? Ako više volite jedan od njih, razmislite o Einsteinovoj specijalnoj relativnosti.

Kao rješenje ovih problema Mises 1936. predlaže isključivanje problematičnih nizova. Dakle, nizovi eksperimentalnih rezultata trebaju biti „slučajni“ (Mises ih je zvao „kolektivima“), a to znači da:

(1) trebaju imati granične relativne frekvencije i

(2) te granične relativne frekvencije trebaju ostati iste u svakom beskonačnom rekurzivnom podnizu danog niza (“rekurzivno” je pojašnjenje iz Church 1940.).

Gore opisani “niz glava i pisama bez graničnih relativnih frekvencija” isključen je zahtjevom (1). Podnizovi “s kojom god graničnom frekvencijom želite” isključeni su zahtjevom  (2). Ipak, osjetljivost na prostor i vrijeme nije isključena. Pretpostavljam da gornji primjer, koji je danas bar donekle poznat, u Misesovo vrijeme to nije bio. Da jest, Mises bi gotovo sigurno (uz Churchovo pojašnjenje) takve anomalije isključio zahtjevom:

(3) granične relativne frekvencije trebaju ostati iste u svakom rekurzivnom preuređenju zadanog niza.

Ali nema objašnjenja zašto bi beskonačan niz ponovljenih pokusa bio „kolektiv“, tj. zašto bi beskonačan niz glava i pisama generiranih beskonačnim brojem slučajnih pokusa trebao zadovoljavati (1) – (3).

Daljnji problem za frekventiste je Kolmogorovljev aksiom kontinuiteta (koji je ekvivalentan teoremu o prebrojivoj aditivnosti). Kolmogorov 1933. smatra da je “gotovo nemoguće razjasniti njegovo empirijsko značenje, kao što je to učinjeno za [druge] aksiome”. Za Kolmogorova frekvencije fn imaju empirijsko značenje, dok ga granične frekvencije nemaju. One su matematička idealizacija. Uvriježeno je mišljenje da za nju ne vrijedi prebrojiva aditivnost. Kolmogorov je ipak postulira da bi tom dodatnom idealizacijom „pojednostavio svoju matematiku“.

Van Fraassen 1979, kao i mnogi drugi, nudi protuprimjer koji navodno dokazuje točnost uvriježenog mišljenja. To je beskonačna lutrija sa žetonima 1,2,3,4, … . Neka je Dj propozicija “izvučen je žeton j”. Pretpostavimo da u beskonačnom nizu izvlačenja (sa zamjenama) niti jedan od žetona nije izvučen beskonačno mnogo puta. Tada je Pr(Dj) (Dj) = 0, za svaki j pa iz toga slijedi da je

Pr(D1) + Pr(D2) + Pr(D3) + Pr(D4) + … = 0.

S druge strane

Pr(D1 ili D2 ili D3 ili D4 ili …) = 1,

jer je  D1 ili D2 ili D3 ili D4 ili … nužni događaj. Stoga je

Pr(D1 ili D2 ili D3 ili D4 ili …) različito od Pr(D1) + Pr(D2) + Pr(D3) + Pr(D4) + … .

To prema Van Fraassenu i mnogim drugim autorima, pobija prebrojivu aditivnost.

Ali zašto bi Pr (D1) + Pr (D2) + Pr (D3) + Pr (D4) + … trebalo biti 0? To je neodređeni oblik

koji može biti bilo što, ako se još uvijek sjećate svog prvog kolegija infinitezimalnog računa. Zapravo, u ovom konkretnom slučaju lako je dokazati da taj zbroj jest 1, kao što i treba biti prema prebrojivoj aditivnosti.

Pretpostavimo, na primjer, da beskonačan slijed izvlačenja počinje ovako:

D4, D1, D1, D2, D4, D1, D7, D2

Odgovarajuće vjerojatnosti su:

i tako dalje.

Ako zbrojimo sve stupce dobivamo:

Pr (D1) + Pr (D2) + Pr (D3) + Pr (D4) + … =

lim ( 1/1, 1/2 + 1/2, 2/3 + 1/3, 2/4 + 1/4 + 1/4, …) = lim ( 1, 1, 1, 1, …)  = 1

Izračun je isti za svaki niz izvlačenja. Naime, ako je Fj frekvencija od Dj u prvih n izvlačenja onda je zbroj vrijednosti u n-tom stupcu

, gdje je

ukupni broj izvlačenja u prvih n izvlačenja, koji je očito n pa je 

Dakle, granične relativne frekvencije zadovoljavaju prebrojivu aditivnost. (Uočite da u dokazu nismo koristili zadnji stupac.)

Isti argument dokazuje prebrojivu aditivnost. Neka D1, D2, D3 … isključuju jedan drugog. Definirajmo D kao D1 ili D2 ili D3 ili … . Tada -D, D1, D2, D3 … također isključuju jedan drugog i prethodnim argumentom “zbrajanja po stupcima” (usp. napomenu o ne korištenju zadnjega stupca) imamo

Pr (-D) + Pr (D1) + Pr (D2) + Pr (D3) + … = lim (1, 1, 1, 1 …) = 1

Iz toga slijedi da je

Pr (-D ili D) = Pr (-D) + Pr (D) = 1 = Pr (-D) + Pr (D1) + Pr (D2) + Pr (D3) + … tj.

Pr (D) = Pr (D1) + Pr (D2) + Pr (D3) + … .

Konačni je zaključak da granične relativne frekvencije zadovoljavaju aksiome vjerojatnosti (1) – (4) (što je dobro poznato), a čak zadovoljavaju i prebrojivu aditivnost (što je novi rezultat). Stoga granične relativne frekvencije nemaju problema s aksiomima vjerojatnosti. Njihov problem je što možda ne postoje, tj. beskonačan niz eksperimentalnih rezultata  možda i nema graničnu relativnu frekvenciju.

Spomenimo na kraju da je sukob frekventista s jedne strane te klasičara i bejesovaca s druge, star više stoljeća. Počeo je kao jedan je od aspekta sukoba britanskih empirista i kontinentalnih racionalista. John Stuart Mill koji je matematiku i logiku (bila ona induktivna ili deduktivna) opravdavao iskustveno, prirodno je usvojio frekvencijski pogled na vjerojatnost. U prvom izdanju svoje knjige Mill 1843. on ismijava Laplaceove vjerojatnosti propozicija, koje Laplace shvaća kao stupnjeve njihove plauzibilnosti (i uz pomoć kojih opravdava klasični pojam vjerojatnosti). Ali tri godine kasnije, u drugom izdanju, Mill mijenja stav i postaje bejesovac. Naime, astronom John Herschel objasnio mu je da nije razumio Laplacea, ali ga je i upozorio na nekonzistentnosti frekventizma. John Venn je pokušao sistematski izložiti  frekventistički pogled u svojoj knjizi Venn 1866. U njoj napada Laplaceove vjerojatnosti i njihovog britanskog proponenta Augustusa De Morgana, ali suočen s problemima identificiranja vjerojatnosti s relativnim frekvencijama ne uspijeva naći konzistentni temelj za svoj frekventistički stav (kao ni Mises 70 godina kasnije).

Kontinentalci Gottfried Wilhelm Leibniz, Jacob Bernoulli, Pierre-Simon Laplace i drugi ne identificiraju vjerojatnosti s frekvencijama. Za njih je vjerojatnost racionalni stupanj uvjerenja. No, zanima ih koja je formalna veza između frekvencija i tako shvaćenih vjerojatnosti. Bernoulli je uspio odgovoriti na dio tog pitanja, sa svojim zakonom velikih brojeva koji je objavio u knjizi „Ars Conjectandi“:  Uz odabir dovoljno dugog niza pokusa, relativna frekvencija ishoda aproksimira vjerojatnost tog ishoda s kojom god želite preciznošću. To je Bernoulli zvao svojim zlatnim teoremom. Na primjer, ako je vjerojatnost ishoda 3/5, željeni interval aproksimacije je (29/50, 31/50), a željena vjerojatnost da frekvencija padne u taj interval je 1000/1001, onda zlatni teorem kaže da se to postiže ako je broj pokušaja veći od 25550.

Motivacija za zlatni teorem bila je Bernoullijeva želja da iz empirijskih podataka određuje vjerojatnosti, jer je razumio da u mnogim područjima nije moguće odrediti vjerojatnosti na klasičan način, prebrajanjem jednako vjerojatnih slučajeva. Želio je iz velikog broja pokusa i relativne frekvencije uspjeha u tim pokusima, odrediti kolika je vjerojatnost uspjeha u pojedinom pokusu. Evidentno je da Bernoulli nije riješio taj problem. Riješio je smjer od vjerojatnosti k frekvencijama, ali ne i smjer od frekvencija k vjerojatnosti. Ipak, Bernoulli je vjerovao da je riješio problem prijelaza od frekvencija k vjerojatnosti pozivajući se na sljedeći (pogrešni) argument. Ako je uz dovoljno veliki broj pokusa relativna frekvencija približno jednaka vjerojatnosti, onda je uz taj broj pokusa i vjerojatnost približno jednaka relativnoj frekvenciji pa je problem zaključivanja od frekvencija k vjerojatnosti riješen.

Taj argument zvuči uvjerljivo: ako je

 onda je

No, pokušate li ga precizirati argument se raspada. Naime, aproksimacija od

ima po volji veliku vjerojatnost za dovoljno velike n, pod uvjetom da je p vjerojatnost uspjeha u svakom pojedinom pokusu (to je zlatni teorem). To ne znači da aproksimacija od

 ima po volji veliku vjerojatnost za dovoljno velike n, pod uvjetom da je fn relativna frekvencija uspjeha u n ponovljenih pokusa. Iako su

ekvivalentne tvrdnje, uvjeti pod kojima procjenjujemo njihove vjerojatnosti su različiti pa su to i njihove vjerojatnosti. Na primjer, kada bi druga tvrdnja bila točna onda bi frekvencije  nužno konvergirale prema graničnoj vrijednosti p, za što nisu dani nikakvi argumenti.

„Argument“ da zakon velikih brojeva omogućava prijelaz od relativnih frekvencija na vjerojatnost nevjerojatno je žilav. Preživio je do danas u formi Fisherovog p-testa, o čemu će još biti riječi. Sam zaključak tog argumenta (bez ozbiljnije rasprave o samom argumentu) ponavljali su vrlo ugledni teoretičari vjerojatnosti 20. stoljeća, uključujući Émilea Borela, Paula Lévyja, Andreja Markova i Andreja Kolmogorova. Kako je to bilo moguće? Diaconis & Skyrms 2018. misle da je to bila strategija ignoriranja problema vezanih uz interpretaciju pojma vjerojatnosti, kojom se zapravo izbjegavao ozbiljan pokušaj suočavanja s tim problemima.

Primijetimo da cijela ova rasprava (i sam zakon velikih brojeva) ima smisla samo za one koji pretpostavljaju da postoji vjerojatnost uspjeha u jednom pokusu, što su klasičari i bejesovci. Samo se oni mogu pitati je li tu vjerojatnost moguće aproksimirati relativnim frekvencijama ponavljanih pokusa. Ako ste frekventist za kojeg vjerojatnost jest granična relativna frekvencija ponavljanih pokusa onda je izlišno pitati se je li graničnu relativnu frekvenciju ponavljanih pokusa moguće aproksimirati relativnim frekvencijama ponavljanih pokusa (a zakon velikih brojeva postaje trivijalan).

Objavljeno u vjerojatnost | Ostavi komentar

Što je vjerojatnost (1)

1. Klasična vjerojatnost

Elementarni uvodi u teoriju vjerojatnosti najčešće se temelje na dva pojma vjerojatnosti, klasičnom  i frekvencijskom. Postoji i treći bejesovski pojam vjerojatnosti, koji vjerojatnost drži „stupnjem plauzibilnosti“ i koji može biti subjektivan ili objektivan. To je najobuhvatniji i najprimjenljiviji, ali i najsloženiji pojam. Počinjemo s klasičnim pojmom.

Za razumijevanje ovoga pojma bitan je pojam slučajnog pokusa (zovemo ga slučajnim zato što je njegov ishod slučajan, a ne zato što je sam pokus slučajan). Na primjer, bacanje igraće kocke smatra se slučajnim pokusom. Svaki mogući ishod bacanja zove se elementarnim događajem toga slučajnog pokusa. Skup svih elementarnih događaja slučajnoga pokusa zove se prostorom elementarnih događajai obično se označava s Ω. Dakle, slučajni pokus bacanja igrače kocke ima 6 elementarnih događaja, tj.

Ω = {1, 2, 3, 4, 5, 6}.

Bilo koji skup elementarnih događaja, tj. bilo koji podskup od Ω, predstavlja slučajni događaj. Na primjer, slučajni događaj „bačen je neparan broj“ i slučajni događaj „bačen je broj manji od 5“ predstavljeni su skupovima:

N = {1, 3, 5}       i       M = {1, 2, 3, 4}.

Klasičnu vjerojatnost slučajnih događaja definiramo na sljedeći način.

Ako slučajni pokus ima konačno mnogo elementarnih događaja i ako iz simetričnosti pokusa možemo zaključiti da su svi oni jednako vjerojatni, onda je vjerojatnost događaja A jednaka  omjeru broja elementarnih događaja u kojima se dogodio A i broja svih mogućih elementarnih događaja (u donjim formulama broj elemenata u skupu S označen je s k(S)):

Pr (A) = k (A) / k (Ω).

U našem primjeru, Pr (N) = k (N) / k (Ω ) = 3/6 = 0.5 i Pr (M) = k (M) / k (Ω ) = 4/6 = 0.66666 … .

Prednost ove definicije je što ona dokaze glavnih svojstava vjerojatnosti (tzv. aksioma vjerojatnosti) čini vrlo lakima. Naime, očito vrijedi:

              

            

Naravno, (1) – (4) su standardni aksiomi vjerojatnosti (Pr(B|A) je vjerojatnost događaja B pod uvjetom da se dogodio A).

Neobično je koliko se probabilističkih problema može riješiti primjenom ovih jednostavnih ideja. Razmotrimo poznati problem rođendana: Kolika je vjerojatnost da najmanje dvije osobe u skupini od N osoba imaju isti rođendan (zanemarujući prijestupne godine i pretpostavljajući da su datumi rođenja jednako vjerojatni, a rođendani pojedinaca neovisni) ? Ako još niste vidjeli rješenje tog problema, rezultat je iznenađujući.

Najprije izračunajmo vjerojatnost da sve te osobe imaju međusobno različite rođendane. Rođendan prve od N osoba može biti bilo koji od 365 dana. Drugi mora biti različit, pa zato može biti bilo koji od preostala 364 dana. Treći može biti bilo koji od preostala 363 dana, itd. do preostalih 365 – (N – 1) dana. Dakle, ukupni broj načina na koji se mogu realizirati rođendani N osoba, tako da svi budu međusobno različiti, je

365 × 364 × 363 × 362× … × (365-N+1).

S druge strane, ukupni broj načina na koji se mogu realizirati svi mogući rođendani N osoba je

365 × 365 × 365 × 365×  … × 365 = 365N.

Dakle, vjerojatnost da svi rođendani budu međusobno različiti iznosi

Komplementarna vjerojatnost,

je vjerojatnost da u skupini od  N  osoba postoji bar jedna podudarnost rođendana. U sljedećoj tablici izračunati su iznosi te vjerojatnosti PN za neke vrijednosti N (kako se ti iznosi mogu izračunati jednostavno, bez glomaznih množenja i dijeljenja vidi u Šikić 2005.).

N5102023304060
PN0.0270.1170.4110.5070.7060.8910.994

Vidimo da je vjerojatnost bar dva podudarna rođendana veća od 50% već u skupini od 23 osobe, a u skupini od 60 osoba skoro je sigurna.

Postoji mnogo varijacija na ovu temu i najčešće se koriste za analizu iznenađujućih koincidencija. Na primjer, moguće je na sličan način dokazati da je velika vjerojatnost da u Hrvatskoj postoje dvije osobe koje imaju isti rođendan, čiji očevi imaju isti rođendan, a i očevi njihovih očeva imaju isti rođendan.

Prvi značajniji rad u matematici vjerojatnosti koristio se klasičnim pojmom i nalazimo ga u prepisci na tu temu između Blaisea Pascala i Pierra de Fermata, koja je započela 1654. Ona pokazuje kako se naizgled složeni problemi mogu svesti na jednostavne izračune s jednako vjerojatnim elementarnim događajima, ali i da nije uvijek jednostavno odrediti prostor takvih događaja.

Jedan od problema iz njihove prepiske je slavni problem bodova. Dva igrača igraju niz igara, na primjer bacaju kovanicu i prvi se kladi na glavu, a drugi na pismo. Tko pobijedi u pojedinoj rundi dobiva bod, a prvi koji dosegne određeni broj bodova pobjeđuje u igri i uzima uloge. Odigrali su određen broj rundi i igra je zbog nečega prekinuta. Što je pravedna podjela uloga ako se igra ne može nastaviti?

Problem bodova je zbunjivao  mnoge koji su se njime bavili prije Pascala i Fermata. Fra Luca Pacioli je 1494. razmatrao igru koja završava kada jedan igrač osvoji 6 bodova, ali je prekinuta kada je prvi igrač osvojio 5, a drugi 3 boda. Pacioli je smatrao da je pravedna podjela proporcionalna osvojenim bodovima. Dakle, 5 prema 3. Oko 50 godina kasnije Nicolo Tartaglia je prigovorio da, prema Paciolijevom pravilu, ako se igra prekine nakon 1 runde koju je dobio prvi igrač, on treba dobiti cijeli ulog, a to nema smisla. Tartaglia je pokušao modificirati Paciolijevo pravilo, ali je na kraju zaključio da definitivan odgovor nije moguć. Čini se da je problem  zbunjivao sve koji su o njemu razmišljali, do ključnog uvida koji je imao Fermat.

Pretpostavimo da nakon prekida jednom igraču do pobjede nedostaje r bodova, a drugome s. To znači da bi se igra odlučila u sljedećih r + s – 1 rundi.  Svi nizovi od r + s − 1 bacanja kovanica predstavljaju jednako vjerojatne elementarne događaje pa vjerojatnosti pobjede jednog i drugog igrača možemo izračunati kao klasične vjerojatnosti.

Za Paciolijev problem, u kojem za pobjedu treba 6 bodova, a nakon prekida prvi igrač ima 5 bodova, a drugi 3, igra bi se odlučila u sljedeće 3 runde. Od 8 jednako vjerojatnih nizova glava i pisama u te 3 runde:

GGG, GGP, GPG, PGG, GPP, PGP, PPG, PPP,

prvi igrač pobjeđuje u prvih sedam slučajeva , a drugi samo u zadnjem slučaju. Dakle, omjer vjerojatnosti njihovih pobjeda je 7:1 pa Fermat smatra da i pravedna podjela dobitka treba biti u istom omjeru. Dakle, on kao pravedni iznos implicitno koristi očekivanu vrijednost E, koja je vjerojatnostima ponderirani iznos mogućih dobitaka (koji su ulog U ili ništa):

E(prvi igrač) = 7/8 × U + 1/8 × 0          E(drugi igrač) = 1/8 × U + 7/8 × 0

Brojanjem jednako vjerojatnih slučajeva, riješili smo problem. Ali ako imamo veliki broj jednako vjerojatnih slučajeva račun postaje glomazan. Razmotrite Tartaglin primjer. Šest bodova je potrebno za pobjedu, a nakon prekida prvi igrač ima jedan, a drugi nijedan bod. Da bi igra završila trebalo bi odigrati još 10 rundi. Dakle, trebamo analizirati 210 = 1024 jednako vjerojatnih nizova glava i pisama. Dosta posla da ih sve ispišemo i prebrojimo povoljne za prvog i drugog igrača. Pascal je smislio bolji način brojanja.

Za prebrojavanje slučajeva u kojima pobjeđuje prvi igrač, Pascal je zbrojio broj slučajeva u kojima prvi igrač ima 5 pobjeda u 10 pokušaja  + broj slučajeva u kojima ima 6 pobjeda u 10 pokušaja  + · · · + broj slučajeva u kojima ima 10 pobjeda u 10 pokušaja . Ovi brojevi se nalaze u 10. redu Pascalovog aritmetičkog trokut (ili Tartaglinog trokuta, ili trokuta Omara Hajjama, svi su oni znali za taj trokut):

i tako dalje

U N-tom red toga trokuta nalaze se brojevi načina na koje možemo iz grupe od N objekata odabrati njih 0, 1, 2, 3, … , N. Dakle, brojevi za Tartaglin problem nalaze se u 10. redu od 5. mjesta na dalje, tj. to su brojevi 252, 210, 120, 45, 10 i 1. Njihov je zbroj 638 pa je vjerojatnost pobjede prvog igrača 638/1024 (oko 63%). On treba dobiti 63% uloga, a drugi igrač 37%.

Pascal i njegovi prethodnici dokazali su da se trokut jednostavno konstruira (jer su sve vrijednosti „uokvirene 1-cama“ zbroj dvaju vrijednosti iznad njih), a nastavljači Pascala i Fermata  razvili su i mnoga druga kombinatorna načela koja omogućavaju jednostavna računanja vjerojatnosti prebrajanjem jednako vjerojatnih slučajeva.

No, problem s klasičnom vjerojatnošću je da vjerojatnost često želimo primijeniti i u situacijama u kojima ne možemo osmisliti slučajni pokus koji bi opisivao tu situaciju i koji bi imao odgovarajuće simetrije iz kojih bismo mogli zaključiti da su svi njegovi elementarni događaji jednako vjerojatni. Ta je simetrija najčešće prisutna u igrama na sreću i sličnim artificijelnim situacijama, a i tada može biti upitna.

Naime, njutnovski determinizam već je u 17.stoljeću doveo u pitanje pojam slučajnog pokusa. Razmislite o bacanju kovanice. Palac udara u kovanicu, ona leti, vrti se i konačno  pada na tlo. Isti slučajni pokus u istim uvjetima trebao bi rezultirati s jednim od dva jednako vjerojatna slučajna ishoda, glavom ili pismom. No, ako palac udari kovanicu na isto mjesto istom snagom, ona će letjeti na isti način i sletjeti na istu stranu. Bacanje novčića je deterministički, a ne slučajni pokus. Za zadanu početnu brzinu v i kutnu brzinu  ω ishod možemo izračunati i rezultat je sljedeći – početni uvjeti koji rezultiraju glavom su šrafirani, a oni koji rezultiraju pismom su bijeli.

Stroj koji izbacuje kovanicu s raznim brzinama v i  ω, tu činjenicu eksperimentalno dokazuje, a kovanica uvijek pada na istu stranu za fiksni v i  ω, usp. Diaconis i koautori 2007. Mnogi mađioničari i kockari, uključujući Diaconisa, također imaju tu „strojnu“ sposobnost, tj. mogu postići da kovanica sleti na koju god žele stranu.

Kako je onda bacanja kovanice postalo paradigmatskim primjerom slučajnog pokusa? Odgovor je pred više od sto godina dao Poincaré 1892. Ako je kovanica bačena snažno, s dovoljno velikom vertikalnom brzinom v i kutnom brzinom ω, osjetljivost na početne uvjete v i  ω bit će velika (tj. šrafirani i bijeli dijelovi gornjeg grafa, u tom području, postaju  nerazlučivi). Tada čak i vrlo mala promjena početnih uvjeta dovodi do promjene ishoda i zato jednaka vjerojatnost ishoda i nije tako loša pretpostavka. Uočite, međutim, da to objašnjenje vjerojatnost vidi kao rezultat našeg nepoznavanja početnih uvjeta bacanja kovanice, a ne kao neko objektivno svojstvo toga bacanja.

Objavljeno u vjerojatnost | Ostavi komentar

Minds, Machines and Gödel

Vrlo popularani argumenti za to da um nije stroj pozivaju se na Gödelove teoreme o nepotpunosti. Ovdje predstavljam neke od najpoznatijih takvih argumenata, kao i njihove najpoznatije kritike. Na kraju, nudim vlastitu rekonstrukciju ovih argumenata i pokazujem zašto ti argumenti nisu valjani. Tekst nisam prevodio jer pretpostavljam da oni koje on zanima dovoljno vladaju engleskim da ga razumiju.

1. Gödel’s theorems

The vast majority of those who use Gödel’s theorems of incompleteness to argue for mind-machine non-equivalence do not fully understand what Gödel’s theorems are claiming. So we will begin by presenting the theorems. Gödel’s first incompleteness theorem reads as follows.

If formal mathematical theory M includes an appropriate amount of arithmetic it contains an explicitly definable sentence G which asserts its own non-provability and is such that, if M is consistent then it is not ⊢ M G and if M is omega-consistent then it is not ⊢ M – G, where ⊢ M is provability in M.

In what follows ⊢ is ⊢ M , and M is a formal mathematical theory which includes an appropriate amount of arithmetic.

Gödel’s second incompleteness theorem reads as follows.

If formal theory M is consistent it cannot prove its consistency, Con (M), which is expressed by non-provability of contradiction *, -Pr (‘*’), because  Con (M) ↔ G. (About provability predicate Pr (x) see in the appendix.)

Concerning formal unprovability of G and -G, it can be proved that

⊢  -Pr (‘G’) ↔ Con (M)      and       ⊢  – Pr (‘-G’) ↔ Con (M + Con (M)).

Notice that Con (M + Con (M)) is stronger than Con (M) (by the second incompleteness theorem) and it is less strong then consistency.

Ideas of the proofs of these results are given in the apendix. Let us now turn to “Gödelian dualist” arguments and their refutations.

2. Gödel

We will start with Gödel. In [GG] he admits the possibility that human mind is a machine unable to understand completely its own functioning. He even says it is conceivable that it would be known with empirical certainty:

1. That the brain suffices for the explanation of all mental phenomena and is a machine in the sense of Turing.

2. That such and such is the precise anatomical structure and physiological functioning of the part of the brain which performs mathematical thinking.

Hence, “Gödelian dualist” would have a hard time convincing Gödel himself.

3. Penrose, Boolos and Good

Penrose [PE] claims that we can see that G is true as follows. If G is provable in Peano arithmetic PA then it is false (because it asserts that it is not provable). But that is impossible “because our formal system should not be so badly constructed that it actually allows false propositions to be proved [in other words it should be correct]”. So, G is unprovable and therefore true.

Boolos [B] asks what about Gödel sentence G for ZFC.  It is also unprovable in ZFC and therefore true, if ZFC is correct.But we do not know that. “We could be in the same situation regarding ZFC that Frege was before receiving the letter from Russell”.

Anyway, the argument could be much simpler. If we know that M is correct and therefore consistent then ⊢ Con (M) ↔ G implies that we know that G is true. And that’s it.

Of course, M also “knows” that, because ⊢ Con (M) ↔ G. But, do we know that Con (M) is true? If we know this, we can always extend M to M + Con (M) and our knowledge of the truth of Con (M) is then successfully formalized. Of course, now the question is do we know that Con (M + Con) is true etc. The “Gödelian dualist”  must verify that the Con sentences of all these extensions are true. But [Go] successfully argued that no such proof is possible (since it would imply that the smallest non-constructible ordinal is constructible).

4. Lucas and Lewis

Lucas [L] bypasses this hierarchy of extensions. He defines an effective function Consuch that:

C1. Con (M) is true if and only if M is consistent,

C2. if M is correct then Con (M) is true,

C3. Con (M) is provable if and only if M is inconsistent.

Call C a consistency sentence for set of sentences S iff there is M such that S is the set of its provable sentences and C = Con(M). Then the following rule of inference is sound, by C2:

R. If C is a consistency sentence for S, infer C from S.

Lucas extended PA to LA, with the rule R. The theorems of LA are true because its theorems come from Peano axioms by truth-preserving rules of inference. Now, if LA is a formal theory,its consistency sentence C = Con(LA) would be its theorem, by R, and LA would be inconsistent, by C3. Hence, by C1, the falsehoods would follow from the Peano axioms themselves. Therefore, insofar as we trust the Peano axioms, we know that Lucas arithmetic is not the output of any formal theory.

So if Lucas can verify all the theorems of Lucas arithmetic then Lucas is no machine. But we are given no reason to believe that he can. As Lewis warned in [Le], in order to check whether Lucas’s rule R has been used correctly, a checking procedure would have to decide whether a given set S of sentences is the output of a formal theory and that, we know, is an undecidable problem. So we do not know how many theorems of LA Lucas can produce. He can certainly go beyond PA, but he can go beyond it and still be a machine, because limitations on his ability to verify theoremhood in LA may leave him unable to recognize a lot of theorems of LA.

5. McCall not understanding Godel’s theorem

McCall’s reasoning in [Mc] differs from the earlier “Gödelian dualist’s” arguments in his admission that the recognition of truth of Gfor a formal theory Mdepends essentially on the unproved assumption that the theory Munder consideration is consistent. But McCall notes that we have two different cases:

  1. If M is consistent then G is not provable.
  2. If M is consistent then – G is not provable.

He claims that both sentences are true. They are not!  Unprovability of -G depends on omega-consistency. He thinks the difference is that the formal version of 1. is a theorem, whereas the formal version of 2. “to the best of [his] knowledge” is not, i.e.

  1.  Con (M) ⊢ – Pr (‘G’),     
  2.  Con (M) ⊢ – Pr (‘-G’).

McCall thinks that 1. yields the true but unprovable sentence. But, we can recognize the truth of – Pr (‘-G’), if we assume not only the consistency of M, but the omegaconsistency of M or the consistency of M + Con (M); which is less strong but suffices. Hence, for the comparison to be fair, it would have to involve a formal theory equipped with whatever assumptions we ourselves have employed in order to see the truth of 2. But we know that

⊢ Con (M + Con (M)) ↔ – Pr (‘-G’)

So, what we can prove, the machine can also prove.

6. My account

My own account of dualists’ argument is as follows. “Gödelian dualist”  argue that no machine M can be identical to a human mathematician H, in the following way. Let Mp be the set of arithmetical sentences provable by M and Hk is to be the set of arithmetical sentences knowable by H (the only property of the notion of knowledge we will need is that knowledge entails truth and that truth does not entail knowledge). Then Mp  Hk or Mp   Hk. In the second case Mp  Hk , hence M  H. In the first case whatever is provable by M is knowable by H and that means that all sentences in Mp are true. Therefore H knows that M is a correct system. But then H knows that it is a consistent system, i.e. Con (M)  Hk. But Con (M)  Mp, by second Gödel’s theorem, hence Mp  Hk and therefore M  H. Hence, M  H in every case.

But the above conclusion “Therefore H knows that M is a correct system.” is not justified. From the truth that every sentence provable by M is knowable by H it does not follow that H knows that (and therefore knows that M is correct), because truth does not entail knowledge. It is possible that Mp  Hk and that H does not know that. In some specific cases we may know just enough to conclude that M is a correct system. On the other hand, it remains possible that there may exist, and even be empirically discoverable (cf. Gödel above), mathematical machines which in fact are equivalent to our mathematical intuitions. For example, we could be such machines.

So, “Gödelian dualist” like [L], [PS] pp.189. and 641. or [PE] pp. 107.-108. confused the incorrect argument (1) with the correct argument (2).

(1) There is no machine which could capture all our mathematical intuitions.

(2) There is no machine which could capture all our mathematical intuitions and which we could understand well enough to know that it is consistent (i.e. that G is true).

We may conclude. As far as Gödel’s incompleteness theorem is concerned we could well be machines. But if we are then we are definitely not capable of the complete knowledge of the machines, i.e. of the complete knowledge of ourselves. It is very close to Gödel’s understanding of the problem.

7. Appendix

If formal mathematical theory M includes an appropriate amount of arithmetic it can refer to its expression F with its Gödel’s number ’F’. Furthermore, M can express a diagonal function d such that for any expression F, d(’F’) = ’F(’F’)’.

Gödel defined arithmetical predicate Prv(x, y) which represents “x is proved by y” (within M itself) and proved that:

  1. If n is Gödel’s number of a provable formula then Prv (n, m) for some m
  2. n is not Gödel’s number of a provable formula then  Prv (n, m) for every m

Gödel then defined Pr (x), which represents “x is provable”, as Ey Prv (x, y). From 1) it easily follows (B1). From 2), with the help of ω-consistecy, it easily follows (B1′). It is also easy to prove (B2) and somewhat more difficult (B3).

(B1)           X  ⊢  Pr(‘X’),               

(B1’)          Pr(‘X’) ⊢ X    if M is ω-consistent

(B2)         ⊢ Pr(‘X → Y’) → (Pr(‘X’) → Pr(‘Y’)),

(B3)        ⊢  Pr(‘X’) → (Pr(‘Pr(‘X’)’).

Furthermore, Gödel realized that for any predicate P(x), substitution of ‘P(d(x))’ for x in P(d(x)) gives P(d(‘P(d(x))’)), or D for short. It immediately follows that D ↔ P(’D’). It follows that there is a sentence G such that

(DL)        ⊢  G ↔ -Pr(‘G’)

From (DL), (B1) and (B1’) we can deduce the first incompleteness theorem. Namely,

 G  →  Pr(‘G’) ↔   -G

 -G  ↔  Pr(‘G’)  →  G

Both implications contradict the consistency of M. Hence, not ⊢ G and not ⊢ -G. Note that we used (B1’), i.e. -consistency, to prove the unprovability of -G.

From (DL), (B1), (B2) and (B3) we can deduce the second incompleteness theorem:

⊢ G → (Pr(‘G’) → * )

⊢ Pr(‘G’) → (Pr(‘Pr(‘G’)’) → Pr(‘*’))

⊢ Pr(‘G’) → Pr(‘ ’)  

⊢ -Pr(‘*’) → -Pr(‘G’)                 i.e.                ⊢  Con(M) → G

⊢  * → G

⊢ Pr(‘*’) → Pr(‘G’)    

⊢ -Pr(‘G’) → -Pr(‘*’)                 i.e.                ⊢  G → Con(M)

Now, from  not ⊢ G and ⊢ Con (M) ↔ G it immediately follows that  not ⊢ Con (M).

So, by (DL) and  ⊢ Con (M) ↔ G, unprovability of G is provably equivalent to the consistency of M:

⊢ -Pr (‘G’) ↔ Con (M)

What do we know about the unprovability of – G, which is the other part of the first incompleteness theorem? From ⊢ -G ↔ Pr (*), by (B1) and (B2), we get

⊢ -Pr (‘-G’) ↔ – Pr (Pr (‘*’)).

But -Pr (Pr (‘*’)) expresses the consistency of M + Con (M). Namely, if PrM+Con (M) is the provability predicate of M + Con (M), then the consistency of M + Con (M) is expressed by -PrM+Con (M)  (‘*’). But,

– Pr (Pr (‘ ’)) ↔ – Pr(-Con (M)) ↔  – PrM+Con (M)  (‘*’)

Hence

 ⊢ -Pr (‘-G’) ↔ Con (M + Con (M)).

References:

[B] Boolos G. On seeing the truth of the Gödel sentence, Behavioural and Brain Sciences 13, 655-656, 1990.

 [G] Gödel, K. Über formal unentscheidbäre Sätze I. Monatshefte für Mathematik und Physik, 38, 173-198, 1931.

[GG] Gödel, K. Gibbs Lecture, 1951, in Collected Works, Vol. 3: Unpublished Essays and Lectures, Editor-in-chief S. Feferman, Oxford University Press, 1995.

[Go] Good, I. J. Gödel’s theorem is a red herring, The British Journal for the Philosophy of Science 18, 359–73,1969.

[Le] Lewis, D. Lucas against mechanism II. Canadian Journal of Philosophy 9, 373–6.1989.

[L] Lucas, J.R. Minds, machines and Gödel. Philosophy, 36, 112-137, 1961.

[Mc] McCall, S. Can a Turing machine know that the Gödel sentence is true?, Journal of Philosophy 96, 525-532, 1999.

[PE] Penrose, R. The Emperor’s New Mind. Oxford University Press, 1999.

[PS] Penrose, R. Shadows of the Mind: A search for the missing science of consciousness, Oxford University Press, 1994.

Objavljeno u filozofija, logika, znanost | Ostavi komentar