Simpsonov paradoks i načelo sigurne stvari

Will Rogers: When the okies moved to California, they raised the average intelligence in both states.

Simpsonov paradoks

Simpsonov paradoks prikazat ćemo na artificijelnom primjeru, koji je u biti jednak Simpsonovom originalnom primjeru iz 1951. On se temelji na podacima o 80 pacijenata, 40 muškaraca (M) i 40 žena (Ž).

MO-O ŽO-O  O-O
L73 L921 L1624
-L1812 -L28 -L2020

Liječeno je 10 muškaraca (L) od kojih se 7 oporavilo (LO). Nije liječeno 30 muškaraca (-L) od kojih se 18 oporavilo (-LO). To je prikazano u lijevoj M-tablici.

Liječeno je 30 žena (L) od kojih se 9 oporavilo (LO). Nije liječeno 10 žena (-L) od kojih se 9 oporavilo (-LO). To je prikazano u srednjoj Ž-tablici.

Kombinirana tablica u kojoj su zajedno muškarci i žene je desno. Dakle, liječeno je 40 pacijenata (L) od kojih se 16 oporavilo (LO). Nije liječeno 40 pacijenata (-L) od kojih se 20 oporavilo (-LO).

Stopa oporavka liječenih muškaraca, 7/10 = 70%, viša je od stope oporavka neliječenih muškaraca, 18/30 = 60%.

Stopa oporavka liječenih žena, 9/30 = 30%, viša je od stope oporavka neliječenih žena, 2/10 = 20%.

U cijeloj populaciji stope su obrnute. Stopa oporavka liječenih pacijenata, 16/40 = 40%, niža je od stope oporavka neliječenih pacijenata, 20/40 = 50%.

7/10 = 70% > 18/30 = 60%  

9/30 = 30% > 2/10 = 20%  

——————————–

  16/40 = 40% < 20/40 = 50%

Mnogima je to iznenađujuće, a nekima čak i paradoksalno, pa takve obrate nazivaju Simpsonovim paradoksima. Ljudi očekuju da više stope u sub-populacijama moraju rezultirati višim stopama u populaciji, jer zbrajaju se sub-populacije pa bi se nekako trebale zbrajati i njihove stope, npr. računanjem prosjeka, a ono je monotono.

Dakle, tu definitivno nema nikakvog paradoksa. No, psihološka je činjenica da ljudi ovakve situacije ipak doživljavaju kao paradoksalne i to je dokazano mnogim psihološkim eksperimentima. No, imam neke sumnje i oko tih eksperimenata.

Kako izgledaju ti eksperimenti? Navodim dva tipična.

U prvom „nematematičkom“ eksperimentu ispitanicima je kazano da u jednom školskom okrugu postoje samo dvije srednje škole i da je prolaznost djevojaka na maturi u obje škole bolja od prolaznosti dječaka.

Nakon što su upoznati s ovim činjenicama ispitanicima je postavljeno pitanje, slijedi li da je u tom okrugu prolaznost djevojaka na maturi bolja od prolaznosti dječaka. Ponuđeni su im sljedeći odgovori:

a. Da, u tom okrugu je stopa maturiranja djevojčica veća od stope maturiranja dječaka.

b. Ne, u tom okrugu stopa maturiranja djevojčica manja je od stope maturiranja dječaka.

c. Ne, u tom okrugu stopa maturiranja djevojčica jednaka je stopi maturiranja dječaka.

d. Ne može se zaključiti, jer nema dovoljno informacija.

U drugom „matematičkom“ eksperimentu ispitanicima je kazano da su sljedeće informacije točne.

Zatim su upitani slijedi li iz toga da je

te su im ponuđeni sljedeći odgovori:

(a) Da, prvi izraz je veći od drugog.

(b) Ne, prvi izraz je manji od drugog.

(c) Ne, prvi i drugi izraz su jednaki.

(d) Ne može se zaključiti jer nema dovoljno informacija.

U eksperimentu sa 106 studenata, Bandyoapdhyay i koautori ustanovili su da su na prvo nematematičko pitanje studenti netočno odgovorili (a), u 83% slučajeva, a točno su odgovorili (d), samo u 12% slučajeva. Na matematičko pitanje, netočno su odgovorili (a), u 57% slučajeva, dok su točno odgovorili (d), u 29% slučajeva.  Slične ankete ponovljene su mnogo puta i pokazale su iste obrasce odgovora.

Moje sumnje u ove eksperimente najbolje ću objasnit usporedbom s jednim drugim problemom:

Automobil A vozi brže od automobila B. Koji će automobil sa zajedničkog polazišta prvi stići na zajedničko odredište?

(a) Automobil A će stići prvi.

(b) Automobil B će stići prvi.

(c) Automobil A i automobil B stići će u isto vrijeme.

(d) Ne može se zaključiti, jer nema dovoljno informacija.

Točan odgovor je (d) jer nigdje nismo rekli da automobili kreću u isto vrijeme, iako to svi pretpostavljaju. Da smo dali informaciju da je B krenuo ranije od A broj bi se točnih odgovora radikalno povećao.

Broj točnih odgovora radikalno bi se povećao i da smo dali informacije o disbalansu djevojčica i dječaka u srednjim školama. Te dodatne informacije dole su podebljane.

U jednom školskom okrugu postoje samo dvije srednje škole T i L. Na maturi je prolaznost djevojaka u školi T veća od prolaznosti dječaka u toj školi. Škola T upisuje gotovo isključivo dječake. Prolaznost djevojaka u školi L također je veća od prolaznosti dječaka u toj školi. Škola L upisuje gotovo isključivo djevojke.

Slijedi li da u tom okrugu djevojaka imaju veću prolaznost mature od dječaka?

Dodatne informacije upućuju na to da je prolaznost djevojaka u cijelom okrugu približno jednaka njihovoj prolaznosti u školi L i da je prolaznost dječaka u cijelom okrugu približno jednaka njihovoj prolaznosti u školi T.

PŽ (U) ≈ PŽ (U|L)          PM (U) ≈ PM (U|T)

S obzirom da o odnosu veličina PŽ (U|L) i PM (U|T) nemamo nikakvih informacije slijedi da ništa ne možemo zaključiti ni o odnosu veličina PŽ (U) i PM (U). Dakle, (d) je točan odgovor.

U izvornom problemu nemamo informaciju o disbalansu djevojčica i dječaka u dvije škole pa ljudi po defaultu pretpostavljaju da on ne postoji i zaključuju:

PŽ (U) ≈ ½ PŽ (U|T) + ½ PŽ (U|L) > ½ PM (U|T) + ½ PM (U|L) ≈ PM (U)

Što to dokazuje? Samo da ljudi u nedostatku informacija praznine popunjavaju najjednostavnijim pretpostavkama. To je zdravi razum (common sense) koji ljude razlikuje od strojeva. Iako se ogromna sredstva ulažu u izgradnju common sense algoritama uspjesi su ograničeni, usp. J. Pavlos 2020. Ako vam kažem „Ivan je otišao u restoran, naručio odrezak i ostavio veliku napojnicu“ vi znate da je Ivan pojeo odrezak. Strojevi ne uspijevaju doći do tog  zdravo razumskog zaključka, jer nigdje u toj maloj sceni nije navedeno da je čovjek išta pojeo. Nama zdrav razum dopušta čitanje između redaka. Nas ne treba eksplicitno informirati da se u restoranima hrana jede nakon što se naruči i prije nego što se da napojnica.

No, vratimo se temi. Da se ne radi samo o teorijskim razmatranjima dokazuje sljedeći primjer iz sveučilišnog života. Početkom 1970-ih, kalifornijsko sveučilište Berkeley tuženo je zbog spolne diskriminacije pri upisu na postdiplomske studije. Naime, u jesen 1973. na najveće odjele primljeno je  46% kandidata i 30% kandidatkinja. Na prvi pogled, i pod pretpostavkom da su kvalifikacije podnositelja zahtjeva bile slične, ovi podaci doista bi mogli ukazivati na rodnu diskriminaciju. Međutim, kada se pogledaju podaci unutar tih odjela, predrasuda prema kandidatkinjama nestaje.

Tu je došlo do Simpsonovog „paradoksa“ jer su se žene više prijavljivale na odjele s niskim stopama prihvaćanja, dok su se muškarci više prijavljivali na odjele s visokim stopama prihvaćanja (kao što se vidi u gornjoj tablici).

To možemo još ekstremnije ilustrirati fiktivnim slučajem srednje škole iz koje izlazi 10 izvrsnih i 100 prosječnih maturanata. Od 10 izvrsnih njih se 9 pokušalo upisati na sveučilišta A lige, a uspjelo je njih 5. Pokušao je i 1 prosječni, ali nije uspio. Ostali, tj. 99 prosječnih i 1 izvrsni, pokušali su se upisati na sveučilišta C lige i uspjelo je 80 prosječnih i taj jedan izvrsni.

Iz srednje škole izlazi10 izvrsnih100 prosječnih
Upisuje A ligu5/9=55%0/1=0%
Upisuje C ligu1/1=100%80/99=81%
Ukupno5/10=60%80/100=80%

Iako su izvrsni očekivano uspješniji u obje lige, oni su ukupno neuspješniji. No, istina o uspješnosti očito je u sub-populacijama, a ne u ukupnoj populaciji, o čemu će još biti govora.

No, vratimo se prije toga našoj analizi porijekla „doživljaja paradoksa“. Kao argument da tu nije riječ samo o prešutnim zdravo razumskim pretpostavkama, već da su Simpsonove situacije u najmanju ruku matematički zahtjevne, ako ne i paradoksalne, mogla bi se navesti činjenica da je Simpsonova „paradoksalna“ situacija bila jedan od problema na matematičkoj olimpijadi 2009./2010. Evo problema.

Imate četiri čaše, sa sokom od jabuke, sokom od breskve, sokom od grejpa i sokom od mrkve. Sok od jabuke je slađi od soka od grejpa, a sok od breskve slađi je od soka od mrkve. Je li mješavina soka od jabuke i soka od breskve slađa od mješavine soka od grejpa i soka od mrkve?

Ili jednostavnije, znamo da je J > G i B > M. Je li nužno da je J+B > G+M? Naravno, > tu znači slađe, a ne količinski veće.

Primijetite da ništa ne znamo o G ⋚ B. Dakle, moguće je da je B < G, pa samo trebamo postići B + J ≈ B, G + M ≈ G i tada imamo B+J ≈ B < G ≈ G+M. Dakle, stavite nekoliko kapi J u B i nekoliko kapi M u G i dobit ćete J+B < G+M.

Pretpostavljam da autor problema nije očekivao tako jednostavno rješenje. No problem matematički nije zahtjevan i svodi se na uzimanje u obzir odgovarajućih pretpostavki.

Da zaključim. Primjena pogrešnog načela „stopa u populaciji jednaka je prosjeku stopa u sub-populacijama“ sigurno je odgovorna za pogrešne procjene Simpsonovih situacija. No, držim da važnu ulogu u tome ima i činjenica da ljudi u nedostatku informacija popunjavaju praznine zdravo razumskim pretpostavkama koje često opravdavaju primjenu tog načela. S druge strane, neke možda složenije pretpostavke dovode do drugih rezultata koji mogu biti u suprotnosti s tim načelom i to ga ipak čini nevaljanim.

Načelo sigurne stvari

U vezi sa Simpsonovim paradoksom često se spominje i načelo sigurne stvari koje je formulirao L. J. Savage u Foundation of Statistics, 1954:

Ako osoba preferira f u odnosu na g, bilo znajući da se desio B, ili ne znajući da se desio B, onda bi trebala preferirati f u odnosu na g i ako ništa ne zna o B. … To nije ni logički ni probabilistički princip.

Ne epistemološka varijanta načela glasila bi ovako:

Ako uzrok U povećava vjerojatnost posljedice P u komplementarnim sub-populacijama onda je povećava i u populaciji.

Čini se da Simpsonove „paradoksalne“ situacije obaraju to načelo. U našem medicinskom primjeru kao uzrok imamo liječenje, a kao posljedicu oporavak. Suprotno načelu sigurne stvari, liječenje povećava vjerojatnost oporavka u obje(komplementarne) sub-populacije M i Ž, ali ne i u cijeloj populaciji.

Stope oporavkaL-L
M70%60%
Ž30%20%
Svi40%50%

Ipak, gotovo svi su uvjereni da je prava istina u sub-populacijama. Ali koji su argumenti za tvrdnju da ono što vrijedi u sub-populacijama vrijedi i u cijeloj populaciji, bez obzira na podatke u cijeloj populaciji? Mogli bismo reći da je intuitivno jasno da lijek koji pomaže i muškarcima i ženama mora pomoći svima. Ali na čemu se temelji ta intuicija? Slijedi jedno moguće objašnjenje.

Pretpostavimo da znamo da estrogen ima negativan učinak na oporavak pa je, bez obzira na lijek, vjerojatnost oporavka žena značajno manja nego u muškaraca. Osim toga (što vidimo iz podataka) žene su uzimanju lijeka sklonije od muškaraca. Dakle, razlog zašto se čini da je lijek u cijeloj populaciji štetan jest da je, uz nasumični odabir korisnika lijeka, veća vjerojatnost da se radi o ženi pa je manje vjerojatno da će se odabrana osoba oporaviti. Dakle, da bismo procijenili učinkovitost lijeka, moramo usporediti osobe istoga spola, jer ćemo tako osigurati da se razlika u stopama oporavka između onih koji uzimaju lijek i onih koji ga ne uzimaju ne može pripisati estrogenu.

To je odgovor i na pokušaj C. Blytha iz 1972. da sruši načelo sigurne stvari sljedećim argumentom, vezanim uz naš medicinski primjer. Predložio je dvije oklade:

 Slučajno odabirete pacijenta dok ne naiđete na jednog koji

  • uzima lijek (to je prva oklada L)
  • ne uzima lijek (to je druga oklada -L)

i tada se za 100 eura kladite da će se taj pacijent oporaviti.

Ako je odabrani pacijent muškarac, iz podataka slijedi da vam se više isplati -L oklada. Ako je odabrani pacijent žena, iz podataka opet slijedi da vam se više isplati -L oklada. Ako ne znate je li odabrani pacijent muškarac ili žena, iz podataka slijedi da vam se više isplati L oklada. To, prema Blythu, obara načelo sigurne stvari.

No, to ne obara kauzalno načelo sigurne stvari koje je eksplicitno formulirao J. Pearl 2000, a implicitno ga je podrazumijevao L. J. Savage 1954:

Akcija U koja povećava vjerojatnost događaja P u obje sub-populacije S i -S povećava vjerojatnost od P u cijeloj populaciji, pod uvjetom da ta akcija ne utječe na distribuciju sub-populacija.

 Naime, akcija L = odabiri pacijente dok ne dođeš do jednog koji uzima lijek dovodi do odabira muškarca s vjerojatnošću 12.5%, jer je

Pr (ML) = Pr (M) Pr (L|M) = 50% 25% = 12.5%,

a do odabira žene dovodi s vjerojatnošću 37.5%, jer je

Pr (ŽL) = Pr (Ž) Pr (L|Ž) = 50% 75% = 37.5%.

S druge strane, akcija -L = odabiri pacijente dok ne dođeš do jednog koji ne uzima lijek dovodi do odabira muškarca s vjerojatnošću 37.5%, jer je

Pr (ML) = Pr (M) Pr (L|M) = 50% 75% = 37.5%,

a do odabira žene dovodi s vjerojatnošću 12.5%, jer je

Pr (ŽL) = Pr (Ž) Pr (L|Ž) = 50% 75% = 12.5%.

Dakle, akcije L i L utječu na distribuciju sub-populacija odabranih muškaraca i odabranih žena.

S druge strane, u našem izvornom primjeru, akcije L = daj pacijentu lijek i -L= ne daj pacijentu lijek ne utječu na sub-populacije muškaraca i žena, jer lijek ne utječe na spol.

Ako, kao R. Jeffery 1982, uvjet korektne primjene načela sigurne stvari pojačamo do oblika „akcije i sub-populacije moraju biti stohastički nezavisne“ načelo sigurne stvari svodi se na sasvim jednostavni probabilistički zakon. Naime taj jači uvjet garantira da je Pr (S|U) = Pr (S|-U) = Pr (S) i Pr (-S|U) = Pr (-S|-U) = Pr (-S) pa se standardno probabilističko načelo  

Pr(P|U) = Pr(P|U,S) Pr (S|U) + Pr(P|U,-S) Pr (-S|U)

Pr(P|-U) = Pr(P|-U,S) Pr (S|-U) + Pr(P|-U,-S) Pr (-S|-U)

svodi na

Pr(P|U) = Pr(P|U,S) Pr (S) + Pr(P|U,-S) Pr (-S)

Pr(P|-U) = Pr(P|-U,S) Pr (S) + Pr(P|-U,-S) Pr (-S).

I tada iz Pr(P|U,S ) > Pr(P|-U,S) i  Pr(P|U,-S ) > Pr(P|-U,-S) odmah slijedi Pr(P|U) > Pr(P|-U).

No, Jefreyev uvjet je pretjeran. Njegovo isključivanje svih slučajeva u kojima su sub-populacije i akcije  stohastički ovisne isključio bi istraživanja u kojima pojedinci s određenim karakteristikama (spol, razina obrazovanja i sl.) s većom  vjerojatnošću traže liječenje, što je čest slučaj u opservacijskim istraživanjima. Dovoljno je isključiti samo kauzalne ovisnosti, a dopustiti čisto stohastičke. Ta se razlika ne može izraziti u jeziku teorije vjerojatnosti, ali može u do-calculusu koji formalizira kauzalnost i u njemu je kauzalno načelo sigurne stvari dokazivo (J. Pearl 2000.).

Dakle, odgovor na pitanje treba li u obzir uzimati stope u sub-populacijama ili stopu u cijeloj populaciji, ne nalazi se u podacima. Kako bismo odlučili hoće li lijek naštetiti ili pomoći pacijentu, prvo moramo razumjeti „priču“ koja stoji iza podataka, tj. uzročne mehanizme koji su generirali podatke koje vidimo. Kao što to ispravno tvrde udžbenici statistike, korelacija nije uzročnost, pa najčešće nema statističke metode koja uzročnu priču može odrediti samo iz podataka. Naprosto nema čisto statističke metode odlučivanja pa zato istraživači, uz korištenje statističkih metoda, podatke najčešće moraju  tumačiti i na temelju neformalnih uzročno-posljedičnih pretpostavki.

Postoje, međutim, i ne statističke formalne metode koje se mogu koristiti za izražavanje i tumačenje uzročnosti. Uz njihovu pomoć moguće je matematički opisati uzročne scenarije bilo koje složenosti i odgovoriti na probleme donošenja odluka i u bitno složenijim situacijama od onih koje generiraju Simpsonovi „paradoksi“. Riječ je o matematičkoj teoriji kauzalnosti razvijenoj zadnjih 30-tak godina (u formi već spomenutog do-calculusa) koju mnogi smatraju „kauzalnom revolucijom“. To je posebna tema koja je izvan okvira ovoga članka.

                                              

Objavljeno u Ekonomija | 3 komentara

Na konferenciji o sigurnosti, znanosti i miru, Pugwash Hrvatska ugostio čelnike Svjetske akademije, Rimskog kluba i globalnog Pugwasha

Pugwash Hrvatska (Hrvatsko pagvaško društvo) i Svjetska akademija umjetnosti i znanosti organizirali su dvodnevnu konferenciju ‘Security, Science and Peace Conference 2022’, konferenciju o sigurnosti, znanosti, mirovnim politikama, međunarodnim odnosima i odgovornom globalnom upravljanju. Konferencija je održana pod pokroviteljstvom Predsjednika Republike Hrvatske.

Prvog dana konferencije govorili su između ostalih akademik Ivo Šlaus, počasni predsjednik Svjetske akademije umjetnosti i znanosti, član Rimskog kluba i Pugwash savjeta, zatim Garry Jacobs, predsjednik Svjetske akademije umjetnosti i znanosti, Sergio Duarte, predsjednik Pugwash Conferences on Science and World Affairs te Mamphela Ramphele, supredsjedateljica Rimskog kluba.

Teme o kojima je bilo riječi prvog dana bile su globalni sigurnosni izazovi i uloga multilateralnih organizacija u mirovnim aktivnostima, nuklearne prijetnje danas, nova sigurnosna arhitektura, hibridno ratovanje te ideje za učinkovitije globalno upravljanje. Govornici su bili Sebnem Udum, Gotz Neuneck, Wangchu Lama i Gordan Akrap.

Drugog dana konferencije uvodno je govorio Paolo Cotta Ramusino, glavni tajnik Pugwasha, nakon čega su uslijedile sesije o ulozi etike, društvenih znanosti i religije u sigurnosti, na kojoj je posebno istaknuta važnost empatije – govorili su Emilio Marin, Miro Jakovljević, Zohar Navot i Asim Kurjak. Sesija o ljudskoj sigurnosti kao novoj paradigmi okupila je brojne svjetske stručnjake koji su fokus s nacionalne sigurnosti usmjerili na sigurnost čovjeka kao individue – govornici su bili Garry Jacobs, Alyn Ware, Jonathan Granoff, Aleksander Zidanšek i Altay Abibullayev. Zadnja sesija je obuhvatila ekonomski razvoj i budućnost energetike, a svoju viziju ekonomske i energetske sigurnosti predstavili su Velimir Srića i Jose Luis Cordeiro.

Konferenciju su organizirali i moderirali Zvonimir Šikić, predsjednik Pugwash Hrvatska, i Ana Jerković, potpredsjednica Pugwash Hrvatska i suradna članica Svjetske akademije umjetnosti i znanosti.

Konferencija je u cijelosti dostupna na sljedećim poveznicama:

1. dan

Day 1 – Security, Science and Peace 2022 – 23 11 2022 – YouTube

2. dan

Day 2 – Security, Science and Peace 2022 – 24 11 2022 – YouTube

Međunarodna organizacija Pugwash Conferences on Science and World Affairs je dobilaNobelovu nagradu za mir 1995. godine za svoje napore vezane uz nuklearno razoružanje, a danas se bavi analizom suvremenih hibridnih prijetnji, povezivanjem znanosti s donositeljima odluka, poticanjem akademskoga dijaloga i odgovornog globalnog upravljanja, sprječavanjem konflikata i zlouporabe znanosti i tehnologije te drugim aktivnostima. Više se može pronaći na stranicama pugwash.org. Hrvatsko pagvaško društvo ili Pugwash Croatia je hrvatski ogranak Pugwash Conferences, kojeg je utemeljio Ivan Supek, te je najstarija nevladina organizacija u Hrvatskoj.

World Academy of Art and Science (Svjetska akademija umjetnosti i znanosti) međunarodna je organizacija koju su utemeljili Albert Einstein, Robert Oppenheimer i Bertrand Russell s ciljem povezivanja iznimnih ličnosti iz akademskog, znanstvenog, političkog i diplomatskog područja za promišljanja o globalnim pitanjima mira, održivog razvoja i suradnje znanosti s društvom na svim razinama.

Objavljeno u Ekonomija | Ostavi komentar

S Mišakom o kalendarima

bez registracije na YouTube

ili s registracijom na hrti

https://hrti.hrt.hr/home?id=0aefd886-d04f-2c36-8862-6e77ff0f899c

Objavljeno u Ekonomija | Ostavi komentar

Što je vjerojatnost (2)

2. Vjerojatnost kao frekvencija

Bacimo li čavlić, on može pasti tako da mu vrh gleda gore ili dolje (v. sliku). Ta dva ishoda nisu simetrična, pa ne možemo zaključiti da su jednako vjerojatni. Da bismo otkrili kolika je vjerojatnost ishoda G (vrh gleda gore) i D (vrh gleda dolje), moramo čavliće bacati više puta i iskustveno ustanoviti kolika je relativna frekvencija ishoda G, a kolika ishoda D.

Pr (G) ≈ relativna frekvencija događaja   Pr (D) ≈ relativna frekvencija događaja D

U skladu s tim, mnogi vjerojatnost (približno) definiraju kao relativnu frekvenciju.

Vjerojatnost događaja A približno je jednaka relativnoj frekvenciji pojavljivanja toga događaja pri ponavljanju slučajnoga pokusa velik broj puta (n je ukupni broj pokusa, a n (A) je broj pokusa u kojima se desio A):

Pr(A) = n(A)/n.

Dakle, vjerojatnost događaja jest relativna frekvencija njegovog pojavljivanja u dugom nizu ponovljenih slučajnih pokusa. Ili kraće, vjerojatnost je „dugotrajna relativna frekvencija“. I ova definicija dokaze glavnih svojstava vjerojatnosti, tj. aksioma vjerojatnosti, čini vrlo lakima. Zato ih je i Kolmogorov koristio u “Empirijskoj dedukciji aksioma”, motivacijskom uvodu u svoju aksiomatizaciju teorije vjerojatnosti Kolmogorov 1933.

Naime, ako je n(A) broj događaja A koji su se dogodili u n ponovljenih slučajnih pokusa, ako je fn (A) = n(A)/n odgovarajuća relativna frekvencija i ako je fn (B|A) relativna frekvencija događaja B u slučajevima u kojima se  dogodio A, onda očito vrijedi:      

Naravno, ako je fn = Pr onda su (1) – (4) aksiomi vjerojatnosti:

Ali, ovdje postoji jedan veliki problem. Za koji n je fn vjerojatnost? Je li vjerojatnost glave određena frekvencijom glave u 100 bacanja kovanice tj. sa f100, je li određena sa 1000 bacanja, tj. sa f1000 ili s nekom drugom frekvencijom? Koliko dugo treba biti „dugotrajno“?

„Najduže dugotrajno“ moglo bi zaobići problem, a „najduže dugotrajno“ je beskonačno dugo. Stoga bismo mogli definirati:

No, ovo rješenje problema stvara nove probleme. Za razliku od konačnih frekvencija, granične frekvencije su neopažljive. Granična relativna frekvencija nema empirijski sadržaj. Uostalom, dva beskonačna niza, koji se ne razlikuju na početku, koliko god dug on bio, mogu imati različite granične relativne frekvencije. Dakle, ne postoji veza između graničnih frekvencija i konačnih opažljivih frekvencija. Naravno, mogla bi nas zanimati matematička teorija graničnih relativnih frekvencija, ako nas zanima matematički temelj vjerojatnosti, a ne nužno i njene primjene.

Dakle, istražimo matematiku vjerojatnosti, koja je definirana kao lim fn. Čini se povoljnim da ovako definirana vjerojatnost zadovoljava aksiome vjerojatnosti (jer ih zadovoljavaju sve frekvencije fn). Ali to je tako samo ako postoji lim fn! A lako je konstruirati primjere beskonačnih nizova s nepostojećim graničnim relativnim frekvencijama.

Evo primjera niza glava i pisama bez granične relativne frekvencije glava i pisama:

GP GP GGPP GGGGPPPP GGGGGGGGPPPPPPPP …

Niz počinje s GP GP i nakon toga imamo blokove s 2n G-ova i 2n P-ova, za svaki n > 0. Ako se zaustavimo nakon n-tog bloka, relativna frekvencija glava će biti 1/2 (jer svaki blok ima isti broj glava i pisama). Ako se zaustavimo u sredini n-tog bloka, relativna frekvencija glava će biti:

Dakle, relativna frekvencija pojavljivanja glava u ovom nizu oscilira između 1/2 i 2/3, tj. granična relativna frekvencija pojavljivanja glava u ovom nizu ne postoji.

Nadalje, čak i ako beskonačan niz glava i pisama ima graničnu relativnu frekvenciju, postoji beskonačno mnogo podnizova toga niza s kojom god graničnom relativnom frekvencijom želite (pored beskonačno mnogo njih bez granične frekvencije). To znači da ako na odgovarajući način zanemarite neka bacanja, dobivate što god odaberete (pa je bolje da budete sigurni da ste vidjeli sva bacanja).

Pretpostavimo, nadalje, da su rezultati ponovljenih eksperimenata “glava-pismo” raspoređeni u prostoru i vremenu na sljedeći način:

Glave su predstavljene bijelim točkama. Njihove koordinate su parcijalne sume niza:

(2,3) + (2,3) + (2,3) + (2,3) + (2,3) + …

Pisma su predstavljena crnim točkama. Njihove koordinate su parcijalne sume niza:

(1,1) + (2,1) + (2,2) + (2,1) + (2,2) + (2,1) + (2,2) + …

Ako ste vi bacali kovanicu, vaš vremenski niz glava i pisama je:

PPG PPG PPG …

Granična relativna frekvencija glava, u vremenskom nizu, je 1/3 i to je vaša procjena vjerojatnosti glave.

Ako ja na tlu pregledavam kovanice koje ste vi bacili pomičući se u smjeru osi s, moj prostorni niz glava i pisama izgleda ovako:

GP GP GP GP GP …

Granična relativna frekvencija glava, u prostornom nizu, je 1/2 i to je moja procjena vjerojatnosti glave.

Treba li jedan odgovor biti točan, a drugi pogrešan? Ako više volite jedan od njih, razmislite o Einsteinovoj specijalnoj relativnosti.

Kao rješenje ovih problema Mises 1936. predlaže isključivanje problematičnih nizova. Dakle, nizovi eksperimentalnih rezultata trebaju biti „slučajni“ (Mises ih je zvao „kolektivima“), a to znači da:

(1) trebaju imati granične relativne frekvencije i

(2) te granične relativne frekvencije trebaju ostati iste u svakom beskonačnom rekurzivnom podnizu danog niza (“rekurzivno” je pojašnjenje iz Church 1940.).

Gore opisani “niz glava i pisama bez graničnih relativnih frekvencija” isključen je zahtjevom (1). Podnizovi “s kojom god graničnom frekvencijom želite” isključeni su zahtjevom  (2). Ipak, osjetljivost na prostor i vrijeme nije isključena. Pretpostavljam da gornji primjer, koji je danas bar donekle poznat, u Misesovo vrijeme to nije bio. Da jest, Mises bi gotovo sigurno (uz Churchovo pojašnjenje) takve anomalije isključio zahtjevom:

(3) granične relativne frekvencije trebaju ostati iste u svakom rekurzivnom preuređenju zadanog niza.

Ali nema objašnjenja zašto bi beskonačan niz ponovljenih pokusa bio „kolektiv“, tj. zašto bi beskonačan niz glava i pisama generiranih beskonačnim brojem slučajnih pokusa trebao zadovoljavati (1) – (3).

Daljnji problem za frekventiste je Kolmogorovljev aksiom kontinuiteta (koji je ekvivalentan teoremu o prebrojivoj aditivnosti). Kolmogorov 1933. smatra da je “gotovo nemoguće razjasniti njegovo empirijsko značenje, kao što je to učinjeno za [druge] aksiome”. Za Kolmogorova frekvencije fn imaju empirijsko značenje, dok ga granične frekvencije nemaju. One su matematička idealizacija. Uvriježeno je mišljenje da za nju ne vrijedi prebrojiva aditivnost. Kolmogorov je ipak postulira da bi tom dodatnom idealizacijom „pojednostavio svoju matematiku“.

Van Fraassen 1979, kao i mnogi drugi, nudi protuprimjer koji navodno dokazuje točnost uvriježenog mišljenja. To je beskonačna lutrija sa žetonima 1,2,3,4, … . Neka je Dj propozicija “izvučen je žeton j”. Pretpostavimo da u beskonačnom nizu izvlačenja (sa zamjenama) niti jedan od žetona nije izvučen beskonačno mnogo puta. Tada je Pr(Dj) (Dj) = 0, za svaki j pa iz toga slijedi da je

Pr(D1) + Pr(D2) + Pr(D3) + Pr(D4) + … = 0.

S druge strane

Pr(D1 ili D2 ili D3 ili D4 ili …) = 1,

jer je  D1 ili D2 ili D3 ili D4 ili … nužni događaj. Stoga je

Pr(D1 ili D2 ili D3 ili D4 ili …) različito od Pr(D1) + Pr(D2) + Pr(D3) + Pr(D4) + … .

To prema Van Fraassenu i mnogim drugim autorima, pobija prebrojivu aditivnost.

Ali zašto bi Pr (D1) + Pr (D2) + Pr (D3) + Pr (D4) + … trebalo biti 0? To je neodređeni oblik

koji može biti bilo što, ako se još uvijek sjećate svog prvog kolegija infinitezimalnog računa. Zapravo, u ovom konkretnom slučaju lako je dokazati da taj zbroj jest 1, kao što i treba biti prema prebrojivoj aditivnosti.

Pretpostavimo, na primjer, da beskonačan slijed izvlačenja počinje ovako:

D4, D1, D1, D2, D4, D1, D7, D2

Odgovarajuće vjerojatnosti su:

i tako dalje.

Ako zbrojimo sve stupce dobivamo:

Pr (D1) + Pr (D2) + Pr (D3) + Pr (D4) + … =

lim ( 1/1, 1/2 + 1/2, 2/3 + 1/3, 2/4 + 1/4 + 1/4, …) = lim ( 1, 1, 1, 1, …)  = 1

Izračun je isti za svaki niz izvlačenja. Naime, ako je Fj frekvencija od Dj u prvih n izvlačenja onda je zbroj vrijednosti u n-tom stupcu

, gdje je

ukupni broj izvlačenja u prvih n izvlačenja, koji je očito n pa je 

Dakle, granične relativne frekvencije zadovoljavaju prebrojivu aditivnost. (Uočite da u dokazu nismo koristili zadnji stupac.)

Isti argument dokazuje prebrojivu aditivnost. Neka D1, D2, D3 … isključuju jedan drugog. Definirajmo D kao D1 ili D2 ili D3 ili … . Tada -D, D1, D2, D3 … također isključuju jedan drugog i prethodnim argumentom “zbrajanja po stupcima” (usp. napomenu o ne korištenju zadnjega stupca) imamo

Pr (-D) + Pr (D1) + Pr (D2) + Pr (D3) + … = lim (1, 1, 1, 1 …) = 1

Iz toga slijedi da je

Pr (-D ili D) = Pr (-D) + Pr (D) = 1 = Pr (-D) + Pr (D1) + Pr (D2) + Pr (D3) + … tj.

Pr (D) = Pr (D1) + Pr (D2) + Pr (D3) + … .

Konačni je zaključak da granične relativne frekvencije zadovoljavaju aksiome vjerojatnosti (1) – (4) (što je dobro poznato), a čak zadovoljavaju i prebrojivu aditivnost (što je novi rezultat). Stoga granične relativne frekvencije nemaju problema s aksiomima vjerojatnosti. Njihov problem je što možda ne postoje, tj. beskonačan niz eksperimentalnih rezultata  možda i nema graničnu relativnu frekvenciju.

Spomenimo na kraju da je sukob frekventista s jedne strane te klasičara i bejesovaca s druge, star više stoljeća. Počeo je kao jedan je od aspekta sukoba britanskih empirista i kontinentalnih racionalista. John Stuart Mill koji je matematiku i logiku (bila ona induktivna ili deduktivna) opravdavao iskustveno, prirodno je usvojio frekvencijski pogled na vjerojatnost. U prvom izdanju svoje knjige Mill 1843. on ismijava Laplaceove vjerojatnosti propozicija, koje Laplace shvaća kao stupnjeve njihove plauzibilnosti (i uz pomoć kojih opravdava klasični pojam vjerojatnosti). Ali tri godine kasnije, u drugom izdanju, Mill mijenja stav i postaje bejesovac. Naime, astronom John Herschel objasnio mu je da nije razumio Laplacea, ali ga je i upozorio na nekonzistentnosti frekventizma. John Venn je pokušao sistematski izložiti  frekventistički pogled u svojoj knjizi Venn 1866. U njoj napada Laplaceove vjerojatnosti i njihovog britanskog proponenta Augustusa De Morgana, ali suočen s problemima identificiranja vjerojatnosti s relativnim frekvencijama ne uspijeva naći konzistentni temelj za svoj frekventistički stav (kao ni Mises 70 godina kasnije).

Kontinentalci Gottfried Wilhelm Leibniz, Jacob Bernoulli, Pierre-Simon Laplace i drugi ne identificiraju vjerojatnosti s frekvencijama. Za njih je vjerojatnost racionalni stupanj uvjerenja. No, zanima ih koja je formalna veza između frekvencija i tako shvaćenih vjerojatnosti. Bernoulli je uspio odgovoriti na dio tog pitanja, sa svojim zakonom velikih brojeva koji je objavio u knjizi „Ars Conjectandi“:  Uz odabir dovoljno dugog niza pokusa, relativna frekvencija ishoda aproksimira vjerojatnost tog ishoda s kojom god želite preciznošću. To je Bernoulli zvao svojim zlatnim teoremom. Na primjer, ako je vjerojatnost ishoda 3/5, željeni interval aproksimacije je (29/50, 31/50), a željena vjerojatnost da frekvencija padne u taj interval je 1000/1001, onda zlatni teorem kaže da se to postiže ako je broj pokušaja veći od 25550.

Motivacija za zlatni teorem bila je Bernoullijeva želja da iz empirijskih podataka određuje vjerojatnosti, jer je razumio da u mnogim područjima nije moguće odrediti vjerojatnosti na klasičan način, prebrajanjem jednako vjerojatnih slučajeva. Želio je iz velikog broja pokusa i relativne frekvencije uspjeha u tim pokusima, odrediti kolika je vjerojatnost uspjeha u pojedinom pokusu. Evidentno je da Bernoulli nije riješio taj problem. Riješio je smjer od vjerojatnosti k frekvencijama, ali ne i smjer od frekvencija k vjerojatnosti. Ipak, Bernoulli je vjerovao da je riješio problem prijelaza od frekvencija k vjerojatnosti pozivajući se na sljedeći (pogrešni) argument. Ako je uz dovoljno veliki broj pokusa relativna frekvencija približno jednaka vjerojatnosti, onda je uz taj broj pokusa i vjerojatnost približno jednaka relativnoj frekvenciji pa je problem zaključivanja od frekvencija k vjerojatnosti riješen.

Taj argument zvuči uvjerljivo: ako je

 onda je

No, pokušate li ga precizirati argument se raspada. Naime, aproksimacija od

ima po volji veliku vjerojatnost za dovoljno velike n, pod uvjetom da je p vjerojatnost uspjeha u svakom pojedinom pokusu (to je zlatni teorem). To ne znači da aproksimacija od

 ima po volji veliku vjerojatnost za dovoljno velike n, pod uvjetom da je fn relativna frekvencija uspjeha u n ponovljenih pokusa. Iako su

ekvivalentne tvrdnje, uvjeti pod kojima procjenjujemo njihove vjerojatnosti su različiti pa su to i njihove vjerojatnosti. Na primjer, kada bi druga tvrdnja bila točna onda bi frekvencije  nužno konvergirale prema graničnoj vrijednosti p, za što nisu dani nikakvi argumenti.

„Argument“ da zakon velikih brojeva omogućava prijelaz od relativnih frekvencija na vjerojatnost nevjerojatno je žilav. Preživio je do danas u formi Fisherovog p-testa, o čemu će još biti riječi. Sam zaključak tog argumenta (bez ozbiljnije rasprave o samom argumentu) ponavljali su vrlo ugledni teoretičari vjerojatnosti 20. stoljeća, uključujući Émilea Borela, Paula Lévyja, Andreja Markova i Andreja Kolmogorova. Kako je to bilo moguće? Diaconis & Skyrms 2018. misle da je to bila strategija ignoriranja problema vezanih uz interpretaciju pojma vjerojatnosti, kojom se zapravo izbjegavao ozbiljan pokušaj suočavanja s tim problemima.

Primijetimo da cijela ova rasprava (i sam zakon velikih brojeva) ima smisla samo za one koji pretpostavljaju da postoji vjerojatnost uspjeha u jednom pokusu, što su klasičari i bejesovci. Samo se oni mogu pitati je li tu vjerojatnost moguće aproksimirati relativnim frekvencijama ponavljanih pokusa. Ako ste frekventist za kojeg vjerojatnost jest granična relativna frekvencija ponavljanih pokusa onda je izlišno pitati se je li graničnu relativnu frekvenciju ponavljanih pokusa moguće aproksimirati relativnim frekvencijama ponavljanih pokusa (a zakon velikih brojeva postaje trivijalan).

Objavljeno u Ekonomija | Ostavi komentar

Što je vjerojatnost (1)

1. Klasična vjerojatnost

Elementarni uvodi u teoriju vjerojatnosti najčešće se temelje na dva pojma vjerojatnosti, klasičnom  i frekvencijskom. Postoji i treći bejesovski pojam vjerojatnosti, koji vjerojatnost drži „stupnjem plauzibilnosti“ i koji može biti subjektivan ili objektivan. To je najobuhvatniji i najprimjenljiviji, ali i najsloženiji pojam. Počinjemo s klasičnim pojmom.

Za razumijevanje ovoga pojma bitan je pojam slučajnog pokusa (zovemo ga slučajnim zato što je njegov ishod slučajan, a ne zato što je sam pokus slučajan). Na primjer, bacanje igraće kocke smatra se slučajnim pokusom. Svaki mogući ishod bacanja zove se elementarnim događajem toga slučajnog pokusa. Skup svih elementarnih događaja slučajnoga pokusa zove se prostorom elementarnih događajai obično se označava s Ω. Dakle, slučajni pokus bacanja igrače kocke ima 6 elementarnih događaja, tj.

Ω = {1, 2, 3, 4, 5, 6}.

Bilo koji skup elementarnih događaja, tj. bilo koji podskup od Ω, predstavlja slučajni događaj. Na primjer, slučajni događaj „bačen je neparan broj“ i slučajni događaj „bačen je broj manji od 5“ predstavljeni su skupovima:

N = {1, 3, 5}       i       M = {1, 2, 3, 4}.

Klasičnu vjerojatnost slučajnih događaja definiramo na sljedeći način.

Ako slučajni pokus ima konačno mnogo elementarnih događaja i ako iz simetričnosti pokusa možemo zaključiti da su svi oni jednako vjerojatni, onda je vjerojatnost događaja A jednaka  omjeru broja elementarnih događaja u kojima se dogodio A i broja svih mogućih elementarnih događaja (u donjim formulama broj elemenata u skupu S označen je s k(S)):

Pr (A) = k (A) / k (Ω).

U našem primjeru, Pr (N) = k (N) / k (Ω ) = 3/6 = 0.5 i Pr (M) = k (M) / k (Ω ) = 4/6 = 0.66666 … .

Prednost ove definicije je što ona dokaze glavnih svojstava vjerojatnosti (tzv. aksioma vjerojatnosti) čini vrlo lakima. Naime, očito vrijedi:

              

            

Naravno, (1) – (4) su standardni aksiomi vjerojatnosti (Pr(B|A) je vjerojatnost događaja B pod uvjetom da se dogodio A).

Neobično je koliko se probabilističkih problema može riješiti primjenom ovih jednostavnih ideja. Razmotrimo poznati problem rođendana: Kolika je vjerojatnost da najmanje dvije osobe u skupini od N osoba imaju isti rođendan (zanemarujući prijestupne godine i pretpostavljajući da su datumi rođenja jednako vjerojatni, a rođendani pojedinaca neovisni) ? Ako još niste vidjeli rješenje tog problema, rezultat je iznenađujući.

Najprije izračunajmo vjerojatnost da sve te osobe imaju međusobno različite rođendane. Rođendan prve od N osoba može biti bilo koji od 365 dana. Drugi mora biti različit, pa zato može biti bilo koji od preostala 364 dana. Treći može biti bilo koji od preostala 363 dana, itd. do preostalih 365 – (N – 1) dana. Dakle, ukupni broj načina na koji se mogu realizirati rođendani N osoba, tako da svi budu međusobno različiti, je

365 × 364 × 363 × 362× … × (365-N+1).

S druge strane, ukupni broj načina na koji se mogu realizirati svi mogući rođendani N osoba je

365 × 365 × 365 × 365×  … × 365 = 365N.

Dakle, vjerojatnost da svi rođendani budu međusobno različiti iznosi

Komplementarna vjerojatnost,

je vjerojatnost da u skupini od  N  osoba postoji bar jedna podudarnost rođendana. U sljedećoj tablici izračunati su iznosi te vjerojatnosti PN za neke vrijednosti N (kako se ti iznosi mogu izračunati jednostavno, bez glomaznih množenja i dijeljenja vidi u Šikić 2005.).

N5102023304060
PN0.0270.1170.4110.5070.7060.8910.994

Vidimo da je vjerojatnost bar dva podudarna rođendana veća od 50% već u skupini od 23 osobe, a u skupini od 60 osoba skoro je sigurna.

Postoji mnogo varijacija na ovu temu i najčešće se koriste za analizu iznenađujućih koincidencija. Na primjer, moguće je na sličan način dokazati da je velika vjerojatnost da u Hrvatskoj postoje dvije osobe koje imaju isti rođendan, čiji očevi imaju isti rođendan, a i očevi njihovih očeva imaju isti rođendan.

Prvi značajniji rad u matematici vjerojatnosti koristio se klasičnim pojmom i nalazimo ga u prepisci na tu temu između Blaisea Pascala i Pierra de Fermata, koja je započela 1654. Ona pokazuje kako se naizgled složeni problemi mogu svesti na jednostavne izračune s jednako vjerojatnim elementarnim događajima, ali i da nije uvijek jednostavno odrediti prostor takvih događaja.

Jedan od problema iz njihove prepiske je slavni problem bodova. Dva igrača igraju niz igara, na primjer bacaju kovanicu i prvi se kladi na glavu, a drugi na pismo. Tko pobijedi u pojedinoj rundi dobiva bod, a prvi koji dosegne određeni broj bodova pobjeđuje u igri i uzima uloge. Odigrali su određen broj rundi i igra je zbog nečega prekinuta. Što je pravedna podjela uloga ako se igra ne može nastaviti?

Problem bodova je zbunjivao  mnoge koji su se njime bavili prije Pascala i Fermata. Fra Luca Pacioli je 1494. razmatrao igru koja završava kada jedan igrač osvoji 6 bodova, ali je prekinuta kada je prvi igrač osvojio 5, a drugi 3 boda. Pacioli je smatrao da je pravedna podjela proporcionalna osvojenim bodovima. Dakle, 5 prema 3. Oko 50 godina kasnije Nicolo Tartaglia je prigovorio da, prema Paciolijevom pravilu, ako se igra prekine nakon 1 runde koju je dobio prvi igrač, on treba dobiti cijeli ulog, a to nema smisla. Tartaglia je pokušao modificirati Paciolijevo pravilo, ali je na kraju zaključio da definitivan odgovor nije moguć. Čini se da je problem  zbunjivao sve koji su o njemu razmišljali, do ključnog uvida koji je imao Fermat.

Pretpostavimo da nakon prekida jednom igraču do pobjede nedostaje r bodova, a drugome s. To znači da bi se igra odlučila u sljedećih r + s – 1 rundi.  Svi nizovi od r + s − 1 bacanja kovanica predstavljaju jednako vjerojatne elementarne događaje pa vjerojatnosti pobjede jednog i drugog igrača možemo izračunati kao klasične vjerojatnosti.

Za Paciolijev problem, u kojem za pobjedu treba 6 bodova, a nakon prekida prvi igrač ima 5 bodova, a drugi 3, igra bi se odlučila u sljedeće 3 runde. Od 8 jednako vjerojatnih nizova glava i pisama u te 3 runde:

GGG, GGP, GPG, PGG, GPP, PGP, PPG, PPP,

prvi igrač pobjeđuje u prvih sedam slučajeva , a drugi samo u zadnjem slučaju. Dakle, omjer vjerojatnosti njihovih pobjeda je 7:1 pa Fermat smatra da i pravedna podjela dobitka treba biti u istom omjeru. Dakle, on kao pravedni iznos implicitno koristi očekivanu vrijednost E, koja je vjerojatnostima ponderirani iznos mogućih dobitaka (koji su ulog U ili ništa):

E(prvi igrač) = 7/8 × U + 1/8 × 0          E(drugi igrač) = 1/8 × U + 7/8 × 0

Brojanjem jednako vjerojatnih slučajeva, riješili smo problem. Ali ako imamo veliki broj jednako vjerojatnih slučajeva račun postaje glomazan. Razmotrite Tartaglin primjer. Šest bodova je potrebno za pobjedu, a nakon prekida prvi igrač ima jedan, a drugi nijedan bod. Da bi igra završila trebalo bi odigrati još 10 rundi. Dakle, trebamo analizirati 210 = 1024 jednako vjerojatnih nizova glava i pisama. Dosta posla da ih sve ispišemo i prebrojimo povoljne za prvog i drugog igrača. Pascal je smislio bolji način brojanja.

Za prebrojavanje slučajeva u kojima pobjeđuje prvi igrač, Pascal je zbrojio broj slučajeva u kojima prvi igrač ima 5 pobjeda u 10 pokušaja  + broj slučajeva u kojima ima 6 pobjeda u 10 pokušaja  + · · · + broj slučajeva u kojima ima 10 pobjeda u 10 pokušaja . Ovi brojevi se nalaze u 10. redu Pascalovog aritmetičkog trokut (ili Tartaglinog trokuta, ili trokuta Omara Hajjama, svi su oni znali za taj trokut):

i tako dalje

U N-tom red toga trokuta nalaze se brojevi načina na koje možemo iz grupe od N objekata odabrati njih 0, 1, 2, 3, … , N. Dakle, brojevi za Tartaglin problem nalaze se u 10. redu od 5. mjesta na dalje, tj. to su brojevi 252, 210, 120, 45, 10 i 1. Njihov je zbroj 638 pa je vjerojatnost pobjede prvog igrača 638/1024 (oko 63%). On treba dobiti 63% uloga, a drugi igrač 37%.

Pascal i njegovi prethodnici dokazali su da se trokut jednostavno konstruira (jer su sve vrijednosti „uokvirene 1-cama“ zbroj dvaju vrijednosti iznad njih), a nastavljači Pascala i Fermata  razvili su i mnoga druga kombinatorna načela koja omogućavaju jednostavna računanja vjerojatnosti prebrajanjem jednako vjerojatnih slučajeva.

No, problem s klasičnom vjerojatnošću je da vjerojatnost često želimo primijeniti i u situacijama u kojima ne možemo osmisliti slučajni pokus koji bi opisivao tu situaciju i koji bi imao odgovarajuće simetrije iz kojih bismo mogli zaključiti da su svi njegovi elementarni događaji jednako vjerojatni. Ta je simetrija najčešće prisutna u igrama na sreću i sličnim artificijelnim situacijama, a i tada može biti upitna.

Naime, njutnovski determinizam već je u 17.stoljeću doveo u pitanje pojam slučajnog pokusa. Razmislite o bacanju kovanice. Palac udara u kovanicu, ona leti, vrti se i konačno  pada na tlo. Isti slučajni pokus u istim uvjetima trebao bi rezultirati s jednim od dva jednako vjerojatna slučajna ishoda, glavom ili pismom. No, ako palac udari kovanicu na isto mjesto istom snagom, ona će letjeti na isti način i sletjeti na istu stranu. Bacanje novčića je deterministički, a ne slučajni pokus. Za zadanu početnu brzinu v i kutnu brzinu  ω ishod možemo izračunati i rezultat je sljedeći – početni uvjeti koji rezultiraju glavom su šrafirani, a oni koji rezultiraju pismom su bijeli.

Stroj koji izbacuje kovanicu s raznim brzinama v i  ω, tu činjenicu eksperimentalno dokazuje, a kovanica uvijek pada na istu stranu za fiksni v i  ω, usp. Diaconis i koautori 2007. Mnogi mađioničari i kockari, uključujući Diaconisa, također imaju tu „strojnu“ sposobnost, tj. mogu postići da kovanica sleti na koju god žele stranu.

Kako je onda bacanja kovanice postalo paradigmatskim primjerom slučajnog pokusa? Odgovor je pred više od sto godina dao Poincaré 1892. Ako je kovanica bačena snažno, s dovoljno velikom vertikalnom brzinom v i kutnom brzinom ω, osjetljivost na početne uvjete v i  ω bit će velika (tj. šrafirani i bijeli dijelovi gornjeg grafa, u tom području, postaju  nerazlučivi). Tada čak i vrlo mala promjena početnih uvjeta dovodi do promjene ishoda i zato jednaka vjerojatnost ishoda i nije tako loša pretpostavka. Uočite, međutim, da to objašnjenje vjerojatnost vidi kao rezultat našeg nepoznavanja početnih uvjeta bacanja kovanice, a ne kao neko objektivno svojstvo toga bacanja.

Objavljeno u Ekonomija | Ostavi komentar

Minds, Machines and Gödel

Vrlo popularani argumenti za to da um nije stroj pozivaju se na Gödelove teoreme o nepotpunosti. Ovdje predstavljam neke od najpoznatijih takvih argumenata, kao i njihove najpoznatije kritike. Na kraju, nudim vlastitu rekonstrukciju ovih argumenata i pokazujem zašto ti argumenti nisu valjani. Tekst nisam prevodio jer pretpostavljam da oni koje on zanima dovoljno vladaju engleskim da ga razumiju.

1. Gödel’s theorems

The vast majority of those who use Gödel’s theorems of incompleteness to argue for mind-machine non-equivalence do not fully understand what Gödel’s theorems are claiming. So we will begin by presenting the theorems. Gödel’s first incompleteness theorem reads as follows.

If formal mathematical theory M includes an appropriate amount of arithmetic it contains an explicitly definable sentence G which asserts its own non-provability and is such that, if M is consistent then it is not ⊢ M G and if M is omega-consistent then it is not ⊢ M – G, where ⊢ M is provability in M.

In what follows ⊢ is ⊢ M , and M is a formal mathematical theory which includes an appropriate amount of arithmetic.

Gödel’s second incompleteness theorem reads as follows.

If formal theory M is consistent it cannot prove its consistency, Con (M), which is expressed by non-provability of contradiction *, -Pr (‘*’), because  Con (M) ↔ G. (About provability predicate Pr (x) see in the appendix.)

Concerning formal unprovability of G and -G, it can be proved that

⊢  -Pr (‘G’) ↔ Con (M)      and       ⊢  – Pr (‘-G’) ↔ Con (M + Con (M)).

Notice that Con (M + Con (M)) is stronger than Con (M) (by the second incompleteness theorem) and it is less strong then consistency.

Ideas of the proofs of these results are given in the apendix. Let us now turn to “Gödelian dualist” arguments and their refutations.

2. Gödel

We will start with Gödel. In [GG] he admits the possibility that human mind is a machine unable to understand completely its own functioning. He even says it is conceivable that it would be known with empirical certainty:

1. That the brain suffices for the explanation of all mental phenomena and is a machine in the sense of Turing.

2. That such and such is the precise anatomical structure and physiological functioning of the part of the brain which performs mathematical thinking.

Hence, “Gödelian dualist” would have a hard time convincing Gödel himself.

3. Penrose, Boolos and Good

Penrose [PE] claims that we can see that G is true as follows. If G is provable in Peano arithmetic PA then it is false (because it asserts that it is not provable). But that is impossible “because our formal system should not be so badly constructed that it actually allows false propositions to be proved [in other words it should be correct]”. So, G is unprovable and therefore true.

Boolos [B] asks what about Gödel sentence G for ZFC.  It is also unprovable in ZFC and therefore true, if ZFC is correct.But we do not know that. “We could be in the same situation regarding ZFC that Frege was before receiving the letter from Russell”.

Anyway, the argument could be much simpler. If we know that M is correct and therefore consistent then ⊢ Con (M) ↔ G implies that we know that G is true. And that’s it.

Of course, M also “knows” that, because ⊢ Con (M) ↔ G. But, do we know that Con (M) is true? If we know this, we can always extend M to M + Con (M) and our knowledge of the truth of Con (M) is then successfully formalized. Of course, now the question is do we know that Con (M + Con) is true etc. The “Gödelian dualist”  must verify that the Con sentences of all these extensions are true. But [Go] successfully argued that no such proof is possible (since it would imply that the smallest non-constructible ordinal is constructible).

4. Lucas and Lewis

Lucas [L] bypasses this hierarchy of extensions. He defines an effective function Consuch that:

C1. Con (M) is true if and only if M is consistent,

C2. if M is correct then Con (M) is true,

C3. Con (M) is provable if and only if M is inconsistent.

Call C a consistency sentence for set of sentences S iff there is M such that S is the set of its provable sentences and C = Con(M). Then the following rule of inference is sound, by C2:

R. If C is a consistency sentence for S, infer C from S.

Lucas extended PA to LA, with the rule R. The theorems of LA are true because its theorems come from Peano axioms by truth-preserving rules of inference. Now, if LA is a formal theory,its consistency sentence C = Con(LA) would be its theorem, by R, and LA would be inconsistent, by C3. Hence, by C1, the falsehoods would follow from the Peano axioms themselves. Therefore, insofar as we trust the Peano axioms, we know that Lucas arithmetic is not the output of any formal theory.

So if Lucas can verify all the theorems of Lucas arithmetic then Lucas is no machine. But we are given no reason to believe that he can. As Lewis warned in [Le], in order to check whether Lucas’s rule R has been used correctly, a checking procedure would have to decide whether a given set S of sentences is the output of a formal theory and that, we know, is an undecidable problem. So we do not know how many theorems of LA Lucas can produce. He can certainly go beyond PA, but he can go beyond it and still be a machine, because limitations on his ability to verify theoremhood in LA may leave him unable to recognize a lot of theorems of LA.

5. McCall not understanding Godel’s theorem

McCall’s reasoning in [Mc] differs from the earlier “Gödelian dualist’s” arguments in his admission that the recognition of truth of Gfor a formal theory Mdepends essentially on the unproved assumption that the theory Munder consideration is consistent. But McCall notes that we have two different cases:

  1. If M is consistent then G is not provable.
  2. If M is consistent then – G is not provable.

He claims that both sentences are true. They are not!  Unprovability of -G depends on omega-consistency. He thinks the difference is that the formal version of 1. is a theorem, whereas the formal version of 2. “to the best of [his] knowledge” is not, i.e.

  1.  Con (M) ⊢ – Pr (‘G’),     
  2.  Con (M) ⊢ – Pr (‘-G’).

McCall thinks that 1. yields the true but unprovable sentence. But, we can recognize the truth of – Pr (‘-G’), if we assume not only the consistency of M, but the omegaconsistency of M or the consistency of M + Con (M); which is less strong but suffices. Hence, for the comparison to be fair, it would have to involve a formal theory equipped with whatever assumptions we ourselves have employed in order to see the truth of 2. But we know that

⊢ Con (M + Con (M)) ↔ – Pr (‘-G’)

So, what we can prove, the machine can also prove.

6. My account

My own account of dualists’ argument is as follows. “Gödelian dualist”  argue that no machine M can be identical to a human mathematician H, in the following way. Let Mp be the set of arithmetical sentences provable by M and Hk is to be the set of arithmetical sentences knowable by H (the only property of the notion of knowledge we will need is that knowledge entails truth and that truth does not entail knowledge). Then Mp  Hk or Mp   Hk. In the second case Mp  Hk , hence M  H. In the first case whatever is provable by M is knowable by H and that means that all sentences in Mp are true. Therefore H knows that M is a correct system. But then H knows that it is a consistent system, i.e. Con (M)  Hk. But Con (M)  Mp, by second Gödel’s theorem, hence Mp  Hk and therefore M  H. Hence, M  H in every case.

But the above conclusion “Therefore H knows that M is a correct system.” is not justified. From the truth that every sentence provable by M is knowable by H it does not follow that H knows that (and therefore knows that M is correct), because truth does not entail knowledge. It is possible that Mp  Hk and that H does not know that. In some specific cases we may know just enough to conclude that M is a correct system. On the other hand, it remains possible that there may exist, and even be empirically discoverable (cf. Gödel above), mathematical machines which in fact are equivalent to our mathematical intuitions. For example, we could be such machines.

So, “Gödelian dualist” like [L], [PS] pp.189. and 641. or [PE] pp. 107.-108. confused the incorrect argument (1) with the correct argument (2).

(1) There is no machine which could capture all our mathematical intuitions.

(2) There is no machine which could capture all our mathematical intuitions and which we could understand well enough to know that it is consistent (i.e. that G is true).

We may conclude. As far as Gödel’s incompleteness theorem is concerned we could well be machines. But if we are then we are definitely not capable of the complete knowledge of the machines, i.e. of the complete knowledge of ourselves. It is very close to Gödel’s understanding of the problem.

7. Appendix

If formal mathematical theory M includes an appropriate amount of arithmetic it can refer to its expression F with its Gödel’s number ’F’. Furthermore, M can express a diagonal function d such that for any expression F, d(’F’) = ’F(’F’)’.

Gödel defined arithmetical predicate Prv(x, y) which represents “x is proved by y” (within M itself) and proved that:

  1. If n is Gödel’s number of a provable formula then Prv (n, m) for some m
  2. n is not Gödel’s number of a provable formula then  Prv (n, m) for every m

Gödel then defined Pr (x), which represents “x is provable”, as Ey Prv (x, y). From 1) it easily follows (B1). From 2), with the help of ω-consistecy, it easily follows (B1′). It is also easy to prove (B2) and somewhat more difficult (B3).

(B1)           X  ⊢  Pr(‘X’),               

(B1’)          Pr(‘X’) ⊢ X    if M is ω-consistent

(B2)         ⊢ Pr(‘X → Y’) → (Pr(‘X’) → Pr(‘Y’)),

(B3)        ⊢  Pr(‘X’) → (Pr(‘Pr(‘X’)’).

Furthermore, Gödel realized that for any predicate P(x), substitution of ‘P(d(x))’ for x in P(d(x)) gives P(d(‘P(d(x))’)), or D for short. It immediately follows that D ↔ P(’D’). It follows that there is a sentence G such that

(DL)        ⊢  G ↔ -Pr(‘G’)

From (DL), (B1) and (B1’) we can deduce the first incompleteness theorem. Namely,

 G  →  Pr(‘G’) ↔   -G

 -G  ↔  Pr(‘G’)  →  G

Both implications contradict the consistency of M. Hence, not ⊢ G and not ⊢ -G. Note that we used (B1’), i.e. -consistency, to prove the unprovability of -G.

From (DL), (B1), (B2) and (B3) we can deduce the second incompleteness theorem:

⊢ G → (Pr(‘G’) → * )

⊢ Pr(‘G’) → (Pr(‘Pr(‘G’)’) → Pr(‘*’))

⊢ Pr(‘G’) → Pr(‘ ’)  

⊢ -Pr(‘*’) → -Pr(‘G’)                 i.e.                ⊢  Con(M) → G

⊢  * → G

⊢ Pr(‘*’) → Pr(‘G’)    

⊢ -Pr(‘G’) → -Pr(‘*’)                 i.e.                ⊢  G → Con(M)

Now, from  not ⊢ G and ⊢ Con (M) ↔ G it immediately follows that  not ⊢ Con (M).

So, by (DL) and  ⊢ Con (M) ↔ G, unprovability of G is provably equivalent to the consistency of M:

⊢ -Pr (‘G’) ↔ Con (M)

What do we know about the unprovability of – G, which is the other part of the first incompleteness theorem? From ⊢ -G ↔ Pr (*), by (B1) and (B2), we get

⊢ -Pr (‘-G’) ↔ – Pr (Pr (‘*’)).

But -Pr (Pr (‘*’)) expresses the consistency of M + Con (M). Namely, if PrM+Con (M) is the provability predicate of M + Con (M), then the consistency of M + Con (M) is expressed by -PrM+Con (M)  (‘*’). But,

– Pr (Pr (‘ ’)) ↔ – Pr(-Con (M)) ↔  – PrM+Con (M)  (‘*’)

Hence

 ⊢ -Pr (‘-G’) ↔ Con (M + Con (M)).

References:

[B] Boolos G. On seeing the truth of the Gödel sentence, Behavioural and Brain Sciences 13, 655-656, 1990.

 [G] Gödel, K. Über formal unentscheidbäre Sätze I. Monatshefte für Mathematik und Physik, 38, 173-198, 1931.

[GG] Gödel, K. Gibbs Lecture, 1951, in Collected Works, Vol. 3: Unpublished Essays and Lectures, Editor-in-chief S. Feferman, Oxford University Press, 1995.

[Go] Good, I. J. Gödel’s theorem is a red herring, The British Journal for the Philosophy of Science 18, 359–73,1969.

[Le] Lewis, D. Lucas against mechanism II. Canadian Journal of Philosophy 9, 373–6.1989.

[L] Lucas, J.R. Minds, machines and Gödel. Philosophy, 36, 112-137, 1961.

[Mc] McCall, S. Can a Turing machine know that the Gödel sentence is true?, Journal of Philosophy 96, 525-532, 1999.

[PE] Penrose, R. The Emperor’s New Mind. Oxford University Press, 1999.

[PS] Penrose, R. Shadows of the Mind: A search for the missing science of consciousness, Oxford University Press, 1994.

Objavljeno u Ekonomija | Ostavi komentar

O matematici i muzici sa Ščekićem kod Mišaka

Sljedeći tjedan gostujem kod Mišaka s temom “Kalendari”. Do tada podsjetnik na jednu staru temu.

Objavljeno u matematika, muzika | Ostavi komentar

Što je konsonantnost (u glazbi)

Predavanje s gornjim naslovom održano u Matematičkom institutu SANU možete vidjeti ovdje:

https://miteam.mi.sanu.ac.rs/asset/QsKfQSqgZmobWJEtC

Objavljeno u fizika, matematika, muzika | Ostavi komentar

Poziv na tribinu

Pozivamo Vas na tribinu ‘ENERGETSKA BUDUĆNOST HRVATSKE’ koja će se održati u četvrtak, 5. svibnja 2022. godine od 10 do 13 sati u organizaciji Hrvatskog pagvaškog društva, Akademije tehničkih znanosti Hrvatske i Svjetske akademije umjetnosti te znanosti pod pokroviteljstvom Ministarstva gospodarstva i održivog razvoj.

Moderatori: prof. dr. sc. Zvonimir Šikić, predsjednik Hrvatskog pagvaškog društva i Ana Jerković, Hrvatsko pagvaško društvo, Svjetska akademija umjetnosti i znanosti

10:00 – Uvodna riječ: akademik Ivo Šlaus, član Međunarodnog savjeta
Pugwash Conferences on Science and World Affairs, počasni predsjednik
Svjetske akademije umjetnosti i znanosti

10:00-10:30 dr. sc. Kristina Čelić, ravnateljica Uprave za energetiku,
Ministarstvo gospodarstva i održivog razvoja


10:30-11:00 prof. dr. sc. Neven Duić, Fakultet strojarstva i brodogradnje Zagreb,
Akademija tehničkih znanosti Hrvatske


11:00-11:30 prof. dr. sc. Davor Grgić, Fakultet elektrotehnike i računarstva
Zagreb, Akademija tehničkih znanosti Hrvatske


11:30-12:00 prof. dr. sc. Frano Barbir, Fakultet elektrotehnike, strojarstva i
brodogradnje Split, Akademija tehničkih znanosti Hrvatske,
Hrvatsko pagvaško društvo


12:00-13:00 Rasprava

Tribina se održava u hibridnom formatu, te dostavljamo link za praćenje putem YouTubea.

YouTube streaming:

Hrvatsko pagvaško društvo

Objavljeno u Ekonomija | Ostavi komentar

Predavanje u kafiću teatra &TD

Matematika i slikarstvo

Caffe Teatar &TD, Zagreb, četvrtak 21. 4. 2022. u 18h

Zvonimir Šikić

Pokazati ću kako se linearna perspektiva od renesansne eksperimentalne a zatim i teorijske slikarske tehnike razvila u matematičku disciplinu. Sve će biti bogato ilustrirano radovima velikih slikara od antike preko renesanse sve do naših dana.

Objavljeno u matematika, umjetnost | Ostavi komentar