Koja je matematička pozadina Simpsonovog obrata i zašto on (bar katkada) djeluje paradoksalno?

Počnimo s nečim jednostavnijim. Težinskom sredinom od  r i q  (s težinskim faktorima  α i β) zovemo svaki broj oblika s = αr + βq  gdje su α, β pozitivni i α+β=1. Očito je da s može primiti bilo koju vrijednost između r i q kada α prima vrijednost između 0 i 1 (s = r  za  α = 0  i  s = q  za  α = 1):

int

Isto je tako očito da iz  r1 >  r2  i  q1 >  q2 nužno ne slijedi  s1 > s2 :

int2

Pretpostavimo sada da je populacija P podijeljena na dvije (nepreklapajuće)  subpopulacije R i Q te da su r1 i q1  udjeli istraživane pojave u onim dijelovima od R i Q  na koje djeluje pretpostavljeni uzrok, a r2 i q2  u onima na koje taj uzrok ne djeluje. Efikasnost uzroka je potvrđena i u R i u Q ako je  r1 > r2  i  q1 > q2.

Ako s p1 i p2 označimo udjele istraživane pojave u onim dijelovima ukupne populacije P na koje pretpostavljeni uzrok djeluje, odnosno ne djeluje, onda će efikasnost uzroka u P biti oborena ako je p1< p2.

Je li moguće da je efikasnost uzroka potvrđena u subpopulacijama, a oborena u ukupnoj populaciji?

Za odgovor na to pitanje ključno je razumjeti kako p1  ovisi o r1 i q1 (i analogno, kako p2 ovisi o r2 i q2).

Ako je p1 težinska sredina od r1 i q1,  a  p2 od  r2 i q2  onda je očito moguće da bude p1< p2 iako je  r1>r i  q1>q2:

fin

Ukratko, Simpsonov obrat u tom je slučaju očigledna mogućnost. No, pogledajmo kako p1 obično računamo iz r1 i q1 (isti račun vrijedi za p2,, r2 i q2).

Ako je r1 = R1‘/R1  i  q1 = Q1‘/Q1   onda je p1 = P1‘/P1 =  (R1‘+Q1‘) / (R1+Q1).

Naime,  P1 = R1 + Q1 (jer je populacija onih na koje djeluje pretpostavljeni uzrok jednaka zbroju odgovarajućih subpopulacija) i slično P1‘ = R1‘ + Q1 (jer je onaj dio te populacije u kojem se pojavljuje istraživana pojava jednak zbroju njemu odgovarajućih subpopulacija).

No, tada lako slijedi:

p1 = (R1‘+Q1‘)/(R1+Q1) = R1‘/(R1+Q1) + Q1‘/(R1+Q1) = (R1‘ /R1)(R1 /(R1+Q1)) + (Q1‘ /Q1)(Q1 /(R1+Q1)) = r1α + q1β

gdje su α i β pozitivni i α + β = 1  tj. p1 je težinska sredina.

Budući da R1 i Q1 možemo učiniti po volji malenim ili velikim bez da mijenjamo  r1 i q1, jer je  r1=R1‘/R1= (x R1‘)/(x R1) i  q1=Q1‘/Q1= (y Q1‘)/(y Q1), tako dobiveni  α=R1/(R1+Q1)  i  β=Q1/(R1+Q1) mogu primati sve vrijednosti između 0 i 1 (α=0 za R1=0 i α=1 za Q1=0), tj. p1  može biti bilo koja težinska sredina između r1 i q1. Analogno vrijedi za  p2, r2, i q2.

Dakle, mogućnost Simpsonovog obrata je očita, a čini se paradoksalnom tek ako nismo svjesni gornjeg jednostavnog računa koji p otkriva kao težinsku sredinu od r i q.

Taj račun dodatno pokazuje kako je lako konstruirati iznenađujuće Simpsonove obrate. Evo jednog zanimljivog primjera.

Radi se o zadatku s Matematičke olimpijade koja je šk.g.2009./10. održana u Izraelu:

Imamo 4 posude. Prva sadrži određenu količinu soka od jabuka, druga od krušaka, treća od grejpa i četvrta od mrkve. Količine nisu nužno jednake. Znamo da je sok od jabuke slađi od soka od grejpa, te da je sok od kruške slađi od soka od mrkve. Je li istina da miješanjem prve dvije posude (jabuke i kruške) nužno dobivamo mješavinu koja je slađa od one dobivene miješanjem druge dvije (grejpa i mrkve)?

Shematski prikazano, pitamo se da li iz

J  slađe od  G,

 K  slađe od  M,

nužno slijedi

J + K  slađe od  G + M,

gdje su J, K, G i M količine soka od jabuke, kruške, grejpa i mrkve sadržane u našim čašama.

Ako sa j označimo količinu šećera u J, s g količniu šećera u G  itd. onda prethodno pitanje glasi:

Da li iz   j/J  > g/G  i  k/K > m/M  nužno slijedi  (j+k)/(J+K) > (g+m)/(G+M) ?

(Usput, (a+b)/(A+B) zovemo medijantom od a/A  b/B. Dakle, (j+k)/(J+K) i (g+m)/(G+M) su medijanti od  j/J,  k/K  i  g/G,  m/M.)

Prema našem računu, medijanti su težinske sredine:

(j+k) / (J+K) = (j/J)(J/(J+K)) + (k/K)(K/(J+K)),

(g+m)/(G+M) = (g/G)(G/(G+M)) + (m/M)(M/(G+M)).

Odaberimo konkretne vrijednosti u skladu s našim pretpostavkama o tome što je slađe, ali i tako da je k/K < g/G (kako bi se intervali (m/M, g/G) i (k/K, j/J) preklapali). Na primjer:

Untitled

Onda dobivamo:

(j+k) / (J+K) = (4/5)(J/(J+K)) + (2/5)(K/(J+K)),

(g+m)/(G+M) = (3/5)(G/(G+M)) + (1/5)(M/(G+M)).

Sada je dovoljno odabrati mali težinski faktor uz  j/J = 4/5, a veliki uz k/K = 2/5 (npr. J=1 i K=19) da težinska sredina  (j+k)/(J+K)  bude blizu  k/K = 4/5 :

(j+k)/(J+K) = (4/5)(1/20) + (2/5)(19/20) = 42/100 ≈ 40/100 = k/K.

Slično, s malim težinskim faktorom uz  m/M = 1/5, a velikim uz  g/G = 3/5    (npr. G=19 i M=1), težinska sredina (g+m)/(G+M)  biti će blizu  g/G = 3/5:

(g+m)/(G+M) = (3/5)(19/20) + (1/5)(1/20) = 58/100 ≈ 60/100 = g/G.

Dakle,

g/G ≈ (g+m)/(G+M) > (j+k)/(J+K) =  k/K

pa imamo željeni Simpsonov obrat:

19l  grejpa pomiješano sa 1l  mrkve slađe je od 1l j abuke pomiješano s 19 l  kruške, iako je grejp manje sladak od jabuke i mrkva manje od kruške.

(Naravno, važno je i to da je grejp slađi od kruške što u zadatku nije zadano. No, pitanje je bilo je li jedna mješavina nužno slađa od druge. Odgovor je : nije nužno jer nije u slučaju da je grejp slađi od kruške i da su količine G=K=19l  i J=M=1l).

Dakle, ako znate da su  p1 i p2  težinske sredine od  r1, q1  i  r2, q2  onda (kao u prethodnom zadatku) uvijek možete odrediti  R1, Q1, R2 i  Q2  tako da je  p1>p2  iako je r1<q1 i r2<q2,  jer je trivijalna činjenica da za  r1<r2<q1<q2  uvijek možemo naći   p1>p2  tako da je  r1<p1<q1  i  r2<p2<q2 :

fin fin

Naravno, ako o p1 = P1‘/P1  mislite samo kao o medijantu od  r1 = R1‘/R1 i Q1 = Q1‘/Q1 , a o  p2 = P2‘/P2   samo kao o medijantu od  r2 = R2‘/R2 i q2 = Q2‘/Q2, onda to nije tako očigledno i možda ćete biti zbunjeni ili čak misliti da ste suočeni s paradoksom.

Uostalom ni Pitagorin teorem (zbroj kvadrata nad katetama jednak je kvadratu nad hipotenuzom) nije očigledan dok ne vidite njegov očigledni dokaz:

pitag

Odgovori

Please log in using one of these methods to post your comment:

WordPress.com Logo

Ovaj komentar pišete koristeći vaš WordPress.com račun. Odjava / Izmijeni )

Twitter picture

Ovaj komentar pišete koristeći vaš Twitter račun. Odjava / Izmijeni )

Facebook slika

Ovaj komentar pišete koristeći vaš Facebook račun. Odjava / Izmijeni )

Google+ photo

Ovaj komentar pišete koristeći vaš Google+ račun. Odjava / Izmijeni )

Spajanje na %s