Sigmund i Nowak u svojim su turnirima tražili strategije čije su odluke bile reakcije na akcije  oponentnih strategija. Uskoro su proširili svoju potragu i na strategije čije su odluke mogle biti i reakcije na vlastite akcije.

Da biste bolje razumjeli o čemu se tu radi, zamislite sebe kao sudionika turnira. Ako vaš oponent u prethodnoj igri nije surađivao možda će vaša reakcija u sljedećoj igri ovisiti i o tome što se vi učinili u prethodnoj igri. Ako ni vi niste surađivali možda ćete blaže reagirati na nesuradnju oponenta, nego što biste reagirali da jeste surađivali.

Nowak je vjerovao da će velikodušni TFT i dalje biti dominantan u „ciklusu izmjena dobra i zla“. No, pokazalo se da je veoma zastupljena bila i sljedeća strategija:

  1. Ako smo oboje surađivali u prošloj igri onda ja surađujem i u sljedećoj.
  2. Ako oboje nismo surađivali u prošloj igri onda ja u sljedećoj surađujem (s određenom vjerojatnošću).
  3. Ako ste vi u prošloj igri surađivali, a ja nisam, onda ja ni u sljedećoj igri ne surađujem.
  4. Ako sam ja u prošloj igri surađivao, a vi niste, onda ja u sljedećoj igri ne surađujem.

Mogli bismo je sažeti i ovako:

I.            Ako smo u prošloj igri činili isto onda ja u sljedećoj igri surađujem.

II.            Ako smo u prošloj igri činili različito onda ja u sljedećoj igri ne surađujem.

Strategija je postala još jasnijom kada ju je biolog J. Krebs prepoznao kao strategiju s kojom se veoma često susreću etolozi (istraživači životinjskog ponašanja. Oni je nazivaju „ako dobijaš ne mijenjaj, ako gubiš mijenjaj“ ili kraće WSLS (Win Stay, Lose Shift). Naime, točke 1. i 3. iz prvog opisa strategije nisu drugo do „ako dobijaš ne mijenjaj“, dok su točke 2. i 4. „ako gubiš mijenjaj“.

Tu strategiju posebno vole golubovi, štakori, miševi i majmuni, a koristi se i za dresuru konja i drugih životinja. U zoologiji se ona izučava već 100 godina i Krebs je bio zaprepašten da je ta biološki sofisticirana strategija spontano evoluirala u krajnje idealiziranoj kompjuterskoj simulaciji.

Nowak je sada mogao analizirati „cikluse dobra i zla“ koji su se izmjenjivali na njegovom računalu i tako otkriti što WSLS čini uspješnim.

Sjetimo se da kraj jednoga ciklusa najavljuje pojava populacije bezuvjetnih surađivača (ranije sam ih zvao „dobricama“). Zahvaljujući slučajnim mutacijama u njihovom će se okruženju neumitno pojaviti „zlikovci“ koji će naivne „dobrice“ lako eksploatirati. „Zlikovci“ će se zato proširiti populacijom i konačno zatvoriti ciklus. Ponovni rast „dobra“, a s time i novi ciklus, počet će na stratištu sukoba „zlih“ sa „zlima“ (jer oni jedni druge uništavaju).

WSLS-ovi također lako eksploatiraju „dobrice“ ali su (osim toga) uspješniji u međusobnim susretima. To je tajna njihovog uspjeha i zato će oni produžiti cijeli ciklus, odgađajući novi početak.

Zanimljivo je da je WSLS izučavan u kontekstu zatvorenikove dileme i prije Sigmund-Nowakovih turnira. Slavni A. Rapaport (koji je sa TFT-om pobijedio u oba Axelrodova turnira) zvao ga je „priglupim“ („simpleton“). Nakon kraće analize odbacio je tu „priglupu“ strategiju kao neefikasnu. Na primjer, ona u susretu sa „zlikovcima“ (koji nikada ne surađuju) alternira između suradnje i nesuradnje, što stvarno izgleda priglupo.

Istu strategiju istraživali su D. i V. Krains, nazivajući je „Pavlovom“ (po slavnom ruskom psihologu, otkrivaču uvjetnoga refleksa), kao i ekonomisti E. Maskin i D. Fudenberg. Svi su oni zaključili da strategija ipak može biti efikasna, ali samo u određenim situacijama.

Zašto se onda ona (uz velikodušni TFT) pokazala najuspješnijom u Sigmund-Nowakovim ciklusima? Zbog kvalifikacije u točki 2. njenog prvog opisa (vidi gore). Naime, Sigmund-Nowakov WSLS nije čisti priglupi „Pavlov“ ili „simpleton“. On tek s određenom vjerojatnošću (dakle, nepredvidivo) surađuje nakon prethodne obostrane nesuradnje. To ga čini otpornijim na napade „zlikovaca“, pa zato i uspješnijim.

Mnogi ljudi i danas misle (nažalost i mnogi udžbenici to ponavljaju) da je priča iterirane zatvorenikove dileme priča o uspješnosti TFT-a. Međutim, rezultati Sigmunda i Nowaka (uglavnom objavljeni u časopisu Nature) jasno pokazuju da je to priča o uspješnosti velikodušnog TFT-a i WSLS-a.

Dapače između te dvije strategije WSLS se dodatno ističe svojom jednostavnošću. On se drži svojeg izbora dok god mu dobro ide, a kada mu krene loše mijenja ga. Zato treba pratiti samo svoje isplate i uopće ne treba brinuti o potezima oponenta. Takva strategija zahtjeva bitno manje kognitivne sposobnosti od TFT-a i velikodušnog TFT-a, koji moraju prepoznavati oponente i pamtiti njihove prijašnje postupke. Zato WSLS bolje modelira ponašanje mnogih organizama nego što to čine TFT-ovi.

Istraživanja Sigmunda i Nowaka pokazala su da je TFT katalizator za evoluciju suradnje, te da je WSLS njena krajnja destinacija u „ciklusima dobra i zla“.

Je li to krajnje rješenje problema suradnje u situacijama zatvorenikove dileme? Naravno da nije. No o tome u sljedećem nastavku.

Odgovori

Please log in using one of these methods to post your comment:

WordPress.com Logo

Ovaj komentar pišete koristeći vaš WordPress.com račun. Odjava / Izmijeni )

Twitter picture

Ovaj komentar pišete koristeći vaš Twitter račun. Odjava / Izmijeni )

Facebook slika

Ovaj komentar pišete koristeći vaš Facebook račun. Odjava / Izmijeni )

Google+ photo

Ovaj komentar pišete koristeći vaš Google+ račun. Odjava / Izmijeni )

Spajanje na %s