Strategija milo za drago, ili kraće TFT (tit for tat), uspješna je dok god je primjenjuju nepogrešiva računala (usp. „Reciprocitet i iterirana zatvorenikova dilema“). Međutim, ljudi kao ni ostale životinje nisu nepogrešivi. Katkada su smušeni, katkada ometeni, katkada loše raspoloženi ili naprosto imaju loš dan.

Možda sam želio surađivati, ali mi se omaklo pa nisam. Možda sam uvjeren da moj oponent nije surađivao u prošloj rundi, iako je zapravo surađivao (možda sam ga pobrkao s nekim drugim). Ovaj mi je tip toliko antipatičan da s njim neću surađivati što god on činio. Ljudske interakcije uvijek imaju mnogo šuma.

Na važnu ulogu šuma prvi je upozorio R. May, krajem 80-tih godina (inače fizičar, poznat po matematičkom utemeljenju moderne ekologije). Smatrao je da evolucijski biolozi trebaju temeljito izučiti kako greške utječu na iteriranu zatvorenikovu dilemu, jer mu je bilo potpuno jasno da zaključci koji se pozivaju na nepogrešivo provođene strategije (kakve su bile one u Axelrodovim turnirima) nisu realni.

Čak i rijetke greške mogu imati fatalne posljedice. Kada se susretnu dvije TFT strategije, samo će jedna greška igrače uvesti u neprekinuti niz nesuradnji. Očiti način da se prekine ovaj niz krvne osvete jest da igrači napuste rigidni TFT i prihvate neki oblik praštanja. No, kako će i zašto do toga doći?

Mayov izazov prihvatili su austrijski matematičari K. Sigmund i M. Nowak (danas voditelj programa Evolucijske dinamike na Harvardu). Uz do tada uobičajene determinističke strategije uveli su i probabilističke. Ako bi oponent surađivao strategija bi surađivala s određenom vjerojatnošću, ako on ne bi surađivao strategija bi surađivala s nekom drugom vjerojatnošću. Dakle, praštanja su mogla biti manje ili više vjerojatna.

Početnu (slučajnu) smjesu determinističkih i probabilističkih strategija uključili su u turnir u kojem je svatko igrao sa svakim. No, njihovi turniri razlikovali su se od Axelrodovih i po tome što su se strategije razmnožavale ovisno o njihovoj uspješnosti. Najuspješnije su dobivale mnogo replika, a najmanje uspješne su „izumirale“. Osim toga, replike nisu uvijek bile točne. Sadržavale su greške (mutacije) koje su bile izvor novih strategija. Tako su se rađale tisuće i tisuće novih generacija, a Sigmund i Nowak su se nadali da će se s vremenom pojaviti konačni pobjednik. Da će se pojaviti strategija koja će istisnuti sve ostale, koja će prirodnom selekcijom postati jedinom ili bar dominantnom strategijom u populaciji.

Iako se evolucijska trajektorija nikada nije doslovno ponovila, neke su pravilnosti bile očite. Turnir je uvijek počinjao kaotičnom smjesom strategija, koju su Sigmund i Nowak slučajno generirali. U toj početnoj zbrci uvijek se najuspješnije razmnožavala strategija „nikada ne surađuj“ (NNS). Loši momci imali su dobar start. Nakon otprilike sto generacija NNS je postala najraširenijom (dominantnom) strategijom.

Strategija TFT se u trenutku kulminacije NNS-ova  uvijek nalazila na granici istrebljenja. No, izrabljivači su se toliko proširili da su ostali bez potencijalnih žrtava i tu počinje njihov pad. (Sjetimo se da NNS u susretu s NNS-om dolazi do malo bodova, za razliku od TFT-a u susretu s TFT-om. Naravno, susreti NNS-a s TFT-om također donose malo bodova.)

Čak i mali dio populacije, koji čine jedva preživjeli TFT-ovi, počinje se uspješno množiti zahvaljujući međusobnim susretima. S druge strane, zli momci u nedostatku naivnih strategija tipa „uvijek surađuj“ polako odumiru. Uskoro populacijom dominiraju TFT strategije.

No, ni njihova dominacija nije stabilna. I najbezazlenija greška (mutacija) čini ih neefikasnima (jer „pregrubo reagiraju na uvrede“), pa oni polako prepuštaju vodstvo svojoj velikodušnijoj varijanti GTFT (generous tit for tat). Ta strategija na suradnju odgovara suradnjom, a na nesuradnju s vjerojatnošću 2/3 odgovara nesuradnjom (prirodna selekcija dovodi do te ili neke druge vjerojatnosti ovisno o korištenoj tablici isplata u zatvorenikovoj dilemi; za konkretnu tablicu koju smo naveli u „Reciprocitet i iterirana zatvorenikova dilema“ vjerojatnost će biti 2/3).

Strategija GTFT dominantna je dulje od svih prethodnika, ali ni ona nije vječna zahvaljujući slučajnim mutacijama. Polako i gotovo neprimjetno velikodušni GTFT mutira prema još velikodušnijim rođacima. Konačno, populacija postaje univerzalno „dobra“ – svi surađuju. Razlog je jednostavan. Kada svi pokušavaju biti dobri, praštanje je sve učestalije. Sve brže i brže se odlučujete na praštanje, jer najveća nagrada dolazi s velikim brojem suradnji.

Naravno, okruženje „dobrica“ koje stalno surađuju plodno je tlo za ponovni uspon „zlih“ NNS-ova (koji nikada ne surađuju), bilo onih zaostalih iz prošlosti ili novih mutanata. Time je ciklus zatvoren i sve opet počinje iz početka.

U svim se turnirima pojavljuje taj isti ciklus. Početna dominacija zlih NNS-ova, zatim rast i dominacija dobrih ali osvetoljubivih TFT-ova, koje zamjenjuju dobri i sve manje osvetoljubivi GTFT-ovi, koji polako prelaze u prave „dobrice“ koje uvijek surađuju. One su plodno tlo za novi uspon NNS-ova pa ciklus kreće iznova.

Dobra je vijest da turnirima i vremenski i ukupnim brojem dominiraju dobre strategije. Najdulje traje i najbrojniji je GTFT. Loša je vijest da kratke vladavine zlih NNS-ova u stvarnom svijetu, koji pokušavaju modelirati ovi turniri, možda traju desetljećima ili stoljećima. Anegdotalih indicija za to ima dosta (svatko će se lako sjetiti svojeg preferiranog perioda „zla i tame“).

No, još jednom upozoravamo da se radi o modelu koji je daleko od stvarnosti. On dokazuje da je nešto moguće ali ne i da je aktualno ili da je bilo aktualno.

3 responses »

  1. Veky (@veky) kaže:

    Mislim da je malo čudno napisana rečenica “Kada se susretnu dvije TFT strategije, samo će jedna greška igrače uvesti u neprekinuti niz nesuradnji.”… stječe se dojam kao da očekujemo da postoje neka bića koja mogu jednom misteriozno pogriješiti a nakon toga nastaviti nepogrešivo slijediti strategiju. Naravno, kako se dogodila jedna greška, dogodit će se i druga. Pogotovo ako su ljudi u pitanju.🙂

    • zsikic kaže:

      da, to su bića koja su se jednokratno i neuobičajeno napila, drogirala ili im je trenutno i jednokratno pao mrak na oči iz bilo kojeg drugog razloga, pa su jednokratno i netipično iskočila iz svog uobičajenog ponašanja ili im se naprosto nešto slučajno desilo, neki neobični splet okolnosti …
      to je ono što svaki sud prihvaća kao olakotnu okolnost🙂

      • Veky (@veky) kaže:

        Ne bih ja to njima uzeo za zlo, BožeSačuvaj (štoviše, puno bi mi bili simpatičniji nakon toga:)… samo kažem da ako se dogodilo jednom, dogodit će se i drugi put. Jer činjenica da se dogodilo jednom znači da smo izašli iz idealiziranog svijeta u kojem “nikad” doista znači nikad. :-]

Odgovori

Please log in using one of these methods to post your comment:

WordPress.com Logo

Ovaj komentar pišete koristeći vaš WordPress.com račun. Odjava / Izmijeni )

Twitter picture

Ovaj komentar pišete koristeći vaš Twitter račun. Odjava / Izmijeni )

Facebook slika

Ovaj komentar pišete koristeći vaš Facebook račun. Odjava / Izmijeni )

Google+ photo

Ovaj komentar pišete koristeći vaš Google+ račun. Odjava / Izmijeni )

Spajanje na %s