Dilema deţinutului

Multe situaţii în viaţă,
dacă le-am rezolva numai cu logica,
am lucra tocmai aşa
cum ne-ar învăţa şi diavolul să lucrăm.
Lucian Blaga

Readuc în atenţia cititorului o dilemă remarcabilă din teoria jocurilor şi nu de atâta că s-a schimbat puterea la Chişinău 🙂 sau că a căzut guvernul Boc de la Bucureşti 😉 şi s-ar putea să fie actuală pentru unii foşti guvernanţi, care au avut slăbiciunea de a se complace cu corupţia 🙂  şi acum ar putea să-i aştepte dreapta  judecată/răsplată 😉 E vorba de o dilemă de o mare valoare şi pentru conştientizarea esenţei firii omului.

În 1950, la o lecţie ţinută în Universitatea Stanford, Albert Tucker a inventat această dilemă, care, conform unor opinii, a avut un impact ştiinţific enorm, comparabil cu cel produs de faimoasa monografie „The Theory of Games and Economic Behavior” de John von Neumann şi Oskar Morgenstern.

Tucker a expus următoarea situaţie. Doi hoţi: Bob şi Al, sunt prinşi aproape de locul infracţiunii. Poliţia nu are probe suficiente pentru a-i acuza de infracţiunea săvârşită, dar îi poate acuza de infracţiuni mai puţin grave, săvârşite anterior, şi le oferă o şansă de a se salva, separat fiecăruia. Fiecare din ei trebuie să decidă: mărturiseşte ori nu şi îl implică ori nu pe tovarăşul de infracţiune. Dacă ambii mărturisesc, sunt condamnaţi la un termen considerabil de detenţie – 10 ani, ţinându-se cont în acest caz de conlucrarea cu poliţia. Dacă ambii nu mărturisesc, anchetatorii demonstrează vina lor în infracţiunile anterioare şi sunt condamnaţi la câte doi ani de detenţie. Dacă unul depune mărturii, iar celălalt nu, cel care a colaborat cu poliţia este eliberat, iar partenerul lui este condamnat la termenul maxim – 20 de ani de detenţie. Deţinuţii sunt izolaţi şi nu cunosc condiţiile oferite celuilalt.

Strategiile jucătorilor sunt evidente: „da” ori „nu” (mărturisesc ori nu). „Câştigul” reprezintă termenul de detenţie, pe care fiecare dintre ei se străduieşte să şi-l micşoreze. Matricea câştigurilor pentru fiecare jucător este inserată în următorul tabel:

 

 

Al

 

 

da

nu

Bob

da

10,10

0,20

nu

20,0

2,2

Strategiile lui Bob corespund liniilor, iar ale lui Al – coloanelor. Elementele din celulele tabelului sunt ani de detenţie. Primul număr – termenul de detenţie pentru Bob, al doilea – pentru Al.

Să găsim soluţie a jocul ţinând cont de conţinutul lui real. Al poate raţiona astfel: “Bob are două alternative: să mărturisească sau să tacă. Fie Bob mărturiseşte. Atunci eu sau fac 20 de ani de puşcărie, dacă nu mărturisesc, sau 10 ani, dacă mărturisesc. În acest caz e mai bine să mărturisesc. Dacă Bob nu mărturiseşte, atunci eu fac doi ani dacă nu mărturisesc, sau sunt liber dacă mărturisesc. Aşadar, şi în acest caz e mai bine să mărturisesc. De aceea, voi mărturisi.” Bob, va raţiona în mod similar. Astfel, ambii depun mărturie şi fac câte 10 ani de detenţie.

Nota bene. Dacă presupunem că Al şi Bob acţionează „iraţional” (aleg ce e mai rău pentru fiecare în parte, adică nu mărturisesc), atunci vor sta în detenţie doar câte doi ani fiecare. Se dovedeşte că acţiunile jucătorilor bazate pe raţionamente individuale clare, despre ce e mai bine, conduc la un rezultat inferior altuia „iraţional”, care se dovedeşte a fi colectivist, deoarece în baza lui au de câştigat ambii jucători. Izolarea şi lipsa de contacte între jucători conduc la alegerea unei soluţii care n-ar fi oportună în cazul informaţiei complete şi a comunicării şi cooperării jucătorilor.

Strategia “da” e dominantă pentru orice strategie fixă a adversarului. Situaţia constituită din strategii dominante formează echilibrul în strategii dominante. Determinarea lui a presupus implicit următoarele condiţii de desfăşurare a jocului:

  • raţionalitatea jucătorilor (fiecare alege ce e mai bine pentru sine);
  • izolarea jucătorilor – jucătorii nu comunică între ei;
  • cunoaşterea strategiilor celuilalt jucător, dar nu neapaărat şi a funcţiei lui de câştig;
  • alegerea „concomitentă” a strategiilor optime – jucătorul îşi alege strategia sa fără să aştepte ca celălalt să şi-o aleagă pe a lui.

Dacă la condiţia de raţionalitate mai adăugăm una, că fiecare dintre jucători este pesimist şi aşteaptă ca celălalt să aleagă strategia cea mai nefavorabilă pentru primul, atunci, spre exemplu, Al va încerca să
-şi garanteze un termen minim de detenţie raţionând în felul următor: „Dacă aleg strategia „da”, Bob poate alege strategia „da”, cea mai rea pentru mine, şi voi face 10 ani de puşcărie; dacă aleg strategia „nu”, Bob va alege strategia „da” şi voi face 20 ani de puşcărie. Aşadar, e mai bine să aleg strategia „da”.” Ambii jucători raţionează în acelaşi fel. Se obţine aşa numita situaţie maximin, care coincide, în acest exemplu, cu echilibrul în strategii dominante.

Dacă ne abstractizăm de la conţinutul acestui joc şi interpretăm pur formal datele lui ca problemă bicriterială (reprezentăm elementele matricei în spaţiul criteriilor), atunci fiecare dintre punctele: (2,2), (20,0), (0,20), este eficient (optim în sens Pareto pentru problema de minimizare), iar situaţiile corespunzătoare lor sunt incomparabile. Doar situaţia („da”, „da”) cu “câştigurile” (10,10) nu este eficientă.

În concluzie, situaţia („nu”, „nu”) cu „câştigurile” (2,2) este eficientă (ca şi celelalte două situaţii) şi convenabilă ambilor jucători, dar nu este nici situaţie de echilibru în strategii dominante, nici situaţie maximin. Situaţia („da”, „da”) cu „câştigurile” (10, 10) este şi echilibru în strategii dominante, şi situaţie maximin, dar nu este eficientă.

Din cele expuse reiese cu elocvenţă că pentru jucători noţiunea de optim nu este univocă şi depinde direct de condiţiile de desfăşurare a jocului. În funcţie de condiţii, jucătorul îşi defineşte principiul de optimalitate. În cazul izolării şi lipsei de comunicare echilibrul („da”, „da”) se determină în baza strategiilor dominante sau a celor pesimiste. În cazul cooperării şi informaţiei complete situaţia („nu”,„nu”) cu „câştigurile” (2,2) este optimă pentru ambii jucători. Din ea survin şi strategiile optime.

Şi încă o caracteristică a jocului descris – el se schimbă dacă este repetat, adică dacă după eliberare Bob şi Al comit o altă infracţiune în comun, sunt prinşi şi li se oferă iarăşi şansele de rigoare. Informaţia despre rezultatele primului joc (primei „partide”) le dă posibilitatea jucătorilor să răsplătească sau să pedepsească partenerul. Intuitiv e clar că în jocul repetat jucătorii vor încerca să coopereze prin strategii de tipul – „cum tu, aşa şi eu”.

Jocul descris este sugestiv pentru diverse situaţii economice, cu strategii de tipul: “a contribui la bunul comun” sau “a acţiona în mod egoist”; “a stabili pe piaţă un preţ mare” sau “unul mic” etc.

Puteţi vizualiza o expunere reuşită a acestei dileme pe YouTube:

Nota bene. Într-un timp apropiat o să revin asupra dilemei cu o explicaţie interesantă din pesrpectiva noţiunilor de egoism şi altruism, raţionalitate şi morală. Dragă cititorulue, dacă subiectul ţi-a trezit interes, revină în timp pe blog.

Va urma…

Anunțuri

Lasă un răspuns

Completează mai jos detaliile tale sau dă clic pe un icon pentru a te autentifica:

Logo WordPress.com

Comentezi folosind contul tău WordPress.com. Dezautentificare / Schimbă )

Poză Twitter

Comentezi folosind contul tău Twitter. Dezautentificare / Schimbă )

Fotografie Facebook

Comentezi folosind contul tău Facebook. Dezautentificare / Schimbă )

Fotografie Google+

Comentezi folosind contul tău Google+. Dezautentificare / Schimbă )

Conectare la %s