1 mai 2021 8:14

Modul în care strategia teorie a jocurilor îmbunătățește luarea deciziilor

Teoria jocurilor, studiul luării deciziilor strategice, reunește discipline disparate precum matematica, psihologia și filosofia. Teoria jocurilor a fost inventată de John von Neumann și Oskar Morgenstern în 1944 și a parcurs un drum lung de atunci. Importanța teoriei jocurilor pentru analiza modernă și luarea deciziilor poate fi măsurată de faptul că, din 1970, până la 12 economiști și oameni de știință de vârf au primit Premiul Nobel pentru Științe Economice pentru contribuțiile lor la teoria jocurilor.

Teoria jocurilor este aplicată în mai multe domenii, inclusiv în afaceri, finanțe, economie, științe politice și psihologie. Înțelegerea strategiilor de teorie a jocurilor – atât cele populare, cât și unele dintre stratagemele relativ mai puțin cunoscute – este importantă pentru a spori abilitățile de raționament și de luare a deciziilor într-o lume complexă.

Chei de luat masa

  • Teoria jocurilor este un cadru pentru înțelegerea alegerii în situații în rândul jucătorilor concurenți.
  • Teoria jocurilor poate ajuta jucătorii să ia decizii optime atunci când se confruntă cu actori independenți și concurenți într-un cadru strategic.
  • O formă obișnuită de „joc” care apare în situații economice și de afaceri este dilema prizonierului, în care factorii de decizie individuali au întotdeauna un stimulent de a alege într-un mod care creează un rezultat mai puțin optim pentru indivizii ca grup.
  • Există mai multe alte forme de joc. Aplicarea practică a acestor jocuri poate fi un instrument valoros pentru a ajuta la analiza industriilor, sectoarelor, piețelor și a oricărei interacțiuni strategice între doi sau mai mulți actori.

Dilema prizonierului

Una dintre cele mai populare și de bază strategii de teorie a jocurilor este dilema prizonierului. Acest concept explorează strategia de luare a deciziilor luată de doi indivizi care, acționând în interesul lor individual, ajung să aibă rezultate mai slabe decât dacă ar fi cooperat între ei în primul rând.

În dilema prizonierului, doi suspecți reținuți pentru o infracțiune sunt deținuți în camere separate și nu pot comunica între ei. Procurorul îi informează atât pe Suspectul 1, cât și pe Suspectul 2, în mod individual, că dacă mărturisește și depune mărturie împotriva celuilalt, el poate fi liber, dar dacă nu cooperează și celălalt suspect, va fi condamnat la trei ani de închisoare. Dacă ambii mărturisesc, vor primi o pedeapsă de doi ani, iar dacă nici unul nu mărturisește, vor fi condamnați la un an de închisoare.

În timp ce cooperarea este cea mai bună strategie pentru cei doi suspecți, atunci când se confruntă cu o astfel de dilemă, cercetările arată că cei mai raționali preferă să mărturisească și să depună mărturie împotriva celeilalte persoane decât să rămână tăcute și să ia șansa pe care cealaltă parte o mărturisește.



Se presupune că jucătorii din cadrul jocului sunt raționali și se vor strădui să-și maximizeze recompensele în joc.

Dilema prizonierului pune bazele unor strategii avansate de teorie a jocurilor, dintre care cele populare includ:

Potrivirea banilor

Acesta este un joc cu sumă zero care implică doi jucători (numiți-i jucătorul A și jucătorul B) plasând simultan un bănuț pe masă, cu plata în funcție de potrivirea banilor. Dacă ambii bănuți sunt capete sau cozi, jucătorul A câștigă și păstrează banul jucătorului B. Dacă nu se potrivesc, jucătorul B câștigă și păstrează banii jucătorului A.

Impas

Acesta este un scenariu de dilemă socială, cum ar fi dilema prizonierului, în care doi jucători pot fie să coopereze, fie să defecte (adică să nu coopereze). Într-un blocaj, dacă jucătorul A și jucătorul B cooperează, fiecare primește o recompensă de 1, iar dacă ambii defectează, fiecare primește o recompensă de 2. Dar dacă jucătorul A cooperează și jucătorul B defectează, atunci A primește o recompensă de la 0 și B obține o recompensă de 3. În diagrama de recompensă de mai jos, prima cifră din celulele (a) până la (d) reprezintă recompensa jucătorului A, iar a doua cifră este cea a jucătorului B:

Impasul diferă de dilema prizonierului prin aceea că acțiunea cu cel mai mare beneficiu reciproc (adică ambele defecte) este, de asemenea, strategia dominantă. O strategie dominantă pentru un jucător este definită ca fiind cea care produce cea mai mare plată din orice strategie disponibilă, indiferent de strategiile folosite de ceilalți jucători.

Un exemplu frecvent citat de blocaj este cel al a două puteri nucleare care încearcă să ajungă la un acord pentru eliminarea arsenalelor lor de bombe nucleare. În acest caz, cooperarea implică aderarea la acord, în timp ce dezertarea înseamnă renunțarea în secret la acord și păstrarea arsenalului nuclear. Din păcate, cel mai bun rezultat pentru oricare dintre națiuni este să renunțe la acord și să păstreze opțiunea nucleară, în timp ce cealaltă națiune își elimină arsenalul, deoarece acest lucru îi va oferi primei un avantaj enorm ascuns față de cea din urmă, dacă va izbucni vreodată un război între cele două. A doua cea mai bună opțiune este ca ambele să defecteze sau să nu coopereze, deoarece acestea își păstrează statutul de puteri nucleare.

Concursul Cournot

Acest model este, de asemenea, similar din punct de vedere conceptual cu dilema prizonierului și poartă numele matematicianului francez Augustin Cournot, care l-a introdus în 1838. Cea mai comună aplicație a modelului Cournot constă în descrierea unui duopol sau a doi producători principali pe o piață.

De exemplu, să presupunem că companiile A și B produc un produs identic și pot produce cantități mari sau mici. Dacă ambii cooperează și acceptă să producă la niveluri scăzute, atunci oferta limitată se va traduce într-un preț ridicat pentru produsul de pe piață și profituri substanțiale pentru ambele companii. Pe de altă parte, dacă defectează și produc la niveluri ridicate, piața va fi inundată și va avea ca rezultat un preț scăzut pentru produs și, în consecință, profituri mai mici pentru ambele. Dar dacă unul cooperează (adică produce la niveluri scăzute) și celălalt defect (adică produce subrept la niveluri ridicate), atunci primul se rupe chiar în timp ce acesta din urmă câștigă un profit mai mare decât dacă amândoi cooperează. 

Este prezentată matricea de plată pentru companiile A și B (cifrele reprezintă profitul în milioane de dolari). Astfel, dacă A cooperează și produce la niveluri scăzute în timp ce B defectează și produce la niveluri ridicate, recompensa este așa cum se arată în celula (b) – rentabilitate pentru compania A și profituri de 7 milioane de dolari pentru compania B.

Joc de coordonare

În coordonare, jucătorii câștigă recompense mai mari atunci când selectează același curs de acțiune.

De exemplu, luați în considerare doi giganți tehnologici care decid între introducerea unei noi tehnologii radicale în cipurile de memorie care le-ar putea aduce profituri de sute de milioane sau o versiune revizuită a unei tehnologii mai vechi care le-ar câștiga mult mai puțin. Dacă o singură companie decide să continue cu noua tehnologie, rata de adoptare de către consumatori ar fi semnificativ mai mică și, prin urmare, ar câștiga mai puțin decât dacă ambele companii decid asupra aceluiași curs de acțiune. Matricea de plată este prezentată mai jos (cifrele reprezintă profitul în milioane de dolari).

Astfel, dacă ambele companii decid să introducă noua tehnologie, ar câștiga 600 milioane dolari bucata, în timp ce introducerea unei versiuni revizuite a tehnologiei mai vechi le-ar câștiga câte 300 milioane dolari fiecare, după cum se arată în celula (d). Dar dacă Compania A decide singură să introducă noua tehnologie, ar câștiga doar 150 de milioane de dolari, chiar dacă Compania B ar câștiga 0 dolari (probabil pentru că consumatorii ar putea să nu fie dispuși să plătească pentru tehnologia sa învechită acum). În acest caz, este logic ca ambele companii să lucreze împreună, mai degrabă decât pe cont propriu. 

Jocul Centipede 

Acesta este un joc de formă extinsă în care doi jucători au alternativ șansa de a lua cota mai mare dintr-o sumă de bani în creștere lentă. Jocul centipede este secvențial, deoarece jucătorii își fac mișcările una după alta, mai degrabă decât simultan; fiecare jucător cunoaște și strategiile alese de jucătorii care au jucat înaintea lor. Jocul se încheie de îndată ce un jucător primește pastrarea, jucătorul obținând porțiunea mai mare, iar celălalt jucător primind porțiunea mai mică.

De exemplu, să presupunem că Jucătorul A merge mai întâi și trebuie să decidă dacă ar trebui să „ia” sau să „treacă” stocul, care în prezent se ridică la 2 USD. Dacă ia, atunci A și B primesc 1 $ fiecare, dar dacă A trece, decizia de a lua sau de a trece acum trebuie luată de jucătorul B. Dacă B ia, ea primește 3 $ (adică stash-ul anterior de 2 $ + 1 $) și A primește 0 USD. Dar dacă B trece, A ajunge acum să decidă dacă să ia sau să treacă și așa mai departe. Dacă ambii jucători aleg întotdeauna să treacă, aceștia primesc fiecare o plată de 100 USD la sfârșitul jocului.

Scopul jocului este dacă A și B cooperează și continuă să treacă până la sfârșitul jocului, primesc plata maximă de 100 USD fiecare. Dar dacă nu se încred în celălalt jucător și se așteaptă ca aceștia să „ia” cu prima ocazie,  echilibrul Nash prezice că jucătorii vor primi cea mai mică pretenție posibilă (1 dolar în acest caz). Studiile experimentale au arătat, totuși, că acest comportament „rațional” (așa cum este prezis de teoria jocurilor) este rar prezentat în viața reală. Acest lucru nu este surprinzător intuitiv, având în vedere dimensiunea mică a plății inițiale în raport cu cea finală. Comportamentul similar al subiecților experimentali a fost, de asemenea, prezentat în dilema călătorului.

Dilema călătorului 

Acest joc fără sumă zero, în care ambii jucători încearcă să-și maximizeze propria plată fără a-l ține cont de celălalt, a fost conceput de economistul Kaushik Basu în 1994. De exemplu, în dilema călătorului, o companie aeriană este de acord să plătească doi călători despăgubiri pentru daune produselor identice. Cu toate acestea, celor doi călători li se cere separat să estimeze valoarea articolului, cu minimum 2 USD și maxim 100 USD. Dacă ambele notează aceeași valoare, compania aeriană va rambursa fiecăreia suma respectivă. Dar dacă valorile diferă, compania aeriană le va plăti valoarea mai mică, cu un bonus de 2 USD pentru călătorul care a notat această valoare mai mică și o penalizare de 2 USD pentru călătorul care a notat valoarea mai mare.

Nivelul de echilibru Nash, bazat pe inducerea înapoi, este de 2 USD în acest scenariu. Dar, la fel ca în jocul centipede, experimentele de laborator demonstrează în mod constant majoritatea participanților, naiv sau altfel, aleg un număr mult mai mare de 2 USD.

Dilema călătorului poate fi aplicată pentru a analiza o varietate de situații din viața reală. Procesul de inducere înapoi, de exemplu, poate ajuta la explicarea modului în care două companii angajate într-o concurență înfruntată pot crește constant prețurile produselor mai mici într-o ofertă de a câștiga cote de piață, ceea ce poate duce la pierderi din ce în ce mai mari în acest proces.

Bătălia Sexelor

Aceasta este o altă formă a jocului de coordonare descris mai devreme, dar cu unele asimetrii de plată. În esență, implică un cuplu care încearcă să își coordoneze seara. Deși au fost de acord să se întâlnească fie la jocul cu minge (preferința bărbatului), fie la o piesă (preferința femeii), au uitat ce au decis și, pentru a compune, problema, nu poate comunica între ei. Unde ar trebui să meargă? Matricea de plată este prezentată mai jos cu numerele din celule reprezentând gradul relativ de bucurie al evenimentului pentru femeie și, respectiv, pentru bărbat. De exemplu, celula (a) reprezintă recompensa (în ceea ce privește nivelurile de plăcere) pentru femeie și bărbat la piesă (ea se bucură mult mai mult decât el). Celula (d) este recompensa dacă ambii ajung la jocul cu mingea (el se bucură mai mult decât ea). Celula (c) reprezintă nemulțumirea dacă ambii merg nu numai la locația greșită, ci și la evenimentul de care se bucură cel mai puțin – femeia la jocul cu mingea și bărbatul la joc.

Joc Dictator 

Acesta este un joc simplu în care jucătorul A trebuie să decidă cum să împartă un premiu în bani cu jucătorul B, care nu are nicio contribuție la decizia jucătorului A. Deși aceasta nu este o strategie de teorie a jocurilor în sine, aceasta oferă câteva informații interesante despre comportamentul oamenilor. Experimentele arată că aproximativ 50% păstrează toți banii pentru ei înșiși, 5% îi împart în mod egal, iar ceilalți 45% acordă celuilalt participant o cotă mai mică. Jocul dictatorului este strâns legat de jocul de ultimatum, în care jucătorul A primește o sumă stabilită de bani, o parte din care trebuie să fie acordată jucătorului B, care poate accepta sau respinge suma dată. Prinderea este dacă al doilea jucător respinge suma oferită, atât A cât și B nu primesc nimic. Jocurile dictatorului și ultimatumului dețin lecții importante pentru chestiuni precum donarea de caritate și filantropia.

Războiul păcii 

Aceasta este o variantă a dilemei prizonierului în care deciziile de „cooperare sau defectare” sunt înlocuite cu „pace sau război”. O analogie ar putea fi două companii război al prețurilor ar reduce dramatic recompensele (celula d). Cu toate acestea, dacă A se angajează în reducerea prețurilor (adică „războiul”), dar B nu, A ar avea o plată mai mare de 4, deoarece ar putea capta cote de piață substanțiale, iar acest volum mai mare ar compensa prețurile mai mici ale produselor.

Dilema voluntarilor

În dilema unui voluntar, cineva trebuie să întreprindă o corvoadă sau o slujbă pentru binele comun. Cel mai rău rezultat posibil se realizează dacă nimeni nu este voluntar. De exemplu, luați în considerare o companie în care frauda contabilă este intensă, dar conducerea superioară nu o știe. Unii angajați juniori din departamentul de contabilitate sunt conștienți de fraudă, dar ezită să spună conducerii superioare, deoarece ar duce la concedierea angajaților implicați în fraudă și, cel mai probabil, urmărirea penală.

A fi etichetat ca denunțător  poate avea, de asemenea, unele repercusiuni pe linie. Dar dacă nimeni nu este voluntar, frauda la scară largă poate duce la eventualul faliment al companiei și la pierderea locurilor de muncă ale tuturor.

întrebări frecvente

Care sunt „jocurile” jucate în teoria jocurilor?

Se numește teoria jocurilor, deoarece teoria încearcă să înțeleagă acțiunile strategice a doi sau mai mulți „jucători” într-o situație dată care conține reguli stabilite și rezultate. Deși este utilizată într-o serie de discipline, teoria jocurilor este folosită în special ca instrument în studiul afacerilor și economiei. „Jocurile” pot implica astfel modul în care două firme concurente vor reacționa la reducerea prețurilor de către cealaltă, dacă o firmă ar trebui să achiziționeze o alta sau cum comercianții de pe o piață de valori pot reacționa la schimbările de preț. În termeni teoretici, aceste  jocuri pot fi clasificate  ca fiind similare cu dilemele prizonierului, jocul dictatorului, șoimul și porumbelul și bătălia sexelor, printre alte câteva variante.

Ce ne învață dilema prizonierului?

Dilema prizonierului arată că simpla cooperare nu este întotdeauna în interesul cuiva. De fapt, atunci când cumpără un articol cu ​​bilete mari, cum ar fi o mașină, negocierea este cursul preferat de acțiune din punctul de vedere al consumatorilor. În caz contrar, reprezentanța auto poate adopta o politică de inflexibilitate în negocierile de prețuri, maximizând profiturile sale, dar rezultând plățile excesive ale consumatorilor pentru vehiculele lor. Înțelegerea beneficiilor relative ale cooperării versus defecțiunii vă poate stimula să vă angajați în negocieri semnificative de  preț  înainte de a face o achiziție mare.

Ce este un echilibru Nash în teoria jocurilor?

Echilibrul Nash în teoria jocurilor este o situație în care un jucător va continua cu strategia aleasă, neavând niciun stimulent pentru a se abate de la aceasta, după ce a luat în considerare strategia adversarului.

Cum pot întreprinderile să folosească teoria jocurilor întrucât concurează între ele?

Concurența Cournot, de exemplu, este un model economic care descrie o structură industrială în care companiile rivale care oferă un produs identic concurează pe cantitatea de producție pe care o produc, independent și în același timp. Este efectiv jocul dilemei unui prizonier.

Linia de fund

Teoria jocurilor poate fi utilizată foarte eficient ca instrument pentru luarea deciziilor, fie într-un context adversar, de afaceri sau personal.