Teoria jocurilor: dincolo de elementele de bază - KamilTaylan.blog
1 mai 2021 14:21

Teoria jocurilor: dincolo de elementele de bază

Folosind teoria jocurilor, pot fi prezentate scenarii din lumea reală pentru situații precum concurența de stabilire a prețurilor și lansarea produselor (și multe altele), iar rezultatele lor pot fi prezise. Companiile care folosesc (și respectă) acest dispozitiv pentru a determina echilibrul Nash văd un beneficiu imens în strategiile lor de bugetare. (Vezi și:  Bazele teoriei jocurilor.)

Randul cui este?

În timp ce jocurile secvențiale sunt jucate pe rând, jocurile simultane sunt jucate, fiecare jucător ia decizia în același timp. Cu jocurile simultane, nu mai folosim metoda introductivă comună de inducere înapoi. Susținătorii teoriei jocurilor tabelează adesea diferitele rezultate în ceea ce se numește o matrice (mai jos).

Această matrice este denumită formă normală. Alegerile jucătorului sunt afișate pe axa verticală stângă, iar alegerile jucătorului doi sunt afișate pe axa orizontală superioară. Recompensele pentru fiecare jucător sunt în intersecțiile lor corespunzătoare și sunt afișate după cum urmează (jucătorul unu, jucătorul doi).

Echilibrul Nash

Nash Equilibrium este un rezultat atins, care, odată atins, înseamnă că niciun jucător nu poate crește recompensa schimbând deciziile unilateral. De asemenea, poate fi considerat „fără regrete”, în sensul că, odată luată o decizie, jucătorul nu va regreta în legătură cu deciziile luând în considerare consecințele.

Echilibrul Nash este atins în timp, în majoritatea cazurilor. Cu toate acestea, odată ce echilibrul Nash este atins, acesta nu va fi deviat de la. După ce vom învăța cum să găsim echilibrul Nash, aruncăm o privire asupra modului în care o mișcare unilaterală ar afecta situația. Are vreun sens? Nu ar trebui, și de aceea echilibrul Nash este descris ca „fără regrete”.

Găsirea echilibrului Nash

Primul pas: Determinați cel mai bun răspuns al jucătorului la acțiunile jucătorului doi. Atunci când examinăm opțiunile care pot maximiza plata unui jucător, trebuie să ne uităm la modul în care jucătorul ar trebui să răspundă la fiecare dintre opțiunile pe care le are jucătorul doi. O modalitate ușoară de a face acest lucru vizual este de a acoperi alegerile jucătorului doi. Luați în considerare matricea prezentată la începutul acestui articol pe măsură ce aplicăm această metodă.

Jucătorul unu are două opțiuni posibile de jucat: „sus” sau „jos”. Jucătorul doi are, de asemenea, două opțiuni de jucat: „stânga” sau „dreapta”. În acest pas al determinării echilibrului Nash, ne uităm la răspunsurile la acțiunile jucătorului doi. Dacă jucătorul doi alege să joace „la stânga”, putem juca „sus” cu recompensa de 1 sau putem juca „jos” cu recompensa de 3. Deoarece 3 este mai mare decât 1, vom îndrăzni 3 indicând opțiunea de a juca „aici jos.

Dacă jucătorul doi alege să joace „corect”, putem alege fie să jucăm „în sus” pentru o recompensă de 4, fie să redăm „în jos” pentru o repriză de 3. Deoarece 4 este mai mare decât 3, vom îndrăzni 4 pentru a indica opțiunea să joci „sus” aici. Rezultatele îndrăznețe sunt prezentate mai jos pe matricea completă.

Pasul doi: Determinați cel mai bun răspuns al jucătorului doi la acțiunile jucătorului. Așa cum am făcut înainte cu jucătorul două recompense pentru jucătorul unu, vom ascunde recompensele jucătorului unu atunci când stabilim cele mai bune răspunsuri pentru jucătorul doi. (A se vedea, de asemenea:  Indicatori principali ai finanțării comportamentale.)

La fel ca atunci când se uită la jucătorul unu, fiecare jucător are două opțiuni de jucat. Dacă jucătorul alege să joace „sus”, putem juca „stânga”, cu o recompensă de 3 sau „dreapta”, cu o recompensă de 2. Deoarece 3 este mai mare decât 2, îndrăznim 3 pentru a arăta opțiunea la joacă „stânga” aici. Dacă jucătorul alege să joace „în jos”, putem juca „la stânga”, pentru o recompensă de 2 sau „dreapta” pentru o recompensă de 1. Deoarece 2 este mai mare decât 1, vom îndrăzni 2 pentru a indica opțiunea de a juca „a plecat” aici. Rezultatele îndrăznețe sunt prezentate mai jos pe matricea completă.

Pasul trei: determinați ce rezultate au ambele beneficii îndrăznețe. Acest rezultat particular este echilibrul Nash. Acum, combinăm opțiunile îndrăznețe pentru ambii jucători pe matricea completă.

Căutați intersecții în care ambele plăți sunt îndrăznețe. În acest caz, găsim că intersecția dintre (Jos, Stânga) cu recompensa de (3, 2) se potrivește criteriilor noastre. Acest lucru indică echilibrul nostru Nash.

Această metodă de găsire a echilibrului Nash este bine potrivită pentru a găsi echilibre în jocuri care sunt simultane, deoarece ne uităm la modul în care un jucător ar răspunde independent de modul în care acționează celelalte. Acest scenariu al unui joc simultan este adesea jucat în companii precum companiile aeriene. Mai jos este un exemplu, asemănător cu jocul de mai sus, al modului în care ar putea evolua prețurile pentru companii aeriene. Plățile sunt în mii de dolari. Amintiți-vă, acestea sunt plățile, nu prețurile. Metoda pe care am aplicat-o anterior este deja aplicată pentru a arăta unde apare echilibrul Nash.

Privind doar alegerile A1, putem vedea că, dacă A2 alege să joace un preț scăzut, alegem între preț scăzut pentru 3.000 sau preț ridicat pentru 2.000. Alegem scăzut, de la 3.000 la 2.000. Facem același lucru pentru A2 jucând un preț ridicat și vedem că jucăm scăzut pentru că 4.000> 3.500. În schimb, uitându-ne doar la alegerile lui A2, putem vedea că, dacă A1 alege să joace un preț mic, alegem între „preț mic” pentru 3.000 și „preț mare” pentru 2.000. De la 3.000 la 2.000, alegem aici opțiunea cu preț redus. Dacă A1 joacă un preț ridicat, putem percepe un preț scăzut pentru 4.000 sau un preț ridicat pentru 3.500. Din moment ce 4.000> 3.500, alegem să jucăm aici un preț redus.

Nash Equilibrium este că ambele companii aeriene vor percepe un preț scăzut (afișat atunci când sunt evidențiate opțiunile pentru fiecare parte). Dacă ambele companii aeriene ar percepe un preț ridicat, fiecare ar fi mai bine decât se află la Nash Equilibrium.

Deci, de ce nu sunt de acord să facă acest lucru? În primul rând, este ilegal să colaborezi. În al doilea rând, dacă s-ar întâmpla acest lucru, o acțiune unilaterală în numele unei companii aeriene pentru a percepe un preț scăzut ar fi benefică, ceea ce ar duce la faptul că compania aeriană va câștiga mai mulți bani la rândul său. Această logică arată, de asemenea, modul în care se atinge echilibrul Nash și de ce nu este benefic să se abată de la el odată ce este atins. (Vezi și:  Finanțe comportamentale.)

Echilibre multiple Nash

În general, poate exista mai mult de un echilibru într-un joc. Cu toate acestea, acest lucru se întâmplă de obicei în jocuri cu elemente mai complexe decât două alegeri de către doi jucători. În jocurile simultane care se repetă în timp, unul dintre aceste echilibre multiple este atins după unele încercări și erori. Acest scenariu de alegeri diferite de-a lungul timpului înainte de a ajunge la echilibru este cel mai des jucat în lumea afacerilor atunci când două firme stabilesc prețuri pentru produse foarte interschimbabile, cum ar fi biletele de avion sau băuturile răcoritoare.

Linia de fund

Cu aceste metode avansate, mai multe situații din lumea reală pot fi modelate și rezolvate. Diferitele tipuri de Nash Equilibria pe care le-am discutat sunt cele mai des găsite soluții la jocurile modelate din lumea reală. O cunoaștere practică a teoriei jocurilor vă poate ajuta să vă formați o strategie, indiferent dacă jucați tic-tac-toe sau concurați pentru cele mai mari profituri.