1 mai 2021 16:58

Iterated Prisoner’s Dilemma

Ce este dilema prizonierului iterat?

Dilema prizonierului iterat este o extensie a formei generale, cu excepția că jocul este jucat în mod repetat de aceiași participanți. Dilema unui prizonier iterat diferă de conceptul original al dilemei unui prizonier, deoarece participanții pot afla despre tendințele comportamentale ale omologului lor.

Dilema iterată a prizonierului a fost uneori numită jocul Peace-War.

Înțelegerea dilemei prizonierului iterat

Deoarece jocul se repetă, un individ poate formula o strategie care nu respectă convenția logică regulată a unei runde izolate. Tit for tat este o strategie obișnuită de dilemă a prizonierului.

Jocul dilema iterat al prizonierului este fundamental pentru multe teorii ale cooperării și încrederii umane. Pe baza presupunerii că jocul poate modela tranzacțiile între două persoane care necesită încredere, comportamentul de cooperare în populații poate fi modelat de o versiune iterată a mai multor jucători a jocului.

Teoria din spatele jocului a captivat mulți cercetători de-a lungul anilor. Mai recent, cercetătorii în proiectarea organizațională au folosit jocul pentru a modela strategii corporative. Dilema prizonierului este, de asemenea, obișnuită pentru ca teoriile jocurilor să devină populare printre strategii de investiții. Globalizarea și comerțul integrat au condus în continuare cererea de modele financiare și operaționale care pot descrie probleme geopolitice.

Exemplu al jocului Iterated Dilemma Prisoner’s Dilemma

De exemplu, tu și un coleg sunteți în închisoare și suspectați că ați comis o infracțiune. Sunteți izolați unul de celălalt și nu știți cum va răspunde celălalt la întrebări. Poliția vă invită pe amândoi să îl implicați pe celălalt în crimă (defect). Ce se întâmplă depinde de ceea ce faceți amândoi, dar niciunul dintre voi nu știe cum va răspunde celălalt.

Dacă colegul tău te trădează (cedează tentației de a te defecta) în timp ce rămâi tăcut, atunci primești cea mai lungă perioadă de închisoare în timp ce colegul tău scapă gratuit (și vice versa). Dacă alegeți amândoi să colaborați unul cu celălalt (nu cu poliția), rămânând tăcut, nu există dovezi suficiente pentru a vă condamna pe amândoi, astfel încât vi se oferă o sentință ușoară pentru o infracțiune mai mică. Dacă amândoi decideți să vă defectați, atunci v-ați condamnat reciproc la sentințe ușor reduse, dar totuși grele.

Profitul din acest joc este o reducere a condamnării la închisoare de foarte bun, destul de bun, destul de rău sau foarte rău, ceea ce se traduce într-un sistem de punctaj punct, după cum urmează:

Jocul este jucat iterativ pentru o serie de runde până când este încheiat (ca și cum ai fi interogat în mod repetat pentru infracțiuni separate). Scorurile din fiecare rundă sunt acumulate, astfel încât obiectivul este de a optimiza scorul de punct înainte de a ajunge la joc. Jocul terminat este determinat aleatoriu oriunde între 1 și 100 de runde. La sfârșitul jocului, scorurile se traduc în procente din cele mai bune scoruri posibile.