Kas yra kalinių dilema?

Pačiame žaidime bausmes (ir atlygį, kai tinka) atstovauja naudingumas skaičiai. Teigiami skaičiai žymi gerus rezultatus, neigiami skaičiai žymi blogus rezultatus, ir vienas rezultatas yra geresnis už kitą, jei su juo susijęs skaičius didesnis. (Tačiau būkite atsargūs, kaip tai veikia su neigiamais skaičiais, nes, pavyzdžiui, -5 yra didesnis nei -20!)

Aukščiau pateiktoje lentelėje pirmasis skaičius kiekvienoje dėžutėje nurodo 1 žaidėjo rezultatą, o antrasis skaičius rodo 2 žaidėjo rezultatą. Šie skaičiai rodo tik vieną iš daugelio skaičių rinkinių, kurie atitinka kalinių dilemos nustatymą.

Apibrėžus žaidimą, kitas žaidimo analizės žingsnis yra įvertinti žaidėjų strategijas ir bandyti suprasti, kaip žaidėjai greičiausiai elgsis. Analizuodami žaidimus ekonomistai daro keletą prielaidų - pirmiausia jie mano, kad abu žaidėjai tai žino išmokos tiek sau, tiek kitam žaidėjui, ir, antra, jie mano, kad abu žaidėjai nori į racionaliai maksimaliai padidinti jų pačių išmokas iš žaidimo.

Vienas paprastas pradinis požiūris yra ieškoti vadinamųjų

instagram viewer

dominuojančios strategijos- geriausios strategijos, nepriklausomai nuo to, kokią strategiją pasirenka kitas žaidėjas. Aukščiau pateiktame pavyzdyje pasirinkimas išpažinti yra dominuojanti abiejų žaidėjų strategija:

Atsižvelgiant į tai, kad išpažintis yra geriausia abiems žaidėjams, nenuostabu, kad rezultatas, kuriame abu žaidėjai prisipažįsta, yra pusiausvyros rezultatas. Vis dėlto svarbu šiek tiek tiksliau apibrėžti mūsų apibrėžimą.

A sąvoka Nash pusiausvyra buvo kodifikuotas matematikas ir žaidimų teoretikas Johnas Nashas. Paprasčiau tariant, Nash pusiausvyra yra geriausios reakcijos strategijų rinkinys. Dviejų žaidėjų žaidime Nasso pusiausvyra yra rezultatas, kai 2 žaidėjo strategija geriausiai reaguoja į 1 žaidėjo strategiją, o 1 žaidėjo strategija yra geriausia reakcija į 2 žaidėjo strategiją.

Rezultatų lentelėje gali būti parodyta Nash pusiausvyra pagal šį principą. Šiame pavyzdyje geriausi 2 žaidėjo atsakymai į pirmąjį žaidėją yra pažymėti žalia spalva. Jei 1 žaidėjas prisipažįsta, geriausias 2 žaidėjo atsakymas yra prisipažinti, nes -6 yra geresnis nei -10. Jei 1 žaidėjas nepripažįsta, geriausias 2 žaidėjo atsakymas yra prisipažinti, nes 0 yra geresnis nei -1. (Atminkite, kad šie samprotavimai yra labai panašūs į motyvus, naudojamus dominuojančioms strategijoms nustatyti.)

Geriausi 1 žaidėjo atsakymai pateikiami mėlyna spalva. Jei 2 žaidėjas prisipažįsta, geriausias 1 žaidėjo atsakymas yra prisipažinti, nes -6 yra geresnis nei -10. Jei 2 žaidėjas nepripažįsta, geriausias 1 žaidėjo atsakymas yra prisipažinti, nes 0 yra geresnis nei -1.

Nasso pusiausvyra yra rezultatas, kai yra ir žalias, ir mėlynas apskritimas, nes tai parodo geriausių atsakymo strategijų rinkinį abiems žaidėjams. Apskritai, įmanoma turėti daugialypę Nash pusiausvyrą arba jos iš viso nėra (bent jau grynosiose strategijose, kaip aprašyta čia).

Galbūt pastebėjote, kad šiame pavyzdyje Nasso pusiausvyra tam tikra prasme atrodo neoptimali (ypač tuo, kad jis nėra optimalus „Pareto“), nes abu žaidėjai gali gauti -1 o ne -6. Tai yra natūralus žaidime vykstančios sąveikos rezultatas - teoriškai nepripažinti būtų optimali strategija grupei kolektyviai, tačiau individualios paskatos užkerta kelią tokiam rezultatui pasiektas. Pvz., Jei 1 žaidėjas manė, kad 2 žaidėjas tylės, jis turėtų paskatinimą jį išstumti, o ne tylėti, ir atvirkščiai.

Dėl šios priežasties Nasso pusiausvyra taip pat gali būti laikoma rezultatu, kai nė vienas žaidėjas neturi paskatų vienašališkai (t. Y. Pats) nukrypti nuo strategijos, kuri paskatino tą rezultatą. Aukščiau pateiktame pavyzdyje, kai žaidėjai pasirenka išpažintį, nė vienas žaidėjas negali padaryti geriau, pakeisdamas savo mintis pats.