Kaip laimėti „Rock-Paper-Scissors“.

Jei kada nors žaidėte „Rock-Paper-Scissors“, susimąstėte, kokia strategija greičiausiai įveiks jūsų priešininką. Ir tu ne vienas. Žaidimų teoretikai ilgai glumino šį ir kitus panašius žaidimus, tikėdamiesi rasti geriausią būdą.





Pasirodo, geriausia strategija yra atsitiktinai pasirinkti ginklą. Ilgainiui yra vienodai tikėtina, kad laimėsite, lygiuosite arba pralaimėsite. Tai žinoma kaip mišri strategija Nash pusiausvyra, kai kiekvienas žaidėjas pasirenka tris veiksmus su vienoda tikimybe kiekviename raunde.

Ir taip dažniausiai žaidžiamas žaidimas. Įvairūs nedidelio masto eksperimentai, kuriuose užfiksuota, kaip tikri žmonės žaidžia „Rock-Paper-Scissors“, rodo, kad tai iš tiesų yra strategija, kuri galiausiai išsivysto.

Arba taip manė žaidimų teoretikai. Šiandien Zhijian Wang iš Zhejiang universiteto Kinijoje ir pora draugų sako, kad „Rock-Paper-Scissors“ yra daugiau, nei kas nors įsivaizdavo. Jų darbas rodo, kad tikrų žaidėjų strategija vidutiniškai atrodo atsitiktinė, bet iš tikrųjų susideda iš nuspėjamų modelių, kuriuos apsukrus varžovas galėtų išnaudoti, kad įgytų gyvybiškai svarbų pranašumą.



Zhijian ir bendradarbiai atliko savo eksperimentus su 360 studentų, įdarbintų iš Džedziango universiteto ir suskirstytų į 60 grupių po šešis žaidėjus. Kiekvienoje grupėje žaidėjai žaidė 300 „Rock-Popier-Scissors“ raundų vienas prieš kitą, kruopščiai fiksuodami savo veiksmus.

Kaip paskatinimas, nugalėtojams buvo mokama vietine valiuta proporcingai jų pergalių skaičiui. Siekdami patikrinti, kaip ši paskata paveikė strategiją, Zhijian ir bendradarbiai pakeitė išmokas skirtingoms grupėms. Jei pralaimėjimas nieko vertas, o lygiosios – 1, laimėjimo išmoka svyravo nuo 1,1 iki 100.

Rezultatai atskleidžia stebinantį elgesio modelį. Vidutiniškai visų grupių žaidėjai kiekvieną veiksmą pasirinko maždaug trečdalį laiko, o tai yra lygiai taip, kaip tikėtasi, jei jų pasirinkimas būtų atsitiktinis.



Tačiau atidžiau pažvelgus į jų elgesį, paaiškėja dar kai kas. Zhijian ir bendražygiai teigia, kad žaidėjai, kurie laimi, linkę laikytis to paties veiksmo, o tie, kurie pralaimi, pereina prie kito veiksmo pagal laikrodžio rodyklę (kur R → P → S yra pagal laikrodžio rodyklę).

Tai žaidimų teorijoje žinoma kaip sąlyginis atsakas ir niekada anksčiau nebuvo pastebėtas eksperimentuose su akmenimis-popieriumi-žirklėmis. Zhijian ir bendradarbiai spėja, kad taip yra tikriausiai todėl, kad visi ankstesni eksperimentai buvo atlikti daug mažesniu mastu.

Šis žaidimas demonstruoja kolektyvinius ciklinius judesius, kurių negali suprasti Nash Equilibrium koncepcija, tačiau jie sėkmingai paaiškinami empiriniu duomenų įkvėptu sąlyginio atsako mechanizmu, sako Zhijian ir kt.



Tiesą sakant, strategija „laimėk pasilikti“, „pralaimėk“ yra visiškai tikėtina psichologiniu požiūriu: žmonės linkę laikytis laiminčios strategijos.

Zhijian ir bendradarbiai tikisi išsamiau ištirti šį psichologinį aspektą būsimuose tyrimuose. Įdomus klausimas, kaip toks atsakas yra integruotas į smegenis. Ar sąlyginis atsakas yra pagrindinis žmogaus smegenų sprendimų priėmimo mechanizmas, ar tik fundamentalesnių nervinių mechanizmų pasekmė, yra sudėtingas būsimų tyrimų klausimas, sako jie.

Šis atradimas turi ir praktinių pasekmių. Jei žmonės žaisdami „Rock-Paper-Scissors“ neišvengiamai naudoja nuspėjamą strategiją, tai yra silpnybė, kurią galima išnaudoti. Mūsų teoriniai skaičiavimai atskleidžia, kad ši nauja strategija gali pasiūlyti didesnį pelną atskiriems žaidėjams, palyginti su NE mišria strategija, sako jie.



Tai gali būti verta turėti omenyje, kai kitą kartą priimsite visus lankytojus prie vietinės girdyklos.

Nuoroda: http://arxiv.org/abs/1404.5199 : socialinis važiavimas dviračiu ir sąlyginiai atsakai žaidime „Rokas-popierius-žirklės“.

paslėpti