Minimax - kas tas ir, definīcija un jēdziens 2021. gads

Satura rādītājs:

Anonim

Spēļu teorijā minimx ir metode, kuras mērķis ir samazināt sagaidāmos zaudējumus. Lai to izdarītu, spēlētājs pieņem, ka viņa pretinieka pieņemtais lēmums būs nelabvēlīgs. Tas ir, vissliktākais scenārijs gaidāms pirms pretinieka kustības.

Citiem vārdiem sakot, minimx metode sastāv no tā, kā pieņemt labāko lēmumu, pieņemot, ka otrs spēlētājs izvēlēsies jums vissliktāko scenāriju.

Mums jāņem vērā, ka šī metode ir piemērojama divu cilvēku (divu spēlētāju) spēlē un ka tā nav kooperatīva, bet gan nulles summas spēle. Tas nozīmē, ka to, ko uzvar viens spēlētājs, zaudē otrs un otrādi. Līdz ar to katrs aģents būs ieinteresēts maksimizēt savu lietderību, pat ja tas otram sāp.

Šajā brīdī mums arī jāatceras, ka spēļu teorija ir matemātikas un ekonomikas nozare, kas pēta izvēli, kas optimizē indivīda situāciju, kad izmaksas un ieguvumi nav iepriekš noteikti, bet ir atkarīgi no citu lēmumu.

Minimax algoritms lēmumu kokā

Mēs varam redzēt, kā minimx metode tiek izmantota lēmumu kokā ar vairākiem mezgliem. Spēle sākas apakšā un beidzas ar rezultātu augstākajā līmenī.

Koka pamatnē pretinieks izdara pirmo gājienu, tāpēc gaidāms vissliktākais rezultāts. Tad otrajā līmenī spēlētājs x ir atkarīgs no tā, kurš centīsies maksimāli palielināt savu peļņu, ņemot vērā pretinieka iepriekš pieņemto lēmumu.

Trešajā līmenī atkal ir pretinieku kārta un tā tālāk. Mēs parādīsim piemēru zemāk.

Minimax algoritma piemērs

Nākamajā lēmumu kokā mēs parādām rezultātus, kurus spēlētājs x ieguva katrā spēles brīdī. Bāzē, pirmajā līmenī, pretinieks pieņem lēmumu. Šī iemesla dēļ tiek doti scenāriji, kuros spēlētājs var zaudēt -10 vai uzvarēt 5.

Otrajā līmenī tas ir atkarīgs no spēlētāja x, tāpēc viņš maksimāli palielinās savu peļņu. Starp zaudējumiem 10 vai laimestiem 1 jūs uzvarēsiet 1. Tāpat arī uzvarot 5 vai 7, jūs uzvarēsiet 7.

Tad atkal ir pretinieka kārta, tāpēc tiks doti scenāriji, kurā spēlētājam x ir sliktākais rezultāts, -3 un 4, atkarībā no gadījuma. Visbeidzot, zaudējot 3 vai uzvarot 4, spēlētājs x pieņems lēmumu, kas ļaus pēdējam.

Mums jāņem vērā, ka katra mezgla vērtības būs atkarīgas no lietderības funkcijas.

Lai labāk saprastu koku, pieņemsim, ka pamatā lēmums ir par produkta izplatīšanu. Konkurents (pretinieks) var izplatīt ārpakalpojumus (skatīt koka kreiso pusi). Tādā gadījumā viņam jāizvēlas, piemēram, starp dīleri A un B. Tādējādi viņš izvēlas pirmo, liekot spēlētājam x zaudēt 10 (Ja viņš izvēlētos B, spēlētājs x uzvar 12).

Tomēr, iespējams, pretinieks dod priekšroku pats izplatīt preces, spējot īrēt motorizētus transportlīdzekļus vai iegādāties kravas automašīnu. No abiem scenārijiem izvēlieties pirmo, kas spēlētājam x ir mazāk glaimojošs, jo viņš uzvar 5, nevis 10.