Glavni » posel » Vzvratna indukcija

Vzvratna indukcija

posel : Vzvratna indukcija
Kaj je nazaj indukcija?

Indukcija za nazaj v teoriji iger je iterativni postopek sklepanja nazaj v času, od konca težave ali situacije, za reševanje končno obsežne oblike in zaporednih iger ter sklepa na zaporedje optimalnih dejanj.

Pojasnjena povratna indukcija

Povratna indukcija se uporablja za reševanje iger, odkar sta John von Neumann in Oskar Morgenstern ustanovila teorijo iger kot akademski predmet, ko sta leta 1944 izdala svojo knjigo Teorija iger in ekonomsko vedenje .

Na vsaki stopnji igre indukcija nazaj določa optimalno strategijo igralca, ki naredi zadnji korak v igri. Nato se določi optimalno delovanje premikajočega se igralca od naslednjega do zadnjega, pri čemer se akcija zadnjega igralca sprejme kot dano. Ta proces se nadaljuje nazaj, dokler ni določen najboljši ukrep za vsako časovno obdobje. Učinkovito je določanje Nash-ovega ravnovesja vsake podgame izvirne igre.

Vendar pa rezultati, ki izhajajo iz vzvratne indukcije, pogosto ne napovedujejo dejanske človeške igre. Eksperimentalne študije so pokazale, da je »racionalno« vedenje (kot ga predvideva teorija iger) v resničnem življenju le redko prikazano. Neracionalni igralci lahko dejansko dobijo višje izplačila, kot je napovedano z vzvratno indukcijo, kot je prikazano v igri centipede.

V igri s stotinami dva igralca izmenično dobita priložnost, da prevzameta večji delež naraščajočega lonca denarja ali data pot drugemu igralcu. Izplačila so razporejena tako, da če se pot poda nasprotniku in nasprotnik vzame pot v naslednjem krogu, prejme nekoliko manj, kot če bi ga v tem krogu vzel. Igra se zaključi takoj, ko igralec prevzame zalog, pri čemer igralec dobi večji delež, drugi igralec pa manjši.

Primer indukcije nazaj

Kot primer, predpostavimo, da je igralec A na prvem mestu in se mora odločiti, ali bo "vzel" ali "prenesel" zalog, ki trenutno znaša 2 USD. Če vzame, potem A in B dobita vsak po 1 dolar, če pa A preide, mora igralec B. sprejeti odločitev, da bo sprejel ali podal, če bo B prevzel, dobi 3 $ (tj. Prejšnji znesek v višini 2 $ + 1 $) in A dobi 0 USD. Če pa B preide, se A zdaj odloči, ali bo šel ali mimo in tako naprej. Če se oba igralca vedno odločita za prehod, vsak ob koncu igre prejme izplačilo v višini 100 USD.

Poanta igre je, če A in B sodelujeta in nadaljujeta do konca igre, vsak dobita največji znesek v višini 100 USD. Če pa zaupajo drugemu igralcu in pričakujejo, da jih bo ob prvi priložnosti "prevzel", Nash ravnovesje napoveduje, da bodo igralci vzeli najnižjo možno škodo (v tem primeru 1 dolar).

Ravnotežje Nash-a v tej igri, kjer noben igralec po premisleku o nasprotnikovi izbiri nima nobene spodbude, da odstopi od svoje izbrane strategije, nakazuje, da bi prvi igralec vzel pot v prvem krogu igre. Vendar v resnici to stori razmeroma malo igralcev. Posledično dobijo večji izplačilo od tistega, ki ga napoveduje analiza ravnotežja.

Reševanje zaporednih iger z uporabo nazaj indukcije

Spodaj je preprosta zaporedna igra med dvema igralcema. Oznake z igralcem 1 in predvajalnikom 2 v njih so nabor informacij za igralce oz. Številke v oklepajih na dnu drevesa so izplačila na vsaki točki. Igra je tudi zaporedna, tako da igralec 1 sprejme prvo odločitev (levo ali desno), igralec 2 pa svojo odločitev po igralcu 1 (gor ali dol).

Slika 1

Vzvratna indukcija, tako kot vsa teorija iger, uporablja predpostavke racionalnosti in maksimiranja, kar pomeni, da bo Player 2 v vsaki dani situaciji maksimiral svoj izplačilo. Na obeh informacijah imamo na voljo dve možnosti, štiri. Z odpravo možnosti, ki jih Player 2 ne bo izbral, lahko drevo zožimo. Na ta način bomo v podanem naboru informacij krepili črte, ki igralcu maksimirajo plačilo.

Slika 2

Po tem znižanju lahko Player 1 poveča svoje izplačila zdaj, ko so odločitve o igralcu 2 objavljene. Rezultat je ravnotežje, ki ga najdemo z vzvratno indukcijo igralca 1, ki izbere "pravilno" in igralca 2, ki izbere "gor". Spodaj je rešitev igre s krepko ravnotežno potjo.

Slika 3

Na primer, lahko bi preprosto postavili igro, podobno zgornji, če bi podjetja uporabila kot igralce. Ta igra lahko vključuje scenarije izdaje izdelkov. Če bi podjetje 1 želelo izdati izdelek, kaj bi lahko podjetje 2 odreagiralo pri napovedovanju prodaje tega novega izdelka v različnih scenarijih, lahko postavimo igro, da napove, kako se lahko dogodki odvijejo. Spodaj je primer, kako lahko nekdo modelira takšna igra.

Slika 4

Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.

Sorodni pogoji

Opredelitev iger Centipede Igra v igri s štirinožci v teoriji iger vključuje dva igralca, ki izmenično dobivata priložnost, da prevzameta večji delež vse večjih zalog denarja. več Kako deluje teorija iger Teorija iger je okvir za modeliranje scenarijev, v katerih obstaja navzkrižje interesov med igralci. več Zero-Sum Game Situacija, v kateri je dobiček ene osebe enakovreden izgubi drugega, tako da je neto sprememba bogastva ali koristi enaka nič. Igra z ničelno vsoto ima lahko samo dva igralca ali milijone udeležencev. več Nash Equilibrium Nash Equilibrium je koncept znotraj teorije iger, kjer je optimalen rezultat igre tam, kjer ni spodbude za odstopanje od njihove prvotne strategije. več Potovalčeva dilema Opredelitev Popotnikova dilema kaže paradoks racionalnosti - da sprejemanje odločitev nelogično pogosto prinaša boljše izplačilo v teoriji iger. več Opredelitev Pennies Definition Ujemanje denarja je osnovni primer teorije iger, ki prikazuje, kako si racionalni odločevalci prizadevajo za čim večje izplačilo. več partnerskih povezav
Priporočena
Pustite Komentar