Principal » Afaceri » Inducție înapoi

Inducție înapoi

Afaceri : Inducție înapoi
Ce este inducerea înapoi?

Inducerea înapoi în teoria jocurilor este un proces iterativ de raționare înapoi în timp, de la sfârșitul unei probleme sau situații, pentru a rezolva o formă extinsă finită și jocuri secvențiale și deduce o secvență de acțiuni optime.

Inducerea înapoi explicată

Inducția înapoi a fost folosită pentru a rezolva jocurile de când John von Neumann și Oskar Morgenstern au stabilit teoria jocurilor ca subiect academic atunci când au publicat cartea lor, Theory of Games and Economic Behavior in 1944.

În fiecare etapă a jocului, inducția înapoi determină strategia optimă a jucătorului care face ultima mișcare din joc. Apoi, acțiunea optimă a jucătorului care se deplasează în următoarea este determinată, luând acțiunea ultimului jucător așa cum a fost dată. Acest proces continuă înapoi până când a fost determinată cea mai bună acțiune pentru fiecare punct în timp. În mod efectiv, se determină echilibrul Nash al fiecărui sub-joc al jocului inițial.

Cu toate acestea, rezultatele deduse din inducția înapoi nu reușesc adesea să prezică jocul uman real. Studiile experimentale au arătat că comportamentul „rațional” (așa cum a fost prevăzut de teoria jocurilor) este foarte rar prezentat în viața reală. Jucătorii iraționali pot ajunge în realitate să obțină rambursări mai mari decât a fost prevăzut de inducția înapoi, așa cum este ilustrat în jocul centipede.

În jocul de centipede, doi jucători au alternativă șansa de a lua o parte mai mare dintr-un pot de bani în creștere sau de a trece potul către celălalt jucător. Remunerațiile sunt aranjate astfel încât dacă potul este trecut adversarului și oponentul ia potul în runda următoare, unul primește ceva mai puțin decât dacă unul ar fi luat potul în această rundă. Jocul se încheie de îndată ce un jucător ia pasul, jucătorul obținând porțiunea mai mare, iar celălalt jucător obține porțiunea mai mică.

Exemplu de inducție înapoi

Ca exemplu, presupunem că jucătorul A merge mai întâi și trebuie să decidă dacă ar trebui să „ia” sau „să treacă” stash-ul, care în prezent se ridică la 2 $. Dacă ia, atunci A și B obțin 1 dolar fiecare, dar dacă A trece, decizia de a lua sau de a trece acum trebuie să fie luată de jucătorul B. Dacă B ia, ea primește 3 $ (adică, stashul anterior de 2 $ + 1 $) iar A primește 0 $. Dar dacă trece B, A ajunge acum să decidă dacă să ia sau să treacă și așa mai departe. Dacă ambii jucători aleg întotdeauna să treacă, fiecare primește o rambursare de 100 USD la sfârșitul jocului.

Ideea jocului este dacă A și B cooperează și continuă să treacă până la sfârșitul jocului, primesc suma maximă de 100 USD fiecare. Dar dacă aceștia au încredere în celălalt jucător și se așteaptă ca aceștia să „ia” la prima oportunitate, echilibrul Nash prevede că jucătorii vor primi cea mai mică cerere posibilă (1 dolar în acest caz).

Echilibrul Nash al acestui joc, în care niciun jucător nu are un stimulent să se abată de la strategia aleasă după luarea în considerare a alegerii unui adversar, sugerează că primul jucător ar lua potul chiar din prima rundă a jocului. Cu toate acestea, în realitate, relativ puțini jucători fac acest lucru. Ca urmare, obțin un profit mai mare decât profitul prevăzut de analiza echilibrului.

Rezolvarea jocurilor secvențiale cu ajutorul inducției înapoi

Mai jos este un simplu joc secvențial între doi jucători. Etichetele cu Player 1 și Player 2 în ele sunt seturile de informații pentru jucătorii unu sau două, respectiv. Numerele din paranteze din partea inferioară a arborelui sunt rambursările la fiecare punct respectiv. Jocul este de asemenea secvențial, astfel încât jucătorul 1 ia prima decizie (stânga sau dreapta), iar jucătorul 2 ia decizia după jucătorul 1 (în sus sau în jos).

figura 1

Inducția înapoi, ca toată teoria jocurilor, utilizează ipotezele raționalității și maximizării, ceea ce înseamnă că jucătorul 2 își va maximiza profitul în orice situație dată. La oricare dintre seturile de informații avem două opțiuni, patru în total. Eliminând opțiunile pe care jucătorul 2 nu le va alege, ne putem restrânge arborele. În acest fel, vom îndrăzni liniile care maximizează rambursarea jucătorului la setul de informații date.

Figura 2

După această reducere, jucătorul 1 își poate maximiza profiturile acum când sunt făcute cunoscute alegerile jucătorului 2. Rezultatul este un echilibru găsit prin inducerea înapoi a jucătorului 1 alegând „corect” și jucătorul 2 alegând „sus”. Mai jos este soluția la joc cu calea de echilibru îndrăzneață.

Figura 3

De exemplu, s-ar putea configura cu ușurință un joc similar cu cel de mai sus, folosind companii ca jucători. Acest joc ar putea include scenarii de lansare a produsului. Dacă Compania 1 dorește să lanseze un produs, ce ar putea face Compania 2 ca răspuns "> prognozarea vânzărilor acestui nou produs în diferite scenarii, putem configura un joc care să prezică modul în care se pot derula evenimentele. Mai jos este un exemplu despre modul în care se poate modela un astfel de joc.

Figura 4

Compararea conturilor de investiții Denumirea furnizorului Descrierea divulgatorului de publicitate × Ofertele care apar în acest tabel provin din parteneriate de la care Investopedia primește compensații.

Termeni înrudiți

Definiția jocului Centipede Jocul centipede din teoria jocurilor implică doi jucători care au alternativă șansa de a lua o parte mai mare dintr-o miză din ce în ce mai mare de bani. mai mult Cum funcționează teoria jocului Teoria jocului este un cadru pentru modelarea scenariilor în care există conflicte de interese în rândul jucătorilor. mai mult Zero-Sum Game O situație în care câștigul unei persoane este echivalent cu pierderea alteia, astfel încât modificarea netă a averii sau a beneficiului este zero. Un joc cu sumă zero poate avea doi jucători sau milioane de participanți. mai mult Echilibrul Nash Echilibrul Nash este un concept din teoria jocului în care rezultatul optim al unui joc este acela în care nu există stimulent să se abată de la strategia lor inițială. mai mult Definiția Dilemei Călătorului Dilema călătorului demonstrează paradoxul raționalității - faptul că luarea deciziilor în mod ilogic produce adesea un profit mai bun în teoria jocurilor. mai mult Potrivirea Pennies-ului Definiția banii de potrivire este un exemplu de teorie a jocului de bază care demonstrează modul în care factorii de decizie raționali încearcă să-și maximizeze profiturile. mai multe link-uri partenere
Recomandat
Lasă Un Comentariu