Teorin om skällande spel. Spelteori: historia och tillämpning

På 1930-talet blev John och Oscar Morgenstern grundarna av en intressant ny gren av matematiken som kallas "spelteori". På 1950-talet blev den unge matematikern John Nash intresserad av detta område. Jämviktsteori blev ämnet för hans avhandling, som han skrev vid 21 års ålder. Så föddes en ny kallad "Nash Equilibrium", som vann Nobelpriset många år senare - 1994.

Det långa gapet mellan avhandlingsskrivande och allmän acceptans utmanade matematikern. Geni utan erkännande resulterade i allvarliga psykiska störningar, men John Nash kunde lösa detta problem tack vare hans utmärkta logiska skäl. Hans teori om "Nash equilibrium" vann Nobelpriset, och hans liv anpassades i filmen "Beautiful mind".

Spelteori i korthet

Eftersom Nashs jämviktsteori förklarar människors beteende i interaktion, är det därför värt att överväga spelteorins grundläggande begrepp.

Spelteori studerar deltagarnas (agenters) beteende när det gäller interaktion med varandra som ett spel, när resultatet beror på flera personers beslut och beteende. Deltagaren fattar beslut baserat på sina förutsägelser om andras beteende, vilket kallas en spelstrategi.

Det finns också en dominerande strategi där deltagaren får det optimala resultatet för de andra deltagarnas beteende. Detta är spelarens bästa no-lose-strategi.

Fångens dilemma och vetenskapliga genombrott

Fångens dilemma är ett fall av lek, när deltagarna tvingas fatta rationella beslut, för att uppnå ett gemensamt mål i en konflikt av alternativ. Frågan är vilket av dessa alternativ han kommer att välja, inse sitt personliga och allmänna intresse, liksom omöjligheten att få båda. Spelare verkar vara fångade i tuffa spelförhållanden, vilket ibland får dem att tänka väldigt produktivt.

Detta dilemma utforskades av en amerikansk matematiker.Jämvikten han härledde blev revolutionerande på sitt sätt. Särskilt ljust påverkade denna nya tanke ekonomers åsikt om hur marknadsaktörer gör sina val, med hänsyn till andras intressen, med nära interaktion och skärningspunkt mellan intressen.

Det är bäst att studera spelteori med specifika exempel, eftersom denna matematiska disciplin i sig inte är torrteoretisk.

Ett exempel på en fånges dilemma

Till exempel begick två personer ett rån, föll i händerna på polisen och förhörs i separata celler. Samtidigt erbjuder poliserna varje deltagare förmånliga villkor under vilka han kommer att släppas om han vittnar mot sin partner. Var och en av brottslingarna har följande uppsättning strategier att överväga:

  1. Båda vittnar samtidigt och får 2,5 års fängelse.
  2. Båda är tysta samtidigt och får 1 år vardera, eftersom bevisunderlaget för deras skuld i detta fall kommer att vara litet.
  3. Den ena avger vittnesmål och får frihet, medan den andre är tyst och får 5 års fängelse.

Uppenbarligen beror utgången av ärendet på båda deltagarnas beslut, men de kan inte komma överens, eftersom de sitter i olika celler. Också tydligt är konflikten mellan deras personliga intressen i kampen för ett gemensamt intresse. Var och en av fångarna har två handlingsalternativ och fyra alternativ för resultat.

Logisk slutledningskedja

Så gärningsmannen A överväger följande alternativ:

  1. Jag är tyst och min sambo är tyst - vi båda får 1 års fängelse.
  2. Jag lämnar in min sambo och han överlämnar mig – vi får båda 2,5 års fängelse.
  3. Jag är tyst, och min partner överlämnar mig - jag kommer att få 5 års fängelse, och han är fri.
  4. Jag lämnar över min sambo, men han är tyst - jag får frihet, och han är 5 år i fängelse.

Här är en matris med möjliga lösningar och resultat för tydlighetens skull.

Tabell över troliga utfall av fångens dilemma.

Frågan är vad varje deltagare väljer?

"Tystnad, du kan inte tala" eller "Du kan inte vara tyst, du kan inte tala"

För att förstå valet av deltagaren måste du gå igenom kedjan av hans tankar. Efter förövarens A resonemang: om jag förblir tyst och min sambo inte säger något så får vi minimitiden (1 år), men jag kan inte ta reda på hur han kommer att bete sig. Om han vittnar mot mig, så är det också bättre för mig att vittna, annars kan jag bli fängslad i 5 år. Det är bättre för mig att gå i fängelse i 2,5 år än i 5 år. Om han håller tyst, så behöver jag desto mer vittna, eftersom detta kommer att ge mig frihet. Deltagare B argumenterar på samma sätt.

Det är inte svårt att förstå att den dominerande strategin för var och en av brottslingarna är att vittna. Den optimala poängen med detta spel kommer när båda brottslingarna vittnar och får sitt "pris" - 2,5 års fängelse. Nash spelteori kallar detta för jämvikt.

Icke-optimal optimal Nash-lösning

Den revolutionära karaktären hos Nash-synen är att den inte är optimal när man tar hänsyn till den individuella deltagaren och dennes personliga intresse. När allt kommer omkring är det bästa alternativet att vara tyst och bli släppt.

Nash-jämvikten är en punkt för konvergens av intressen, där varje deltagare väljer ett alternativ som är optimalt för honom endast om andra deltagare väljer en viss strategi.

Med tanke på alternativet när båda brottslingarna är tysta och bara får 1 år var, kan vi kalla det det Pareto-optimala alternativet. Det är dock bara möjligt om de kriminella kunde komma överens i förväg. Men inte ens detta skulle garantera detta resultat, eftersom frestelsen att avvika från avtalet och undvika straff är stor. Bristen på fullständigt förtroende för varandra och faran att få 5 år gör det nödvändigt att välja alternativet med erkännande. Det är helt enkelt irrationellt att spekulera i att deltagarna kommer att hålla sig till det tysta alternativet och agera i samförstånd. Denna slutsats kan dras om vi studerar Nash-jämvikten. Exempel bevisar bara fallet.

Självisk eller rationell

Nashs jämviktsteori gav häpnadsväckande fynd som motbevisade tidigare principer. Till exempel såg Adam Smith beteendet hos var och en av deltagarna som helt själviskt, vilket förde systemet i balans. Denna teori kallades "marknadens osynliga hand".

John Nash såg att om alla deltagare agerar i jakten på sina egna intressen, så kommer detta aldrig att leda till ett optimalt gruppresultat. Med tanke på att rationellt tänkande är inneboende hos varje deltagare, är valet som Nash-jämviktsstrategin erbjuder mer troligt.

Rent manligt experiment

Ett slående exempel är spelet "blonde paradox", som, även om det verkar olämpligt, är en levande illustration av hur Nashs teori om spel fungerar.

I det här spelet måste du föreställa dig att en grupp fria killar kom till en bar. I närheten finns en grupp tjejer, varav en är att föredra framför andra, säg en blondin. Hur kan killar agera för att få sin bästa vän?

Så, killarnas resonemang: om alla börjar lära känna en blondin, kommer troligen ingen att få henne, då kommer hennes vänner inte att vilja träffas. Ingen vill vara den andra fallbacken. Men om killar väljer att undvika blondinen, så är sannolikheten stor att varje kille hittar en bra flickvän bland tjejerna.

Nash-jämviktssituationen är inte optimal för killar, eftersom alla skulle välja en blondin när de bara strävar efter sina egna själviska intressen. Det kan ses att strävan efter enbart själviska intressen kommer att vara liktydigt med kollapsen av gruppintressen. Nash-jämvikt kommer att innebära att varje kille agerar i sina egna intressen, som är i kontakt med hela gruppens intressen. Detta är inte ett optimalt alternativ för alla personligen, utan optimalt för alla, baserat på den övergripande strategin för framgång.

Hela vårt liv är ett spel

Att fatta beslut i verkliga livet är mycket som ett spel, när du förväntar dig ett visst rationellt beteende från andra deltagare. I affärer, på jobbet, i ett team, på ett företag och till och med i relationer med det motsatta könet. Från stora affärer till vanliga livssituationer, allt lyder den eller den lagen.

Naturligtvis är de brottslingar och barspelssituationer som diskuteras bara bra illustrationer av Nash-jämvikten. Exempel på sådana dilemman uppstår mycket ofta på den verkliga marknaden, och det gäller särskilt i fall där två monopolister kontrollerar marknaden.

Blandade strategier

Ofta är vi inte involverade i en, utan i flera matcher samtidigt. Att välja ett av alternativen för ett spel, styrt av en rationell strategi, men du befinner dig i ett annat spel. Efter några rationella beslut kan du upptäcka att du inte är nöjd med ditt resultat. Vad borde göras?

Tänk på två typer av strategier:

  • En ren strategi är beteendet hos en deltagare som kommer från att tänka på andra deltagares möjliga beteende.
  • En blandad strategi eller slumpmässig strategi är växlingen av rena strategier på ett slumpmässigt sätt eller valet av en ren strategi med en viss sannolikhet. Denna strategi kallas också randomiserad.

Genom att titta på detta beteende får vi en ny titt på Nash-jämvikten. Om det tidigare har sagts att spelaren väljer en strategi en gång, kan ett annat beteende föreställas. Det kan antas att spelarna väljer en strategi slumpmässigt med en viss sannolikhet. Spel som inte kan hitta Nash-jämvikt i rena strategier har dem alltid blandade.

Nash-jämvikten i blandade strategier kallas blandad jämvikt. Det är en jämvikt där varje deltagare väljer den optimala frekvensen för att välja sina strategier, förutsatt att andra deltagare väljer sina strategier med en given frekvens.

Straff och blandad strategi

Ett exempel på en blandad strategi kan hittas i fotbollsspelet. Den bästa illustrationen av blandad strategi är kanske straffläggningen. Så vi har en målvakt som bara kan hoppa till ett hörn, och en spelare som tar straffen.

Så om första gången en spelare väljer en strategi för att sparka in i det vänstra hörnet, och målvakten också faller i det här hörnet och fångar bollen, hur kan händelserna då utvecklas andra gången? Om en spelare sparkar i det motsatta hörnet är detta förmodligen för uppenbart, men en spark i samma hörn är inte mindre uppenbart. Därför har både målvakten och smeten inget annat val än att förlita sig på ett slumpmässigt val.

Så, omväxlande slumpmässiga val med en viss ren strategi, försöker spelaren och målvakten få maximalt resultat.

Från den populära amerikanska bloggen Cracked.

Spelteori handlar om att utforska sätt att göra det bästa draget och, som ett resultat, få så mycket av den vinnande kakan som möjligt genom att skära av en del av den från andra spelare. Den lär dig att analysera många faktorer och dra logiska slutsatser. Jag tycker att det ska studeras efter siffrorna och före alfabetet. Helt enkelt för att alltför många människor fattar viktiga beslut baserat på intuition, hemliga profetior, stjärnornas placering och liknande. Jag har studerat spelteori grundligt, och nu vill jag berätta om dess grunder. Kanske kommer detta att lägga sunt förnuft till ditt liv.

1. Fångens dilemma

Berto och Robert greps för att ha rånat en bank efter att ha misslyckats med att använda en stulen bil på rätt sätt för att fly. Polisen kan inte bevisa att det var de som rånade banken utan tog dem på bar gärning i en stulen bil. De fördes till olika rum och var och en erbjöds en överenskommelse: att överlämna en medbrottsling och skicka honom till fängelse i 10 år och att själv släppas. Men om de båda passerar varandra, kommer var och en att få 7 år. Om ingen säger något så kommer båda att få fängelse i 2 år bara för att ha stulit en bil.

Det visar sig att om Berto är tyst, men Robert överlämnar honom, hamnar Berto i fängelse i 10 år, och Robert släpps.

Varje fånge är en spelare, och fördelarna med var och en kan representeras i form av en "formel" (vad de båda får, vad den andre får). Till exempel, om jag slår dig, ser mitt vinstschema ut så här (jag får en grov vinst, du har mycket ont). Eftersom varje fånge har två alternativ kan vi presentera resultaten i en tabell.

Praktisk tillämpning: Identifiera sociopater

Här ser vi den huvudsakliga tillämpningen av spelteori: identifiera sociopater som bara tänker på sig själva. Sann spelteori är ett kraftfullt analytiskt verktyg, och amatörism fungerar ofta som en röd flagga, med huvudet som förråder en person som saknar heder. Personer som gör beräkningarna intuitivt tycker att det är bättre att agera olämpligt, eftersom det kommer att leda till kortare fängelsestraff oavsett vad den andra spelaren gör. Rent tekniskt är detta korrekt, men bara om du är en kortsynt person som sätter siffror över människoliv. Det är därför spelteorin är så populär inom finans.

Det verkliga problemet med fångens dilemma är att den ignorerar data. Till exempel tar den inte hänsyn till möjligheten att du träffar vänner, släktingar eller ens borgenärer till den person som du har fängslat i 10 år.

Det värsta av allt är att alla inblandade i fångens dilemma agerar som om de aldrig hört det.

Och det bästa draget är att vara tyst och två år senare, tillsammans med en god vän, använda de gemensamma pengarna.

2. Dominerande strategi

Detta är en situation där dina handlingar ger dig den största utdelningen, oavsett din motståndares agerande. Vad som än händer så gjorde du allt rätt. Det är därför många människor i "fångens dilemma" tror att svek leder till det "bästa" resultatet oavsett vad den andra personen gör, och den inneboende åsidosättandet av verkligheten i denna metod gör att allt ser superenkelt ut.

De flesta av spelen vi spelar har inte strikt dominerande strategier för annars skulle de bara vara hemska. Föreställ dig att du alltid skulle göra samma sak. Det finns ingen dominerande strategi i spelet sten-papper-sax. Men om du skulle spela med en man med vantar på händerna och bara kunde visa en sten eller papper, skulle du ha en dominerande strategi: papper. Ditt papper kommer att slå in hans sten eller leda till oavgjort, och du kan inte förlora eftersom motståndaren inte kan visa saxen. Nu när du har en dominerande strategi måste du vara en idiot för att prova något annat.

3. Kampen mellan könen

Spel är mer intressanta när de inte har en strikt dominerande strategi. Till exempel könens kamp. Anjali och Borislav går på dejt, men kan inte välja mellan balett och boxning. Anjali älskar boxning för att hon älskar det när blod utgjuts till glädje för en skrikande skara åskådare som anser sig vara civiliserade bara för att de betalat för någons trasiga huvuden.

Borislav vill titta på balett, eftersom han förstår att ballerinor går igenom ett stort antal skador och svår träning, med vetskapen om att en skada kan sätta stopp för allt. Balettdansare är de största idrottarna på jorden. En ballerina kanske sparkar dig i huvudet, men hon kommer aldrig att göra det, eftersom hennes ben är värt mycket mer än ditt ansikte.

Var och en av dem vill gå till sitt favoritevenemang, men de vill inte njuta av det ensamma, så vi får ett schema över deras vinst: det största värdet är att göra vad de vill, det minsta värdet är att bara vara med en annan person , och noll är att vara ensam.

Vissa människor föreslår att envist balansera på gränsen till krig: om du, oavsett vad, gör vad du vill, måste den andra personen anpassa sig till ditt val eller förlora allt. Som jag redan sa, förenklad spelteori är bra på att upptäcka dårar.

Praktisk användning: Undvik skarpa hörn

Naturligtvis har denna strategi också sina betydande nackdelar. Först och främst, om du behandlar din dejting som en "kamp mellan könen", kommer det inte att fungera. Dela så att var och en av er kan hitta någon han gillar. Och det andra problemet är att deltagarna i den här situationen är så osäkra att de inte kan göra det.

En riktigt vinnande strategi för alla är att göra vad de vill, och efter, eller nästa dag, när de är lediga, gå till ett café tillsammans. Eller växla mellan boxning och balett tills en revolution sker i underhållningsvärlden och boxningsbalett uppfinns.

4. Nash-jämvikt

En Nash Equilibrium är en uppsättning drag där ingen vill göra något annorlunda efter ett fullbordat faktum. Och om vi kan få det att fungera kommer spelteorin att ersätta hela det filosofiska, religiösa och finansiella systemet på planeten, eftersom "lusten att inte brinna ut" har blivit en mer kraftfull drivkraft för mänskligheten än eld.

Låt oss snabbt dela på $100. Du och jag bestämmer hur många av hundra vi kräver och meddelar samtidigt beloppet. Om vår totalsumma är mindre än hundra får alla som de vill. Om summan är mer än hundra får den som bett om det minsta beloppet önskat belopp, och den girigare får det som är kvar. Om vi ​​ber om samma summa får alla $50. Hur mycket frågar du? Hur ska du dela upp pengarna? Det finns bara ett vinnande drag.

Att syna $51 ger dig det maximala beloppet oavsett vad din motståndare väljer. Om han ber om mer får du $51. Om han ber om $50 eller $51, får du $50. Och om han ber om mindre än $50 får du $51. Hur som helst, det finns inget annat alternativ som ger dig mer pengar än det här. Nash Equilibrium är en situation där vi båda väljer $51.

Praktisk tillämpning: Tänk först

Detta är hela poängen med spelteorin. Det är inte nödvändigt att vinna, än mindre skada andra spelare, men det är absolut nödvändigt att göra det bästa draget för dig själv, oavsett vad andra förbereder för dig. Och det är ännu bättre om detta drag är fördelaktigt för andra spelare också. Det här är en sorts matematik som kan förändra samhället.

En intressant variant på denna idé är att dricka alkohol, som kan kallas Nash Equilibrium med ett tidsberoende. När du dricker tillräckligt bryr du dig inte om andra människors handlingar oavsett vad de gör, men dagen efter ångrar du verkligen att du inte gjorde något annat.

5. Kastaspelet

Kasten spelas av spelare 1 och spelare 2. Varje spelare väljer samtidigt huvuden eller svansar. Om de gissar rätt får spelare 1 spelare 2:s öre. Om inte får spelare 2 spelare 1:s mynt.

Den vinnande matrisen är enkel ...

… Optimal strategi: spela helt slumpmässigt. Detta är svårare än du tror, ​​eftersom valet måste vara helt slumpmässigt. Om du har en preferens för huvuden eller svansar, kan fienden använda det för att ta dina pengar.

Naturligtvis är det verkliga problemet här att det skulle vara mycket bättre om de bara slängde en krona på varandra. Som ett resultat skulle deras vinster vara desamma, och det resulterande traumat kunde hjälpa dessa olyckliga människor att känna något annat än fruktansvärd tristess. Detta är trots allt det sämsta spelet någonsin. Och det här är den perfekta modellen för en straffläggning.

Praktisk tillämpning: Straffläggning

I fotboll, hockey och många andra matcher är förlängning en straffläggning. Och de skulle vara mer intressanta om de var baserade på hur många gånger spelare i full form skulle kunna göra hjulet, för det skulle åtminstone vara en indikation på deras fysiska förmåga och skulle vara kul att se. Målvakter kan inte tydligt bestämma bollens eller puckens rörelse i början av sin rörelse, eftersom robotar tyvärr fortfarande inte deltar i våra sporter. Målvakten måste välja vänster eller höger riktning och hoppas att hans val sammanfaller med valet av motståndaren som skjuter på mål. Detta har något att göra med att spela med ett mynt.

Observera dock att detta inte är ett perfekt exempel på likheten med huvuden och svansar, eftersom även med rätt riktning kanske målvakten inte fångar bollen och anfallaren kan missa målet.

Så vad är vår slutsats enligt spelteorin? Bollspel ska avslutas med en multiball-metod, där spelarna varje minut får en extra boll/puck en-mot-en tills en av sidorna får ett visst resultat, vilket var en indikator på spelarnas verkliga skicklighet, och inte en spektakulärt sammanträffande.

Spelteori bör trots allt användas för att göra spelet smartare. Vilket betyder bättre.

Vad är fria radikaler?

Varför, om du blandar alla färger, får du brunt, och inte vitt, eftersom vitt innehåller alla färger?

7 oväntade fakta om världen omkring oss

Fantastisk värld

10 häpnadsväckande fakta om hundtänkande

En hund är en människas vän och tar ofta något från honom.

Som ett resultat av att studera detta kapitel måste studenten:

känna till

Spelkoncept baserade på principen om dominans, Nash-jämvikt, vad är omvänd induktion, etc.; konceptuella tillvägagångssätt för att lösa spelet, innebörden av begreppet rationalitet och balans inom ramen för interaktionsstrategin;

kunna

Skilj mellan spel i strategiska och utökade former, bygg ett "spelträd"; formulera spelmodeller för konkurrens för olika typer av marknader;

egen

Metoder för att bestämma resultatet av spelet.

Spel: grundläggande begrepp och principer

Det första försöket att skapa en matematisk teori om spel gjordes 1921 av E. Borel. Som ett självständigt vetenskapsområde för första gången systematiserades spelteori i monografin av J. von Neumann och O. Morgenstern "Spelteori och ekonomiskt beteende" 1944. Sedan dess har många delar av ekonomisk teori (t.ex. teorin om ofullkomlig konkurrens, teorin om ekonomiska incitament, etc. .) utvecklats i nära kontakt med spelteorin. Spelteori tillämpas också framgångsrikt inom samhällsvetenskap (till exempel analys av röstningsförfaranden, sökning efter jämviktsbegrepp som bestämmer kooperativa och icke-kooperativa beteenden hos individer). Som regel avvisar väljarna kandidater som representerar extrema åsikter, men det är en kamp när man ska välja en av de två kandidater som erbjuder olika kompromisslösningar. Till och med Rousseaus idé om evolution från "naturlig frihet" till "medborgerlig frihet" motsvarar formellt sett från spelteoretisk synvinkel med samarbetssynpunkt.

SpeletÄr en idealiserad matematisk modell av det kollektiva beteendet hos flera personer (spelare), vars intressen är olika, vilket ger upphov till en konflikt. En konflikt innebär inte nödvändigtvis förekomsten av antagonistiska motsättningar mellan parterna, utan är alltid förknippad med en viss typ av oenighet. En konfliktsituation blir antagonistisk om en ökning av den ena partens vinst med ett visst belopp leder till att den andra partens vinst minskar med samma belopp och vice versa. Intressemotsättningen skapar en konflikt, och sammanträffandet av intressen reducerar spelet till samordning av handlingar (samarbete).

Exempel på en konfliktsituation är situationer som utvecklas i relationen mellan köparen och säljaren; i en konkurrensutsatt miljö av olika företag; under fientligheter etc. Exempel på spel är vanliga spel: schack, dam, kort, saloon etc. (därav namnet "spelteori" och dess terminologi).

I de flesta spel som härrör från analys av finansiella, ekonomiska, ledningsmässiga situationer, är spelarnas (parternas) intressen inte strikt antagonistiska eller absolut sammanfallande. Köpare och säljare är överens om att det ligger i deras gemensamma intresse att komma överens om försäljning och köp, men de förhandlar kraftfullt när de väljer ett specifikt pris inom ramen för ömsesidig fördel.

Spel teoriÄr en matematisk teori om konfliktsituationer.

Spelet skiljer sig från en verklig konflikt genom att det spelas enligt vissa regler. Dessa regler fastställer sekvensen av drag, mängden information varje sida har om den andras beteende och resultatet av spelet, beroende på situationen. Reglerna fastställer också slutet på spelet, när en viss sekvens av drag redan har gjorts och inga fler drag är tillåtna.

Spelteori, som vilken matematisk modell som helst, har sina begränsningar. En av dem är antagandet om motståndarnas fullständiga (ideala) intelligens. I en verklig konflikt är ofta den bästa strategin att gissa var fienden är dum och använda den dumheten till din fördel.

En annan nackdel med spelteorin är att var och en av spelarna måste känna till alla möjliga handlingar (strategier) hos motståndaren, det är bara okänt vilken av dem han kommer att använda i ett givet spel. I en verklig konflikt är detta vanligtvis inte fallet: listan över alla möjliga strategier för fienden är exakt okänd, och den bästa lösningen i en konfliktsituation är ofta att gå utöver gränserna för de strategier som fienden känner till, "förstummad" honom med något helt nytt, oförutsett.

Spelteorin inkluderar inte de riskelement som oundvikligen följer med intelligenta beslut i verkliga konflikter. Den definierar det mest försiktiga återförsäkringsbeteendet hos parterna i konflikten.

Dessutom, inom spelteorin, hittas optimala strategier för en indikator (kriterium). I praktiska situationer är det ofta nödvändigt att inte ta hänsyn till ett utan flera numeriska kriterier. En strategi som är optimal för en indikator kanske inte är optimal för andra.

Genom att inse dessa begränsningar och därför inte blint följa rekommendationerna från de givna spelteorierna, är det fortfarande möjligt att utveckla en helt acceptabel strategi för många verkliga konfliktsituationer.

Forskning pågår för närvarande för att utöka omfattningen av spelteorin.

I litteraturen finns följande definitioner av de element som utgör spelet.

Spelare- dessa är de ämnen som är involverade i interaktion, representerade i form av ett spel. I vårt fall är det hushåll, företag, myndigheter. Men i fallet med osäkerhet i yttre omständigheter är det ganska bekvämt att representera de slumpmässiga komponenterna i spelet, som inte beror på spelarnas beteende, som handlingar av "natur".

Spelets regler. Spelets regler är de uppsättningar av åtgärder eller drag som är tillgängliga för spelarna. I det här fallet kan åtgärder vara mycket olika: köparnas beslut om volymen av köpta varor eller tjänster; företag - på produktionsvolymen; nivån på skatter som tas ut av regeringen.

Fastställande av spelets resultat (resultat). För varje kombination av spelaråtgärder fastställs resultatet av spelet nästan mekaniskt. Resultatet kan bli: sammansättningen av konsumentkorgen, vektorn för företagets produktion, eller en uppsättning andra kvantitativa indikatorer.

Vinster. Innebörden av begreppet vinna kan skilja sig åt för olika typer av spel. I det här fallet är det nödvändigt att tydligt skilja mellan fördelarna som mäts på en ordinalskala (till exempel nyttonivån) och värden för vilka intervalljämförelse också är meningsfull (till exempel vinst, välfärdsnivån) .

Information och förväntningar. Osäkerhet och ständiga förändringar i information kan vara extremt allvarliga i de möjliga resultaten av en interaktion. Det är därför det är nödvändigt att ta hänsyn till informationens roll i utvecklingen av spelet. I detta avseende begreppet informationsuppsättning spelare, dvs. sammanställningen av all information om spelets tillstånd som han besitter vid viktiga ögonblick i tiden.

En intuitiv idé om delad kunskap är till stor hjälp när man överväger spelares tillgång till information, eller Allmänbildning, betyder följande: ett faktum är allmänt känt om alla spelare är medvetna om det och alla spelare vet att andra spelare också vet om det.

För fall där tillämpningen av begreppet allmän kunskap inte räcker, begreppet individ förväntningar deltagare - idéer om hur spelsituationen är i detta skede.

Inom spelteorin antar man att spelet består av rör sig, utförs av spelare samtidigt eller sekventiellt.

Dragen är personliga och slumpmässiga. Flytten kallas personlig, om spelaren medvetet väljer det från uppsättningen av möjliga alternativ för åtgärder och utför det (till exempel alla drag i ett schackspel). Flytten kallas slumpmässig, om hans val inte görs av spelaren, utan av någon slumpmässig urvalsmekanism (till exempel baserat på resultatet av en myntkastning).

Uppsättningen av drag som spelarna tar från början till slutet av spelet kallas fest.

Ett av spelteorins grundläggande begrepp är begreppet strategi. Strategi en spelare är en uppsättning regler som bestämmer valet av en handlingsvariant för varje personligt drag, beroende på situationen som har utvecklats under spelets gång. I enkla (en-drag) spel, när spelaren i varje spel bara kan göra ett drag, sammanfaller konceptet med strategi och möjlig handling. I det här fallet täcker spelarens strategier alla hans möjliga handlingar och alla möjliga för spelaren i handling är hans strategi. I komplexa (multi-move-spel) kan begreppen "alternativ för möjliga åtgärder" och "strategi" skilja sig från varandra.

Spelarens strategi kallas optimal, om det ger en given spelare en multipel upprepning av spelet den maximala möjliga genomsnittliga vinsten eller minsta möjliga genomsnittliga förlust, oavsett vilka strategier motståndaren använder. Andra kriterier för optimalitet kan också användas.

Det är möjligt att strategin som ger maximal utdelning inte har ett annat viktigt koncept för optimalitet, såsom stabiliteten (jämvikten) hos lösningen. Lösningen på spelet är hållbar(jämvikt) om strategierna som motsvarar denna lösning bildar en situation som ingen av spelarna är intresserad av att förändra.

Vi upprepar att spelteorins uppgift är att hitta optimala strategier.

Klassificeringen av spel visas i fig. 8.1.

  • 1. Beroende på typen av drag delas spel in i strategiska och hasardspel. Spelande spel består endast av slumpmässiga drag, som spelteorin inte behandlar. Om det tillsammans med slumpmässiga drag finns personliga drag eller alla drag är personliga, kallas sådana spel strategisk.
  • 2. Beroende på antalet spelare delas spel in i dubblar och multiplar. V dubbelspel antalet deltagare är två, in flera olika- mer än två.
  • 3. Deltagare i ett spel med flera kan bilda koalitioner, både permanenta och tillfälliga. På grund av förhållandet mellan spelarna delas spel in i icke-koalition, koalition och kooperativ.

Koalitionsfri kallas spel där spelare inte har rätt att ingå avtal, bilda koalitioner, och målet för varje spelare är att få största möjliga individuella vinst.

Spel där spelarnas handlingar syftar till att maximera utdelningen av kollektiv (koalitioner) utan att deras efterföljande uppdelning mellan spelarna kallas koalition.

Ris. 8.1.

Resultatet kooperativ spel är uppdelningen av koalitionens vinster, som inte uppstår som ett resultat av vissa handlingar från spelarna, utan som ett resultat av deras förutbestämda överenskommelser.

I enlighet med detta jämförs i kooperativa spel inte situationen i fråga om preferens, som fallet är i icke-kooperativa spel, utan divisionerna; och denna jämförelse är inte begränsad till övervägande av individuella vinster, utan är mer komplex till sin natur.

  • 4. Enligt antalet strategier för varje spelare delas spel in i slutlig(antalet strategier för varje spelare är begränsat) och ändlös(uppsättningen strategier för varje spelare är oändlig).
  • 5. Enligt mängden information som är tillgänglig för spelare angående tidigare drag, delas spel in i spel med fullständig information(all information om tidigare drag finns) och ofullständig information. Exempel på spel med fullständig information är schack, dam, etc.
  • 6. Beroende på typen av beskrivning delas spel in i positionsspel (eller spel i utökad form) och spel i normal form. Positionsspelär satta i form av ett spelträd. Men vilket positionsspel som helst kan reduceras till normal form, där var och en av spelarna endast gör ett oberoende drag. I positionsspel görs drag vid diskreta tidpunkter. Existerar differentialspel, där rörelserna görs kontinuerligt. Dessa spel studerar problemen med att förfölja ett kontrollerat objekt av ett annat kontrollerat objekt, med hänsyn till dynamiken i deras beteende, vilket beskrivs av differentialekvationer.

Det finns även reflekterande spel, som beaktar situationer i termer av mental reproduktion av motståndarens möjliga handlingssätt och beteende.

7. Om något möjligt spel i ett visst spel har en nollsumma av alla vinster N spelare (), då pratar de om ett nollsummespel. Annars heter spelen spel med icke-nollsumma.

Uppenbarligen är nollsummedubbelspelet antagonistisk, eftersom vinsten för en spelare är lika med förlusten för den andra, och därför är dessa spelares mål direkt motsatta.

Det sista nollsummans dubbla spelet kallas matrisspel. Ett sådant spel beskrivs av en utdelningsmatris, där den första spelarens utdelning ställs in. Matrisens radnummer motsvarar numret på den tillämpade strategin för den första spelaren, kolumnen - till numret på den tillämpade strategin för den andra spelaren; i skärningspunkten mellan en rad och en kolumn är motsvarande vinst för den första spelaren (förlust för den andra spelaren).

Ett ändligt parspel med en summa som inte är noll kallas bimatrix spel. Ett sådant spel beskrivs av två lönematriser, var och en för respektive spelare.

Låt oss ge följande exempel. Spelet "Test". Låt spelare 1 vara eleven som förbereder sig för provet och spelare 2 läraren som gör provet. Vi kommer att anta att eleven har två strategier: A1 - förbereda sig väl för provet; A 2 - förbered inte. Läraren har också två strategier: B1 - att ge poäng; B 2 - ingen kredit. Uppskattningen av värdena för spelarnas utdelning kan till exempel baseras på följande överväganden som återspeglas i utdelningsmatriserna:

Detta spel, i enlighet med ovanstående klassificering, är strategiskt, dubbelt, koalitionsfritt, final, beskrivet i normal form, med en summa som inte är noll. Mer kortfattat kan detta spel kallas bimatrix.

Utmaningen är att bestämma de optimala strategierna för eleven och för läraren.

Ytterligare ett exempel på det välkända bimatrisspelet Prisoner's Dilemma.

Var och en av de två spelarna har två strategier: A 2 och B 2 - strategier för aggressivt beteende, en A jag och B i - fredligt beteende. Anta att "fred" (båda spelarna är fredliga) är bättre för båda spelarna än "krig". Fallet när en spelare är aggressiv och den andra är fredlig är mer fördelaktigt för angriparen. Låt utdelningsmatriserna för spelare 1 och 2 i ett givet bimatrisspel ha formen

För båda spelarna domineras de aggressiva strategierna A2 och B2 av de fredliga strategierna Axe och B v Således är den enda jämvikten i dominerande strategier (A2, B 2), dvs. det postuleras att krig är resultatet av icke-samarbetsvilligt beteende. Samtidigt ger utfallet (A1, B1) (fred) en större utdelning för båda spelarna. Således kommer icke-samarbetsvilligt själviskt beteende i konflikt med kollektiva intressen. Kollektiva intressen dikterar valet av fredliga strategier. Samtidigt, om spelare inte utbyter information, är krig det mest troliga resultatet.

I detta fall är situationen (A1, B1) Pareto optimal. Denna situation är dock instabil, vilket leder till möjligheten att spelare bryter mot det etablerade avtalet. Faktum är att om den första spelaren bryter mot avtalet, och den andra inte bryter mot, kommer den första spelarens vinst att öka till tre, och den andra kommer att falla till noll, och vice versa. Dessutom förlorar varje spelare som inte bryter mot avtalet mer om den andra spelaren bryter mot avtalet än om de båda bryter mot avtalet.

Det finns två huvudformer av spel. Spelar in omfattande form representeras som ett diagram över "träd"-typen av beslutsfattande, med "roten" som motsvarar punkten i början av spelet, och början av varje ny "gren", kallad Knut,- det tillstånd som uppnåtts i detta skede med de givna åtgärder som redan vidtagits av spelarna. Varje slutnod - varje slutpunkt i spelet - tilldelas en vektor av vinster, en komponent för varje spelare.

Strategisk, annars kallas normal, form representationen av spelet motsvarar en flerdimensionell matris, och varje dimension (i det tvådimensionella fallet, rader och kolumner) inkluderar en uppsättning möjliga åtgärder för en agent.

En separat cell i matrisen innehåller en vektor av utdelningar som motsvarar en given kombination av spelarnas strategier.

I fig. 8.2 visar en omfattande form av spelet och i tabell. 8.1 - strategisk form.

Ris. 8.2.

Tabell 8.1. Ett spel med samtidigt beslutsfattande på ett strategiskt sätt

Det finns en ganska detaljerad klassificering av de ingående delarna av spelteorin. Ett av de mest allmänna kriterierna för en sådan klassificering är uppdelningen av spelteorin i teorin om icke-kooperativa spel, där ämnena för beslutsfattande är individerna själva, och teorin om kooperativa spel, där ämnena av beslutsfattande är grupper, eller koalitioner av individer.

Icke-kooperativa spel presenteras vanligtvis i normala (strategiska) och utökade (omfattande) former.

  • Vorobiev Η. N. Spelteori för cyber-ekoiomer. Moskva: Nauka, 1985.
  • Wentzel E.S. Operationsforskning. Moskva: Nauka, 1980.

Den matematiska teorin om spel som uppstod på 40-talet av XX-talet används oftast inom ekonomi. Men hur kan vi modellera beteendet hos människor i samhället med hjälp av konceptet spel? Varför studerar ekonomer i vilket hörn fotbollsspelare är mer benägna att skjuta straffar, och hur man vinner i Rock, Scissors, Paper, berättade Danil Fedorovykh, universitetslektor vid institutionen för mikroekonomisk analys vid Higher School of Economics, i sin föreläsning.

John Nash och blondinen i baren

Ett spel är varje situation där agentens vinst inte bara beror på hans egna handlingar utan också på andra deltagares beteende. Om du spelar patiens hemma, ur en ekonoms och spelteoris synvinkel, är det inget spel. Det innebär obligatorisk närvaro av en intressekonflikt.

A Beautiful Mind, om John Nash, en nobelpristagare i ekonomi, innehåller en scen med en blondin i en bar. Det visar idén som vetenskapsmannen fick priset för - idén om Nash-jämvikt, som han själv kallade kontrolldynamik.

Spelet- alla situationer där agenternas utbetalningar beror på varandra.

Strategi - en beskrivning av spelarens agerande i alla möjliga situationer.

Resultatet är en kombination av de valda strategierna.

Så ur teoretisk synvinkel är spelarna i den här situationen bara män, det vill säga de som fattar beslutet. Deras preferenser är enkla: en blondin är bättre än en brunett, och en brunett är bättre än ingenting. Du kan agera på två sätt: gå till blondinen eller till "din" brunett. Spelet består av ett enda drag, beslut fattas samtidigt (det vill säga du kan inte se vart de andra tog vägen och sedan gå själv). Om en tjej avvisar en man slutar spelet: det är omöjligt att återvända till henne eller välja en annan.

Vad är det troliga slutet på den här spelsituationen? Det vill säga, vad är dess stabila konfiguration, från vilken alla kommer att förstå att de har gjort det bästa valet? För det första, som Nash korrekt konstaterar, om alla går till blondinen kommer det inte att sluta bra. Därför föreslår forskaren vidare att alla behöver gå till brunetter. Men sedan, om det är känt att alla kommer att gå till brunetter, borde han gå till blondinen, för hon är bättre.

Detta är den verkliga balansen - resultatet, där man går till blondinen och resten till brunetterna. Det kan tyckas som att detta är orättvist. Men i en situation av jämvikt kan ingen ångra sitt val: de som går till brunetter förstår att de fortfarande inte skulle få något av en blondin. Således är Nash-jämvikten en konfiguration där ingen individuellt vill ändra den strategi som valts av alla. Det vill säga, efter att ha reflekterat i slutet av spelet inser varje deltagare att även om han visste hur andra är, skulle han ha gjort detsamma. På ett annat sätt kan man kalla det ett utfall, där varje deltagare svarar på ett optimalt sätt på de andras agerande.

"Sten sax påse"

Överväg andra balansspel. Till exempel, i "Rock, Scissors, Paper" finns det ingen Nash-jämvikt: i alla dess troliga utfall finns det inget alternativ där båda deltagarna skulle vara nöjda med sitt val. Det finns dock världsmästerskapet och World Rock Paper Scissors Society som samlar in spelstatistik. Självklart kan du öka dina chanser att vinna om du vet något om det vanliga beteendet hos människor i det här spelet.

En ren strategi i ett spel är en där en person alltid spelar på samma sätt och väljer samma drag.

Enligt World RPS Society är sten det mest spelade draget (37,8%). Papper gynnas av 32,6 %, sax av 29,6 %. Nu vet du att välja papper. Men om du spelar med någon som också kan detta behöver du inte längre välja papper, eftersom det samma förväntas av dig. Det finns ett känt fall: 2005 bestämde två auktionshus Sotheby "s och Christie" s vem som skulle få en mycket stor lott - en samling av Picasso och Van Gogh med ett startpris på 20 miljoner dollar. Ägaren bjöd in dem att spela Rock, Scissors, Paper, och representanterna för husen skickade honom sina alternativ via e-post. Sotheby's, som de senare sa, tvekade inte att välja papper. Vann Christie ”s. För att fatta ett beslut vände de sig till en expert - den 11-åriga dottern till en av toppcheferna. Hon sa: "Stenen verkar vara den starkaste, så de flesta väljer den. Men om vi inte leker med en helt dum nybörjare kommer han inte att kasta en sten, han förväntar sig att vi gör det, och han kommer själv att kasta ut papperet. Men vi kommer att tänka framåt och slänga saxen."

Således kan du tänka framåt, men detta leder dig inte nödvändigtvis till seger, eftersom du kanske inte är medveten om din motståndares kompetens. Därför är det ibland istället för rena strategier mer korrekt att välja blandade, det vill säga att fatta beslut på måfå. Så i "Rock, Scissors, Paper" är balansen, som vi inte har hittat tidigare, just i blandade strategier: att välja vart och ett av de tre alternativen för ett drag med en sannolikhet på en tredjedel. Om du väljer en sten oftare kommer din motståndare att justera sitt val. Genom att veta detta kommer du att korrigera din och balansen kommer inte ut. Men ingen av er kommer att börja ändra beteende om alla helt enkelt väljer sten, sax eller papper med lika stor sannolikhet. Detta beror på att det i blandade strategier baserade på tidigare handlingar är omöjligt att förutsäga ditt nästa drag.

Blandade strategier och sporter

Det finns många allvarligare exempel på blandade strategier. Till exempel var man servar i tennis eller för att slå/ta en straffspark i fotboll. Om du inte vet något om din motståndare, eller om du bara hela tiden spelar mot olika, är den bästa strategin att agera mer eller mindre slumpmässigt. Professor vid London School of Economics Ignacio Palacios-Huerta publicerade en artikel i American Economic Review 2003, vars essens var att hitta Nash-jämvikten i blandade strategier. Palacios-Huerta valde fotboll som föremål för sin forskning och som ett resultat såg han över 1400 straffar. Naturligtvis, i sport är allt listigare än i "Rock, Scissors, Paper": det tar hänsyn till idrottarens starka ben, slår olika vinklar när han slår med all sin kraft och liknande. Nash-jämvikten består här i att beräkna alternativ, det vill säga att till exempel bestämma vinklarna för målet som du behöver skjuta för att vinna med större sannolikhet, att känna till dina styrkor och svagheter. Statistiken för varje fotbollsspelare och jämvikten i den i blandade strategier visade att fotbollsspelare gör något som ekonomer förutspår. Det behöver knappast hävdas att de som tar straff har läst läroböcker i spelteori och har gjort en ganska knepig matematik. Troligtvis finns det olika sätt att lära sig att bete sig optimalt: du kan vara en briljant fotbollsspelare och känna vad du ska göra, eller så kan du vara ekonom och söka balans i blandade strategier.

2008 träffade professor Ignacio Palacios-Huerta Abraham Grant, Chelsea-tränaren som då spelade i Champions League-finalen i Moskva. Forskaren skrev ett meddelande till tränaren med rekommendationer om straffläggning angående beteendet hos motståndarens målvakt, Edwin van der Sar från Manchester United. Till exempel, enligt statistiken, slog han nästan alltid mittnivån och rusade oftare till den naturliga sidan för en straffspark. Som vi definierade ovan är det mer korrekt att randomisera ditt beteende med hänsyn till kunskap om din motståndare. När straffen redan stod 6-5 fick Chelsea-anfallaren Nicolas Anelka göra mål. Pekade på det högra hörnet innan han slog, van der Sar verkade fråga Anelk om han skulle slå där.

Summan av kardemumman är att alla Chelseas tidigare skott var till höger om kickern. Vi vet inte exakt varför, kanske på grund av råd från en ekonom, att slå i en onaturlig riktning för dem, för enligt statistiken är van der Sar mindre redo för detta. De flesta av Chelseas spelare var högerhänta: slog en onaturlig högerhörna, alla utom Terry gjorde mål. Tydligen var strategin att Anelka skulle skjuta åt samma håll. Men van der Sar verkar ha listat ut det. Han agerade briljant: han pekade på det vänstra hörnet och sa: "Ska du slå där?" I sista stund bestämde han sig för att agera annorlunda och träffade sin naturliga sida, vilket var vad van der Sar behövde, som tog det här slaget och säkrade Manchesters seger. Denna situation lär ut ett slumpmässigt val, för annars kan ditt beslut beräknas och du kommer att förlora.

Fångens dilemma

Det kanske mest kända spelet som sätter igång collegespelteorikurser är Prisoner's Dilemma. Enligt legenden ska de två misstänkta för grovt brott ha gripits och låsts in i olika celler. Det finns bevis för att de förvarade vapen, och det gör att de kan fängslas under en kort period. Det finns dock inga bevis för att de begått detta fruktansvärda brott. Utredaren berättar för varje individ om förutsättningarna för spelet. Om båda brottslingarna erkänner kommer båda att dömas till tre års fängelse. Om den ene erkänner, och medbrottslingen är tyst, kommer den erkände att lämna omedelbart, och den andre kommer att fängslas i fem år. Om tvärtom den första inte erkänner och den andra överlämnar honom, kommer den första att sitta i fem år och den andra lämnar omedelbart. Om ingen erkänner kommer båda att hamna i fängelse i ett år för vapeninnehav.

Nash-jämvikten ligger här i den första kombinationen, då båda misstänkta inte är tysta och båda sitter fängslade i tre år. Resonemangen för var och en är som följer: "Om jag talar, kommer jag att sitta i tre år, om jag förblir tyst, i fem år. Om den andre är tyst, skulle jag också bättre säga: att inte sitta ner är bättre än att sitta ner i ett år." Detta är den dominerande strategin: att tala är fördelaktigt, oavsett vad den andre gör. Det finns dock ett problem i det - tillgången till ett bättre alternativ, eftersom att sitta i tre år är värre än att sitta i ett år (om vi bara betraktar historien från deltagarnas synvinkel och inte tar hänsyn till moralisk problem). Men det är omöjligt att sitta ner i ett år, eftersom det, som vi förstod ovan, är olönsamt för båda brottslingarna att tiga.

Pareto förbättring

Det finns en berömd metafor om marknadens osynliga hand, som tillhör Adam Smith. Han sa att om slaktaren försöker tjäna pengar för sig själv, kommer det att vara bättre för alla: han kommer att göra välsmakande kött, som bagaren kommer att köpa för pengar från försäljningen av rullar, som han i sin tur också måste göra läckra så att de säljs ... Men det visar sig att denna osynliga hand inte alltid fungerar, och det finns många situationer när alla agerar för sig själva, men alla är dåliga.

Därför tänker ibland ekonomer och spelteoretiker inte på det optimala beteendet för varje spelare, det vill säga inte på Nash-jämvikten, utan på resultatet där hela samhället kommer att bli bättre (i "Dilemma" består samhället av två kriminella ). Ur denna synvinkel är resultatet effektivt när det inte finns någon Pareto-förbättring i det, det vill säga det är omöjligt att göra någon bättre utan att göra andra sämre. Om människor bara byter varor och tjänster är detta en Pareto-förbättring: de gör det frivilligt, och det är osannolikt att någon är dålig för det. Men ibland, om du bara låter människor interagera och inte ens störa, då kommer det de kommer fram till inte att vara Pareto-optimalt. Detta är vad som händer i The Prisoner's Dilemma. I den, om vi låter alla agera på ett sätt som passar dem, visar det sig att alla är dåliga av detta. Det vore bättre för alla om alla inte agerade optimalt för sig själva, det vill säga de var tysta.

Tragedi i samhället

The Prisoner's Dilemma är en stiliserad leksakshistoria. Du kanske inte förväntar dig att hamna i en liknande situation, men liknande effekter finns överallt omkring oss. Tänk på multiplayer-dilemmat, som ibland kallas en tragedi i samhället. Till exempel är det trafikstockningar på vägarna, och jag bestämmer hur jag ska ta mig till jobbet: med bil eller buss. Andra gör detsamma. Om jag åker bil, och alla bestämmer sig för att göra detsamma, blir det trafikstockning, men vi kommer dit bekvämt. Om jag åker buss blir det fortfarande bilkö, men jag kommer att vara obekväm och inte speciellt snabb, så det här utfallet är ännu värre. Om alla i snitt åker buss, så kommer jag, efter att ha gjort detsamma, att ta mig dit ganska snabbt utan bilkö. Men om jag under sådana förhållanden åker bil kommer jag också snabbt fram, men också med komfort. Så närvaron av en plugg beror inte på mina handlingar. Nash-jämvikten är här – i en situation där alla väljer att åka bil. Vad de andra än gör så är det bättre att jag väljer en bil, för det blir bilkö eller inte, det är okänt, men jag kommer i alla fall dit med komfort. Det är den dominerande strategin, så det slutar med att alla kör och vi har vad vi har. Statens uppgift är att göra att resa med buss är det bästa alternativet för åtminstone vissa, så det finns betalda entréer till centrum, parkeringsplatser och så vidare.

En annan klassisk historia är väljarens rationella okunnighet. Föreställ dig att du inte vet utgången av ett val i förväg. Du kan studera programmet för alla kandidater, lyssna på debatterna och sedan rösta på de bästa. Den andra strategin är att komma till vallokalen och rösta på måfå eller på någon som visas oftare på tv. Vad är det bästa beteendet om min röst aldrig avgör vem som vinner (och i ett land med en befolkning på 140 miljoner kommer en röst aldrig att avgöra någonting)? Självklart vill jag att landet ska ha en bra president, men jag vet att ingen annan kommer att studera kandidaternas program noggrant. Att inte slösa tid på detta är därför den dominerande beteendestrategin.

När du bjuds in till lördagsstädningen beror det inte på någon separat om gården blir ren eller inte: om jag går ut ensam kan jag inte ta bort allt, eller om alla går ut så gör jag det inte gå ut, för allt är utan mig borttaget. Ett annat exempel är frakten av varor i Kina, som jag lärde mig om i Stephen Landsburgs utmärkta bok The Economist on the Couch. För 100-150 år sedan var en metod att transportera varor utbredd i Kina: allt veks ihop till en stor kropp, som släpades av sju personer. Kunderna betalade om varorna levererades i tid. Föreställ dig att du är en av dessa sex. Man kan anstränga sig och dra med all kraft och gör alla det kommer lasten fram i tid. Om någon ensam inte gör detta så kommer alla också i tid. Alla tänker: "Om alla andra drar ordentligt, varför ska jag göra det, och om alla andra inte drar med all sin kraft, då kan jag inte ändra någonting." Som ett resultat, under leveranstiden, var allt mycket dåligt, och flyttarna själva hittade en väg ut: de började anställa en sjunde och betala honom pengar för att piska de lata med en piska. Själva närvaron av en sådan person tvingade alla att arbeta med all sin kraft, för annars föll alla i en dålig balans, från vilken ingen individuellt kunde komma ut lönsamt.

Samma exempel kan observeras i naturen. Ett träd som växer i en trädgård skiljer sig från det som växer i en skog i sin krona. I det första fallet omger det hela stammen, i det andra är det bara på toppen. I skogen är detta Nash-jämvikten. Om alla träd kom överens och växte på samma sätt, skulle de fördela antalet fotoner lika, och alla skulle ha det bättre. Men det är olönsamt för någon att göra det. Därför vill varje träd växa sig lite högre än de runt omkring.

Kommunikationsenhet

I många situationer kan en av spelarna i spelet behöva ett verktyg för att övertyga andra om att de inte bluffar. Det kallas för engagemang. Till exempel förbjuder lagen i vissa länder betalning av lösen till kidnappare för att minska motivationen hos brottslingar. Denna lagstiftning fungerar dock ofta inte. Om din släkting blir tillfångatagen och du har möjlighet att rädda honom genom att kringgå lagen, kommer du att göra det. Föreställ dig en situation där lagen kan kringgås, men de anhöriga visade sig vara fattiga och de har inget att betala lösen. Gärningsmannen har två alternativ i denna situation: släppa eller döda offret. Han gillar inte att döda, men han gillar inte fängelse längre. Det frigivna offret kan i sin tur antingen vittna så att kidnapparen straffades, eller tiga. Det bästa resultatet för gärningsmannen är att släppa offret som inte kommer att överlämna honom. Offret vill släppas och vittna.

Balansen här är att terroristen inte vill bli gripen, vilket innebär att offret dör. Men detta är inte Pareto-jämvikt, eftersom det finns ett alternativ där alla är bättre - offret i stort förblir tyst. Men för detta är det nödvändigt att göra så att det skulle vara lönsamt för henne att vara tyst. Någonstans läste jag ett alternativ när hon kan be en terrorist att ordna en erotisk fotosession. Om gärningsmannen fängslas kommer hans medbrottslingar att lägga upp bilder på internet. Nu, om kidnapparen förblir fri är det dåligt, men bilder med öppen tillgång är ännu värre, så en balans uppnås. Det är ett sätt för offret att överleva.

Andra exempel på spel:

Bertrand modell

Medan vi är inne på ämnet ekonomi, låt oss titta på ett ekonomiskt exempel. I Bertrands modell säljer två butiker samma produkt och köper den från tillverkaren till samma pris. Om priserna i butikerna är desamma så är deras vinst ungefär densamma, för då väljer köparna butiken av en slump. Den enda Nash-jämvikten här är att sälja produkten till självkostnadspris. Men butiker vill tjäna pengar. Därför, om man sätter priset på 10 rubel, kommer den andra att minska det med ett öre, och därmed fördubbla sin inkomst, eftersom alla köpare kommer att gå till honom. Därför är det fördelaktigt för marknadsaktörer att sänka priserna och därigenom fördela vinster sinsemellan.

Avfart på en smal väg

Låt oss överväga exempel på att välja mellan två möjliga jämvikter. Föreställ dig att Petya och Masha kör mot varandra längs en smal väg. Vägen är så smal att de båda måste dra åt sidan. Om de bestämmer sig för att svänga åt vänster eller höger från sig själva kommer de helt enkelt att skingras. Om den ena svänger åt höger och den andra åt vänster, eller tvärtom, händer en olycka. Hur väljer man var man ska flytta ut? För att hjälpa till att hitta balans i sådana spel finns det till exempel trafikregler. I Ryssland måste alla svänga höger.

I det roliga med Chiken, när två personer åker i hög hastighet mot varandra, finns det också två balanser. Om båda svänger åt sidan av vägen uppstår en situation, som kallas Chiken out, om båda inte svänger, då dör de i en fruktansvärd olycka. Om jag vet att min motståndare går rakt, är det fördelaktigt för mig att flytta ut för att överleva. Om jag vet att min motståndare kommer att flytta ut, då är det fördelaktigt för mig att gå direkt för att få $100 efteråt. Det är svårt att förutsäga vad som faktiskt kommer att hända, men var och en av spelarna har sin egen metod för att vinna. Tänk att jag säkrade ratten så att den inte går att vrida, och visade detta för min motståndare. Att veta att jag inte har något val kommer motståndaren att studsa.

QWERTY-effekt

Ibland kan det vara väldigt svårt att flytta från en balans till en annan, även om det innebär fördelar för alla. QWERTY-layouten skapades för att sakta ner din skrivhastighet. För om alla skrev för snabbt skulle skrivmaskinshuvudena som träffade pappret klänga sig fast vid varandra. Därför placerade Christopher Scholes ofta intilliggande brev så långt bort som möjligt. Om du går till tangentbordsinställningarna på din dator kan du välja Dvorak-layouten där och skriva mycket snabbare, eftersom det inte är några problem med analoga pressar just nu. Dvorak förväntade sig att världen skulle flytta till hans tangentbord, men vi lever fortfarande med QWERTY. Naturligtvis, om vi bytte till Dvorak-layouten, skulle den framtida generationen vara oss tacksamma. Vi skulle alla arbeta hårt och lära oss om, och resultatet skulle bli en balans där alla skriver snabbt. Nu är vi också i balans – i en dålig sådan. Men det är inte fördelaktigt för någon att vara den enda som kommer att omskola sig, eftersom det kommer att vara obekvämt att arbeta med vilken dator som helst, förutom en personlig dator.

1. Spelteoris grundläggande begrepp och deras klassificering ................... 4

1.1. Spelteoris ämne och uppgifter ................................................... ................................................... 4

1.2. Terminologi och klassificering av spel ................................................... ............................ 7

1.3. Exempel på spel ........................................................... ................................................... ........... 12

Tester ................................................... ................................................................ ............................ 15

2. Matrisspel ................................................... ................................................................ ... sexton

2.1. Beskrivning av matrisspelet ................................................... .. ........................................ sexton

Spel teori är en matematisk teori om konfliktsituationer.

Syftet med spelteorin - Utveckling av rekommendationer om rimligt beteende hos parterna i konflikten (fastställande av optimala strategier för spelarnas beteende).

Spelet skiljer sig från en verklig konflikt genom att det spelas enligt vissa regler. Dessa regler fastställer sekvensen av drag, mängden information varje sida har om den andras beteende och resultatet av spelet, beroende på situationen. Reglerna fastställer också slutet på spelet, när en viss sekvens av drag redan har gjorts och inga fler drag är tillåtna.

Spelteori, som vilken matematisk modell som helst, har sina begränsningar. En av dem är antagandet om motståndarnas fullständiga ("ideala") intelligens. I en verklig konflikt är ofta den bästa strategin att gissa var fienden är "dum" och dra fördel av denna dumhet.

En annan nackdel med spelteorin är att var och en av spelarna måste känna till alla möjliga handlingar (strategier) hos motståndaren, det är bara okänt vilken av dem han kommer att använda i ett givet spel. I en verklig konflikt är detta vanligtvis inte fallet: listan över alla möjliga strategier för fienden är exakt okänd, och den bästa lösningen i en konfliktsituation är ofta att gå utöver gränserna för de strategier som fienden känner till, "förstummad" honom med något helt nytt, oförutsett.

Spelteorin inkluderar inte de riskelement som oundvikligen följer med intelligenta beslut i verkliga konflikter. Den definierar det mest försiktiga, "återförsäkrings"-beteendet hos parterna i konflikten.

Dessutom, inom spelteorin, hittas optimala strategier för en indikator (kriterium). I praktiska situationer är det ofta nödvändigt att inte ta hänsyn till ett utan flera numeriska kriterier. En strategi som är optimal för en indikator kanske inte är optimal för andra.

Genom att inse dessa begränsningar och därför inte blint följa rekommendationerna från spelteorierna, är det fortfarande möjligt att utveckla en helt acceptabel strategi för många verkliga konfliktsituationer.

Forskning pågår för närvarande för att utöka omfattningen av spelteorin.

1.2. Terminologi och klassificering av spel

Inom spelteorin antar man att spelet består av rör sig utförs av spelare samtidigt eller sekventiellt.

Det finns drag personlig och slumpmässig ... Flytten kallas personlig om spelaren medvetet väljer det från uppsättningen av möjliga alternativ för åtgärder och utför det (till exempel alla drag i ett schackspel). Flytten kallas slumpmässig om hans val inte görs av spelaren, utan av någon mekanism av slumpmässigt urval (till exempel genom resultatet av en myntkastning).

Uppsättningen av drag som spelarna tar från början till slutet av spelet kallas fest .

Ett av spelteorins grundläggande begrepp är begreppet strategi. Strategi en spelare är en uppsättning regler som bestämmer valet av en handlingsvariant för varje personligt drag, beroende på situationen som har utvecklats under spelets gång. I enkla (en-drag) spel, när spelaren i varje spel bara kan göra ett drag, sammanfaller konceptet med strategi och möjlig handling. I det här fallet täcker spelarens strategier alla hans möjliga handlingar och alla möjliga för spelaren i handling är hans strategi. I komplexa (multi-move-spel) kan konceptet "alternativ för möjliga åtgärder" och "strategi" skilja sig från varandra.

En spelares strategi kallas optimal om den ger en given spelare med en multipel upprepning av spelet den maximala möjliga genomsnittliga vinsten eller minsta möjliga genomsnittliga förlust, oavsett vilka strategier motståndaren använder. Andra kriterier för optimalitet kan också användas.

Det är möjligt att strategin som ger maximal utdelning inte har ett annat viktigt koncept för optimalitet, såsom stabiliteten (jämvikten) hos lösningen. En spellösning är stabil (jämvikt) om strategierna som motsvarar denna lösning bildar en situation som ingen av spelarna är intresserad av att ändra på.

Vi upprepar att spelteorins uppgift är att hitta optimala strategier.

Klassificeringen av spel visas i fig. 1.1.

1. Beroende från typerna av rörelser spel är indelade i strategiska och hasardspel. Spelande spel består endast av slumpmässiga drag - spelteorin tar inte upp dem. Om det tillsammans med slumpmässiga drag finns personliga drag, eller alla drag är personliga, kallas sådana spel strategisk .

2. Beroende av antalet deltagare spel är indelade i dubblar och multiplar. I ångbadet antalet deltagare i spelet är två, i flera - mer än två.

3. Deltagare i ett spel med flera kan bilda koalitioner, både permanenta och tillfälliga. Naturen Relationen mellan spelarna i spelet är uppdelad i icke-koalition, koalition och kooperativ.

Koalitionsfri kallas spel där spelare inte har rätt att ingå avtal, bilda koalitioner, och målet för varje spelare är att få största möjliga individuella vinst.

Spel där spelarnas handlingar syftar till att maximera utdelningen av kollektiv (koalitioner) utan att deras efterföljande uppdelning mellan spelarna kallas koalition .

https://pandia.ru/text/78/553/images/image002_69.gif "width =" 509 "height =" 75 ">

https://pandia.ru/text/78/553/images/image006_35.gif "width =" 509 "height =" 108 ">

Ris. 1.1. Spelklassificering

Resultatet kooperativ spel är uppdelningen av koalitionens vinster, som inte uppstår som ett resultat av vissa handlingar från spelarna, utan som ett resultat av deras förutbestämda överenskommelser.

I enlighet med detta jämförs i kooperativa spel inte situationen i fråga om preferens, som fallet är i icke-kooperativa spel, utan divisionerna; och denna jämförelse är inte begränsad till övervägande av individuella vinster, utan är mer komplex till sin natur.

4. Med antalet strategier för varje spelare är spelen indelade i ändliga (antalet strategier för varje spelare är ändligt) och ändlös (uppsättningen strategier för varje spelare är oändlig).

5. Med mängden information tillgängliga för spelare i förhållande till tidigare drag, spel är uppdelade i spel med fullständig information (all information om tidigare drag finns) och ofullständig information ... Exempel på spel med fullständig information är schack, dam, etc.

6. Efter beskrivningstyp spel klassificeras i positionsspel (eller spel i utökad form) och spel i normal form. Positionell spel är satta i form av ett spelträd. Men alla positionsspel kan vändas till normal form , där varje spelare endast gör ett oberoende drag. I positionell I spel görs drag vid diskreta ögonblick i tiden. Existerar differentiell spel där drag görs kontinuerligt. Dessa spel studerar problemen med att förfölja ett kontrollerat objekt av ett annat kontrollerat objekt, med hänsyn till dynamiken i deras beteende, vilket beskrivs av differentialekvationer.

Det finns även reflekterande spel som tar hänsyn till situationer med hänsyn till den mentala reproduktionen av fiendens möjliga handlingssätt och beteende.

7. Om något möjligt spel av något spel har noll vinster f jag, https://pandia.ru/text/78/553/images/image009_21.gif "width =" 60 höjd = 45 "höjd =" 45 ">), sedan pratar de om spelet Noll summa ... Annars kallas spelen för spel med en summa som inte är noll .

Uppenbarligen är nollsummedubbelspelet antagonistisk , eftersom vinsten för en spelare är lika med förlusten för den andra, och därför är dessa spelares mål direkt motsatta.

Det sista nollsummans dubbla spelet kallas matris spel. Ett sådant spel beskrivs av en utdelningsmatris, där den första spelarens utdelning ställs in. Matrisens radnummer motsvarar numret på den tillämpade strategin för den första spelaren, kolumnen - till numret på den tillämpade strategin för den andra spelaren; i skärningspunkten mellan en rad och en kolumn är motsvarande vinst för den första spelaren (förlust för den andra spelaren).

Ett ändligt parspel med en summa som inte är noll kallas bimatris spel. Ett sådant spel beskrivs av två lönematriser, var och en för respektive spelare.

1.3. Exempel på spel

Spel 1. Test

Låt spelare 1 vara eleven som förbereder sig för provet och spelare 2 läraren som gör provet. Vi kommer att anta att eleven har två strategier: A1 - förbereda sig väl för provet; A2 - förbered inte. Läraren har också två strategier: B1 - att ge poäng; B2 - ingen kredit. Uppskattningen av värdena för spelarnas utdelning kan till exempel baseras på följande överväganden som återspeglas i utdelningsmatriserna

(uppskattad)

(allt är bra)

(var orättvist)

(lyckades fånga det)

(fick vad han förtjänade)

(låta sig luras)

(student kommer igen)

Studentvinster

Lärarförmåner

Detta spel, i enlighet med ovanstående klassificering, är strategiskt, dubbelt, koalitionsfritt, final, beskrivet i normal form, med en summa som inte är noll. Mer kortfattat kan detta spel kallas bimatrix.

Utmaningen är att bestämma de optimala strategierna för eleven och för läraren.

Spel 2. Morra

Spelet "morra" är ett spel med valfritt antal ansikten, där alla spelare samtidigt visar ("kastar") ett visst antal fingrar. Varje situation tillskrivs de vinster som spelarna i denna situation får från "banken". Till exempel vinner varje spelare antalet fingrar som visas för honom om alla andra spelare visar ett annat nummer; han vinner ingenting i alla andra fall. I enlighet med ovanstående klassificering är detta spel strategiskt; i det allmänna fallet, multipla (i det här fallet kan spelet vara icke-koalitionellt, koalitionellt och kooperativt) ändligt.

I det speciella fallet, när spelet är dubbel, kommer det att vara ett matrisspel (matrisspel är alltid antagonistiskt).

Låt två spelare "kasta" ett, två eller tre fingrar samtidigt. Om summan är jämn vinner den första spelaren, om summan är udda vinner den andra. Vinsten är lika med summan av kastade fingrar. Således, i det här fallet, har var och en av spelarna tre strategier, och matrisen för den första spelarens vinster (den andra spelarens förluster) har formen:

där en i- den första spelarens strategi att "kasta ut" i fingrar;

V j- strategin för den andra spelaren, som består i att "kasta ut" j fingrar.

Vad ska var och en av spelarna göra för att säkerställa att de får maximala vinster?

Spel 3. Slåss om marknaderna

Ett visst företag A, som har 5 konventionella monetära enheter till sitt förfogande, försöker behålla två lika stora försäljningsmarknader. Dess konkurrent (företag B), som har ett belopp som motsvarar 4 konventionella monetära enheter, försöker avsätta företag A från en av marknaderna. Var och en av konkurrenterna kan allokera ett helt antal enheter av sina fonder för att skydda och erövra respektive marknad. Man tror att om företag A allokerar mindre medel än företag B för att skydda åtminstone en av marknaderna, så förlorar det, och i alla andra fall vinner det. Låt vinsten för företag A vara lika med 1, och förlusten är lika med (-1), sedan reduceras spelet till ett matrisspel, för vilket matrisen av vinster för företag A (förluster för företag B) har form:

Här en i- strategin för företag A, som består i att lyfta fram i konventionella monetära enheter för att skydda den första marknaden; V j- strategin för företag B, som består i att lyfta fram j konventionella monetära enheter för att erövra den första marknaden.

Om företag kunde ägna valfri mängd tillgängliga medel för att försvara eller erövra marknader, skulle spelet vara oändligt.

TESTER

(B - Sant, N - Falskt)

1. Varje konfliktsituation är antagonistisk.

2. Varje antagonistisk situation är en konflikt.

4. Nackdelen med spelteorin är antagandet att motståndarna är helt rimliga.

5. Inom spelteorin antas det att inte alla motståndarens möjliga strategier är kända.

6. Spelteorin inkluderar riskelement som oundvikligen följer med intelligenta beslut i verkliga konflikter.

7. I spelteorin utförs att hitta den optimala strategin enligt många kriterier.

8. Strategispel består endast av personliga drag.

9. I ett dubbelspel är antalet strategier för varje deltagare lika med två.

10. Spel där spelarnas agerande syftar till att maximera utdelningen av koalitionerna utan att deras efterföljande uppdelning mellan spelarna kallas koalitionsspel.

11. Resultatet av det kooperativa spelet är uppdelningen av koalitionens vinster, som inte uppstår som ett resultat av vissa handlingar från spelarna, utan som ett resultat av deras förutbestämda överenskommelser.

12. Beroende på typen av beskrivning delas spel in i spel med fullständig information eller spel med ofullständig information.

13. Ett finita multipla nollsummespel kallas ett matrisspel.

14. Det sista nollsummespelet kallas ett bimatrisspel.

(Svar: 1-H; 2-B; 3-B; 4-B; 5-H; 6-H; 7-H; 8-H; 9-H; 10-B; 11-B; 12-H 13-H; 14-H.)

2. MATRIXSPEL

2.1. Beskrivning av matrisspelet

Det mest utvecklade inom spelteorin är ett nollsummespel med ändliga par (ett antagonistiskt spel med två personer eller två koalitioner) som kallas ett matrisspel.

Tänk på ett sådant här spel G, där två spelare deltar A och V med antagonistiska intressen: vinsten för en spelare är lika med förlusten för den andra. Sedan spelarens vinster A lika med spelarens utdelning V med motsatt tecken kan vi bara vara intresserade av att vinna a spelare A... Naturligtvis spelaren A vill maximera a och spelaren V- minimera a... För prostatan identifierar vi oss mentalt med en av spelarna (låt det vara spelaren A), så ringer vi spelaren V- "fiende" (naturligtvis några verkliga fördelar för A följer inte av detta).

Relaterade publikationer