• No se han encontrado resultados

Egyensúly a játékelméletben: egzisztencia és általánosítások

N/A
N/A
Protected

Academic year: 2021

Share "Egyensúly a játékelméletben: egzisztencia és általánosítások"

Copied!
164
0
0

Texto completo

(1)

Egyensúly a játékelméletben: egzisztencia és

általánosítások

AKADÉMIAI DOKTORI ÉRTEKEZÉS

Írta: Forgó Ferenc

Budapesti Corvinus Egyetem Közgazdaságtudományi Kar

(2)

Tartalomjegyzék

1. A Nash-egyensúlypont létezése 5

1.1. A Nash-egyensúlypont létezése konvexitás nélkül . . . 7

1.2. Cournot oligopólium nem konvex költségfüggvényekkel . . . 12

1.3. Kétfüggvényes minimax tételek . . . 23

2. A korrelált egyensúly és általánosításai 28 2.1. Deníció és interpretáció . . . 28

2.2. A gyenge és a puha korrelált egyensúly normál formában adott játé-kok esetében . . . 36

2.3. Puha korrelált egyensúly egyszer¶, két-kiszolgálós, nem-csökken®, li-neáris torlódási játékokban . . . 51

2.4. A gyenge és a puha korrelált egyensúly extenzív formában adott já-tékok esetében . . . 69

2.5. Részjáték tökéletes puha fa-korrelált egyensúly . . . 73

2.6. Optimalizálás a fa-korrelált egyensúlyok halmazán . . . 81

2.7. Egy alkalmazás . . . 85

3. Az L-Nash alkumegoldás 88 3.1. A Nash-alkumegoldás . . . 88

3.2. Az L-Nash alkumegoldás . . . 92

3.3. Az L-Nash alkumegoldás implementációja kétszemélyes alkujátékokban105 3.4. Az alkuprobléma és a többkritérimú döntések . . . 114

(3)

Függelék 126

A. Bizonyítások 127

A.1. Egy két-függvényes minimax tétel . . . 127 A.2. A puha korrelált egyensúly ereje négy-személyes, egyszer¶, két-kiszolgálós,

nem növekv® lineáris, torlódási játékokban . . . 138 A.3. Az L-Nash alkumegoldás Howard-féle implementációja . . . 142

B. Rövidítések jegyzéke 151

(4)

El®szó

Csaknem ötven éve foglalkozom játékelmélettel kisebb-nagyobb intenzitással. Az els® mérföldk® ezen az úton az els® magyar nyelv¶ játékelmélet könyv, amit mentorom-mal, Szép Jen®vel közösen írtunk, Szép és Forgó (1974) majd ezt két angol és egy német nyelv¶ játékelmélet könyv követte az id®k folyamán, Szép és Forgó (1983, 1985), Forgó et al (1999). Ezek, f®leg az utolsó, sok új kutatási eredményemet is tartalmazza, mégis inkább tankönyvek. A Budapesti Corvinus Egyetemen és jog-el®djein évtizedek óta vezetek játékelmélet kurzusokat, amelyek szintén inspiráltak arra, hogy a tudományos érdekl®désem a matematikai programozástól mindinkább a játékelmélet felé forduljon. Az utóbbi húsz évben már csak kifejezetten játékel-méleti, vagy ahhoz szorosan kapcsolódó témákban jelentek meg dolgozataim sokféle fórumon, amelyek közül, fontossági sorrend nélkül, megemlítem a European Journal of Operations Research, a Central European Operations Research, a Mathematical Social Sciences, a Journal of Global Optimization, az Archiv der Mathematik, az Acta Mathematica Hungarica, a Pure Mathematics and Applications és a Szigma folyóiratokat.

Ennek a disszertációnak, amely túlnyomó részt saját kutatási eredményeket tar-talmaz, speciális szerkezete van. Három f® fejezete egy-egy olyan új fogalom köré épül, amelyet különböz® munkáimban én vezettem be olyan területeken, amelyek a játékelméleti kutatások f® sodrába tartoznak. Az els® fejezet a Nash-egyensúlypont létezésével foglalkozik különböz® modellekben és feltételek mellett, különös tekin-tettel a sok egzisztencia tétel bizonyításában szerepet játszó CF-konvexitás, Forgó (1994) fogalmára. A második fejezetben a korrelált egyensúllyal és általánosításaival

(5)

foglalkozom különös tekintettel a "puha korrelált egyensúlyra", Forgó (2010). Ez, mint egyéb általánosítások is, els® sorban azt célozza, hogy minél nagyobb társadal-mi hasznosságot lehessen elérni egyensúlyban. A harmadik fejezet a Nash alkumeg-oldásból származtatott limit-Nash alkumegoldással, Forgó (1984), annak különböz® tulajdonságaival és implementációjával foglalkozik.

Minden fejezetben törekedtem a témához kapcsolódó új alkalmazást is bemu-tatni. Az els® fejezetben a Cournot oligopólium tiszta Nash-egyensúlypontjának lé-tezésére adok elégséges feltételeket nem lineáris keresleti függvény és nem konvex költségfüggvény esetében, Forgó (1995). A puha korrelált egyensúly alkalmazását részletesen bemutatom a torlódási játékok egy osztályára, Forgó (2014), valamint a klímatárgyalások egy játékelméleti modelljében, Forgó et al (2005). Nagy gyel-met szentelek a limit-Nash alkumegoldás alkalmazásának a többkritériumú döntési problémákban, Forgó és Szidarovszky (2003).

Köszönettel tartozom szerz®társaimnak, kollégáimnak, a diákoknak, az egyetemi játékelméleti szeminárium résztvev®inek, és utoljára, de els®sorban, családomnak a támogatásért és a türelemért.

(6)

Bevezetés

Mivel a három f® fejezet elején külön-külön van egy viszonylag hosszabb beveze-tés, itt csak amellett szeretnék érvelni, hogy miért tartozik a disszertációt alkotó három fejezet témája a játékelméleti kutatások f® sodrába. A klasszikus játékelmé-letnek három fontos kiindulópontja van (eltekintve, de nem lebecsülve von Neumann (1928) mérföldk®nek számító, a zérus-összeg¶ játékok speciális osztályára vonatkozó eredményét®l): von Neumann és Morgenstern (1944) monumentális m¶ve, amely a kooperatív játékok elméletét alapozta meg, Nash Nobel díjjal is jutalmazott deníci-ója és egzisztencia tétele, Nash (1950a, 1951) a nem-kooperativ játékok egyensúlyára vonatkozóan, valamint ugyancsak Nash (1950b, 1953) munkái, amelyek összekapcsol-ják a kooperatív és nem-kooperativ megközelítést. Ehhez a f® sodorhoz kapcsolódott az ugyancsak Nobel díjas Aumann (1974) a korrelált egyensúly fogalmának beveze-tésével.

A disszertáció a kooperatív játékok Neumann-Morgenstern megközelítésének ki-vételével ezekhez a kutatási irányokhoz csatlakozik, amint azt a három fejezetre tagolás jelzi is, és igyekszik saját kutatásaimon alapuló új eredményeket bemutatni. A dolgozathoz tartozik egy függelék (szintén három részb®l áll), amelyben a hosszabb bizonyítások találhatók. A disszertáció folyamatosan olvasható a függelék nélkül is. A deníciók, tételek, lemmák és példák számozása fejezetenként és a füg-gelék három részében folyamatos. Az értekezésben elnevezés szintjén nem tettem különbséget "tétel" (theorem) és "állítás" (proposition) között, noha sokan alkal-maznak ilyen gyakorlatot, felállítva egy olyan hierarchiát, amelyben "súlyban" egy tétel megel®z egy állítást. Van amikor ez egyértelm¶en eldönthet®, de sokszor nem.

(7)

Én mindenhol a "tétel" elnevezést használom és inkább a szövegben utalok arra, hogy milyen súlyú az állítás. Sok fogalomnak nincs magyar nyelv¶, a szakma ál-tal egységesen elfogadott megnevezése. Sokszor saját elnevezéseket kreáltam, illetve önkényesen választottam a verseng® lehetséges terminológia közül. Az olvasás meg-könnyítése céljából elég sok fogalom esetében az els® el®fordulás alkalmával zárójel-ben az angol elnevezést is megadtam. A kett®nél több szerz®s hivatkozásoknál csak az els® szerz®t említem annak megjelölésével, hogy társai is vannak. Az irodalom-jegyzékben minden adat pontosan szerepel. A disszertáció végén van a rövidítések jegyzéke.

A disszertáció megértéséhez a mesterszint¶ közgazdászképzésben elvárt analízis, valószín¶ségszámítás, lineáris algebra és optimumszámítás tudás b®ségesen elég. A matematikai általánosságban sehol nem megyek túl a véges dimenziós euklideszi terek nyújtotta lehet®ségeken, még az eredetileg általánosabb terekben megfogal-mazott állításokat is a speciális esetet jelent® véges dimenzióban fogalmazom meg és bizonyítom.

Az egyes szám els® személy használata csak az el®szóra és a bevezetésre kor-látozódik, a kés®bbiekben a tudományos m¶vekben megszokott többes szám els® személyt használom.

(8)

1. fejezet

A Nash-egyensúlypont létezése

A játékelméleti kutatások lassan száz éves történetében mind a mai napig látható az a törekvés, hogy a Nash-egyensúlypont(N EP), illetve ennek általánosításai és

no-mításai esetében lehet®leg minél gyengébb feltételek mellett bizonyítsák a vizsgált egyensúly létezését általában és speciálisan egyes konkrét játékosztályok esetében is. Nézzük meg, hogy az általános esetben melyek a f® irányok.

Egy G nem-kooperatív játékot normál formában a játékosok N = {1, . . . , n} halmazával, a stratégiahalmazaival és az kizet®függvényeivel szokás megadni a jól ismert G={S1, . . . , Sn;f1, . . . , fn} formában, ahol minden i∈N-re Si azi játékos

nem üres stratégiahalmaza,fi :→Ra kizet®függvénye, amely azS =S1× · · · ×Sn

stratégiaprol halmazon van értelmezve.

Természetesen G összetev®ir®l fel kell tételeznünk valamit, hogy bármilyen

eg-zisztencia tételhez jussunk (közismert a mondás, hogy ha valamir®l nem teszünk fel semmit, akkor nem is tudunk mondani róla semmit). Persze a feltételezéseknek olyanoknak kell lenni, amelyek bizonyos alkalmazásokban relevánsak, lehet®leg jól ellen®rizhet®ek és egyszer¶ek. Induljunk ki Nash (1950a, 1951) eredményéb®l.

Idézzük fel a jól ismert deníciót. Ehhez vezessük be a csonka stratégiaprol fo-galmát és a megfelel® jelölést. Minden stratégiaprolt felírhatunk az s = (si, s−i)

formában, ahol az s−i csonka stratégiaprol csak az si-t nem tartalmazza. Egy

(9)

egyen-l®tlenségek:

fi(s?i, s ?

−i)≥fi(si, s?−i)

minden si ∈ Si és i ∈ N esetén. Nash klasszikus eredménye (Nash, 1950a, 1951) a

következ®:

1.1. tétel. Véges játékok kevert b®vítésének mindig van N EP-je.

Itt az Si halmazok a lehetséges keverések (véges halmazon vett

valószín¶ségel-oszlások) halmazai, az fi függvények pedig a véges játékban vett kizetéseknek a

játékosok által egymástól függetlenül választott valószín¶ségeloszlásaival számított várható kizetését adják meg (egy multilineáris forma, vagyis minden játékos kize-tése a többiek által választott stratégiák rögzíkize-tése mellett a saját stratégia lineáris függvénye).

Már itt is látszik, hogy a további általánosítások kereteit mi határozza meg. Általánosítani lehet a stratégiahalmazokat (a stratégiahalmazok alakját, a teret, amelyben ezek a halmazok deniálva vannak), a kizet®függvények alakját, folyto-nosságát, simaságát, stb. Ebben a szellemben született az els® komoly általánosítás, a Nikaido-Isoda tétel (Nikaido és Isoda, 1955).

1.2. tétel. Ha minden i∈N-re

(i) az Si stratégiahalmazok véges dimenziós euklideszi terek konvex kompakt

rész-halmazai,

(ii) az fi függvények folytonosak az S stratégiaprol halmazon,

(iii) az fi(., s−i) függvények konkávok az Si stratégiahalmazon,

akkor a G játéknak van legalább egy N EP-je.

Világos, hogy Nash tétele speciális eset, hiszen az egységszimplexek konvex, kom-pakt halmazok és a multilineáris függvények folytonosak és konkávok a saját válto-zójukban a többi változó rögzítése esetén.

(10)

Friedman (1977) közölte a legáltalánosabbat azok közül a tételek közül, amelyek a konvexitás klasszikus fogalmát használják és a véges dimenziós euklideszi térben maradnak. Ez körülbelül az a pont, ahol a legtöbb tankönyv megáll.

1.3. tétel. Legyen G = {S1, . . . , Sn;f1, . . . , fn} egy nem-kooperatív játék, amely

eleget tesz az alábbi feltételeknek minden i∈N-re:

1. Si véges dimenziós euklideszi tér nem üres, konvex, kompakt részhalmaza,

2. fi felülr®l félig folytonos a stratégiaprolok S halmazán,

3. bármely rögzített si ∈ Si esetén az f(si,·) függvény alulról félig folytonos az

S−i csonka stratégiaprolok halmazán,

4. az fi(·, s−i) függvények kvázikonkávok az Si stratégiahalmazon.

Ekkor a G játéknak van legalább egy N EP-je.

1.1. A Nash-egyensúlypont létezése konvexitás

nél-kül

Az els® kísérlet ebben az irányban Nishimura és Friedman nevéhez f¶z®dik (Nishi-mura és Friedman, 1981). A feltételük, ami a kvázikonkávítást helyettesíti az 1.3. tételben azonban nagyon nehezen ellen®rízhet®. Mint láttuk, a függvények alaki és folytonossági tulajdonságai is általánosabbak az 1.3. tételben, mint az 1.2. tételben. Mi a következ®kben az alaki (konvexitási/konkávitási) tulajdonságok általánosítá-saival foglalkozunk. A legels®, a játékelméletben is felhasznált eredmény Ky Fan nevéhez f¶z®dik (Fan, 1952, 1953). Legel®ször deniáljuk a Fan-konkáv (F-konkáv)

függvényeket.

1.4. deníció (F-konkávitás). LegyenekX ésY tetsz®leges nem üres halmazok. Az f: X × Y → R függvényt F-konkávnak nevezzük az X halmazon az Y halmazra

(11)

vonatkozóan, ha bármely x1, x2 ∈ X ponthoz és λ ∈ [0,1] valós számhoz van olyan

x0 ∈X, hogy

f(x0, y)≥λf(x1, y) + (1−λ)f(x2, y) (1.1)

fennáll minden y∈Y-ra.

Vegyük észre, hogy az általánosság milyen magas szintjén mozgunk: jóformán semmit sem teszünk fel az X, Y halmazokról és az f függvényr®l is csak az (1.1)

egyenl®tlenség fennállását. Például, ha egy duopólium modellben X ésY a két

vál-lalat lehetséges termeléshalmaza (lehet pl. nem összefügg®, bizonyos volumenek nem lehetségesek), akkor csak azt követeljük meg, hogy ha az els® vállalat bármely kétx1,

x2termelési lehet®ségéhez tartozóf(x1, y),f(x2, y)protoknak legalább aλ,(1−λ)

-val súlyozott átlagát lehessen realizálni -valamelyx0 termelési lehet®séggel, nem kell

ennek feltétlenül a két termelési lehet®ségλx1+ (1−λ)x2 súlyozott átlagának lenni

(lehet, hogy az nem is lehetséges).

Ky Fan klasszikus eredménye a következ® (nem teljes általánosságában, mert mi az euklideszi térben maradunk).

1.5. tétel (Fan (1952)). Legyen G= {S1, S2;f1, f2} kétszemélyes zérus-összeg¶

já-ték, ahol azS1, S2 stratégiahalmazok zártak és korlátosak, azf1, f2 kizet®függvények

felülr®l félig folytonosak és f1 F-konkáv S1-en az S2-re vonatkozóan, f2 F-konkáv

S2-n az S1-re vonatkozóan. Ekkor a G játéknak van legalább egy N EP-je.

Hosszú ideig azt gondolták, hogy ezt az eredményt egyszer¶en át lehet vinni n

-személyes játékokra. Ez nem sikerült és kiderült az oka is: Joó (1986) konstruált egy olyan kétszemélyes nem zérusösszeg¶ játékot, ahol mindkét játékos stratégiahalmaza a [0,1] intervallum, a kizet®függvények folytonosak és F-konkávok de a játéknak

nincs N EP-je.

Forgó (1994) módosította az F-konkávitás denícióját (kicsit szigorított), ami

aztán lehet®vé tette a Fan-típusú egzisztencia tétel bizonyítását akárhány játékos esetére. Nézzük a módosított deníciót.

(12)

1.6. deníció (CF-konkávitás, folytonos F-konkávitás). Legyen X egy véges

di-menziós euklideszi tér nem üres részhalmaza,Y egy tetsz®leges nem üres halmaz. Az f: X×Y függvénytCF-konkávnak nevezzük azX halmazon azY halmazra

vonatko-zóan, ha van olyanψ: X×X×R→X folytonos függvény, hogy bármely x1, x2 ∈X

pontok és λ ∈[0,1] valós szám esetében

f(ψ(x1, x2, λ), y)≥λf(x1, y) + (1−λ)f(x2, y) (1.2)

fennáll minden y∈Y-ra.

Szükséges lesz ennek a deníciónak egy másik formájára is.

1.7. deníció (CF-konkávitás). Legyen X egy véges dimenziós euklideszi tér nem

üres részhalmaza, Y egy tetsz®leges nem üres halmaz. Az f: X×Y →R függvényt

CF-konkávnak nevezzük az X halmazon azY halmazra vonatkozóan, ha mindenk ≥

2-re van olyanψk: × j=k

j=1Xj×R→X folytonos függvény, hogy bármely x1, . . . , xk ∈

X pontok és 0≤λ1, . . . , λk ≤1. Pjj==1kλj = 1 valós számok esetében

f(ψk(x1, . . . , xk, λ1, . . . , λk), y)≥λ1f(x1, y) +. . .+λkf(xk, y)

fennáll minden y∈Y-ra.

A fenti két deníció ekvivalenciájának bizonyítása megtalálható Forgó (1994)-ben.

A N EP egzisztenciájának bizonyításához szükségünk lesz egy jól ismert

dení-cióra.

1.8. deníció. AG={S1, . . . , Sn;f1, . . . , fn} játékhoz tartozó aggregátor

függvény-nek nevezzük az A: S×S →R, A(s, t) = i=n X i=1 fi(si, t−i) (1.3) függvényt.

(13)

1.9. lemma (Nikaido és Isoda (1955)). Ha van olyan t∗ ∈S stratégiaprol, hogy

A(t∗, t∗)≥A(s, t∗) (1.4)

minden s∈S-re, akkor t∗ a G játék N EP-je.

1.10. tétel (Forgó (1994)). Ha

a) Si, i∈N véges dimenziós euklideszi tér nem üres, konvex, kompakt részhalmaza,

b) fi, i∈N folytonos függvény az S stratégiaprolok halmazán,

c) az A aggregátor függvény CF-konkáv S-en az S-re vonatkozóan,

akkor G-nek van N EP-je.

Bizonyítás. A bizonyítás a Nikaido-Isoda tétel (Nikaido és Isoda, 1955) bizonyításá-nak lépései mentén halad. Tegyük fel, indirekt bizonyítást alkalmazva, hogy G-nek

nincs N EP-je. Akkor az 1.9. lemma miatt minden t ∈S-hez van olyan s ∈S, hogy A(t, t)< A(s, t). Legyen

Hs ={t ∈S:A(t, t)< A(s, t)}, s∈S .

A Hs halmazok nyíltakS-ben és teljesen lefedik S-et

S = [

s∈S

Hs .

Mivel S zárt és korlátos, ezért aHs halmazok közül véges sok is lefedi S-et

S=

j=q

[

j=1

Hsj .

Deniáljuk minden j = 1, . . . , q-ra az aj: S→R és az a: S →R függvényeket

aj(t) = max{A(sj, t)−A(t, t),0}, t∈S a(t) = q P j=1 aj(t)>0, t ∈S .

(14)

Tekintsük S-nek a következ® önmagára való folytonos leképezését t→t0 = ψq s1, . . . , sq, a1(t) a(t), . . . , aq(t) a(t) ,

ahol ψq az 1.7. denícióban szerepl® folytonos függvény. A c) feltételezés és az 1.7.

deníció miatt A(t0, t)≥ q X j=1 aj(t) a(t)A(sj, t)

fennáll mindent ∈S-re.

Az A, a1, . . . , aq, a, ψq függvények valamennyien folytonosak, ezért a t →t0

leké-pezésnek a Brouwer-xponttétel, (Brouwer, 1912) szerint van xpontja. Legyen t∗

egy xpont. Ekkor t∗ =t∗0 és így

A(t∗, t∗)≥ q X j=1 aj(t∗) a(t∗)A(sj, t ∗ ) . (1.5)

Az indirekt feltevés miatt van legalább egy sj, amelyre A(t∗, t∗) < A(sj, t∗), és

haA(t∗, t∗)≥A(sj, t∗), akkor aj(t) = 0. Így q X j=1 aj(t∗) a(t∗)A(sj, t ∗ )> q X j=1 aj(t∗) a(t∗)A(t ∗ , t∗) = A(t∗, t∗),

ami ellentmond (1.5)-nek.

A CF-konkávitás deníciójától inspirálva, az 1.10. tétel különböz® irányokban

való általánosításaiként további egzisztencia tételek születtek az évek folyamán. Csak azokból, amelyekben expliciten a CF-konkávitást jelölik meg, mint egyik

kiinduló-pontot, megemlítjük a következ® független munkákat: Kim és Kum (2005), Kim és Lee (2002), Kim és Lee (2007), Hou (2009), Cheng (2010), Kim (2011) cikkeket és Cambini és Martein (2009) könyvét.

Az általánosítás egyik iránya, amikor az euklideszi tereknél általánosabb terekben deniálunk konvex halmazokat és függvényeket. Forgó és Joó (1999) munkájában 13 xpont és játékelméleti egzisztencia tétel szerepel teljesen egyéni terekben (un.

(15)

pszeudokonvex terekben), amelyeknek deníciójában jól látható a CF-konkávítás,

mint kiinduló pont. Ezeknek az ismertetése kívül esne azon a határon, amelyet az euklideszi térnél húztunk meg.

Az eddigiekb®l is világos volt, de most két példán is megmutatjuk, hogy nem kell az euklideszi teret elhagyni ahhoz, hogy olyan játékok N EP-jének létezését tudjuk

bizonyítani, ahol a klasszikus konvexitási/konkávitási feltételek nem teljesülnek. 1.11. példa. LegyenG={X, Y, f, g},X =Y = [−1,1], f(x, y) =x2y+x,g(x, y) =

−x2y2+y. Látható, hogyf(·,1)nem kvázikonkáv és ezért az 1.3. tételt nem tudjuk

használni. Az A: (X×Y)×(X×Y)→R aggregátor függvény ebben az esetben

A(x, y, u, v) =f(x, v) +g(u, y) = x2v+x−u2y2+y .

Legyen a ψ függvény a következ®:

ψ(x1, x2, y1, y2, λ) =   p λx21+ (1−λ)x22 p λy2 1 + (1−λ)y22   .

Elemi (de kicsit hosszadalmas) számolással igazolható, hogy az A aggregátor

függvényCF-konkáv az X×Y halmazon az X×Y-ra vonatkozóan, így G-nek van N EP-je. Valóban, azx=−1

2, y = 1egyN EP. Megjegyezzük, hogy ennél a játéknál

Nishimura és Friedman (1981) feltétele nem teljesül.

1.2. Cournot oligopólium nem konvex

költségfüggvé-nyekkel

A klasszikus Cournot modell jólismert. Egy iparágban, ahol n vállalat termel egy

homogén termékfajtát (a fogyasztókat vásárlásaikkor nem érdekli, hogy a termé-ket melyik vállalat termelte), a vállalatok egymástól függetlenül hozzák meg vo-lumendöntéseiket, vagyis az i vállalat választ egy xi termelési szintet, xi ∈ [0,1],

(16)

szintjeiket a [0,1] intervallumra normalizáltuk az egyszer¶ség kedvéért. Adott egy

P: [0, n]→ R árfüggvény (inverz keresleti függvény), amely az iparág q = Pi=n

i=1 xi

teljes termeléséhez azt a legnagyobb árat rendeli, amelyen a piac kitisztul, vagy-is a fogyasztók az egész q mennyiséget megvásárolják. Szintén adott az i vállalat Ci: [0,1]→R,i= 1, . . . , nköltségfüggvénye, amely azxi termelési szinthez aCi(xi)

költséget rendeli. Költség szempontból a vállalatok különböz®k lehetnek. Ezekb®l az elemekb®l tev®dik össze az i vállalat fi: [0,1]n → R protfüggvénye (költséggel

csökkentett árbevétel) fi(x1, . . . , xn) =xiP xi+ X j6=i xj ! −Ci(xi), xi ∈[0,1], i= 1, . . . , n .

Bevezetve az Si = [0,1], i = 1, . . . , n jelölést, az Si termelési halmazok és az

fi protfüggvények, i = 1, ..., n a G = {S1, . . . , Sn;f1, . . . , fn} oligopólium játékot

határozzák meg. Jelöljük a játékosok (vállalatok) halmazát N = {1, . . . , n}-el. A különböz® közgazdasági alkalmazásokban fontos kérdés, hogy a G oligopólium

já-téknak van-e egyensúlypontja a tiszta stratégiák halmazán. A klasszikus eredmény a következ®:

1.12. tétel (Friedman (1977)). Ha a P árfüggvény konkáv a [0, n] intervallumon,

a Ci költségfüggvények minden i∈ N-re konvexek a [0,1] intervallumon, akkor a G

oligopólium játéknak van egyensúlypontja a tiszta stratégiák halmazán.

Ennél általánosabb eredményekhez juthatunk, ha gyelmünket azokra az oligo-pólium játékokra koncentráljuk, amelyek az u.n. potenciál játékok közé tartoznak. 1.13. deníció (Monderer és Shapley (1996). Legyen N = {1, . . . , n} a játékosok halmaza, és H = {T1, . . . , Tn;g1, . . . , gn} egy játék normál formában. A H játékot

ordinális potenciál játéknak nevezzük, ha van olyan Π : T → R függvény, ahol T =

T1 ×. . .×Tn a stratégiaprolok halmaza, hogy minden i ∈ N, és t−i ∈ T−i csonka

(17)

gi(ti, t−i)−gi(ri, t−i)>0⇔Π(ti, t−i)−Π(ri, t−i)>0 .

Π-t ordinális potenciál függvénynek nevezzük. A potenciál függvény általában

nem egyértelm¶.

Az 1.13. deníció egyenes következményei:

1. A H ={T1, . . . , Tn;g1, . . . , gn} és a H0 ={T1, . . . , Tn; Π, . . . ,Π} játékok

stra-tégiailag ekvivalensek. AH0 játék tulajdonképpen egy u.n. koordinációs játék,

a játékosoknak közös céljaik vannak, amit a Π potenciál függvény fejez ki, a

probléma csak a Π függvényt maximalizáló termelési prol realizálása.

2. Ha a Π ordinális potenciál függvénynek van maximuma T-n, akkor minden

maximumpont egyN EP.

3. Minden véges ordinális potenciál játéknak van N EP-je.

Tekintsük aGoligopólium játékot azzal a további megkötéssel, hogy a vállalatok

csak pozitív mennyiséget termelhetnek és minden vállalat költségfüggvénye lineáris, egységesencmarginális költséggel. Könny¶ belátni, hogy ekkor aGoligopólium játék

ordinális potenciál játék a Π : R++→R, Π(x1, . . . , xn) = x1· · ·xn(Π(x)−c)

poten-ciál függvénnyel. Ha van olyan termelési volumen prol, amelyben minden vállalat pozitív mennyiséget termel és a kialakult ár nagyobb a marginális költségnél (ezt minden "normális" iparágban nyugodtan fel lehet tenni), akkor a 2. következmény értelmében van a tiszta stratégiák halmazán N EP. Hangsúlyozni kell, hogy a P

árfüggvény akármilyen lehet, még monoton csökken®nek sem kell lenni, megengedve akár a Gien hatást is, Varian (1992). A költségfüggvényre viszont szigorú kikötés van.

A fordított helyzet is kedvez® a N EP egzisztenciája szempontjából.

Tegyük most fel, hogy a Goligopólium játékban, az árfüggvény lineáris: P(x) =

a−bx, a, b >0, a Ci(xi) költségfüggvények tetsz®legesek,i∈N. Legyen a potenciál

függvényΠ : Rn

(18)

Π(x1, . . . , xn) = a j=n X j=1 xj −b j=n X j=1 x2j −b X 1≤k<j≤n xkxj − j=n X j=1 Cj(xj) .

Nem nehéz igazolni, hogy a G oligopólium játék ordinális potenciál játék a Π

potenciál függvénnyel (s®t, egy egzakt potenciál-játék, ami a mi szempontunkból most nem lényeges).

Láthatjuk, hogy itt az árfüggvényre van szigorú megkötés (linearitás), míg a költ-ségfüggvények bármilyenek lehetnek. Ezért, ha olyan esetet keresünk, amikor nincs a tiszta stratégiák halmazán N EP, akkor nemlineáris árfüggvénnyel és nemlineáris

vagy lineáris, de nem azonos költségfüggvényekkel kell próbálkoznunk.

A következ®kben elégséges feltételeket adunk a Ci költségfügvényekre, amelyek

teljesülése esetén bizonyos monoton csökken®, szigorúan konkáv árfüggvény esetén is van a tiszta stratégiák halmazán N EP. A célcsoport a költségfüggvények egy

olyan osztálya, amely a legtöbb iparágban inkább mondható tipikusnak, mint a konvex költség függvény. A termelés felfutásával a költségek egy pontig (az optimális kapacitáskihasználásig) csökken® ütemben n®nek, majd ezen túl növekv® ütemben. Annak jelent®ségére, hogy az oligopólium modellekben preferáljuk a tisztaN EP-et,

mások mellett Tasnádi (2011) mutat rá.

Foglaljuk össze az árfüggvényre és a költségfüggvényekre tett feltételeinket. A P árfüggvény ki kell elégítse az alábbi feltételeket:

a) P kétszer folytonosan dierenciálható egy nyilt intervallumon, amely tartalmazza

a [0, n] intervallumot, aP értelmezési tartományát.

b) P(x)>0 mindenx∈[0, n]-re, vagyis a vállalatok termelési korlátai olyan

szoro-sak, hogy még akkor is, ha mindenki teljes kapacitáson termel, az össztermelést pozitív áron el lehet adni.

c) P0(x)<0 mindenx∈[0, n]-re, vagyis P szigorúan monoton csökken®.

(19)

e) P00monoton csökken® a [0, n]intervallumon, vagyis az árak csökkenésének

"gyor-sulása" csökken az összkínálat növekedésével.

Azivállalat költségfüggvénye ki kell elégítse az alábbi feltételeket mindeni∈N

-re:

1. Ci kétszer folytonosan dierenciálható egy nyilt intervallumon, amely

tartal-mazza a [0,1]intervallumot, a Ci értelmezési tartományát.

2. Ci(xi)≥0 mindenxi ∈[0,1]-re.

3. Ci0(xi)>0 minden xi ∈ [0,1]-re, tehát a költségek monoton n®nek a termelés

növekedésével.

4. Van egy olyan ui ∈(0,1)inexiós pont, hogy Ci konkáv a [0, ui) és konvex az

(ui,1] intervallumon.

5. Ci00(0) < 0 és Ci00 szigorúan monoton növekv® a [0,1] intervallumon, vagyis a

költségek növekedésének a gyorsulása n® a termelés növekedésével.

Egy egyszer¶ példa a fenti feltételeket kielégít® költségfüggvényre a Ci(xi) =

(xi−12)3+ 18 függvény.

A felesleges indexezés elkerülése érdekében vezessük be a következ® jelöléseket

x=xi, t=

X

j6=i

xj ésϕi(x, t) =xP(x+t)−Ci(x) .

A ϕi(x, t) tulajdonképpen az i-ik vállalat protja, ha a saját termelésex a

töb-bieké pedig összesen t. A következ®kben nem írjuk ki, de minden deriváltat az x

helyen veszünk.

Hasznos lesz a következ® segédtétel.

1.14. lemma. A P és Ci függvényekre tett feltételek mellett a ϕi függvény ϕ0i

(20)

Bizonyítás. Egyszer¶ deriválással kapjuk, hogy

ϕ0i(x, t) =xP0(x+t) +P(x+t)−Ci0(x),

és mivel P konkáv, −Ci0 szigorúan konkáv, csak azt kell bizonyítani, hogy h(x) =

xP0(x+t) konkáv a [0,1] intervallumon. Ennek a függvénynek a deriváltja P0(x+

t) +xP00(x+t),amely csökken® P konkávitása és xnem negativitása miatt, ami azt

jelenti, hogy ϕ0i szigorúan konkáv.

Az 1.14. lemma alkalmazásával tudjuk bizonyítani a következ® tételt.

1.15. tétel (Forgó (1995)). Ha 2P0(0) ≤ Ci00(0) fennáll minden i ∈ N-re, akkor a G oligopólium játéknak van legalább egy N EP-je.

Bizonyítás. Vegyük a ϕi protfüggvény második deriváltját

ϕ00i(x, t) = 2P0(x+t) +xP00(x+t)−Ci00(x),

és végezzük el az x= 0 helyettesítést

ϕ00i(0, t) = 2P0(0 +t) −Ci00(0) .

Mivel P0 monoton csökken®, 2P0(0) ≤ Ci00(0)-b®l következik ϕ00i(0, t) ≤ 0. Az 1.14.

lemma miatt ϕ0i konkáv és ezértϕ00i csökken®. Ebb®l következik ϕ00i(x, t)≤ϕ00i(0, t)≤0

mindenx∈[0,1]-re. Ezért ϕi konkáv, tehátGegy olyan játék, amelyre az 1.2. tétel

feltételei fennállnak és így van legalább egyN EP-je.

Az 1.15. tétel feltétele azt jelenti, hogy az árfüggvény gyorsabban csökken 0

termelés esetében, mint a költségnövekés gyorsulásának a fele.

Más elégséges feltételek mellett is bizonyítható a N EP egzisztenciája aG

oligo-pólium játékra. Ehhez szükséges lesz a következ® tételre, amely egyenes következ-ménye egy jól ismert egzisztencia tételnek (Theorem 3.1, Forgó et al (1999)).

(21)

1.16. tétel. Ha a ϕi(x, t) protfüggvénynek csak egyetlen maximumpontja van a

[0,1]intervallumon at∈[0, n−1]paraméter bármely értékére, akkor aGoligopólium

játéknak van legalább egy N EP-je.

Két lemma lesz segítségünkre a továbbiakban.

1.17. lemma. Ha ϕ0i(0, t)>0 valamely t-re, akkor a ϕi(·, t) függvénynek pontosan

egy maximumpontja van a [0,1] intervallumon.

Bizonyítás. Haϕ0i(0, t)>0ésϕ0i konkáv, akkor minden olyan0< x≤1-re, amelyre

fennáll a ϕ0i(x, t) = 0 egyenl®ség, az alábbi egyenl®tlenség teljesül 0< ϕ0i(0, t)≤ϕ0i(x, t)−xϕ00i(x, t) =−xϕ00i(x, t) ,

amib®l ϕ00i(x, t) < 0 jön. Ebb®l a tényb®l és az 1.14. lemmából következik, hogy

a K = {x ∈ [0,1] : ϕ0i(x, t) = 0} kritikus pontok halmazának legfeljebb egy eleme van. Ha K =, akkor felhasználva a 0< ϕ0i(0, t) egyenl®tlenséget azt kapjuk, hogy

ϕ0i(x, t) >0 mindenx ∈ [0,1]-re, amib®l az következik, hogy a ϕi(·, t) függvénynek

az x = 1 pontban van az egyetlen maximumpontja. Ha viszont K = {x0}, akkor

x=x0 az egyetlen maximumpont.

1.18. lemma. Ha a ϕi(·, t)függvénynek több, mint egy globális maximumpontja van

a [0,1] intervallumon, akkor

Ci(1)−Ci(0)−Ci0(0)−P

0

(0)≤0 . (1.6)

Bizonyítás. Azt az esetet, amikor a ϕi(·, t) függvény szigorúan monoton, nem kell

vizsgálni, mert akkor csak egy maximumpont van. Továbbá, az 1.17. lemma miatt csak azokat a t-ket kell tekintenünk, amelyekre ϕ0i(0, t)≤0, amib®l aztán a

P(t)−C0(0)≤0 (1.7)

(22)

Most azt látjuk be, hogy ha ϕi(·, t)-nak két maximumpontja van a [0,1]

in-tervallumon, akkor ezek csak az intervallum végpontjai lehetnek. Indirekt érvelést alkalmazva, tegyük fel, hogy x1 és x2 két különböz® maximumpont és legalább az

egyik nem végpont. Feltehetjük, mondjuk, hogy0< x1 < x2 1. Emiatt van olyan

x3 pont, hogy x1 < x3 < x2 és x3 lokális minimumpont. Így

ϕ00i(x1, t) = 2P0(x1+t) +x1P00(x1+t)−Ci00(x1)≤0 ,

és

ϕ00i(x3, t) = 2P0(x3+t) +x3P00(x3+t)−Ci00(x3)≥0 ,

ami ellentmond a d), e) és az 5. feltételeknek. Tehátϕi(0, t) = ϕi(1, t), amib®l kapjuk

a

P(1 +t) = Ci(1)−Ci(0) (1.8)

egyenl®séget. Mivel a P árfüggvény konkáv, ezért P(t) +P0(t) ≥ P(1 +t), amib®l

gyelembe véve, hogyP0(t)< P0(0), az (1.7) és az (1.8) egyenl®ség fennállnak. Ebb®l

közvetlenül adódik a lemma állítása.

A következ® tétel a nulla összkínálat melletti határár és határköltségek viszonya alapján ad meg egy elégséges feltételt a N EP létezésére.

1.19. tétel (Forgó (1995)). Ha Ci0(0)≤ −P0(0) minden i∈N-re, akkor a G

oligo-pólium játéknak van legalább egy N EP-je.

Bizonyítás. Mivel minden költségfüggvény monoton növekv®, ezért Ci(1)−Ci(0)>

0. Így a −Ci0(0) −P0(0) ≥ 0 egyenl®tlenségb®l következik, hogy (1.6) nem állhat

fenn, ami viszont az 1.18. lemma miatt szükséges ahhoz, hogy ϕi(·, t)-nek több

ma-ximumpontja legyen. Így az 1.16. tétel szerint aGoligopólium játéknak van legalább

(23)

Egy másik elégséges feltételt kapunk, ha a költségfüggvények inexiós pontjának elhelyezkedését korlátozzuk.

1.20. tétel (Forgó (1995)). Ha minden i∈N -re az ui inexiós pontra fennáll az

ui <

P0(0)

C00(0) (1.9)

egyenl®tlenség, akkor a G oligopólium játéknak van legalább egy N EP-je.

Bizonyítás. Az (1.6) egyenl®tlenséget, amely szükséges ahhoz, hogy a ϕi(·, t)-nek

több maximumpontja legyen, átrendezhetjük a következ® módon

Ci(1)−Ci(ui) +Ci(ui)−Ci(0)−Ci0(0)−P

0

(0)≤0 . (1.10)

Mivel Ci konkáv a[0, ui)intervallumon és konvex az (ui,1]intervallumon, ezért

Ci(1)−Ci(ui) ≥ (1−ui)Ci0(ui)

Ci(ui)−Ci(0) ≥ uiCi0(ui).

Ezeket az egyenl®tlenségeket felhasználva kapjuk (1.10)-b®l az alábbi egyenl®tlensé-get

Ci0(ui)−Ci0(0)−P

0

(0) ≤0. (1.11)

A Lagrange középérték tételb®l következik, hogy

uiCi00(ξ)−P

0

(0) ≤0

valamely 0≤ξ≤ui értékre. A Ci00 monotonitása miatt ebb®l az

uiCi00(0)−P

0

(0)≤0

egyenl®tlenség adódik, ami ellentmond (1.9)-nek. Az 1.18. lemma az állítja, hogy ekkor a ϕi(·, t)-nek csak egy maximumpontja van és így az 1.16. tétel szerint a G

(24)

Ezeknek az elégségességi tételeknek érdekes következménye van a költségfüggvény alakjára. Az 1.20. tétel következménye, hogy ha minden i ∈ N-re 2P0(0) > Ci00(0),

akkor ha a költségfüggvény konkáv része nem terjed túl a termelési kapacitás felén, aG oligopólium játéknak van legalább egy N EP-je.

Ha minden i ∈ N -re 2P0(0) ≤ Ci00(0), akkor az 1.15. tétel biztosítja a N EP

létezését. Nem tudunk semmit mondani arról, ha bizonyos vállalatok esetén az egyik irányú, mások esetében pedig a másik irányú egyenl®tlenség áll fenn. Ez persze nem fordulhat el® a szimmetrikus esetben, vagyis, ha minden vállalatnak ugyanaz a költségfüggvénye. AN EP létezése szempontjából ekkor csak úgy lehet baj, ha az

inexiós pont az (12,1]intervallumba esik.

A vállalatok a termelési lehet®ségeiket tekintve szimmetrikusak. Ez teszi lehe-t®vé, hogy adjunk egy olyan elégséges feltételt, amely az iparágat alkotó vállalatok számára vonatkozik.

1.21. tétel (Forgó (1995)). Ha P(1) > Ci0(0) minden i ∈ N-re, akkor van olyan n0 ≥2vállalatszám, hogy aGoligopólium játéknak van legalább egy N EP-je minden 2≤n≤n0 esetében.

Bizonyítás. Figyelembe véve, hogy a P árfüggvény és a P−1 keresleti függvény is

monoton, könny¶ látni, hogy ha

n < P−1(Ci0(0)) + 1 , (1.12)

akkor (1.7) nem állhat fenn és ezért aϕi(·, t)protfüggvénynek csak egy maximuma

van, amib®l az 1.16. tétel szerint következik, hogy van legalább egyN EP. Az (1.12)

egyenl®tlenségnek csak akkor van értelme, ha

P−1(Ci0(0)) >1 ,

ami ekvivalens a tételben megfogalmazott feltétellel. Azn0 küszöbszám létezését az

(25)

A feltétel szavakban azt jelenti, hogy ha az iparág teljes termelését egy vállalat adja, akkor az ár legyen nagyobb, mint 0 termelésnél a határköltség. Általános

ta-nulságként megállapíthatjuk, hogy még nemlineáris árfüggvény esetén sem szükséges a N EP létezéséhez a költségek konvexitása, igen széles költségfüggyvény osztályok

is "kellemesek" ebb®l a szempontból.

Valamiért azért kitüntetett szerep jut a konvex költségfüggvényeknek. Ezt világít-ja meg az alábbi tétel. Csak azn= 2 esettel (duopóliomakkal) foglalkozunk. A

mo-dell lényegében változatlan, azzal a kivétellel, hogy általános árbevétel függvénnyel számolunk, az árbevétel nem feltétlenül mennyiségszer egységár, akár mennyiségi diszkontár is megengedett. Tehát az (általánosított) G duopólium játék

G={[0,1],[0,1];f1, f2}

fi(x1, x2) =Ri(x1, x2)−Ci(xi), xi ∈[0,1] , i= 1,2,

aholRi: [0,1]2 →Raz árbevétel (revenue) függvény,Cia költségfüggvény.Ri(x1, x2)

az árbevétel, amit az i vállalat ér el akkor, ha a vállalatok termelése (x1, x2). Az

alábbi tétel egy szükséges feltételt ad a költségfüggvény alakjára.

1.22. tétel (Forgó (1995)). Ha a G duopólium játéknak minden konkáv árbevétel

függvény mellett van N EP-je, akkor a költségfüggvény konvex

Ez a tétel Joó (1986) egy kevéssé ismert tételének a következménye.

1.23. tétel (Joó (1986)). LegyenekI1,I2 azRzárt intervallumai,f1, f2: I1×I2 →R

folytonos függvények. Ha bármely g1, g2: I1×I2 →R folytonos függvényre, amelyek

közül g1 az els® változójában, g2 a második változójában konkáv, miközben a másik

változót rögzítjük, a

G={I1, . . . , I2;f1+g1,f2+g2}

játéknak vanN EP-je, akkor f1 az els® változójában, f2 a második változójában

(26)

Valóban, hafi =−Ci, gi =Ri i= 1,2, akkor az 1.23. tételb®l azonnal következik

az 1.22. tétel állítása. Itt a Ci költségfüggvények akár a másik vállalat termelési

volumenét®l is függhetnének, nem csak a sajátjuktól. Ekkor azt lehetne állítani, hogy az 1.23. tétel feltételei mellett a vállalatok költségfüggvénye konvex a másik vállalat termelését rögzítettnek véve. Nyitott kérdés, hogy ez a tétel kiterjeszthet®-e oligopóliumokra és/vagy "mennyiség× egységár" típusú árbevétel függvényekre. A kritikus lépés Joó tételének általánosítása lenne kett®nél több játékosra, ami azonban nem t¶nik könny¶nek.

1.3. Kétfüggvényes minimax tételek

A játékelmélet els® komoly eredménye Neumann János nevéhez f¶z®dik. Úttör® mun-kájában, von Neumann (1928) egy egyensúlyi egzisztencia tételt bizonyított kétsze-mélyes zérus-összeg¶ játékokra. A játékosztály, amire ez vonatkozik tartalmazza a mátrixjátékokat (véges, kétszemélyes zérusöszeg¶ játékok kevert b®vítése), amely a Nash által vizsgált véges játékok kevert b®vítésének is speciális esete. Ez az egzisz-tencia tétel egy minimax tétel formájában is felírható. Nézzük ezt a problémát egy kicsit általánosabban.

LegyenekX,Y nem üres halmazok ésf: X×Y →Regy valós érték¶ függvény. Nagyon könny¶ igazolni, hogy

sup

X

inf

Y f ≤infY supX f . (1.13)

Az igazán érdekes kérdés, hogy milyen feltételeket kell tenni azX,Y halmazokra

és az f függvényre, hogy (1.13)-ban az egyenl®tlenséget egyenl®ségre cserélhessük.

Neumann Jánossal kezd®d®en óriási mennyiség¶ dolgozat foglalkozott a témával. Az így keletkezett tételeket (egyfüggvényes) minimax tételeknek nevezik. Ezeknek a tételeknek nagyon sok alkalmazása van az optimumszámításban, döntéselméletben, játékelméletben, statisztikában és még sok más területen. Simons (1995) cikke kiváló áttekintést ad a témakörr®l.

(27)

Az egyfüggvényes minimax tételek egy érdekes általánosítása a következ®. Ve-zessünk be egy másik g: X×Y →Rfüggvényt és tegyük fel, hogy f ≤g. A kérdés

az, hogy milyen feltételek mellett áll fenn a következ® egyenl®tlenség:

inf

Y supX f ≤supX infY g . (1.14)

Világos, hogy haf =g és (1.14) teljesül, akkor (1.13)-ban egyenl®ség van. Mivel

(1.14)-ben két függvény szerepel, ezért azokat a tételeket, amelyek az X, Y, f, g

-re tett bizonyos feltételek mellett az (1.14) egyenl®tlenség fennállását mondják ki, kétfüggvényes minimax tételeknek nevezik.

Hogyan lehet alkalmazni a kétfüggvényes minimax tételeket a játékelméletben? Ennek egy egyszer¶ módja, Forgó (1999) a következ®. Legyen a G egy n-személyes

játék normál formában:

G:={S1, . . . , Sn, f1, . . . , fn}.

Jelöljük a stratégiaprolok halmazát S := Qn

i=1Si-el és deniáljuk az A: S2 → R

aggregátor függvényt a szokásos módon

A(x, y) := f1(x1, y2, . . . , yn) +. . .+fn(y1, . . . , yn−1, xn) , x, y ∈S .

Az 1.9. lemma szerint annak a szükséges és elégséges feltétele, hogy y∗ ∈S a G

egy N EP-je legyen az, hogy a

A(x, y∗)≤A(y∗, y∗)

egyenl®tlenség fennálljon mindenx∈S-re.

Tegyük fel, hogy van egy olyan B: S2

R függvény, amely kielégíti a

A(x, y) +B(y, x)≤A(y, y) +B(x, x) (1.15)

(28)

Deniáljuk az f, g:S2

R függvényeket a következ® képpen

f(x, y) := A(x, y)−A(y, y) ,

és

g(x, y) :=B(x, x)−B(y, x) .

(1.15) miatt azf ≤gegyenl®tlenség fennállS2-en. Tegyük fel, hogy az alábbi típusú

kétfüggvényes minimax egyenl®tlenség teljesül, vagyis

min

y∈S supxSf(x, y)≤supxSyinf∈Sg(x, y) . (1.16)

Ekkor van olyan y∗ ∈S, hogy

A(x, y∗)≤A(y∗, y∗) (1.17)

fennáll minden x∈S-re, vagyisy∗ aG egyN EP-je. Ez azért van, mert g(x, x) = 0

mindenx∈S-re és így

sup

x∈S

inf

y∈Sg(x, y)≤0,

amib®l az következik, hogy van olyan y∗ ∈S, hogy

sup

x∈S

f(x, y)≤0 ,

ami (1.17)-tel ekvivalens.

Íly módon a kétfüggvényes minimax tételeket potenciálisan fel lehet használni játékelméleti egzisztencia tételek bizonyítására. Többféle technika van kétfüggvényes minimax tételek bizonyítására. Mint szinte mindenütt a matematikában (és más tudományágakban is) szeretjük az elemi bizonyításokat. Ezekre itt is van lehet®ség. Persze az elemi bizonyítás nem jelenti azt, hogy egyszer¶, vagy rövid, hanem azt, hogy csak elemi eszközöket használunk a bizonyításhoz. Erre jó példa a következ® tétel.

(29)

A tétel megfogalmazásához szükségünk van az "átlagoló függvény" deníciójára. Egy ρ: R2 → R folytonos függvényt átlagoló függvénynek (averaging function) nevezünk, ha mindkét változójában növekv®, valamint

ρ(λ, λ) = λ ,

és

λ 6=µ⇒min{λ, µ}< ρ(λ, µ)<max{λ, µ} .

Könny¶ látni, hogy pl. a súlyozott számtani átlag függvény eleget tesz a fenti feltételeknek.

1.24. tétel. (Forgó és Joó (1998)) Legyenek ρ1 és ρ2 átlagoló függvények, X és Y

nem üres halmazok, f, g: X ×Y → R, olyan függvények, amelyekre fennállnak a következ® feltételek:

(i) f ≤g, f korlátos,

(ii) bármely x1, x2 ∈X-höz található olyan x3 ∈X, hogy

y∈Y ⇒f(x3, y)≥ρ1(f(x1, y), g(x2, y)) ,

(iii) bármely y1, y2 ∈Y-hoz található olyan y3 ∈Y, hogy

x∈X ⇒g(x, y3)≤ρ2(f(x, y1), g(x, y2)) .

Ekkor minden F ⊂X véges halmazra fennáll

inf

(30)

A bizonyítás a hosszúsága miatt a függelékben található.

Ezt a tételt az évek folyamán többen általánosították, Forgó (2001), Cheng és Lin (2001), Cheng és Lin (2003), Cheng (2004), Cheng (2010), Jin et al (2006), Tang és Cheng (2008), de az általánosabb feltételek némelyike már "elég mesterkélt" lett, szemben az átlagoló függvény természetességével.

(31)

2. fejezet

A korrelált egyensúly és

általánosításai

2.1. Deníció és interpretáció

A Nash-egyensúly egy fontos általánosításához vezet, ha a kevert stratégia fogal-mát tágabban értelmezzük. Legyen N = {1, . . . , n} a játékosok halmaza és G =

{S1, . . . , Sn;f1, . . . , fn} egy véges játék. Amikor Gkevert b®vítésér®l beszélünk,

ak-kor legalábbis a leggyaak-koribb interpretációban, feltesszük azt, hogy a játékosok egy-mástól függetlenül, kevert stratégiájuk által meghatározottan, véletlenszer¶en vá-lasztanak tiszta stratégiát (amit ebben a fejezetben általában akciónak fogunk ne-vezni). Ehhez mindegyik külön-külön egy véletlen mechanizmust (random device,

RD) használ. Ezek az eloszlások egy valószín¶ségeloszlást generálnak azS =×n i=1Si

akcióprolok véges halmazán. Ha félretesszük azt a feltételezést, hogy az egyéni ran-domizálások egymástól függetlenek, akkor b®vülnek a lehet®ségek: tetsz®leges va-lószín¶ségeloszlást használhatunk S-en egy akcióprol véletlenszer¶ kiválasztására.

Ez tulajdonképpen az akcióválasztások összehangolása (korrelálása), amit úgy kell megvalósítani, hogy ne kelljen valamilyen szerz®désben a játékosokat az összehangolt cselekvésre kötelezni és így a nem-kooperatív játékok körét elhagyni.

(32)

több személyre való kiterjesztés csak jelölésbeli kellemetlenségeket okozna, a lényeg ugyanaz. Jelöljük az els® (sor) játékos akcióinak halmazát I-vel, a másodikét

(osz-lop) J-vel, az els® játékos kizetéseit aij, a másodikét bij-vel, i ∈ I, j ∈ J. Jelölje

A = [aij] és B = [bij] a két játékos kizet®mátrixát. Legyenpij az(i, j) akcióprol

választásának valószín¶sége. A pij valószín¶ségeket rendezzük el egy P mátrixban,

amely nyilván nem negatív és az elemeinek összege1. A P mátrix köztudott. Ezt a

valószín¶ségeloszlást és az azt reprezentálóP mátrixot korrelált stratégiának

nevez-zük. Ez már nem a szó eredeti értelmében vett stratégia és talán az elnevezés sem szerencsés, de általában ez használatos.

A véletlen választást, az RD-t, egy "játékvezet®" m¶ködteti. Amint a választás

megtörtént, a játékvezet® az els® játékosnak titokban, úgy, hogy a második ezt ne tudja, javasolja, hogy azi akciót játssza. Ugyanígy javasolja a második játékosnak,

hogy a j akciót játssza. A korrelált stratégiát korrelált egyensúlynak hívjuk, ha

várható értékben egyik játékosnak sem érdeke a játékvezet® javaslatát elutasítani és valami mást játszani, mint az éppen javasolt akció, feltéve, hogy a másik játékos megfogadja a játékvezet® javaslatát. Itt tulajdonképpen a játék valódi lejátszását megel®z® forgatókönyvet (pre-game scenario), más néven protokollt adtuk meg. Ez a protokoll a korrelált egyensúly feltalálójának, Aumannak (Aumann, 1974) a nevéhez f¶z®dik.

A fentiek alapján a korrelált egyensúlyok halmaza egyenl® az alábbi lineáris egyenl®tlenségrendszer összes megoldásainak halmazával:

pij ≥ 0 i∈I, j ∈J P i∈I P j∈J pij = 1 P j∈J (aij−akj)pij ≥ 0 i, k ∈I P i∈I (bij −bil)pij ≥ 0 j, l ∈J (2.1)

Ezt az egyenl®tlenségrendszert használhatjuk a korrelált egyensúly formális de-níciójára is. Az egyenl®tlenségeket szokás "ösztönz® feltételeknek" (incentive

(33)

const-raints) nevezni.

2.1. deníció. A P = [pij] valószín¶ségeloszlást a G = (A, B) bimátrix játék

kor-relált egyensúlyának (CE) nevezzük, ha kielégíti a (2.1) egyenl®tlenségrendszert.

A lineáris egyenl®tlenségrendszerek elméletéb®l ismert, hogy a megoldásai konvex halmazt alkotnak. Így a korrelált egyensúlyok konvex lineáris kombinációi is korrelált egyensúlyok. Ez a tulajdonság nyilván nem igaz a N EP-ekre.

Vezessük be a következ® jelölést minden i∈I-re ésj ∈J-re:

pi = X j∈J pij, pj = X i∈I pij .

Feltéve, hogy pi és pj > 0, a (2.1) egyenl®tlenségeit végigoszthatjuk velük és az

alábbit kapjuk: P j∈J (aij −akj) pij pi ≥ 0 i, k∈I P i∈I (bij −bil) pij pj ≥ 0 j, l∈J . (2.2) A pij

pi annak a valószín¶sége, hogy a második játékos aj akcióját játssza, feltéve,

hogy az els® az i akcióját, és így tekinthet® az els® játékos vélekedésének a

máso-dik játékos akcióválasztásáról. A (2.2) egyenl®tlenségek azt fejezik ki tehát, hogy mindkét játékos akcióválasztása maximalizálja a saját várható kizetését adott vé-lekedések mellett, ami maga a bayesi racionalitás, Aumann (1987).

A korrelált egyensúly valóban általánosítása a Nash-egyensúlynak, amit a követ-kez® egyszer¶en igazolható tételben fogalmazunk meg.

2.2. tétel (Aumann (1974)). Ha(x, y)aG= (A, B)bimátrix játékN EP-je, akkor a pij =xiyj, i∈I, j ∈J korrelált stratégiaCE. Ha viszontpij egy olyanCE, amelyre

fennáll, hogy pij =uivj, i∈I, j ∈J valamely u, v valószín¶ségi vektorokra (vagyis a

pij valószín¶ségekb®l összeállított P mátrix rangja 1), akkor az (u, v) stratégiaprol

(34)

A fenti tétel és a 2.1. deníció egyszer¶ következménye, hogy a N EP-ek konvex

burka része a korrelált egyensúlyok halmazának.

2.3. példa. Tekintsük a gyáva nyúl" (game of chicken), Forgó et al (1999) játékot a szokásos autós interpretációval, amelyben a kizet®függvények a következ®k (N:

nem tér ki, K: kitér):

1-es játékos kizetései

K N

K 6 2

N 7 0

2-es játékos kizetései

K N

K 6 7

N 2 0

Ekkor a korrelált egyensúlyok halmazát leíró egyenl®tlenségrendszer a következ®:

p11, p12, p21, p22 ≥ 0 p11+p12+p21+p22 = 1 (6−7)p11+ (2−0)p12 ≥ 0 (7−6)p21+ (0−2)p22 ≥ 0 (6−7)p11+ (2−0)p21 ≥ 0 (7−6)p12+ (0−2)p22 ≥ 0 . (2.3)

A három N EP által meghatározott CE-k:

(i) p11 = 0, p12= 1, p21 = 0, p22= 0;

(ii) p11 = 0, p12= 0, p21 = 1, p22= 0;

(iii) p11 = 4/9, p12 = 2/9, p21 = 2/9, p22 = 1/9.

Szemléletes, ha a három N EP által meghatározottCE-k P mátrixát is felírjuk:

(i)   0 1 0 0   (ii)   0 0 1 0   (iii) 1 9   6 2 2 1   .

Természetesen ezek összes konvex lineáris kombinációi isCE-k, de van olyanCE

is, amely nem állítható el® a háromN EP által meghatározottCE-k konvex lineáris

(35)

(iv) p11 = 1/3, p12 = 1/3, p21= 1/3, p22= 0,

vagy mátrix formában:

(iv) 1 3   1 1 1 0   ,

CE (kielégíti a (2.3) egyenl®tlenség rendszert!) ilyen.

A CE-t nemcsak bimátrix játékokra, hanem akárhány személyes véges

játékok-ra is lehet deniálni, mint azt a kés®bbiekben meg is fogjuk tenni. S®t, végtelen játékokra is, de ezzel nem nagyon foglalkozunk. A CE itt is egy eloszlás a játék

le-hetséges kimenetelein. Az interpretáció teljesen ugyanaz: a játékvezet® kisorsol egy akció n-est, majd minden játékosnak titokban javasolja, hogy játssza a kisorsolt

akciót. Ekkor egyetlen játékos sem tudja javítani a várható kizetését azzal, hogy eltér a játékvezet® által javasolt akciótól. A bayesi interpretáció is ugyanaz, mint a kétszemélyes esetben.

A CE-k halmaza sokkal egyszer¶bb szerkezet¶, mint a N EP-eké: egy konvex

politóp. Nincs is szükség semmilyen xpont tételre a CE létezésének bizonyítására,

a lineáris programozás dualitás tétele (vagy ezzel ekvivalens tétel) elegend® annak bizonyításához, hogy a CE-t deniáló egyenl®tlenségrendszernek van megoldása.

Általában végtelen sok CE létezik. Ezek közül lehet úgy választani (pl. a

játék-vezet® választhat), hogy valamilyen célt reprezentáló függvényt maximalizálunk a

CE-k halmazán és a kiválasztottCE-t majd a játékvezet® implementálja egy

meg-felel® RD segítségével. Ha a játékosok hasznosságai összeadhatók, akkor egy ilyen

cél lehet a hasznosságok összegének a maximalizálása. Az így kapott CE egyszerre

valósít meg kollektív" hasznosságot és stabilitást, abban az értelemben, hogy a kol-lektív optimum" önmegvalósító (self enforcing), ha a játékosok hajlandók a játék szabályait elfogadni (azt tehát, hogy a mindenki által ismert eloszlás szerint sorsol a játékvezet® és a leírt titoktartási szabályokat betartják).

(36)

p11= 1/2, p12= 1/4, p21= 1/4, p22= 0 ,

vagy mátrix formában:

1 4   2 1 1 0  

az egyetlenCE amely maximalizálja a hasznosságok összegét, amir®l

meggy®z®dhe-tünk, ha a

12p11+ 9p12+ 9p21

célfüggvény¶ és a (2.3) feltételrendszer¶ lineáris programozási feladatot megoldjuk. A fent leírt forgatókönyvet jól megnézve láthatjuk, hogy itt tulajdonképpen egy

E extenzív játékról van szó, amely a játékvezet® által végrehajtott sorsolással

kez-d®dik, majd a játékosok lépnek (választanak a saját információ halmazukban lé-v® akciókból). A sorjátékos i stratégiájához tartozó információ halmazát azok az

akcióprolok (az E játék fájában pontok) alkotják, amelyekben a sorjátékos az i

stratégiáját játssza. Az E játékban pl. a sorjátékos egy stratégiája egy függvény,

amely minden információ halmazhoz hozzárendel egy k ∈ I akciót. A játékvezet®

javaslatának követése csak egy stratégia a sok közül. Könnyen látható, hogy E-ben

a "javaslatkövet®" stratégiapárosN EP. Lehet azonbanE-ben a javaslatkövet®

stra-tégiapároson kívül másN EP is.

Nézzük ismét a gyáva nyúl játékot:

K N

K (6,6) (2,7)

N (7,2) (0,0)

Itt az ebb®l felépített E extenzív játékban mindkét játékosnak négy stratégiája

van, amelyeket a{K, N} bet¶készletb®l két bet¶vel adunk meg: az els® azt jelenti, hogy mit csinál a játékos, ha a játékvezet® K-t, a második pedig azt, hogy mit,

(37)

ha a játékvezet® N-et javasol. Tehát a négy stratégia: KK, KN, N K, N N. Az

els® és a negyedik két "következetes" stratégia: mindegy mit javasol a játékvezet®, a játékosK-t illetveN-et választ. A második az "ellenszegül®", mindkét játékos mást

csinál, mint amit javasolnak, a harmadik pedig a javaslatkövet®. A kizetések a P

eloszlással számolt várható értékek az E-ben választott stratégiapárosok esetében.

Válasszuk P-nek a hasznosságok összegét a CE-k halmazán maximalizáló eloszlást.

Láttuk, hogy ez az alábbi (mátrix formában adott) CE:

P =   1 2 1 4 1 4 0  .

Könnyen kiszámolható, hogy ezt a CE-t használva azE játék normál formája a

következ® (a számok negyedeket jelentenek):

C=             KK N K KN N N KK (24,24) (12,27) (20,25) (8,28) N K (27,12) (9,9) (20,10) (2,7) KN (25,20) (10,20) (21,21) (6,21) N N (28,8) (7,2) (21,6) (0,0)            

A tiszta stratégiák halmazán háromN EP van: a javaslatkövet®(KN, KN)és az

aszimmetrikus következetes (KK, N N) és (N N, KK). Nehéz olyan érvet felhozni,

amelyik garantálná, hogy feltétlenül a javaslatkövet® stratégiapáros fog megvalósul-ni.

Ezen a ponton felmerül az a gondolat, hogy menjünk még egy lépéssel tovább, és tekintsük a C játékot kiinduló játéknak és keressük ennek egy olyan CE-jét, amely

maximalizálja a várható hasznoságok összegét. Az világos, hogy ha a (KN, KN)

javaslatkövet® stratégiapárost 1 valószín¶séggel sorsoljuk ki, akkor 42

összhasznos-ságot kapunk. Kérdés, hogy van-e ennél jobb? A most már kicsit nagyobb LP-t

megoldva azt látjuk, hogy nincs. Viszont nem csak egy megoldás van, hanem végte-len sok. Például a következ® két mátrix minden konvex lineáris kombinációja is:

(38)

         1 2 0 0 1 4 0 0 0 0 0 0 0 0 1 4 0 0 0          ,          0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0          .

Igy lehet®ség van arra, hogy a sok optimális CE közül egyéb, a modellben nem

szerepl® megfontolások alapján válasszon a játékvezet®. Hogyan lehet ezt a "két-szint¶" korrelált egyensúlyt interpretálni? Egy lehetséges forgatókönyv a következ®, Forgó (2013). Két játékvezet® van. Az els® szinten a játékvezet® javaslatokat tesz és a játékosok választanak K és N közül. A második szinten a játékvezet® javaslatot

tesz arra, hogy hogyan reagáljanak a játékosok az els® szinten kapott javaslatok-ra. Természetesen id®ben a második szint javaslata jut el a játékosokhoz el®ször, azután következik az els® szint. Ha javaslatkövet® magatartást választanak a játéko-sok a második szinten, akkor nem kötelez® javaslatkövet®nek lenni az els® szinten, mégis lehet maximális hasznosságösszeget realizálni. S®t, az sem kötelez®, hogy az els® szinten a sorsolás egy CE-t realizáló eloszlás szerint történjék.

Mindebb®l az a tanulság, hogy hiába olyan vonzó a "játékvezet®s" forgatókönyv-vel bevezetni a korrelált egyensúlyt, mégis jobb el®ször a korrelált egyensúlyt mate-matikailag deniálni az ösztönz® feltételekkel és csak utána belemerülni a különböz® interpretációkba.

Az interpretációk közül a leghíresebb Aumanné (Aumann, 1987), aki azt állítja, hogy a korrelált egyensúly a bayesi döntéselmélet javaslataival legjobban összhang-ban lév® egyensúlyi fogalom. A végletekig leegyszer¶sítve: egy bayesi döntéshozó a saját várható hasznosságát maximalizálja a világ állapotairól alkotott véleménye szerint, amely vélemény a világ állapotain deniált (szubjektív) valószín¶ségelosz-lásban ölt testet. Tekintsünk úgy a stratégiaprolok halmazára, mint a lehetséges világállapotok halmazára és a P mátrixra, mint egy ezen deniált a priori

valószí-n¶ségeloszlásra. Ha a sorjátékos ahhoz az információhoz jut, hogy a sorsolás olyan világállapotot eredményezett, amelyben az ® akciója i, akkor az oszlopjátékos

(39)

vi-lágállapotainak halmaza J, a hozzá tartozó valószín¶ségek pedig a posterior

való-szín¶ségek (a feltétel az, hogy az i-ik sor választása már megtörtént). Ekkor a fenti

ösztönz® feltételek ekvivalensek azzal, hogy a sorjátékos, miután megtudta, hogy a kisorsolt stratégiaprolból az ® része az i-ik, bayesi döntéshozóként maximalizálja

a posterior valószín¶ségekkel számolt várható hasznosságát. Ha a P eloszlás CE,

akkor az istratégia optimális választás.

Aumann kritikusainak legf®bb ellenvetése, hogy furcsa világállapot az, amely döntésekb®l tev®dik össze. Így a végén a döntés meghozatalának az eredménye egy világállapot. Összekeverednek a dolgok, a lehetséges döntések hol döntésként, hol világállapotként szerepelnek. Aumann védi álláspontját, de igazán soha sem sike-rült meggy®zni kritikusait. Holott egy egyszer¶ "trükkel" ezt a problémát meg lehet oldani. Tekintsük a problémát, mint egy nem teljes információs játékot, amelyben mind a sor, mind az oszlopjátékos minden akciójához hozzárendelünk egy típust. Tu-lajdonképpen minden akcióhoz hozzárendelünk egy tulajdonságot, amit az jellemez, hogy egy ilyen tulajdonságú játékos általában így cselekszik. Például a gyáva nyúl játékban aKitér cselekvéshez az Óvatos, a Nem tér ki cselekvéshez a Merész típus

tartozhat. Így a négy világállapot: ÓÓ, ÓM, MÓ, M M. Korrelált egyensúlyban a

"légy önmagad", vagyis ha Ó típus vagy, akkor játsszálK-t, haM típus vagy, akkor

játsszál N-et stratégia páros bayesi Nash-egyensúly.

2.2. A gyenge és a puha korrelált egyensúly normál

formában adott játékok esetében

ACE, noha általánosítása azN E-nek, ugyanazokkal a koncepcionális problémákkal

rendelkezik, mint az N E. Egyrészt azért, mert az extenzív játékká vagy nem

tel-jes információs játékká való átalakítás során egy kib®vített játék N E-jével hozzuk

összefüggésbe, másrészt Aumann interpretációját ugyanúgy nem lehet az egyéni ra-cionalitásra és annak a köztudására visszavezetni, mint az N E-ét. Lásd b®vebben

(40)

Risse (2000).

Ez persze nem azt jelenti, hogy aCE egy haszontalan általánosítása azN E-nek.

Ha másért nem, akkor azért, mert így nagyobb társadalmi hasznosságot (SW: social

welfare) lehet egyensúlyban, a játékvezet® segítségével, a játékosok egyéni érdekei által vezérelve, nem-kooperatív környezetben megvalósítani.

Felmerült az a kérdés, hogy a CE további általánosításával lehetne-e még

na-gyobbSW-t elérni. A továbbiakban, hacsak nem jelezzük, SW-n automatikusan az

egyes játékosok hasznosságainak (kizetéseinek) az összegét értjük. Világos, hogy ez egyáltalán nem magától értet®d®, de mivel az irodalomban az egyes egyensúlytípu-sok össehasonlításánál általában ezt használják, nem érdemes ett®l eltérni.

Moulin és Vial (1978) tértek el el®ször az Aumann-féle protokolltól. Csak bi-mátrix játékokat vizsgáltak. Nagyobb elkötelezettséget követelnek a játékosoktól: a játék lejátszása el®tti fázisban dönteniük kell, hogy vakon követik-e a játékvezet® javaslatát a sorsolás megtörténte után, vagy nem akarják elkötelezni magukat, ami-kor is nem kapnak semmilyen javaslatot, de azt csinálhatnak, amit akarnak. Valami olyasmire gondolhatunk, mint amikor valakinek döntenie kell, hogy szabad kezet adjon-e a brókerének a befektetés kiválasztásához, vagy pedig saját maga hozza meg a befektetési döntést.

Szemléletes, ha a forgatókönyvet a következ®képpen képzeljük el. A játékvezet® elvégzi a sorsolást az adott, közismert valószín¶ségeloszlás szerint. A kisorsolt ak-ciókat (illetve egy papírt, amire az akció fel van írva) beteszi az egyes játékosok számára kijelölt piros borítékokba. A játékosok valamennyi akcióját, azt is, amelyik a piros borítékban van, beteszi egy fehér borítékba. A játékosok egymástól függetle-nül (szimultán) választanak a piros és a fehér boríték közül. Ha egy játékos a pirosat választotta, akkor azt az akciót kell végrehajtania, ami a borítékban van. Ha a fe-héret választotta, akkor szabadon választ a borítékban lév® akciók közül, vagyis az akcióhalmazából bármelyiket választhatja. A valószín¶ségeloszlást, amely szerint a játékvezet® a sorsolást végzi, gyenge korrelált egyensúlynak (weak correlated equi-librium), W CE-nek fogjuk nevezni. Más elnevezés is ismert a szakirodalomban. Az

(41)

eredeti "egyszer¶ kiterjesztés" (simple extension) nem elég kifejez®, ezért talán a Young (2004) által bevezetett "coarse correlated equilibrium" elnevezés a leggyako-ribb.

Moulin és Vial (1978) mutattak példát arra (lásd a 2.7. példát), amikor a W CE

nagyobbSW-t ad, mint bármelyikCE. Ugyancsak karakterizálta azokat a bimátrix

játékokat, amelyeknek aN EP-jét lehet és amelyeket nem lehet aW CE segítségével

Pareto-javítani. Ezeknek az eredményeknek a megértéséhez szükség van a stratégiai ekvivalencia deníciójára.

2.4. deníció. Az (A, B) és (C, D) bimátrix játékokat stratégiailag ekvivalenseknek

nevezzük, ha

x0Ay ≥x00Ay⇔x0Cy ≥x00Cy minden x0, x00 ∈X-re, minden y ∈Y-ra

és

xBy0 ≥xBy00⇔xDy0 ≥xDy00 minden y0, y00 ∈Y-ra, minden x∈X-re,

ahol X a sorjátékos, Y az oszlopjátékos kevert stratégiáinak halmaza.

Könny¶ belátni, hogy stratégiailag ekvivalens játékok N EP halmazai

megegyez-nek, ami egyébként a stratégiai ekvivalencia szokásos deníciója. Ha egy bimátrix játék stratégiailag ekvivalens egy zéró-összeg¶ játékkal (mátrixjátékkal), akkor stra-tégiailag zéró-öszeg¶ játéknak nevezzük. Ezeknek a játékoknak több érdekes tulaj-donsága van, amelyek közül jelen kontextusban csak a következ® két állítás fontos számunkra.

2.5. tétel (Szükséges feltétel, Moulin és Vial (1978)). Ha egy bimátrix játék straté-giailag zéró-összeg¶, akkor egyetlen Pareto-dominánsN EP-et sem lehet a W CE-vel

(42)

2.6. tétel (Elégséges feltétel, Moulin és Vial (1978)). Ha (x, y) egy teljesen

ke-vert (minden akciót pozitív valószín¶séggel játszanak) N EP-je az (A, B) bimátrix

játéknak, amely nem stratégiailag zéró-összeg¶, akkor van olyan W CE, amelyben a

játékosok kizetései szigorúan Pareto-javítják az (x, y)-hoz tartozó kizetéseket.

Persze akkor is lehet javítani a W CE-vel, ha az elégséges feltétel nem teljesül.

Ezt mutatja Moulin és Vial (1978) következ® példája. 2.7. példa. Tekintsük a következ® bimátrix játékot:

A=      3 1 4 1 5 0 1 0 2      , B =      3 1 1 4 2 0 1 0 5      .

Ennek egy N EP-je van: az els® játékos az els® sort, a második az els® oszlopot

választja és a kizetés(3,3). Könnyen igazolható, hogy a

P=      1 3 0 0 0 1 3 0 0 0 13     

egyW CE, amely a (103 ,103)várható kifzetést adja és ez szigorúan Pareto-dominálja

a(3,3)kizetést.

Felmerül a kérdés, hogy nem lehet-e a CE protokollját másképpen

megváltoz-tatni úgy, hogy továbbra is aCE általánosítását kapjuk, de olyan játékok esetében

is (nem mindegyiknél természetesen) el tudunk érni Pareto-jobb kizetéseket, ame-lyeknél aW CEezt nem tudja megtenni. A következ® protokoll alapján Forgó (2010)

aCE egy új általánosítását vezette be, amelyet "puha korrelált egyensúlynak" (soft

correlated equilibrium, SCE) nevezett. A protokoll leírásánál célszer¶ ismét a

"bo-rítékos" interpretációt használni a szemléletesség kedvéért.

Most is azzal kezdünk, hogy a játékvezet® egy köztudott valószín¶ségeloszlás sze-rint kisorsol egy akcióprolt. Minden játékos számára a saját piros borítékjába teszi

(43)

a kiválasztott akciót. A fehér borítékjába a többi akciókat. Vegyük észre a W CE

-t®l való eltérést: míg ott minden akciót elhelyezett a játékvezet® a fehér borítékba, itt a kiválasztott (piros borítékban lév®) akciót nem. Innent®l kezdve a protokoll ugyanaz. A játékosok szimultán választanak a piros és a fehér borítékok közül. A valószín¶ségeloszlást SCE-nek nevezzük, ha várható értékben egyik játékosnak sem

érdeke a fehér borítékot választani, feltéve, hogy az összes többi a pirosat választotta. Másképpen: annak a kib®vített játéknak, amelyik azzal kezd®dik, hogy a játékosok döntenek, hogy elkötelezik-e magukat a játékvezet®nek való feltétlen engedelmesség mellett,N EP-je az a stratégiaprol, amikor mindenki elkötelezi magát.

Nézzük meg, hogy miképpen tudjuk jellemezni a háromféle korrelált egyensúlyt, a CE-t, a W CE-t és az SCE-t egy lineáris egyenl®tlenségrendszer segítségével n

-személyes véges játékok esetében. Az egyenl®tlenségek az úgy nevezett "ösztönz® feltételek", amelyek annak a várható hasznát, hogy egy játékos engedelmeskedik a játékvezet®nek, hasonlítja össze azzal, amikor ezt nem teszi meg, mindíg feltéve, hogy a többi játékos követi a játékvezet® utasításait.

Legyen G ={S1, . . . , Sn;f1, . . . , fn} egy n-személyes játék normál formában, az

S1, . . . , Sn véges akcióhalmazokkal és az f1, . . . , fn kizet®függvényekkel.

Az ösztönz® feltételeket az i rögzített játékosra írjuk fel és az egyszer¶ség

ked-véért ezt az indexet elhagyjuk ott, ahol ez nem okoz félreértést. A következ® jelöléseket használjuk:

• N ={1, . . . , n}: a játékosok halmaza.

• I = {1, . . . , m}: az i játékos akcióhalmaza, az akciókat az akciók indexei

rep-rezentálják.

• S−: azijátékos kivételével az összes többi játékos akcióhalmazainak Descartes

szorzata (a csonka akcióproliok halmaza). • s− ∈S−: egy csonka akcióprol.

(44)

• S ={(j, s−) : j ∈I, s− ∈S−}: a (teljes) akcióprolok halmaza.

• f(j, s−): az i játékos kizetése, ha ® a j akciót játssza, a többiek pedig s−-t.

• p: egy valószín¶ségeloszlásS-en.

• p(j, s−): az a valószín¶ség, amelyet a p eloszlás a (j, s−) akcióprolhoz rendel.

ACE olyanpvalószín¶ségeloszlás, amely mindeni-re, (i∈N)kielégíti az alábbi

ösztönz® feltételt X s−∈S− f(j, s−)p(j, s−)≥ X s−∈S− f(k, s−)p(j, s−)

mindenj, k ∈I-re, vagy ami ezzel ekvivalens

X s−∈S− f(j, s−) p(j, s−) P s−∈S−p(j, s−) ≥ X s−∈S− f(k, s−) p(j, s−) P s−∈S−p(j, s−)

minden j, k ∈ I-re, feltéve, hogy P

s−∈S− p(j, s−) > 0. Itt a baloldalon a kizetés

várható értéke szerepel akkor, ha az i játékos engedelmeskedik a játékvezet®nek,

a jobboldalon pedig annak a kizetésnek a várható értéke, ha a k ∈ I stratégiát

választja függetlenül attól, hogy mi a játékvezet® javaslata.

A W CE olyan pvalószín¶ségeloszlás, amely kielégíti minden i (i∈N)játékos

X j∈I X s−∈S− f(j, s−)p(j, s−)≥ X j∈I X s−∈S− f(k, s−)p(j, s−)

ösztönz® feltételeit minden k ∈ I-re. A baloldalon annak a kizetésnek a várható

értéke van, amit az i játékos kap, ha elkötelezi magát, hogy mindig végrehajtja a

játékvezet® javaslatát, a jobboldalon pedig az a várható kizetés szerepel, amelyet azijátékos akkor kap, ha nem kötelezi el magát és ak ∈I akciót választja. Világos,

hogy a W CE általánosítása a CE-nek, hiszen ösztönz® feltételei a CE bizonyos

ösztönz® feltételeinek összegzésével álltak el®.

AzSCE deniálásohoz kell némi el®készület. Egy rögzítettj ∈I-re tekintsük az

Referencias

Documento similar

[r]

Si la inclinación supera la latitud del lugar de lanzamiento (gura 2c) hay dos posibilidades en las que será necesario determinar el Azimut, Az adecuado para insertar directamente

This  chapter will help you learn how to lean on friends and family, understand the  people who don’t step forward, and navigate having people in your space.  . Get

Homework: Take an isochrone from any database, and generate a synthetic HR diagram with 1000 stars following the Salpeter IMF from it. Do it directly with a plotting-capable

In section 6, we evaluate the impact of the potential extra fine-tunings mentioned above, discussing also the correlation between soft terms that the experimental Higgs mass imposes

First, the mTORC1 pathway activation status and the consequent reduction of autophagy (as assessed by established autophagy markers levels, although a more detailed analysis

This language, already deeply sanskrithd, was only partly influenced by the Arabo-Persian superstratum and even re- tained (in spite of certain attempts a t

The relationship between the coverage obtained using IS-seq (reads per RFLP band) and the difference be- tween observed and expected sites showed that our method was prone to