Egyensúly a játékelméletben: egzisztencia és
általánosítások
AKADÉMIAI DOKTORI ÉRTEKEZÉS
Írta: Forgó Ferenc
Budapesti Corvinus Egyetem Közgazdaságtudományi Kar
Tartalomjegyzék
1. A Nash-egyensúlypont létezése 5
1.1. A Nash-egyensúlypont létezése konvexitás nélkül . . . 7
1.2. Cournot oligopólium nem konvex költségfüggvényekkel . . . 12
1.3. Kétfüggvényes minimax tételek . . . 23
2. A korrelált egyensúly és általánosításai 28 2.1. Deníció és interpretáció . . . 28
2.2. A gyenge és a puha korrelált egyensúly normál formában adott játé-kok esetében . . . 36
2.3. Puha korrelált egyensúly egyszer¶, két-kiszolgálós, nem-csökken®, li-neáris torlódási játékokban . . . 51
2.4. A gyenge és a puha korrelált egyensúly extenzív formában adott já-tékok esetében . . . 69
2.5. Részjáték tökéletes puha fa-korrelált egyensúly . . . 73
2.6. Optimalizálás a fa-korrelált egyensúlyok halmazán . . . 81
2.7. Egy alkalmazás . . . 85
3. Az L-Nash alkumegoldás 88 3.1. A Nash-alkumegoldás . . . 88
3.2. Az L-Nash alkumegoldás . . . 92
3.3. Az L-Nash alkumegoldás implementációja kétszemélyes alkujátékokban105 3.4. Az alkuprobléma és a többkritérimú döntések . . . 114
Függelék 126
A. Bizonyítások 127
A.1. Egy két-függvényes minimax tétel . . . 127 A.2. A puha korrelált egyensúly ereje négy-személyes, egyszer¶, két-kiszolgálós,
nem növekv® lineáris, torlódási játékokban . . . 138 A.3. Az L-Nash alkumegoldás Howard-féle implementációja . . . 142
B. Rövidítések jegyzéke 151
El®szó
Csaknem ötven éve foglalkozom játékelmélettel kisebb-nagyobb intenzitással. Az els® mérföldk® ezen az úton az els® magyar nyelv¶ játékelmélet könyv, amit mentorom-mal, Szép Jen®vel közösen írtunk, Szép és Forgó (1974) majd ezt két angol és egy német nyelv¶ játékelmélet könyv követte az id®k folyamán, Szép és Forgó (1983, 1985), Forgó et al (1999). Ezek, f®leg az utolsó, sok új kutatási eredményemet is tartalmazza, mégis inkább tankönyvek. A Budapesti Corvinus Egyetemen és jog-el®djein évtizedek óta vezetek játékelmélet kurzusokat, amelyek szintén inspiráltak arra, hogy a tudományos érdekl®désem a matematikai programozástól mindinkább a játékelmélet felé forduljon. Az utóbbi húsz évben már csak kifejezetten játékel-méleti, vagy ahhoz szorosan kapcsolódó témákban jelentek meg dolgozataim sokféle fórumon, amelyek közül, fontossági sorrend nélkül, megemlítem a European Journal of Operations Research, a Central European Operations Research, a Mathematical Social Sciences, a Journal of Global Optimization, az Archiv der Mathematik, az Acta Mathematica Hungarica, a Pure Mathematics and Applications és a Szigma folyóiratokat.
Ennek a disszertációnak, amely túlnyomó részt saját kutatási eredményeket tar-talmaz, speciális szerkezete van. Három f® fejezete egy-egy olyan új fogalom köré épül, amelyet különböz® munkáimban én vezettem be olyan területeken, amelyek a játékelméleti kutatások f® sodrába tartoznak. Az els® fejezet a Nash-egyensúlypont létezésével foglalkozik különböz® modellekben és feltételek mellett, különös tekin-tettel a sok egzisztencia tétel bizonyításában szerepet játszó CF-konvexitás, Forgó (1994) fogalmára. A második fejezetben a korrelált egyensúllyal és általánosításaival
foglalkozom különös tekintettel a "puha korrelált egyensúlyra", Forgó (2010). Ez, mint egyéb általánosítások is, els® sorban azt célozza, hogy minél nagyobb társadal-mi hasznosságot lehessen elérni egyensúlyban. A harmadik fejezet a Nash alkumeg-oldásból származtatott limit-Nash alkumegoldással, Forgó (1984), annak különböz® tulajdonságaival és implementációjával foglalkozik.
Minden fejezetben törekedtem a témához kapcsolódó új alkalmazást is bemu-tatni. Az els® fejezetben a Cournot oligopólium tiszta Nash-egyensúlypontjának lé-tezésére adok elégséges feltételeket nem lineáris keresleti függvény és nem konvex költségfüggvény esetében, Forgó (1995). A puha korrelált egyensúly alkalmazását részletesen bemutatom a torlódási játékok egy osztályára, Forgó (2014), valamint a klímatárgyalások egy játékelméleti modelljében, Forgó et al (2005). Nagy gyel-met szentelek a limit-Nash alkumegoldás alkalmazásának a többkritériumú döntési problémákban, Forgó és Szidarovszky (2003).
Köszönettel tartozom szerz®társaimnak, kollégáimnak, a diákoknak, az egyetemi játékelméleti szeminárium résztvev®inek, és utoljára, de els®sorban, családomnak a támogatásért és a türelemért.
Bevezetés
Mivel a három f® fejezet elején külön-külön van egy viszonylag hosszabb beveze-tés, itt csak amellett szeretnék érvelni, hogy miért tartozik a disszertációt alkotó három fejezet témája a játékelméleti kutatások f® sodrába. A klasszikus játékelmé-letnek három fontos kiindulópontja van (eltekintve, de nem lebecsülve von Neumann (1928) mérföldk®nek számító, a zérus-összeg¶ játékok speciális osztályára vonatkozó eredményét®l): von Neumann és Morgenstern (1944) monumentális m¶ve, amely a kooperatív játékok elméletét alapozta meg, Nash Nobel díjjal is jutalmazott deníci-ója és egzisztencia tétele, Nash (1950a, 1951) a nem-kooperativ játékok egyensúlyára vonatkozóan, valamint ugyancsak Nash (1950b, 1953) munkái, amelyek összekapcsol-ják a kooperatív és nem-kooperativ megközelítést. Ehhez a f® sodorhoz kapcsolódott az ugyancsak Nobel díjas Aumann (1974) a korrelált egyensúly fogalmának beveze-tésével.
A disszertáció a kooperatív játékok Neumann-Morgenstern megközelítésének ki-vételével ezekhez a kutatási irányokhoz csatlakozik, amint azt a három fejezetre tagolás jelzi is, és igyekszik saját kutatásaimon alapuló új eredményeket bemutatni. A dolgozathoz tartozik egy függelék (szintén három részb®l áll), amelyben a hosszabb bizonyítások találhatók. A disszertáció folyamatosan olvasható a függelék nélkül is. A deníciók, tételek, lemmák és példák számozása fejezetenként és a füg-gelék három részében folyamatos. Az értekezésben elnevezés szintjén nem tettem különbséget "tétel" (theorem) és "állítás" (proposition) között, noha sokan alkal-maznak ilyen gyakorlatot, felállítva egy olyan hierarchiát, amelyben "súlyban" egy tétel megel®z egy állítást. Van amikor ez egyértelm¶en eldönthet®, de sokszor nem.
Én mindenhol a "tétel" elnevezést használom és inkább a szövegben utalok arra, hogy milyen súlyú az állítás. Sok fogalomnak nincs magyar nyelv¶, a szakma ál-tal egységesen elfogadott megnevezése. Sokszor saját elnevezéseket kreáltam, illetve önkényesen választottam a verseng® lehetséges terminológia közül. Az olvasás meg-könnyítése céljából elég sok fogalom esetében az els® el®fordulás alkalmával zárójel-ben az angol elnevezést is megadtam. A kett®nél több szerz®s hivatkozásoknál csak az els® szerz®t említem annak megjelölésével, hogy társai is vannak. Az irodalom-jegyzékben minden adat pontosan szerepel. A disszertáció végén van a rövidítések jegyzéke.
A disszertáció megértéséhez a mesterszint¶ közgazdászképzésben elvárt analízis, valószín¶ségszámítás, lineáris algebra és optimumszámítás tudás b®ségesen elég. A matematikai általánosságban sehol nem megyek túl a véges dimenziós euklideszi terek nyújtotta lehet®ségeken, még az eredetileg általánosabb terekben megfogal-mazott állításokat is a speciális esetet jelent® véges dimenzióban fogalmazom meg és bizonyítom.
Az egyes szám els® személy használata csak az el®szóra és a bevezetésre kor-látozódik, a kés®bbiekben a tudományos m¶vekben megszokott többes szám els® személyt használom.
1. fejezet
A Nash-egyensúlypont létezése
A játékelméleti kutatások lassan száz éves történetében mind a mai napig látható az a törekvés, hogy a Nash-egyensúlypont(N EP), illetve ennek általánosításai és
no-mításai esetében lehet®leg minél gyengébb feltételek mellett bizonyítsák a vizsgált egyensúly létezését általában és speciálisan egyes konkrét játékosztályok esetében is. Nézzük meg, hogy az általános esetben melyek a f® irányok.
Egy G nem-kooperatív játékot normál formában a játékosok N = {1, . . . , n} halmazával, a stratégiahalmazaival és az kizet®függvényeivel szokás megadni a jól ismert G={S1, . . . , Sn;f1, . . . , fn} formában, ahol minden i∈N-re Si azi játékos
nem üres stratégiahalmaza,fi :→Ra kizet®függvénye, amely azS =S1× · · · ×Sn
stratégiaprol halmazon van értelmezve.
Természetesen G összetev®ir®l fel kell tételeznünk valamit, hogy bármilyen
eg-zisztencia tételhez jussunk (közismert a mondás, hogy ha valamir®l nem teszünk fel semmit, akkor nem is tudunk mondani róla semmit). Persze a feltételezéseknek olyanoknak kell lenni, amelyek bizonyos alkalmazásokban relevánsak, lehet®leg jól ellen®rizhet®ek és egyszer¶ek. Induljunk ki Nash (1950a, 1951) eredményéb®l.
Idézzük fel a jól ismert deníciót. Ehhez vezessük be a csonka stratégiaprol fo-galmát és a megfelel® jelölést. Minden stratégiaprolt felírhatunk az s = (si, s−i)
formában, ahol az s−i csonka stratégiaprol csak az si-t nem tartalmazza. Egy
egyen-l®tlenségek:
fi(s?i, s ?
−i)≥fi(si, s?−i)
minden si ∈ Si és i ∈ N esetén. Nash klasszikus eredménye (Nash, 1950a, 1951) a
következ®:
1.1. tétel. Véges játékok kevert b®vítésének mindig van N EP-je.
Itt az Si halmazok a lehetséges keverések (véges halmazon vett
valószín¶ségel-oszlások) halmazai, az fi függvények pedig a véges játékban vett kizetéseknek a
játékosok által egymástól függetlenül választott valószín¶ségeloszlásaival számított várható kizetését adják meg (egy multilineáris forma, vagyis minden játékos kize-tése a többiek által választott stratégiák rögzíkize-tése mellett a saját stratégia lineáris függvénye).
Már itt is látszik, hogy a további általánosítások kereteit mi határozza meg. Általánosítani lehet a stratégiahalmazokat (a stratégiahalmazok alakját, a teret, amelyben ezek a halmazok deniálva vannak), a kizet®függvények alakját, folyto-nosságát, simaságát, stb. Ebben a szellemben született az els® komoly általánosítás, a Nikaido-Isoda tétel (Nikaido és Isoda, 1955).
1.2. tétel. Ha minden i∈N-re
(i) az Si stratégiahalmazok véges dimenziós euklideszi terek konvex kompakt
rész-halmazai,
(ii) az fi függvények folytonosak az S stratégiaprol halmazon,
(iii) az fi(., s−i) függvények konkávok az Si stratégiahalmazon,
akkor a G játéknak van legalább egy N EP-je.
Világos, hogy Nash tétele speciális eset, hiszen az egységszimplexek konvex, kom-pakt halmazok és a multilineáris függvények folytonosak és konkávok a saját válto-zójukban a többi változó rögzítése esetén.
Friedman (1977) közölte a legáltalánosabbat azok közül a tételek közül, amelyek a konvexitás klasszikus fogalmát használják és a véges dimenziós euklideszi térben maradnak. Ez körülbelül az a pont, ahol a legtöbb tankönyv megáll.
1.3. tétel. Legyen G = {S1, . . . , Sn;f1, . . . , fn} egy nem-kooperatív játék, amely
eleget tesz az alábbi feltételeknek minden i∈N-re:
1. Si véges dimenziós euklideszi tér nem üres, konvex, kompakt részhalmaza,
2. fi felülr®l félig folytonos a stratégiaprolok S halmazán,
3. bármely rögzített si ∈ Si esetén az f(si,·) függvény alulról félig folytonos az
S−i csonka stratégiaprolok halmazán,
4. az fi(·, s−i) függvények kvázikonkávok az Si stratégiahalmazon.
Ekkor a G játéknak van legalább egy N EP-je.
1.1. A Nash-egyensúlypont létezése konvexitás
nél-kül
Az els® kísérlet ebben az irányban Nishimura és Friedman nevéhez f¶z®dik (Nishi-mura és Friedman, 1981). A feltételük, ami a kvázikonkávítást helyettesíti az 1.3. tételben azonban nagyon nehezen ellen®rízhet®. Mint láttuk, a függvények alaki és folytonossági tulajdonságai is általánosabbak az 1.3. tételben, mint az 1.2. tételben. Mi a következ®kben az alaki (konvexitási/konkávitási) tulajdonságok általánosítá-saival foglalkozunk. A legels®, a játékelméletben is felhasznált eredmény Ky Fan nevéhez f¶z®dik (Fan, 1952, 1953). Legel®ször deniáljuk a Fan-konkáv (F-konkáv)
függvényeket.
1.4. deníció (F-konkávitás). LegyenekX ésY tetsz®leges nem üres halmazok. Az f: X × Y → R függvényt F-konkávnak nevezzük az X halmazon az Y halmazra
vonatkozóan, ha bármely x1, x2 ∈ X ponthoz és λ ∈ [0,1] valós számhoz van olyan
x0 ∈X, hogy
f(x0, y)≥λf(x1, y) + (1−λ)f(x2, y) (1.1)
fennáll minden y∈Y-ra.
Vegyük észre, hogy az általánosság milyen magas szintjén mozgunk: jóformán semmit sem teszünk fel az X, Y halmazokról és az f függvényr®l is csak az (1.1)
egyenl®tlenség fennállását. Például, ha egy duopólium modellben X ésY a két
vál-lalat lehetséges termeléshalmaza (lehet pl. nem összefügg®, bizonyos volumenek nem lehetségesek), akkor csak azt követeljük meg, hogy ha az els® vállalat bármely kétx1,
x2termelési lehet®ségéhez tartozóf(x1, y),f(x2, y)protoknak legalább aλ,(1−λ)
-val súlyozott átlagát lehessen realizálni -valamelyx0 termelési lehet®séggel, nem kell
ennek feltétlenül a két termelési lehet®ségλx1+ (1−λ)x2 súlyozott átlagának lenni
(lehet, hogy az nem is lehetséges).
Ky Fan klasszikus eredménye a következ® (nem teljes általánosságában, mert mi az euklideszi térben maradunk).
1.5. tétel (Fan (1952)). Legyen G= {S1, S2;f1, f2} kétszemélyes zérus-összeg¶
já-ték, ahol azS1, S2 stratégiahalmazok zártak és korlátosak, azf1, f2 kizet®függvények
felülr®l félig folytonosak és f1 F-konkáv S1-en az S2-re vonatkozóan, f2 F-konkáv
S2-n az S1-re vonatkozóan. Ekkor a G játéknak van legalább egy N EP-je.
Hosszú ideig azt gondolták, hogy ezt az eredményt egyszer¶en át lehet vinni n
-személyes játékokra. Ez nem sikerült és kiderült az oka is: Joó (1986) konstruált egy olyan kétszemélyes nem zérusösszeg¶ játékot, ahol mindkét játékos stratégiahalmaza a [0,1] intervallum, a kizet®függvények folytonosak és F-konkávok de a játéknak
nincs N EP-je.
Forgó (1994) módosította az F-konkávitás denícióját (kicsit szigorított), ami
aztán lehet®vé tette a Fan-típusú egzisztencia tétel bizonyítását akárhány játékos esetére. Nézzük a módosított deníciót.
1.6. deníció (CF-konkávitás, folytonos F-konkávitás). Legyen X egy véges
di-menziós euklideszi tér nem üres részhalmaza,Y egy tetsz®leges nem üres halmaz. Az f: X×Y függvénytCF-konkávnak nevezzük azX halmazon azY halmazra
vonatko-zóan, ha van olyanψ: X×X×R→X folytonos függvény, hogy bármely x1, x2 ∈X
pontok és λ ∈[0,1] valós szám esetében
f(ψ(x1, x2, λ), y)≥λf(x1, y) + (1−λ)f(x2, y) (1.2)
fennáll minden y∈Y-ra.
Szükséges lesz ennek a deníciónak egy másik formájára is.
1.7. deníció (CF-konkávitás). Legyen X egy véges dimenziós euklideszi tér nem
üres részhalmaza, Y egy tetsz®leges nem üres halmaz. Az f: X×Y →R függvényt
CF-konkávnak nevezzük az X halmazon azY halmazra vonatkozóan, ha mindenk ≥
2-re van olyanψk: × j=k
j=1Xj×R→X folytonos függvény, hogy bármely x1, . . . , xk ∈
X pontok és 0≤λ1, . . . , λk ≤1. Pjj==1kλj = 1 valós számok esetében
f(ψk(x1, . . . , xk, λ1, . . . , λk), y)≥λ1f(x1, y) +. . .+λkf(xk, y)
fennáll minden y∈Y-ra.
A fenti két deníció ekvivalenciájának bizonyítása megtalálható Forgó (1994)-ben.
A N EP egzisztenciájának bizonyításához szükségünk lesz egy jól ismert
dení-cióra.
1.8. deníció. AG={S1, . . . , Sn;f1, . . . , fn} játékhoz tartozó aggregátor
függvény-nek nevezzük az A: S×S →R, A(s, t) = i=n X i=1 fi(si, t−i) (1.3) függvényt.
1.9. lemma (Nikaido és Isoda (1955)). Ha van olyan t∗ ∈S stratégiaprol, hogy
A(t∗, t∗)≥A(s, t∗) (1.4)
minden s∈S-re, akkor t∗ a G játék N EP-je.
1.10. tétel (Forgó (1994)). Ha
a) Si, i∈N véges dimenziós euklideszi tér nem üres, konvex, kompakt részhalmaza,
b) fi, i∈N folytonos függvény az S stratégiaprolok halmazán,
c) az A aggregátor függvény CF-konkáv S-en az S-re vonatkozóan,
akkor G-nek van N EP-je.
Bizonyítás. A bizonyítás a Nikaido-Isoda tétel (Nikaido és Isoda, 1955) bizonyításá-nak lépései mentén halad. Tegyük fel, indirekt bizonyítást alkalmazva, hogy G-nek
nincs N EP-je. Akkor az 1.9. lemma miatt minden t ∈S-hez van olyan s ∈S, hogy A(t, t)< A(s, t). Legyen
Hs ={t ∈S:A(t, t)< A(s, t)}, s∈S .
A Hs halmazok nyíltakS-ben és teljesen lefedik S-et
S = [
s∈S
Hs .
Mivel S zárt és korlátos, ezért aHs halmazok közül véges sok is lefedi S-et
S=
j=q
[
j=1
Hsj .
Deniáljuk minden j = 1, . . . , q-ra az aj: S→R és az a: S →R függvényeket
aj(t) = max{A(sj, t)−A(t, t),0}, t∈S a(t) = q P j=1 aj(t)>0, t ∈S .
Tekintsük S-nek a következ® önmagára való folytonos leképezését t→t0 = ψq s1, . . . , sq, a1(t) a(t), . . . , aq(t) a(t) ,
ahol ψq az 1.7. denícióban szerepl® folytonos függvény. A c) feltételezés és az 1.7.
deníció miatt A(t0, t)≥ q X j=1 aj(t) a(t)A(sj, t)
fennáll mindent ∈S-re.
Az A, a1, . . . , aq, a, ψq függvények valamennyien folytonosak, ezért a t →t0
leké-pezésnek a Brouwer-xponttétel, (Brouwer, 1912) szerint van xpontja. Legyen t∗
egy xpont. Ekkor t∗ =t∗0 és így
A(t∗, t∗)≥ q X j=1 aj(t∗) a(t∗)A(sj, t ∗ ) . (1.5)
Az indirekt feltevés miatt van legalább egy sj, amelyre A(t∗, t∗) < A(sj, t∗), és
haA(t∗, t∗)≥A(sj, t∗), akkor aj(t) = 0. Így q X j=1 aj(t∗) a(t∗)A(sj, t ∗ )> q X j=1 aj(t∗) a(t∗)A(t ∗ , t∗) = A(t∗, t∗),
ami ellentmond (1.5)-nek.
A CF-konkávitás deníciójától inspirálva, az 1.10. tétel különböz® irányokban
való általánosításaiként további egzisztencia tételek születtek az évek folyamán. Csak azokból, amelyekben expliciten a CF-konkávitást jelölik meg, mint egyik
kiinduló-pontot, megemlítjük a következ® független munkákat: Kim és Kum (2005), Kim és Lee (2002), Kim és Lee (2007), Hou (2009), Cheng (2010), Kim (2011) cikkeket és Cambini és Martein (2009) könyvét.
Az általánosítás egyik iránya, amikor az euklideszi tereknél általánosabb terekben deniálunk konvex halmazokat és függvényeket. Forgó és Joó (1999) munkájában 13 xpont és játékelméleti egzisztencia tétel szerepel teljesen egyéni terekben (un.
pszeudokonvex terekben), amelyeknek deníciójában jól látható a CF-konkávítás,
mint kiinduló pont. Ezeknek az ismertetése kívül esne azon a határon, amelyet az euklideszi térnél húztunk meg.
Az eddigiekb®l is világos volt, de most két példán is megmutatjuk, hogy nem kell az euklideszi teret elhagyni ahhoz, hogy olyan játékok N EP-jének létezését tudjuk
bizonyítani, ahol a klasszikus konvexitási/konkávitási feltételek nem teljesülnek. 1.11. példa. LegyenG={X, Y, f, g},X =Y = [−1,1], f(x, y) =x2y+x,g(x, y) =
−x2y2+y. Látható, hogyf(·,1)nem kvázikonkáv és ezért az 1.3. tételt nem tudjuk
használni. Az A: (X×Y)×(X×Y)→R aggregátor függvény ebben az esetben
A(x, y, u, v) =f(x, v) +g(u, y) = x2v+x−u2y2+y .
Legyen a ψ függvény a következ®:
ψ(x1, x2, y1, y2, λ) = p λx21+ (1−λ)x22 p λy2 1 + (1−λ)y22 .
Elemi (de kicsit hosszadalmas) számolással igazolható, hogy az A aggregátor
függvényCF-konkáv az X×Y halmazon az X×Y-ra vonatkozóan, így G-nek van N EP-je. Valóban, azx=−1
2, y = 1egyN EP. Megjegyezzük, hogy ennél a játéknál
Nishimura és Friedman (1981) feltétele nem teljesül.
1.2. Cournot oligopólium nem konvex
költségfüggvé-nyekkel
A klasszikus Cournot modell jólismert. Egy iparágban, ahol n vállalat termel egy
homogén termékfajtát (a fogyasztókat vásárlásaikkor nem érdekli, hogy a termé-ket melyik vállalat termelte), a vállalatok egymástól függetlenül hozzák meg vo-lumendöntéseiket, vagyis az i vállalat választ egy xi termelési szintet, xi ∈ [0,1],
szintjeiket a [0,1] intervallumra normalizáltuk az egyszer¶ség kedvéért. Adott egy
P: [0, n]→ R árfüggvény (inverz keresleti függvény), amely az iparág q = Pi=n
i=1 xi
teljes termeléséhez azt a legnagyobb árat rendeli, amelyen a piac kitisztul, vagy-is a fogyasztók az egész q mennyiséget megvásárolják. Szintén adott az i vállalat Ci: [0,1]→R,i= 1, . . . , nköltségfüggvénye, amely azxi termelési szinthez aCi(xi)
költséget rendeli. Költség szempontból a vállalatok különböz®k lehetnek. Ezekb®l az elemekb®l tev®dik össze az i vállalat fi: [0,1]n → R protfüggvénye (költséggel
csökkentett árbevétel) fi(x1, . . . , xn) =xiP xi+ X j6=i xj ! −Ci(xi), xi ∈[0,1], i= 1, . . . , n .
Bevezetve az Si = [0,1], i = 1, . . . , n jelölést, az Si termelési halmazok és az
fi protfüggvények, i = 1, ..., n a G = {S1, . . . , Sn;f1, . . . , fn} oligopólium játékot
határozzák meg. Jelöljük a játékosok (vállalatok) halmazát N = {1, . . . , n}-el. A különböz® közgazdasági alkalmazásokban fontos kérdés, hogy a G oligopólium
já-téknak van-e egyensúlypontja a tiszta stratégiák halmazán. A klasszikus eredmény a következ®:
1.12. tétel (Friedman (1977)). Ha a P árfüggvény konkáv a [0, n] intervallumon,
a Ci költségfüggvények minden i∈ N-re konvexek a [0,1] intervallumon, akkor a G
oligopólium játéknak van egyensúlypontja a tiszta stratégiák halmazán.
Ennél általánosabb eredményekhez juthatunk, ha gyelmünket azokra az oligo-pólium játékokra koncentráljuk, amelyek az u.n. potenciál játékok közé tartoznak. 1.13. deníció (Monderer és Shapley (1996). Legyen N = {1, . . . , n} a játékosok halmaza, és H = {T1, . . . , Tn;g1, . . . , gn} egy játék normál formában. A H játékot
ordinális potenciál játéknak nevezzük, ha van olyan Π : T → R függvény, ahol T =
T1 ×. . .×Tn a stratégiaprolok halmaza, hogy minden i ∈ N, és t−i ∈ T−i csonka
gi(ti, t−i)−gi(ri, t−i)>0⇔Π(ti, t−i)−Π(ri, t−i)>0 .
Π-t ordinális potenciál függvénynek nevezzük. A potenciál függvény általában
nem egyértelm¶.
Az 1.13. deníció egyenes következményei:
1. A H ={T1, . . . , Tn;g1, . . . , gn} és a H0 ={T1, . . . , Tn; Π, . . . ,Π} játékok
stra-tégiailag ekvivalensek. AH0 játék tulajdonképpen egy u.n. koordinációs játék,
a játékosoknak közös céljaik vannak, amit a Π potenciál függvény fejez ki, a
probléma csak a Π függvényt maximalizáló termelési prol realizálása.
2. Ha a Π ordinális potenciál függvénynek van maximuma T-n, akkor minden
maximumpont egyN EP.
3. Minden véges ordinális potenciál játéknak van N EP-je.
Tekintsük aGoligopólium játékot azzal a további megkötéssel, hogy a vállalatok
csak pozitív mennyiséget termelhetnek és minden vállalat költségfüggvénye lineáris, egységesencmarginális költséggel. Könny¶ belátni, hogy ekkor aGoligopólium játék
ordinális potenciál játék a Π : R++→R, Π(x1, . . . , xn) = x1· · ·xn(Π(x)−c)
poten-ciál függvénnyel. Ha van olyan termelési volumen prol, amelyben minden vállalat pozitív mennyiséget termel és a kialakult ár nagyobb a marginális költségnél (ezt minden "normális" iparágban nyugodtan fel lehet tenni), akkor a 2. következmény értelmében van a tiszta stratégiák halmazán N EP. Hangsúlyozni kell, hogy a P
árfüggvény akármilyen lehet, még monoton csökken®nek sem kell lenni, megengedve akár a Gien hatást is, Varian (1992). A költségfüggvényre viszont szigorú kikötés van.
A fordított helyzet is kedvez® a N EP egzisztenciája szempontjából.
Tegyük most fel, hogy a Goligopólium játékban, az árfüggvény lineáris: P(x) =
a−bx, a, b >0, a Ci(xi) költségfüggvények tetsz®legesek,i∈N. Legyen a potenciál
függvényΠ : Rn
Π(x1, . . . , xn) = a j=n X j=1 xj −b j=n X j=1 x2j −b X 1≤k<j≤n xkxj − j=n X j=1 Cj(xj) .
Nem nehéz igazolni, hogy a G oligopólium játék ordinális potenciál játék a Π
potenciál függvénnyel (s®t, egy egzakt potenciál-játék, ami a mi szempontunkból most nem lényeges).
Láthatjuk, hogy itt az árfüggvényre van szigorú megkötés (linearitás), míg a költ-ségfüggvények bármilyenek lehetnek. Ezért, ha olyan esetet keresünk, amikor nincs a tiszta stratégiák halmazán N EP, akkor nemlineáris árfüggvénnyel és nemlineáris
vagy lineáris, de nem azonos költségfüggvényekkel kell próbálkoznunk.
A következ®kben elégséges feltételeket adunk a Ci költségfügvényekre, amelyek
teljesülése esetén bizonyos monoton csökken®, szigorúan konkáv árfüggvény esetén is van a tiszta stratégiák halmazán N EP. A célcsoport a költségfüggvények egy
olyan osztálya, amely a legtöbb iparágban inkább mondható tipikusnak, mint a konvex költség függvény. A termelés felfutásával a költségek egy pontig (az optimális kapacitáskihasználásig) csökken® ütemben n®nek, majd ezen túl növekv® ütemben. Annak jelent®ségére, hogy az oligopólium modellekben preferáljuk a tisztaN EP-et,
mások mellett Tasnádi (2011) mutat rá.
Foglaljuk össze az árfüggvényre és a költségfüggvényekre tett feltételeinket. A P árfüggvény ki kell elégítse az alábbi feltételeket:
a) P kétszer folytonosan dierenciálható egy nyilt intervallumon, amely tartalmazza
a [0, n] intervallumot, aP értelmezési tartományát.
b) P(x)>0 mindenx∈[0, n]-re, vagyis a vállalatok termelési korlátai olyan
szoro-sak, hogy még akkor is, ha mindenki teljes kapacitáson termel, az össztermelést pozitív áron el lehet adni.
c) P0(x)<0 mindenx∈[0, n]-re, vagyis P szigorúan monoton csökken®.
e) P00monoton csökken® a [0, n]intervallumon, vagyis az árak csökkenésének
"gyor-sulása" csökken az összkínálat növekedésével.
Azivállalat költségfüggvénye ki kell elégítse az alábbi feltételeket mindeni∈N
-re:
1. Ci kétszer folytonosan dierenciálható egy nyilt intervallumon, amely
tartal-mazza a [0,1]intervallumot, a Ci értelmezési tartományát.
2. Ci(xi)≥0 mindenxi ∈[0,1]-re.
3. Ci0(xi)>0 minden xi ∈ [0,1]-re, tehát a költségek monoton n®nek a termelés
növekedésével.
4. Van egy olyan ui ∈(0,1)inexiós pont, hogy Ci konkáv a [0, ui) és konvex az
(ui,1] intervallumon.
5. Ci00(0) < 0 és Ci00 szigorúan monoton növekv® a [0,1] intervallumon, vagyis a
költségek növekedésének a gyorsulása n® a termelés növekedésével.
Egy egyszer¶ példa a fenti feltételeket kielégít® költségfüggvényre a Ci(xi) =
(xi−12)3+ 18 függvény.
A felesleges indexezés elkerülése érdekében vezessük be a következ® jelöléseket
x=xi, t=
X
j6=i
xj ésϕi(x, t) =xP(x+t)−Ci(x) .
A ϕi(x, t) tulajdonképpen az i-ik vállalat protja, ha a saját termelésex a
töb-bieké pedig összesen t. A következ®kben nem írjuk ki, de minden deriváltat az x
helyen veszünk.
Hasznos lesz a következ® segédtétel.
1.14. lemma. A P és Ci függvényekre tett feltételek mellett a ϕi függvény ϕ0i
Bizonyítás. Egyszer¶ deriválással kapjuk, hogy
ϕ0i(x, t) =xP0(x+t) +P(x+t)−Ci0(x),
és mivel P konkáv, −Ci0 szigorúan konkáv, csak azt kell bizonyítani, hogy h(x) =
xP0(x+t) konkáv a [0,1] intervallumon. Ennek a függvénynek a deriváltja P0(x+
t) +xP00(x+t),amely csökken® P konkávitása és xnem negativitása miatt, ami azt
jelenti, hogy ϕ0i szigorúan konkáv.
Az 1.14. lemma alkalmazásával tudjuk bizonyítani a következ® tételt.
1.15. tétel (Forgó (1995)). Ha 2P0(0) ≤ Ci00(0) fennáll minden i ∈ N-re, akkor a G oligopólium játéknak van legalább egy N EP-je.
Bizonyítás. Vegyük a ϕi protfüggvény második deriváltját
ϕ00i(x, t) = 2P0(x+t) +xP00(x+t)−Ci00(x),
és végezzük el az x= 0 helyettesítést
ϕ00i(0, t) = 2P0(0 +t) −Ci00(0) .
Mivel P0 monoton csökken®, 2P0(0) ≤ Ci00(0)-b®l következik ϕ00i(0, t) ≤ 0. Az 1.14.
lemma miatt ϕ0i konkáv és ezértϕ00i csökken®. Ebb®l következik ϕ00i(x, t)≤ϕ00i(0, t)≤0
mindenx∈[0,1]-re. Ezért ϕi konkáv, tehátGegy olyan játék, amelyre az 1.2. tétel
feltételei fennállnak és így van legalább egyN EP-je.
Az 1.15. tétel feltétele azt jelenti, hogy az árfüggvény gyorsabban csökken 0
termelés esetében, mint a költségnövekés gyorsulásának a fele.
Más elégséges feltételek mellett is bizonyítható a N EP egzisztenciája aG
oligo-pólium játékra. Ehhez szükséges lesz a következ® tételre, amely egyenes következ-ménye egy jól ismert egzisztencia tételnek (Theorem 3.1, Forgó et al (1999)).
1.16. tétel. Ha a ϕi(x, t) protfüggvénynek csak egyetlen maximumpontja van a
[0,1]intervallumon at∈[0, n−1]paraméter bármely értékére, akkor aGoligopólium
játéknak van legalább egy N EP-je.
Két lemma lesz segítségünkre a továbbiakban.
1.17. lemma. Ha ϕ0i(0, t)>0 valamely t-re, akkor a ϕi(·, t) függvénynek pontosan
egy maximumpontja van a [0,1] intervallumon.
Bizonyítás. Haϕ0i(0, t)>0ésϕ0i konkáv, akkor minden olyan0< x≤1-re, amelyre
fennáll a ϕ0i(x, t) = 0 egyenl®ség, az alábbi egyenl®tlenség teljesül 0< ϕ0i(0, t)≤ϕ0i(x, t)−xϕ00i(x, t) =−xϕ00i(x, t) ,
amib®l ϕ00i(x, t) < 0 jön. Ebb®l a tényb®l és az 1.14. lemmából következik, hogy
a K = {x ∈ [0,1] : ϕ0i(x, t) = 0} kritikus pontok halmazának legfeljebb egy eleme van. Ha K =∅, akkor felhasználva a 0< ϕ0i(0, t) egyenl®tlenséget azt kapjuk, hogy
ϕ0i(x, t) >0 mindenx ∈ [0,1]-re, amib®l az következik, hogy a ϕi(·, t) függvénynek
az x = 1 pontban van az egyetlen maximumpontja. Ha viszont K = {x0}, akkor
x=x0 az egyetlen maximumpont.
1.18. lemma. Ha a ϕi(·, t)függvénynek több, mint egy globális maximumpontja van
a [0,1] intervallumon, akkor
Ci(1)−Ci(0)−Ci0(0)−P
0
(0)≤0 . (1.6)
Bizonyítás. Azt az esetet, amikor a ϕi(·, t) függvény szigorúan monoton, nem kell
vizsgálni, mert akkor csak egy maximumpont van. Továbbá, az 1.17. lemma miatt csak azokat a t-ket kell tekintenünk, amelyekre ϕ0i(0, t)≤0, amib®l aztán a
P(t)−C0(0)≤0 (1.7)
Most azt látjuk be, hogy ha ϕi(·, t)-nak két maximumpontja van a [0,1]
in-tervallumon, akkor ezek csak az intervallum végpontjai lehetnek. Indirekt érvelést alkalmazva, tegyük fel, hogy x1 és x2 két különböz® maximumpont és legalább az
egyik nem végpont. Feltehetjük, mondjuk, hogy0< x1 < x2 ≤1. Emiatt van olyan
x3 pont, hogy x1 < x3 < x2 és x3 lokális minimumpont. Így
ϕ00i(x1, t) = 2P0(x1+t) +x1P00(x1+t)−Ci00(x1)≤0 ,
és
ϕ00i(x3, t) = 2P0(x3+t) +x3P00(x3+t)−Ci00(x3)≥0 ,
ami ellentmond a d), e) és az 5. feltételeknek. Tehátϕi(0, t) = ϕi(1, t), amib®l kapjuk
a
P(1 +t) = Ci(1)−Ci(0) (1.8)
egyenl®séget. Mivel a P árfüggvény konkáv, ezért P(t) +P0(t) ≥ P(1 +t), amib®l
gyelembe véve, hogyP0(t)< P0(0), az (1.7) és az (1.8) egyenl®ség fennállnak. Ebb®l
közvetlenül adódik a lemma állítása.
A következ® tétel a nulla összkínálat melletti határár és határköltségek viszonya alapján ad meg egy elégséges feltételt a N EP létezésére.
1.19. tétel (Forgó (1995)). Ha Ci0(0)≤ −P0(0) minden i∈N-re, akkor a G
oligo-pólium játéknak van legalább egy N EP-je.
Bizonyítás. Mivel minden költségfüggvény monoton növekv®, ezért Ci(1)−Ci(0)>
0. Így a −Ci0(0) −P0(0) ≥ 0 egyenl®tlenségb®l következik, hogy (1.6) nem állhat
fenn, ami viszont az 1.18. lemma miatt szükséges ahhoz, hogy ϕi(·, t)-nek több
ma-ximumpontja legyen. Így az 1.16. tétel szerint aGoligopólium játéknak van legalább
Egy másik elégséges feltételt kapunk, ha a költségfüggvények inexiós pontjának elhelyezkedését korlátozzuk.
1.20. tétel (Forgó (1995)). Ha minden i∈N -re az ui inexiós pontra fennáll az
ui <
P0(0)
C00(0) (1.9)
egyenl®tlenség, akkor a G oligopólium játéknak van legalább egy N EP-je.
Bizonyítás. Az (1.6) egyenl®tlenséget, amely szükséges ahhoz, hogy a ϕi(·, t)-nek
több maximumpontja legyen, átrendezhetjük a következ® módon
Ci(1)−Ci(ui) +Ci(ui)−Ci(0)−Ci0(0)−P
0
(0)≤0 . (1.10)
Mivel Ci konkáv a[0, ui)intervallumon és konvex az (ui,1]intervallumon, ezért
Ci(1)−Ci(ui) ≥ (1−ui)Ci0(ui)
Ci(ui)−Ci(0) ≥ uiCi0(ui).
Ezeket az egyenl®tlenségeket felhasználva kapjuk (1.10)-b®l az alábbi egyenl®tlensé-get
Ci0(ui)−Ci0(0)−P
0
(0) ≤0. (1.11)
A Lagrange középérték tételb®l következik, hogy
uiCi00(ξ)−P
0
(0) ≤0
valamely 0≤ξ≤ui értékre. A Ci00 monotonitása miatt ebb®l az
uiCi00(0)−P
0
(0)≤0
egyenl®tlenség adódik, ami ellentmond (1.9)-nek. Az 1.18. lemma az állítja, hogy ekkor a ϕi(·, t)-nek csak egy maximumpontja van és így az 1.16. tétel szerint a G
Ezeknek az elégségességi tételeknek érdekes következménye van a költségfüggvény alakjára. Az 1.20. tétel következménye, hogy ha minden i ∈ N-re 2P0(0) > Ci00(0),
akkor ha a költségfüggvény konkáv része nem terjed túl a termelési kapacitás felén, aG oligopólium játéknak van legalább egy N EP-je.
Ha minden i ∈ N -re 2P0(0) ≤ Ci00(0), akkor az 1.15. tétel biztosítja a N EP
létezését. Nem tudunk semmit mondani arról, ha bizonyos vállalatok esetén az egyik irányú, mások esetében pedig a másik irányú egyenl®tlenség áll fenn. Ez persze nem fordulhat el® a szimmetrikus esetben, vagyis, ha minden vállalatnak ugyanaz a költségfüggvénye. AN EP létezése szempontjából ekkor csak úgy lehet baj, ha az
inexiós pont az (12,1]intervallumba esik.
A vállalatok a termelési lehet®ségeiket tekintve szimmetrikusak. Ez teszi lehe-t®vé, hogy adjunk egy olyan elégséges feltételt, amely az iparágat alkotó vállalatok számára vonatkozik.
1.21. tétel (Forgó (1995)). Ha P(1) > Ci0(0) minden i ∈ N-re, akkor van olyan n0 ≥2vállalatszám, hogy aGoligopólium játéknak van legalább egy N EP-je minden 2≤n≤n0 esetében.
Bizonyítás. Figyelembe véve, hogy a P árfüggvény és a P−1 keresleti függvény is
monoton, könny¶ látni, hogy ha
n < P−1(Ci0(0)) + 1 , (1.12)
akkor (1.7) nem állhat fenn és ezért aϕi(·, t)protfüggvénynek csak egy maximuma
van, amib®l az 1.16. tétel szerint következik, hogy van legalább egyN EP. Az (1.12)
egyenl®tlenségnek csak akkor van értelme, ha
P−1(Ci0(0)) >1 ,
ami ekvivalens a tételben megfogalmazott feltétellel. Azn0 küszöbszám létezését az
A feltétel szavakban azt jelenti, hogy ha az iparág teljes termelését egy vállalat adja, akkor az ár legyen nagyobb, mint 0 termelésnél a határköltség. Általános
ta-nulságként megállapíthatjuk, hogy még nemlineáris árfüggvény esetén sem szükséges a N EP létezéséhez a költségek konvexitása, igen széles költségfüggyvény osztályok
is "kellemesek" ebb®l a szempontból.
Valamiért azért kitüntetett szerep jut a konvex költségfüggvényeknek. Ezt világít-ja meg az alábbi tétel. Csak azn= 2 esettel (duopóliomakkal) foglalkozunk. A
mo-dell lényegében változatlan, azzal a kivétellel, hogy általános árbevétel függvénnyel számolunk, az árbevétel nem feltétlenül mennyiségszer egységár, akár mennyiségi diszkontár is megengedett. Tehát az (általánosított) G duopólium játék
G={[0,1],[0,1];f1, f2}
fi(x1, x2) =Ri(x1, x2)−Ci(xi), xi ∈[0,1] , i= 1,2,
aholRi: [0,1]2 →Raz árbevétel (revenue) függvény,Cia költségfüggvény.Ri(x1, x2)
az árbevétel, amit az i vállalat ér el akkor, ha a vállalatok termelése (x1, x2). Az
alábbi tétel egy szükséges feltételt ad a költségfüggvény alakjára.
1.22. tétel (Forgó (1995)). Ha a G duopólium játéknak minden konkáv árbevétel
függvény mellett van N EP-je, akkor a költségfüggvény konvex
Ez a tétel Joó (1986) egy kevéssé ismert tételének a következménye.
1.23. tétel (Joó (1986)). LegyenekI1,I2 azRzárt intervallumai,f1, f2: I1×I2 →R
folytonos függvények. Ha bármely g1, g2: I1×I2 →R folytonos függvényre, amelyek
közül g1 az els® változójában, g2 a második változójában konkáv, miközben a másik
változót rögzítjük, a
G={I1, . . . , I2;f1+g1,f2+g2}
játéknak vanN EP-je, akkor f1 az els® változójában, f2 a második változójában
Valóban, hafi =−Ci, gi =Ri i= 1,2, akkor az 1.23. tételb®l azonnal következik
az 1.22. tétel állítása. Itt a Ci költségfüggvények akár a másik vállalat termelési
volumenét®l is függhetnének, nem csak a sajátjuktól. Ekkor azt lehetne állítani, hogy az 1.23. tétel feltételei mellett a vállalatok költségfüggvénye konvex a másik vállalat termelését rögzítettnek véve. Nyitott kérdés, hogy ez a tétel kiterjeszthet®-e oligopóliumokra és/vagy "mennyiség× egységár" típusú árbevétel függvényekre. A kritikus lépés Joó tételének általánosítása lenne kett®nél több játékosra, ami azonban nem t¶nik könny¶nek.
1.3. Kétfüggvényes minimax tételek
A játékelmélet els® komoly eredménye Neumann János nevéhez f¶z®dik. Úttör® mun-kájában, von Neumann (1928) egy egyensúlyi egzisztencia tételt bizonyított kétsze-mélyes zérus-összeg¶ játékokra. A játékosztály, amire ez vonatkozik tartalmazza a mátrixjátékokat (véges, kétszemélyes zérusöszeg¶ játékok kevert b®vítése), amely a Nash által vizsgált véges játékok kevert b®vítésének is speciális esete. Ez az egzisz-tencia tétel egy minimax tétel formájában is felírható. Nézzük ezt a problémát egy kicsit általánosabban.
LegyenekX,Y nem üres halmazok ésf: X×Y →Regy valós érték¶ függvény. Nagyon könny¶ igazolni, hogy
sup
X
inf
Y f ≤infY supX f . (1.13)
Az igazán érdekes kérdés, hogy milyen feltételeket kell tenni azX,Y halmazokra
és az f függvényre, hogy (1.13)-ban az egyenl®tlenséget egyenl®ségre cserélhessük.
Neumann Jánossal kezd®d®en óriási mennyiség¶ dolgozat foglalkozott a témával. Az így keletkezett tételeket (egyfüggvényes) minimax tételeknek nevezik. Ezeknek a tételeknek nagyon sok alkalmazása van az optimumszámításban, döntéselméletben, játékelméletben, statisztikában és még sok más területen. Simons (1995) cikke kiváló áttekintést ad a témakörr®l.
Az egyfüggvényes minimax tételek egy érdekes általánosítása a következ®. Ve-zessünk be egy másik g: X×Y →Rfüggvényt és tegyük fel, hogy f ≤g. A kérdés
az, hogy milyen feltételek mellett áll fenn a következ® egyenl®tlenség:
inf
Y supX f ≤supX infY g . (1.14)
Világos, hogy haf =g és (1.14) teljesül, akkor (1.13)-ban egyenl®ség van. Mivel
(1.14)-ben két függvény szerepel, ezért azokat a tételeket, amelyek az X, Y, f, g
-re tett bizonyos feltételek mellett az (1.14) egyenl®tlenség fennállását mondják ki, kétfüggvényes minimax tételeknek nevezik.
Hogyan lehet alkalmazni a kétfüggvényes minimax tételeket a játékelméletben? Ennek egy egyszer¶ módja, Forgó (1999) a következ®. Legyen a G egy n-személyes
játék normál formában:
G:={S1, . . . , Sn, f1, . . . , fn}.
Jelöljük a stratégiaprolok halmazát S := Qn
i=1Si-el és deniáljuk az A: S2 → R
aggregátor függvényt a szokásos módon
A(x, y) := f1(x1, y2, . . . , yn) +. . .+fn(y1, . . . , yn−1, xn) , x, y ∈S .
Az 1.9. lemma szerint annak a szükséges és elégséges feltétele, hogy y∗ ∈S a G
egy N EP-je legyen az, hogy a
A(x, y∗)≤A(y∗, y∗)
egyenl®tlenség fennálljon mindenx∈S-re.
Tegyük fel, hogy van egy olyan B: S2 →
R függvény, amely kielégíti a
A(x, y) +B(y, x)≤A(y, y) +B(x, x) (1.15)
Deniáljuk az f, g:S2 →
R függvényeket a következ® képpen
f(x, y) := A(x, y)−A(y, y) ,
és
g(x, y) :=B(x, x)−B(y, x) .
(1.15) miatt azf ≤gegyenl®tlenség fennállS2-en. Tegyük fel, hogy az alábbi típusú
kétfüggvényes minimax egyenl®tlenség teljesül, vagyis
min
y∈S supx∈Sf(x, y)≤supx∈Syinf∈Sg(x, y) . (1.16)
Ekkor van olyan y∗ ∈S, hogy
A(x, y∗)≤A(y∗, y∗) (1.17)
fennáll minden x∈S-re, vagyisy∗ aG egyN EP-je. Ez azért van, mert g(x, x) = 0
mindenx∈S-re és így
sup
x∈S
inf
y∈Sg(x, y)≤0,
amib®l az következik, hogy van olyan y∗ ∈S, hogy
sup
x∈S
f(x, y)≤0 ,
ami (1.17)-tel ekvivalens.
Íly módon a kétfüggvényes minimax tételeket potenciálisan fel lehet használni játékelméleti egzisztencia tételek bizonyítására. Többféle technika van kétfüggvényes minimax tételek bizonyítására. Mint szinte mindenütt a matematikában (és más tudományágakban is) szeretjük az elemi bizonyításokat. Ezekre itt is van lehet®ség. Persze az elemi bizonyítás nem jelenti azt, hogy egyszer¶, vagy rövid, hanem azt, hogy csak elemi eszközöket használunk a bizonyításhoz. Erre jó példa a következ® tétel.
A tétel megfogalmazásához szükségünk van az "átlagoló függvény" deníciójára. Egy ρ: R2 → R folytonos függvényt átlagoló függvénynek (averaging function) nevezünk, ha mindkét változójában növekv®, valamint
ρ(λ, λ) = λ ,
és
λ 6=µ⇒min{λ, µ}< ρ(λ, µ)<max{λ, µ} .
Könny¶ látni, hogy pl. a súlyozott számtani átlag függvény eleget tesz a fenti feltételeknek.
1.24. tétel. (Forgó és Joó (1998)) Legyenek ρ1 és ρ2 átlagoló függvények, X és Y
nem üres halmazok, f, g: X ×Y → R, olyan függvények, amelyekre fennállnak a következ® feltételek:
(i) f ≤g, f korlátos,
(ii) bármely x1, x2 ∈X-höz található olyan x3 ∈X, hogy
y∈Y ⇒f(x3, y)≥ρ1(f(x1, y), g(x2, y)) ,
(iii) bármely y1, y2 ∈Y-hoz található olyan y3 ∈Y, hogy
x∈X ⇒g(x, y3)≤ρ2(f(x, y1), g(x, y2)) .
Ekkor minden F ⊂X véges halmazra fennáll
inf
A bizonyítás a hosszúsága miatt a függelékben található.
Ezt a tételt az évek folyamán többen általánosították, Forgó (2001), Cheng és Lin (2001), Cheng és Lin (2003), Cheng (2004), Cheng (2010), Jin et al (2006), Tang és Cheng (2008), de az általánosabb feltételek némelyike már "elég mesterkélt" lett, szemben az átlagoló függvény természetességével.
2. fejezet
A korrelált egyensúly és
általánosításai
2.1. Deníció és interpretáció
A Nash-egyensúly egy fontos általánosításához vezet, ha a kevert stratégia fogal-mát tágabban értelmezzük. Legyen N = {1, . . . , n} a játékosok halmaza és G =
{S1, . . . , Sn;f1, . . . , fn} egy véges játék. Amikor Gkevert b®vítésér®l beszélünk,
ak-kor legalábbis a leggyaak-koribb interpretációban, feltesszük azt, hogy a játékosok egy-mástól függetlenül, kevert stratégiájuk által meghatározottan, véletlenszer¶en vá-lasztanak tiszta stratégiát (amit ebben a fejezetben általában akciónak fogunk ne-vezni). Ehhez mindegyik külön-külön egy véletlen mechanizmust (random device,
RD) használ. Ezek az eloszlások egy valószín¶ségeloszlást generálnak azS =×n i=1Si
akcióprolok véges halmazán. Ha félretesszük azt a feltételezést, hogy az egyéni ran-domizálások egymástól függetlenek, akkor b®vülnek a lehet®ségek: tetsz®leges va-lószín¶ségeloszlást használhatunk S-en egy akcióprol véletlenszer¶ kiválasztására.
Ez tulajdonképpen az akcióválasztások összehangolása (korrelálása), amit úgy kell megvalósítani, hogy ne kelljen valamilyen szerz®désben a játékosokat az összehangolt cselekvésre kötelezni és így a nem-kooperatív játékok körét elhagyni.
több személyre való kiterjesztés csak jelölésbeli kellemetlenségeket okozna, a lényeg ugyanaz. Jelöljük az els® (sor) játékos akcióinak halmazát I-vel, a másodikét
(osz-lop) J-vel, az els® játékos kizetéseit aij, a másodikét bij-vel, i ∈ I, j ∈ J. Jelölje
A = [aij] és B = [bij] a két játékos kizet®mátrixát. Legyenpij az(i, j) akcióprol
választásának valószín¶sége. A pij valószín¶ségeket rendezzük el egy P mátrixban,
amely nyilván nem negatív és az elemeinek összege1. A P mátrix köztudott. Ezt a
valószín¶ségeloszlást és az azt reprezentálóP mátrixot korrelált stratégiának
nevez-zük. Ez már nem a szó eredeti értelmében vett stratégia és talán az elnevezés sem szerencsés, de általában ez használatos.
A véletlen választást, az RD-t, egy "játékvezet®" m¶ködteti. Amint a választás
megtörtént, a játékvezet® az els® játékosnak titokban, úgy, hogy a második ezt ne tudja, javasolja, hogy azi akciót játssza. Ugyanígy javasolja a második játékosnak,
hogy a j akciót játssza. A korrelált stratégiát korrelált egyensúlynak hívjuk, ha
várható értékben egyik játékosnak sem érdeke a játékvezet® javaslatát elutasítani és valami mást játszani, mint az éppen javasolt akció, feltéve, hogy a másik játékos megfogadja a játékvezet® javaslatát. Itt tulajdonképpen a játék valódi lejátszását megel®z® forgatókönyvet (pre-game scenario), más néven protokollt adtuk meg. Ez a protokoll a korrelált egyensúly feltalálójának, Aumannak (Aumann, 1974) a nevéhez f¶z®dik.
A fentiek alapján a korrelált egyensúlyok halmaza egyenl® az alábbi lineáris egyenl®tlenségrendszer összes megoldásainak halmazával:
pij ≥ 0 i∈I, j ∈J P i∈I P j∈J pij = 1 P j∈J (aij−akj)pij ≥ 0 i, k ∈I P i∈I (bij −bil)pij ≥ 0 j, l ∈J (2.1)
Ezt az egyenl®tlenségrendszert használhatjuk a korrelált egyensúly formális de-níciójára is. Az egyenl®tlenségeket szokás "ösztönz® feltételeknek" (incentive
const-raints) nevezni.
2.1. deníció. A P = [pij] valószín¶ségeloszlást a G = (A, B) bimátrix játék
kor-relált egyensúlyának (CE) nevezzük, ha kielégíti a (2.1) egyenl®tlenségrendszert.
A lineáris egyenl®tlenségrendszerek elméletéb®l ismert, hogy a megoldásai konvex halmazt alkotnak. Így a korrelált egyensúlyok konvex lineáris kombinációi is korrelált egyensúlyok. Ez a tulajdonság nyilván nem igaz a N EP-ekre.
Vezessük be a következ® jelölést minden i∈I-re ésj ∈J-re:
pi = X j∈J pij, pj = X i∈I pij .
Feltéve, hogy pi és pj > 0, a (2.1) egyenl®tlenségeit végigoszthatjuk velük és az
alábbit kapjuk: P j∈J (aij −akj) pij pi ≥ 0 i, k∈I P i∈I (bij −bil) pij pj ≥ 0 j, l∈J . (2.2) A pij
pi annak a valószín¶sége, hogy a második játékos aj akcióját játssza, feltéve,
hogy az els® az i akcióját, és így tekinthet® az els® játékos vélekedésének a
máso-dik játékos akcióválasztásáról. A (2.2) egyenl®tlenségek azt fejezik ki tehát, hogy mindkét játékos akcióválasztása maximalizálja a saját várható kizetését adott vé-lekedések mellett, ami maga a bayesi racionalitás, Aumann (1987).
A korrelált egyensúly valóban általánosítása a Nash-egyensúlynak, amit a követ-kez® egyszer¶en igazolható tételben fogalmazunk meg.
2.2. tétel (Aumann (1974)). Ha(x, y)aG= (A, B)bimátrix játékN EP-je, akkor a pij =xiyj, i∈I, j ∈J korrelált stratégiaCE. Ha viszontpij egy olyanCE, amelyre
fennáll, hogy pij =uivj, i∈I, j ∈J valamely u, v valószín¶ségi vektorokra (vagyis a
pij valószín¶ségekb®l összeállított P mátrix rangja 1), akkor az (u, v) stratégiaprol
A fenti tétel és a 2.1. deníció egyszer¶ következménye, hogy a N EP-ek konvex
burka része a korrelált egyensúlyok halmazának.
2.3. példa. Tekintsük a gyáva nyúl" (game of chicken), Forgó et al (1999) játékot a szokásos autós interpretációval, amelyben a kizet®függvények a következ®k (N:
nem tér ki, K: kitér):
1-es játékos kizetései
K N
K 6 2
N 7 0
2-es játékos kizetései
K N
K 6 7
N 2 0
Ekkor a korrelált egyensúlyok halmazát leíró egyenl®tlenségrendszer a következ®:
p11, p12, p21, p22 ≥ 0 p11+p12+p21+p22 = 1 (6−7)p11+ (2−0)p12 ≥ 0 (7−6)p21+ (0−2)p22 ≥ 0 (6−7)p11+ (2−0)p21 ≥ 0 (7−6)p12+ (0−2)p22 ≥ 0 . (2.3)
A három N EP által meghatározott CE-k:
(i) p11 = 0, p12= 1, p21 = 0, p22= 0;
(ii) p11 = 0, p12= 0, p21 = 1, p22= 0;
(iii) p11 = 4/9, p12 = 2/9, p21 = 2/9, p22 = 1/9.
Szemléletes, ha a három N EP által meghatározottCE-k P mátrixát is felírjuk:
(i) 0 1 0 0 (ii) 0 0 1 0 (iii) 1 9 6 2 2 1 .
Természetesen ezek összes konvex lineáris kombinációi isCE-k, de van olyanCE
is, amely nem állítható el® a háromN EP által meghatározottCE-k konvex lineáris
(iv) p11 = 1/3, p12 = 1/3, p21= 1/3, p22= 0,
vagy mátrix formában:
(iv) 1 3 1 1 1 0 ,
CE (kielégíti a (2.3) egyenl®tlenség rendszert!) ilyen.
A CE-t nemcsak bimátrix játékokra, hanem akárhány személyes véges
játékok-ra is lehet deniálni, mint azt a kés®bbiekben meg is fogjuk tenni. S®t, végtelen játékokra is, de ezzel nem nagyon foglalkozunk. A CE itt is egy eloszlás a játék
le-hetséges kimenetelein. Az interpretáció teljesen ugyanaz: a játékvezet® kisorsol egy akció n-est, majd minden játékosnak titokban javasolja, hogy játssza a kisorsolt
akciót. Ekkor egyetlen játékos sem tudja javítani a várható kizetését azzal, hogy eltér a játékvezet® által javasolt akciótól. A bayesi interpretáció is ugyanaz, mint a kétszemélyes esetben.
A CE-k halmaza sokkal egyszer¶bb szerkezet¶, mint a N EP-eké: egy konvex
politóp. Nincs is szükség semmilyen xpont tételre a CE létezésének bizonyítására,
a lineáris programozás dualitás tétele (vagy ezzel ekvivalens tétel) elegend® annak bizonyításához, hogy a CE-t deniáló egyenl®tlenségrendszernek van megoldása.
Általában végtelen sok CE létezik. Ezek közül lehet úgy választani (pl. a
játék-vezet® választhat), hogy valamilyen célt reprezentáló függvényt maximalizálunk a
CE-k halmazán és a kiválasztottCE-t majd a játékvezet® implementálja egy
meg-felel® RD segítségével. Ha a játékosok hasznosságai összeadhatók, akkor egy ilyen
cél lehet a hasznosságok összegének a maximalizálása. Az így kapott CE egyszerre
valósít meg kollektív" hasznosságot és stabilitást, abban az értelemben, hogy a kol-lektív optimum" önmegvalósító (self enforcing), ha a játékosok hajlandók a játék szabályait elfogadni (azt tehát, hogy a mindenki által ismert eloszlás szerint sorsol a játékvezet® és a leírt titoktartási szabályokat betartják).
p11= 1/2, p12= 1/4, p21= 1/4, p22= 0 ,
vagy mátrix formában:
1 4 2 1 1 0
az egyetlenCE amely maximalizálja a hasznosságok összegét, amir®l
meggy®z®dhe-tünk, ha a
12p11+ 9p12+ 9p21
célfüggvény¶ és a (2.3) feltételrendszer¶ lineáris programozási feladatot megoldjuk. A fent leírt forgatókönyvet jól megnézve láthatjuk, hogy itt tulajdonképpen egy
E extenzív játékról van szó, amely a játékvezet® által végrehajtott sorsolással
kez-d®dik, majd a játékosok lépnek (választanak a saját információ halmazukban lé-v® akciókból). A sorjátékos i stratégiájához tartozó információ halmazát azok az
akcióprolok (az E játék fájában pontok) alkotják, amelyekben a sorjátékos az i
stratégiáját játssza. Az E játékban pl. a sorjátékos egy stratégiája egy függvény,
amely minden információ halmazhoz hozzárendel egy k ∈ I akciót. A játékvezet®
javaslatának követése csak egy stratégia a sok közül. Könnyen látható, hogy E-ben
a "javaslatkövet®" stratégiapárosN EP. Lehet azonbanE-ben a javaslatkövet®
stra-tégiapároson kívül másN EP is.
Nézzük ismét a gyáva nyúl játékot:
K N
K (6,6) (2,7)
N (7,2) (0,0)
Itt az ebb®l felépített E extenzív játékban mindkét játékosnak négy stratégiája
van, amelyeket a{K, N} bet¶készletb®l két bet¶vel adunk meg: az els® azt jelenti, hogy mit csinál a játékos, ha a játékvezet® K-t, a második pedig azt, hogy mit,
ha a játékvezet® N-et javasol. Tehát a négy stratégia: KK, KN, N K, N N. Az
els® és a negyedik két "következetes" stratégia: mindegy mit javasol a játékvezet®, a játékosK-t illetveN-et választ. A második az "ellenszegül®", mindkét játékos mást
csinál, mint amit javasolnak, a harmadik pedig a javaslatkövet®. A kizetések a P
eloszlással számolt várható értékek az E-ben választott stratégiapárosok esetében.
Válasszuk P-nek a hasznosságok összegét a CE-k halmazán maximalizáló eloszlást.
Láttuk, hogy ez az alábbi (mátrix formában adott) CE:
P = 1 2 1 4 1 4 0 .
Könnyen kiszámolható, hogy ezt a CE-t használva azE játék normál formája a
következ® (a számok negyedeket jelentenek):
C= KK N K KN N N KK (24,24) (12,27) (20,25) (8,28) N K (27,12) (9,9) (20,10) (2,7) KN (25,20) (10,20) (21,21) (6,21) N N (28,8) (7,2) (21,6) (0,0)
A tiszta stratégiák halmazán háromN EP van: a javaslatkövet®(KN, KN)és az
aszimmetrikus következetes (KK, N N) és (N N, KK). Nehéz olyan érvet felhozni,
amelyik garantálná, hogy feltétlenül a javaslatkövet® stratégiapáros fog megvalósul-ni.
Ezen a ponton felmerül az a gondolat, hogy menjünk még egy lépéssel tovább, és tekintsük a C játékot kiinduló játéknak és keressük ennek egy olyan CE-jét, amely
maximalizálja a várható hasznoságok összegét. Az világos, hogy ha a (KN, KN)
javaslatkövet® stratégiapárost 1 valószín¶séggel sorsoljuk ki, akkor 42
összhasznos-ságot kapunk. Kérdés, hogy van-e ennél jobb? A most már kicsit nagyobb LP-t
megoldva azt látjuk, hogy nincs. Viszont nem csak egy megoldás van, hanem végte-len sok. Például a következ® két mátrix minden konvex lineáris kombinációja is:
1 2 0 0 1 4 0 0 0 0 0 0 0 0 1 4 0 0 0 , 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 .
Igy lehet®ség van arra, hogy a sok optimális CE közül egyéb, a modellben nem
szerepl® megfontolások alapján válasszon a játékvezet®. Hogyan lehet ezt a "két-szint¶" korrelált egyensúlyt interpretálni? Egy lehetséges forgatókönyv a következ®, Forgó (2013). Két játékvezet® van. Az els® szinten a játékvezet® javaslatokat tesz és a játékosok választanak K és N közül. A második szinten a játékvezet® javaslatot
tesz arra, hogy hogyan reagáljanak a játékosok az els® szinten kapott javaslatok-ra. Természetesen id®ben a második szint javaslata jut el a játékosokhoz el®ször, azután következik az els® szint. Ha javaslatkövet® magatartást választanak a játéko-sok a második szinten, akkor nem kötelez® javaslatkövet®nek lenni az els® szinten, mégis lehet maximális hasznosságösszeget realizálni. S®t, az sem kötelez®, hogy az els® szinten a sorsolás egy CE-t realizáló eloszlás szerint történjék.
Mindebb®l az a tanulság, hogy hiába olyan vonzó a "játékvezet®s" forgatókönyv-vel bevezetni a korrelált egyensúlyt, mégis jobb el®ször a korrelált egyensúlyt mate-matikailag deniálni az ösztönz® feltételekkel és csak utána belemerülni a különböz® interpretációkba.
Az interpretációk közül a leghíresebb Aumanné (Aumann, 1987), aki azt állítja, hogy a korrelált egyensúly a bayesi döntéselmélet javaslataival legjobban összhang-ban lév® egyensúlyi fogalom. A végletekig leegyszer¶sítve: egy bayesi döntéshozó a saját várható hasznosságát maximalizálja a világ állapotairól alkotott véleménye szerint, amely vélemény a világ állapotain deniált (szubjektív) valószín¶ségelosz-lásban ölt testet. Tekintsünk úgy a stratégiaprolok halmazára, mint a lehetséges világállapotok halmazára és a P mátrixra, mint egy ezen deniált a priori
valószí-n¶ségeloszlásra. Ha a sorjátékos ahhoz az információhoz jut, hogy a sorsolás olyan világállapotot eredményezett, amelyben az ® akciója i, akkor az oszlopjátékos
vi-lágállapotainak halmaza J, a hozzá tartozó valószín¶ségek pedig a posterior
való-szín¶ségek (a feltétel az, hogy az i-ik sor választása már megtörtént). Ekkor a fenti
ösztönz® feltételek ekvivalensek azzal, hogy a sorjátékos, miután megtudta, hogy a kisorsolt stratégiaprolból az ® része az i-ik, bayesi döntéshozóként maximalizálja
a posterior valószín¶ségekkel számolt várható hasznosságát. Ha a P eloszlás CE,
akkor az istratégia optimális választás.
Aumann kritikusainak legf®bb ellenvetése, hogy furcsa világállapot az, amely döntésekb®l tev®dik össze. Így a végén a döntés meghozatalának az eredménye egy világállapot. Összekeverednek a dolgok, a lehetséges döntések hol döntésként, hol világállapotként szerepelnek. Aumann védi álláspontját, de igazán soha sem sike-rült meggy®zni kritikusait. Holott egy egyszer¶ "trükkel" ezt a problémát meg lehet oldani. Tekintsük a problémát, mint egy nem teljes információs játékot, amelyben mind a sor, mind az oszlopjátékos minden akciójához hozzárendelünk egy típust. Tu-lajdonképpen minden akcióhoz hozzárendelünk egy tulajdonságot, amit az jellemez, hogy egy ilyen tulajdonságú játékos általában így cselekszik. Például a gyáva nyúl játékban aKitér cselekvéshez az Óvatos, a Nem tér ki cselekvéshez a Merész típus
tartozhat. Így a négy világállapot: ÓÓ, ÓM, MÓ, M M. Korrelált egyensúlyban a
"légy önmagad", vagyis ha Ó típus vagy, akkor játsszálK-t, haM típus vagy, akkor
játsszál N-et stratégia páros bayesi Nash-egyensúly.
2.2. A gyenge és a puha korrelált egyensúly normál
formában adott játékok esetében
ACE, noha általánosítása azN E-nek, ugyanazokkal a koncepcionális problémákkal
rendelkezik, mint az N E. Egyrészt azért, mert az extenzív játékká vagy nem
tel-jes információs játékká való átalakítás során egy kib®vített játék N E-jével hozzuk
összefüggésbe, másrészt Aumann interpretációját ugyanúgy nem lehet az egyéni ra-cionalitásra és annak a köztudására visszavezetni, mint az N E-ét. Lásd b®vebben
Risse (2000).
Ez persze nem azt jelenti, hogy aCE egy haszontalan általánosítása azN E-nek.
Ha másért nem, akkor azért, mert így nagyobb társadalmi hasznosságot (SW: social
welfare) lehet egyensúlyban, a játékvezet® segítségével, a játékosok egyéni érdekei által vezérelve, nem-kooperatív környezetben megvalósítani.
Felmerült az a kérdés, hogy a CE további általánosításával lehetne-e még
na-gyobbSW-t elérni. A továbbiakban, hacsak nem jelezzük, SW-n automatikusan az
egyes játékosok hasznosságainak (kizetéseinek) az összegét értjük. Világos, hogy ez egyáltalán nem magától értet®d®, de mivel az irodalomban az egyes egyensúlytípu-sok össehasonlításánál általában ezt használják, nem érdemes ett®l eltérni.
Moulin és Vial (1978) tértek el el®ször az Aumann-féle protokolltól. Csak bi-mátrix játékokat vizsgáltak. Nagyobb elkötelezettséget követelnek a játékosoktól: a játék lejátszása el®tti fázisban dönteniük kell, hogy vakon követik-e a játékvezet® javaslatát a sorsolás megtörténte után, vagy nem akarják elkötelezni magukat, ami-kor is nem kapnak semmilyen javaslatot, de azt csinálhatnak, amit akarnak. Valami olyasmire gondolhatunk, mint amikor valakinek döntenie kell, hogy szabad kezet adjon-e a brókerének a befektetés kiválasztásához, vagy pedig saját maga hozza meg a befektetési döntést.
Szemléletes, ha a forgatókönyvet a következ®képpen képzeljük el. A játékvezet® elvégzi a sorsolást az adott, közismert valószín¶ségeloszlás szerint. A kisorsolt ak-ciókat (illetve egy papírt, amire az akció fel van írva) beteszi az egyes játékosok számára kijelölt piros borítékokba. A játékosok valamennyi akcióját, azt is, amelyik a piros borítékban van, beteszi egy fehér borítékba. A játékosok egymástól függetle-nül (szimultán) választanak a piros és a fehér boríték közül. Ha egy játékos a pirosat választotta, akkor azt az akciót kell végrehajtania, ami a borítékban van. Ha a fe-héret választotta, akkor szabadon választ a borítékban lév® akciók közül, vagyis az akcióhalmazából bármelyiket választhatja. A valószín¶ségeloszlást, amely szerint a játékvezet® a sorsolást végzi, gyenge korrelált egyensúlynak (weak correlated equi-librium), W CE-nek fogjuk nevezni. Más elnevezés is ismert a szakirodalomban. Az
eredeti "egyszer¶ kiterjesztés" (simple extension) nem elég kifejez®, ezért talán a Young (2004) által bevezetett "coarse correlated equilibrium" elnevezés a leggyako-ribb.
Moulin és Vial (1978) mutattak példát arra (lásd a 2.7. példát), amikor a W CE
nagyobbSW-t ad, mint bármelyikCE. Ugyancsak karakterizálta azokat a bimátrix
játékokat, amelyeknek aN EP-jét lehet és amelyeket nem lehet aW CE segítségével
Pareto-javítani. Ezeknek az eredményeknek a megértéséhez szükség van a stratégiai ekvivalencia deníciójára.
2.4. deníció. Az (A, B) és (C, D) bimátrix játékokat stratégiailag ekvivalenseknek
nevezzük, ha
x0Ay ≥x00Ay⇔x0Cy ≥x00Cy minden x0, x00 ∈X-re, minden y ∈Y-ra
és
xBy0 ≥xBy00⇔xDy0 ≥xDy00 minden y0, y00 ∈Y-ra, minden x∈X-re,
ahol X a sorjátékos, Y az oszlopjátékos kevert stratégiáinak halmaza.
Könny¶ belátni, hogy stratégiailag ekvivalens játékok N EP halmazai
megegyez-nek, ami egyébként a stratégiai ekvivalencia szokásos deníciója. Ha egy bimátrix játék stratégiailag ekvivalens egy zéró-összeg¶ játékkal (mátrixjátékkal), akkor stra-tégiailag zéró-öszeg¶ játéknak nevezzük. Ezeknek a játékoknak több érdekes tulaj-donsága van, amelyek közül jelen kontextusban csak a következ® két állítás fontos számunkra.
2.5. tétel (Szükséges feltétel, Moulin és Vial (1978)). Ha egy bimátrix játék straté-giailag zéró-összeg¶, akkor egyetlen Pareto-dominánsN EP-et sem lehet a W CE-vel
2.6. tétel (Elégséges feltétel, Moulin és Vial (1978)). Ha (x, y) egy teljesen
ke-vert (minden akciót pozitív valószín¶séggel játszanak) N EP-je az (A, B) bimátrix
játéknak, amely nem stratégiailag zéró-összeg¶, akkor van olyan W CE, amelyben a
játékosok kizetései szigorúan Pareto-javítják az (x, y)-hoz tartozó kizetéseket.
Persze akkor is lehet javítani a W CE-vel, ha az elégséges feltétel nem teljesül.
Ezt mutatja Moulin és Vial (1978) következ® példája. 2.7. példa. Tekintsük a következ® bimátrix játékot:
A= 3 1 4 1 5 0 1 0 2 , B = 3 1 1 4 2 0 1 0 5 .
Ennek egy N EP-je van: az els® játékos az els® sort, a második az els® oszlopot
választja és a kizetés(3,3). Könnyen igazolható, hogy a
P= 1 3 0 0 0 1 3 0 0 0 13
egyW CE, amely a (103 ,103)várható kifzetést adja és ez szigorúan Pareto-dominálja
a(3,3)kizetést.
Felmerül a kérdés, hogy nem lehet-e a CE protokollját másképpen
megváltoz-tatni úgy, hogy továbbra is aCE általánosítását kapjuk, de olyan játékok esetében
is (nem mindegyiknél természetesen) el tudunk érni Pareto-jobb kizetéseket, ame-lyeknél aW CEezt nem tudja megtenni. A következ® protokoll alapján Forgó (2010)
aCE egy új általánosítását vezette be, amelyet "puha korrelált egyensúlynak" (soft
correlated equilibrium, SCE) nevezett. A protokoll leírásánál célszer¶ ismét a
"bo-rítékos" interpretációt használni a szemléletesség kedvéért.
Most is azzal kezdünk, hogy a játékvezet® egy köztudott valószín¶ségeloszlás sze-rint kisorsol egy akcióprolt. Minden játékos számára a saját piros borítékjába teszi
a kiválasztott akciót. A fehér borítékjába a többi akciókat. Vegyük észre a W CE
-t®l való eltérést: míg ott minden akciót elhelyezett a játékvezet® a fehér borítékba, itt a kiválasztott (piros borítékban lév®) akciót nem. Innent®l kezdve a protokoll ugyanaz. A játékosok szimultán választanak a piros és a fehér borítékok közül. A valószín¶ségeloszlást SCE-nek nevezzük, ha várható értékben egyik játékosnak sem
érdeke a fehér borítékot választani, feltéve, hogy az összes többi a pirosat választotta. Másképpen: annak a kib®vített játéknak, amelyik azzal kezd®dik, hogy a játékosok döntenek, hogy elkötelezik-e magukat a játékvezet®nek való feltétlen engedelmesség mellett,N EP-je az a stratégiaprol, amikor mindenki elkötelezi magát.
Nézzük meg, hogy miképpen tudjuk jellemezni a háromféle korrelált egyensúlyt, a CE-t, a W CE-t és az SCE-t egy lineáris egyenl®tlenségrendszer segítségével n
-személyes véges játékok esetében. Az egyenl®tlenségek az úgy nevezett "ösztönz® feltételek", amelyek annak a várható hasznát, hogy egy játékos engedelmeskedik a játékvezet®nek, hasonlítja össze azzal, amikor ezt nem teszi meg, mindíg feltéve, hogy a többi játékos követi a játékvezet® utasításait.
Legyen G ={S1, . . . , Sn;f1, . . . , fn} egy n-személyes játék normál formában, az
S1, . . . , Sn véges akcióhalmazokkal és az f1, . . . , fn kizet®függvényekkel.
Az ösztönz® feltételeket az i rögzített játékosra írjuk fel és az egyszer¶ség
ked-véért ezt az indexet elhagyjuk ott, ahol ez nem okoz félreértést. A következ® jelöléseket használjuk:
• N ={1, . . . , n}: a játékosok halmaza.
• I = {1, . . . , m}: az i játékos akcióhalmaza, az akciókat az akciók indexei
rep-rezentálják.
• S−: azijátékos kivételével az összes többi játékos akcióhalmazainak Descartes
szorzata (a csonka akcióproliok halmaza). • s− ∈S−: egy csonka akcióprol.
• S ={(j, s−) : j ∈I, s− ∈S−}: a (teljes) akcióprolok halmaza.
• f(j, s−): az i játékos kizetése, ha ® a j akciót játssza, a többiek pedig s−-t.
• p: egy valószín¶ségeloszlásS-en.
• p(j, s−): az a valószín¶ség, amelyet a p eloszlás a (j, s−) akcióprolhoz rendel.
ACE olyanpvalószín¶ségeloszlás, amely mindeni-re, (i∈N)kielégíti az alábbi
ösztönz® feltételt X s−∈S− f(j, s−)p(j, s−)≥ X s−∈S− f(k, s−)p(j, s−)
mindenj, k ∈I-re, vagy ami ezzel ekvivalens
X s−∈S− f(j, s−) p(j, s−) P s−∈S−p(j, s−) ≥ X s−∈S− f(k, s−) p(j, s−) P s−∈S−p(j, s−)
minden j, k ∈ I-re, feltéve, hogy P
s−∈S− p(j, s−) > 0. Itt a baloldalon a kizetés
várható értéke szerepel akkor, ha az i játékos engedelmeskedik a játékvezet®nek,
a jobboldalon pedig annak a kizetésnek a várható értéke, ha a k ∈ I stratégiát
választja függetlenül attól, hogy mi a játékvezet® javaslata.
A W CE olyan pvalószín¶ségeloszlás, amely kielégíti minden i (i∈N)játékos
X j∈I X s−∈S− f(j, s−)p(j, s−)≥ X j∈I X s−∈S− f(k, s−)p(j, s−)
ösztönz® feltételeit minden k ∈ I-re. A baloldalon annak a kizetésnek a várható
értéke van, amit az i játékos kap, ha elkötelezi magát, hogy mindig végrehajtja a
játékvezet® javaslatát, a jobboldalon pedig az a várható kizetés szerepel, amelyet azijátékos akkor kap, ha nem kötelezi el magát és ak ∈I akciót választja. Világos,
hogy a W CE általánosítása a CE-nek, hiszen ösztönz® feltételei a CE bizonyos
ösztönz® feltételeinek összegzésével álltak el®.
AzSCE deniálásohoz kell némi el®készület. Egy rögzítettj ∈I-re tekintsük az