• No se han encontrado resultados

B. Semicontinuidad y Lema de Fatou 53

B.2. Lema de Fatou generalizado

Dentro de los teoremas b´asicos de integraci´on est´an el Teorema de Convergencia Mon´otona, el Teorema de Convergencia Dominada y el Lema de Fatou, los cuales se pueden ver en [3,2]. En este caso los resultados que se presentan a continuaci´on, son correspondientes al Lema de Fatou generalizado.

Definici´on B.2.1. Sea w : X → [1,∞) una funci´on medible. Para cada funci´on medibleu:X →R definimos suw−norma como

kukw := sup

x∈X

|u(x)|

w(x) .

Denoteremos porBw(X) al espacio de Banach de las funciones conw−norma finita.

Dada {wn}una sucesi´on de funciones enBw(X), definimos el l´ımite inferior (su- perior) generalizado como:

w(x) := ´ınf n

l´ım inf

n→∞ (xn) :xn→x o

(B.2) y

w(x) := sup

l´ım sup

n→∞

(xn) :xn →x

, (B.3)

respectivamente.

Lema B.2.1. La funci´on w (respectivamente w) es semicontinua superiormente (inferiormente).

Demostraci´on. Seaρla m´etrica en el espacioX que define la topolog´ıa. Para cada x ∈ X y r > 0, hacemos B(x, r) := {y :ρ(x, y)< r}. Notemos que w puede ser escrito en la siguiente forma:

w(x) = sup

n

´ınfk≥n

y∈B(x,1/n)´ınf wk(y)

.

Fijemos x ∈ X y supongamos que w(x) > d para alg´un n´umero real d. Para probar quew(x) es semicontinua inferiormente en x, necesitamos mostrar que existe δ >0 tal quew(y)> d para cada y∈B(x, δ). Ya que

´ınfk≥n

y∈B(x,1/n)´ınf wk(y)

↑w(x), existe unaN tal que

´ınfk≥l

´ınf

y∈B(x,1/l)wk(y)

> d ∀l > N.

Dadam >2l > l > N y δ:= 12l, entonces tenemos w(y) = sup

n

´ınfk≥n

z∈B(x,1/n)´ınf wk(z)

≥ ´ınf

k≥m

z∈B(x,1/m)´ınf wk(z)

≥ ´ınf

k≥m

z∈B(x,1/l)´ınf wk(z)

≥´ınf

k≥l

z∈B(x,1/l)´ınf wk(z)

> d.

La prueba de la semicontinuidad superior de la funci´on w(x) en x es similar a la anterior comenzando con

w(x) = ´ınf

n sup

k≥n

sup

y∈B(x,1/n)

wk(y)

! .

Lema B.2.2. Sea {µn} ⊂ P(X) una sucesi´on que converge d´ebilmente a alg´un µ0 ∈ P(X). Si {vn} es una sucesi´on de funciones Borel medibles no-negativas en X y w definida como en (B.2), entonces

Z

X

w(x)µ0(dx)≤l´ım inf

n→∞

Z

X

vn(x)µn(dx); (B.4) y si las funciones {vn}son no-positivas, entonces

Z

X

w(x)µ0(dx)≥l´ım sup

n→∞

Z

X

vn(x)µn(dx), (B.5) con w definida como en (B.3).

Demostraci´on. (ver en Lema 3.2 de [17]).

Lema B.2.3. Supongamos que {µn} converge d´ebilmente a alg´un µ0 ∈ P(X) y {wn} es una sucesi´on de funciones en Cw(X) tal quekwnkw ≤b para toda n y para alguna constante b > 0. Si V es una funci´on continua, R

XV(x)µm(dx) < ∞ para cada m≥0 y

Z

X

V(x)µm(dx)→ Z

X

V(x)µ0(dx) (B.6)

cuandom → ∞, entonces Z

X

w(x)µ0(dx)≤l´ım inf

n→∞

Z

X

wn(x)µn(dx) (B.7)

y

Z

X

w(x)µ0(dx)≥l´ım sup

n→∞

Z

X

wn(x)µn(dx) (B.8) Demostraci´on. Definamos vn(x) := wn(x) +bV(x) y notemos que vn ≥ 0. Para algunax∈X y cualquier sucesi´onxn →xcuando n→ ∞, tenemos

l´ım inf

n→∞ vn(xn) =bV(x) + l´ım inf

n→∞ wn(xn).

Por tanto v(x) = bV(x) +w(x), x∈X, y consecuentemente Z

X

v(x)µ0(dx) =b Z

X

V(x)µ0(dx) + Z

X

w(x)µ0(dx) Aplicando (B.4) a la sucesi´on{vn} y (B.6), f´acilmente obtenemos

l´ım inf

n→∞

Z

X

wn(x)µn(dx) +b Z

X

V(x)µ0(dx) = l´ım inf

n→∞

Z

X

vn(x)µn(dx)

≥ Z

X

v(x)µ0(dx) = Z

X

w(x)µ0(dx) +b Z

X

V(x)µ0(dx), lo cual implica (B.7).

Similarmente (B.8) se sigue de (B.5) tomando vn(x) :=wn(x)−bV(x)≤0.

Ap´ endice C

Varios resultados

C.1. Teorema de punto fijo de Banach

Definici´on C.1.1. Dado (X, d) un espacio m´etrico. Un operador T : X → X es llamado una contracci´on si existe un n´umero 0≤τ <1 tal que

d(T x1, T x2)≤τ d(x1, x2)

para todox1, x2 ∈S. En este caso τ es llamado el m´odulo de T.

Proposici´on C.1.1. (Teorema del puto fijo de Banach) Un operador de con- tracci´onT en un espacio m´etrico completo (X, d) tiene un ´unico punto fijo x. Mas a´un,d(Tnx, x)≤τnd(x, x) para todo x∈X,n = 1,2, . . ., donde τ es el m´odulo de T, yTn :=T(Tn−1) para n= 1,2, . . ., con T0 :=identidad.

C.2. Teorema minimax de Fan

Antes de enunciar el teorema minimax estableceremos la siguiente definici´on.

Definici´on C.2.1. Seaf una funci´on que toma valores reales en el espacio producto X×Y de dos conjuntos arbitrarios X, Y (no necesariamente topol´ogicos).f se dice ser:

(a) convexa enX si para cualquiera dos elementos x1, x2 ∈ X y n´umero α ∈[0,1], 57

existe un elementox0 ∈X tal que

f(x0, y)≤αf(x1, y) + (1−α)f(x2, y) para todo y∈Y .

(b) c´oncava en Y si para cualquiera dos elementos y1, y2 ∈ Y y β ∈ [0,1], existe y0 ∈Y tal que

f(xy0)≥βf(x, y1) + (1−β)f(x, y2) para todo x∈X.

Teorema C.2.1. Sean X, Y dos espacios m´etricos compactos y f : X ×Y → R. Supongamos que, para caday∈Y,f(x, y) es s.c.i. enX; y para cada x∈X,f(x, y) es s.c.s. en Y. Entonces:

(i) La igualdad

m´ınx∈X m´ax

y∈Y f(x, y) = m´ax

y∈Y m´ın

x∈Xf(x, y) (C.1)

se tiene, si y solo si la siguiente condici´on se satisface: Para cualquiera dos conjuntos finitos {x1, x2, . . . , xn} ⊂X y {y1, y2, . . . , ym} ⊂ Y, existe x0 ∈X y y0 ∈Y tales que

f(x0, yk)≤f(xi, y0) (1≤i≤n,1≤k ≤m).

(ii) En particular, si f es convexa en X y c´oncava en Y, se tiene (C.1).

Demostraci´on. (ver [7]).

Para ver m´as resultados minimax vea [8].

C.3. Teorema del M´ aximo de Berge y Teorema de Selecci´ on medible

Los elementos que intervienen en los siguientes resultados est´an definidos en el Ap´endice A.2 y B.1. Cuyas pruebas se pueden consultar en el Cap´ıtulo 17 de [1] . Lema C.3.1. Seaϕ:X Y una correspondencia s.c.i. entre espacios m´etricos y la funci´onf :Grϕ→Rsemicontinua inferiormente. Se define la funci´on real extendida m:X →R como

m(x) = sup

y∈ϕ(x)

f(x, y).

Entonces la funci´onm es semicontinua inferiormente.

Lema C.3.2. Seaϕ:X Y una correspondencia s.c.s. entre espacios m´etricos con valores compactos no vac´ıos y la funci´on f :Grϕ→R semicontinua superiormente.

Se define la funci´onm :X →R como

m(x) = m´ax

y∈ϕ(x)f(x, y).

Entonces la funci´onm es semicontinua superiormente en X.

Teorema C.3.3. (Teorema del M´aximo de Berge)Sea ϕ:X Y una corres- pondencia continua entre espacios m´etricos con valores compactos no vac´ıos y su- pongamos que la funci´on f :Grϕ→R es continua. Se define la funci´onm :X →R como

m(x) = m´ax

y∈ϕ(x)f(x, y) y la correspondencia µ:X Y de maximizadores por

µ(x) ={y∈ϕ(x) :f(x, y) =m(x)}.

Entonces

(1) m es continua,

(2) la correspondencia µ toma valores compactos no vac´ıos, (3) la correspondencia µ es s.c.s.

Teorema C.3.4. (Teorema de Selecci´on medible)SeanX yY espacios de Bo- rel, ϕ:X Y una correspondencia con valores compactos no vac´ıos y supongamos que la funci´on u : Grϕ → R es Borel medible tal que u(x,·) es s.c.s. en ϕ(x) para cada x ∈ X. Entonces existe un selector Borel medible f :X → Y para cada ϕ tal que

u(x, f(x)) = m´ax

y∈ϕ(x)f(x, y) para cada x∈X.

M´as a´un, la funci´onm definida por m(x) = m´axy∈ϕ(x)u(x, y) es Borel medible.

Similarmente, si u es s.c.s. en ϕ(x) para cada x ∈ X, entonces existe un selector medibleg :X →Y para ϕtal que

u(x, g(x)) = m´ın

y∈ϕ(x)f(x, y) para cada x∈X, y, la funci´on v definida por v(x) = m´ıny∈ϕ(x)u(x, y) es Borel medible.

Demostraci´on. (ver Himmelberg en [15]).

Bibliograf´ıa

[1] C.D. Aliprantis, K.C. Border, Infinite Dimensional Analisys, Springer- Berlag, Berlin, 2006.

[2] R. B. Ash, C.A. Dol´eans-Dade,Probability and Measure Theory, Academic Res, 2000.

[3] R. B Ash, Real Analysis and Probability, Academic Press, New York, 1972.

[4] J.-P. Aubin, Optima and equilibria, Springer-Verlag, Berlin, 1993.

[5] D. P. Bertsekas, S. E. Shreve, Stochastic Optimal Control: The Discrete Time Case, Academic Press, New York, 1978.

[6] L. Devroye, G. Lugosi, Combinatorial Methods in Density Estimation, Springer, New York, 2001.

[7] K. Fan, Minimax theorems, Proc. Nat. Acad. Sci. USA, 39 (1953), pp. 42-47.

[8] J. B G. Frenk, G. Kassay, J. Kolumb´an,On equivalent results in minimax theory, European Journal of Operational Research, 157 (2004), 46-58.

[9] E. I. Gordienko, J. A. Minj´arez-Sosa, Adaptive control for discrete-time Markov processes with unbounded costs: Discounted criterion, Kybernetika, 34 (1998), pp. 217–234.

[10] O. Hern´andez-Lerma, Adaptive Markov Control Processes, Springer-Verlag, New York, 1989.

[11] O. Hern´andez-Lerma, R. Cavazos-Cadena,Density estimation and adap- tive control of Markov processes: Average and discounted criteria, Acta Appl.

Math., 20 (1990), pp. 285–307.

61

[12] O. Hern´andez-Lerma, J. B. Lasserre,Discrete-Time Markov Control Pro- cesses: Basic Optimality Criteria, Springer-Verlag, New York, 1996.

[13] O. Hern´andez-Lerma, J. B. Lasserre, Further Topics on Discrete-Time Markov Control Processes, Springer-Verlag, New York, 1999.

[14] N. Hilgert, J. A. Minj´arez-Sosa, Adaptive control of stochastic systems with unknown disturbance distribution: Discounted criteria, Math. Methods Oper. Res., 63 (2006), pp. 443–460.

[15] Hilmmelberg, C. J. Parthasarathy, Van Vleck, Optimal plans for dy- namic programming problems, Math. Oper. Res. 1 (1976), pp. 390-394.

[16] C. J. Himmelberg, F. S. Van Vleck,Multifunctions with values in a space of probability measures, J. Math. Anal. Appl., 50 (1975), pp. 108-112.

[17] A. Ja´skiewicz, A. S. Nowak,Zero-sum ergodic stochastic games with Feller transition probabilities,SIAM J. Control Optim., 45 (2006), pp. 773–789.

[18] H.-U. K¨uenle, On Markov games with average reward criterion and weakly continuous transition probabilities, SIAM J. Control Optim., 45 (2007), pp.

2156–2168.

[19] E. Michael,Continuos selections I, Ann. Math., 63 (1956), pp. 361-382.

[20] J. A. Minj´arez-Sosa,Nonparametric adaptive control for discrete-time Mar- kov processes with unbounded costs under average criterion, Appl. Math. (War- saw), 26 (1999), pp. 267–280.

[21] J. A. Minj´arez-Sosa, Approximation and estimation in Markov control pro- cesses under a discounted criterion, Kybernetika, 40 (2004), pp. 681–690.

[22] J. A. Minj´arez-Sosa, O. Vega-Amaya,Asymtotically optimal strategies for adaptive zero-sum discounted Markov games, SIAM SIAM J. Control Optim. 48 (2009), pp. 1405-1421.

[23] J. A. Minj´arez-Sosa, O. Vega-Amaya, Averange optimal strategies for zero-sum Markov games with unknown disturbance distribution on one side, (en preparaci´on).

Documento similar