B. Semicontinuidad y Lema de Fatou 53
B.2. Lema de Fatou generalizado
Dentro de los teoremas b´asicos de integraci´on est´an el Teorema de Convergencia Mon´otona, el Teorema de Convergencia Dominada y el Lema de Fatou, los cuales se pueden ver en [3,2]. En este caso los resultados que se presentan a continuaci´on, son correspondientes al Lema de Fatou generalizado.
Definici´on B.2.1. Sea w : X → [1,∞) una funci´on medible. Para cada funci´on medibleu:X →R definimos suw−norma como
kukw := sup
x∈X
|u(x)|
w(x) .
Denoteremos porBw(X) al espacio de Banach de las funciones conw−norma finita.
Dada {wn}una sucesi´on de funciones enBw(X), definimos el l´ımite inferior (su- perior) generalizado como:
w∗(x) := ´ınf n
l´ım inf
n→∞ (xn) :xn→x o
(B.2) y
w∗(x) := sup
l´ım sup
n→∞
(xn) :xn →x
, (B.3)
respectivamente.
Lema B.2.1. La funci´on w∗ (respectivamente w∗) es semicontinua superiormente (inferiormente).
Demostraci´on. Seaρla m´etrica en el espacioX que define la topolog´ıa. Para cada x ∈ X y r > 0, hacemos B(x, r) := {y :ρ(x, y)< r}. Notemos que w∗ puede ser escrito en la siguiente forma:
w∗(x) = sup
n
´ınfk≥n
y∈B(x,1/n)´ınf wk(y)
.
Fijemos x ∈ X y supongamos que w∗(x) > d para alg´un n´umero real d. Para probar quew∗(x) es semicontinua inferiormente en x, necesitamos mostrar que existe δ >0 tal quew∗(y)> d para cada y∈B(x, δ). Ya que
´ınfk≥n
y∈B(x,1/n)´ınf wk(y)
↑w∗(x), existe unaN tal que
´ınfk≥l
´ınf
y∈B(x,1/l)wk(y)
> d ∀l > N.
Dadam >2l > l > N y δ:= 12l, entonces tenemos w∗(y) = sup
n
´ınfk≥n
z∈B(x,1/n)´ınf wk(z)
≥ ´ınf
k≥m
z∈B(x,1/m)´ınf wk(z)
≥ ´ınf
k≥m
z∈B(x,1/l)´ınf wk(z)
≥´ınf
k≥l
z∈B(x,1/l)´ınf wk(z)
> d.
La prueba de la semicontinuidad superior de la funci´on w∗(x) en x es similar a la anterior comenzando con
w∗(x) = ´ınf
n sup
k≥n
sup
y∈B(x,1/n)
wk(y)
! .
Lema B.2.2. Sea {µn} ⊂ P(X) una sucesi´on que converge d´ebilmente a alg´un µ0 ∈ P(X). Si {vn} es una sucesi´on de funciones Borel medibles no-negativas en X y w∗ definida como en (B.2), entonces
Z
X
w∗(x)µ0(dx)≤l´ım inf
n→∞
Z
X
vn(x)µn(dx); (B.4) y si las funciones {vn}son no-positivas, entonces
Z
X
w∗(x)µ0(dx)≥l´ım sup
n→∞
Z
X
vn(x)µn(dx), (B.5) con w∗ definida como en (B.3).
Demostraci´on. (ver en Lema 3.2 de [17]).
Lema B.2.3. Supongamos que {µn} converge d´ebilmente a alg´un µ0 ∈ P(X) y {wn} es una sucesi´on de funciones en Cw(X) tal quekwnkw ≤b para toda n y para alguna constante b > 0. Si V es una funci´on continua, R
XV(x)µm(dx) < ∞ para cada m≥0 y
Z
X
V(x)µm(dx)→ Z
X
V(x)µ0(dx) (B.6)
cuandom → ∞, entonces Z
X
w∗(x)µ0(dx)≤l´ım inf
n→∞
Z
X
wn(x)µn(dx) (B.7)
y
Z
X
w∗(x)µ0(dx)≥l´ım sup
n→∞
Z
X
wn(x)µn(dx) (B.8) Demostraci´on. Definamos vn(x) := wn(x) +bV(x) y notemos que vn ≥ 0. Para algunax∈X y cualquier sucesi´onxn →xcuando n→ ∞, tenemos
l´ım inf
n→∞ vn(xn) =bV(x) + l´ım inf
n→∞ wn(xn).
Por tanto v∗(x) = bV(x) +w∗(x), x∈X, y consecuentemente Z
X
v∗(x)µ0(dx) =b Z
X
V(x)µ0(dx) + Z
X
w∗(x)µ0(dx) Aplicando (B.4) a la sucesi´on{vn} y (B.6), f´acilmente obtenemos
l´ım inf
n→∞
Z
X
wn(x)µn(dx) +b Z
X
V(x)µ0(dx) = l´ım inf
n→∞
Z
X
vn(x)µn(dx)
≥ Z
X
v∗(x)µ0(dx) = Z
X
w∗(x)µ0(dx) +b Z
X
V(x)µ0(dx), lo cual implica (B.7).
Similarmente (B.8) se sigue de (B.5) tomando vn(x) :=wn(x)−bV(x)≤0.
Ap´ endice C
Varios resultados
C.1. Teorema de punto fijo de Banach
Definici´on C.1.1. Dado (X, d) un espacio m´etrico. Un operador T : X → X es llamado una contracci´on si existe un n´umero 0≤τ <1 tal que
d(T x1, T x2)≤τ d(x1, x2)
para todox1, x2 ∈S. En este caso τ es llamado el m´odulo de T.
Proposici´on C.1.1. (Teorema del puto fijo de Banach) Un operador de con- tracci´onT en un espacio m´etrico completo (X, d) tiene un ´unico punto fijo x∗. Mas a´un,d(Tnx, x∗)≤τnd(x, x∗) para todo x∈X,n = 1,2, . . ., donde τ es el m´odulo de T, yTn :=T(Tn−1) para n= 1,2, . . ., con T0 :=identidad.
C.2. Teorema minimax de Fan
Antes de enunciar el teorema minimax estableceremos la siguiente definici´on.
Definici´on C.2.1. Seaf una funci´on que toma valores reales en el espacio producto X×Y de dos conjuntos arbitrarios X, Y (no necesariamente topol´ogicos).f se dice ser:
(a) convexa enX si para cualquiera dos elementos x1, x2 ∈ X y n´umero α ∈[0,1], 57
existe un elementox0 ∈X tal que
f(x0, y)≤αf(x1, y) + (1−α)f(x2, y) para todo y∈Y .
(b) c´oncava en Y si para cualquiera dos elementos y1, y2 ∈ Y y β ∈ [0,1], existe y0 ∈Y tal que
f(xy0)≥βf(x, y1) + (1−β)f(x, y2) para todo x∈X.
Teorema C.2.1. Sean X, Y dos espacios m´etricos compactos y f : X ×Y → R. Supongamos que, para caday∈Y,f(x, y) es s.c.i. enX; y para cada x∈X,f(x, y) es s.c.s. en Y. Entonces:
(i) La igualdad
m´ınx∈X m´ax
y∈Y f(x, y) = m´ax
y∈Y m´ın
x∈Xf(x, y) (C.1)
se tiene, si y solo si la siguiente condici´on se satisface: Para cualquiera dos conjuntos finitos {x1, x2, . . . , xn} ⊂X y {y1, y2, . . . , ym} ⊂ Y, existe x0 ∈X y y0 ∈Y tales que
f(x0, yk)≤f(xi, y0) (1≤i≤n,1≤k ≤m).
(ii) En particular, si f es convexa en X y c´oncava en Y, se tiene (C.1).
Demostraci´on. (ver [7]).
Para ver m´as resultados minimax vea [8].
C.3. Teorema del M´ aximo de Berge y Teorema de Selecci´ on medible
Los elementos que intervienen en los siguientes resultados est´an definidos en el Ap´endice A.2 y B.1. Cuyas pruebas se pueden consultar en el Cap´ıtulo 17 de [1] . Lema C.3.1. Seaϕ:X Y una correspondencia s.c.i. entre espacios m´etricos y la funci´onf :Grϕ→Rsemicontinua inferiormente. Se define la funci´on real extendida m:X →R como
m(x) = sup
y∈ϕ(x)
f(x, y).
Entonces la funci´onm es semicontinua inferiormente.
Lema C.3.2. Seaϕ:X Y una correspondencia s.c.s. entre espacios m´etricos con valores compactos no vac´ıos y la funci´on f :Grϕ→R semicontinua superiormente.
Se define la funci´onm :X →R como
m(x) = m´ax
y∈ϕ(x)f(x, y).
Entonces la funci´onm es semicontinua superiormente en X.
Teorema C.3.3. (Teorema del M´aximo de Berge)Sea ϕ:X Y una corres- pondencia continua entre espacios m´etricos con valores compactos no vac´ıos y su- pongamos que la funci´on f :Grϕ→R es continua. Se define la funci´onm :X →R como
m(x) = m´ax
y∈ϕ(x)f(x, y) y la correspondencia µ:X Y de maximizadores por
µ(x) ={y∈ϕ(x) :f(x, y) =m(x)}.
Entonces
(1) m es continua,
(2) la correspondencia µ toma valores compactos no vac´ıos, (3) la correspondencia µ es s.c.s.
Teorema C.3.4. (Teorema de Selecci´on medible)SeanX yY espacios de Bo- rel, ϕ:X Y una correspondencia con valores compactos no vac´ıos y supongamos que la funci´on u : Grϕ → R es Borel medible tal que u(x,·) es s.c.s. en ϕ(x) para cada x ∈ X. Entonces existe un selector Borel medible f :X → Y para cada ϕ tal que
u(x, f(x)) = m´ax
y∈ϕ(x)f(x, y) para cada x∈X.
M´as a´un, la funci´onm definida por m(x) = m´axy∈ϕ(x)u(x, y) es Borel medible.
Similarmente, si u es s.c.s. en ϕ(x) para cada x ∈ X, entonces existe un selector medibleg :X →Y para ϕtal que
u(x, g(x)) = m´ın
y∈ϕ(x)f(x, y) para cada x∈X, y, la funci´on v definida por v(x) = m´ıny∈ϕ(x)u(x, y) es Borel medible.
Demostraci´on. (ver Himmelberg en [15]).
Bibliograf´ıa
[1] C.D. Aliprantis, K.C. Border, Infinite Dimensional Analisys, Springer- Berlag, Berlin, 2006.
[2] R. B. Ash, C.A. Dol´eans-Dade,Probability and Measure Theory, Academic Res, 2000.
[3] R. B Ash, Real Analysis and Probability, Academic Press, New York, 1972.
[4] J.-P. Aubin, Optima and equilibria, Springer-Verlag, Berlin, 1993.
[5] D. P. Bertsekas, S. E. Shreve, Stochastic Optimal Control: The Discrete Time Case, Academic Press, New York, 1978.
[6] L. Devroye, G. Lugosi, Combinatorial Methods in Density Estimation, Springer, New York, 2001.
[7] K. Fan, Minimax theorems, Proc. Nat. Acad. Sci. USA, 39 (1953), pp. 42-47.
[8] J. B G. Frenk, G. Kassay, J. Kolumb´an,On equivalent results in minimax theory, European Journal of Operational Research, 157 (2004), 46-58.
[9] E. I. Gordienko, J. A. Minj´arez-Sosa, Adaptive control for discrete-time Markov processes with unbounded costs: Discounted criterion, Kybernetika, 34 (1998), pp. 217–234.
[10] O. Hern´andez-Lerma, Adaptive Markov Control Processes, Springer-Verlag, New York, 1989.
[11] O. Hern´andez-Lerma, R. Cavazos-Cadena,Density estimation and adap- tive control of Markov processes: Average and discounted criteria, Acta Appl.
Math., 20 (1990), pp. 285–307.
61
[12] O. Hern´andez-Lerma, J. B. Lasserre,Discrete-Time Markov Control Pro- cesses: Basic Optimality Criteria, Springer-Verlag, New York, 1996.
[13] O. Hern´andez-Lerma, J. B. Lasserre, Further Topics on Discrete-Time Markov Control Processes, Springer-Verlag, New York, 1999.
[14] N. Hilgert, J. A. Minj´arez-Sosa, Adaptive control of stochastic systems with unknown disturbance distribution: Discounted criteria, Math. Methods Oper. Res., 63 (2006), pp. 443–460.
[15] Hilmmelberg, C. J. Parthasarathy, Van Vleck, Optimal plans for dy- namic programming problems, Math. Oper. Res. 1 (1976), pp. 390-394.
[16] C. J. Himmelberg, F. S. Van Vleck,Multifunctions with values in a space of probability measures, J. Math. Anal. Appl., 50 (1975), pp. 108-112.
[17] A. Ja´skiewicz, A. S. Nowak,Zero-sum ergodic stochastic games with Feller transition probabilities,SIAM J. Control Optim., 45 (2006), pp. 773–789.
[18] H.-U. K¨uenle, On Markov games with average reward criterion and weakly continuous transition probabilities, SIAM J. Control Optim., 45 (2007), pp.
2156–2168.
[19] E. Michael,Continuos selections I, Ann. Math., 63 (1956), pp. 361-382.
[20] J. A. Minj´arez-Sosa,Nonparametric adaptive control for discrete-time Mar- kov processes with unbounded costs under average criterion, Appl. Math. (War- saw), 26 (1999), pp. 267–280.
[21] J. A. Minj´arez-Sosa, Approximation and estimation in Markov control pro- cesses under a discounted criterion, Kybernetika, 40 (2004), pp. 681–690.
[22] J. A. Minj´arez-Sosa, O. Vega-Amaya,Asymtotically optimal strategies for adaptive zero-sum discounted Markov games, SIAM SIAM J. Control Optim. 48 (2009), pp. 1405-1421.
[23] J. A. Minj´arez-Sosa, O. Vega-Amaya, Averange optimal strategies for zero-sum Markov games with unknown disturbance distribution on one side, (en preparaci´on).