El objetivo de este trabajo es analizar resultados recientes que generalizan el Lema de Fatou cuando la secuencia de medidas converge débilmente. Asimismo, se establecen condiciones bajo las cuales se obtiene la correspondiente desigualdad de Fatou cuando la secuencia de medidas converge débilmente.
Introducci´ on
Lema de Fatou para funciones acotadas inferiormente
Ahora, si consideramos una secuencia de funciones {gn}n≥1 en lugar de una sola función g en el Teorema 1.2.1, podemos cambiar ligeramente las condiciones para obtener la misma desigualdad. Dado que fn ≥gn, del lema de Fatou se deduce que para funciones no negativas aplicadas a la secuencia {fn−gn}n≥1.
Integrabilidad uniforme y la desigualdad de Fatou
Además, el siguiente ejemplo muestra que podemos tener integrabilidad uniforme y no satisfacer la condición del Teorema 1.2.1. El siguiente ejemplo muestra que se cumple la condición (1.3) y que la secuencia de partes negativas de las funciones no es uniformemente integrable.
Convergencia de sucesiones de medidas
Notemos que de las definiciones y observaciones anteriores se deduce que si una secuencia de medidas {μn} en un espacio métrico converge fuertemente a una medida finita μen S, entonces {μn} converge débilmente a μcuando→. Sin embargo, como veremos en el siguiente ejemplo, una serie de mediciones pueden converger débilmente y no converger fuertemente.
Lema de Fatou para sucesiones de medidas
Sea (S,Σ) un espacio medible, {μn} ⊂ M(S) un conjunto de medidas que converge fuertemente a µ∈ M(S), y {fn} un conjunto de funciones medibles en S. El conjunto ´one de medidas de probabilidad {µn}n≥1 converge fuertemente (y por lo tanto débilmente) a la medida de probabilidad µ, donde µ(A) = 2λ(A∩[12,1]),.
Lema de Fatou para convergencia d´ ebil de medidas 17
Lema de Fatou generalizado
Ahora, considere una secuencia {fn}n≥1 de funciones medibles no negativas en S con valores enR. Sea S un espacio métrico arbitrario, {µn} ⊂ P(S) una secuencia débilmente convergente en µ∈P(S), y {fn} sea una secuencia de funciones medibles en S con valores en R. Sea S sea un espacio métrico arbitrario, {µn} ⊂ P(S) sea una secuencia que converge débilmente en µ ∈ P(S) y {fn} sea una secuencia de funciones medibles en S con valores en R.
La secuencia {fn} de funciones medibles con valores en R se llama uniformemente integrable (u.i.) con respecto a una secuencia de medidas {μn} ⊂ M(S) si. Sea (S,Σ) un espacio medible, {μn} ⊂ M(S) una secuencia de medidas y {fn} una secuencia de funciones medibles en S con valores en R. Sea S un espacio métrico, { µn } una secuencia de medidas que convergen débilmente a µ∈ M(S) y {fn} una secuencia de funciones medibles en S con valores en R tales que {fn−} a.u.i.
Sea S un espacio métrico, {µn} un conjunto de medidas en S que converge débilmente a µ ∈ M(S) y {fn} un conjunto de funciones medibles en S con valores enR. Entonces la desigualdad (2.21) se satisface si existe un conjunto de funciones medibles {gn} en S con valores en R tales que fn(s)≥gn(s) para cada n ∈N, s∈S y.
Igualdad del l´ımite inferior y el l´ımite inferior generalizado
Consideremos las siguientes nociones de semiequicontinuidad superior e inferior para una serie de funciones. La secuencia {fn} es semiequicontinua inferior (en S) si es semiequicontinua inferior en todos los s∈S. La secuencia de funciones {fn} es semiequicontinua a continuación ya que para cada >0 y s∈S,.
Una secuencia de funciones con valores reales {fn} en S es equicontinua en s∈S si la secuencia es semiequicontinua superior e inferior en s ∈S. Supongamos que la secuencia de funciones {fn} no es en sí misma semiequicontinua. 2.38) Si la sucesión {nk} está acotada (por un entero positivo C), entonces (2.38) contradice la semicontinuidad inferior de la función tfn,n = 1,2,. A continuación damos un contraejemplo, obteniendo que la secuencia no es semiequicontinua en sí misma.
Si la secuencia {fn} converge precisamente a f en S, entonces {fn} es semiequicontinua a continuación en S. Si tenemos igualdad (2.28) para todos los s ∈ S, entonces el teorema 2.3.7(ii) implica que { fn } es semiequicontinua a continuación en Dado que la secuencia de funciones {fn} converge precisamente en f.
Lema de Fatou en su forma cl´ asica para sucesi´ on de medidas
Sea S un espacio métrico y sea {fn} una secuencia de funciones reales, semicontinuas inferiores a S, que uniformemente semiconvergen desde abajo a una función real f, semicontinua inferior a S. Sea S un espacio métrico, { µn}a secuencia de medidas en S que converge débilmente k µ∈ M(S), y {fn}una secuencia de funciones medibles en S con valores en R tales que l´ımn→∞,s0→sfn(s0) existe µ- c.s., s ∈S. Esto significa que cuando la probabilidad de transición es débilmente continua, tenemos que la secuencia de medidas de probabilidad {Q(·|xn, an)} converge débilmente a la medida Q(·|x, a) y cuando la probabilidad de transición es fuertemente continua { Q(· |xn, an)}.
Recuerde que una función f es semicontinua inferior en U si los conjuntos de niveles Df(λ), λ∈R, son cerrados, además la función f es inf-compacta en U si los conjuntos Df(λ), λ ∈ R, son compactos . Dado que el límite de una secuencia monótona creciente de funciones semicontinuas inferiores es nuevamente una función semicontinua inferior, Vα ∈ L(X). Definamos una nueva función de costos ˆc := c−M ≥ 0, y denotemos las funciones de valor correspondientes por ˆVn,α y ˆVα.
Dado que la función superior sobre cualquier conjunto de funciones semicontinuas inferiores es una función semicontinua inferior, entonces u es semicontinua inferior. Para una función f :U→Rdefinida en un espacio métrico U, considere los conjuntos de niveles Df(λ) (o Df(λ;U)). A.1) De la definición A.0.1 tenemos que una función f es semicontinuamente inferior en U si todos los conjuntos de niveles Df(λ) son cerrados.
Procesos de Control de Markov 36
Modelo de control
La función medible c:K → R se llama función de costo de etapa y suponemos que está acotada desde abajo. El modelo de control representa un sistema estocástico controlado observado en momentos = 0,1. Al indicar el estado del sistema y el control (acción) aplicado en el momento t, la evolución del sistema se puede describir de la siguiente manera.
Una vez realizada la transición al nuevo estado, se elige un nuevo control y se repite el proceso. Si el número de periodos de decisión es finito, decimos que el modelo tiene un horizonte finito; En otro caso decimos que el horizonte es infinito.
Pol´ıticas de control
En otras palabras, una política es determinista de Markov si todas las decisiones dependen sólo del estado y el tiempo actuales, y una política es determinista estacionaria si todas las decisiones dependen sólo del estado actual. Sea π={πt} una política de control arbitraria y ν una medida de probabilidad arbitraria sobre X, que llamaremos "distribución inicial". Un proceso estocástico (Ω,F, Pνπ,{xt}) se denomina proceso de control de Markov en tiempo discreto (o también proceso de decisión de Markov).
Si ν se concentra en el estado inicial x ∈ X, entonces escribimos Pxπ y Exπ en lugar de Pνπ y Eνπ respectivamente.
Criterios de optimalidad y problema de control ´ optimo
Hip´ otesis generales y resultados auxiliares
Si la hipótesis 1(i) no se cumple, entonces el problema es trivial, ya que J(x) = ∞ para todo x∈X y cualquier política π sería óptima al costo promedio. Para U ⊂U, si el dominio def se reduce a U, entonces esta función se llama restricción de f a U. Denotemos por L(X) la clase de funciones definidas en Xsemicontinuas a continuación y acotadas a continuación; de K(A) a la familia de subgrupos compactos no vacíos de A, y de Kσ(A) a la familia de todos los subgrupos σ−compactos de A. Para demostrar la existencia de políticas de coste medio óptimo, en el resto del En este artículo consideraremos las siguientes hipótesis: fueron propuestas en [6] y estudiadas bajo un enfoque diferente en [19]. i) c es semicontinua por debajo y acotada por debajo en K;. ii).
En el ejemplo 3.5.5, presentamos el caso en el que se satisfacen las hipótesis 2(i) y (ii), pero la multifunción no es semicontinua. De la definición anterior, podemos reescribir la hipótesis 2 de la siguiente manera: a) c es K-inf-compacta y acotada desde abajo; 45 Esto se debe a que la semicontinuidad inferior de c junto con la condición (ii) de la hipótesis 2 es equivalente a la compacidad K-inf de c; ver Lema B.0.5.
Dado que u ∈ L(X) y Q son débilmente continuas en (x, a), el teorema 1.4.5(iii) implica que el segundo sumando en (3.15) es una función semicontinua inferior y está acotada desde abajo ya que es delimitado desde abajo. Dado que la suma de una función inf-compacta y una función semicontinua acotada inferior es una función inf-compacta, concluimos que ηuα(x,·) es inf-compacta iA( x).
Aplicaci´ on del Lema de Fatou a Procesos de Control de Markov
- Costo total esperado descontado
- Desigualdad de optimalidad en costo promedio
- Ejemplo: Modelos de ecuaciones en diferencias
- Un modelo de inventario
Dado que (i)-(iv) son válidos para los costos ˆc y las funciones ˆVn, α y Vˆα, también son válidos para la función de costo inicial cy para las funciones de valor Vn, α y Va. Desigualdad del optimismo al coste medio. Entonces existe una política estacionaria f que satisface la desigualdad de optimización al costo promedio (3.9) donde u es la función definida en (3.22) y las igualdades (3.10) se cumplen para esta políticaf. La función f es semicontinua hacia abajo en Ssi y sólo si para cada secuencia {xn} convergente a un punto x ∈ S, tenemos que l´ım infnf(xn) ≥ f(x) donde l´ım infnf(xn ) = supn ´ınfk≥nf(xk).
Tenemos que f es semicontinuamente inferior en S y f ≤ f; Además, si g : S → R es semicontinuamente inferior y g ≤f, entonces ≤f. De manera similar, si f := l´ım supy→xf(y) = ´ınfV supy∈V f(y), entonces f , la envolvente superior de f, es semicontinua superior y f ≥f; de hecho, f es el mínimo de todas las funciones scs mayores o iguales a f. Supongamos que existe una secuencia de funciones medibles {gn} en S con valores en R tales que fn(s)≥gn(s) para cada n ∈ norte, s ∈S y. B.1) Si la secuencia de funciones {gn}n≥1 está uniformemente acotada arriba, entonces existe N = 0,1,.
Para una función f con valores en R, definida en un subconjunto U no vacío de un espacio métrico U, considere conjuntos de niveles. Recuerde que una función f es semicontinua en U si todos los conjuntos de niveles Df(λ;U) son cerrados, y una función f es inf-compacta en U si todos esos conjuntos son compactos. Una multifuncional o correspondencia ψ de X a Y es una función tal que ψ(x) es un subconjunto no vacío de Y para todo x∈X.
Una vecindad de un conjunto A es todo conjunto B para el cual existe un conjunto abierto V tal que A⊂V ⊂B. Cualquier conjunto abierto V que se considere A⊂V se llama vecindad abierta de A. i) semicontinua superior en x∈X si para cada vecindad U de ψ(x) existe una vecindad V de x tal que z ∈ V implica que ψ(z) ⊂ U. Decimos que ψ es semiconexo superiormente en x) (es decir