Generación por fuente
3.2 PROGRAMACIÓN DINÁMICA
3.2.1 CARACTERISTICAS DE LOS PROBLEMAS DE PROGRAMACIÓN DINÀMICA El problema de diligencia es un prototipo literal de los problemas de programación
dinámica. En realidad, el ejemplo se diseño así, con el propósito de disponer de una interpretación física literal de la estructura abstracta de estos problemas. Por lo tanto, la manera de reconocer una situación que se pueda formular como un problema de programación dinámica es identificar una estructura analógica como la del problema de la diligencia.
A continuación se presentan y estudian estas características básicas que distinguen a los problemas de programación dinámica.
Escuela Superior de Ingeniería Mecánica y Eléctrica
Despacho Económico Considerando Rampas
de Incremento y Decremento de Unidades Generadoras Página 49
1.- El problema se puede dividir en etapas, cada una de las cuales requiere de una política de decisión.
En el problema de la diligencia se hizo una división literal en cuatro etapas (viajes) que corresponden a las cuatro jornadas de diligencia. La política de decisión en cada etapa fue qué póliza de seguro elegir, esto es, qué destino elegir para la siguiente jornada en diligencia. De manera parecida, otros problemas de programación dinámica requieren tomar una serie de decisiones interrelacionadas, cada una de las cuales corresponde a una etapa del problema.
2.- Cada etapa tiene cierto número de estados asociados con su inicio.
Los estados asociados con cada etapa en el problema de la diligencia son los estados (o territorios) en los que el cazafortunas puede estar al iniciar esa jornada específica del viaje. En general, los estados son las distintas condiciones posibles en las que se puede encontrar el sistema de cada etapa del problema. El número de estados puede ser finito como en el problema de la diligencia o infinito.
3.- El efecto de la política de decisiones en cada etapa es transformar el estado actual en un estado asociado con el inicio de la siguiente etapa quizá según una distribución de probabilidad.
La decisión del cazafortunas sobre su siguiente destino lo conduce de un estado actual al siguiente estado de su viaje. Este procedimiento sugiere que los problemas de programación dinámica se puedan interpretar por medio de las redes.
4.- El procedimiento de solución está diseñado para encontrar una política óptima para manejar el problema completo, es decir, una receta para elaborar la política de decisión óptima para cada etapa en cada uno de los estados posibles.
En el problema de la diligencia, el procedimiento de solución construyo una tabla de cada etapa (n) que percibe la decisión óptima
( )
*n
x para cada estado posible (s). Así, además de identificar las tres soluciones óptimas (rutas óptimas) para el problema completo, los resultados muestran también como puede proceder el cazafortunas en caso de que sea desviado a un estado que no se encuentra en la ruta óptima. En cualquier problema, la programación dinámica proporciona este tipo de receta política sobre qué hacer en todas las circunstancias posibles a esto se debe que la decisión real que se toma al llegar a un estado en particular se llama política de decisión. Proporcionar esta información adicional, en vez de solo especificar una solución óptima, una secuencia óptima de decisiones, puede ser muy valiosa en muchas situaciones que el análisis de sensibilidad.
Despacho Económico Considerando Rampas
de Incremento y Decremento de Unidades Generadoras Página 50
5.- Dado el estado actual, una política óptima para las etapas restantes independiente de la política adoptada en las etapas anteriores. Por lo tanto, la decisión inmediata óptima depende solo del estado actual y no de cómo se llego ahí. Este es el principio de optimización de la programación dinámica.
Dado es el lado en donde se localiza el cazafortunas, la política de seguro de vida óptima (y su ruta asociada) desde este lugar en adelante es independiente de cómo llego ahí. En general, en los problemas de programación dinámica, el conocimiento del estado actual del sistema expresa toda la información sobre su comportamiento anterior, información que es necesaria para determinar la política óptima de ahí en adelante. (Esta propiedad es la propiedad markoviana) un problema que carezca de esta propiedad no se puede formular como un problema de programación dinámica.
6.- El procedimiento de solución inicia cuando se determina la política óptima para la última etapa.
La política óptima para la última etapa prescribe la política óptima de decisión para cada estado posible de esa etapa. Es común que la decisión de este problema de una etapa sea trivial, como lo fue en el problema de la diligencia.
7.- Se dispone de una relación recursiva que identifica la política óptima para la etapa n, dada la política óptima para la etapa n+1.
En el problema de la diligencia, la relación recursiva que se obtuvo es
( )
{
( )}
* * 1min
n n sx n nf
s
=
c
+
f
+x
(3.12)Entonces, para encontrar la política óptima de decisiones cuando se comienza en el estado s de la etapa n se necesita encontrar el valor que minimice xn. El costo mínimo correspondiente se tiene al usar este valor de xn para después seguir la política óptima cuando el proceso se encuadra en el estado xn en la etapa n+1.
La formula precisa de la relación recursiva difiere de un problema a otro de programación dinámica, pero se usara una anotación analógica.
N = numero de etapas
n = etiqueta de la etapa actual (n = 1, 2….N) n
Escuela Superior de Ingeniería Mecánica y Eléctrica
Despacho Económico Considerando Rampas
de Incremento y Decremento de Unidades Generadoras Página 51
n
x = variable de decisión de la etapa n.
*
n
x = valor óptimo de xn (dado sn)
(
,)
n n n
f s x =Contribución a la función objetivo de las etapas n. n+1,….N, si el sistema se encuentra en el estado sn en la etapa n, la decisión inmediata es xn, y en adelante se toman decisiones óptimas
( )
(
, *)
s
n n n n n
f s = f s x (3.13)
La relación recursiva siempre tendrá la forma.
( )
{
(
)}
* max , n n n n n f s = f s x o fn*( )
sn =min{
f s xn(
n, n)}
Donde *(
,)
n n n f s x se escribe en términos de *( )
1 1 , n n n ns x f + s + y tal vez alguna medida de la
contribución inmediata de xn a la función objetivo. Lo que hace que la expresión *
( )
n n
f s
sea una relación recursiva es la inclusión d *
( )
1 1n n
f + s + , en el lado derecho, de manera que
( )
*
n n
f s está definida en términos de *
( )
1 1n n
f + s + .
La relación recursiva recure constantemente a las etapas posteriores a la medida que se trabaja hacia atrás unas etapa a la vez. Cuando el número de la etapa actual n disminuye su valor en 1, la nueva función *
( )
n n
f s se obtiene mediante el uso de la función *
( )
1 1n n
f + s + que se obtuvo en la iteración anterior; después, el proceso se repite cada nueva iteración. Esta propiedad se refuerza en la siguiente (y última) característica de programación dinámica. 8. Cuando se usa esta relación recursiva, el procedimiento de solución comienza al final y se mueve hacia atrás etapa por etapa encuentra cada vez la política óptima para esa etapa hasta que encuentra la política óptima desde la etapa inicial. Esta política óptima lleva de inmediato a una solución óptima para el problema completo, es decir, *
1
x para el estado inicial s1 después *
2
x para el estados2 que resulta, luego * 3
x para el estado s3 que se obtiene, y así sucesivamente hasta *
N
x para el estado sN resultante.
Este movimiento hacia atrás se mostró en el problema de la diligencia, en el que se encontró la política óptima, en forma sucesiva donde en cada estado se iniciaba de las etapas respectivas 4, 3, 2 y 1. Para todos los problemas de programación dinámica, se obtiene una tabla como la siguiente para cada etapa
(
n N N= , −1,...)
.Despacho Económico Considerando Rampas
de Incremento y Decremento de Unidades Generadoras Página 52 Tabla 3.6 tabla general para los problemas de programación dinámica
Xn n S
(
)
n nr nf S X
*( ) n n f S * n XCuando se obtiene esta tabla de la etapa inicial
(
N =1)
el problema queda resuelto. Como se conoce el estado de la etapa inicial, la primera decisión está especificada por *1
x en esta tabla. El valor óptimo de las otras variables de decisión queda, a su vez especificado por las otras tablas según el estado del sistema que se obtiene al tomar la decisión anterior. [6]
Escuela Superior de Ingeniería Mecánica y Eléctrica
Despacho Económico Considerando Rampas
de Incremento y Decremento de Unidades Generadoras
CAPITULO 4
En este capítulo se explica la metodología de solución del despacho económico de generación por el método de programación dinámica, y también dando solución
Despacho Económico Considerando Rampas
de Incremento y Decremento de Unidades Generadoras Página 54