Respuestas Simulación
1) ¿Cómo caracteriza en general a un sistema? ¿Qué características tiene un sistema complejo?
Un sistema se define como un conjunto de elementos vinculados entre sí que interactúan en el cumplimiento de una función determinada. Estas entidades se mueven por el sistema. Los movimientos son originados por eventos.
Un sistema muchas veces se ve afectado por cambios en el entorno por lo que es imprescindible definir, según el propósito del estudio, los límites entre el sistema y su entorno.
Los componentes mas importantes que caracterizan a un sistema son:
Entidades: objetos o componentes del sistema que requieren una representación explícita en el modelo. (
Atributos: son las propiedades de cada entidad.
Lista o tabla: colección permanente o temporaria de entidades asociadas ordenadas con algún criterio. La eficiencia de los resultados depende del manejo de las listas favorece rapidez modelo
Actividad: duración de tiempo conocida asociada a un proceso dado, que puede definirse en términos de una distribución estadística.
Noticia de un evento: registro que indica que un evento va a ocurrir en el futuro, asociado con algún dato necesario para ejecutarlo.
En clase el ing Velazco mencionó que la complejidad de un sistema se debía fundamentalmente a:
Gran número de variables involucradas.
Gran número de interrelaciones entre las variables Gran diversidad de tipos de variables y comportamientos
Sólo con el fin de enriquecer la respuesta se agregan a continuación otras características de los sistemas complejos:
Dinámicos: los cambios suelen darse en distintas escalas de tiempo y puede suceder que una variable que en el corto plazo se pareciera mantenerse estable, en el largo plazo varíe radicalmente.
Gobernados por el feedback: nuestras decisiones alteran el estado del sistema causando cambios que dan origen a una nueva situación que influye en nuestras próximas decisiones.
No lineales: los efectos raramente son proporcionales a las causas. Múltiples factores interactúan entre sí.
Dependientes de su historia: muchas acciones son irreversibles y condicionan la evolución futura del sistema.
Auto-organizados: la dinámica del sistema surge espontáneamente debido a las características de su estructura interna.
Adaptativos: las capacidades y las reglas de decisión cambian en el tiempo. Los agentes del sistema aprenden en base a la experiencia y toman decisiones con criterios distintos, no necesariamente mejores.
Anti-intuitivos: la causa y el efecto están separados en tiempo y espacio. Lo que a simple vista parece ser la causa solo es un síntoma del problema. Es difícil encontrar puntos de apalancamiento.
Los efectos a corto plazo normalmente difieren de los efectos a largo plazo. Debido a esto, decisiones estratégicas pueden producir en principio resultados que parecieran ser negativos pero a largo plazo mejoran radicalmente las cosas.
2) ¿ Que entiende por modelo de un sistema, para qué sirve?
Un modelo es una representación simplificada de un sistema que se realiza con el propósito de poder estudiarlo. Se requiere, sin embargo, el nivel de detalle suficiente para poder obtener conclusiones válidas sobre el sistema real. El modelo incluye todos los componentes del sistema que son relevantes para su estudio.
El modelo permite estudiar el sistema sin la necesidad ni siquiera de que el sistema ya exista (es el caso en que se utiliza para diseñar un sistema). Y si bien en algunos casos se hace posible experimentar con el sistema mismo esto puede que sea muy costoso, muy riesgoso, o simplemente poco práctico.
3) ¿ Cuáles son los pasos para modelizar un sistema y que problemas plantea cada etapa?
No existe una receta única que garantice la posibilidad de modelizar un sistema. De hecho, algunos creen que la modelización es más un arte que una ciencia. Sin embargo algunos pasos importantes que no pueden dejar de considerarse son:
Formular el problema
El primer paso consiste en formular el problema e identificar los objetivos y preguntas a ser respondidas por el modelo. Este paso se basa en abstraer los factores esenciales del problema de manera tal de lograr una descripción lo suficientemente precisa como para luego poder ser transcripto a notación matemática.
Debido a que no pueden captarse todos los factores del sistema real se realizan suposiciones que permiten comenzar inicialmente con un modelo más simple e incrementar gradualmente su complejidad. Estos supuestos caen normalmente dentro de dos actividades:
a) Clasificar las variables en dependientes e independientes: se definen las variables que se van a considerar en el modelo y aquellas que inicialmente se consideran despreciables. Al mismo tiempo se definen cuales de los factores de los que depende cada variable se van a considerar y cuales se desprecian.
b) Determinar las interrelaciones entre las variables seleccionadas para su estudio: puede que la complejidad del problema haga que no puedan identificarse las relaciones entre las variables. En ese caso pueden estudiarse sub-modelos que inicialmente se suponen independientes del resto y luego se van conectando gradualmente.
Resolver o interpretar el modelo
Unir los submodelos y tratar de entender integramente las interrelaciones entre ellos.
Muchas veces sucede que al llegar a este paso no se está en condiciones de resolver el modelo. En ese caso es importante considerar la posibilidad de volver al paso anterior y hacer suposiciones adicionales o bien volver al primer paso y redefinir el problema.
Verificar el modelo
Esta etapa consiste en verificar que los parámetros y la estructura lógica del modelo es adecuada.
Validar el modelo
En esta etapa se busca corroborar que el modelo representa adecuadamente la realidad. Se basa en un proceso iterativo de comparación del modelo con el comportamiento actual del sistema y usa las discrepancias entre los dos para mejorar el modelo. Este proceso se repite hasta que la precisión del modelo se juzga aceptable.
4) ¿Qué entiende por simulación de un sistema o proceso y para que sirve?
La simulación es la imitación de un sistema o un proceso del mundo real durante un período de tiempo. Involucra la generación de una historia artificial y la observación de esa historia artificial para deducir conclusiones de las características operativas del sistema real que representa.
La simulación es útil básicamente para:
Estudiar y experimentar el comportamiento de un sistema complejo Obtener ayuda para el diseño de sistemas
Para poder contestar preguntas del tipo que pasa si...?
En el caso de tener que realizar un modelo de simulación se agregan algunas cuestiones al proceso de modelización descripto en la pregunta 3.
En las filminas se pueden observar todas las etapas para realizar un estudio (y no solamente un modelo) de simulación. Básicamente un estudio de simulación puede ser dividido en cuatro fases
1) Descubrimiento y orientación: esta fase esta formada por la formulación del problema y la planificación del proyecto.
2) Modelización: esta fase incluye la construcción del modelo conceptual, el modelo de datos, el modelo operacional, la codificación , la verificación y la validación. 3) Corrida del modelo: esta fase incluye el diseño experimental, la experimentación, el
análisis y las conclusiones.
4) Implementación: esta fase incluye la presentación final y la implementación.
Las cuestiones adicionales que se plantean al realizar un modelo de simulación surgen del análisis de la fase 2 del estudio de simulación antes mencionado y son las siguientes:
La construcción de un modelo de datos
El modelo operacional y la codificación del modelo en un lenguaje de simulación o bien su ingreso a un software de simulación.
Si la pregunta apunta a las cuestiones adicionales que agrega realizar un estudio de simulación en comparación con solo modelizar un sistema, entonces los aspectos a incluir también deben tener en cuenta las fases 1, 3, y 4.
También es importante recordar (no está mencionado dentro de los pasos del estudio de simulación pero si fue mencionado en clase) la necesidad de formar un equipo de trabajo y definir los roles que van a cumplir cada uno de los integrantes.
6) Qué diferencias existen entre la simulación continua y la Discreta
Simulación continua: el estado de las variables cambia en una forma CONTINUA a través del TIEMPO.
Estado de la variable
Tiempo
Simulación discreta: el estado de las variables cambia sólo en punto DISCRETOS a través del TIEMPO debido a ocurrencia de eventos (cambio de la evolución de las variables se da por eventos que modifican el estado del sistema)
la variable
Tiempo
Cabe remarcar que NINGUN sistema es completamente continuo o completamente discreto.
7) Qué aplicaciones de modelos de simulación conoce? Describa por lo menos una de ellas.
Las más fáciles que se me ocurren para acordarse son: un sistema de colas común y corriente y el problema de estimación de demanda del canillita. Este último, por ejemplo, podemos describirlo en función de sus entidades, atributos, actividades, eventos y variables de estado (acordarse de que están pueden describir unívocamente el estado de un sistema).
Problema del canillita (Simulación de la Demanda).
Entidades: Bajada diaria de Revistas y Periódicos (Es decir las entidades son los diarios y revistas que adquiere el canillita desde el distribuidor).
Atributos: Vigencia (Diario o Revista. Es decir si todavía sigue vigente. Este atributo se transforma en NO cuando paso un día para el diario o pasaron 7 para la revista).
Actividades: demanda en días de lluvia y demanda en días de sol. Eventos: Lluvia o Soleado.
Var. De Estado: Sobrantes de diario y Demanda insatisfecha.
8) En el caso de simular un sistema de manufactura que objetivos pueden plantearse? Qué restricciones pueden esperarse? En el caso de HP que resultados se obtuvieron? Sistema de manufactura: en un proceso industrial, la simulación permite:
- Visualizar el movimiento de las partes y su interacción con el reto de los componentes del proceso
- Evaluar el flujo de las partes a través del sistema - Examinar casos de demanda conflictiva de recursos - Evaluar cambios previstos, antes de su implantación Preguntas típicas:
- Cuáles serán los resultados? - Cómo se podrían modificar? - Cuál es el mejor diseño?
- Cuál es la confiabilidad del sistema? - Cuál es el impacto en los cambios?
Hewlett Packard utilizó simulación para obtener recomendaciones para cambios para mejorar la performance de su sistema de producción de impresoras pues no se alcanzaban las metas de producción.
Los beneficios que obtuvo fueron un aumento en el ingreso y en la productividad (costo competitivo).
9) Que ventajas y desventajas puede mencionar de la modelización por simulación Ventajas de la Simulación Desventajas de la Simulación Flexibilidad para modelar los
procesos tal como son Permite introducir: el Factor
probabilística y Reglas de decisión
Salidas gráficas = Resultados comprensibles
Única alternativa en sistemas complejos.
Permitehacer uso del tiempo pudiendo acelerarlo o dejarlo más lento.
Avances en los paquetes de software para simulación (más simples, herramientas
estadísticas, etc)
Resultados aproximados. Capacitación en la herramienta
a utilizar.
Resultados a veces difíciles de interpretar.
Modelo costoso (Fuerza bruta: Prueba y Error).
A veces debe requerirse de mucho tiempo.
10) Qué entiende por simulación de Montecarlo? Cuándo la utilizaría?
La simulación de Monte Carlo es un tipo de simulación ESTATICA en que se asignan distribuciones probabilísticas a las variables de entrada y se obtiene una distribución de probabilidad para la salida. Donde usarla donde el tiempo no juegue un rol en el modelo (i.e: Simulación de escenarios estáticos).
11. Cuales son los elementos básicos de un modelo de simulación discreta?
Un modelo está compuesto por un conjunto de relaciones que describen un sistema en términos de estados, entidades y sus atributos, eventos y actividades.
12. Cómo se formula el proyecto para realizar un modelo de simulación? Como se organiza el grupo del proyecto? Que cuidados deben tenerse?
Uno de los principales cuidados que deben tenerse es si la simulación es el método apropiado para encarar el problema. Si se supone que lo es, el proyecto debe incluir sistemas alternativos que requieran considerarse y un método para evaluar la efectividad de éstos para describir el objeto de estudio.
Además debe detallarse el número de personas involucradas en el proyecto, el costo del mismo, los días necesarios para cada fase del trabajo y los resultados esperados al final de cada fase.
Definido el problema debo establecer el Plan del Proyecto. Este requiere establecer de antemano los roles, objetivos, etapas del proyecto, indicadores de control, etc.
El grupo total del proyecto puede dividirse entre aquellos que tienen las competencias para obtener información y aquellos que tienen las competencias para realizar el proyecto (software, conocedor del proyecto, dirección del proyecto, etc.)
También es necesario tener un plan de contingencias.
13. Que entiende por evento? Que entiende por estado? Ejemplifique.
Evento: ocurrencia instantánea que cambia el estado del sistema (en simulación discreta la ocurrencia es discreta); entre eventos el sistema permanece inalterado. Ej.: llegada o partida de un cliente, un nacimiento, etc.
Estado: colección de variables que contienen información necesaria para describir el sistema en cualquier momento.
Ej.: número de clientes en una cola, aviones en un aeropuerto, etc. 14. Que es el procesamiento de listas? Por que es importante?
Lista: colección de entes asociados permanentemente o temporalmente, ordenados de alguna manera lógica. Ej.: clientes en una cola ordenados por momento de llegada (FIFO) o por prioridad (pacientes en sala de espera de un hospital, según gravedad), etc.
LEF: contiene eventos futuros ordenados cronológicamente. En el momento en que comienza una actividad, se registra un evento en la LEF, donde el tiempo o instante de ocurrencia del evento está definido por el instante en que finaliza dicha actividad. Además se especifica el tipo de evento (p.e.: fin de un servicio).
El procesamiento de listas abarca métodos para el manejo en memoria de listas de entidades o listas de eventos futuros. En simulación por computadora, cada registro (entidad o evento) se almacena en un lugar físico de la memoria. Hay dos opciones:
Tablas/Arrays: los registros se ubican contiguos en la memoria. Forma una matriz donde cada fila es un registro; R(i) representa el i-ésimo registro. Su ventaja es que puede encontrarse un determinado registro directamente. Su desventaja es que cada array debe sobredimensionarse (puede haber más de una) para que cualquier lista quepa en ella; esto hace que se ocupe gran cantidad de memoria.
Con arrays hay dos métodos de ordenar los registros:
Posiciones ordenadas: primer reg. en R(1), segundo en R(2),…, R(tailptr). Este
método es ineficiente para listas largas. Si se debe agregar un ítem en cualquier lugar (excepto el último) deben desplazarse hacia abajo los que le siguen.
Posiciones no ordenadas: una variable, el headptr, apunta al primer registro de la
lista. (headptr = 11 indica que el R(11) es el primero de la lista). Los registros tienen un campo que indica qué registro es el siguiente. Ej. para lista de entidades:
R(i) = [identificación, tiempo de arribo, próximo registro]
Alocación dinámica: en este caso los registros no necesitan ser guardados en zonas contiguas de memoria. Cada registro tiene un campo con un índice que indica en qué lugar de la memoria se encuentra el siguiente. Cuando un registro no se necesite más, el espacio que ocupaba en la memoria será liberado quedando disponible.
Para acceder a un registro cualquiera, se debe recorrer la lista hasta ubicarlo.
La importancia del procesamiento de las listas radica en que permite mantener todo ordenado y por ende favorece la efectividad del modelo en cuanto a rapidez. La eficacia de los resultados también depende del buen manejo de las listas.
15. Que lenguajes de programación para simulación conoce? Que características tienen?
Los lenguajes para simulación facilitan el desarrollo y ejecución de las simulaciones.
- Existen lenguajes de programación de propósitos generales o no específicos como FORTRAN, Visual Basic, C y C++. Este último no fue diseñado específicamente para uso en simulación, aunque se utiliza ampliamente para simulación de eventos discretos. Para ciertas aplicaciones existen paquetes basados en este tipo de lenguajes.
Son para modelos sencillos.
Lentos para simular porque normalmente no poseen buenas técnicas para el procesamiento de las listas.
El analista debe programarlo todo (las muestras generadas, etc)
- Por otro lado, se encuentran lenguajes específicos para simulación como GPSS, SIMAN V, SIMSCRIPT II, SLAM II, etc. GPSS fue diseñado para sistemas de colas relativamente simples (como negocios de compra-venta) pero puede utilizarse para sistemas de gran complejidad. Por su parte SIMAN V, SIMSCRIPT II, SLAM II se orientan a interacciones entre procesos.
Tienen macro funciones o rutinas para acelerar la simulación (procesamiento de listas eficaz)
Diseñados para facilitar la construcción del modelo.
16 - Qué criterios utilizaría para seleccionar el software de simulación? En función del INPUT:
Interfase con algún lenguaje (Aceptar código C, Vbasic, etc) Capacidad de análisis del input
Portabilidad (Correr en PC´s, bajo Windows, etc.) Sintaxis (consistencia, facilidad de aprendizaje, etc.) Depurador de datos interactivo
Flexibilidad de la modelización (Enfoque tipo interacción de procesos) En función del PROCESAMIENTO:
Velocidad de ejecución Tamaño máximo de modelos
Forma de manejo de materiales (Transporters, conveyers, etc.) Replicaciones independientes (Con diferente set de Nros aleatorios) En función del OUTPUT:
Reportes estándares (Longitud promedio de las colas, etc.) Análisis estadístico (Intervalos de confianza)
Salidas gráficas (De barras, Pie charts, etc.)
Facilidad de mantenimiento de datos (Manejo de base de datos) 17- Que ventajas tiene un software con animación del proceso?
La ventaja de que el software permita hacer animaciones del proceso a simular, es que ayuda al creador del modelo a “venderlo”. Es mucho mas fácil convencer a alguien que no esta familiarizado con la técnica de simulación, si le presentamos un “video” acerca de cómo va a funcionar, antes que ponerse a hablar de datos estadísticos y técnicos, que si bien lo validarían, no lo hacen atractivo para su compra.
Por otro lado, nos ayuda a comprender mejor la salida del modelo. 18- Que es y para que sirve el modelo conceptual de un sistema?
El modelo conceptual de un sistema sirve para pasar de la realidad a un modelo abstracto, definiendo la correspondencia que existirá entre los elementos del sistema real y los del modelo. En primer lugar hay que definir los límites del sistema y el propósito del mismo, para ubicar cual va a ser nuestro campo de acción. Luego, hay que ver cuales son los componentes del sistema, identificando las relaciones que hay entre si y su feedback. Una vez identificados los componentes, hay que explicitar como es que interactúan con el contexto y con otros sistemas.
La utilidad del modelo conceptual se basa en que nos permite hacer una simplificación de la realidad, para poder focalizarnos en el problema. Seria imposible modelar la realidad tal cual es, por eso se hacen supuestos y simplificaciones que permiten ver la escencia del problema, sin desviar la atención de lo importante. Posibilita que el árbol no nos tape el bosque.
19. Que tipos de variables y de relaciones entre variables pueden aparecer?
Tipos de Variables
Discretas y Continuas
Independientes, Relacionadas y Aleatorias Variables de Estado y de Flujo
Parámetros y Variables de Decisión Inercia, Umbrales, Triggers y Lags
Relaciones entre Variables
Causa-Efecto Acción- Reaccion
20. Que pasos deben seguirse para elaborar el modelo conceptual?
Pasos (son decisiones a tomar)
Propósito del Modelo: definir si se busca
Resultado o comportamiento Diseño o Mejora del Sistema Descripción o Explicación Operacional o económico Oportunidad o Precisión Objetivos: Factibilidad Simulación Optimización Planeamiento Aprendizaje
Modelo Argumental: se definen las situaciones, consideraciones a hacerse en el
problema. Ej. En el caso de Don Valentín, la ruta, opciones de Don Valentin como dormir siesta, ver que pasa si el carro se rompe, horarios, cargas, tiempos, estado del camino si llueve o no, etc.
Límites y contexto: establecer las limitaciones que se plantearán en el modelo y el
contexto para poder llevar a cabo el estudio.
Estructura y Funciones:
Supuestos y Simplificaciones Variables y Parámetros Relaciones y Funciones Estados, Redes y Flujos Memoria y Evolución
Agentes:
El Dueño del Problema y el Modelizador Los Agentes en el Modelo, Roles e Intereses
Decisiones:
Programadas o Interactivas Relaciones con el Contexto Grados de Incertidumbre
Propósito del modelo
Se espera como resultado el tiempo de transporte de los toneles al pueblo con el carro de Don Valentín en condiciones inciertas de clima. Se trata de diseñar el sistema para que Don Valentín sepa cuanto tiempo le llevará las entregas y cumplir con el plazo acordado con el cliente.
Objetivos y modelo argumental
El objetivo es estimar el tiempo que le llevará llevar los toneles al pueblo para poder cumplir con los clientes. El objetivo se trata de planear el viaje y la salida para llegar en el plazo acordado.
Modelo argumental: la entrega depende de la carga llevada en cada viaje, la ruta elegida
y la velocidad del carro. Pero a su vez, la carga máxima que puede llevar el carro depende del estado y condiciones del carro. La velocidad a la que puede viajar estará condicionada por el estado de los caballos y los caminos. El estado de los caminos depende del clima (las lluvias de hoy y ayer). Pero para estimar el tiempo, es necesario considerar ciertos eventos que pueden ocurrir: lluvias, rotura del carro, siesta de Valentín, horarios en que los carros pueden entrar a la ciudad, el posible cansancio de los caballos y de Don Valentín.
Límites y contexto
El límite está en determinar el tiempo del viaje bajo las variables que se tendrán en cuenta.
Estructura y funciones
Las simplificaciones del sistema son que no se considerarán otros imprevistos que no sean las lluvias, rotura del carro y siesta de Don Valentín y las variables: el carro, los caballos, los toneles, el camino, la ruta, los accidentes, el cansancio, la lluvia y el barro, las decisiones de Don Valentín. Por lo tanto, los resultados serán con ese nivel de precisión.
Agentes y decisiones
El dueño del problema es Don Valentín, y el modelizador es el que se ofrece a analizar el problema y buscar una solución. Don Valentín tiene el interés de poder estimar el tiempo estimado del viaje al pueblo en su carro. El modelizador tiene como objetivo estimar ese tiempo con la mayor precisión posible y luego ver la realidad y que el desvío sea el menor posible. Las decisiones serán tomadas por el modelizador en cuanto a las variables que se incluyen en el modelo y consideraciones que sean de estimaciones de distribuciones de probabilidad para ciertas variables. Las decisiones
pueden ser interactivas con el dueño del problema, en cuanto a estimaciones de tiempo, o consideraciones que el dueño del problema conozca mejor que el modelizador. 22. Que entiende por prototipo y cuando lo desarrollaría?
El prototipo del modelos se desarrolla en base al modelo conceptual.
Prototipo: primer ejemplar de alguna cosa que se toma como modelo para crear otros de la misma clase.
Es algo funcional.
Capta aspectos esenciales. Puede hacerse con Excel.
Desarrollo cuando es caro considerar todo desde un principio y no estoy segura de que vaya a ser útil o no tengo certeza de que va a funcionar.
23. Que métodos pueden aplicarse para la modelización conceptual? Como? Métodos de aplicación:
Diagrama ABC: priorizando las variables más importantes o relevantes.
Análisis de correlación: mediante regresiones, obtener el grado de correlación entre las variables.
Diagrama de relaciones: realizar un diagrama de relaciones entre las variables del modelo.
24. Cuales son los errores típicos que se cometen en la modelización conceptual? Saltear el modelo conceptual
El modelo multipropósito enorme y perfecto (muy global) Buscar todos los datos …que no interesen
Relaciones causa-efecto y nada más Un contexto estático
25. Describa el modelo conceptual de su proyecto 26. Qué es y para qué sirve el modelo de datos?
El modelo de datos es la estructura definitiva de aquellos datos de entrada que sirven de base para simular:
Variables y Parámetros.
Obtención de la información, métodos utilizados. Histogramas y ajuste de distribuciones.
Consistencia con los procesos reales. Relaciones y evolución.
Muestras artificiales.
Información para la validación del modelo. Variabilidad e incertidumbre de los datos. Monitoreo del sistema real.
El modelo de datos sirve para que durante la simulación se generen con la mayor fidelidad posible a la realidad los datos de entrada necesarios.
27. Cómo se obtienen los datos a utilizar en el modelo?
Los tipos de datos dependen de la naturaleza del sistema que se simule. Los datos pueden ser de dos tipos:
- Datos reales: son los datos reales usados “directamente” en el modelo. Son valores realistas y “legales” (son totalmente veraces, es el espejo de la realidad), a veces insuficientes (porque no siempre se puede acceder a todos los datos reales, se tarda mucho tiempo o son muy costosos), probablemente con límites restringidos (solo van a simular lo que pasó en la realidad, se restringe a eso) y con un proceso lento de lectura (se necesita una gran base de datos con todos estos datos reales que producen que el sistema funcione más lentamente).
- Ajuste de distribuciones: es una generación sintética de datos, que va más allá de los valores observables. Requiere un ajuste y validez de dichos valores.
Las dos formas de obtener los datos son:
- Recolectándolos. Esto generalmente requiere una substancial dedicación de tiempo y compromiso de recursos.
- Generando una muestra artificial. Hay veces en las que la obtención de los datos reales no es viable. Entonces, lo que se hace es generar una muestra artificial a partir del conocimiento de la distribución del proceso. Esta muestra responderá a dicha distribución. La distribución se sabe por el conocimiento del proceso y por la opinión de gente experta.
Es importante el concepto de calidad de los datos.
La calidad (precisión) depende de los objetivos (decisiones) del modelo Análisis de sensibilidad del resultado a las variaciones de cada variable Datos “sucios”, incompletos, montañas de datos (que no se necesitan) Variabilidad y validez de los datos
GIGO (Garbage In, Garbage Out)
28. Cómo se analiza el comportamiento de una variable de entrada del modelo? (interpretamos que pregunta sobre el análisis de los datos de entrada).
Los pasos para analizar el comportamiento de una variable de entrada son los siguientes: 1- Obtención de una muestra de datos.
2- Selección de las distribuciones.
3- Realización de ensayos de bondad de ajuste. 4- Generación de muestras artificiales.
29. Cómo puede atribuirse una distribución de probabilidades a una cierta variable? La distribución de probabilidades se puede atribuir mediante dos formas:
- Análisis del proceso: según qué tipo de proceso sea, ya se sabe que ciertas distribuciones lo ajustan bien. Por ejemplo, llegadas de gente se hace con Poisson, tiempo de falla de un componente con Weibull. (ver filmina 6, clase 4)
- Análisis estadístico: según la muestra que se obtuvo de los datos, se construye un histograma de frecuencias a partir del cual se puede ver en primera aproximación la forma que tiene. Luego se estiman los parámetros de la posible distribución, se dibuja la “forma” de la función de densidad de probabilidades y se ve si las dos “formas” son similares.
Una vez elegida la distribución, se tiene que realizar un ensayo de bondad de ajuste para determinar si la distribución elegida es válida para representar los datos reales.
30. Que entiende por proceso estocástico? Que distribuciones aparecen? Ejemplifique. Un proceso estocástico se define como una colección indexada de variables aleatorias (Xt) donde el índice t toma valores de un conjunto T dado. Con frecuencia T se toma como el conjunto de enteros no negativos y Xt representa una característica de interés mesurable en el tiempo t. Por ejemplo, Xt puede representar los niveles de inventario al final de la semana t. El interés de los procesos estocásticos es describir el comportamiento de un sistema en operación durante algunos períodos. Un proceso estocástico tiene la siguiente estructura:
El estado actual del sistema puede estar en una de M + 1 categorías mutuamente excluyentes llamadas estados. La variable aleatoria Xt representa el estado del sistema en el tiempo t, de manera que sus únicos valores posibles son de 0 a M. Los procesos estocásticos proporcionan una representación matemática de cómo evoluciona el estado del sistema físico.
31. Como se mide la bondad del ajuste de una distribución a un histograma dado? Se mide a partir de dos tests: Chi cuadrado y Kolmogorov-Smirnov. Existen más tests pero los más importantes son esos.
El test chi cuadrado formaliza la idea intuitiva de comparar el histograma de la muestra con la forma de la distribución elegida. Este test es válido para muestras grandes, para distribuciones continuas o discretas, cuando los parámetros están estimados por máxima probabilidad. El test comienza por ordenar las n observaciones en i intervalos de clase. El estadístico es:
X02 = (Oi – Ei)2 / Ei con I desde 0 a k.
Página: 13 Simulación. Cursos “A”, “B” y “C”
Año 2004
Simulación. Cursos “A”, “B” y “C” Año 2004
Que tan bueno es el ajuste …?
Que tan bueno es el ajuste …?
•Formaliza estadísticamente la bondad del ajuste–Oirepresenta el Nº de observaciones de un valor en el intervalo i.
–pies la probabilidad que un valor caiga dentro del intervalo bajo la distribución hipotisada.
–Podemos esperar que la frecuencia en el intervalo sea Ei= npi, si tenemos n observaciones
Evaluación de la Bondad del ajuste – Test Chi Cuadrado
fr e c u e n ci a valores i O F u n c ió n valores i p Página: 1
Simulación. Cursos “A”, “B” y “C” Año 2004
Simulación. Cursos “A”, “B” y “C” Año 2004
Chi Cuadrado
Chi Cuadrado
El estadístico seráo sea Asumiendo que Oi– Eitiene una distribución Normal
•
Se puede demostrar que la distribución del estadístico es aproximadamente Chi Cuadrado con k-s-1 grados de libertad•
S = nº de parámetros de la distribución•
Se establece que las frecuencias Ei> = 5 para la validez del test. Evaluación de la Bondad del ajuste – Test Chi Cuadrado
k i i i i E E O 1 2 2 0
k i i i i p p n O 1 2 2 0 Página: 15
Simulación. Cursos “A”, “B” y “C” Año 2004
Simulación. Cursos “A”, “B” y “C” Año 2004
Chi Cuadrado
Chi Cuadrado
Test de Hipótesis-
H0: la variable aleatoria X pertenece a la distribución asumida con los parámetros estimados.-
H1: la variable aleatoria no pertenece a la distribuciónEl Valor crítico es mediante el cual se rechaza la
hipótesis nula si con un nivel de significación de
Evaluación de la Bondad del ajuste – Test Chi Cuadrado
2 1 ,ks
0 2
,ks1 2 Página: 16Simulación. Cursos “A”, “B” y “C” Año 2004
Simulación. Cursos “A”, “B” y “C” Año 2004
Otros
Otros
tests
tests
de la bondad de ajuste
de la bondad de ajuste
Test de Hipótesis
-
H0:Donde:
Evaluación de la Bondad del ajuste – Test Kolmogorov-Smirnov
n i X F n x X x F X X X i i n ) ( con de Nº ) ( ) ( ) ( ) 2 ( ) 1 ( tabulado 1 , ) ( 1 ) ( 1 1 ) ( ˆ , ) ( ˆ max ) ( ) ( ˆ sup
max
max
n i n i i n i n d n i X F X F n i x F x F D observado valor X Fˆ( (i)) .Tiene que tenerse en cuenta al efectuar estos tests el tamaño de la muestra. Los tests de bondad no van a rechazar ninguna distribución si los datos son pocos y van a rechazar todas si los datos son muchos. El rechazo o no rechazo es solo una pieza de la evidencia.
32. Como se analiza la serie de evolución temporal de una variable? Se analiza en función de:
Estacionalidad (período) Comportamiento periódico.
Tendencia (pendiente) Comportamiento lineal con pendiente.
Período abierto/cíclico (período) se deben analizar los comportamientos repetitivos
Irregularidades (variables aleatorias con promedio y varianza) outliers. 33. En que casos es esperable que aparezca una distribución de Poisson? Porque? La distribución de Poisson modela el número de eventos independientes que ocurren en una cantidad de tiempo o espacio fija. Por ejemplo el número de clientes que arriban a una tienda durante 1 hora o el número de defectos encontrados en 30 metros cuadrados de una hoja de metal.
34. En que casos es esperable que aparezca una distribución de Gauss? Por que? La distribución Normal modela la distribución de un proceso que puede ser pensado como la suma de un numero de procesos que lo componen. Por ejemplo, el tiempo para ensamblar un producto tiene distribución normal. Esto es porque es la suma de los tiempos requeridos para cada operación de ensamble.
Es importante notar que la distribución norma admite valores negativos, los cuales pueden ser imposibles para procesos con tiempos.
35. Cómo puede establecerse si la variable se encuentra en régimen estable?
Se puede establecer que la variable se encuentra en régimen estable si no presenta su serie de evolución temporal ninguna tendencia, corrida, estacionalidad, período cíclico o irregularidades.
36. Cómo puede establecerse si dos o más variables están relacionadas?
Si las variables de entrada de un modelo de simulación están relacionadas, dicha relación debe ser determinada y tenida en cuenta en el momento de plantear el modelo. Hay que tener en cuenta además si la relación se mantiene o si se da en un intervalo.
Dos maneras de determinar la dependencia entre variables son: la covarianza y la
correlación. Sean X1 y X2 dos variables aleatorias y i = E(Xi) y i =Var(Xi) la media y la varianza de Xi respectivamente, la covarianza y la correlación dan una medida de la
relación lineal entre las variables mencionadas. Covarianza entre X1 y X2 (para variables discretas)
Cov (X1 y X2) = E(X1 - 1)(X2 - 2) = E(X1X2) - 12 Características de la covarianza:
- Puede tomar valores desde + a -
- Covarianza bastante positiva indica una fuerte relación positiva entre las variables (valores grandes de X1 tienden a ocurrir con valores grandes de X2).
- Covarianza bastante negativa indica una fuerte relación negativa entre las variables. - Covarianza cercana a 0 indica que las variables no están fuertemente relacionadas. - Defecto su valor depende críticamente de las unidades de medición.
Correlación entre X1 y X2
= Cov (X1 y X2)/ 12 Características de la correlación:
- Es independiente de las unidades de medición. - Puede tomar valores desde + 1 a - 1
- menor que 1 en valor absuluto indica sólo que la relación no es completamente lineal, pero todavía puede haber una fuerte relación no lineal.
- = 0 no implica que X1 y X2 sean independientes sino sólo que hay completa ausencia de relación lineal. (X1 y X2 son no correlacionadas)
- = 1 indica la relación positiva más fuerte. - = -1 indica la relación negativa más fuerte.
37. Dada una distribución de probabilidades, cómo puede generarse una muestra artificial?
La simulación de un modelo en el que se hayan definido variables aleatorias requiere contar con secuencias de valores de dichas variables. La forma más directa de resolver tal necesidad consistiría en utilizar secuencias obtenidas de datos históricos. Sin embargo, se requieren en general, para la simulación, más valores de los que se disponen en los datos históricos; además, las condiciones en las que se producen los valores en la realidad pueden ser distintas y menos generales a las que se han definido para el estudio. Por ello, es conveniente siempre que sea factible, obtener primero las distribuciones de probabilidad de las variables y luego, mediante procedimientos estadísticos, generar muestras artificiales (valores necesarios en base a dichas distribuciones).
La generación de las muestras artificiales se realiza con el método de la transformación inversa pues este puede ser utilizado para casi todas las distribuciones usuales en forma eficiente.
Para este método se requiere obtener valores de una variable continua x con una función de probabilidad acumulada
x f x dx
x
F( ) ( ) (f(x): función de densidad de probabilidad) o valores de una variable discreta z con probabilidad acumulada
z p z x F 0 ) ( )( (p(z): probabilidad del valor z).
Dichos valores constituyen una muestra sobre una determinada población teórica definida por su distribución de probabilidad.
El método se basa en realizar la transformación de un número aleatorio uniforme a un valor particular de la variable en consideración.
Dado un número aleatorio uniforme r e igualando la función de probabilidad aculumada r F(x) se obtiene un valor x de la variable haciendo x F1(r). Para
efectuar esta transformación se requiere que la función F-1 pueda ser obtenida explícitamente a partir de la F.
Para una variable discreta con probabilidad acumulada F(x) el método se aplica calculando, para un valor de r, el valor de la variable x que surge de F(x-1)< r < F(x).
Generaci ón de valores aleatorios uniformes (r)
Una variable continua x sigue una distribución uniforme cuando su función de densidad de probabilidad está dada por
a b x f 1 )
Su función de probabilidad acumulada es a b a x x F )
( para a≤x≤b; F(x) = 0 para x<a y F(x) =1 para x>b.
Para generar valores aleatorios el intervalo de la variable uniforme debe ser entre 0 y 1 por lo cual:
f(x) = 1 0≤ x ≤1 y f(x) = 0 de otra forma.
F(x) = 0 para x<0; F(x) = x para 0≤x≤1 y F(x) = 1 para x>1.
Así, los valores x de la distribución uniforme son números reales del intervalo 0,1. Por motivos prácticos se utilizan en forma equivalente números enteros del conjunto 0,1,2,P-2,P-1 donde P es un número entero grande.
En base a ellos se obtienen números fraccionarios mediante la relación
P C r para 0≤ r ≤1 los que se aproximan a los valores de x de la distribución uniforme, siendo mayor la correspondencia a medida que se adopten valores más altos de P.
Los valores de C reciben el nombre de números aleatorios y pueden obtenerse mediante diversos métodos de generación como por ejemplo la función random de Excel. 38. Qué hacemos si no pueden obtenerse datos confiables para una variable?
Existen diversas maneras de obtener información acerca de un proceso aún si no hay datos (por ejemplo porque el sistema no existe) o si estos no son confiables. Entre ellas figuran:
- Consulta a expertos: hablar con personas que tengan experiencia en el proceso o procesos similares puede aportar datos acerca de si el proceso es aproximadamente constante, variable y también acerca de las causas de la variación. Del mismo modo, los expertos pueden dar valores optimistas, pesimistas y probables de los tiempos. - Limitaciones físicas o convencionales: tener presente los límites o fronteras obvios
que restringen los valores de las variables de entrada.
- Naturaleza del proceso: de acuerdo a las características del proceso muchas veces es posible asociarle una distribución aunque no haya datos disponibles.
- Engineering data: los estándares provistos por las compañías o valores de performance pueden servir como punto de partida para las variables de entrada actuando como valor central en la generación de muestras.
- Diseño de experimentos: implicar generar información base a partir del diseño de un modelo más pequeño para luego ampliarlo.
- Modelos robustos: implica generar el modelo de manera que absorba variaciones de información.
- Aproximaciones: las distribuciones uniforme, triangular y beta pueden usarse para generar muestras de variables aleatorias de diversas distribuciones.
La distribución uniforme requiere conocer un intervalo de valores posibles. Tiene como punto negativo que, en la generación de datos, cualquier valor del intervalo es tan probable como el real del proceso. Si además de un intervalo se conoce un valor más probable (por ejemplo el std de una compañía), se utiliza la distribución triangular que asigna mayor probabilidad al valor más probable y una menor a los
extremos del intervalo. La distribución beta requiere conocer la media, valor optimista y pesimista. Se debe tener cuidado con la forma que puede tomar la distribución.
Es fundamental aclarar que, para el caso en que los modelos se construyan en base a los puntos planteados, se requiere realizar un profundo análisis de sensibilidad para asegurar que los resultados del modelo son los esperados.
39. Cómo se diseña el diagrama lógico del modelo? Cómo se organiza su cálculo? Cómo se determinan los indicadores de performance?
40. Cómo se integra el valor de una variable de estado al concluir la simulación? 41. En el caso de ARENA, cuales son las principales funciones programables?
Arena emplea un diseño orientado a objetos para un desarrollo gráfico del modelo. Para poder llevar a cabo la simulación, primero se debe construir el diagrama que describe el flujo de las entidades o componentes del sistema (flujograma).
Para ello, se utilizan diversos módulos que poseen una serie de propiedades que el usuario debe programar. Entre dichas propiedades las principales son:
- Módulo create: permite definir la entrada de entidades al sistema.
- Módulo process: permite ejecutar acciones sobre las entidades, que demoran un cierto tiempo y también usar ciertos recursos del sistema que pueden estar ocupados cuando la entidad los solicita (delay, seize delay, seize delay release, delay release).
- Módulo decide: permite que las entidades se ramifiquen ya sea en forma aleatoria o siguiendo alguna condición especificada.
- Módulo dispose: permite la salida de entidades del sistema. Esto es importante para acelerar el procesamiento de la salida.
42. Cómo se genera una llegada de un elemento al sistema en ARENA?
Al simular el flujo, la llegada de un elemento al sistema se genera de acuerdo a la información suministrada en las propiedades del módulo create. En este módulo es posible definir el nombre del módulo, el nombre de la entidad a crear, el tiempo entre arribos y las unidades a crear por cada arribo, la cantidad máxima de arribos y el tiempo en el cual se realizará la primera creación.
43. En que consiste la validación de un modelo? Qué se valida?
La validación del modelo consiste en asegurar que el mismo representa correctamente el sistema real bajo estudio. Normalmente, la validación se logra a través de la calibración que es un proceso iterativo mediante el cual se va comparando el modelo con la realidad y ajustando las discrepancias hasta reducirlas a un nivel aceptable establecido. Dicho esto, la tarea de validación requiere disponer de datos reales para su comparación
con los resultados obtenidos con el modelo lo que es posible sólo si el sistema modelado existe.
Durante la recolección de datos sobre el funcionamiento del sistema real es imprescindible medir también las condiciones experimentales en las que han sido obtenidos. Dichas condiciones se deben reproducir en la operación simulada del modelo para que los datos reales y los resultados simulados puedan compararse sin distorsiones.
Existen pruebas subjetivas y objetivas para validar. Las subjetivas se refieren a la opinión de expertos mientras que las objetivas requieren la realización de pruebas estadísticas en las que se comparan resultados reales con los obtenidos por el modelo. La validación, aunque suministra información útil sobre la representatividad del modelo con respecto al sistema en estudio, no es concluyente para el rechazo de una determinada configuración de aquel.
Lo que debe validarse es: 1) Los supuestos del modelo
2) Las relaciones de transformación (input-output transformations) del modelo 3) Los usos del modelo: se refiere si el modelo es útil para lo que fue creado. 44. Cómo se validan los supuestos del modelo? Y las relaciones de transformación?
Los supuestos del modelo pueden agruparse en dos categorías: supuestos estructurales y supuestos de datos.
Los supuestos estructurales se refieren a simplificaciones y abstracciones acerca de cómo opera el sistema real. La manera de validar estos supuestos es mediante observación directa durante períodos apropiados de tiempo y consultando a conocedores del tema.
Por otro parte, los supuestos de datos se basan en la recolección de datos confiables y su correcto análisis estadístico. La confiabilidad de los datos se logra mediante la consulta a expertos, pruebas de homogeneidad de datos en el caso de combinar serie de datos obtenidos en diferentes tiempos y pruebas de correlación. El análisis de los mismos consiste en identificar la adecuada distribución de probabilidad, estimar los parámetros de la distribución y finalmente realizar pruebas de bondad de ajuste.
La validación de las relaciones de transformación implica comparar los resultados del modelo con los obtenidos por el sistema real para una determinada entrada. Para ello es necesario disponer de datos del sistema real, es decir, el sistema real debe existir pues de otra forma ésta validación no es posible. Lo que se hace es realizar un ensayo de hipótesis en el que como hipótesis nula, se plantea el valor del sistema real. De esta forma, si la hipótesis nula no se rechaza (en función del nivel de significación () fijado), la versión del modelo planteada se considera válida. De otra forma, el modelo debe ser mejorado hasta que la hipótesis nula no sea rechazada.
45. Cómo se estima el valor medio de una variable de salida del modelo?
El valor medio de una variable X, en un lapso de simulación t, se obtiene en forma muy eficiente mediante el siguiente método:
Se calcula para cada instante en que cambia el valor de la variable X la función acumulada A definida por la expresión:
Al final del lapso t de simulación, donde se llega a un valor de A = Af, el valor medio de X en dicho lapso surge de
Xmedio = Af / t
46. Cómo se determina el tamaño de la corrida necesaria? Detalle el proceso de cálculo.
Para muestras infinitas:
n S t x n1,1/2 donde n S tn1,1/2 = h es la precisión. La
precisión debe estar fijada. Así, 2 2 / 1 , 1 h S t
n n El problema es que tanto S como t dependen de n.
El método de resolución es iterativo. Dado un S, lo que hago es tirar un valor de n y saco su t correspondiente. Con esta t vuelvo a calcular ninfinito y de nuevo el t. Repito esto hasta que n se estabilice.
O sino puedo resolverlo en forma aproximada:
-Reemplazo t por z, correspondiente al valor crítico de la normal -Suponer que S se mantendrá para muestra más largas
- Obtener 2 2 / 1 h S z
n donde S= desvío estándar del n0 inicial de n0 de réplicas
Una aproximación 2 0 h h n
n o donde ho es el half width del no inicial de repeticiones. Vemos que n crece cuadráticamente conforme h decrece.
47. Qué diferencias existen entre la simulación con terminación y sin terminación? Cómo se determinan en cada caso los elementos que conforman la muestre? Ejemplifique.
Simulación con terminación:
Tienen un tiempo establecido de finalización para su corrida Corto plazo
Los datos estadísticos se calculan dentro del período de tiempo natural del sistema. Generalmente analizados mediante Repeticiones Independientes
o Realiza corridas independientes (repeticiones) de la simulación, todas en condiciones idénticas.
o La muestra de cada corrida se asume con distribución aproximadamente normal.
o Para estimar M y S se vale de n corridas utilizando condiciones iniciales y generación de números aleatorios independientes.
n
Y
Y
t
n
ti
1
1
2 1
n
Y
Y
S
n t tEjemplo: Tiempo promedio de espera de los clientes en un banco durante el transcurso de 1 día.
Simulación sin terminación (Sistemas de estado estable)
No tienen un tiempo de duración definido, el horizonte de tiempo puede ser infinito. Largo plazo
Condiciones iniciales de simulación
o Vacío: No hay identidades en el momento 0.
o Condiciones más representativas del sistema simulado.
o No se toman datos en un período inicial (período de estabilización) se toman a partir de Ymw + 1.
Implica que se desperdician datos se soluciona con el método de la media Batch. o Se realiza una corrida larga
o Se eliminan los datos correspondientes al período de estabilización. o Se dividen las observaciones en grupos “batch” mayores que 30
o Las medias de cada grupo se consideran independientes y su media se aproxima a una normal.
o Se calculan M y S igual q antes, pero sobre las medias de los intervalos, no sobre los datos originales.
Ejemplo: línea de ensamblado contínuo.
48. Cómo se determina el tamaño de la corrida si se desea verificar que un nuevo método de trabajo es superior al método que actualmente se aplica en el sistema real? Comparamos 2 métodos (MET1 y MET2). MET1 es el que se viene usando y queremos cambiarlo por MET2 que supuestamente es mejor. Cómo sabemos si es mejor??
H0) La muestra MET2 pertenece a la misma población que MET1 su media se ubica dentro del intervalo de confianza de la distribución muestral (la que tenemos originalmente y que sacamos con MET1. Es normal por ser distribución de medias y con un cierto nivel de confianza se estableces LS y LI para la media)
N Z M N Z M LS LI n n
Mn: media de la muestra : Nivel de confianza
De no conocerse el puede utilizarse S con la distribución t de student.
Si la media de MET2 resulta ser superior a LS, se rechaza la H0 y puede asegurarse que MET2 pertenece a otra población mejor que MET1.
2 2 2 n n n M M Z N LS M
49. Que métodos de reducción de varianza conoce? Para qué sirven? Técnicas de Reducción de varianza
Muestro Estatificado
Método de números aleatorios complementarios No se para qué sirven...alguien sabe???
50. Cómo puede optimizarse un resultado en un modelo de simulación? Como se opera?
El resultado de una simulación Y se encuentra relacionado con variables independientes x1, x2,…, xk, llamadas variables de diseño y usualmente sujetas a control. La verdadera relación entre las mismas se representa mediante un modelo de simulación, que consiste en aproximar esa relación mediante una función matemática. Puede usarse:
Regresión lineal simple Regresión lineal múltiple
La calidad de la regresión deberá verificarse (bondad de ajuste).