Análisis del criterio jerárquico para la selección de términos en los modelos estadisticos lineales aplicado al diseño de experimentos
103
0
0
Texto completo
(2) II. 07(20)113. ANÁLISIS DEL CRITERIO J ERÁRQUICO PARA LA SELECCIÓN DE TÉRMINOS EN LOS MODELOS ESTADÍSTICOS LINEALES APLICADO AL DISEÑO DE EXPERIMENTOS. FERNANDO PÉREZ MORENO. Proyecto de grado presentado como requisito para optar al título de ingeniero industrial Asesor:. MARIO CASTILLO Profesor Titular Ingeniería Industrial Universidad de los Andes Co-asesor:. ARTURO T. DE ZAN Facultad de Ingeniería Universidad de La Sabana. UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENÍERIA DEPARTAMENTO DE INGENIERÍA INDUSTRIAL BOGOTÁ D.C 2007.
(3) II. 07(20)113 TABLA DE CONTENIDO. 1. INTRODUCCIÓN…………………………………………………………………........1. 2. REVISION BIBLIOGRÁFICA ...………………………………………………….....10 2.1 DISEÑOS EXPERIMENTALES………………………………………………...…10 2.1.1 Diseños factoriales a 2 niveles………………………………………………..11 2.1.2 Diseños factoriales 2 k y modelos lineales ……………………………..….12 2.1.3 Metodología de superficie de respuesta…………………………………….15 2.1.3.1 Estrategias de primer orden…………………………………………….…..17 2.1.3.2 Estrategias de segundo orden………………………………………………20 2.2 AJUSTE DE MODELOS……………………………………………………….….23 2.2.1 Criterios para la selección de términos………………………………….….23 2.2.1.1 Criterio del p-value…………………………………………………….……...23 2.2.1.2 Criterio jerárquico……………………………………………………….…….27 2.2.2 Medidas clásicas de calidad de ajuste……………………………………....34 2.2.2.1 Comparación del ajuste global entre dos modelos………………….….34 2.2.2.2 Predicción de valores futuros en la respuesta…………………….…….39 2.3 SIMULACIÓN DE UN PROCESO…………………………………………….…..44 2.4 PRINCIPALES HALLAZGOS EN LA REVISIÓN BIBLIOGRÁFICA………....47. 3. OBJ ETIVOS Y METODOLOGÍA……………………………………………….…..50. 4. COMPARACION DE CRITERIOS DE AJUSTE DE MODELOS……………..…52.
(4) II. 07(20)113 4.1 ANÁLISIS DE UN CASO…...………………………………………………….….52 4.2 COMPARACION DE LOS MODELOS AJUSTADOS………………………....63 4.2.1 Comparación de los modelos usando la prueba F………………….…….65 4.2.2 Comparación de los modelos usando el criterio AIC…………………..…66 4.2.3 Aptitud de los modelos para predecir valores futuros…………….……..68 4.2.4 Aptitud de los criterios ante el aumento en el número de réplicas…….69. 5. RESULTADOS Y DISCUSIÓN……………………………………………..……….76. 6. CONCLUSIONES Y POSIBLES INVESTIGACIONES FUTURAS …….………80. 7. BIBLIOGRAFIA……………………………………………………………….….......84 ANEXO - USO DE PAQUETE ESTADÍSTICO MINITAB………………………..….86.
(5) II. 07(20)113. LISTA DE TABLAS. 1. Matri z de diseño …………………………………………………………………13 2. Puntos de diseño sobre el camino de la máxima pendiente ……………...59 3. Diseño factorial con puntos centrales………………………………………...60 4. Diseño central compuesto con puntos de estrella…………………………..62 5. Cálculo de los valores AIC……………………………………………………...67 6. Observaciones reales para hacer la simulación……………………………..71 7. Resultados de Prueba F con varias réplicas…………………………………72 8. Comportamiento del AICc con varias réplicas……………………………….73 9. Resultados de Mallow para mustras grandes………………………………..73 10.Cálculo del PRESS para CJ y P……………………………………………….74 11.Cálculo del tamaño del IP para CJ y P………………………………………..74.
(6) II. 07(20)113 LISTA DE FIGURAS. 1. Región de no rechazo ………………………………………………………… 6. 2. Variación en el sabor dado un aumento en el tiempo de cocción………. 8. 3. Interacción entre A y B ………………………………………………………. 14 4. Análisis de la superficie con estrategias de primer orden………………...18 5. Estrategias de primer orden…………………………………………………..20 6. Estrategias de segundo orden………………………………………………..22 7. Diagrama de proceso para hacer predicciones…………………………….39 8. Rango de predicción…………………………………………………………..40 9. Partes de una valor simulado………………………………………………..46 10. Pasos para hacer una simulación…………………………………………..47 11.Camino por la máxima pendiente de crecimiento………………………….59 12.Diseño factorial con puntos centrales……………………………………….60 13.Gráfica del diseño central compuesto con puntos de estrella…………….61 14.Gráfica del modelo CJ………………………………………………………...77 15.Gráfica del modelo P………………………………………………………….78.
(7) II. 07(20)113. Dedico este trabajo a mis padres Carlos Pérez y Alicia Moreno ya que sin su apoyo incondicional esto no habría sido posible, gracias porque sé que nunca me han dejado caer y me han enseñado a ver que la hora más oscura del día es que la que viene antes de amanecer. Doy gracias también a las personas que amo, a mis amigos y demás personas que me acompañaron en este proceso. Aún doy gracias a mí muy estimado amigo y quien fuera promotor de este triunfo y quien me brindo su ayuda sin condiciones Arturo De Zan: vos sabés como dijo Stephen Hawking I am “on the shoulders of gigants.” Por último pero no menos importante Te dedico este trabajo y recibe esta ofrenda y corona porque es por Tu gracia que estoy aquí, porque ahora sé que para Ti nada es imposible. Señor que este trabajo únicamente Te glorifique a Ti, recibe esto para tu honra y honor, Te amo bendito Dios..
(8) II. 07(20)113 1. INTRODUCCIÓN “La adquisición de conocimientos nuevos, el descubrimiento, viene condicionado por dos elementos esenciales: la ocurrencia de un hecho diferente de lo hab itual, cosa por tanto poco frecuente, y la circunstancia de que este hecho se produzca en presencia de una persona capaz de identificarlo como extraño, reflexionar sob re él y, lo que es más difícil, extraer consecuencias” (Prat y col., 2000, p.127). En una de las cartas que escribía el profesor Albert Einstein a su amigo Solovine, decía que “la totalidad de la ciencia no es otra cosa que un refinamiento del pensamiento cotidiano” (Holton, 1982, p.326). En esta misma carta, Einstein describía el proceso de la epistemología y un algoritmo de cómo era que se adquiría el conocimiento científico. El profesor describe allí cómo los humanos tienen un campo de experiencias sensibles que se filtran a través de unos conceptos y categorías ya manejados a través de su vida (tales como conceptos espirituales, de medida, de tiempo, etc.) y se llegaba a la generación de axiomas. Estos axiomas o ideas nuevas tendrán que tener algún soporte teórico y/o empírico que se constatarán nuevamente en el campo de la experiencia sensible. Estas nuevas herramientas serán usadas luego (si es posible) mejoradas, o de lo contrario reemplazadas; pero serán herramientas que serán útiles mientras la prueba empírica así lo permita. Los modelos estadísticos son de este tipo de herramientas. Estos modelos son el intento de explicar la variabilidad de cierto fenómeno a través de variables que se cree explicarán algo de éste. Básicamente existen dos clases de modelos: los modelos mecanicistas y los modelos empíricos (Prat y col., 1998, p.129). La diferencia entre las dos clases radica en el rango de variación en el que se quiera inferir. Por su parte, los modelos mecanicistas, basados en conocimientos teóricos, sirven para describir el comportamiento a gran escala de un proceso industrial; conocimiento, que es importante como una descripción general del 1.
(9) II. 07(20)113 proceso. Sin embargo, este conocimiento no es suficiente para dar soluciones a cualquier caso que incluya dicho proceso del cual se tiene un modelo mecanicista previo. Para poder hacer estimaciones fiables y que puedan resultar de extrema utilidad se han de hacer experimentos para un rango limitado de las variables con 1. el fin de extraer conclusiones prácticas para un caso particular . Un ejemplo para explicar la diferencia entre las dos clases de modelos es el comportamiento de un cuerpo en caída libre que parte del reposo. Un conocimiento teórico (y práctico) de dicho proceso es la fórmula d = (1 / 2) gt 2 , donde d es la distancia que recorrida, g la aceleración gravitacional y t el tiempo transcurrido. Si un experimentador, ubicado en un lugar particular de la tierra, mide el tiempo controlando la distancia, se dará cuenta que las observaciones no son exactamente iguales a las predicciones que se podrían hacer con la fórmula conocida. La variación entre las observaciones y las predicciones se debe a factores externos (i.e la fricción debida al aire) que influyen sobre el objeto y que no se están (o no se puede) controlando. Por lo tanto, es necesario determinar unos niveles para dichos factores con el fin de poder hacer inferencias sobre el comportamiento particular en las condiciones externas y propias de un lugar. Examinar el comportamiento de un objeto en caída libre, dadas unas condiciones específicas de un lugar particular, lleva al planteamiento de un modelo empírico que será de mayor utilidad que el modelo mecanicista.. Cuando se requiere analizar un proceso industrial surgen dos preguntas básicas. La primera es: ¿cuáles son las variables que, se presume, explicarán el comportamiento de dicho proceso?; además, ¿cuáles son los valores donde estas variables, llamadas. independientes, hacen que la respuesta, o variable. dependiente, sea en lo posible “óptima”? Pero al responder la primera pregunta surge tal vez una tercera: una vez se conoce (por experiencia del experimentador, 1. Cabe aclarar que así no se cuente con algún modelo mecanicista, sí es necesario ciert a pericia o conocimiento previo del experimentador acerca del proceso que se requiere estudiar; este conocimiento puede provenir de referencias secundarias, experiencias pas adas o estudios similares. Es conocimiento muchas veces es llamado “ conocimiento no estadístico”; para ampliar se recomienda ver Montgomery (2001).. 2.
(10) II. 07(20)113 por ejemplo) cuáles son las variables que muy probablemente tienen influencia sobre la respuesta, ¿cómo saber si estas son o no significativas estadísticamente y cuál es el modelo resultante?. Un ejemplo de esto es la situación que enfrenta un panadero a la hora de preparar un ponqué que es nuevo en el mercado. Un primer paso será determinar cuáles son los ingredientes que llevarán a que lo que vaya a preparar sea efectivamente un ponqué (harina, huevos, polvo para hornear, mantequilla, esencias, cremas, etc.); además, determinar cuáles son las herramientas externas que le permitirán la cocción del mismo (el horno, por ejemplo). Como primer acercamiento el panadero determinará qué cantidad de cada ingrediente agregar a la mezcla. Como es un ponqué nuevo, él no sabe a ciencia cierta qué cantidad aplicar; lo que sí se sabe es la experiencia que éste tiene a la hora de hacer cualquier clase de torta. Ahora bien, dependiendo de su resultado inicial, y con el fin de crear un ponqué realmente “exquisito”, el panadero tendrá que seguir experimentando hasta encontrar los niveles “óptimos” de ingredientes y tiempo de cocción para la preparación de las tortas que sacará al mercado. Este proceso seguramente será más eficiente que buscar una fórmula mecanicista que relacione aquellas variables.. En el caso del panadero, los componentes del modelo que él usa son los siguientes: la variable de respuesta es el “sabor” del ponqué, las variables independientes, o de control, son los ingredientes y el tiempo de cocción. En otras palabras, el sabor de la torta varía dependiendo de la cantidad de los ingredientes y del tiempo de cocción. Se puede decir entonces que el sabor de la torta es la variable dependiente. Su variabilidad está explicada por los ingredientes, el tiempo de cocción y factores externos que no se han controlado y que hace parte del error experimental. En esta instancia, el experimentador, una vez ha definido los factores que posiblemente afectan el sabor del ponqué, podría preguntarse cuánta influencia tiene la cantidad de cierto factor (en particular) en el sabor del ponqué. Es decir, ¿cuánta variabilidad en el sabor de un ponqué está recogiendo la 3.
(11) II. 07(20)113 cantidad del ingrediente x? Una respuesta a esta pregunta se podría conseguir planteando un modelo de regresión lineal. Pero es por medio de un análisis de varianza que se determina si dicha variabilidad es estadísticamente significativa.. Para llevar a cabo el análisis de varianza es necesario plantear un primer modelo teórico con el fin de evaluarlo estadísticamente. Con fines ilustrativos (y no prácticos), para el ejemplo del panadero, sería razonable plantear inicialmente un modelo del tipo: Sabor = β 0 + β 1 cant.harina + β 2 tiempo.coccion + ε donde β 0 es el intercepto, β 1 es el coeficiente que acompaña a la cantidad de harina, β 2 es el coeficiente que esta asociado al tiempo de cocción y ε es el error experimental debido a factores no controlados2 (i.e. el tipo de leche, la cantidad de huevos, etc.) Para determinar el valor de dichos coeficientes es necesario hacer una estimación de ellos mediante algún estimador para estos a partir de observaciones del sabor frente a diferentes valores de la cantidad de harina y del 3 tiempo de cocción. Un posible estimador sería el de mínimos cuadrados . Una vez. hechas las estimaciones el paso siguiente es determinar si los factores son estadísticamente significativos. Para ello es necesario hacer uso de las pruebas de hipótesis. Para medir la significancia estadística de la cantidad de harina de determina la siguiente hipótesis: ⎧H 0 : la cantidad de harina no es significativa en el sabor del ponqué , ⎨ ⎩H 1 : la cantidad de harina es significativa en el sabor del ponqué. lo cual es análogo a probar que:. 2. Es obvio que como ya se mencionó antes, es necesario controlar los factores más evidentes que puedan influir en la variable de respuesta. Nuevament e, este ejemplo es sólo con fines ilustrativos. 3 Es usará permanentement e el estimador de mínimos cuadrados para lo que compete a este trabajo. Para ampliar en la estimación de mínimos cuadrados se recomienda consultar Montgomery et al. (2001).. 4.
(12) II. 07(20)113 ⎧H 0 : β 1 = 0 . ⎨ ⎩H 1 : β 1 ≠ 0. Se define entonces un estadístico de prueba que permitirá determinar la significancia estadística de cierto factor sobre la respuesta. Cuando se supone que la población sobre la cual se está trabajando sigue una distribución normal, entonces el estadístico de prueba de éste tipo de hipótesis se distribuirá como un normal estándar (si la varianza poblacional se conoce) o con una t de Student (si la varianza poblacional no se conoce). Una vez, se halla el estadístico de prueba y poder extraer conclusiones se debe definir el error de tipo I (uno). El error de tipo I se define como la probabilidad de rechazar la hipótesis nula dado que esta es verdadera. A éste se lo conoce también como nivel de significancia α y su interpretación es similar al porcentaje de confianza que se define para hacer pruebas con intervalos de confianza. El nivel de significancia es equivalente al tamaño de la región de rechazo. Se le dice así ya que marca el límite clásico o frecuentista en el cual se define si el coeficiente asociado a cierto factor es o no significativo. Suponiendo que el valor de la varianza poblacional no se conoce, la prueba de hipótesis para el caso de harina sería la siguiente: Se rechaza H 0 ⇔ t calculada ≥ t. α. (1− ; gl ) 2. ó t calculada ≤ t. α. .. ( ;gl ) 2. en la figura 1.1 se puede observar la distribución de probabilidad normal para una variable donde se indica el tamaño de la región de no rechazo:. 5.
(13) II. 07(20)113. Figura 1.1 Región de no rechazo. Otra forma de medir la significancia estadística de un factor en un modelo de regresión es el p-value asociado a la t calculada. Se llama p-value ya que es la probabilidad de que la t de prueba tome un valor superior a la t calculada. Esta probabilidad se compara con la α del investigador y se concluye lo siguiente: ⎧Re chazar H 0 si α ≥ p − value . ⎨ d.l.c. ⎩No rechazar H0. En la mayoría de software estadístico se publica el p-value asociado al estadístico t a posteriori de la realización del experimento. Para un investigador que este revisando un informe de algún trabajo de investigación, le es más útil conocer el valor del p-value ya que le permitirá compararlo contra el nivel de significancia que este haya escogido; esto lo convierte en una herramienta fácil y rápida de usar. Por ejemplo, el p-value de un factor de un modelo hipotético sea igual a 6%. Para el investigador A con α = 5% el coeficiente asociado a dicho factor sería no significativo. Mientras que para el investigador B, que tolera más error de tipo I, y escoge α = 10% , llevándolo a concluir que el coeficiente asociado a la variable de análisis si es significativo. Por todo lo anterior, es que el p-value es usado frecuentemente como un criterio de selección de variables en los modelos estadísticos lineales. Sin. 6.
(14) II. 07(20)113 embargo, existen casos donde el uso del criterio del p-value no es tan evidente ni robusto; este es el caso de los modelos polinómicos de orden mayor a uno. En dichos modelos las variables tienen una propiedad adicional: pueda que existan relaciones de carácter jerárquico entre ellas. Existen casos donde dos términos son. jerárquicamente. comparables. (Peixoto, 1990): un. 4. predictor. η1. es. jerárquicamente comparable con η 2 si los términos al interior de los dos predictores son iguales, o al menos uno de estos contiene al otro (o viceversa). Por ejemplo, el predictor η 1 = x1 x 2 es comparable con η 2 siendo este último es. η 2 = x1 i x2 j z, donde z es un vector de factores diferente a x1 y x 2 , y donde i y j son valores mayores o iguales a cero. Para ilustrar, se puede decir que x1 x 2 es comparable e inferior que x12 x 2 , pero x12 x 2 no es comparable con x 2 x 3 porque este ultimo no contiene x1 ; también se pueden comparar x1 con x1 x1 , o lo que se igual x1 con x12 , donde se dice que el término elevado al cuadrado es de orden superior 5. al término lineal . Cuando el modelo que se está evaluando tiene términos que están jerárquicamente relacionados se ha planteado una selección de términos que difiere del criterio del p-value. Este criterio indica que si se incluye un término cualquiera, todos sus términos de orden inferior también deberán estar presentes en el modelo. (Ato et al., 2005, p.17). Este criterio se formalizará más adelante y 6 recibirá el nombre de Criterio Jerárquico (CJ) de selección de términos en los. modelos estadísticos lineales. Para una correcta aplicación del CJ es necesario evaluar primero los términos jerárquicamente superiores. Si estos términos resultan significativos se 7 han de dejar en el modelo el resto de términos de orden inferior . Una motivación. 4. Entiéndase una función que agrupa una o más variables. Más Adelante se entrará más en detalle acerca de esto. 6 El “ criterio jerárquico” se da en el mismo sentido de los modelos que Peixoto (1987) llamará “ modelos bien formulados.” 7 Se aclara nuevament e que lo referente al criterio jerárquico se formalizará más adel ante. 5. 7.
(15) II. 07(20)113 para aplicar el criterio jerárquico es la situación del término de los modelos que se conoce como el intercepto. El intercepto β 0 es equivalente a β 0 xi0 y así a veces la interacción no tenga mucho sentido práctico bien puede ser útil dejarlo dentro del modelo para evitar ponerle restricciones o sesgos al modelo. Por otro lado, paquetes estadísticos como Minitab no permiten usar las herramientas para el análisis de diseños de experimentos si no se aplica el CJ.. Continuando con el ejemplo del panadero, una hipotética situación que se le podría presentar a éste sería la siguiente: se sabe que a medida que el tiempo de cocción aumente el sabor y la consistencia del ponqué serán mejores. Pero, ¿se podría pensar entonces que debemos dejarle un tiempo de cocción muy grande ya que eso llevaría a una mejor consistencia y mejor sabor? No necesariamente. Después de un tiempo quizá la cocción haría que el pastel se queme y el sabor sea muy desagradable. La siguiente gráfica plantea esa situación: Figura 1.2 Variación en el sabor dado un aumento en el tiempo de cocción. 8.
(16) II. 07(20)113 Una posible conjetura acerca del “verdadero” (aunque desconocido) comportamiento del sabor frente al tiempo de cocción, podría ser mediante el planteamiento de un modelo polinómico como el de la figura 1.1. En este caso, lo que postula el criterio jerárquico es que si la variable tiempo de cocción al cuadrado resulta significativa entonces no se deberá (o no será necesario) indagar si la variable tiempo de cocción, elevada a la primera potencia, con una función del tipo parabólica, en la que quizá sea posible pensar en un nivel de tiempo en que el sabor sea “máximo”, será significativa o no. Según el CJ está última se deberá incluir en el modelo junto con la variable de tiempo de cocción al cuadrado debido a la jerarquía existente entre los términos.. El problema de elegir entre un criterio de selección de variables y otro es el que le presenta a los investigadores a la hora de seleccionar la variables del modelo que se cree es el que mejor explica el fenómeno estudiado. Es necesario entonces hacer un estudio profundo acerca de las razones del uso de uno u otro criterio, para tratar de eliminar la subjetividad a la hora de determinar los mejores modelos a emplear. Esta necesidad de escoger el mejor modelo nace de la misma necesidad de hacer que un proceso esté desempeñándose. en las mejores. condiciones, es decir en mejores condiciones técnicas y económicas. Es por eso que saber con qué criterio escoger las variables de un modelo que se llevará a la práctica es algo que se puede considerar indispensable para el experimentador. La razón principal para el desarrollo de este trabajo es tratar de determinar cuál de los dos criterios de selección de términos sería más apropiado usar para en el caso de los modelos de regresión polinómicos, especialmente en el contexto de la experimentación a nivel industrial. Se evaluará entonces de qué manera tanto el criterio jerárquico como el del p-value se comportan en el contexto del diseño de experimentos. Para este fin, se llevara a cabo una revisión bibliográfica exhaustiva en lo que se refiere a los dos criterios de selección; además de la descripción detallada de las herramientas necesarias para el desarrollo de la investigación. Después se plantearan los objetivos específicos del trabajo y se 9.
(17) II. 07(20)113 describirá la metodología que empleará para satisfacer estos objetivos. Finalmente se discutirá y analizarán los resultados obtenidos, dando paso a las conclusiones finales acerca del tema de investigación.. Este trabajo, como es natural, tiene ciertas restricciones pragmáticas. Lo ideal sería tener la posibilidad de desarrollar el trabajo en campo. Es decir, si tuviese la posibilidad de tener acceso a alguna planta de producción y de esta forma experimentar allí para extraer conclusiones hacer de la selección de términos se tendría un poco más de certeza acerca de las conclusiones que se podrían extraer. Sin embargo, algunas en algunas referencias bibliográficas se encuentran ejemplos que, mediante el uso de el paquete estadístico Minitab, serán expuestos a simulaciones que permitirá extraer conclusiones que se cree podrán acercarse en gran medida a la realidad. La ventaja de las simulaciones es que, dadas unas condiciones y supuestos, el costo de experimentación en este caso es 8 prácticamente nulo . Las conclusiones previas que se puedan extraer acerca del. conocimiento de la selección de términos podrían ser de gran utilidad a la hora de implementarlos en un proceso de producción real.. 2. REVISIÓN BIBLIOGRÁFICA 2.1 DISEÑOS EXPERIMENTALES En los procesos industriales es común que la respuesta de algún proceso esté explicada por uno o más factores. A la hora de experimentar para entender la respuesta de cierto proceso industrial, es necesario definir (por experiencia del experimentador) estos factores que, se cree, explican en gran parte la variabilidad de dicho proceso. Una ve z definidas estas variables o factores, es necesario identificar los niveles a los cuales éstos generarán el mejor nivel para la respuesta 8. Cabe aclarar que la adquisición de licencias para software especializados en simulación puede llegar a tener costos extremadament e elevados (i.e Arena). Los costos nulos a los que se hace referenci a es los de experimentar con máquinas y materia prima dentro de una planta de producción.. 10.
(18) II. 07(20)113 del proceso. Para ello, se puede pensar en una máquina que genera cierto producto del cual se mide una característica en particular (i.e. porosidad, desgaste, dureza, contaminación, etc.) y es deseable que ésta sea por ejemplo la mínima posible. La forma más eficiente de estudiar esta clase de experimentos es mediante los diseños factoriales. (Montgomery, 2002, p. 170). Para experimentar, se han de determinar al menos tres cosas: 1) la respuesta; 2) los factores y 3) los niveles 9. de los factores. La respuesta es el nombre que recibe la característica estudiada . Un requisito indispensable aquí es que esta característica debe tener asociado por lo menos un instrumento de medición para así poder mejorar (si es que se puede) el proceso que se pretende estudiar. Por otro lado, los factores son las variables que se considera afectan a la respuesta. Anteriormente se ha dicho que estos factores son escogidos y controlados por el experimentador, los cuales se cree van a explicar gran parte de la variabilidad de la respuesta. Por último, los niveles son los valores posibles que puede tomar un factor en particular. Estos niveles, deben ser escogidos por el encargado de hacer el experimento (por ejemplo, el operario experto en cierta máquina). Sin embargo, la localización de dichos puntos no es trivial y para poder situarlos se requiere de experiencia en el proceso. Ahora bien, “por diseño factorial se entiende que en cada ensayo o réplica completa del experimento se investigan todas las combinaciones posibles de los niveles de los factores.” (Montgomery, 2002). El número de factores y de niveles se deberá escoger de forma apropiada tal que los costos de experimentación sean los mínimos posibles. 2.1.1 Diseños factoriales a dos niveles La forma que se utiliza para referirse a un diseño factorial es: n k , donde n es el número de niveles de cada factor y k es el número de factores a estudiar. Para el trabajo que se está desarrollando se estudiarán la clase de diseños 9. Es claro que se podría estudiar más de una respuesta en los experimentos. Sin embargo, para efectos de este proyecto se trabaj ará sobre una única respuesta.. 11.
(19) II. 07(20)113 factoriales 2 k . Esta clase de diseños se usa ampliamente en la industria al menos por las siguientes razones (Montgomery, 2002 y Prat y col., 1998):. 1. Proporcionan el menor número de corridas con las que puede estudiarse k factores en un diseño factorial completo. 2. Proporcionan una excelente relación entre el esfuerzo experimental y la información obtenida. 3. Son fáciles de construir, realizar, analizar e interpretar. 2.1.2 Diseños factoriales 2 k y los modelos lineales. Para cada factor considerado dentro de un diseño factorial 2 k se eligen dos niveles: un “bajo” y uno “alto”. Para codificar dichos factores se le asigna el valor 10 1 al nivel “bajo” del factor y +1 al “alto” . Cuando las variables son cualitativas no. importa el valor que se le asigne a cada nivel, es decir, es arbitrario. El siguiente paso es construir la matriz de diseño del experimento X. Esta matriz de diseño parte de la previa codificación de los niveles de cada factor (como se mencionó anteriormente). Ahora bien, como la idea es estudiar todas las combinaciones posibles entre factores y niveles, la matriz de diseño debe recoger todas éstas. Para garantizar esto, se utilizan los siguientes pasos (Prat, 1997, p.138): 1. Las columnas de la matriz son los k factores a estudiar. 2. Las filas son el número de combinaciones posibles: 2 k . 3. Para la primera columna se completa con unos. Luego, en la segunda se van alternando los valores -1 y +1 hasta llenar todas las filas. 4. Para la teecera columna, se van alternando dos signos (-1) y dos signos (+1); para la tercera cuatro signos (-1) y cuatro signos (+1); para la cuarta ocho signos (-1) y ocho signos (+1) y así sucesivamente.. 10. La selección de los niveles de los factores se basa en la experiencia del experimentador, como ya se había comentado. A ciencia ciert a, no hay un modelo que indique cómo se debe estimar dicha diferencia.. 12.
(20) II. 07(20)113 Al proceso inmediatamente anterior se le conoce como codificación de las variables en orden estándar. Como ejemplo, se puede examinar un diseño 23 para los factores A, B y C para los cuales quedaría la matriz de diseño de la siguiente forma: Tabla 2.1: Matriz de diseño 1. 1 1. A -1. B -1. C -1. 2 3. 1 1. 1 -1. -1 1. -1 -1. 4 5. 1 1. 1 -1. 1 -1. -1 1. 6 7. 1 1. 1 -1. -1 1. 1 1. 8. 1. 1. 1. 1. en la tabla 1.1 puede observarse que cada fila constituye una única combinación de los niveles de los factores. Las filas así definidas constituyen las 8 condiciones experimentales del diseño elegido. Para el este diseño se hallan los valores de la respuesta y se podrán estimar los valores de los efectos de cada factor sobre la respuesta. Además se podrán calcular los efectos de la interacción entre las variables. Los efectos de cada factor sobre la respuesta, se llaman efectos principales. Estos efectos principales son el promedio del cambio en la respuesta cuando un factor pasa de un nivel bajo a un nivel alto. Los efectos de la interacción se pueden interpretar de una manera más sencilla cuando se examina el caso de un diseño con dos niveles y dos factores. Si se tienen dos factores, A y B, la interacción de A con B (o B con A que es análoga) es el promedio del efecto 11 de A cuando B pasa de un nivel bajo a un nivel alto . Esta situación se puede. apreciar en la figura 2.1:. 11. En el capítulo 3 se explicará cómo calcular todos los efectos usando el paquete estadístico MINITAB.. 13.
(21) II. 07(20)113 Figura 2.1: Interacción entre A y B. Un diseño 2 k se puede representar con un modelo de regresión lineal (Prat y col, 1998). Para el caso sencillo de un diseño 2 2 el modelo de regresión que se puede plantear, teniendo en cuenta la interacción, es: y = β 0 + β 1 x1 + β 2 x2 + β 12 x1 x 2 + ε , donde x1 corresponde al factor A y x 2 al factor B. Las β 1 , β 2 y β 1,2 corresponden a los coeficientes de regresión de cada factor, a priori, desconocidos. La diferencia principal entre efectos y coeficientes es que el coeficiente es el cambio en la respuesta y cuando el factor x j cambia en una unidad, mientras que el efecto es el cambio en y cuando el factor x j cambia de un nivel a otro. Es decir, que al haber un cambio de nivel en el efecto x j cambia de -1 a +1, es decir, cambia en dos unidades. Por lo tanto, el valor del coeficiente β j es la mitad del efecto del mismo factor (o interacción según sea el caso).. 14.
(22) II. 07(20)113 Una vez se estima el valor de los coeficientes de las variables (por ejemplo, mediante mínimos cuadrados ordinarios), éstas se podrán decodificar usando la 12 siguiente fórmula :. Xc =. nivel .alto + nivel.bajo 2 , nivel .alto − nivel.bajo 2. Xo −. donde X c es el factor en unidades codificadas y X o el factor en unidades originales.. Más adelante se verá cómo el software estadístico Minitab calcula las estimaciones de las regresiones tanto de los coeficientes como de los efectos. Para ampliar en el tema de diseños factoriales se recomienda mirar Box, Hunter y Hunter (1978, 2005) Montgomery (2002), y Prat y Col. (1997), entre otros. 2.1.3 Metodología de Superficie de Respuesta (MSR). Como ya se mencionó anteriormente, los procesos industriales que han de ser evaluados usando diseño de experimentos son aquellos que no suelen tener un fundamento teórico establecido en cuanto a cómo están relacionadas entre sí las variables. En estos casos, la forma en la que se ha de modelar dichos procesos nace de una aproximación empírica con los datos que se obtengan al experimentar. La Metodología de Superficie de Respuesta (MSR) (Response Surface Methodology) es apropiada para estimar el modelo de cierta característica que se desee estudiar. El profesor Montgomery define esta metodología como “una colección de técnicas matemáticas y estadísticas útiles para desarrollar, modelar, analizar y optimizar problemas [mediante una estrategia secuencial], donde la respuesta está influenciada por ciertas variables” [(Myers y Montgomery, 2002, p.1) y (Montgomery, 2002, p.405)].. 12. Se sobre entiende que esta forma de decodi ficar se usa únicamente para las variables cuantitativas.. 15.
(23) II. 07(20)113. La MSR permite relacionar la respuesta de la característica de interés de cierto proceso que se ha llamado y, con los factores de la matriz x “lo más adecuado posible, con el mínimo coste de experimentación” (Prat y Col., 1997, p.203). La MSR tiene como fundamento la exploración secuencial de la superficie de la variable a estudiar. Con la estrategia secuencial se puede examinar la superficie de una manera eficiente ya que es como si se hiciera una exploración de un terreno desconocido donde lo único que se sabe es que hay que llegar a una cima o a un valle (Prat y col, 1998). Para aplicar dicha estrategia es necesario pasar por varios momentos:. 1. El primer paso es ubicarse sobre algún punto en el terreno o superficie. Esto se logra mediante un diseño factorial escogiendo algunos niveles de los factores donde se cree que se está lejos del óptimo. 2. Se hace una primera estimación lineal y se hallan los parámetros. De acá se desprende un gradiente que nos indicará el camino por la máxima 13 pendiente . Este gradiente indicará en qué dirección se espera que crezca. más rápidamente la respuesta. 3. Si el objetivo es maximizar la respuesta la dirección a seguir es la misma dirección del gradiente. Mientras que si el objetivo es minimizar se deberá ir en sentido opuesta al gradiente. 4. Se ha de empezar a hacer experimentos en ciertos puntos de este camino. En el punto donde haya evidencia que ya no se está incrementando la altura (o disminuyen más según sea el caso) sino que, por el contrario, empezó a decrecer nuevamente la repuesta es necesario parar y hacer experimentos que permitan saber si están o no en la presencia de alguna respuesta óptima dentro del rango de los factores.. El uso de gráficos (cuando éstos se pueden visualizar, es decir, en menos de tres dimensiones) se hace indispensable para un el buen entendimiento de los 13. Más adelante se dará explicación a esto.. 16.
(24) II. 07(20)113 diseños 2 2 . Más adelante se ampliará en estos gráficos. En el mismo sentido, una buena forma de entender la metodología de superficie de respuesta es la propuesta por Prat: haciendo uso de lo que los autores resumen como estrategias de primer y segundo orden (Prat y Col., 1997, p.204).. 2.1.3.1 Estrategias de primer orden Se le llama estrategia de primer orden a los pasos dentro de la MSR donde se cree que la mejor estimación de la superficie es un modelo lineal de primer orden. Dentro de las estrategias de primer orden se encuentran los siguientes pasos: 14 1. Realizar un diseño de 2 k. 2. Estimar los parámetros de dicho modelo por mínimos cuadrados ordinarios. 3. Hacer una aproximación de la respuesta por medio de un modelo de primer orden Y = β 0 + β 1 x1 + β 2 x 2 + ε se plantean las siguientes hipótesis:. ⎧H 0 :: El modelo lineal de primer orden ajusta adecuadamente los datos ⎨ ⎩H 1 : Hacer una aproximación cuadrática para ajustar los datos.. 4. Hacer el análisis de ajuste del modelo. Para hacer este análisis satisfactoriamente se han de incluir puntos centrales en el diseño. Los pintos de diseño en un diseño 2 2 forman un cuadrado cuando se incluyen puntos centrales estos quedarán ubicados en el centro de dicho cuadrado. Estos puntos deben venir replicados para poder estimar el error. Además En realidad lo que plantean el autor Prat y colaborados es un Diseño 2 k − p esto refiere a los Diseños Factoriales Fraccionales, que no se requieren en este proyecto. Pero para el caso que se esta evaluando basta 14. sólo con los diseños 2 k que ya se explicaron en la sección 2.1.1 y 2.1.2. Si se desea ampliar en este tema puede consultarse en Prat y Col., 1997, Capítulo 8.. 17.
(25) II. 07(20)113 permitirá evaluar que no haya ninguna interacción significativa entre los factores (lo cual llevaría a un plano con curvatura). Además permitirá el test de curvatura ya que si los puntos centrales están significativamente más arriba del plano ajustado quiere decir que se puede sospechar que existe 15 curvatura . 16. 5. Aplicar el método de máximo ascenso o Steepest Ascent.. Una explicación gráfica a estas estrategias sería la siguiente: Figura 2.2 Análisis de la superficie con estrategias de primer orden.. en la figura 2.2 se puede apreciar que dados los niveles de los factores del diseño 2 2 se puede se pueden obtener valores de la respuesta de y. Una primera aproximación a la forma de esta superficie se puede hacer mediante un modelo lineal de primer orden, es decir evaluar si esta se ajusta a un plano. Supóngase 15. Cuando se analicen las estrategias de segundo orden es neces aria la inclusión de puntos centrales y puntos de estrella que permitirán estimar los efectos en un modelo polinomial de segundo orden. 16 Realmente, si se llega a que el modelo planteado no es, o no se ajusta, a un modelo de primer orden no es neces ario continuar con la metodología de máxima pendiente.. 18.
(26) II. 07(20)113 que efectivamente para los datos tomados del experimento 2 2 se pueda ajustar el plano marcado con color azul. Si se siguen los pasos de la MSR se procederá a encontrar el vector gradiente que indique la dirección de máximo crecimiento del valor esperado de la respuesta. Supóngase que una vez calculado el gradiente este sea el que se señala con la flecha de color verde. Se procederá entonces a recorrer dicha dirección el fin de encontrar un punto donde se sospeche que se está en presencia de curvatura. El ascenso por la máxima pendiente de crecimiento se debe hacer mediante experimentos parciales en ciertos puntos del camino. Como el objetivo (para el caso de la gráfica) es llegar a un valor máximo de de la respuesta, probablemente, se llegará el punto donde una respuesta sea menor que la anterior, es en este punto donde se presumirá que se está en presencia de curvatura. Cuando se sospecha curvatura en la superficie, es necesario hacer pruebas que lo confirmen. Una vez se hagan dichas pruebas y se determine que efectivamente se está en presencia de un máximo (para este ejemplo gráfico) se deberá hacer uso de las estrategias de segundo orden. Mediante las estrategias de segundo orden se plantea una ecuaciones donde los términos de estas tendrán relaciones. cuadráticas,. estas. relaciones. cuadráticas. serán. una. mejor. aproximación a la superficie en este punto. Finalmente, el siguiente diagrama de flujo que se muestra en la figura 2.3 se muestra el proceso para llevar a cabo las estrategias que se han denominado de primer orden:. 19.
(27) II. 07(20)113 Figura 2.3: Estrategias de primer orden.. 2.1.3.2 Estrategias de segundo orden. El la figura 2.3 se puede apreciar que una vez exista evidencia de curvatura o que haya una falta de ajuste de los datos al modelo lineal planteado se debe hacer una aproximación cuadrática; es aquí donde se usarán las estrategias de segundo orden. Dentro del esquema presentado por Prat (Prat y Col, 1997, p.204) se plantean los siguientes pasos: 1. Es necesario el uso de un diseño central compuesto. Este diseño es similar al diseño ya estudiado de 2 k pero con la diferencia de que este incluye. 20.
(28) II. 07(20)113 puntos centrales y puntos de estrella. Cornell explica claramente la manera de usar los diseños centrales compuestos (Cornell, 1990, p.52). Los diseños centrales son útiles y necesarios ya que permiten mantener la independencia estadística entre las k variables dentro del modelo, cuando 17 se están analizando modelos polinómicos de segundo orden .. 2. Una vez garantizada la independencia de los términos de la matriz de factores se hace la estimación por mínimos cuadrados del modelo. 3. Después de la estimación se plantea el modelo de segundo orden resultante: Y = β 0 + β 1 X 1 + β 2 X 2 + β 11 X 12 + β 22 X 22 + β 12 X 1 X 2 + ε 4. Gráficas de curvas de nivel (para el caso de dos factores y dos niveles) y análisis canónico. Las estrategias de segundo orden permiten estimar los coeficientes de variables dentro del segundo modelo planteado (el cuadrático). Más adelante se verá cómo el paquete estadístico de MINITAB facilita este tipo de análisis. El análisis de este tipo de modelos polinómicos de orden dos, permitirá en ciertos casos, la evaluación de los criterios de selección de variables. En algunos casos se encontrará que todas las variables. dentro del modelo son significativas. estadísticamente. En algunos otros, se encontrará que el efecto de la interacción y/o el efecto de alguno de los factores elevado al cuadrado son no significativos, mientras que los efectos principales sí lo son. Pero el caso en que alguno de los efectos principales no sea significativo mientras que el mismo efecto dentro de alguna interacción o elevado a un valor mayor a 1, sí lo sea, es el caso que nos interesa para poner a prueba el criterio jerárquico. Así como se hizo con las estrategias de primer orden, a continuación se presenta el diagrama de flujo clásico (figura 2.4) para llevar a cabo las estrategias de segundo orden:. 17. Más adelante en el capítulo 4 se explicará de qué form a se deben hallar esos puntos centrales y de estrella con un ejemplo concreto.. 21.
(29) II. 07(20)113 Figura 2.4: Estrategias de segundo orden.. Cuando existe evidencia de curvatura el paso a seguir es hacer una aproximación cuadrática a la “verdadera” forma de la superficie. Una vez se llega al punto donde existe esta evidencia, es necesario hacer un diseño central compuesto con puntos de estrella con el fin de ajustar un modelo de segundo orden. Una vez se hace el ajuste de ese modelo se decidirán cuales variables son las que entran a lo que se tomará como el modelo más apropiado para explicar la superficie dentro de los rangos que han delimitado los niveles de los factores.. La economía de experimentación que presenta la MSR la convierte en una herramienta muy práctica que permitirá la búsqueda del ajuste de un modelo adecuado para explicar la variabilidad de la característica estudiada.. Para ampliar en el tema de la MSR se recomienda revizar remita a Box y Drapper (2007), Box, Hunter y Hunter (2005), Montgomery (2002), Myers y Montgomery (2002), Prat y Col. (1997) y Cornell (1990), entre otros.. 22.
(30) II. 07(20)113. 2.2 AJUSTE DE MODELOS Cuando se requiere estudiar cierto proceso industrial es necesario definir una característica que se pueda medir de éste con el fin de poder estudiarlo y así tratar de mejorarlo. Se deben seleccionar los factores o variables que se cree explican gran parte de la variabilidad de dicho proceso. Una vez escogidas dichas variables es necesario hacer aproximaciones lineales a la superficie que describe el comportamiento del proceso que permita estimar los valores de los coeficientes que indican si estos factores son o no significativos. Una vez hecha esta estimación de los coeficientes al interior del modelo, es necesario definir cuáles son las variables que se van a seleccionar como parte del modelo final, modelo del que se tiene evidencia que es el mejor para la estimación del parámetro de interés. Uno de los problemas que plantea el ajuste de modelos es el criterio que se sigue. para escoger el modelo final. Clásicamente, esta selección se hace. basándose en el resultado del análisis de varianza y las pruebas de significancia parcial. El análisis de varianza indica las características de ajuste del modelo en general. Es decir, indica si el modelo planteado es un buen predictor de la característica de interés. Mientras que las pruebas de significancia parcial indican el ajuste de cada factor en particular. Una vez se tienen los resultados de estos dos últimos, es necesario determinar cuáles de estas variables deberían entrar al modelo, a partir del criterio que se haya seleccionado para ese fin. 2.2.1 Criterios para la selección de términos 2.2.1.1 Criterio del p-value. 23.
(31) II. 07(20)113 Se supone un proceso que tiene determinada característica que se desea evaluar por medio de la medida y. En primer lugar se plantea un modelo lineal con dos factores el cual queda expresado de la siguiente forma: y = β 0 + β 1 x1 + β 2 x2 + ε , Donde y es la variable de respuesta, x i (i: 1,2) los factores y ε el término de error. Para este último se hacen los siguientes supuestos: 1. El error aleatorio ε tiene media cero y varianza constante. 2. Los errores son estadísticamente independientes. Sin embargo, para llevar a cabo el análisis de varianza y las pruebas de significancia parcial es necesario agregar que:. 3. El error aleatorio debe tener distribución de probabilidad normal. Para poder tomar decisiones es necesario plantear pruebas de hipótesis. Las pruebas de hipótesis para determinar la significancia global del modelo son las siguientes: ⎧H 0 : β j = 0 ∀j ≥ 1 ⎨ ⎩H 1 : al menos uno es diferente de cero Para estimar los β j se recogen observaciones de la respuesta para diferentes niveles de los factores x j .. Una vez se escogen los puntos de diseño y se hacen los experimentos correspondientes se han de calcular los elementos de la tabla de análisis de varianza o ANOVA. Del ANOVA se desprenden dos estadísticos importantes: la F de prueba y el R cuadrado. 24.
(32) II. 07(20)113. La F de prueba es la razón entre la sumatoria de los cuadrados de la regresión (sobre sus grados de libertad) y la sumatoria de cuadrados del error SSR. (sobre sus grados de libertad) F =. SSE. ( p − 1). . Esta F se compara con una. ( N − p). distribución F (llamada crítica) con [(k-1); (N-k); α ], donde k es el número de factores, N es el total de las muestras recogidas y α es el nivel de significancia (error de tipo I o tamaño de la región crítica) escogido por el investigador. El criterio jerárquico sugiere que: Se rechaza la Ho si y solamente si la F de prueba es mayor que la F crítica.. Por otra parte, R cuadrado indica el porcentaje de la variabilidad de y que está siendo explicado por el modelo planteado. La R 2 se calcula como la razón entre la sumatoria de los cuadrados de la regresión y la sumatoria de los cuadrados totales R 2 =. SSR . Es decir, la variabilidad que recoge el modelo de SST. regresión dividido el modelo total. Esto indica el porcentaje de error que el modelo no está recogiendo debido a otros factores no estudiados. Cuando la selección de factores a estudiar se ha hecho adecuadamente se esperaría que R 2 sea relativamente alto. En el caso que esta razón sea muy baja, esto podría significar que hay factores adicionales que es necesario incluir en el modelo. Por otra parte, para evaluar la significancia parcial de los factores, se plantea la siguiente prueba de hipótesis: ⎧⎪H 0 : β j = 0 ∀ j = 1, 2 ⎨ ⎪⎩H 1 : β j ≠ 0 ∀ j = 1, 2. 25.
(33) II. 07(20)113 La estimación de los coeficientes se puede facilitar calculando los efectos del diseño de experimentos. Como se vio en la sección 2.1.2., las variables se codifican y se calculan los efectos de la siguiente forma: ⎡N ⎤ Efecto del int ercepto = 1 / N ⎢ ∑ y i = y ⎥ ⎣ i= 1 ⎦ 1 Efecto del Factor i = y xi =+1 − y xi =−1 , ∀ i = 1, 2 2. [. ]. La estimación de β i se interpreta como el cambio promedio en la respuesta cuando el factor x i pasa de un nivel bajo a un nivel alto (o viceversa). Una vez se obtienen dichas estimaciones se usa el hecho (que ya se explicó anteriormente en el capitulo) que los coeficientes del modelo y = β 0 + β 1 x1 + β 2 x 2 + e son la mitad del valor de los efectos estimados. El estadístico de prueba para determinar la significancia parcial es la t de Student. Este estadístico, se evalúa de la siguiente forma:. t=. βˆ j − β 0 var( βˆ j ). , ∀ j = 0,1, 2. Como ya se ha mencionado, la varianza se supone en este caso constante. La varianza se calcula de la siguiente forma:. Var( βˆi ) =. σ2 N. 2. s N. σˆ 2 =. ,. n. s 2 = ∑ d i 2N =1 i. 26.
(34) II. 07(20)113 donde di es la diferencia entre las réplicas en el punto diseño i. Una vez calculada la t para cada una de los coeficientes se calcula la t crítica. La t teórica se calcula con N-k grados de libertad y un nivel de significancia α escogido por el investigador . Para comparar estos valores se hace la siguiente prueba: se rechaza la Ho sí y solamente si t es mayor que t crítica. En el caso en que se rechace Ho se aceptará que el factor x i es significativamente diferente de cero.. Como una prueba análoga a la prueba t, se puede calcular el valor crítico de rechazo que se ha denominado como p-value. Este número es la probabilidad de que el estadístico t sea mayor que la t de prueba que se ha calculado. La mayoría de software muestra en pantalla este valor. Para saber si se rechaza la Ho o no con el valor del p-value, es necesario que el investigador, como en todos los casos, defina un nivel de significancia α . Este nivel de significancia (que habitualmente es del 5%) indica el tamaño de la región crítica. Se hace la comparación entre el p-value y este nivel de significancia y se sigue el siguiente 18 criterio :. Si el p-value es menor o igual al tamaño de la región critica, quiere decir que la este p-value se encuentra dentro de la región de rechazo, con lo cual el factor x i se considerará significativamente mayor que cero, y deberá ser incluido en el modelo ajustado .En el caso en que el p-value sea mayor que el tamaño de la región crítica no hab rá evidencia estadística suficiente para decir que el término evaluado sea significativo y por tanto no deb erá ser incluido dentro del modelo ajustado. Lo anterior es lo que se conoce con el nombre de criterio del p-value para el ajuste de modelos. 2.2.1.2 Criterio jerárquico 18. En Wu y Hamada (2002), pueden verse este y otro criterios.. 27.
(35) II. 07(20)113. Cuando se quiere optimizar algún proceso industrial desde el punto de vista estadístico es necesario plantear un modelo que describa alguna característica medible en términos de algunos factores, que afectan los valores de dicha respuesta, siempre y cuando se encuentren bajo el control del experimentador. De acuerdo con la MSR clásica, un primer acercamiento al conocimiento del comportamiento de cierto proceso se hace utilizando modelos lineales de primer orden. Una vez se realizan las pruebas de ajuste de dicho modelo se determinará si éste funciona adecuadamente o no. En algunos casos, dicho modelo lineal de primer orden no se ajusta a los valores que se encontraron en los experimentos. Se procede entonces a hacer las pruebas de curvatura. Si dichas pruebas indican que hay sospecha de la presencia de curvatura, es necesario plantear un modelo lineal de segundo orden, o cuadrático: Y = β 0 + β 1 X 1 + β 2 X 2 + β 11 X 12 + β 22 X 22 + β 12 X 1 X 2 + ε. Cuando se trata de ajustar un modelo cuadrático se debe proceder de la misma forma en que se hizo en la sección 2.2.1.1. Sin embargo, a la hora de decidir el criterio con el cual se deben escoger qué variables deben entrar en el modelo final las condiciones, podrían variar un poco. Diferente al criterio del p-value para el ajuste de modelos polinómicos. 19. se. plantea el criterio jerárquico de ajuste de modelos. Para llegar a la definición de dicho criterio es necesario hacer ciertas aclaraciones. La primera de ellas es definir a qué se refiere el término “jerárquico”. Existen dos casos básicos donde pueden existir relaciones jerárquicas:. 19. En adelante, cuando se haga referencia a modelos polinómicos, se estará tratará de modelos de segundo orden.. 28.
(36) II. 07(20)113 1. Cuando existen relaciones jerárquicas “puras” por efecto del orden al que están elevadas estas variables puede existir comparación jerárquica. Si se define la variable x ih como un término dentro de un modelo de regresión polinómico, donde h ≥ 1 ; y se define un segundo término x iih +k , donde k > 0 , dentro del mismo modelo. Entonces, al darse la situación anterior se dice los dos términos son jerárquicamente comparables. Además, ya que el segundo término es de orden mayor al primero, éste primero es jerárquicamente inferior al segundo término.. 2. Cuando se define la. interacción. x ih x lj está se puede. comparar. jerárquicamente tanto con x i como con x j . Cuando se comparan las variables sin interacción (o efectos principales) con alguna interacción como la que ya se definió, siempre ésta última será jerárquicamente superior. Cuando se comparan dos términos que sean interacciones pero una de ellas es del tipo x ih x lj x k , está última siempre será jerárquicamente superior a una interacción de tipo x ih x lj . En otro caso diferente la comparación no sería del todo correcta20. Por otro lado, algunos estudios acerca de los modelos lineales de segundo orden, muestran que algunos investigadores a la hora de mostrar sus resultados deciden tomar como el mejor modelo aquel que está “mal formulado”. Se dice que un modelo está “mal formulado” cuando contiene k predictores que excluyen términos jerárquicamente inferiores (Peixoto, 1990, p.26). A esto mismo se refieren Berhardt y Jung (1979) cuando indican que un modelo que excluya los términos jerárquicamente inferiores está incompleto. Los autores que han estudiado estos modelos polinómicos demuestran que existe un inconveniente con los modelos que no están completos (o que no están “bien formulados”): que estos. 20. Para ampliar en el tema de las relaciones jerárqui cas entre variables, se recomienda al lector leer: Peixoto (1987).. 29.
(37) II. 07(20)113 son sensibles a transformaciones de escala no homogéneas. Una ilustración de esto es la situación que se describe a continuación: Supóngase que un ingeniero está interesado en medir la resistencia al desgate de la pintura de cierto vehículo. Éste sospecha que la temperatura a la cual se somete la pintura cuando el vehiculo está en el horno y el tiempo que se deje en el mismo son los factores que determinan dicho desgaste. Se plantea entonces el siguiente modelo: y = β 0 + β 1T + β 2 L + β 12TL + ε. donde T es la temperatura del horno medida en grados Celsius y L es el tiempo que se deja el vehículo en el horno. Se quiere evaluar también la interacción existente entre el la temperatura y el tiempo de horneado. Una vez se realiza el experimento los resultados son los siguientes: el tiempo de horneado no resultó estadísticamente significativo, mientras que la temperatura del horno y la interacción entre el tiempo y la temperatura sí son significativos. Ahora bien, al ingeniero podría plantear dos modelos tentativos: 1. y = β 0 + β1 L + β 2T + β 12TL + e el modelo completo. 2. y = β 0 + β 2 T + β 12TL + e el modelo borrando el efecto principal no significativo.. Si a éste se le plantea hacer una transformación de la temperatura de grados Celsius a grados Fahrenheit la nueva variable quedaría de la siguiente forma: 9 Z = 32 + T , 5 el nuevo modelo quedaría así: y = µ 0 + µ1 L + µ 2 Z + µ12 ZL + u. 30.
(38) II. 07(20)113 Resolviendo la anterior ecuación e igualando los coeficientes del modelo original con el último, el resultado sería el siguiente: ⎛ 32 ⎞ ⎟⎟ β 2 ⎝9 5⎠ ⎛ 32 ⎞ ⎟⎟ β 3 µ1 = β 1 − ⎜⎜ ⎝9 5 ⎠. µ 0 = β 0 − ⎜⎜. ⎛5⎞ ⎝9⎠ ⎛5 ⎞ µ 3 = ⎜ ⎟β 3 ⎝9 ⎠. ,. µ 2 = ⎜ ⎟β2. Aquí se puede observar que el valor del coeficiente de L varía cuando se hacen. transformaciones. de. escala, mientras. que. el. valor. del. término. jerárquicamente mayor no se ve afectado por dicha transformación.. Ahora bien, si se toma como el mejor modelo el segundo al hacer la transformación lineal pasará lo siguiente: y = β 0 + β 2 T + β 12 TL + ε y = ν 0 + ν 1 Z + ν 12 ZL + r despejando, 9 9 y = ν 0 + ν 1 32 + ν 12 32L + ν 1 T + ν 12 LT + r , 5 5 se puede observar que nuevamente aparece el término L que ya había sido eliminado. La situación problemática de escoger no escoger el modelo completo es que al presentarse las transformaciones lineales, la significancia estadística de los factores varía. Griepentrog, Ryan y Smith (1982) demuestran esta situación tal y como se presenta a continuación: Para efectos prácticos suponga que la transformación que sufre la temperatura es Z = c + bT . El estadístico t de student indica si el efecto es significativo o no. Es necesario calcular la matriz de varianzas: se puede 31.
(39) II. 07(20)113 demostrar que para el modelo sin transformaciones y = Xβ + ε esta matriz es. (X ′X )−1. mientras. que. para el modelo. con. transformación. y = Hν + r es. ′ −1 H −1 (X ′X ) T −1 . También se puede demostrar que el cálculo de los estimadores. ( ). del modelo transformado se hace mediante νˆ = H −1 βˆ . Así las cosas la matriz H quedará así:. ⎡1 ⎢ 0 H =⎢ ⎢0 ⎢ ⎣0. 0. c. 1. 0. 0 d 0 0. 0⎤ ⎥ c ⎥ ⇒ H −1 0⎥ ⎥ d⎦. ⎡ ⎢1 ⎢ ⎢0 =⎢ ⎢0 ⎢ ⎢ ⎢0 ⎣. 0 −. c d. 1. 0. 0. 1 d. 0. 0. ⎤ 0 ⎥ c⎥ − ⎥ d⎥. 0 ⎥ ⎥ 1 ⎥ ⎥ d ⎦. Si se denota a los elementos de la diagonal de la matriz (X ′X )−1 (que corresponden a las t (β i ) = βˆi. varianzas. para los coeficientes) como C ii. entonces. Cii para i=0, 1, 2, 3. Para el modelo modificado los estadísticos t se. calculan así:. βˆ1 −. t (ν 1 ) =. C22 − 2. c ˆ β3 d 2. c c C13 + 2 C33 d d. = t (βˆ1 ). βˆ 2 t (ν 2 ) =. d ≠ t ( βˆ ) 2 C 22. βˆ3 t (v3 ) =. d = t ( βˆ3 ) 1 C33 2 d. 32.
(40) II. 07(20)113 El único estadístico que no se ve afectado por la transformación es el correspondiente a la interacción. Es decir que si en el primer modelo (antes de la transformación) la interacción resulta significativa y se elimina un término jerárquicamente inferior no significativo, al hacer transformaciones en uno (o algunos) de los efectos, esto alteraría la significación de estadística de los nuevos coeficientes en el modelo transformado.. Lo anterior llevaría a una conclusión parcial: si bien los términos de mayor orden (dado que tienen relación con los efectos principales) en el modelo permanecen constantes antes transformaciones lineales en los efectos principales, esto no es cierto para la significación estadística de los factores de menor orden dentro del modelo. Por lo tanto, será mejor siempre dejar los efectos principales dentro del modelo así no sean estadísticamente significativos.. La conclusión previa refuerza lo que De Zan (2006) cuando propone que los efectos principales no significativos, dado que hay términos de mayor orden significativos, no deberían ser borrados, ya que no se conoce a ciencia cierta la superficie sobra la que se está trabajando, lo cual llevaría a restricciones fuertes sobre el conocimiento de cierto proceso.. Por el contrario, Montgomery et al (2005) publican un artículo en el cual afirman que utilizar el criterio jerárquico es nocivo para la capacidad de 21. predicción. de los modelos. Los modelos de regresión son útiles para la. predicción de datos de la respuesta futuros. Está predicción puede ser objeto de análisis mediante estadísticos que indican la que tan eficiente está siendo un modelo cuando se usa para tener alguna certeza de los datos que arrojará el sistema en un futuro. La conclusión de dicho artículo es que por principio de parsimonia. 21. (entre. menos. mejor). el modelo. que. excluya. los. términos. Ver sección 2.2.2.2. 33.
(41) II. 07(20)113 estadísticamente no significativos, así sus términos jerárquicamente superiores si 22 lo sean, será el mejor para hacer predicciones .. Dadas las características del criterio jerárquico para el ajuste de modelos este se puede definir de la siguiente forma: Cuando se tiene un modelo polinómico de orden mayor a uno, es necesario hacer primero las pruebas de significancia parcial para los predictores de órdenes superiores. Si dichos predictores de órdenes superiores resultan significativos, entonces es recomendable tomar los predictores jerárquicamente inferiores como parte del modelo. 2.2.2 Medidas Clásicas de calidad de ajuste 2.2.2.1 Comparación del ajuste global entre dos modelos A la hora de elegir un modelo, los dos criterios que se analizaron previamente pueden llevar a una selección de términos distinta. Por un lado, el criterio denominado “jerárquico” indica que la mejor forma de seleccionar los términos del modelo final es la que evalúa la significancia estadística de los términos jerárquicamente superiores y decidir: si éste es estadísticamente significativo se debe dejar en el modelo final, junto con los. términos. jerárquicamente inferiores al término evaluado. De lo contrario, se continúa con la evaluación de los siguientes términos inferiores. Por otro lado, se encuentra el “criterio del p-value”, donde se concluye que en el modelo final sólo deberán estar los términos estadísticamente significativos, independientemente de la jerarquía de los mismos.. Con el fin de evaluar qué criterio de selección de términos funciona mejor en el contexto de la MSR, es necesario tener ciertas medidas que sirvan de base para identificar cuál de los modelos finales es más util. 22. En este artículo se referencia un ejerci cio de Montgomery (2001) el cuál será objeto de análisis en el capítulo 4.. 34.
(42) II. 07(20)113. Prueba F para la comparación de modelos Motulsky y Christopoulos (2004) indican las características que deben presentar los modelos para que en estos pueda ser realizada la prueba F. La condición más importante que se debe cumplir es que los modelos estén anidados <nested> (Motulsky y Christopoulos, 2004, p.136). Dos modelos están anidados o relacionados, “cuando un modelo es un caso simple del otro”. Esta forma de comparar modelos anidados está fundamentada sobre pruebas de hipótesis. En la prueba F se compara la sumatoria de los cuadrados del error de los dos modelos. Ya que los cuadrados medios de error se pueden comparar con estadísticos que sigan distribuciones chi-cuadrado y sumándole la condición de normalidad e independencia, la razón entre los dos cuadrados se distribuirá según una F. Esta F calculada se debe comprar con una F crítica, que indicará si la diferencia entre los dos modelos es o no significativa. La prueba de hipótesis a realizar acá es la siguiente: ⎧H 0 : El mod elo restringido es el más adecuado ⎨ ⎩H 1 : El mod elo completo es el más adecuado. La fórmula para hallar la F de prueba es:. F=. (SSE R − SSE C ) SSEC (gl R − gl C ) gl C. ,. donde los subíndices C y R se refieren al modelo completo (o con mayor número de términos) y modelo restringido (o con menor número de parámetros),. 35.
Documento similar