• No se han encontrado resultados

Control estadístico multivariante en circuito de molienda en la concentradora Cuajone

N/A
N/A
Protected

Academic year: 2020

Share "Control estadístico multivariante en circuito de molienda en la concentradora Cuajone"

Copied!
147
0
0

Texto completo

(1)CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. UNIVERSIDAD NACIONAL DE INGENIERIA FACULTAD DE INGENIERIA GEOLOGICA, MINERA Y METALURGICA. CONTROL ESTADÍSTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA EN LA CONCENTRADORA CUAJONE TESIS PARA OPTAR EL TITULO PROFESIONAL DE: INGENIERO METALURGISTA PRESENTADO POR: CRISTHIAN GERONIMO CURO LORO LIMA – PERU 2008. 1.

(2) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. INDICE RESUMEN ..................................................................................................................... 6 INTRODUCCION ............................................................................................................ 7. CAPITULO I MARCO TEORICO 1.1.DEFINICION DE ANALISIS MULTIVARIANTE ....................................................................... 9 1.2.CONCEPTOS BASICOS DE ANALISIS MULTIVARIANTE .................................................. 10 1.2.1. Valor teorico .............................................................................................................. 10 1.2.2. Definicion y clasificacion de las variables ................................................................. 11 a).-Tipos de variables ................................................................................................. 12 b).-clasificación por los valores que pueden adoptar…………………………………..133. 1.2.3. Escalas de medida .......................................................................................... 13 1.2.4.Variables y escalas de medida................................................................................... 14 1.2.5. Clasificación en función del análisis de datos........................................................... 15 1.3. TIPOS DE TECNICAS MULTIVARIANTES.......................................................................... 16 1.3.1.Verificacion de los supuestos del analisis multivariante……………………………...16 a. Normalidad ............................................................................................................. 16 b. Homocedasticidad .................................................................................................. 18 c. Linealidad................................................................................................................ 18 1.3.2. Tipos de tecnicas multivariantes: ............................................................................. 21 1.4.. ANALISIS GRAFICO Y DATOS ATIPICOS...................................................................... 22 1.4.1. Histogramas y diagramas de dispersion .................................................................. 23 a. Analisis de la forma de la distribucion: ................................................................... 23 b. Análisis de relación entre variables: ....................................................................... 24 1.4.2. Datos Atípicos .......................................................................................................... 25. 1.5.. DISTRIBUCIONES MULTIVARIANTES ........................................................................... 28 1.5.1. Distribucion de Wishart ............................................................................................ 28 1.5.2. La T2 de Hotelling .................................................................................................... 31. 1.6.. CONTROL ESTADISTICO DE PROCESOS CONCEPTOS FUNDAMENTALES ........... 34 1.6.1. Gráficos De Control.................................................................................................. 36 1.6.1.1.Cartas de control para X y R…………………………………………. …….…….39 1.6.1.2.Cartas de control para X y S…………………………………….………………..39 1.6.2. CAPACIDAD DEL PROCESO ................................................................................. 47 1.6.2.1. analisis de capacidad del proceso……………………………………………....47 Utilizando un Histograma……………………………..………………………….48 Graficación de probabilidades ....................................................................... 49 1.6.2.2. Índices de capacidad del proceso ................................................................. 53 a. Uso e interpretación Cp ............................................................................. 53 b. Índice de capacidad del proceso para un proceso fuera del centro.......... 53 1.6.2.3. Estudios de capacidad de instrumentos y sistemas de medicion ............... 56. 2.

(3) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. CAPITULO II MARCO CONCEPTUAL 2.1.CONFIGURACION ACTUAL DE LA PLANTA CONCENTRADORA .................................... 56 2.2. PROCEDIMIENTOS DE OPERACION................................................................................. 61 2.2.1. Lazos de control de molienda ................................................................................... 62 a.-Control de la tasa de alimentación al molino de bolas 1C……….……………..62 Control automático……………………………………………………...…………………63 Modo cascada .......................................................................................................... 63 Modo automático ...................................................................................................... 64 Control manual ......................................................................................................... 65 b.-Control del nivel del tanque de pulpa del polvo de recolección de polvo de recuperación de mineral fino ...................................................................................... 67 Control automático ................................................................................................. 68 Control manual ....................................................................................................... 69 c.-Control del flujo de pulpa de polvo a los molinos de bolas 1C A 2E...................... 70 Control automático ................................................................................................. 70 Control manual ....................................................................................................... 71 2.3. HIPOTESIS: INCREMENTAR TONELAJE EN CIRCUITOS DE MOLIENDA ..................... 72 Molino 1C – Prueba Nº 1:.................................................................................................... 72 Molino 1C – Prueba Nº 2:.................................................................................................... 75 Molino 1D – Prueba Nº 3:.................................................................................................... 78 Molino 1D – Prueba Nº 4:.................................................................................................... 79 Molino 1D – Prueba Nº 5:.................................................................................................... 80 2.4.. JUSTIFICACION ............................................................................................................... 83. CAPITULO III VALIDACIÓN DEL METODO 3.1. TEST ANALITICOS ANALISIS DE FACTORES DE VARIABILIDAD - VFA ........................ 85 3.1.1. Analisis factores de variabilidad................................................................................ 85 Cálculo del primer componente principal (VF1) .................................................. 86 Cálculo del segundo componente principal (VF2) ............................................... 87 3.1.2. Indice dE Hotelling T2 ............................................................................................... 92 3.1.3. Indice error cuadratico de prediccion - SPE............................................................. 94 3.2.TEST ANALITICOS PROYECCION DE ESTRUCTURAS LATENTES - PLS ...................... 98 3.2.1.Cálculo del primer vector latente (VL1).................................................................... 100 3.2.2.Cálculo del segundo vector latente (VL2) ................................................................ 102 3.3. MODELOS PREDICTIVOS................................................................................................. 113 3.3.1.Determinacion de los límites de control ................................................................... 115 3.3.2.Determinacion de la capacidad del proceso: ........................................................... 116 3.3.3.Modelo predictivo %malla +65 como control de calidad:......................................... 117 3.3.3.1.Empleando el software Outocal: ................................................................ 119 3.3.3.2.Empleando el EXCEL:................................................................................ 122 3.3.3.3.Empleando el SCAN:.................................................................................. 123. 3.

(4) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. 3.3.4. Modelo predictivo tonelaje:..................................................................................... 128. CAPITULO IV DISCUSION - ANALISIS DE LOS RESULTADOS .................................................... 133 CAPITULO V CONCLUSIONES y RECOMENDACIONES 5.1.CONCLUSIONES ................................................................................................................ 135 5.2.RECOMENDACIONES ........................................................................................................ 137. BIBLIOGRAFIA ........................................................................................................... 138 GLOSARIO.................................................................................................................. 139 ANEXOS ..................................................................................................................... 141 ANEXO A: FACTORES PARA CONSTRUIR CARTAS DE CONTROL........................... 142 ANEXO B: ARQUITECTURA DEL SISTEMA DE INFORMACION DE PLANTA - PI ..... 143 ANEXO C: VARIABLES DE CONTROL EN LA ETAPA DE MOLIENDA ......................... 144 ANEXO D: MOLINO DE BOLAS 1C- PI PROCESS BOOK ............................................. 146 ANEXO E: FLOW SHEET CONCENTRADORA CUAJONE ............................................ 147. 4.

(5) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. INDICE DE TABLAS TABLA Nº 1 : REFERENCIA CRUZADA DE LA ALIMENTACIÓN AL MOLINO........... 63 TABLA Nº 2 : VÁLVULAS DE CONTROL DEL NIVEL DEL TANQUE DE PULPA....... 69 TABLA Nº 3 : REFERENCIA CRUZADA DEL CONTROL DE FLUJO DE PULPA....... 70 TABLA Nº 4 : VÁLVULAS DE CONTROL DEL FLUJO DE PULPA.............................. 72 TABLA Nº 5 : ESTADISTICA DESCRIPTIVA DEL MOLINO 1C .................................. 74 TABLA Nº 6: MOLINO 1C PRUEBA Nº 1..................................................................... 75 TABLA Nº 7: MOLINO 1C PRUEBA Nº 2..................................................................... 76 TABLA Nº 8: VARIACIÓN DE LAS AGUAS ................................................................. 76 TABLAN º 9: RESULTADOS DE LA PRUEBA Nº2...................................................... 77 TABLA Nº 10: TABLA DE LOS COEFICIENTES DE REGRESIÓN – MOLINO 1D...... 78 TABLA Nº 11: MOLINO 1D PRUEBA Nº3..................................................................... 79 TABLA Nº 12: TABLA DE LOS COEFICIENTES DE REGRESIÓN – MOLINO 1D...... 80 TABLA Nº 13: MOLINO 1D PRUEBA Nº 4.................................................................... 80 TABLA Nº 14: TABLA DE LOS COEFICIENTES DE REGRESIÓN – MOLINO 1D...... 81 TABLA Nº 15: VARIACIÓN DE LAS AGUAS PRUEBA Nº4 ......................................... 81 TABLA Nº 16: RESULTADOS DE LA PRUEBA Nº 4.................................................... 81 TABLA Nº 17: TAGS DEL MOLINO 1C...................................................................... 113 TABLA Nº 18: ESTADISTICA DEL MOLINO 1C........................................................ 114 TABLA Nº 18: DETERMINACIÓN DE LA CAPACIDAD DEL PROCESO ................. 116 TABLA Nº 19: Cp y Cpk ............................................................................................. 116 TABLA Nº 20: MODELO % MALLA + 65- OUTOCAL ................................................. 120 TABLA Nº 21:RESULTADOS DEL MODELO % MALLA + 65 - OUTOCAL ............... 121 TABLA Nº 22: MODELO %SÓLIDOS O/F - OUTOCAL.............................................. 121 TABLA Nº 23: RESULTADOS ESTADÍSTICOS ......................................................... 121 TABLA Nº 24: MODELO %MALLA +65 - EXCEL ....................................................... 122 TABLA Nº 26: MODELO %SÓLIDOS O/F- EXCEL .................................................... 123 TABLA Nº 27: RESULTADO LMODELO %SÓLIDOS O/F- EXCEL.......................................... 123. TABLA Nº 29: RESULTADOS DEL INCREMENTO DEL TONELAJE ........................ 133 TABLA Nº 30: BENEFICIO ECÓNÓMICO DEL INCREMENTO DEL TONELAJE ..... 134. 5.

(6) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. RESUMEN La presente tesis trata sobre la aplicación de las técnicas de análisis multivariante en la etapa de molienda con el objetivo de incrementar el tonelaje en la Planta Concentradora – Unidad Cuajone – SPCC, haciendo uso de la tecnología utilizada como es la Aplicación SCAN. El trabajo consiste en investigar el efecto de todas las variables que existen e interactúan en el proceso de molienda evaluando las variaciones de éstas y el efecto que tienen sobre el tonelaje. Para el estudio se hizo análisis de toda una data extraída usando el Sistema PI, el cual permitía capturar los datos de la historia de todas las variables a examinar para la generación de los modelos predictivos multivariantes. El logro del incremento del tonelaje, requirió en principio el desarrollo de un Sensor Virtual del %malla +65 como un variable de control de calidad y del %Sólidos en el OverFlow.. Los modelos generados fueron el %Carga. Circulante, Potencia, %Malla +65, %Sólidos en el OverFlow y el Tonelaje. Dichos modelos permitieron realizar correcciones de las desviaciones en las condiciones de la operación, con los cuales se logró el incremento del tonelaje. El incremento de tonelaje en la molienda aplicando el control estadístico multivariante se realizó enfocando a los 8 molinos de 16.5’ x 20’, el cual aumentaría si se generasen los modelos predictivos para los molinos de mayor tamaño de 20’ x 33.5’. Los resultados indican que el tonelaje promedio incrementado por día fue de 141.3 TM, lo cual significaría un incremento de 22% de Cobre Total por día.. 6.

(7) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. INTRODUCCION El objetivo de la tesis es dar a conocer una de las principales técnicas multivariantes como es la técnica de Componentes Principales, del cual esta basado el desarrollo del SCAN. Para ello se utilizo la tecnología con que cuenta la Planta Concentradora Cuajone como es el Sistema PI, equipos de medición de partículas en línea (PSM), los cuales fueron la plataforma para la generación de los modelos predictivos. Con el desarrollo de los modelos predictivos se pudo manejar las principales variables operativas del circuito de molienda mediante un control estadístico multivariante, el cual es una herramienta alternativa que deja de lado el control manual de las variables manipuladas por los operadores. Para la realización de dichos modelos predictivos se tuvo en cuenta a la variable %malla +65 del Overflow como una variable de control de calidad y que junto a la variable Potencia fueron las que restringieron el límite para poder incrementar el tonelaje de la planta concentradora. La Planta Concentradora Cuajone que está ubicada a 160Km al noreste del Puerto de Ilo al sur del Perú, y a una altura de 3360m sobre el nivel del mar, consta de: •. Tres circuitos de chancado en tres etapas: primario, secundario y terciario. •. Molienda en molinos de bolas Allis Chalmers y Svedala.. •. Flotación de Cobre – Moly en celdas OK100 y OK160, Wemco, Dorr – Oliver y celdas columna.. •. Recuperación de Moly en Planta de Molibdeno.. •. Espesamiento en espesadores Eimco.. 7.

(8) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. •. CRISTHIAN CURO LORO. Filtrado de concentrado de cobre en filtros rotatorios Eimco y filtro Larox.. •. Recuperación de agua en los Espesadores de relaves Nº 1 y 2 de la marca Eimco, en el Espesador Nº 3 de Dorr – Oliver, y en el Espesador Nº 4 de Hi – Rate Outokumpu. La concentradora y las instalaciones relacionadas están diseñadas para. tratar 87 360 TMD de mineral con un contenido promedio de 0.72 %Cu y 0.029 %MO. La concentradora produce dos tipos de concentrado de mineral: •. Aproximadamente 1,935 TMD de concentrado de Cobre con un promedio de 25 %Cu y 0.127% MoS2.. •. Aproximadamente 15TMD de concentrado de MO con un promedio de 92 %MoS2 y menos de 1.2 %Cu. El análisis de los métodos multivariantes predominará en el futuro y dará. por resultado cambios drásticos en el modo que los investigadores piensen sobre los problemas y en como diseñan sus investigaciones. Esos métodos hacen posible plantear preguntas especificas y precisas de considerable complejidad de marcos idóneos, lo que posibilita llevar a cabo investigaciones teóricamente significativas y evaluar los efectos de las variaciones paramétricas ocurridas de forma natural en el contexto en que normalmente ocurren. De esta forma, se pueden preservar las correlaciones naturales entre las múltiples influencias sobre el comportamiento y se pueden estudiar estadísticamente los efectos aislados de esas influencias sin provocar el típico aislamiento de esos individuos o variables.. 8.

(9) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. CAPITULO I MARCO TEORICO 1.1.. DEFINICION DE ANALISIS MULTIVARIANTE Las técnicas multivariantes son un conjunto de métodos estadísticos que. permiten el análisis de forma simultánea de más de dos variables observadas en una investigación. Desde una concepción amplia podemos definir el análisis multivariante como un conjunto de métodos que analizan las relaciones entre un número razonablemente amplio de variables (medidas), tomadas sobre cada elemento de análisis, en una o más muestras simultáneamente. A través del análisis multivariante lo que hacemos es combinar todas las variables, eliminando la información redundante y se obtiene una nueva variable que no es observable directamente, que representa un concepto abstracto que se puede medir obteniéndose un valor para cada elemento. Esta situación la podemos resumir en el siguiente esquema. Variables Observadas. Análisis Multivariante. Nueva variable Abstracta. Las técnicas de análisis multivariante se utilizan cada vez más en la investigación comercial por las siguientes razones: 1. Permiten el analizar un gran número de encuestas. Simplificando muchos datos, con la mínima pérdida de información. Consiguiendo hacer más comprensible la información para la mente humana.. 9.

(10) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. 2. Permiten analizar toda la información acerca de un determinado fenómeno, considerando simultáneamente todos los factores que intervienen. 3. Permiten trabajar con cualquier tipo de variable. 1.2.. CONCEPTOS BASICOS DE ANALISIS MULTIVARIANTE Aunque el análisis multivariante tiene sus raíces en la estadística. univariante y bivariante, la extensión al dominio multivariante introduce conceptos y cuestiones adicionales. Estos conceptos van desde la necesidad de un entendimiento conceptual del elemento básico del análisis multivariante – el valor teórico – a las cuestiones específicas acerca de los tipos de escalas de medida utilizadas y los resultados estadísticos de los tests de significación y los intervalos de confianza. Cada concepto juega un papel importante en la correcta aplicación de cualquier técnica multivariante. 1.2.1 VALOR TEORICO El propósito del análisis multivariante es medir, explicar y predecir el grado de relación de los valores teóricos (combinaciones ponderadas de variables). Por tanto, el carácter multivariante reside en los múltiples valores teóricos (combinaciones múltiples de variables) y no en el número de variables u observaciones. El elemento esencial del análisis multivariante es el valor teórico, una combinación. lineal. de. variables. con. ponderaciones. determinadas. empíricamente. El investigador especifica las variables, mientras que las ponderaciones son objeto específico de determinación por parte de la técnica multivariante. Un valor teórico de “n” variables ponderadas (X1 a Xn) puede expresarse matemáticamente así:. 10.

(11) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Valor Teórico = w 1 X 1 + w 2 X 2 + w 3 X 3 + ... + w n X n .................. (1) Donde Xn es la variable observada y wn es la ponderación determinada por la técnica multivariante. El resultado es un valor único que representa una combinación de todo el conjunto de variables que mejor se adaptan al objeto del análisis multivariante específico. En regresiones múltiples el valor teórico se determina de tal forma que guarde la mejor correlación con la variable que se esta prediciendo. 1.2.2 DEFINICION Y CLASIFICACION DE LAS VARIABLES En las técnicas del análisis multivariante se entiende por variable alguna magnitud que representa la característica de los elementos objeto de investigación que tratamos de medir. En una primera clasificación las variables las podemos clasificar en dos grupos, variables independientes (VI) y variables dependientes (VD). Las variables dependientes son aquellas cuyo comportamiento es explicado o pronosticado por una o más variables independientes. Las variables dependientes también se denominan variables criterio o respuesta, mientras que las variables independientes son las que servirán para explicar el fenómeno estudiado y en ocasiones se denominan como variables explicativas, factores o variables predictoras. En los estudios no experimentales, la situación de las variables no siempre es clara, definiéndose su papel en el contexto de la investigación. Una misma variable puede adoptar diferentes roles en función de situaciones. Cuando existen diferencias sistemáticas en una variable dependiente (Y) asociada a diferentes niveles de variación de la variable independiente (X) se dice que están relacionadas.. 11.

(12) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Si todas las variables desempeñan el mismo papel se habla de relaciones de interdependencia. En este caso no hay una variable con las que se intente explicar el comportamiento de otras. En ocasiones, al analizar el modelo la única forma de diferenciar las variables es simplemente por donde están situadas en la ecuación. a).-. TIPOS DE VARIABLES Una variable es una característica o propiedad de un elemento (individuo,. objeto, transacción, suceso, etc.), que toma distintos valores para cada elemento. En general se clasifican en dos grandes grupos: • Variables no métricas o cualitativas • Variables métricas o cuantitativas Los diferentes tipos de variable los resumimos a continuación: Variables cuantitativas o métricas: Son aquellas en las que los valores tomados por diferentes individuos tienen un significado propio. De hecho, son una medición o cuantificación de una determinada característica, la respuesta a la pregunta: ¿Cuántos? Ejemplos: altura, peso, edad, hijos, ingresos, de un individuo, empleados, oficinas, beneficios, de una empresa, etc. Variables cualitativas o no métricas (atributos): En las que las distintas características de los elementos estudiados son cualidades o categorías alfabéticas. Sin embargo, con el fin de facilitar el tratamiento de los datos, estas categorías se convierten en unos códigos, sin que tenga que existir ningún tipo de relación entre el valor asignado y el significado de la categoría representada. Ejemplos: nacionalidad, sexo, religión, estudios cursados, clase social, calificación (Suspenso, Aprobado, Notable, Sobresaliente), etc.. 12.

(13) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. b).-. CRISTHIAN CURO LORO. CLASIFICACIÓN POR LOS VALORES QUE PUEDEN ADOPTAR De acuerdo con el valor que pueden adoptar las variables estas las. podemos clasificar en los siguientes tipos: •. Variable continúa. Se trata de una variable cuantitativa que puede. adoptar cualquier valor numérico, Para todo par de valores siempre podemos encontrar uno intermedio. Por ejemplo la edad, el consumo de teléfono. •. Variable discreta. Puede adoptar un número finito de valores. distintos, entre dos valores consecutivos no se puede encontrar ninguno intermedio. Por ejemplo el número de personas por hogar. •. Variable dicotómica o binaria. Solo puede tomar dos valores, si se. definen como 0 y 1 se llama binaria. •. Variables ficticias o Dummy. Se utiliza con variables cualitativas,. para poder obtener información a través de operaciones, se convierten en binarias, indicando el valor 1 la presencia de una categoría de la variable y 0 su ausencia. Para realizar la conversión de una variable cualitativa en ficticia se necesitan tantas variables dummy como categorías tiene la variable menos una.. ESCALAS DE MEDIDA Prácticamente todas las investigaciones de mercado recogen los datos en forma de números, interesando al investigador lo que estos números representan, por medio de las correspondientes operaciones de medida. Medir consiste en asignar números a los sucesos, elementos, objetos, atributos, según unas normas predeterminadas. Puesto que se utiliza diferentes reglas para la asignación de los números, un mismo número puede dar lugar a diferentes interpretaciones, ello da lugar a la existencia de diferentes escalas de medida.. 13.

(14) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Por escala de medida entenderemos la correspondencia entre los números asignados a las propiedades de los elementos y la significación de los cálculos matemáticos realizados con los números. Básicamente en el análisis estadístico se utilizan las cuatro escalas siguientes: Nominal, Ordinal, Intervalo y Ratio o de proporción. Las características de estas escalas se resumen a continuación: •. Nominal: los posibles valores de la variable representan diferentes. categorías, no existiendo ninguna relación entre el código asignado a una categoría y su significado Ejemplos: profesión, raza, estado civil, o Caso particular: variables dicotómicas, sólo admiten dos posibles respuestas. Ejemplos: sexo, verdadero/falso, si / no. Se denominan binarias si se codifican 0 / 1. •. Ordinal: los códigos o valores de cada categoría mantienen la. misma relación de orden que el significado de las categorías. Ejemplos: clase social, escala de preferencia. •. Intervalo: los códigos asignados a diferentes respuestas permiten. conocer la magnitud de la característica medida, ya que se mantiene una relación de orden y distancia. Ejemplos: temperatura, fechas, cualquier variable redondeada. •. Ratio o razón: los códigos representan el propio valor de la. característica estudiada, observándose una relación de orden y de distancia y la existencia de un origen Ejemplos: cifra de ventas, ratio económico financiero. 1.2.4. VARIABLES Y ESCALAS DE MEDIDA Partiendo de los dos grandes grupos de variables, (cualitativas y métricas), podemos resumir la relación entre las variables y las escalas de medida como sigue:. 14.

(15) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. 1. Variables no métricas o cualitativas, vienen medidas en escala nominal u ordinal. 2. Variables métricas o cuantitativas se utilizan las escalas de intervalo o de razón. 3. Variables binarias se utiliza la escala de razón. 1.2.5. CLASIFICACIÓN EN FUNCIÓN DEL ANÁLISIS DE DATOS En ocasiones en el estudio se deben realizar transformaciones de escala y origen, las variables las podemos dividir en: Valores o puntuaciones directas, también llamadas brutas, se obtienen directamente del instrumento de medida y en sus mismas dimensiones. Se suelen representar por letras mayúsculas X, Y, Z, ... teniendo medias mX, mY, mZ ... y las correspondientes desviaciones típicas sX, sY, sZ, ... medidas en la misma escala. Valores o puntuaciones centradas en la media o diferenciales, son el resultado de un cambio en el origen al obtenerse de la resta de la media del valor, se suelen representar con letras minúsculas (x, y, z, ...) y se obtienen a partir de la siguiente operación: x = X − mx. ………. (2). Este tipo de puntuación tiene de media 0 y una desviación típica igual a la de las puntuaciones originales. Se produce un cambio de origen no de escala. Valores típicos o estandarizados, se obtienen restando de cada valor la media y dividiendo por la desviación típica. Se suelen representar por la letra Z y el subíndice de a correspondiente categoría de la variable.. 15.

(16) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Se obtienen de: Z=. X − mx ………. (3) sx. Los valores tipificados están libres de escala y siempre tienen media igual a 0 y desviación típica igual a 1. 1.3. TIPOS DE TECNICAS MULTIVARIANTES El empleo de las técnicas de análisis multivariante implica la necesidad de. comprobar algunos supuestos estadísticos. Esta necesidad aumenta como consecuencia de dos características de este tipo de análisis. 1. La complejidad de las relaciones, debido al uso habitual de una gran cantidad de variables, hace que las distorsiones y los sesgos potenciales sean mas potentes cuando se incumplan los supuestos. 2. La complejidad de los análisis y de los resultados pueden enmascarar los “signos” de las violaciones de los supuestos que son aparentes en los mas sencillos análisis multivariantes. El análisis multivariante requiere que los supuestos subyacentes a las técnicas estadísticas sean contrastados dos veces: en primer lugar para las variables aisladas, semejante a la prueba de los supuestos del análisis univariante, y en segundo lugar para el valor teórico del modelo multivariante, que actúa colectivamente sobre las variables a analizar y por tanto debe cumplir los mismos supuestos que las variables individuales. 1.3.1. VERIFICACION DE LOS SUPUESTOS DEL ANALISIS MULTIVARIANTE a. NORMALIDAD El supuesto fundamental del análisis multivariante es la normalidad de los datos, en referencia al perfil de la distribución de los datos para una única variable métrica y su correspondencia con una distribución. 16.

(17) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. normal, punto de referencia de los métodos estadísticos. Si la variación respecto de la distribución normal es suficientemente amplia, todos los test estadísticos resultantes no son validos, dado que se requiere la normalidad para el uso de los estadísticos t (test de Student) y de F (test de Fisher). La normalidad univariante para una variable es fácil de contrastar, siendo. posible. varias. medidas. correctoras.. La. normalidad. multivariante (la combinación de dos o más variables) implica que las variables individuales son normales en un sentido univariante y que sus combinaciones también sean normales. Por tanto, si una variable es normal multivariante, es también normal univariante. Sin embargo, lo contrario no es necesariamente cierto (dos o mas variables normales univariantes no son necesariamente normal multivariante).. Gráf ico de. Dist ribución. Gráf ico de. Dist ribución. probabilidad normal. Univariant e. probabilidad normal. Univariant e. (a) Distribución Normal. (b) Distribución Uniforme. Gráf ico de. Dist ribución. Gráf ico de. Dist ribución. probabilidad normal. Univariant e. probabilidad normal. Univariant e. (c) Distribución no Puntiaguda. (d) Distribución Puntiaguda. Gráf ico de. Dist ribución. Gráf ico de. Dist ribución. probabilidad normal. Univariant e. probabilidad normal. Univariant e. (e) Distribución Negativa. (f) Distribución Positiva. ____ Gráfico de Distribución univariante. …….. Distribución Normal acumulativa. Figura Nº 1 17.

(18) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. b. HOMOCEDASTICIDAD La homocedasticidad es un supuesto relativo primordialmente a las relaciones de dependencia entre variables. Se refiere al supuesto que las variables dependientes exhiban iguales niveles de varianza a lo largo del rango del predictor de las variables. La homocedasticidad es deseable porque la varianza de la variable dependiente que se esta explicando en la relación de dependencia no debería concentrarse solo en un limitado rango de los valores independientes. Aunque las variables dependientes deben ser métricas, este concepto de igual dispersión de la varianza a lo largo de las variables independientes puede aplicarse cuando las variables son métricas o no métricas. Con. variables. homocedasticidad. independientes. métricas,. el. concepto. de. se basa en la dispersión de la varianza de la. variable dependiente a lo largo del rango de los valores de la variable independiente, que se encuentra en técnicas como la regresión múltiple. El mismo concepto se aplica también cuando las variables independientes son no métricas.. V2. V2. V1. V1. (a) Homocedasticidad. (b) Heterocedasticidad. Figura Nº 2. 18.

(19) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. c. LINEALIDAD La linealidad es un supuesto implícito de todas las técnicas multivariantes basadas en medidas de correlación, incluyendo la regresión múltiple, regresión logística, análisis factorial y los modelos de ecuaciones estructurales. Dado que las correlaciones representan solo la asociación lineal entre variables, los efectos no lineales no estarán representados en el valor de la correlación. Como resultado, es siempre prudente examinar todas las relaciones para identificar cualquier desplazamiento de la linealidad que pueda impactar la correlación. Identificación de relaciones no lineales: La forma más común de evaluar la linealidad es examinar los gráficos de dispersión de las variables e identificar cualquier pauta no lineal en los datos. Una aproximación alternativa es ir a un análisis de regresión múltiple y examinar los residuos. Los residuos reflejan la parte no explicada de la variable dependiente: por tanto, cualquier parte no lineal de la relación quedará reflejada en los residuos. TRANSFORMACIONES DE LOS DATOS: Las transformaciones de los datos proporcionan un medio de modificar variables por una o dos razones: corregir el incumplimiento de los supuestos estadísticos subyacentes a las técnicas multivariantes o mejorar la relación (correlación) entre variables. La transformación de los datos puede basarse en razones tanto “teóricas” como “derivadas de los datos”. Así, en cada caso el investigador debe proceder muchas veces por ensayo y error, ponderando la mejora frente a la necesidad de transformaciones adicionales.. 19.

(20) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Transformaciones de los datos para conseguir la normalidad y la homocedasticidad: Las transformaciones de los datos proporcionan el medio principal de corregir la no normalidad y heterocedasticidad. En ambos casos, la forma de las variables sugiere transformaciones específicas. Para las distribuciones no normales, las dos formas más comunes son las distribuciones “planas” y las distribuciones “asimétricas”. Para la distribución plana, las transformaciones mas comunes son la inversa (es decir, 1/Y o 1/X). Las distribuciones asimétricas. pueden ser. transformadas empleando la raíz cuadrada, logaritmos o incluso la inversa de la variable. La heterocedasticidad es un problema asociado a la normalidad, y en muchos casos la solución del problema tiene que ver también con los problemas de normalidad. La heterocedasticidad se debe también a la distribución de la variable.. Transformaciones para conseguir la linealidad: Existen numerosos procedimientos para conseguir la linealidad entre dos variables, pero las relaciones no lineales mas simples pueden clasificarse en cuatro categorías (figura 3). En cada cuadrante, se muestran las transformaciones potenciales para variables dependiente e independiente. Por ejemplo. Si las relaciones locales son como las de la Figura 3 (a) se aplica la raíz cuadrada para conseguir la linealidad. Cuando se muestran las posibilidades de transformación múltiple se empieza con el método más adecuado para cada cuadrante para después bajar hasta que se consigue la linealidad.. 20.

(21) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. Y. CRISTHIAN CURO LORO. Y. Y2. logY -1/Y. Y. logX -1/X. X2. X. X. (a). X. (c). Y. Y. Y2. logY -1/Y. Y logX -1/X. X2 X. (b). X. (d). X. Figura Nº 3. 1.3.2. TIPOS DE TECNICAS MULTIVARIANTES: El análisis multivariante es un conjunto de técnicas de análisis de datos en expansión. Entre las técnicas mas conocidas tenemos: 1. Regresión múltiple y correlación múltiple 2. Análisis discriminante múltiple 3. Componentes principales y análisis factorial común 4. Análisis multivariante de varianza y covarianza 5. Correlación canónica 6. Análisis cluster 7. Análisis multidimensional, y 8. Análisis conjunto. Entre las técnicas más emergentes tenemos: 9. Análisis de correspondencias 10. Modelos de probabilidad lineal como logit y probit; y 11. Modelos de ecuaciones simultaneas/estructurales.. 21.

(22) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Existe varios software estadísticos uno de los más conocidos el STATGRAPHICS Plus, el cual contiene un Módulo de Métodos Multivariantes, el cual consta de cinco tipos de análisis: -. Análisis Cluster.. -. Análisis Factorial.. -. Análisis de los Componentes Principales.. -. Análisis Discriminante, y. -. Análisis de Correlación Canónica.. En el caso de la presente tesis, se va a trabajar con la Aplicación SCAN, el cual trabaja con el Método Multivariante de los Componentes Principales. 1.4.. ANALISIS GRAFICO Y DATOS ATIPICOS El examen de los datos es un paso necesario, que lleva tiempo, y que. habitualmente se descuida por parte de los analistas de datos. Las tareas previas implícitas en el examen previo de los datos pueden parecer insignificantes y sin consecuencias a primera vista, pero son parte esencial del análisis multivariante. Existen cuatro fases distintas para un examen de datos: a. Un examen gráfico de la naturaleza de las variables a analizar y las relaciones que forman las bases del análisis multivariante. b. Un proceso de evaluación para entender el impacto que pueden tener los datos ausentes sobre el análisis. c. Las técnicas que mejor se ajustan para la identificación de casos atípicos. d. Los métodos analíticos necesarios para evaluar adecuadamente la capacidad de los datos para cumplir los supuestos estadísticos específicos de muchas técnicas multivariantes.. 22.

(23) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. 1.4.1. HISTOGRAMAS Y DIAGRAMAS DE DISPERSION a.. ANALISIS DE LA FORMA DE LA DISTRIBUCION:. El punto de partida para entender la naturaleza de cualquier variable es caracterizar la forma de su distribución. Muchas veces el investigador puede obtener una perspectiva adecuada de la variable a través de un histograma. Un histograma es una representación grafica de los datos que muestra la frecuencia de los casos (valores de los datos) en categoría de datos. Las frecuencias se representan para examinar la forma de la distribución de las respuestas. Si el rango de respuestas va de 1 a10, el investigador pude construir un histograma contando el número de respuestas que fueron un uno, un dos, etc. Para las variables continuas se forman categorías, dentro de las cuales la frecuencia de los valores de datos esta tabulada. Por ejemplo según la figura 4 las categorías de puntos intermedios son 0, 0.5, 1, 1.5…..hasta 6.0. La altura de las barras representa la frecuencia de los valores de los datos en cada categoría. Si el examen de la distribución tiene como objetivo evaluar su normalidad, se puede superponer la curva normal sobre la distribución, como se ha hecho en la Figura 4. El histograma puede utilizarse para examinar cualquier tipo de variable, desde los valores originales a los residuos de una técnica multivariante. 23.

(24) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. 16 14. Frecuencia. 12 10 8 6 4 2 0 0,05. 0,5. 1. 1,5. 2. 2,5. 3. 3,5. 4. 4,5. 5. 5,5. 6. X1: Velocidad de Entrega. Una representación gráfica de una distribución universal: El histograma.. Figura Nº 4. b.. ANÁLISIS DE RELACIÓN ENTRE VARIABLES: El método mas popular de análisis de las relaciones bivariantes es el. GRÁFICO DE DISPERSIÓN, un gráfico de puntos de datos basados en dos variables. Se presenta una variable en el eje horizontal y la otra en el vertical. El patrón de los puntos representa la relación entre las variables.. Cuando los. puntos se organizan a lo largo de una línea recta, tenemos una relación lineal de correlación. Un conjunto de puntos curvados puede indicar una relación no lineal. Existen muchos tipos de gráficos de dispersión, pero un formato que se ajusta particularmente a las técnicas multivariantes es la MATRIZ DEL GRÁFICO DE DISPERSIÓN. Aquí se representa el gráfico de dispersión para todas las combinaciones de variables en la porción inferior de la matriz. Las diagonales contienen los histogramas de las variables. En la parte superior de la matriz se incluyen las correlaciones correspondientes para que el investigador pueda valorar la correlación representada en cada grafico de dispersión.. 24.

(25) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. 1.4.2. DATOS ATÍPICOS Los casos atípicos son observaciones con una combinación única de características identificables que les diferencia claramente de las otras observaciones.. Los. casos. atípicos. no. pueden. ser. caracterizados. categóricamente como benéficos o problemáticos sino que deben ser contemplados en el contesto del análisis y deben ser evaluados por los tipos de información que pueden proporcionar. Cuando son benéficos, los casos atípicos, aunque diferentes a la mayor parte de la muestra, pueden ser indicativos de las características segmento de la población que se llegarían a descubrir en el curso normal del análisis. Por el contrario, los casos atípicos problemáticos no son representativos de la población y están en contra de los objetivos del análisis. Los casos atípicos problemáticos pueden distorsionar seriamente los test estadísticos. Debido a la variabilidad en la evaluación de los casos atípicos, se hace imperativo que el investigador examine los datos en busca de la presencia de los casos atípicos con el fin de averiguar el tipo de influencia que ejercen. DETECCIÓN DE CASOS ATÍPICOS: Los datos atípicos pueden identificarse desde una perspectiva univariante, bivariante o multivariante.. Detección Univariante: La perspectiva univariante de identificación de casos atípicos examina la distribución de observaciones, seleccionando como casos atípicos aquellos casos que caigan fuera de los rangos de la distribución. La cuestión principal consiste en el establecimiento de un umbral para la designación como caso atípico. El enfoque típico convierte en primer lugar los valores de los datos en valores estándar, que tienen una media cero y una desviación estándar de uno.. 25.

(26) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Detección Bivariante: Además de la evaluación univariante, pueden evaluarse conjuntamente pares de. variables. mediante. un. gráfico. de. dispersión.. Casos. que. caigan. manifiestamente fuera del rango del resto de las observaciones pueden identificarse como puntos aislados en el gráfico de dispersión. Para ayudar a determinar el rango esperado de las observaciones, se puede superponer sobre el gráfico de dispersión una elipse que represente un intervalo de confianza especificado (variando entre 50 y 90 porciento de la distribución) para una distribución normal bivariante. Esto proporciona una representación gráfica de los límites de confianza y facilita la identificación de casos atípicos.. Detección Multivariante: Dado que la mayoría de los análisis multivariantes tienen más de dos variables, el investigador necesita una forma de medición objetiva de la posición multidimensional de cada observación relativa a un punto común. La medida D2 de Mahalanobis puede usarse con este fin. La D2 de Mahalanobis es una medida de la distancia de cada observación en un espacio multidimensional respecto del centro medio de las observaciones. Debido a que proporciona una medida común de centralidad multidimensional, también tiene propiedades estadísticas que tienen en cuenta las pruebas de significación. Dada la naturaleza de los test estadísticos, se sugiere que se use un nivel muy conservador, quizá 0.001, como valor umbral para la designación como caso atípico. Una forma de resumir la variabilidad de un conjunto de variables es mediante la traza de su matriz de varianzas y covarianzas. Se define la varianza total de los datos por:. 26.

(27) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. p. T = tr ( S ) = ∑ si2. …………..…..…… (4). i =1. Y la varianza media por: _2. s =. 1 p 2 ∑ si ………………………..…. (5) p i =1. El inconveniente de estas medidas es no tener en cuenta la estructura de dependencia entre las variables. Una medida mejor de la variabilidad global es la varianza generalizada, concepto debido a Wilks. Se define como el determinante de la matriz de varianzas y covarianzas, es decir: VG = S …………………..…. (6). Su raíz cuadrada se denomina desviación típica generalizada, y tiene las propiedades siguientes: 1.5. Está bien definida, ya que el determinante de la matriz de varianzas y covarianzas es siempre no negativo. 1.6. Es una medida del área (para p=2), volumen (para p=3) o hipervolumen (para p>3) ocupado por el conjunto de datos. Un. procedimiento. alternativo. para. estudiar. la. variabilidad. de. las. observaciones es utilizar el concepto de distancias entre puntos. En el caso escalar, la distancia entre el valor de una variable x en un punto, xi, y la media 2. _. de la variable, x , se puede medir mediante. _ ⎛ ⎞ ⎜ xi − x ⎟ , alternativamente, por el ⎝ ⎠. _. valor absoluto de la diferencia, xi − x . La varianza es un promedio de estas distancias al cuadrado entre los puntos y su media. 27.

(28) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. La Distancia de Mahalanobis: Se define la distancia de Mahalanobis entre un punto y su vector de medias por: _ _ ⎡⎛ ⎞ ⎛ ⎞⎤ di = ⎢⎜ xi − x ⎟' S −1 ⎜ xi − x ⎟⎥ ⎠ ⎝ ⎠⎦ ⎣⎝. 1/ 2. ……… (7). Es frecuente referirse al valor di2 también como la distancia de Mahalanobis, en lugar de cómo cuadrado de la distancia, la cual es una medida muy razonable de distancias entre variables correlacionadas. 1.5.. DISTRIBUCIONES MULTIVARIANTES El problema central en el análisis de datos es decir si las propiedades. encontradas en una muestra pueden generalizarse a la población de la que proviene. Para poder realizar esta extrapolación necesitamos construir un modelo del sistema generador de los datos, es decir, suponer una distribución de probabilidad para la variable aleatoria en la población. 1.5.1. DISTRIBUCION DE WISHART La distribución de Wishart se utiliza para representar la distribución muestral de las matrices de covarianzas en muestras de variables normales multivariantes. En el caso escalar, la distribución que representa esta incertidumbre es la ji-cuadrado de Pearson, χ i2 y la distribución de Wishart estándar puede considerarse como una generalización multivariante de esta distribución. Recordemos los resultados univariantes: Si (I1, … , Im) es un conjunto de variables aleatorias normales independientes N (0, de sus cuadrados,. σ ∑ x −2. m. 2. i =1. i. σ. , sigue una distribución. 2. ), la suma estandarizada. x. 2. . También decimos que. m. 28.

(29) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. w =. x. 2 m. ∑ x m. 2. i =1. i. CRISTHIAN CURO LORO. , sigue una distribución. σ x 2. 2. . La densidad de una distribución. m. es un caso particular de la Gamma con parámetros ⎛⎜ 1 , m ⎞⎟ y tiene función de ⎝2 2 ⎠. densidad dada por: 2. (x ) 2. 2. f (x ) = k (x ). m −1 2. ⎧ 1 2⎫ exp. ⎨− x ⎬ …….. ⎩ 2 ⎭. (8). Donde k es una constante. Por otro lado, la distribución de la variable w =. ∑ x m. 2. i =1. i. ⎛ 1 ⎞m ⎟. será la Gamma con parámetros ⎜ , y su densidad tendrá la ⎜2 2⎟ 2 ⎝ σ ⎠. forma:. f (w) = k. (σ ) 2. −. m 2. −1 ⎧ 1 −2 ⎫ w 2 exp. ⎨− σ w⎬ ……. (9) ⎩ 2 ⎭ m. Considerando ahora un conjunto de “m” vectores aleatorios, (x1,…, xm), de dimensión “p” con la misma distribución Np (0,1). La estimación de su matriz de varianzas y covarianzas se obtendrá de. ∑. m. i =1. xi xi' / m , y el numerador de. esta expresión. W=. ∑ xi xi' m. i =1. …………………………..…. (10). que es una matriz cuadrada p x p, simétrica y definida positiva, decimos que sigue una distribución Wishart con “m” grados de libertad. Esta afirmación debe. 29.

(30) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. interpretarse en el sentido de que la distribución conjunta de los. 1 p(p+1) 2. elementos distintos de W es:. f. (w ,..., w ) = c W 11. ( m − p −1) / 2. pp. ⎧ 1 ⎫ exp⎨− tr (W )⎬ …….. (11) ⎩ 2 ⎭. Donde “c” es una constante de normalización para que la integral de la función = 1.. Observemos que para p = 1 se obtiene la ecuación 8. Escribiremos W∼ Wp (m), donde “p” indica que se trata de la distribución de los elementos de una matriz cuadrada y simétrica de orden p, y m son los grados de libertad. Observemos que esta distribución depende únicamente de las dos medidas escalares del tamaño de la matriz: la traza y el determinante. Por tanto, todas las combinaciones de elementos de la matriz que conduzcan a los mismos valores de estas medidas de tamaño tienen la misma probabilidad. Consideremos, seguidamente, m vectores aleatorios (x1,…, xm) de una distribución. N (0, ∑ ) , p. donde hemos utilizado el símbolo ∑ en lugar de V. (matriz de varianzas y covarianzas o simplemente matriz de covarianzas) para representar la matriz de covarianzas. La distribución de los elementos de la matriz W=. ∑ xi xi' m. i =1. ……………………………..……… (12). es la distribución Wishart con m grados de libertad y matriz de parámetros ∑, dada por f. (w ,..., w ) = c / w /( 11. pp. m − p −1) / 2. ⎧ 1 exp⎨− tr ∑ ⎩ 2. −1. ⎫ w⎬ …………. (13) ⎭. 30.

(31) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. En general, si una matriz cuadrada y simétrica sigue la distribución (ecuación 9), donde ∑ es una matriz simétrica (p x p) no singular definida positiva de componentes constantes, diremos que sigue la distribución Wishart con m grados de libertad y matriz de parámetros∑, y escribiremos W∼Wp (m,∑). Observemos que para p = 1, esta expresión se reduce a (ecuación 9), y si hacemos Σ = I, la densidad (ecuación 13) se reduce a. ecuación 11, y. Wp(m, I)= Wp(m). La Figura 5 presenta un ejemplo de esta distribución.. Figura Nº 5 1.5.2. LA T2 DE HOTELLING Si x es un vector aleatorio con distribución 1(x- µ) es una. x. 2. N. p. (µ, V), la variable (x- µ)’V-. con p grados de libertad. Si Sustituimos V por su estimación. Ŝ , la matriz de variabilidad muestral dividida por n -1, la distribución que se. obtiene se denomina T² de Hotelling. En general, si x se distribuye N p (µ, V) y (n-1) Ŝ se distribuye `W p (n-1,V), la distribución de la variable escalar:. 31.

(32) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. T²=(x-µ)′ Ŝ -1(x-µ) ………… (14) que representa la distancia de Mahalanobis entre una variable y su media poblacional, pero calculada con la matriz de covarianza estimada, se denomina distribución T² de Hotelling con p y n – 1 grados de libertad. Diremos que T² ∼ T² (p, n-1). Asintóticamente, como Ŝ → V, T² converge a la distancia de Mahalanobis y 2. la distribución de Hotelling a la distribución x p . Por tanto, para m grande, la distribución de Hotelling es muy similar a una. x. 2 p. , Para tamaños muestrales mas. pequeños tiene una mayor variabilidad que la. x. 2 p. , como consecuencia de la. mayor incertidumbre al utilizar la matriz estimada, Ŝ , en lugar de la matriz de covarianzas poblacional, V.. ⎛ 1 ⎞ Si x es la medida muestral, como x ∼ N p ⎜ µ , V ⎟ , la distribución de ⎝ n ⎠ −1. (x. ⎛ Sˆ ⎞ ι -µ)′ ⎜ ⎟ ( x − µ ) = n (x − µ ) Sˆ (x − µ ) …………. (15) ⎜n⎟ ⎝ ⎠ −1. es también una T² de Hotelling. Observemos que si p = 1, la T² se reduce a:. T² =. n. (x − µ ) = 2. sˆ. 2. t. 2. ……………. Y coincide con el estadístico t de Student. Por tanto T² (1, m) =. t. (16). 2 m. La distribución de Hotelling no se tabula, ya que con una simple transformación se reduce a la distribución F del análisis de la varianza de Fisher. Se demuestra que:. 32.

(33) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. F. p ,n− p. =. CRISTHIAN CURO LORO. n− p 2 ( p.n − 1) T p(n − 1). (17). lo que permite calcular la distribución de T² en función de las tablas de la distribución F. Este resultado es consistente con la convergencia de la T² a la x² ya que implica que asintóticamente, p F p ,n − p tiene a una distribución muestra un ejemplo. x. 2. . La Figura 6. de la distribución de Hotelling comparada con la. x. 2 p. .. Vemos que para tamaño muestral muy pequeño, n = 15, las colas de la distribución son mas pesadas que las de la ji-. cuadrado indicando la mayor. incertidumbre existente, pero para n = 50 ambas son ya muy similares. La aproximación depende del cociente n/p, y si este es grande mayor de 15, podemos aproximar bien la distribución de la Hotelling mediante la ji-cuadrada.. La distribución de Hotelling para dos valores del tamaño muestra y la distribución ji-cuacrada.. Figura Nº 6. 33.

(34) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. 1.6.. CRISTHIAN CURO LORO. CONTROL ESTADISTICO DE PROCESOS CONCEPTOS FUNDAMENTALES El control estadístico de Procesos (SPC, por sus siglas en inglés) en. línea es una herramienta básica para alcanzar el objetivo de un continuo desempeño del proceso y reducir la variabilidad de los parámetros clave. Las cartas de control constituyen el procedimiento de control estadístico de procesos en línea del tipo más simple. Dichas cartas de control se concentran principalmente en la carta de control propuesta por el Doctor Walter A. Shewhart, llamada la carta de control de Shewhart (Juran. Quality Planning and Análisis, 2da edición McGraw-Hill) En cualquier proceso de producción, independiente de lo adecuado que sea su diseño o de la atención que se preste a su mantenimiento, siempre existirá cierta cantidad de variabilidad inherente o natural. Esta variabilidad natural, o “ruido de fondo”, es el efecto acumulado de muchas causas pequeñas y en esencia inevitables. En el contexto del control estadístico de calidad, a esta variabilidad natural se le denomina un “sistema estable de causas fortuitas”. Se dice que un proceso que opera únicamente con causas fortuitas de variación esta bajo control estadístico. En otras palabras las causas fortuitas son una parte inherente del proceso. En ocasiones puede estar presente otra clase de variabilidad en la salida de un proceso. Esta variabilidad en las características clave de la calidad se origina de tres fuentes: -. Máquinas ajustadas o controladas incorrectamente.. -. Errores del operador.. -. Materia Prima defectuosa.. 34.

(35) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. A estas fuentes de variabilidad que no son parte del patrón de las causas fortuitas se les llama “causas asignables”. Se dice que un proceso que opera en presencia de causas asignables esta fuera de control.. Tiempo, t La causa asignable tres esta presente; el proceso esta fuera de control La causa asignable dos esta presente; el proceso esta fuera de control. t1. LSL. t3 µ2<µ0. σ1>σ0. t2. La causa asignada uno esta presente; el proceso esta fuera de control Solo estan presentes causas fortuitas de variación; el proceso esta bajo control. σ1>σ0. σ0 σ0. µ1>µ0 σ0. µ0. USL Caracteristica de la calidad del proceso X. Figura Nº 7 En la figura 7 se ilustran las causas fortuitas y asignables de la variación. Hasta el tiempo t1 el proceso que se muestra en esta figura esta bajo control; es decir, solo están presentes causas de variación fortuita. Como resultado, tanto la media como la desviación estándar del proceso están en sus valores bajo control (por ejemplo µ0 y σ0). En el tiempo t1 ocurre una causa asignable. Como se muestra en la figura 7, el efecto de esta causa asignable es correr la medida del proceso a un nuevo valor µ1 > σ0. En tiempo t2 ocurre otra causa asignable, de la que resulta µ = µ0, pero ahora la desviación estándar del proceso se ha ocurrido a un valor mas grande σ1>σ0. En el tiempo t3 se presenta otra causas asignable, cuyo resultado es que tanto la media como la desviación estándar toman valores fuera de control. Del tiempo t1 en adelante, la presencia de causas asignables ha dado como resultado un proceso fuera de control.. 35.

(36) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Con frecuencia los procesos de producción operaran en el estado bajo control, produciendo productos aceptables durante periodo relativamente prolongados. Con el tiempo, sin embargo, ocurrirán causas asignables, aparentemente al azar, que ocasionaran un “corrimiento” a un estado fuera de control en el que una proporción mayor de la salida del proceso no cumplirá con los requerimientos. Por ejemplo, en la figura 7 se observa que cuando el proceso esta bajo control, la mayor parte de la producción estar entre los limites inferior y superior (LSL y USL, respectivamente, por sus siglas en ingles) de la especificación. Cuando el proceso esta fuera de control, una proporción más alta del mismo se localiza fuera de estas especificaciones. Uno de los objetivos principales del control estadístico de procesos es detectar con rapidez la ocurrencia de causas asignables en el corrimiento del proceso a fin de hacer la investigación pertinente y emprender las acciones correctivas antes de que se fabriquen muchas unidades disconformes. La carta de control es una técnica del movimiento de procesos en línea que se usa ampliamente para este fin. Las cartas de control también pueden usarse para estimar los parámetros de un proceso de producción y para determinar con esta información la capacidad del proceso. Asimismo, la carta de control puede ofrecer información útil para mejorar el proceso. Por ultimo, recuérdese que la meta última del control estadístico de procesos es eliminar la variabilidad del proceso. Quizás no sea para reducir la variabilidad tanto como sea posible. 1.6.1. GRÁFICOS DE CONTROL En la figura 8, se muestra una carta de control típica, que es la representación gráfica de una característica de la calidad que se ha medido o calculado a partir de una muestra contra el número de muestra o tiempo. La carta contiene una línea central que representa el valor promedio de la característica de la calidad que corresponde al estado bajo control. También se muestra en la carta otras dos líneas horizontales, llamadas el Límite de Control. 36.

(37) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. Superior (UCL, por sus siglas en ingles) y el límite de control inferior (LCL, por sus siglas en ingles). Estos límites de control se eligen de tal modo que si el proceso esta bajo control, casi todos los puntos muestrales se localizaran entre ellos. En tanto los puntos graficados se localicen dentro de los limites de control, se supone que el proceso esta bajo control y no es necesaria ninguna acción. Sin embargo, un punto que se localiza fuera de los límites de control se interpreta como evidencia de que el proceso esta fuera de control, y se requiere investigación y acción correctiva para encontrar y eliminar la causa o causas. Característica de la calidad muestral. asignables responsables de este comportamiento.. Límite de control superior. Límite central. Límite de control inferior. Número de muestra o tiempo. Figura Nº 8: Gráfico de Control Puede darse un modelo general para una carta de control. Sea ω un estadístico muestral que mide alguna característica de la calidad de interés, y suponer que la media de ω es µ, y que la desviación estándar de ω es σw. Entonces la línea central, el límite de control superior (UCL) y el límite de control inferior (LCL) son:. 37.

(38) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. UCL = µ w + Lσ LineaCentral = µ w. ………… (18). LCL = µ w − Lσ. Donde L es la “distancia” de los limites de control a la línea central, expresada en unidades de desviación estándar. La carta de control es un recurso para describir de manera precisa lo que se pretendió exactamente por medio del control estadístico: como tal, puede usarse en una variedad de formas. En muchas aplicaciones se usa para la vigilancia en línea de un proceso. Es decir, se colectan datos muéstrales y se _. usan para construir la carta de control, y si los valores muéstrales de x se localizan dentro de los limites de control y no muestran ningún patrón sistemático, se dice que el proceso esta bajo control en el nivel indicado por la carta.. Salida. Entrada. Proceso. Sistema de medición Detectar la causa asignable. Verificar y hacer el seguimiento. Implementar una acción correctiva. Identificar la causa de origen del problema. Figura Nº 9. 38.

(39) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. CARTAS DE CONTROL PARA VARIABLES: A una característica de la calidad que se mide en una escala numérica se le llama variable, por ejemplo dimensiones tales como el largo y el ancho, la temperatura y el volumen. Cuando se trata con una característica de la calidad que es una variable, por lo general es necesario monitorear tanto el valor medio de la característica de la calidad como su variabilidad. El control del promedio del proceso, o nivel de calidad medio, suele hacerse con la carta de control desviación estándar, llamada carta S, o bien con una carta de control para el rango, llamada carta R. _. La carta R se usa con mucha frecuencia. Generalmente, se llevan cartas x y R _. separadas para cada característica de la calidad de interés. Las cartas x y R (o S) se encuentran entre las técnicas estadísticas de monitoreo y control de procesos en línea mas importantes y útiles. Es importante mantener bajo control tanto la media del proceso como la variabilidad del proceso. En la figura 10 se ilustra la salida de un proceso de producción. En la figura 10(a) la media µ y la desviación estándar σ están bajo control en sus valores nominales (por ejemplo µ0 y σ0); por consiguiente, la mayor parte de la salida del proceso se localiza dentro de los límites de la especificación. Sin embargo, en la figura 10(b) la media se ha corrido a un valor µ1 > µ0, dando como resultado una fracción mayor de productos disconformes. En la figura 10(c) la desviación estándar del proceso se ha corrido a un valor σ1 > σ0. Esto también resulta en una porción caída del proceso más alta, aun cuando la media del proceso se encuentra aun en el valor nominal.. 1.6.1.1.. _. CARTAS DE CONTROL PARA x y R. Suponer que una característica de la calidad tiene una distribución normal con medida µ y desviación estándarσ. Donde tanto µ como σ son conocidas. si. 39.

(40) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. x1,x2,…, xn es una muestra de tamaño n, entonces el promedio de esta muestra es:. x =. x +x 1. + ... + xn. 2. ……… (19). n. y se sabe que x sigue una distribución normal con media µ y desviación σx =. σ/ n. Además, la probabilidad es de 1 - ∝ para que cualquier medida muestral se localice entre:. µ + Z α / 2σ x = µ + Z α / 2. σ n. ………. (20). -σ0. Límite inferior de la especificación. µ0. Límite superior de la especificación. (a) -σ0. Límite inferior de la especificación. µ0. µ2. Límite superior de la especificación. (b) -σ2. Límite inferior de la especificación. µ0. µ0. Límite superior de la especificación. (c). Figura Nº 10. 40.

(41) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. CRISTHIAN CURO LORO. La necesidad de controlar tanto la medida como la variabilidad del proceso, a) La medida y la desviación estándar en sus valores nominales. b) La medida del proceso µ1 > µ0.c, c) La desviación estándar del proceso σ1 > σ0 .c y. µ − Z α / 2σ x = µ − Z α / 2. σ n. ……….. (21). Por lo tanto, si µ y σ son conocidas, las ecuaciones 20 y 21 podrían usarse como límites de control superior e inferior en una carta de control para las medidas muéstrales. Se acostumbra sustituir Z∝/2 con 3, a fin de trabajar con límites tres sigmas. Si la media de una muestra se localiza fuera de estos límites, se trata de un indicio de que la media del proceso ha dejado de ser igual a µ. Se ha supuesto que la distribución de las características de la calidad es normal. Sin embargo los resultados anteriores siguen siendo aproximadamente validos cuando incluso cuando la distribución fundamental no es normal, debido al teorema de límite central. En la practica, generalmente no se conocen los calores de µ y σ. Por lo tanto, deben estimarse a partir de muestras o subgrupos preliminares tomados cuando se considera que el proceso esta bajo control. En general, estas estimaciones deberán basarse en al menos 20 o 25 muestras. Suponer que se cuenta con “m” muestras, cada una de las cuales contienen, observaciones de la características de la calidad. De manera típica “n” será pequeña, con frecuencia ya sea 4, 5 o 6. Estos tamaños pequeños de la muestra suelen resultar de la construcción de subgrupos racionales y del hecho de que los costos de muestreo e inspección asociados con la medición de las variables por lo general son relativamente altos. Sean X , X ,…., X los promedios de cada muestra. 1. 2. m. Entonces el mejor estimador deµ, el promedio del proceso, el gran promedio: por ejemplo:. 41.

(42) CONTROL ESTADISTICO MULTIVARIANTE EN CIRCUITO DE MOLIENDA. x +x. x =. 1. CRISTHIAN CURO LORO. 2. …………(22). + .... + x m m. Por tanto, x se usara como la línea central (CL, por sus siglas en ingles) en la carta. Para construir los límites de control es necesaria una estimación de la desviación estándar. σ. Este valor de σ puede estimarse sea partir de las. desviaciones estándar o bien por lo rangos de las “m” muestras. Si X , X , …., X es una muestra de tamaño n, entonces el rango de la 2. 1. m. muestra es la diferencia entre las observaciones menor y mayor es decir: R=. x. máx. − xmin …………….. (23). Sean:. R +R 1. 2. Los rangos de las m muestras. El rango promedio es:. + ..., + R m. R≡. R +R 1. + ..., + R m. 2. …………(24). m. Ahora pueden darse las fórmulas para construir los límites de control de la carta x . Estos son los siguientes: Límites de control de la carta x UCL = x + A2 R Línea central = x LCL= x -. (25). AR 2. 42.

Figure

Figura Nº 8: Gráfico de Control
Figura 11  0102030405060708090 190 210 230 250 270 290 310 330 350 Resistencia de la botellaPorciento acumulado Figura 12
TABLA Nº 1 - REFERENCIA CRUZADA DE LA ALIMENTACIÓN AL MOLINO  Molino de Bolas  Instrumentación de Control de  Nivel IE/LT/LIC  Instrumentación de control de Rango de Peso  WT/WIC  Controladores de  la velocidad de la Faja de Alimentación  ST/SIC/SZ  IC 583
TABLA Nº 2 - VÁLVULAS DE CONTROL DEL NIVEL DEL TANQUE DE  PULPA
+7

Referencias

Documento similar