• No se han encontrado resultados

Análisis de Capacidad del Proceso en la Ausencia de Normalidad

N/A
N/A
Protected

Academic year: 2021

Share "Análisis de Capacidad del Proceso en la Ausencia de Normalidad"

Copied!
57
0
0

Texto completo

(1)

Análisis de Capacidad del

Proceso en la Ausencia de

Normalidad

Dr. Eduardo Santiago

(2)

© 2014 Minitab, Inc.

Objetivos

1. Repaso de supuestos del Análisis de Capacidad para datos normalmente distribuidos

2. Generar un Análisis de Capacidad para datos que no siguen una distribución normal utilizando diferentes técnicas

3. ¿Qué situación produce datos no-normales? 4. Desventajas de las pruebas de Normalidad

5. ¿Cómo manejar datos que provienen de un sistema de medición con baja discriminación?

(3)
(4)

© 2014 Minitab, Inc.

(5)

Resumen (Obj. 1)

► El análisis de capacidad es sensible a los siguientes supuestos:

• Supuesto de la distribución de los datos

(6)

© 2014 Minitab, Inc.

¿Qué hacer con datos no-normales?

1. Utilizar una transformación

2. Encontrar una distribución no-normal (NN) que modele de forma apropiada los datos

3. Utilizar un método no-paramétrico

4. Cuando las opciones anteriores no sean factibles, pregúntese por qué es que los datos no siguen una distribución normal

(7)

► Analicemos el tiempo necesario en minutos para completar una actividad específica.

(8)

© 2014 Minitab, Inc.

► La transformación de Box-Cox

Nota: Excepto cuando

 = 0, Y* = ln(Y)

Uso de Transformaciones

(9)

► La transformación de Johnson

Uso de Transformaciones

𝑌∗ = 𝑎 + 𝑏 ∙ ln⁡[𝑓 𝑌 ]

Nota: Asenh(z) =

(10)

© 2014 Minitab, Inc.

Estudio con distribuciones alternas

► Caso de estudio cirugía de hernia inguinal.

► ¿Cuál es la capacidad del proceso para fabricar una malla de polipropileno

que soporte una fuerza mínima de 15 lb?

Fuente:

http://es.wikipedia.org/wiki/Cirug%C 3%ADa_de_la_hernia_inguinal

(11)

Estudio con distribuciones alternas

► La distribución de los

datos no sigue una curva normal (sesgo positivo). ► Los estadísticos de

(12)

© 2014 Minitab, Inc.

(13)

► De las posibles distribuciones, seleccionamos la

distribución loglogística para ajustar los datos y obtener una estimación de la capacidad del proceso.

(14)

© 2014 Minitab, Inc.

► Utilice un método no-paramétrico para estimar la capacidad del proceso.

• Ver referencia [3] McCormack et al. [3]. Este método

requiere tamaño de muestras más grandes.

• Manejar los datos cual si fueran binarios, y realizar

una prueba de 1 proporción.

(15)

Ejemplo. Un ingeniero encargado de evaluar el peso húmedo del producto necesita validar si el proceso es capaz de satisfacer las necesidades del cliente.

Prueba e IC para una proporción

Límite inferior Muestra X N Muestra p de 95%

1 7967 7978 0.998621 0.997719

(16)

© 2014 Minitab, Inc.

► Análisis de peso húmedo usando un análisis de capacidad no-paramétrico.

(17)

Resumen (Obj. 2)

► Cuando los datos no son normales uno puede utilizar distintas técnicas:

• Transformación de Box-Cox o Johnson

• Modelar los datos con una distribución no-normal como por ejemplo Weibull, Lognormal, o la distribución del valor más extremo.

• Con tamaños de muestra más grandes usted puede utilizar un

enfoque no-paramétrico

► Si ninguna de las técnicas anteriores es de utilidad, pregúntese por qué los datos no son normales.

(18)

© 2014 Minitab, Inc.

Caso I. La naturaleza del proceso bajo estudio – el proceso

se encuentra cerca de una frontera, y los datos que se generan por lo regular tienen un gran sesgo.

Caso II. Mezcla de distribuciones o unos cuantos valores extremos – el proceso no está bajo control estadístico.

(19)

¿Por qué los datos no son normales?

Caso III. Tamaño de muestras grandes – la potencia de las

pruebas de normalidad detectan un sesgo o diferencia minúscula del modelo de normalidad perfecta.

Caso IV. El número de dígitos significativos no es suficiente para diferenciar entre partes, lo cual hace ineficaces a las pruebas de normalidad clásicas.

(20)

© 2014 Minitab, Inc.

Prueba de Normalidad Falló – Caso I

► Este escenario es el más sencillo, procedemos a ajustar los datos a una distribución no-normal utilizando la

herramienta de identificación de distribución (prueba de bondad de ajuste), o seleccionamos una distribución específica de acuerdo al conocimiento del proceso.

(21)

Prueba de Normalidad Falló – Caso II

► La muestra obtenida para estimar la capacidad del

proceso incluye datos que provienen de distribuciones distintas.

(22)

© 2014 Minitab, Inc.

Prueba de Normalidad Falló – Caso II

► Una gráfica de control es una herramienta efectiva para detectar que los datos provienen de diferentes

(23)

Prueba de Normalidad Falló – Caso II

► ¿Qué hacer en situaciones como ésta?

► Hay que buscar tener un mejor control del proceso.

(24)

© 2014 Minitab, Inc.

Prueba de Normalidad Falló – Caso III

► Investiguemos de nueva cuenta el ejemplo de “Peso

Húmedo” con más de 7,000 observaciones. Los datos al parecer siguen una curva normal.

(25)

Prueba de Normalidad Falló – Caso III

► ¿Por qué si los datos se ven normalmente distribuidos la prueba de normalidad indica lo contrario?

► En las palabras de George Box: “Todos los modelos son incorrectos, sin embargo algunos son de utilidad.”

Solución: Utilizar un enfoque no-paramétrico o utilizar una muestra representativa.

(26)

© 2014 Minitab, Inc.

Prueba de Normalidad Falló – Caso III

► Comparación de los estimadores de porcentaje de

defectos para todos los análisis realizados con el mismo conjunto de datos.

Método Cpk Tasa de defectos FPY

Una proporción N/A 0.14% 99.86%

Método no-paramétrico (percentiles)

1.29* 0.14% 99.86%

(27)

► Baja discriminación del sistema de medición.

Prueba de Normalidad Falló – Caso IV

Redondeo y baja discriminación entre las partes genera datos en 3 puntos distintos: 15, 15.5, 16

(28)

© 2014 Minitab, Inc.

Prueba de Normalidad Falló – Caso IV

► La falta de continuidad en los datos conlleva a la prueba de Anderson-Darling (AD) a determinar que los datos no siguen una distribución normal.

(29)

Prueba de Normalidad Falló– Caso IV

► Para datos redondeados las pruebas de Sesgo (SK), Curtosis (KT), Ómnibus (OB) son preferibles.

En cada punto, generamos 5000 muestras de N=100 y sometimos cada muestra a 4 pruebas de normalidad.

(30)

© 2014 Minitab, Inc.

► Consideremos ahora una distribución con gran sesgo, en específico la distribución exponencial.

(31)

► La prueba de AD al parecer se desempeña tan bien como las pruebas OB y SK, sin embargo la detección viene como consecuencia del redondeo de los datos.

En cada punto, generamos 5000

muestras de 100 observaciones de una distribución exponencial (media = 1).

(32)

© 2014 Minitab, Inc.

► ¿Que pasaría si los datos provienen de una distribución ligeramente sesgada pero no normalmente distribuida?

(33)

► La única prueba que identifica correctamente que los datos no son normales es la prueba de AD lo cual lo hace como consecuencia del redondeo.

(34)

© 2014 Minitab, Inc.

¿Qué prueba de normalidad utilizar?

► Cuando los datos son normales, la prueba de sesgo no rechaza correctamente la normalidad con el nivel de significancia esperado.

► La prueba de sesgo tiene una buena potencia, y es menos sensible al grado de redondeo.

► Las pruebas de Sesgo y Ómnibus tienen un comportamiento similar.

(35)

Resumen (Objetivos 3, 4)

► La naturaleza de los datos hace inapropiado el uso de la distribución normal.

► La falta de controles en un proceso produce muestras de distribuciones distintas.

► Tamaños de muestra grandes pueden incrementar la sensibilidad de las pruebas de normalidad.

► Conforme incrementa el nivel de redondeo, las pruebas clásicas de normalidad se vuelven menos efectivas.

(36)

© 2014 Minitab, Inc.

Capacidad con Datos Redondeados

► Existen unos cuántos enfoques para estimar la capacidad de un proceso:

1. Enfoque clásico, ignorar la falta de normalidad.

2. Ajustar la desviación estándar considerando el sesgo introducido por el equipo de medición.

3. Manejar los datos como si fuesen censurados o suspendidos en intervalos.

(37)

Estimación Clásica de Capacidad

► Asumimos que los datos redondeados, denotados como Y*, siguen una distribución normal:

► Procedemos a calcular Ppk como si los datos fueran normales.

(38)

© 2014 Minitab, Inc.

Ajuste con Corrección de Sheppard

► En el artículo de 1898, Sheppard [5] describe la

estimación del sesgo en el cálculo de la desviación estándar cuando los datos han sido redondeados.

(39)

Análisis de Censura por Intervalos

► Suponga que no sabemos exactamente el verdadero valor que debimos haber obtenido, pero sabemos el intervalo en el que caería dicho valor.

Valores Observados 5.1 5.1 5.0 5.2 5.1 5.0 Converted to

Inicio Fin Frecuencia

4.95 5.05 2 5.05 5.15 3 5.15 5.25 1

(40)

© 2014 Minitab, Inc.

Análisis de Censura por Intervalos

► Obtenemos los siguientes estimadores:

Análisis de distribución, Inicio = Inicio y fin = Fin Inicio de la variable: Inicio Fin: Fin

Frecuencia: Frecuencia

Información de censura Conteo Valor censurado del intervalo 6

Método de cálculo: Máxima verosimilitud

Distribución: Normal Cálculos del parámetro

Error IC normal de 95.0% Parámetro Estimación estándar Inferior Superior

Media 5.08345 0.0278668 5.02883 5.13807

(41)
(42)

© 2014 Minitab, Inc.

(43)

Resumen (Obj. 5)

► El redondeo de datos produce una falla en las pruebas

clásicas de normalidad. [Rechazan casi con certeza sin

importar la naturaleza de los datos.]

► Los datos normales medidos con un sistema de

medición con baja discriminación deberán ser simétricos; por lo tanto, hace sentido que las pruebas de sesgo y

ómnibus sean de mayor utilidad en este caso.

► Otros aspectos no-normales no serán capturados por las dos pruebas anteriores.

(44)

© 2014 Minitab, Inc.

Resumen (Obj. 5)

► El método de máxima verosimilitud (MLE) para datos por intervalos produce mejores estimadores en general. ► Los estimadores MLE son asintóticamente insesgados.

[Conforme aumenta el tamaño de muestra, el sesgo de los estimadores se vuelve despreciable]

► La simplicidad de la corrección de Sheppard para

estimar s hace de este método uno bastante fácil de

(45)

Conclusiones

► El objetivo final de un análisis de capacidad es la estimación de la tasa de defectos del proceso.

► Cuando el interés de un análisis estadístico se centre en la estimación de los defectos, el supuesto de distribución será extremadamente importante.

► Otro supuesto importante es asegurarnos de que el proceso sea estable y esté en control.

(46)

© 2014 Minitab, Inc.

Conclusiones

► De los dos supuestos, el de normalidad es el que se viola más frecuentemente en la práctica.

► El análisis de capacidad No-Normal (NN) requiere:

• Utilizar una transformación

• Encontrar una distribución alterna que ajuste los datos

• Usar un enfoque no-paramétrico el cual requiere un tamaño de muestra grande.

(47)

Conclusiones

► Las pruebas clásicas de normalidad (Anderson-Darling, Kolmogorov-Smirnov, Shapiro-Wilk) típicamente

rechazan la normalidad cuando los datos tienen poca

discriminación, sin importar cuál es la distribución real de los datos.

► Cuando utilice un equipo de medición con baja

discriminación, utilice distintas pruebas para verificar la normalidad, como la de Sesgo o la Ómnibus.

(48)

© 2014 Minitab, Inc.

Conclusiones

► Si no existe evidencia de que los datos “redondeados” sean no-normales, asuma normalidad.

► Utilice el método de censura por intervalos (Máxima Verosimilitud) para estimar la media y la desviación estándar.

(49)

Referencias Bibliográficas

1. Juran, J.M., Godfrey, A.M. “Juran’s Quality Handbook”. 5th edition,

McGraw-Hill. New York, 1999.

2. Kane, V.E. (1986) “Process Capability Indices”. Journal of Quality Technology, 18, 41-52.

3. McComack, D.W., Harris, I.R., Hurwitz, A.M., and Spagon, P.D. (2000) “Capability Indices for Non-normal data”, Quality Engineering. 12(4), 489-495.

4. Schneeweiss, H., Komlos, J., and Ahmad, A.S. (2006) “Symmetric and Asymmetric Rounding.” Working paper.

5. Sheppard, W.F. (1898). “On the calculation of the most probable values of frequency constants for data arranged according to equidistant division of a scale.” Proceedings of the London Mathematical Society. 29, 231-258.

(50)

© 2014 Minitab, Inc.

(51)

Caso de Estudio

Un fabricante de dispositivos médicos construye un aparato de monitoreo de niveles de glucosa en la sangre para

personas diabéticas. La lectura es truncada para facilitar el uso y entendimiento de la misma.

El fabricante mide una solución estándar con 100 dispositivos para establecer una base de referencia. Los límites de

(52)

© 2014 Minitab, Inc.

Datos

122

118

117

120

120

121

122

116

124

117

121

120

118

117

120

118

119

122

121

118

119

118

119

119

120

117

121

120

118

122

119

120

120

121

122

118

118

117

119

121

123

117

118

120

118

122

118

124

118

121

116

116

118

121

120

119

119

117

121

121

119

120

120

118

117

120

118

120

119

121

120

118

119

117

119

120

121

121

118

119

119

121

120

119

121

120

119

120

122

118

121

120

123

118

117

118

120

115

121

119

(53)

Caso de Estudio

(54)

© 2014 Minitab, Inc.

Caso de Estudio

► Utilizar una prueba alternativa de Normalidad, como la prueba de Sesgo.

Número Total de Observaciones en Glucosa = 100

Prueba de Sesgo.

Z 0.600407 P-value 0.548235

(55)

Caso de Estudio

► Convertir los datos al siguiente formato.

Inicio Fin Frecuencia

114.5 115.5 1 115.5 116.5 3 116.5 117.5 10 117.5 118.5 20 118.5 119.5 17 119.5 120.5 21 120.5 121.5 17 121.5 122.5 7 122.5 123.5 2 123.5 124.5 2

(56)

© 2014 Minitab, Inc.

Caso de Estudio

► Tratar los datos como censurados por intervalos y

analizarlos con un Análisis de distribución paramétrico

(57)

Caso de Estudio

► Finalmente, con los estimadores de 119.41 para la

media y 1.766 para la desviación estándar, proceder a estimar Ppk.

𝑃𝑝𝑘 = 𝑚𝑖𝑛

𝑈𝑆𝐿 − 𝜇

3𝜎

,

𝜇 − 𝐿𝑆𝐿

Referencias

Documento similar

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y