FIABILIDAD (III): ANÁLISIS PARAMÉTRICO DE LOS TIEMPOS DE FALLO

(1)

FIABILIDAD (III): ANÁLISIS PARAMÉTRICO

DE LOS TIEMPOS DE FALLO

Autores: Ángel A. Juan Pérez ([email protected]), Rafael García Martín ([email protected]).

RELACIÓN CON OTROS MATH-BLOCS__________________________________

Este math-block forma parte de una serie de 8 documentos relacionados todos ellos con la Fiabilidad de componentes desde un punto de vista estadístico:

• Conceptos Básicos (I).

• Identificación y descripción gráfica de los datos (II). • Análisis paramétrico de los tiempos de fallo (III). • Análisis no paramétrico de los tiempos de fallo (IV). • Comparación no paramétrica de muestras (V). • Tests de vida acelerada (VI).

• Modelos de regresión para observaciones censuradas (VII). • Análisis Probit (Éxito / fracaso) (VIII).

MAPA CONCEPTUAL_________________________________________________

Análisis paramétrico con Statistica

Fiabilidad (III): Análisis

paramétrico de los

tiempos de fallo

Análisis paramétrico con Minitab EMV para la exponencial Estimador de Máxima Verosimilitud IC y contrastes para θ0

(2)

INTRODUCCIÓN_____________________________________________________

En el math-block Fiabilidad (II) se describió un método gráfico que servía para tratar de ajustar la distribución de los tiempos de fallo por alguna conocida (Weibull, exponencial, normal, y lognormal). Si no ha sido posible realizar dicho ajuste, se deberá recurrir a métodos no paramétricos (que se explican en el math-block Fiabilidad IV) para tratar de describir el comportamiento de los tiempos de fallo.

Si, por el contrario, se ha logrado ajustar algún modelo teórico a las observaciones, los objetivos siguientes serán:

1) Estimar el valor de los parámetros que caracterizan la distribución (para ello se suele usar el método de máxima verosimilitud o bien el de mínimos cuadrados).

2) Realizar un análisis descriptivo de los tiempos de fallo (media, mediana, percentiles, etc.), usando para ello la distribución teórica ajustada (análisis paramétrico).

En la primera parte de este documento (de carácter más teórico), se presentará el método que permite hallar el estimador de máxima verosimilitud (EMV). A fin de ejemplificar dicho método y sus posibilidades, se usará la distribución exponencial de un parámetro, θ.

A partir del estimador EMV obtenido, se mostrará:

1) Cómo es posible hallar intervalos de confianza para θ (o para funciones de θ), y 2) Cómo realizar contrastes de hipótesis sobre el valor de dicho θ.

Los conceptos y técnicas que aquí se muestran para la distribución exponencial uniparamétrica son fácilmente generalizables a otras distribuciones como la Weibull o la lognormal, ambas pertenecientes a la familia de las log-localización-escala. Si se desea profundizar en los detalles de este método se recomienda consultar Kececioglu (1994) [3], y Nelson (1982) [4].

En las partes segunda y tercera del math-block , se llevarán a cabo sendos análisis paramétricos completos con la ayuda respectiva de los programas MINITAB y STATISTICA.

(3)

EMV PARA LA DISTRIBUCIÓN EXPONENCIAL

La idea general del método de máxima verosimilitud es la siguiente: dado un conjunto de observaciones que siguen una determinada distribución teórica de parámetros desconocidos, se tratará de hallar (estimar) el valor de dichos parámetros.

Lo que se pretende, en definitiva, es encontrar aquellos valores de los parámetros característicos de la distribución que maximizan la probabilidad de que las observaciones provengan de dicho modelo (de ahí el nombre del método).

El de máxima verosimilitud es uno de los métodos más versátiles, en el sentido de que es aplicable a una gran variedad de modelos, tanto paramétricos como no paramétricos, y tanto con observaciones completas como con observaciones censuradas. Este método se puede incluso usar a la hora de buscar variables explicativas (análisis de regresión).

Cuando el tamaño muestral, n, es suficientemente grande, el estimador de máxima verosimilitud (EMV) presenta bastantes propiedades destacables:

• Es asintóticamente consistente, i.e.: conforme n aumenta, el EMV converge al valor real del parámetro.

• Es asintóticamente eficiente, i.e.: para valores grandes de n, es el que proporciona una estimación más precisa.

• Es asintóticamente insesgado, i.e.: conforme n aumenta, el valor esperado del EMV converge al valor real.

• Para valores grandes de n, los EMV se distribuyen de forma normal.

El tamaño muestral, n, necesario para que se cumplan las propiedades anteriores puede llegar a ser bastante grande: desde 30-50 observaciones completas (no censuradas) hasta más de 100, según sea el caso de estudio.

Con menos observaciones, el EMV puede presentar problemas de sesgo. Se sabe, por ejemplo, que el EMV del parámetro forma (β) en una Weibull es bastante sesgado cuando la muestra es de tamaño reducido, y que dicho efecto puede verse agravado conforme aumenta la proporción de observaciones censuradas en la muestra. Este sesgo podría afectar seriamente a la calidad del análisis.

Sin embargo, incluso cuando se trate de muestras de reducido tamaño, el método de máxima verosimilitud suele proporcionar estimadores de, al menos, tanta calidad como el resto de métodos de estimación (mínimos cuadrados, rangos medianos, etc.).

Por simplicidad en la exposición, en este apartado se trabajará siempre sobre la distribución exponencial de un solo parámetro θ (escala), cuya f.d.p. es expresable como:

      θ − θ = θ t t f( ; ) 1exp

(4)

ESTIMADOR DE MÁXIMA VEROSIMILITUD (OBS. CENSURADAS)____________

Supuesto 1: en lo que sigue, se supondrá que la v.a. T, la cual registra los tiempos de fallo de un conjunto de dispositivos, sigue una distribución exponencial de parámetro θ0 desconocido, y que se dispone de una muestra compuesta por n observaciones independientes t1, t2, ..., tn . Se denotará por f(ti; θ) al valor de la f.d.p. en el instante ti . Además, en una primera aproximación, se supondrá que las n observaciones son completas (no censuradas).

Asociada a la muestra anterior, se define la función de verosimilitud L(θ) como:

∏

= θ = θ ≡ θ n i i n f t t t L L 1 1... ; ) ( ; ) ( ) (

La función de verosimilitud L(θ) se puede interpretar como una medida de lo probable que son las observaciones registradas. Así, los valores de θ para los cuales L(θ) es relativamente grande serán más probables que los valores de θ para los cuales la probabilidad de las observaciones es relativamente pequeña. Se tratará pues de hallar (si existe) un estimador de máxima verosimilitud, i.e., un valor del parámetro θ que maximice la función L(θ). Cuando existe un único máximo global de L(θ), éste se suele denotar por θˆ .

En muchas ocasiones, en lugar de intentar maximizar la función L(θ), resulta más sencillo maximizar la función logarítmica de verosimilitud Λ(θ) (el máximo de ambas funciones, si existe, ocurrirá para el mismo valor de θ):

( )

_∑

(

)

= θ = θ = θ Λ n i i t f L 1 ) ; ( ln ) ( ln ) (

Supuesto 2: se considerará ahora el caso de observaciones censuradas. Se supondrá que una observación censurada a la izquierda de un instante t0 equivale a una observación censurada en el intervalo ( 0 , t0 ) .

En las condiciones del supuesto 2, parece lógico pensar que la función de verosimilitud deba contener varios factores, uno por cada observación, a los que denotaremos por Li(θ). Cada uno de estos factores tratará de representar la probabilidad de que se obtenga el valor registrado en la observación i-ésima, es decir:

• Si la observación i-ésima ha fallado justo en el instante ti (observación no censurada), Li (θ) = f( ti ; θ )

• Si la observación i-ésima ha fallado el intervalo ti-1 - ti (censura arbitraria o a izquierda),

∫

₋ − − < < = = − = θ ti i t i i i i i P t t t f tdt F t F t L 1 1 1 ) ( ) ( ) ( ) ( ) (

• Si la observación i-ésima ha fallado después del instante ti (censura a derecha),

∫

∞ = ∞ − = − = > = θ i t i i i i P t t f tdt F F t F t L ( ) ( ) ( ) ( ) ( ) 1 ( )

Una vez definida la nueva función de verosimilitud L(θ) se deberá buscar un valor del parámetro que la maximice. Dicho valor (si existe) será el EMV.

(5)

INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPÓTESIS PARA

_θθθθ

0

______

A partir de la función de verosimilitud, es posible hallar un intervalo de confianza para θ0 (el valor real del parámetro) a nivel 1-α, el cual vendrá dado por el siguiente conjunto de valores:

( )

{

2

}

) 1 ; ( ln 2 : ) 1 ( −α paraθ0 = θ∈R / - ⋅ R(θ) ≤ χ _α IC

donde R(_θ)₌L(_θ) L(ˆ_θ) es la llamada verosimilitud relativa, θˆ es el EMV, y χ_(α2_;₁₎ es aquel valor que en una χ2 con 1 grado de libertad deja a su derecha un área de α.

Debido a la estrecha relación que existe entre los conceptos intervalo de confianza y contraste de hipótesis (ver Apéndice 1), es posible usar el intervalo de confianza anterior para realizar contrastes de hipótesis bilaterales sobre el valor del parámetro θ:

Dado un valor fijo θ1, se puede considerar el contraste:    θ ≠ θ θ = θ 1 1 1 0 : : H H .

Pues bien, para un nivel de significación α, se rechazará la hipótesis nula si y sólo si:

(

)

2 ) 1 ; ( 1) ( ln 2⋅ θ > χ _α − R

Es decir, la hipótesis nula será rechazada sólo cuando θ1 no esté contenido en el intervalo de confianza para θ0 a nivel de confianza 1-α.

Para muestras de gran tamaño (usualmente n > 30 o n > 50), también es frecuente usar otros intervalos de confianza basados en la distribución normal, los cuales presentan la ventaja de ser más fácilmente calculables (si bien no son tan precisos como los anteriores).

Así, un intervalo de confianza para θ0 basado en la distribución normal, vendrá dado por:

θ α ⋅ ± θ =     θθ ˆ z /2 sˆˆ ~ ~ , ~

donde θˆes el EMV, zα/2 es aquel valor que en una N(0,1) deja a su derecha un área de α/2,

( )

1 2 2 ˆ ˆ ˆ − θ _       θ θ Λ − = d d s

es un estimador del error estándar de θˆ, y Λ(θ) es la función logarítmica de verosimilitud. Este intervalo de confianza está basado en la hipótesis de que la v.a.

θ θ θ − θ = ˆ 0 ˆ _ˆ ˆ s Z

sigue una distribución N(0,1), por lo que se cumplirá

α − ≈ < < _θ α α − ) 1 (z₁ _/₂ Z_ˆ z _/₂ P ,

de lo cual se deduce (teniendo en cuenta que -z1-α/2 = zα/2):

α − ≈ ⋅ + θ < θ < ⋅ − θ _α ˆ_θ ˆ _α ˆ_θ) 1 ˆ ( z _/₂ s_ˆ ₀ z _/₂ s_ˆ P .

(6)

INTERVALOS DE CONFIANZA PARA FUNCIONES DE

_θθθθ

0________________________

En el caso de distribuciones uniparamétricas, como la exponencial, los intervalos de confianza para θ0 pueden transformarse fácilmente en intervalos de confianza para funciones monótonas de θ0.

Ejemplo (IC para la tasa de ocurrencia): La tasa de ocurrencia (o tasa de fallo) de una exponencial, λ = 1/θ, es una función monótona decreciente de θ.

Por ello, si      _θ ~~_θ , ~

es un intervalo de confianza de θ0 a nivel 1-α, entonces: α − ≈      ~_θ _< _θ _<~~_θ ₁ 0 P

de donde se deduce que:

α − ≈         θ > θ > θ ~~ 1 1 1 ~1 0 P es decir:         θ θ =      _λ _λ ~1 , ~ ~ 1 ~ ~ , ~

será un intervalo de confianza para λ0 a nivel 1-α.

Ejemplo (IC para la f.d.): Análogamente, en el caso de la exponencial, la función de distribución F(t;θ) es una función monótona decreciente de θ. Por tanto, dado t0, si

      θ θ,~~ ~

es un intervalo de confianza de θ0, un intervalo de confianza para F(t0;θ0) vendrá dado por:       _θ _θ =       _θ _θ ~₎ , ( ), ~ ~ , ( ) , ( ~ ~ ), , ( ~ 0 0 0 0 0 0 F t F t Ft t F

(7)

ANÁLISIS PARAMÉTRICO CON MINITAB

El programa MINITAB permite hacer un análisis paramétrico bastante completo de la distribución de los tiempos de fallo. A tal fin, se supondrá que la distribución de T sigue, aproximadamente, alguna de las siguientes 8 distribuciones teóricas:

Weibull exponencial normal lognormal (base e)

lognormal base 10 logística log-logística valores extremos

En esta parte, a fin de ilustrar cómo llevar a cabo el análisis paramétrico de las observaciones, se usarán sendos ejemplos según se disponga de datos con observaciones censuradas a derecha, o de datos con observaciones arbitrariamente censuradas (con censura a izquierda, a derecha, o por intervalos).

EJEMPLO ANÁLISIS PARAMÉTRICO CON CENSURA A DERECHA___________

Volviendo al ejemplo de las cubiertas (ver capítulo 2), supongamos que se desea conocer, para cada temperatura, el instante temporal en el cual se espera fallen el 63,2% de las unidades (i.e., el percentil 63,2), así como el porcentaje de unidades que sobrevivirán tras 70 meses (i.e., la prob. de que una cubierta sobreviva más de 70 meses).

Entrada de datos (input): en primer lugar, se deben definir las variables temporales y los indicadores de censura. Para ello se deberá abrir previamente la ventana del menú Parametric distrib. Analysis:

Observar que se ha optado por la distribución lognormal (base e) para el ajuste, pues se comprobó en el Capítulo 2 que era la que mejor se ajustaba a estas observaciones.

Dentro de la opción Estimate , se indicarán los percentiles y los tiempos de supervivencia a estudiar (en este caso, 63,2 y 70 respectivamente):

(8)

También es conveniente seleccionar (mediante la opción Graphs) dos gráficos para los datos: uno de probabilidad, y otro que muestre la función de supervivencia:

Salida de datos (output): en las páginas siguientes se muestran los “outputs” asociados a cada variable. En cada uno de ellos cabe distinguir las siguientes secciones:

• Parameter Estimates: donde se estima (por el método de máxima verosimilitud) el valor óptimo de los parámetros característicos de la distribución elegida. También proporciona una medida de la bondad del ajuste.

• Characteristics of Distribution: donde aparecen varios estadísticos de centralización y dispersión.

• Table of Percentiles: donde se estiman, a partir de la distribución elegida, los tiempos en los cuales habrán fallado los respectivos porcentajes de unidades (percentiles de T).

• Table of Survival Probabilities: donde se estiman las probabilidades de supervivencia para los tiempos indicados.

(9)

Distribution Analysis: Tiemp80 Variable: Tiemp80

Censoring Information Count Uncensored value 37 Right censored value 13 Censoring value: Comp80 = 0

Estimation Method: Maximum Likelihood Distribution: Lognormal base e

Parameter Estimates

Standard 95,0% Normal CI Parameter Estimate Error Lower Upper Location 4,09267 0,07197 3,95161 4,23372 Scale 0,48622 0,06062 0,38080 0,62082 Log-Likelihood = -181,625 Goodness-of-Fit Anderson-Darling (adjusted) = 67,2208 Characteristics of Distribution Standard 95,0% Normal CI Estimate Error Lower Upper Mean(MTTF) 67,4153 5,5525 57,3656 79,2255 Standard Deviation 34,8145 6,7983 23,7435 51,0476 Median 59,8995 4,3109 52,0192 68,9735 First Quartile(Q1) 43,1516 3,2953 37,1531 50,1186 Third Quartile(Q3) 83,1475 7,3769 69,8763 98,9392 Interquartile Range(IQR) 39,9959 6,3332 29,3245 54,5505 Table of Percentiles Standard 95,0% Normal CI Percent Percentile Error Lower Upper 1,0 19,3281 2,8375 14,4953 25,7722 2,0 22,0674 2,9256 17,0178 28,6154 3,0 24,0034 2,9726 18,8304 30,5975 4,0 25,5709 3,0036 20,3126 32,1906 5,0 26,9212 3,0262 21,5978 33,5566 6,0 28,1265 3,0440 22,7506 34,7727 7,0 29,2276 3,0588 23,8074 35,8819 8,0 30,2501 3,0717 24,7910 36,9113 9,0 31,2110 3,0833 25,7170 37,8788 10,0 32,1225 3,0941 26,5962 38,7970 20,0 39,7837 3,2100 33,9646 46,5999 30,0 46,4184 3,4101 40,1936 53,6073 40,0 52,9573 3,7567 46,0833 60,8568 50,0 59,8995 4,3109 52,0192 68,9735 60,0 67,7517 5,1591 58,3584 78,6569 63,2 70,5695 5,5148 60,5478 82,2501 70,0 77,2958 6,4592 65,6184 91,0514 80,0 90,1863 8,5821 74,8412 108,6778 90,0 111,6958 12,8103 89,2100 139,8493 91,0 114,9578 13,5112 91,3052 144,7376 92,0 118,6095 14,3120 93,6288 150,2553 93,0 122,7588 15,2417 96,2426 156,5806 94,0 127,5648 16,3437 99,2372 163,9786 95,0 133,2761 17,6863 102,7529 172,8663 96,0 140,3136 19,3873 107,0258 183,9549 97,0 149,4767 21,6739 112,4995 198,6078 98,0 162,5904 25,0764 120,1748 219,9765 99,0 185,6339 31,3868 133,2714 258,5697 Table of Survival Probabilities

95,0% Normal CI Time Probability Lower Upper 70,0000 0,3743 0,2631 0,4971

A los 19,33 meses habrán fallado (aprox.) un 1% de las cubiertas

Se espera que un 63,2% de las cubiertas habrán fallado tras 70,57 meses

La probabilidad de que una cubierta sobreviva tras 70 meses es de 0,37 EMV para los parámetros de

la Log-Normal en base e

Este estadístico es una medida de cuán lejos están los puntos (observaciones) respecto a la recta que representa a la f.d. en el gráfico de probabilidad. Cuanto menor sea el estadístico, tanto mejor será el ajuste.

(10)

Distribution Analysis: Tiemp100 Variable: Tiemp100

Censoring Information Count Uncensored value 34 Right censored value 6 Censoring value: Comp100 = 0

Estimation Method: Maximum Likelihood Distribution: Lognormal base e

Parameter Estimates

Standard 95,0% Normal CI Parameter Estimate Error Lower Upper Location 3,6287 0,1178 3,3978 3,8595 Scale 0,73094 0,09198 0,57117 0,93540 Log-Likelihood = -160,688 Goodness-of-Fit Anderson-Darling (adjusted) = 16,4987 Characteristics of Distribution Standard 95,0% Normal CI Estimate Error Lower Upper Mean(MTTF) 49,1969 6,9176 37,3465 64,8076 Standard Deviation 41,3431 11,0416 24,4947 69,7806 Median 37,6636 4,4362 29,8995 47,4439 First Quartile(Q1) 23,0044 2,9505 17,8910 29,5791 Third Quartile(Q3) 61,6643 8,4984 47,0677 80,7876 Interquartile Range(IQR) 38,6600 7,2450 26,7759 55,8185 Table of Percentiles Standard 95,0% Normal CI Percent Percentile Error Lower Upper 1,0 6,8776 1,6170 4,3383 10,9034 2,0 8,3941 1,7942 5,5212 12,7619 5,0 11,3181 2,0766 7,8995 16,2162 ... 63,2 48,1892 5,9938 37,7639 61,4925 70,0 55,2572 7,2445 42,7359 71,4473 80,0 69,6769 10,2054 52,2896 92,8456 90,0 96,1040 16,6968 68,3686 135,0909 91,0 100,3541 17,8420 70,8271 142,1905 92,0 105,1845 19,1727 73,5864 150,3510 93,0 110,7647 20,7464 76,7308 159,8942 94,0 117,3475 22,6502 80,3853 171,3053 95,0 125,3340 25,0242 84,7457 185,3617 96,0 135,4144 28,1141 90,1451 203,4169 97,0 148,9246 32,4050 97,2189 228,1298 98,0 168,9934 39,0628 107,4274 265,8427 99,0 206,2550 52,1976 125,5996 338,7041 Table of Survival Probabilities

95,0% Normal CI Time Probability Lower Upper 70,0000 0,1982 0,1072 0,3248

Si se desea estimar el tiempo que tardará en fallar un determinado porcentaje de cubiertas, bastará con mirar la tabla de percentiles. A 80º C, por ejemplo, un 1% de las cubiertas habrán fallado tras 19,33 meses.

A 100ºC, se espera que un 63,2% de las cubiertas habrán

fallado tras 48,19 meses

A 100ºC, la probabilidad de que una cubierta sobreviva tras 70 meses es de 0,20

no censuradas y el de obs. censuradas (a derecha)

Medidas de centralización y de dispersión asociadas a la variable

(11)

En el “output” anterior, aparece el percentil 63,2 solicitado. A 80º C, el 63,2% de las cubiertas fallarán a los 70,5695 meses; a 100º C, el 63,2% de las cubiertas fallarán a los 48,1892 meses. Por tanto, el incremento de temperatura ha provocado un descenso de unos 22 meses en el percentil.

Para determinar la proporción de cubiertas que sobrevivirían tras 70 meses, se deberá consultar la tabla de probabilidades de supervivencia: a 80º C, el 37,43% sobrevivirán al menos 70 meses, a 100º C, sólo un 19,82% será capaz de ello.

El programa también proporcionará los gráficos que se indicaron:

Tiemp80 Tiemp100 100 10 99 95 90 80 70 60 50 40 30 20 10 5 1 Time to Failure P er cent

Probability Plot for Tiemp80-Tiemp100

Lognormal base e Distribution - ML Estimates - 95,0% CI Censoring Column in Comp80-Comp100

Location Scale AD* F/C 4,0927 0,4862 67,2 37/13 3,6287 0,7309 16,5 34/6 Tiemp80 Tiemp100 200 100 0 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 Time to Failure P robabi lit y

Parametric Survival Plot for Tiemp80-Tiemp100

Lognormal base e Distribution - ML Estimates - 95,0% CI Censoring Column in Comp80-Comp100

Location Scale 4,0927 0,4862 3,6287 0,7309

(12)

EJEMPLO ANÁLISIS PARAMÉTRICO CON CENSURA ARBITRARIA__________

Se considerará ahora el caso de una compañía que fabrica neumáticos. Los ingenieros de dicha compañía, están interesados en averiguar durante cuántos kilómetros “sobrevivirán” (no estarán excesivamente desgastados) ciertos porcentajes de estas unidades. En especial hay interés en saber cuantos neumáticos seguirán en condiciones tras 45.000 Km. Se han inspeccionado todos los neumáticos en activo cada 10,000 Km. Los datos se encuentran en el fichero Neumáticos.MTW :

Entrada de datos (input): usando la opción Parametric Distribution Analysis-Arbitrary Censoring , se deberán introducir las columnas Inicio, Fin, y Frec, así como la distribución que se pretenda usar (en este caso la de valores extremos). Es conveniente, además, seleccionar un gráfico de probabilidad y otro de supervivencia, ambos con intervalos de confianza incluidos (use usará para ello la opción Graphs):

Además, se pretende calcular la probabilidad de que un neumático dure más de 45.000 km., por lo que se deberá indicar mediante la opción Estimate:

8 obs. censuradas a izquda., i.e.: 8 neumáticos habrán fallado antes del km. 10.000

25 obs. censuradas en el intervalo 30.000, 40.000, i.e.: 25 neumáticos habrán fallado entre ambos puntos kilométricos

71 obs. censuradas a decha., i.e.: 71 neumáticos fallarán después del km. 90.000

(13)

Distribution Analysis, Start = Inicio and End = Fin Variable

Start: Inicio End: Fin Frequency: Frec

Censoring Information Count Right censored value 71 Interval censored value 694 Left censored value 8 Estimation Method: Maximum Likelihood Distribution: Extreme value

Parameter Estimates

Standard 95,0% Normal CI Parameter Estimate Error Lower Upper Location 77538,0 547,0 76465,8 78610,2 Scale 13972,0 445,0 13126,5 14872,1 Log-Likelihood = -1465,913 Goodness-of-Fit Anderson-Darling (adjusted) = 2,4259 Characteristics of Distribution Standard 95,0% Normal CI Estimate Error Lower Upper Mean(MTTF) 69473,32 646,6352 68205,94 70740,70 Standard Deviation 17919,83 570,7594 16835,36 19074,15 Median 72417,04 599,5413 71241,97 73592,12 First Quartile(Q1) 60130,23 849,0361 58466,15 61794,31 Third Quartile(Q3) 82101,72 538,9283 81045,44 83158,00 Interquartile Range(IQR) 21971,49 699,8078 20641,82 23386,80 Table of Percentiles Standard 95,0% Normal CI Percent Percentile Error Lower Upper 1 13264,55 2216,243 8920,791 17608,30 2 23019,97 1916,275 19264,14 26775,80 3 28756,49 1741,644 25342,93 32170,05 4 32847,96 1618,183 29676,38 36019,54 20 56580,77 939,3041 54739,76 58421,77 30 63133,78 777,3208 61610,26 64657,30 40 68152,58 670,9556 66837,54 69467,63 50 72417,04 599,5413 71241,97 73592,12 60 76316,52 555,6791 75227,41 77405,63 70 80131,56 537,6457 79077,79 81185,32 80 84187,05 548,1648 83112,67 85261,44 90 89191,10 600,4733 88014,20 90368,01 91 89816,23 609,6261 88621,39 91011,08 92 90483,47 619,9522 89268,39 91698,56 93 91203,29 631,7046 89965,17 92441,41 94 91990,61 645,2472 90725,95 93255,27 95 92867,93 661,1321 91572,13 94163,72 96 93871,73 680,2606 92538,44 95205,01 97 95067,77 704,2704 93687,43 96448,12 98 96596,59 736,6912 95152,70 98040,48 99 98875,78 788,1406 97331,05 100420,5 Table of Survival Probabilities

95,0% Normal CI Time Probability Lower Upper 45000,00 0,9072 0,8903 0,9216 La prob. de que un neumático siga en condiciones tras 45.000 km. es de 0,91 El 40% de los neumáticos habrán fallado tras 68.152 km.

Aquí aparecen el nº de observaciones censuradas a derecha, por intervalos, y a izquierda

Valor óptimo (EMV) de los parámetros que caracterizan la distribución elegida

(14)

Como se refleja en la tabla de características de la distribución, la media y la mediana de kilómetros recorridos hasta que los neumáticos se estropean son de 69.473 y 72.417 km., respectivamente. La Tabla de percentiles muestra los Km. a los cuales se habrá estropeado una determinada proporción de neumáticos. Así, por ejemplo, se espera que el 5% de los neumáticos falle (deje de estar en condiciones) tras 36.038 Km.; y que el 50% falle a los 72.417 Km.

Por su parte, la tabla de probabilidades de supervivencia informa de que el 90,72% de los neumáticos lograrán llegar en buen estado a los 45.000 Km.

Finalmente, los gráficos solicitados (con sus respectivos intervalos de confianza) son:

100000 50000 0 99 95 90 80 70 60 50 40 30 20 10 5 3 2 1 Time to Failure P er cent

Probability Plot for Inicio

Extreme value Distribution - ML Estimates - 95,0% CI Arbitrary Censoring Location Scale MTTF StDev Median IQR AD* 77538 13972 69473 17920 72417 21971 2,4259 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 P robabi lit y

Parametric Survival Plot for Inicio

Extreme value Distribution - ML Estimates - 95,0% CI Arbitrary Censoring Location Scale MTTF StDev Median IQR 77538 13972 69473 17920 72417 21971

Estas observaciones se sitúan fuera de los IC, lo cual dice muy poco en favor de la bondad del ajuste

(15)

ANÁLISIS PARAMÉTRICO CON STATISTICA

STATISTICA permite ajustar la distribución de los tiempos de fallo observados mediante una distribución Weibull, exponencial, o Gompertz. Este programa utiliza un algoritmo de mínimos cuadrados (con tres diferentes pesos) para estimar los parámetros (de cada una de las distribuciones anteriores) que logran un mejor ajuste a las observaciones. Además de estos parámetros “óptimos”, el programa también proporciona un test χ2 de bondad de ajuste.

EJEMPLO IDENTIFICACIÓN DE LA DISTRIB. DE AJUSTE___________________

Supongamos que se conocen las fechas en que se arreglaron una serie de 65 ordenadores portátiles, las fechas en que éstos dejaron de funcionar correctamente o bien se dejó de tener información sobre ellos, la clasificación de cada observación como completa o censurada, la edad del portátil en el momento de su reparación, si ya había sido arreglado con anterioridad (0 = NO, 1 = SI), y el taller en el que fue arreglado (A, B, o C). Estos datos se almacenan en el archivo fiabilidad.sta:

Entrada de datos (input): dentro del módulo Survival Analysis, se optará por la opción Life Tables & Distributions.

(16)

Ahora se accederá a la opción Variables y se escogerán las primeras 6 variables en la lista de la izquierda. Después se escogerá, en la lista de la derecha, la variable Censur? como el indicador de censura:

En este caso, se optará por la distribución exponencial, lo cual se deberá indicar en el menú desplegable Results for model :

Salida de datos (output): pulsando sobre el botón Parameter estimates se obtendrán los estimadores para los tres diferentes pesos:

Si el test Chi-cuadrado resulta ser estadísticamente significativo (p-valor ≤ 0,05), entonces se rechazará la hipótesis nula de que la distribución correspondiente se ajusta a los datos. En la imagen superior se aprecia que las observaciones no corresponden a una exponencial, pues el test es significativo para los tres valores del parámetro Lambda. Si se repitiese la estimación paramétrica con cada una de las tres posibles distribuciones, se observaría que el único test no significativo es el correspondiente a la Weibull (en especial para el tercero de los pesos). Por tanto, la distribución que mejor se ajusta a las observaciones es una Weibull de parámetros Lambda = 0,0511 y Gamma = 0,4277:

(17)

GRÁFICOS DE LAS FUNCIONES R(t) , h(t) ,y f(t)__________________________

Siguiendo con el ejemplo anterior de los portátiles, es posible comprobar visualmente la bondad del ajuste mediante un gráfico que compare la función de supervivencia observada con cada una de las tres funciones de supervivencia que se obtienen al variar el parámetro lambda estimado:

Dicho gráfico se obtiene pulsando sobre el botón Graph of survival function :

A partir del gráfico de las funciones de supervivencia, también se aprecia que el tercer par de parámetros (Weight 3) es el que proporciona el mejor ajuste posible a las observaciones.

Resulta además conveniente representar la función tasa de fallo, la cual representa la probabilidad condicional de que el ordenador deje de funcionar correctamente en un determinado intervalo infinitesimal, sabiendo que no ha fallado hasta la fecha (desde que fue reparado). Como se comentó en el Capítulo 1, la tasa de fallo es una función creciente para valores grandes de la variable tiempo, lo cual se debe al “efecto envejecimiento”.

Para obtenerla, se deberá pulsar sobre el botón Graph of hazard function :

Observed Weight 1 Weight 2 Weight 3 LS Estimates of Survival Function

Model: Weibull Note: Weights: 1=1., 2=1./V, 3=N(I)*H(I)

Interval Start

Cumulative Proportion Surviving

0,0 0,2 0,4 0,6 0,8 1,0 0,0000 161,36 322,73 484,09 645,45 806,82 968,18 1129,5 1290,9 1452,3 1613,6 1775,0 1936,4 2097,7 Observed Weight 1 Weight 2 Weight 3 LS Estimates of Hazard Function

Model: Weibull

Note: Weights: 1=1., 2=1./V, 3=N(I)*H(I)

Interval Start Hazard 0,000 0,001 0,002 0,003 0,004 0,005 0,0000 161,36 322,73 484,09 645,45 806,82 968,18 1129,5 1290,9 1452,3 1613,6 1775,0 1936,4 2097,7

(18)

Finalmente, también es posible visualizar la gráfica de la f.d.p., la cual suele ser decreciente debido al efecto “mortalidad infantil” (tras una reestructuración importante del sistema, es muy probable que los nuevos componentes no se adapten correctamente a lo que quede de la estructura anterior y, por tanto, se produzca un alto índice de fallos en las primeras etapas de la nueva situación).

Esta gráfica se obtiene mediante la opción Graph of probability density function :

Observed Weight 1 Weight 2 Weight 3 LS Estimates of Probability Density

Model: Weibull

Note: Weights: 1=1., 2=1./V, 3=N(I)*H(I)

Interval Start Probability Density 0,000 0,001 0,001 0,002 0,002 0,003 0,0000 161,36 322,73 484,09 645,45 806,82 968,18 1129,5 1290,9 1452,3 1613,6 1775,0 1936,4 2097,7

(19)

BIBLIOGRAFÍA______________________________________________________

[1]. Franklin R. Nash. Estimating Device Reliability: Assessment of Credibility, Kluwer Academic

Publishers, 1993, ISBN 0-7923-9304-X.

[2]. Harold Ascher and Harry Feingold, Repairable Systems Reliability: Modeling, Inference,

Misconceptions and Their Causes, Marcel Dekker, Inc., 1984.

[3]. Dimitri Kececioglu, Reliability & Life Testing Handbook, Vols. 1 & 2, , PTR Prentice Hall, 1993. ISBN 0-13-772377-6 (Vol. 1)

[4]. Wayne Nelson. Applied Life Data Analysis, John Wiley & Sons, New York, 1982

[5]. Reliability Data for Pumps and Drives, valve Actuators, and Valves, ANSI/IEEE, John Wiley & Sons,

New York, 1986

ENLACES___________________________________________________________

[W1] Una página altamente recomendable por la cantidad de información que contiene es la dedicada a la Ingenieria de la Fiabilidad que mantiene la Universidad de Maryland.