• No se han encontrado resultados

Estimadores bayesianos de la fiabilidad con muestreo censurado

N/A
N/A
Protected

Academic year: 2020

Share "Estimadores bayesianos de la fiabilidad con muestreo censurado"

Copied!
175
0
0

Texto completo

(1)UNIVERSIDAD POLITECNICA DE MADRID FACULTAD DE INFORMATICA DEPARTAMENTO DE METODOS ESTADISTICOS, INVESTIGACION OPERATIVA E INTELIGENCIA ARTIFICIAL. ESTIMADORES BAYESIANOS DE LA FIABILIDAD CON MUESTREO CENSURADO. Autor: Jose Villon Altamirano. Licenciado en Ciencias Matematicas. Memoria. Presentada. para la obtencion del Grado de. Informatica.. Director: Antonio Insua Negrao Codirector: Jan Hurt. Junio de 1988. Doctor. en.

(2) TESIS DOCTORAL. ESTIMADORES BAYESIANOS DE LA FIABILIDAD CON MUESTREO CENSURADO. Autor: D. Jose Villen Altamirano Director: D. Antonio Insua Negrao. TRIBUNAR CALIFICADOR. Presidente: D. Luis Laita Larrica. Vocales:. D. Sixto Rios Insua. D. Emilio Prieto Saez. D§. Maria Jesus Rios Insua. D. Eugenio Martinez Falero. Madrid. de Junio de 1988.

(3) PLANTEAMIENTO Y RESUMEN DE LA TESIS. El gran. estudio de la fiabilidad de componentes y sistemas tiene. importancia. en diversos campos de. la. ingenieria,. y. muy. analizar la duracion de los elementos de la muestra. hay. concretamente en el de la informatica. Al que. tener en cuenta los elementos que no fallan en el tiempo que. dure el experimento, o bien los que fallen por causas distintas a la que es objeto de estudio. Por. ello. estos casos.. surgen nuevos tipos de. muestreo. El mas general de ellos,. que. contemplan. el muestreo censurado, es. el que consideramos en nuestro trabajo. En este muestreo tanto el tiempo. hasta. que falla el componente como el tiempo de. censura. son variables aleatorias. Con. la. hipotesis. exponencialmente,. el. de. que. ambos. profesor. tiempos. Hurt estudio. el. se. distribuyen. comportamiento. asintotico del estimador de maxima verosimilitud de la funcion de fiabilidad. En. principio parece interesante utilizar metodos Bayesianos. en el estudio de la fiabilidad porque informacion problemas Bayesianos. a. priori. reales.. de. Por. la. que. incorporan al analisis se. dispone. ello hemos considerado. normalmente dos. la en. estimadores. de la fiabilidad de una distribucion exponencial. que. son la media y la moda de la distribucion a posteriori. Hemos calculado la expansion asint6tica de la media, varianza y. error. cuadratico. distribuci6n. de. medio. censura. Hemos obtenido. es. de. ambos. estimadores. cuando. la. exponencial.. tambien la distribucion. asintotica. de. los.

(4) estimadores. para. el caso m3s general de que la distribucion. de. censura sea de Weibull. Dos tipos de intervalos de confianza para muestras grandes se han propuesto para cada estimador. Los maxima. resultados. se han comparado con los del. verosimilitud,. parametricos:. limite. y. con. los. producto. y. de. dos. estimador. estimadores. Bayesiano,. resultando. de no un. comportamiento superior por parte de uno de nuestros estimadores. Finalmente nemos comprobado mediante simulacion que nuestros estimadores censura, valido para. son. robustos frente a la supuesta. distribuci6n. de. y que uno de los intervalos de confianza propuestos. es. con muestras pequenas. confirmar. estimadores.. el. mejor. Este estudio ha. comportamiento. de. servido uno. de. tambien nuestros.

(5) SETTING OUT AND SUMMARY OF THE THESIS. When take. we study the lifetime of components it's necessary. into. account. experiment,. the. elements that. don't. fail. during. to the. or those that fail by reasons which are desirable to. exclude from consideration. The model of random censorship is very usefull for analysing these data. In this model the time to failure and the time censor are random variables. We. obtain two Bayes estimators of the reliability. function. of an exponential distribution based on randomly censored data. We. have. variance. and. calculated the asymptotic expansion of mean square error of. both. the. estimators,. mean,. when. the. of. the. censor's distribution is exponential. We. have. estimators. obtained also the asymptotic distribution for. distribution.. the Two. more. general. large-sample. case. of. confidence. censor's bands. Weibull. have. been. proposed for each estimator. The likelihood. results. have been compared with those of. estimator,. and. with. those of. two. non. the. maximum. parametric. estimators: Product-limit and Bayesian. One of our estimators has the best behaviour. Finally we have shown by simulation, that our estimators are robust against the assumed censor's distribution, and that one of our intervals does well in small sample situation..

(6) Agradezco la. persona. a. la. Facultad de Informdtica,. de su Decano D.. Estadistica,. Investigaci6n. Luis Mat6,. y. al. en. especial. en. Departamento. de. Operativa e Inteligencia. Artificial. haberme brindado la posibilidad de realizar esta tesis. Quiero expresar mi agradecimiento al Dr. del. Departamento. Matematicas labor. de. Estadistica. en la Facultad. de. la Universidad Carolina de Praga por. de orientaci6n y ayuda tanto a. correspondencia del. de. Jan Hurt, profesor. entre. travel. de. Fisica su. la. y. eficaz extensa. Madrid y Praga mantenida estos anos. como. contacto directo en ambas capitales. Agradezco igualmente al Dr. D. Antonio Insua Negrao su apoyo. para. establecer el contacto con la Universidad de Praga,. y. sus. sabios consejos a lo largo de la realizacidn del trabajo. Agradezco Da. Araceli. tambien a la Directora de la E.U.. de Informatica. Lorenzo las facilidades dadas para la utilizaci6n de. los ordenadores personales IBM-AT de su centro de calculo. Finalmente quiero agradecer a mis companeros del Departamento de. Matematica. Aplicada el aliento y apoyo que me. durante este periodo.. nan. prestado.

(7) INDICE Pag. 1.- Introducci6n 1.1. Definici6n de fiabilidad. Campos de aplicacion . . .1 1.2. Perspectiva historica. 3. 1.3. Medidas de fiabilidad. 5. 1.4. Tipos de censura. 8. 2.- Estimadores de la fiabilidad 2.1. Estimadores no parametricos. 14. 2.2. Estimadores de maxima verosimilitud. 23. 2.2.1. Tiempo de vida exponencial. 26. 2.2.2. Tiempo de vida Weibull. 33. 3.- Estimadores Bayesianos de la fiabilidad 3.1. Interes de los metodos Bayesianos para el estudio de la fiabilidad. 37. 3.2. Estimacion Bayesiana. 39. 3.3. Estimacion Bayesiana de la fiabilidad con tiempo de vida exponencial 3.4. Transformacion de los estimadores Bayesianos. 46 . . .50. 3.5. Expansion asintotica de la esperanza, varianza error cuadratico medio del estimador R4. 59. 3.6. Expansion asintotica de la esperanza, varianza error cuadratico medio del estimador Rs. 68. 3.7. Distribucion asintotica de los estimadores R4 y R5 72 3.8. Intervalos de confianza. 77. 3.9. Comparacion con otros estimadores de la fiabilidad 78.

(8) 4.- Simulacion 4.1. Robustez de los estimadores frente a la distribucion de censura supuesta 4.2. Intervalos de confianza con muestras pequenas. 92 . .106. 5.- Conclusiones y perspectivas de futuro. 113. Bibliografia. 117. Apendice 1 : Obtencion de la f6rmula 3.4.1. 122. Apendice 2 : Programas y ejecuciones. 126. Programa DEFICIENCIA. 127. Programa COMPARA. 136. Programa ECUACION. .. ,. 146. Programa SIMULA. 148. Programa COBERTURA. 152.

(9) 1.-INTRODUCTION I.l.-Definici6n de Fiabilidad. Campos de aplicaci6n. El an&lisis estadistico de la fiabilidad se ha convertido en una materia de considerable interes para personas que trabajan en distintas areas, especialmente en ingenieria, medicina, biol6gicas, comprenden. y. desde. manufacturados diseno. y. interns. por. supuesto en. estadistica.. la investigacion en la duracion. ha. subsistemas. aplicaciones de. productos. hasta el estudio de enfermedades humanas.. producci6n de equipos cada. se. Las. ciencias. acrecentado. que. forman. ya. vez. que. parte. mas. todos. del. complejos,. los. equipo. Con el este. componentes. deben. y. realizar. adecuadamente su funcion para que el sistema cumpla su objetivo. Utilizaremos probabilidad. de. el que. termino una. fiabilidad. parte. de. un. para. indicar. equipo. la. (componente,. subsistema o sistema) realice adecuadamente su funcion durante un periodo. dado. de. tiempo. bajo. condiciones. especificadas.. Por. ejemplo si la variable X indica el tiempo hasta que falle (tiempo de. vida). una. fiabilidad,. bombilla dada de 60 W,. R(x), de. la. bombilla. entonces. en funcion. la. funcion. de. del. tiempo. de. funcionamiento x, sera: R(x) = Pr (X > x) El estudio estadistico de la fiabilidad comprende una de. metodos. y. tecnicas para analizar variables. toman valores positivos. aleatoria. representa. el. serie. aleatorias. que. En nuestro caso el valor de la variable tiempo. de vida. de. un. componente. o. sistema. En otra area importante de aplicacion de estas tecnicas, 1.

(10) el. valor. de la variable aleatoria es el tiempo de vida. unidad biologica (paciente,. de. una. animal, celula, etc.)- En este campo. se utiliza el termino supervivencia,. en vez de fiabilidad,. para. indicar la probabilidad de que la unidad biologica sobreviva a un tiempo x dado. Dentro del area de la informatica los estudios de fiabilidad se. han referido tradicionalmente a los componentes hardware.. En. la ultima decada se ha comenzado a medir y predecir la fiabilidad del. software.. No. substancialmente vez. se. hay. duda. de que. en. software.. aumentaran. para. ser. cada. controlados. La necesidad del estudio de la fiabilidad de. componentes hardware esta muy clara, intuitivo. futuro. estos estudios entre otras razones porque. disenan sistemas mas complicados. mediante. el. pero quizas no parezca. muy. que un software que funcione bien pueda fallar al cabo. del tiempo, pues las sentencias de los programas no se deterioran con su uso. Sin embargo, un error logico en alguna instruccion se detecta solamente como resultado de una combinacion particular de datos de entrada. funcionando,. Por ello, mientras mas tiempo este el programa. es mas probable que encuentre un conjunto de. de entrada para los cuales falle por un error logico,. datos. por lo que. la fiabilidad tambien sera una funcion decreciente del tiempo. Actualmente. se considera que la principal cualidad que debe. tener un sistema informatico es la fiabilidad, incluso mas que la eficiencia.. Daremos dos razones para ello:. En primer. lugar, a. medida que los equipos se van haciendo mas rapidos y mas baratos, hay. menos. duplicar. necesidad de maximizar su uso.. algunos. componentes para aumentar. 2. Resulta mas la. rentable. fiabilidad. del.

(11) sistema, muchas. aunque. disminuya su eficiencia.. aplicaciones. ejemplo,. Por otra. parte,. hay. como el sistema de control de un avion. por. en las que el coste de fallar el sistema es mucho mayor. que el coste del sistema en si mismo, por lo que la fiabilidad es esencial.. 1.2 Perspectiva hist6rica. Aunque los origenes del analisis de supervivencia se atribuir varios. pueden. a los primeros trabajos sobre tablas de mortalidad hace siglos,. el. origen. de los. estudios. de. fiabilidad. es. relativamente reciente. Antes de 1940, los trabajos concernientes a. control de calidad y a fiabilidad no se identificaban como. campo en. especifico.. la. un. La Segunda Guerra Mundial estimulo el interes. fiabilidad de los equipos militares,. y este. interes. se. extendio tambien en la posguerra a los productos industriales. A. principios de los cincuenta varios grupos. iniciaron. estudios formales sobre problemas de. tuvieron. influencia. estadistico grupos. de. durante mucho tiempo sobre. estos. temas.. sea el AGREE,. de. ingenieros. fiabilidad, el. que. tratamiento. Quizas el mas conocido. de. estos. formado por el departamento de defensa. de. EE UU en 1952,. que desarrollo especificaciones estandars para la. fiabilidad. componentes electrdnicos. durante. de. muchos anos.. mayoritario influyente. utilizadas. El uso de la distribucion exponencial. en los primeros trabajos.. del. tiempo. desarrollaron. de. vida,. y. un. exponencial. Epstein. metodos estadisticos para 3. fue. Davis (1952) escribio. articulo sobre el uso de la distribucion. como distribucion (1953,1954). ampliamente. y. Sobel. datos. sin.

(12) censura.. Estos. fiabilidad:. trabajos fueron adoptados por los ingenieros. El. informe AGREE de 1957,. de. en el que presentaron el. conocido test estandar de fiabilidad MIL-STD-781 consideraba todo en terminos de la distribuci6n exponencial. A. partir. de. los sesenta. se. nan. desarrollado. numerosos. procedimientos de estimaci6n y contraste de hipotesis para varias familias censura. de. distribuciones parametricas,. como para datos censurados.. tanto para datos. Se han realizado. estudios sobre las distribuciones exponencial, lognormal.. A. distribucion. partir. de. de. los. setenta. numerosos. Weibull,. quizas. sin. haya. gamma y. sido. la. Weibull la mas utilizada como distribucion. del. tiempo de vida. La. mayor. aplicaciones. parte. a. la. investigacion. estadistica. la ingenieria se ha concentrado en. parametricos.. Estos. incluyen. analisis. un. de. ofrecen. los. varias ventajas entre las. sencillo. de. datos. modelos que. se. y. la. censurados. posibilidad de hacer extrapolaciones en el tiempo.. en. Aunque se han. desarrollado diversas tecnicas para asegurar la bondad del ajuste a una distribucion determinada, las. aplicaciones. practicas. modelo determinado,. muchas veces se han utilizado en. procedimientos. estandar. para. un. fundamentalmente el exponencial, sin que los. datos fueran adecuados para ello. Por. otra. parte. la. analisis. de. supervivencia. se ha centrado fundamentalmente en los metodos. no. parametricos.. A. desarrollaron. el. partir. investigaci6n medica. del. estimador. aho 1958 en. que. limite-producto de. en. Kaplan la. y. Meier. funcion. de. supervivencia para datos censurados, se han hecho grandes avances. 4.

(13) para. extender. censurados.. los. procedimientos no parametricos a. los. datos. En particular Breslow y Crowley (1974) han examinado. el comportamiento asintotico de este estimador.. 1.3 Medidas de Fiabilidad. Como. los. diferentes objetos que queremos. estudiar. pueden. tener diferentes usos y objetivos, necesitamos diferentes medidas de fiabilidad para aplicar la mas util en cada caso.. Por ejemplo. la medida de fiabilidad que se toma habitualmente para el reactor de una central nuclear es la tasa de fallo,. pues el fallo de. un. reactor es lo que interesa fundamentalmente.. Sin embargo para un. motor de un lanzador de cohetes espaciales,. lo importante es que. no. falle durante todo el lanzamiento y por ello la. probabilidad. de que sobreviva a la mision, la fiabilidad, es la medida que nos interesa. En un tercer ejemplo un fabricante de automoviles desea encontrar. un periodo de garantia durante el cual espere. reparar. un 5% de los vehiculos vendidos. En este caso la vida fiable sera la. medida m£s adecuada.. Veamos a continuacion la definicion. de. estos conceptos, y la relacion entre los mismos. Sea X una variable aleatoria que indica el tiempo de vida de un. objeto bajo unas condiciones de funcionamiento dadas,. y. sea. f(x) su funcion de densidad. Como hemos indicado antes, la funcion de fiabilidad, R(x), se define del siguiente modo. R(x) = Pr (X > x). f(t) dt = 1 - F(x) x. El. tiempo. medio. de vida es el tiempo durante 5. el. que. se.

(14) espera que el objeto funcione adecuadamente. Es por tanto. E(X) =. Si. lim X. x f(x) dx o. x R(x) = 0 , entonces se puede. demostrar. facilmente,. oo. integrando por partes que. E(X) =. R(x) dx o. La tasa de fallo o funcion de fallo se define como f(x) h(x) =. (1.1) R(x). En Epidemiologia a h(x) se le llamo historicamente la fuerza de la mortalidad.. La definicion de tasa de fallo se puede dar. tambien. de la siguiente forma: Pr(x < X < x+Ax | X > x) h(x) = lim AX-»0. A X. que es la probabilidad de que el objeto falle en el intervalo (x, x. + Ax) sabiendo que funcionaba en el tiempo x.. de las dos definiciones es inmediata.. La equivalencia. Para ver la relacion entre. la tasa de fallo y la funcion de fiabilidad,. integramos en ambos. miembros de (1.1): x h(u) du =. x. f(u)/R(u) du = - In R(u) o. 6. x. = - In R(x).

(15) Por tanto x h(u) du) o. R(x) = exp(-. Asi. pues. f(x), R(x). y h(x) estan. relacionadas. entre. si, y. conociendo una de ellas podemos calcular las otras dos. El. proceso. dificil vida. elegir. de. para. asimetricas pequeno. nos. complejo,. principalmente. distinguir. entre. varias. encontramos con el problema de. en. y. es. tiempo. de. Si intentamos utilizar los tiempos de. tamano de las muestras,. dificultades. bastante. una distribucion estadistica para el. de un objeto.. observados. fallo suele ser. las. fallo. distribuciones que. debido. al. las observaciones son dispersas. colas. de. la. distribucion.. se pueden superar mediante el concepto de. Estas tasa. de. fallo que permite distinguir entre varias distribuciones sobre la base de consideraciones fisicas. La objeto. curva. tasa La. de. tercera que. de. por. Se distinguen tres regiones:. La. primera. se los. iniciales debidos a los defectos de fabricaci6n o de. los. representa por. tipica tasa de fallo tiene generalmente la forma. una tasa de fallo decreciente y representa. materiales.. o. un. banera.. caracteriza fallos. de fallo puede variar a lo largo de la vida de. La segunda tiene una tasa de fallo casi constante. los fallos al azar causados por algun shock repentino. condiciones de funcionamiento. inusualmente. severas.. region se caracteriza por una tasa de fallo creciente. resulta. y. del. deterioro del componente. debido. al. La y. desgaste. sufrido con el tiempo. Como senalamos anteriormente suele ser mas. 7.

(16) conveniente seleccionar una distribucion basandose en la forma de la tasa de fallo, que en la forma de la funcion de densidad. Como. ultima. medida. definiremos. la. vida. fiabilidad. sera. R.. de. fiable. la. fiabilidad. de. como el tiempo XR. un. en. objeto,. el. que. Intuitivamente la vida fiable es el. para. el que el 100R% de la poblacion sobrevive.. Xr. como. el. del. percentil. 100(1-R) de la distribucion. se. la. tiempo calcula. tiempo. de. vida. Observar generalizar. que para. todos el. los. caso. conceptos. en que X. no. anteriores sea. una. se. pueden. distribucion. continua.. 1.4.-Tipos de censura. Todo los. lo que hemos dicho hasta ahora se podria estudiar. metodos. estadisticos. fundamentalmente la. conocidos.. Lo. que. con. distingue. el analisis de la fiabilidad de otros campos de. estadistica es la censura.. En la estadistica clasica. cuando. tomamos una muestra, podemos observar el resultado completo de la misma.. Sin. tiempo. de. vida de unos componentes o de. transcurrir elementos. embargo cuando tomamos una muestra para observar unas. personas,. de. la misma,. por lo que los elementos que. no. falla por causas distintas a las que otro. elemento. censurado.. siguientes tipos de censura: 8. hayan. Por otra parte podemos estar. interesados en estudiar unas causas de fallo determinadas.. tambien. puede. demasiado tiempo hasta que fallen o mueran todos los. fallado se dice que son censurados.. objeto. el. nos. Podemos. Si el. interesan,. distinguir. es los.

(17) Censura tipo I. Fijamos experimento. son v.a. una. de. un. valor. T. > 0,. que es el tiempo. Tomamos una muestra de tamano n:. ellas con funci6n de el. distribucion. a la muestra ordenada.. el. ... , Xn que. Estas la. variables muestra.. Llamemos X{1> ,. ... ,. Los resultados del experimento. los primeros r valores de Xi, n-r. F.. tiempo de vida de los elementos de. Solo podremos observar los valores Xi < T.. los. dure. independientes e identicamente distribuidas (iid), cada. representan. X(n). Xi ,. que. .... son. , Xn y la informacion de que. restantes objetos tienen una duracion mayor que. T.. En. este tipo de censura la duracion del experimento es fija (T) pero el numero de objetos que fallan (r) es una v.a. Binomial de parametros n y p = P r ( X i. con distribucion. < T), i = l , ... , n.. Censura tipo II. Ahora fijamos r < n, X(i),. .... el numero de objetos que fallan.. , X(n) el estadistico ordenado de Xi,. Sea. .... ,Xn. El. experimento termina despues de fallar el r-simo objeto,. de forma. que podemos observar X( 1) , objetos. que. fallan. es. .... fijo,. ,X(r) . En este caso el numero de mientras. que. la. duracion. del. experimento (X<r)) es una v.a... Muestreo Censurado. Junto a las variables Xi , ... , Xn que representan el tiempo 9.

(18) de vida consideramos Ti , ... , Tn que son v.a. i.i.d. cada una de ellas con funci6n de distribucion G. asociado. a. Xi. Ti es el tiempo de. y representa el tiempo de fallo del. causas distintas a la que nos interesa estudiar.. censura. objeto. En este. por. modelo. solo podemos observar los pares: (Wl,Il), ... , (Wn,In) donde Wj = min(Xj ,Tj ) Ij = I(Xj < Tj ) =. 1. si Xj < Tj , esto es si Xj esta sin censurar. =. 0. si Xj > Tj , es decir si Xj esta censurada. En este modelo hacemos la importante suposicion de que Xj. y. Tj son independientes, pues de otro modo se podrian obtener pocos resultados.. Esta hipotesis esta justificada en la mayoria de las. aplicaciones ya que se eligen al azar los elementos que entran en el. estudio,. y. las perdidas por censura tambi<§n se producen. al. azar. El muestreo censurado se puede considerar un caso particular del modelo de riesgo multiple con dos causas de muerte que son el fallo y la censura. En el modelo general un elemento puede fallar por. p causas distintas,. que. se produce el primer fallo.. demas. causas. y solo podemos observar el tiempo hasta Los tiempos de fallo. estan censurados por el fallo del sistema. para con. las la. primera causa. Observar. que. la censura tipo I es un caso. 10. particular. del.

(19) muestreo. censurado. en. el. que la distribuci6n. de. censura. es. degenerada en el punto T. El la. muestreo censurado creemos que es el que modeliza. realidad. fiabilidad. alguna. tanto. en. analisis. de. supervivencia. mejor. como. en. En aplicaciones medicas la censura puede ocurrir por. de las causas siguientes:. a) El paciente decide dejar la. terapia o marcharse a otro lugar.. No volvemos a saber mas de el.. b). El paciente muere por otra causa independiente.. podemos. estar. estudiando una terapia. paciente muere de infarto de corazon.. contra el. Por. ejemplo. cancer,. y. c) La terapia puede. el. tener. efectos contraproducentes y es necesario terminar el tratamiento. d). Termina> el estudio.. En fiabilidad ademas de la ultima causa,. la principal es que el objeto falle por un motivo distinto al que estemos estudiando. Un. caso particular importante de muestreo censurado. es. el. modelo de tasa de fallo proporcional.. Este modelo lo supondremos. en. y ha. alguno. de. numerosos tasa. nuestros. autores.. resultados,. sido. utilizado. Decimos que el par (X,T) sigue el modelo. de fallo proporcional si existe un numero real. por de. positivo 13. tal que 13 1 - G(t) = [1 - F(t)] Observar fallo. para t 6 [0,*). que si esta relacion es cierta, de. las. proporcionales.. distribuciones La. constante. de. entonces las tasas. fallo. y. censura. 13 se puede interpretar. como. de son el. parametro de censura: 13 = 0 corresponde a muestreo sin censura, y la. proporcion. esperada de observaciones censuradas. aumenta. al. hacerlo (3. Una caracterizacion de este modelo viene dada por. el. 11.

(20) siguiente teorema demostrado por Allen (1963): "El par (X,T), fallo. proporcional. 0 < Pr(X < T) < 1 sigue el modelo de tasa de si. y solo si las variables aleatorias. W =. min (X,T) y I = I(X < T) son independientes". Por tanto con este modelo, 1,. Wj y Ij son independientes,. j=. ... , n. Como los pares aleatorios (Xj,Tj), j = 1, ... ,n son. i.i.d.. concluimos que las variables aleatorias Ii , ... , In,. Wi, ... , Wn son independientes. Una este. forma. modelo. H(x)/S(x). de comprobar graficamente si la. es. y. adecuada. consiste. en. dibujar. utilizacion en. de. ordenadas. en abcisas x; el resultado debe ser aproximadamente. una linea recta.. Se define H(x) = Pr(W > x, I = 1) y S(x) =. Pr(W > x, 1 = 0 ) .. Otros tipos de censura. que. Los. tipos de censura que nemos considerado hasta. son. los. derecha.. de mayor interes,. son del tipo de. ahora, y. censura. a. la. Se puede considerar tambien censura a la izquierda. Por. ejemplo en el muestreo censurado a la izquierda el resultado. del. experimento son los pares de valores: (Wl,Il), ... , (Wn,In) donde Wj = max (Xj ,Tj ) Ij = I(Xj > Tj ) Ambos. tipos de censura,. a la izquierda y a la derecha, 12. se.

(21) pueden. considerar. casos particulares del intervalo. de. censura. (llamada tambien doble censura), en el que la v.a. de interes cae en un intervalo.. Si Xi esta censurado a la. que Xi cae en el intervalo [Ti,<»).. 13. derecha,. observamos.

(22) 2.- ESTIMADORES DE LA FIABILIDAD. En este capitulo estudiaremos los principales estimadores de la. fiabilidad utilizados hasta ahora,. mas. interesantes.. Una. vez. asi como sus. propiedades. que veamos las propiedades. de. los. estimadores Bayesianos, realizaremos un estudio comparativo.. 2.1 Estimadores no param^tricos Estimador limite producto Este desde en. estimador fue propuesto en 1958 por Kaplan y. Meier. y. entonces ha habido una abundante literatura sobre el mismo. las. revistas especializadas.. generalizacion. para. el. muestreo. En realidad se censurado de. trata la. de. funcion. una de. fiabilidad empirica en muestras completas. Sea W(i) < ... < W(n) el estadistico ordenado de Wi , .. ., Wn y abusando de la notacion, llamamos I(i) al valor de I asociado a W(i) , es decir,. I( i) = Ij si W(i) = Wj . Logicamente I<i> , ... ,. I(n) no estan ordenados. Definimos: m. =. numero. de elementos que no han fallado. en. el. [0,W(i)] di = numero de fallos en W(ij = 1 = 0. si I(i) = 1 si I( i) = 0. Pi = Pr (sobrevivir a W( ±) | ha sobrevivido a W( »-i> ) = Pr (X > W(i) | X > W(i-i)) Pi se puede estimar de la siguiente forma:. 14. intervalo.

(23) Pi = 1 - d i / n i. T e n i e n d o en c u e n t a Pr. = 1 - 1/ni. s i I(±). =1. (sin. censurar). =1. s i I(i>. = 0. (censurado). que. (X > W(k)) = Pk • P r (X > W ( k - i ) ). = Pk • P k - I • k. Pr. (X. > W ( k - 2 ) ) = . . . = re Pi i s1. el estimador limite producto de la fiabilidad es: R(X) =. % Pi i:Wi <x. =. Si. 0. X < W(n). Si. X > W(n). Como Pi = 1- 1/ni = 1 - l/(n-i+l) = (n-i)/(n-i+l). si I (i ) = 1. el estimador lo podemos escribir asi: I. a). n-i. K. R(X) =. i:W(i)<x. (. ). X < W(n). si. x > W(n). n-i+1. = 0 Algunas. Si. propiedades. basicas. de. este. estimador. fueron. estudiadas por Breslow y Crowley en 1974. Mencionaremos solamente los resultados mas importantes: Si F y G son continuas en [0,T] y F(T) < 1 , entonces Zn (t) = /n (R (t) - R (t) ) converge debilmente a un proceso Gaussiano, Z(t), con momentos E (Z(t)) = 0 15.

(24) s cov (Z(s),2(t)) = R(s)-R(t). -2 [R(x) (l-G(x))]. dPr(X<x,I=l). 0 s<t Burke, correcta. de. Breslow fallo.. Csorgo. y. y Horvath (1981),. esta convergencia,. dieron. una. ya que aunque el. Crrowley era correcto,. demostracion resultado. la demostracion. tenia. de. algun. Ademas observaron que se necesitaban muestras muy grandes. para que la aproximacion fuese buena. Como caso particular del teorema anterior, tenemos que t -2 2 Vrn (R (t) - R (t) ) —*- N ( 0 , R (t) [R(x) (l-G(x))] dPr(X<x,I=l)) 0 La varianza asint6tica de R(t) se puede aproximar por "2 A Var ( R ( t ) ) = R ( t ). I (i ) £ W(i)<t (n-i)(n-i+l). que se conoce con el nombre de formula de Greenwood. Peterson. (1977). obtuvo. algunos. resultados. importantes. sobre la consistencia de este estimador. En concreto demostro que es consistente de orden 0 ( n _ 1 ) desde el punto de vista del cuadratico medio,. error. y que es fuertemente consistente de orden. o(n - 1 / 2 /log n ) . Propiedades estudiadas muestras Hollander momento. asintoticas. por muchos pequenas y. no. Langberg. de. autores.. este. estimador. Sin embargo. han. sido. resultados. para. se demostraron hasta 1982 en. que Chen,. obtuvieron una expresion exacta. de orden a (a > 0) con la suposici6n de que la. 16. para. el. censura.

(25) sigue el modelo de tasa de fallo proporcional: Sea Kn(x) la funcion de distribucion empirica de los W's, 1 Kn(x) = n. n S I(Wq < x); sea (l-K(x) = (l-F(x)) (l-G(x)) y q=l. sea Ii = Pr (Xi < Ti), entonces:. E [{R} ] n-1 n q n-q q n-i a S ( ) {K(x)} {l-K(x)} 7c {Ii ( ) + (l-Ii)} q=0 q i=l n-i+1 En consecuencia: n-1 n q n-q q = S ( ) {K(x)} {l-K(x)} 7C { l - I i q=0 q i=l. E {R(x)}. 1 (. )} n-i+1. y. n-1 n q n-q q V a r { R ( x ) } = E ( ) {K(x)} { l - K ( x ) } % {l-Ii q=l q i=l -. [. 1 2 ) (2n-2i+l} n-i+1. n-1 n q n-q q £ ( ) (K(x)} {l-K(x)} % {l-Ii q=0 q i=l. Aplicando. estas. estimador. limite. exponencial. (. 1 2 )} ]. ( n-i+1. formulas obtuvieron la Esperanza y Varianza del producto. de parametro 1,. en un modelo con y distribucion de. tiempo. de. censura. vida tambien. exponencial de parametro 8, para diversos valores de 6 y diversos tamanos muestrales.. Posteriormente compararemos estos resultados. con los obtenidos por nuestros estimadores Bayesianos. Finalmente. indicaremos que un incoveniente del estimador de. Kaplan-Meier es que falla en la cola derecha de la. distribucion,. en concreto para estimar la fiabilidad en puntos del tiempo x >Wn. 17.

(26) Estimador Bayesiano. Susarla. y. Van. Ryzin. obtuvieron. en. 1976. un. estimador. Bayesiano no parametrico de la funcion de fiabilidad con muestreo censurado.. Este. limite-producto.. estimador tiene una forma similar al Para. estimador. verlo vamos a escribir este ultimo de. la. siguiente forma: n-i. R(x) =. x. (i). n ( ) i:W(i)<x n-i+1 n-i+1 -I(i> ( ) n-i. n W(i)<x N(x) = n. 1 n n-1 N(x)+1 - { ... } N(x) n n-1 n-2 N(x). n-i+1 n W(i)<x. (. 1_1. (i). ) n-i. donde N(x) = Numero de elementos Wi > x. El. estimador Bayesiano para muestreo censurado obtenido por. Susarla y Van Ryzin (1976) utiliza la nocidn de proceso Dirichlet a priori, introducida por Ferguson (1973), que tiene la propiedad de. que. la. distribucion. a posteriori. es. tambien. un. proceso. Dirichlet. Supongamos que F = 1-R es un proceso Dirichlet con parametro a. sobre. el a-Algebra de Borel en (0,oo),. siendo. a. una. medida. finita no negativa en (0,°o). Entonces el estimador Bayesiano de R con funcion de perdida 00. ~. 2. [R(u) - R(u)] dg(u). L(R,R) = 0. 18.

(27) siendo g una funci6n peso, no negativa y no decreciente, es: r a[W (i ) ,w) + (n-i + l) -I1-1 ( i). a(x,<°)+N(x). % W( i ) <x •- a[W( i ) ,« ) + (n-i). Ra (x) = a(0,oo)+n. Se puede demostrar que a(A) Pr(X € A) = a(0,oo) Esta ecuacion da una interpretacion del parametro a. a(A)/a(0,») del. es. conjunto. El cociente. nuestra creencia a priori sobre la. A.. Por. ejemplo. si. pensamos. probabilidad. que. X. sigue. una. distribucion exponencial de media 9, entonces a(t,»). -9t = e. a(0,») Observar considerar. que. un. el. estimador. limite-producto. caso particular de este estimador. se. puede. Bayesiano;. caso en el que el peso dado a la curva de supervivencia a. el. priori. es nulo. Susarla. y. Van. Ryzin (1978) demostraron que. el. estimador. obtenido por ellos es consistente de orden 0(n - 1 ) desde el de. vista. del. consistente. de. error. cuadratico medio,. y. que. es. orden o(n~*/2/log n ) . Demostraron. siguiente teorema sobre convergencia asintotica: Sea T < co y F y G continuas en [0,T], entonces Zn (t) = /n [ Ra (t) - R ( t ) ]. 19. punto. fuertemente tambien. el.

(28) converge debilmente a un proceso Gaussiano, Z(t), con momentos E(Z(t)) = 0 s cov (Z(s),Z(t)) = R(s)-R(t). -2 [R(x) (l-G(x))]. dPr(X<x,I=l). 0 s<t Hemos. visto que desde el punto de vista asintotico el. limite-producto y el estimador Bayesiano son Susarla. y Van Ryzin (1980) estudiaron,. estimador. equivalentes.. Ray,. mediante simulacion,. el. comportamiento con muestras pequenas de ambos estimadores y el de maxima. verosimilitud. exponencial error. y. que. veremos. despues.. Suponiendo. siendo cierta esta hipotesis comprobaron. tiempo que. el. cuadratico medio del estimador Bayesiano era menor que. el. del. limite-producto pero mayor que el de. Con. la. misma hipotesis exponencial,. distribucion. una Gamma,. maxima. verosimilitud.. pero siendo. la. verdadera. el estimador Bayesiano era el de. menor. error cuadratico de los tres. Ademas las diferencias entre Ra y R aumentaban. a. medida. que. se. incrementaba. la. proporci6n. de. elementos censurados, y esto lo explicaban por el hecho de que el primero hace mas uso de los datos censurados que el segundo. Dong de. orden. Ho Park (1987) obtuvo la expresion exacta del. momento. a. que. (a > 0) del estimador Bayesiano suponiendo. la. censura sigue el modelo de tasa de fallo proporcional. Utilizando la. misma. notaci6n que para los momentos del. estimador. producto, tenemos:. E [{Ra } ] = n-1 n q n-q q n-i a E ( ) {K(x)} U-K(x)} 7t { Ii ( ) q=0 q i=l n-i + 1 20. +. limite-.

(29) n-i (1 - la). L. n-i+2. a. } n-i+1 n-i+1 ->. En consecuencia: n-1 n q n-q q -2 E{R(x)} = £ ( ) {K(x)> (l-K(x)} % {l-[l+Ii(n-i)](n-i+l) } q=0 q i=l 2 n-1 n q n-q q -1 E{R(x) } = 2 ( ) {K(x)} {l-K(x)} % {1-21! (n-i+1) + q=0 q i=l -2 (3Ii-2) (n-i+1) Estas. formulas. exponencial parametro medio. -4 + (l-Ii) (n-i+1). las aplic6 a un modelo con tiempo. de parametro 1,. y censura tambi^n. 13. Obtuvo la esperanza,. para. diversos. }. valores de 6,. resultados con los obtenidos por Chen,. y. n.. vida. exponencial. varianza y error x. de. de. cuadratico. Comparando. estos. Hollander y Langberg para. el estimador limite-producto, confirmo las conclusiones obtenidas mediante simulacion por Rai, Susarla y Van Ryzin en el sentido de que. el. error. cuadratico. significativamente menor, es mayor,. medio. del. estimador. Bayesiano. es. especialmente cuando x crece. El sesgo. aunque se acercan cuando x crece. Este estimador tiene. por tanto mejor comportamiento en la cola de la distribucion.. Estimador de Ebrahimi. Citaremos. tambien un estimador no parametrico de la funcion. de. fiabilidad propuesto por Ebrahimi (1985) para el caso de. la. censura. est6 relacionada con la distribuci6n del. tiempo. que de.

(30) vida segun el modelo de tasa de fallo proporcional: 1 - G(x) = [R(x)3B,. para todo x. l-Pr(I=l) _ 1 Teniendo en cuenta que 13 = — : , y que I = - E Ii Pr(I=l) n. es un. estimador de Pr(I=l), utiliza como estimador de (3; (1-I)/I . Por otra parte demuestra que 1 log R(x) =. (3 + 1 log. 13+1. 1 +. 13. Pr (W>x,I=0) (3 + 1. Esta ecuaci6n le lleva a dar el siguiente estimador de R R(x) = T exp {T log (1/T) + T log H(x) } + (1-T) exp {T log (1/1-T) + T log S(x) } 1 1 siendo H(x) = - E I(Wi>x,Ii=l) y S(x) = - E I(Wi>x,Ii=0) n i n i En. el caso de que no haya censura este estimador coincide con la. funcion de distribucion empirica. En. el. mismo. articulo. fuertemente consistente,. demuestra. que. este. estimador. y que converge d§bilmente a un. es. proceso. Gaussiano de media cero y con una determinada covarianza. Justifica de. fallo. salto censura. la introduccion de este estimador porque con tasa. proporcional cualquier estimador de R deberia. en. los tiempos de fallo observados y en. observados.. los. dar. un. tiempos. de. El estimador limite-producto no tiene. propiedad, pero 6ste si.. 22. esta.

(31) 2.2 Estimadores de maxima verosimilitud. Vamos a deducir las funciones de verosimilitud para los tres tipos. de censura mas importantes.. Comenzaremos por el caso. mas. sencillo. Censura tipo II Supongamos vida observados, x< i) < .... que X = (X(x>,. .... ,. X<r)) son los tiempos de. ordenados de menor a mayor,. < X(r > ,. y x =(X(i) ,. .... (r fijo).. Sea 0 <. , X(r) ). Sea 8 > 0 tal que. X( i) + 8 < X(i + i ) , i = 1, ... ,r-l (definimos x<o> = 0 ) . Sea A el vector r-dimensional con todos sus componentes iguales a 8. Sea E el suceso aleatorio { x < X < x +A } el. suceso E ocurre si no hay ninguna observaci6n menor que x<i> ,. exactamente. una observaci6n en el intervalo [X( i) ,. X(i). +. 8). solo una en el intervalo [x(2), x< z > + 8 ) , ... , y fina'lmente (n-r) observaciones son mayores o iguales que X{r ) + 6 . Por tanto n! p(E). =. r %. [F(x (i). n-r + 8) - F(x ( i))] R (X(r) + 8). (n-r)! i=l La funcion de densidad conjunta de X es simplemente el limite: f (X(i>, ... , X ( D ) = lim 8~rPr(E) = 8->0 n! r n-r % f(X(i)) R (X(r)) (n-r)! i=l 0<X(l)<...<X(r)<» 23.

(32) Censura tipo I. En este caso el resultado del experimento son los primeros r tiempos de vida ordenados x< 1) que X(r+i)) > T, ... , X(n>. , ... , x< r). , y la informaci6n de. > T. Mantenemos la misma notaci6n que. en el tipo anterior de censura.. Supongamos que x< r ) + 8 < T.. De. forma similar tenemos: Pr ( X < X < X + A Pr. (. no. exactamente. , X(r+1) > T, ... ,X(n) > T •) =. haya ninguna observacion. una. en. [x<i),. menor. X(1)+5),. .... que ,. x< 1) , solo. [X(r),x<r)+5) y (n-r) observaciones mayores que T ). haya. una. en. =. ni. r n-r % [ F(x(i)+S) - F(x(i)) ] R (T) (n-r)! i=l. Por. tanto. la. funcion de densidad conjunta. del. resultado. del. experimento es n!. f (X(l),. ... , X(r)) =. r n-r K f(X(i)) R (T) (n-r)! i=l 0<X(1)<.... <X(r)<T. Muestreo censurado. Suponemos que X y T son v.a. independientes con funciones de distribucion. F(x;8i). absolutamente continuas.. y. G(t;62). respectivamente,. ambas. Queremos obtener la funcion de densidad. del par (W,I) = ( min (X,T) , I (X<T) ). 24.

(33) Pr (W < w, I = 1) = Pr(X < w, X < T) =. dF(x) dG(t) =. w. [1 - G(x)] dF(x) = F(w) -. w. f(x) G(x) dx. x<w x<t Ancilogamente Pr (W < w, I = 0) = G(w). w. F(x) g(x) dx 0. Derivando dPr(W<w,I=l) = f(w) [1 - G(w)] dPr(W<w,I=0). aw. g(w)[l - F(w)3. Por tanto h(w,i) = {f(w) [1-G(w)]}i {g(w) [l-FCw)]}!-1 , w>0, i = 0,l es la funci6n de densidad del par (W,I). La funcidn de verosimilitud de la muestra es n L = L (Wi , ... , Wn; II, ... , In ) = % h (Wj , Ij ) j=l. Esta funcion se puede escribir tambien de la siguiente forma L = % f(Xj) * (l-F(Tj)) % g(T3) % (l-G(Xj)) jeU jeC jeC jeU donde. C. =. observaciones. {j: Ij. = 0}. censuradas. es el conjunto. de. indices. y U = {j: Ij = 1} es el. de. conjunto. las de. indices de las observaciones sin censurar. Teniendo en cuenta que no hay dependencia funcional entre 6i y 82 (ya que hemos supuesto que los tiempos de vida y de 25. censura.

(34) son. independientes), los. parametro. desconocido. constantes. al. dos ultimos factores no contienen. 81, por. maximizar. L.. lo. que. Asi pues el. pueden. tratarse. estimador. de. el como. maxima. verosimilitud 61 se obtiene maximizando % f(Xj }. jeU. % (l-F(T!j. )). jeC. Por ello el valor de 81 no depende de la distribucidn de censura, aunque la distribucidn del estimador si depende de G. A. continuacidn. verosimilitud,. vamos a obtener los estimadores. que el tiempo de vida siga las distribuciones mas. en. la. estimaci6n. fundamentalmente. maxima. asi como algunas de sus propiedades para el. de. Justificaremos. de. de. la. fiabilidad:. Exponencial. tambien la elecci6n de estos modelos, los. que. utilizar^. con. los. caso. utilizadas y Weibull. que. ser£n. estimadores. Bayesianos.. 2.2.1. Tiempo de vida Exponencial. La. tiene. como. funci6n de fiabilidad R(x) = exp(-x/8) y como tasa de fallo. h(x). = 1/8. la. distribucidn. exponencial. de. parametro. 8. El hecho de que la tasa de fallo sea constante indica que. probabilidad. de fallo en un intervalo de tiempo de. longitud. especificada es la misma, independientemente del tiempo que lleve funcionando ese objeto. Esta propiedad se conoce con el nombre de carencia. de memoria,. y la distribucidn exponencial es la. distribucidn continua que la posee.. 26. unica.

(35) Se. pueden. elecci6n. dar. varias. justificaciones. teoricas. para. la. del modelo exponencial como distribucion del tiempo. de. vida. Por ejemplo, supongamos que una sobrecarga de un componente ocurre. segun los postulados de un proceso de Poisson,. y que. el. objeto falla la primera vez que se encuentra tal sobrecarga y. no. falla. por otra causa.. El numero de sobrecargas X(x) que ocurren. en un intervalo de tiempo de longitud x es exp(-Xx) (Xx)n Pr[ X(x) = n ] =. n=0,l,2, ... n!. donde X es la tasa de ocurrencia de la sobrecarga. Sea T una v.a. que indica el tiempo de vida del objeto. De este modo R(x) = Pr (objeto tenga una duracion > x) = Pr (no haya sobrecargas en (0,x)) = Pr (X(x) = 0) = exp(-Xx) que es la funci6n de fiabilidad de la distribuci6n exponencial. Otra modelo. justificacion es. la. independientes observado. es. independientes. teorica. siguiente: de. el. fallo, mas. para la. Supongamos de. forma. pequeno. que. entre un. utilizacion que. de. hay muchas. el gran. tiempo numero. este. causas. de. fallo. de v.a.. no negativas (cualquier mecanismo complejo. tiene. muchos componentes independientes, de forma que cuando uno falla, falla mil. el mecanismo. piezas. de. Por ejemplo un automovil tiene mas de las. que. alrededor. de. diez. trescientas. son. imprescindibles para su funcionamiento). Bajo algunas restricciones en. las v.a.. de las componentes,. la distribuci6n del tiempo. fallo. observado es aproximadamente exponencial.. puede. demostrar que si Xi ,. ... 27. En concreto. , Xn es una muestra. de se. aleatoria.

(36) simple. de una distribuci6n con funcion de fiabilidad R(x) y. que. si R(x) = 1 - x/6 + o(x) cuando x->0. , 9 >0. entonces cuando n->», la funci6n de fiabilidad de Tn = n min (Xi, ... , X n ) converge. a la funci6n de fiabilidad de una exponencial de. media. 6. Una. forma. exponencial. es. empirica. de. comprobar. si. la. distribucidn. adecuada para un conjunto de datos. consiste. en. representar en ordenadas el logaritmo del estimador de la funcion de fiabilidad, y en abcisas el tiempo. El dibujo debe aproximarse a una linea recta que pase por el origen. Con. muestreo. censurado y tiempo de. vida. exponencial,. la. funci6n de verosimilitud queda L = (1/6)1 exp (- 1/8 E Xj - 1/6 E Tj ). u. c. n. = (l/e)1 exp (- i/e s Wj ) 3=1 con lo que el estimador de maxima verosimilitud es n n 9 = 2 Wj / E Ij 3=1 3=1 suponiendo. que I = E Ij , el niimero de elementos no. censurados. sea mayor que cero, pues en caso contrario no estara definido 9. De. forma analoga se comprueba que para la censura tipo I el. estimador es. 28.

(37) r 8 = l/r [ 2 X(j > + (n-r) T ] j=l y para la censura tipo II r 6 = l/r [ E X ( j) + (n-r) X< r ) ] j=l Para Hipdtesis, puede. la. construccion de Intervalos de Confianza y Test. de. necesitamos la distribucion de estos estimadores.. Se. demostrar (ver Miller 6 Kalbfleisch) que con censura. II, la distribuci6n de 2r8 / 8 grados de libertad.. sigue una distribucion. X 2 con 2r. Comparando esta distribuci6n con el caso. que. no haya censura ( 8 = EXi/n ,. con. datos. 2n8/8. ~. exponenciales se obtiene la misma. estimacion. tipo. de. X 2 2 n ), vemos que eficiencia. observando r objetos hasta que fallen que. en. la. observando. un numero mayor, n, hasta que fallen r. Para obtener. muestreo la. censurado,. distribucion. verosimilitud.. La. asintotica. los mismos.. de. o censura tipo I no. de. los. estimadores. es. posible. de. maxima. unica posibilidad es estudiar la distribucion Con muestreo censurado. Hurt. (1982). demostro que D /n (8 - 8). 1 3> N (0 ,. Var (W - 81) ). (2.1). Pr 2 (X<T) El. denominador. esperada. de. la. varianza. asintotica. de observaciones sin censurar.. tipo I se tiene Pr( X < T ) = 1 - exp (-T/8). 29. es. la. En el caso. proporcion de. censura.

(38) Distribucion de censura exponencial. Si segun. las distribuciones de fallo y censura estdn relacionadas. el modelo. distribucidn. de tasa de fallo. proporcional,. de censura es exponencial.. entonces la. Si el parametro. de la. misma es a, entonces G(t) = 1- exp(-t/a) , = 0 W. t >0 t <0. = min (X,T) se distribuye por tanto. exponencialmente con. parametro 6 que cumple 1. 1. 6. 1 8. a. La f6rmula (2.1) se reduce a la siguiente D /n ( 6 - 9 ) Los. resultados. 3 > N (0 , 6 /6 ). anteriores. se pueden aplicar. al estimador de. maxima verosimilitud de la funcion de fiabilidad.. Para cualquier. valor real fijo x > 0, dicho estimador, que llamaremos Ri es Ri = exp (-x/6) Sin ninguna perdida de generalidad, realizando un cambio adecuado en la escala del tiempo nos podemos restringir al valor x = 1, de forma que la funcion de fiabilidad sera Ri = exp (-1/6) si. quisieramos. verdadera. estimar. la fiabilidad. en el tiempo. x y la. media de la distribucion fuera 9, considerariamos un 30.

(39) modelo con esperanza 8X = 6/x. Hurt (1982) demostro que Vn (Ri - R). N(0, R2 (8S)-i ). 3-. En 1986 estudi6 la expansi6n asint6tica de la media,. la varianza. y el error cuadratico medio del estimador Ri, y obtuvo las siguientes formulas:. E Ri. 1 1 1 = R [1 + - ( + ) + n 8 298 1 — n. V a r Ri. 1. 1 3 + — +. (. 2. 6. 8. 2. 1. 1. 1 +. 2. 288. 8 S. 5. 1. 688. 2. + o(n"3). )] 2. 88 8. 2. 1. = R2. [. + n88. 1 —. 1. 3. (. n2. 82. ECM Ri = R2 [. 3. +. + 88. 828. 882. ) ]. +. 0(n-3). 282S2. 1 + n88. 1 2 3 — (— + n2 82 88 Basandose. 6. 1. 828. 882. 7 +. 48 2 8 2. en el estimador de maxima. )] + 0(n-3). verosimilitud,. otros dos estimadores de la funcion de fiabilidad. ellos,. que llamaremos R2,. obtuvo. El primero de. se obtiene restando a Ri un estimador. del termino en n -1 de la f6rmula de la esperanza: 1. R2 = Ri. con. 1 1 Ri - { -3 - 1) n W 2W. lo que se elimina el sesgo de primer orden. 31. Esta correcci6n.

(40) es interesante para muestras pequerias. El sesgo. otro estimador,. del. estimador. de. que llamaremos R3, maxima. tambi^n corrige. verosimilitud.. Miller. el. (1981). realiza un desarrollo en serie de Taylor para obtener el sesgo de primer orden del estimador de maxima verosimilitud de la de fiabilidad en muestreo sin censura, una. correcci6n. de dicho estimador.. funci6n. a partir del cual realiza. Con un m6todo analogo. para. muestreo censurado, se obtiene R3: I I -1 R3 = Ri [ 1 + — ( -_ _ i) ] nW 2W Antes realizar. de terminar el estudio del modelo exponencial vamos a alguna. distribucion en. advertencia. sobre. su. utilizaci6n.. Esta. es muy adecuada para el estudio del tiempo de. muchos problemas reales,. y los procedimientos de. basados en ella son ampliamente utilizados. inconveniente. que. presenta. este. vida. inferencia. Sin embargo el mayor. modelo. es. que. dichos. procedimientos son poco robustos, es decir que sus propiedades se alteran. considerablemente. modelo supuesto. basadas. con pequerias. desviaciones. sobre. Por tanto solo solo deber£n hacerse inferencias. en el modelo exponencial cuando los datos observados. ajusten bi6n a esta distribucion. anteriormente. el. no. se. Con el metodo gr^fico indicado. podemos asegurar totalmente que el ajuste. sea. bueno. Adem&s de los metodos generales de contrastar la bondad de un. ajuste,. existen. exponencial. procedimientos. como. un. Lawless El. test. especificos (1982). para. considera. primero supone la. la tres. distribuci6n. caso particular de los modelos Weibull o 32. distribucion tipos. de. exponencial Gamma;. estos.

(41) test. son efectivos para detectar desviaciones de la. dentro del modelo mas general, otro. tipo de desviaciones.. tienen tasa. buena. de. exponencial. pero pueden no ser efectivos para test. que. potencia frente a distribuciones alternativas. con. fallo mon6tonas.. El segundo tipo considera. Finalmente considera test. formulados sin alternativas especificas,. de. utilizando una. ajuste versi6n. especial de los test generales.. 2.2.2.. La. Tiempo de vida Weibull. distribucion. de. Weibull. de parametro de. escala. 8 y. parametro de forma 13 tiene como funci6n de fiabilidad R(x) = exp [ - (x/9)8 ] La funci6n de densidad es f(x) = (3/6 (x/G)'3"1 exp [ - (x/8)« ] y la tasa de fallo {x/Q)*-1. h(x) = 13/e. Vemos que el modelo exponencial es un caso particular del de Weibull. con. constante.. 13 =. 1.. Si (3 > 1,. Este caso corresponde. a. tasa. de. fallo. la tasa de fallo es creciente, lo cual nos. permite modelizar el tiempo de vida de los componentes en periodo de. desgaste,. (sabiendo tiempo.. que Si. en no. los que la probabilidad instantanea ha fallado hasta ese. 13 < 1,. de. con. el. h(x) es decreciente y podemos modelizar. el. 33. momentq) crece. fallo.

(42) periodo. infantil del tiempo de vida de los. Una es. que. componentes.. justificacion teorica de la utilizaci6n de este modelo, la. distribuci6n de Weibull se. distribucion. limite. independientes siguiente: negativas. del. menor. no negativas.. "Sean. Xi ,. .... de. puede. un. obtener. gran. como. niimero. de. la. v. a.. En concreto se puede demostrar , Xn v.a.. i.i.d.. continuas. lo. y. no. tales que cuando x -> 0 las funciones de densidad y de. fiabilidad. son. asint6ticamente. x B-1 /8. y. 1. - xB/8i3. respectivamente, donde 8 > 0 y i 3 > 0 . S i W = min (Xi , ... , Xn ) y T. =. (1/86) 1/8 n1 /B W,. distribuci6n forma. limite. entonces cuando n —>. °°, T. tiene. como. la distribuci6n de Weibull de parametro. 13". El teorema que dimos para justificar la. de. distribucion. exponencial es un caso particular de este con 0 = 1 . Tenemos que log [-log (R(x)] = 13 (log x - log 9) de. modo que una forma empirica de comprobar si el modelo Weibull. es adecuado, consiste en representar en ordenadas log [-log R(x)] y. en abcisas log x,. funcion de fiabilidad,. donde R(x) es un estimador muestral. de. la. por ejemplo el de Kaplan-Meier. El dibujo. debe dar aproximadamente una linea recta, cuya pendiente nos dara un. estimador. grosero. estudiar. la. Lawless. (1982). de. (3. Existen test. bondad del ajuste a una recoge. algunos. mas. potentes. distribucion. test. para. de Weibull.. especificos. para. esta. distribuci6n. Con muestreo censurado y tiempo de vida Weibull, de verosimilitud queda. 34. la funci6n.

(43) 13 L = (—) &B. l. ( K jeU. (3 i = (—) 9S. 13-1 Xj ) exp. ( n jeU. log L = I. (3-1 Xj ) exp. l o g 13 -. a — log L = 39. 113 9. -j I — log L = di3 13. Si 13 se especifica,. fl. [-. 1 (-) 9. 13 2 Xj ) e x p U. [-. 1 B n 13 (-) 2 Wj 9 j=l. I 13 l o g 9 + (13 - 1 ). 1 + S (-) 9. B+ 1. [-. 1 R (-) 9. a 2 Tj C. -. IB 0 ( - ) 2 Wj 9 j. ). ). 2 l o g Xj jeU. 13 2 Wj j. I log 9 + 2 l o g Xj jeU. -. 1 (-) 9. B. 13 2 Wj l o g j. Wj (—•) 9. el estimador de maxima verosimilitud de 9 lo. obtenemos explicitamente igualando a cero la primera ecuacion 1 9 = ( I. 13 i/8 2 Wj ) j. resultado que se podia haber obtenido teniendo en cuenta que si X tiene. una. distribucion. de. exponencial de parametro 9 s .. Weibull,. entonces. X6. sigue. una. Sustituyendo en la segunda derivada. e igualando a cero queda la siguiente ecuacion 13 I 2 Wj log Wj — + 2 log Xj - I = 0 13 U 2 WjG de Esta. la cual obtenemos el estimador de maxima verosimilitud de 13. ecuacion. no. contiene a 9 y se resuelve por el. 35. metodo. de.

(44) Newton-Raphson. unidimensional.. Como. valor. inicial. de. las. iteraciones se puede tonvar el valor de 6 obtenido graf icarnente, o simplemente. tomar. experimentalmente. Bo. que. =. 1,. ya. que. se. ha. con este valor converge casi. ecuaci6n.. 36. comprobado siempre. la.

(45) 3.- ESTIMADORES BAYESIANOS DE LA PIABILIDAD. 3.1. Interns. de. los ®6todog Bayesianos para el. estudio. de. la. fiabilidad.. Hemos. estudiado en el capitulo anterior tres estimadores no. parametricos. de. la. funcion. estimadores parametricos.. de. fiabilidad,. priori. En. que. fiabilidad. mismos. este tiene. el estudio de estimadores. que. son. tres. y si nos aportan alguna. apartado pretendemos explicar. Posteriormente. veremos. otros. La pregunta que surge de forma natural. es si son necesarios nuevos estimadores, ventaja.. y. el. interns. Bayesianos. de. a la. cuando obtengamos propiedades de los mejores en. muchos. aspectos. que. los. existentes actualmente. Lo que distingue fundamentalmente a la inferencia es. que. tiene. en. cuenta. explicitamente. informacion que se tenga a priori.. en. el. analisis. tiene en cuenta:. muestrales. El. la. En la inferencia clasica esta. informacion se considera solamente de manera informal, se. Bayesiana. si es que. El analisis se basa solamente en los. uso Bayesiano de la experiencia. pasada,. datos. que. se. cuantifica mediante la distribucion a priori, produce inferencias mas informativas en aquellos casos donde la distribucion a priori refleja acertadamente nuestra informaci6n sobre el parametro. Una. consecuencia. Bayesianos. requieren. conseguir. la. correspondientes. misma. de. lo. anterior. normalmente calidad. en. metodos cl&sicos.. es. menos datos las. que. los. metodos. muestrales. inferencias. que. En muchos casos esta es. para los una. motivaci6n pratica para utilizar metodos Bayesianos especialmente 37.

(46) en aquellas dreas de aplicacion, datos. como la fiabilidad,. muestrales son dificiles de obtener o. insistencia. creciente. son muy. donde. los. caros. La. en la relaci6n coste-efectividad. en. los. prograraas de estudio de fiabilidad, hace que normalmente no halla suficientes. recursos disponibles para obtener un tamafio muestral. compatible. con el grado de precision requerido para. fiabilidad con los m^todos clasicos. problemas. de. sistemas. que. ejemplo. un. escasez por. de. datos. naturaleza. reactor nuclear.. estiraar. De manera similar tendremos. cuando. estudiemos. deban ser muy. fiables. equipos como. Aqui el problema principal. tiempo que tiene que transcurrir hasta que se produzca un suficiente de falios. hard de. la. o. por. es. el. numero. Esta limitacion en el tamano de la muestra. que las estimaciones sean imprecisas o tengan un bajo nivel confianza.. La. aproximaci6n Bayesiana es mas. adecuada. para. estos casos. Por. otra parte es bien sabido que la mayoria de los avances. tecnologicos evoluci6n. no son procesos revolucionarios, sino mas bien. en. la. que los equipos. actuales. se. modifican. una para. mejorar. algunos aspectos o para adecuarlos a nuevas necesidades.. Podemos. poner. como. ejemplo la. evolucion. de. personales de las principales marcas del mercado.. los. ordenadores. En estos casos. es bastante razonable que lo que conocemos sobre la fiabilidad de los. equipos. calidad. de. actuales las. sea utilizado para. estimaciones. intentar. de la fiabilidad. de. mejorar los. la. nuevos. modelos. Los metodos clasicos son inadecuados para incorporar esa informacion, satisfactoria. mientras que los Bayesianos proporcionan una de. introducir esos conocimientos a traves. 38. forma de. la.

(47) distribucion informacion para. a priori. con. Mediante el teorema de Bayes unimos. la que nos proporciona los datos de la. esa. muestra. realizar la inferencia estadistica sobre los par&metros. de. interns. Adem£s de la informacidn proporcionada por equipos similares o anteriores, los ingenieros siempre suelen tener un conocimiento previo del problema y una opinion sobre el mismo. Es inconcebible que. se. disene. un sistema,. hecho. de. una. que. idea. esas. sobre. nociones. la. fiabilidad. del. personales. y de que cada ingeniero pueda no estar de acuerdo con. la. mismo. El. y no se tenga. cuantificacion de su conocimiento subjetivo no es. sean. una. raz6n. para desacreditar los procedimientos Bayesianos.. En este caso el. analisis. pueden. Bayesiano. diferentes opiniones. muestra. resultados a priori.. creencias similares,. hasta que punto se. segun las diferencias sostenidas En el caso de que varios ingenieros. obtener en. las. tengan. ese acuerdo servirci para confiar en que los. resultados de la inferencia ser&n correctos.. 3.2. Estimacidn Bayesiana. Sea. 9. el. parametro desconocido de. funci6n de densidad f(x),. una. distribucion. y q(9) la funcion de densidad a priori. que se supone que recoge toda la informacion disponible sobre parametro. 9 antes de observar los datos de la muestra.. (*) al resultado del experimento, caso. de censura tipo II,. muestreo L(9). censurado, etc.. con. (Wi,Ii),. el. Llamamos. esto es X( i > , ... , X(r) en el .... ,. (Wn,In) en. Sea L(9) la funcion de. caso. de. verosimilitud.. = % f(Xi|e) representa la informacion sobre el parametro 9 39.

(48) contenida. en la muestra.. posteriori. posteriori. El. teorema. esta. Sea q(6 j(*) ) la funcion de densidad de. Bayes. relacionado. establece que. el. con el modelo a priori. modelo y. con. a a la. funcidn de verosimilitud de la siguiente forma: L(6) q(6) q(6|(*)) = L(t) q(t) dt. Esta. densidad. a. posteriori. representa. una. modificaci6n. del. conocimiento subjetivo sobre 9, expresado por el modelo a priori, a. la vista de los datos muestrales observados.. apoyan. nuestra. opinion sobre 9,. modelo. a posteriori.. Si. estos. esta quedara reflejada. En caso contrario,. datos en. el. el modelo reflejar3 un. resultado ponderado de ambas valoraciones. Sea. 1(9,9). discrepancias. la. funcion. de. perdida. ,que. indica. entre el valor de 9 y el del estimador 6.. las. Vamos a. considerar dos tipos: li (9,9) = w(9) (9 - 9 ) 2 que es una funcion de perdida cuadratica con funcion peso w(9) > 0, y. donde ko,. 12 (8,8 ) = ko ( 8 - 8 ). si e - e > 0. = ki(9-9). si e - e < o. ki son constantes positivas. En caso de que ko = ki la. funci6n de perdida quedaria k |9 - 8|. En el caso de que ki > ko, le damos mas peso a una sobrestimacion del pardmetro.. 40.

(49) La valores. funcion. de. los. como. la. riesgo Bayesiano se define como el valor esperado de. la. de. la. de. p<§rdida es una v.a.. muestra.. que. Definimos funci6n de. depende riesgo. esperanza de la funcidn de p^rdida:. R(9,9) = E [ 1(6,9) 3 =. El. 1(9,9) L(9) dx. funcion de riesgo con respecto a la distribucidn a priori q(9):. El. r(q,9) =. q(t) {. estimador. Bayesiano. l(t,9) L(t) dx } dt. (3.1). optimo 9 es el que minimiza. el. riesgo. Bayesiano, esto es : r(q,9) < r(q,9). para cualquier otro estimador 9. Para obtener dicho estimador, orden. de. suponemos que se puede cambiar. integraci6n de (3.1),. con lo que el riesgo. el. Bayesiano. queda. r(q,9) =. f(x) {. l(t,9) q(t|<*)) dt } dx. donde. f(x) =. Por. tanto. L(t) q(t) dt. para. minimizar. el. riesgo. minimizar la integral. 41. Bayesiano. bastara. con.

(50) l(t,8) q ( t j o ) dt que. es. =. B(8). la esperanza de la funcion de perdida con respecto a. distribucion a posteriori, posteriori.. Vamos. la. y se conoce con el nombre de riesgo a. a obtener los estimadores Bayesianos. optimos. con las funciones de perdida indicadas anteriormente.. Teorema X.. Supongamos que. 0 <. Entonces. t* w(t) q(t|(*)) dt <. el. estimador. Bayesiano. optimo 8 con. respecto. a. la. funcion de perdida li es. t w(t) q(tj(*)) dt. w(t) q(t|(*)) dt. Demostraci6n. Tenemos. que demostrar que 8 minimiza a B(8). Para. tenemos. (t - 8) ( 8 - 8 ) w(t) q(t|(*> ) dt. 42. todo 8.

(51) (8 - 9). la. w(t) q(t| ( *)) dt. t w(t) q(t|(*)) dt - 9. primera igualdad es cierta porque 8 y 9 son estimadores y por. tanto. dependen. solamente de (*).. La segunda se. deduce. de. la. definicion de 9. Tenemos:. B(6) =. (t - 9 ) 2 w(t) q(t| ( *)) dt. (t - 8 + 8 - 8 ) 2 w(t) q(t|(*)) dt. (t - 8 ) 2 w(t) q(t|(* > ) dt +. (8 - 6 ) 2 w(t) q(t| ( *)) dt. (t - 8 ) 2 w(t) q(t| ( *)) dt. B(8). =. c.q.d. Considerando la funcion peso w(t) en su forma general, no es posible Bayesiano.. obtener. una. formula. Si tomamos w(t) = a,. explicita. para. el. estimador. entonces el estimador Bayesiano. es la media de la distribucion a posteriori:. 8 =. El. t q(t|(*) ) dt = E (8|(*) ). riesgo a posteriori asociado a este estimador,. es. riesgo a posteriori minimo es. B(8) = a. (t - 9 ) 2 q(t|(*> ) dt = a Var (8|(*) ). 43. decir. el.

(52) Teorema 2 Supongamos que. |t| w(t) q(t|(*) ) dt < oo. 0 <. Sea. 8. el. percentil. posteriori q(S|(*)).. 100. ko/(ko + ki). de. la. distribucion. a. Entonces 8 es el estimador Bayesiano 6ptimo. con respecto a la funci6n de perdida I2. Demostraci6n. Sea. 8 un estimador arbitrario de 9.. Si 8 > 8. para. muestra entonces 12(8,8) - 12(9,6) = k o. (8 - 8). Si 8 - 8 > 0. = ki (8 - 8). si 9 - 6 < 0. = ki(-8 + 8)-ko. (6-8). si e - e < 0 < e - e Por tanto. [ l2(t,8) - l2(t,9) ] q(t|(*) ) dt =. '8 ko (8 - 8 ). q(t|(*)) dt. q(t|(*> ) dt. +. q(t| ( *)) dt. [ki 8 + ko 8]. 44. -. 6 - q(tj(*)) dt 8. alguna.

(53) (ko. t q(t|(*> ) dt. + ki ). +. ki. (9 -. 8). q(t|(*)). dt (3.2). u t i l i z a n d o la desigualdad t q ( t | ( * > ) dt < 8. y. q(t|(*> ) dt. sumando las integrales entre 8 y 8 que aparecen en el. miembro. de la derecha de la igualdad (3.2) obtenemos que la suma de estas integrales es no negativa. Aun mas: De la definicidn de percentil se tiene que. ko. 6 q(t|(*)) dt >. q(t|(*> ) dt ko +ki. Esto. asegura que la suma de las restantes integrales en (3.2) es. tambien no negativa. Por tanto queda demostrado el teorema para 6 > 8. El caso 8 < 8 se demuestra de forma analoga. Observar que si. ko = ki,. es decir si la funcion de perdida. es 12 (8,8 ) = k |8 - 8| el. estimador. k > 0. que se obtiene es la mediana de la distribucion. a. posteriori.. Otros estimadores. Otro. estimador. Bayesiano. es el valor. 45. del. par£metro. que.

(54) maximiza. la distribucion a posteriori,. distribuci6n.. A este estimador,. estimador. de. maxima. estimador. puede. no. generalizado.. estimador. funci6n de p^rdida estandar,. esta. si existe se le suele llamar el. verosimilitud ser un. esto es la moda de. Bayesiano. Aunque. este. para. ninguna. es un estimador razonable,. pues es. una medida de posicion de la la distribucion a posteriori analoga a la media y la mediana.. 3.3.. Estimadores. Bayesianos de la fiabilidad con tiempo de vida. exponencial.. Vamos a obtener dos estimadores Bayesianos de la funcion fiabilidad. para. distribucion Suponemos. el. caso. exponencial. de que el tiempo. de. y el tipo de muestreo. vida sea. siga. de una. censurado.. que -A. = 1/8 sigue una distribucion a priori gamma. de. parametros a y p, con lo que la funcion de densidad sera aP. -aX e. q( X ) =. p-1 X. si. T(P) = 0 La. X> 0. resto. distribuci6n a priori de R = exp (- X) tiene como funcion. de. densidad aP s(r) =. a-1 p-1 r (-In r). si. 0 < r <1. T(P) = La. distribucion. 0. resto gamma es la mas utilizada como. 46. distribuci6n. a.

(55) priori del parametro -A- de una esponencial. Entre las razones que justifican versatilidad. su. uso est3n su fdcil tratamiento matematico,. disponible. par&metros a y p.. con. Como E.A. las distintas. elecciones. y. de. la los. = p/a y var js. = p/a2 la informaci6n. a priori sobre la localizaci6n y variabilidad de la tasa de fallo se. pueden. par&metros. tener a y p.. en cuenta para una elecci6n. adecuada. En el analisis que hagamos de los. de. los. resultados. consideraremos la posibilidad de que la informaci6n a priori. sea. correcta, y tambi^n de que nos lleve a infravalorar o sobrestimar la tasa de fallo. Por el teorema de Bayes, la distribuci6n a posteriori sera: L(r) s(r) q(r|(Wi,Ii), ... , (Wn,In) ) = q(r|W,I) =. ri L(r) s(r) dr , 0 Como vimos en el apartado 2.2.1. la funcion de verosimilitud para la distribuci6n exponencial es I L(r) = % f(Xj ) % [1 - F(tj)] jeU jeC. '1 L(r) s(r) dr .0. [1. aP. JO. r(p). =. aP. - W e. a-l+W p-l+I r (-In r) dr. r(p+I). F(p) (W+a)P+I. con lo que la distribucion a posteriori queda. 47. I W (-In r) r.

(56) (W+a)I+p. a+W-1 l+p-1 r (-In r). q(r|W,I) =. si. 0 < r < 1. r(I+p) 0 Para. resto. obtener el primer estimador Bayesiano,. consideramos constante.. funci6n Hemos. de. que llamaremos. perdida cuadratica. con. funci6n. R4, peso. visto en el apartado anterior que en este caso. el estimador es la esperanza de la distribucion a posteriori. Por tanto (W+a)I+P. 1 R 4 (a,p) =. r. a+W-1 r. 0. I+p-1 (-In r). dr. r(l+p) I+. W+a = (. P. ). W+a+1 El. riego. funcion. a. posteriori de este estimador. peso. igual. a. 1,. la varianza. es, de. la. considerando distribucion. la a. posteriori: B(R 4 ) = E (r2|W,I) - ( R 4 ) 2 = W+a (. I+. W+a. P. ). (. W+a+2 Aunque. la. I+. P. ). W+a+1. funci6n peso mas usual es la. que. hemos. considerado. nosotros, es posible tomar funciones peso de la forma -a Wa,e(r)=r. -13 {- I n r ). a > 0 , i 3 > 0. constantes. 0 < r < 1 que pueden tener interes para algun problema particular. A medida 48.

(57) que si. a crece le damos m3s peso a valores de r pr6ximos a cero, y B. aumenta,. podemos. fijar. a los valores de r pr6ximos a uno, a y e dependiendo de que. con. interese. lo. estudiar.. que La. funci6n W tiene forma de U. El estimador Bayesiano con esta funcidn peso sera. r w(r). q(r|W,I). dr. R = w(r). 1. q(r|W,I). 1-oc. dr. -13. r. (-In. r). W+a-1 r. I+p-1 (-In. r). dr. 0 1. -a r. -13 (-In. r). W+a-1 r. I+p-1 (-In. r). dr. 0. W+a-a (. I+P-B. W + a > a ,. ). I +. p - l 3 > 0. W+a+l-a. El estimador Bayesiano R4 se puede considerar un caso. particular. de este con a = 8 = 0. Para p > 1 otro estimador Bayesiano, puede. obtener. como. la moda de la. que llamaremos R5, se. distribucion. a. posteriori.. Maximizando la funcion de densidad de dicha distribucion tenemos:. I+P-1 R5. (a,p). = exp. (. si. ) W+a-1. resto. 49. W + a - l > 0.

(58) 3.4. Transformaci6n de los estimadores Bayesianos. Pretendemos. obtener la expasi6n asint6tica de la Esperanza,. Varianza y Error Cuadratico Medio de los estimadores R4 y Rs. Con las. expresiones. conseguir, sean. del. variables para. que. obtenidas. de. los. y de forma muy laboriosa, orden 0(n~ 2 ). I y W.. s61o. es. posible. que los terminos restantes. Los estimadores son. funciones. de. las. Vamos a realizar una serie de transformaciones. sean. transformaciones. mismos. funci6n nos. de. seran. la. variable. Y. tambien utiles. =. I/W.. para. Estas. demostrar. la. normalidad asintotica de los estimadores. Queremos demostrar que. R4 = exp(-Y) { 1 + (l/2nW) [-2p + Y (2a + 1). +. (l/2n 2 W 2 ) [p2 + p (2a + 1) - Y/3 (6a2 + 6a + 2 + 6ap 3p) + Y 2 /4 (4a2 + 4a + 1)] } + 0 P (n~ 3 ). La. definicion. de. 0P. (Rao (1973) 6 Serfling. (1981). +. (3.4.1). ). es. la. siguiente: "Sea sucesi6n para. {rn}. una. sucesion de numeros positivos y. de variables aleatorias.. {x n }. una. Decimos que Xn = 0 P (r n ). todo e > 0 existen Me y Ne tales que Pr [|Xn|/rn > Me] <. si 6. para n > Ne". Para la demostracion de la formula 3.4.1 necesitamos previamente algunos lemas. 50. probar.

(59) Lema 1. Sea. {r n } una. sucesion. de. numeros. positivos, y {Xn}. una. p. sucesion de v.a. tales que Xn/rn — > c , entonces Xn=0 P (r n ).. Demostracion. Sea c* tal que c* > c.. Entonces Pr (Xn/rn > c* •) = Pr (Xn/rn. c > c* - c) < Pr ( | Xn/rn - cj > c* - c). > 0. n-> a>. c . q. d.. Lema 2. I+P Sea A = I + p, y. X=. .. Entonces para j < k. W+a+1 X3. (n~k).. — = 0P Ak. Demostracion. I+p. I+p/n = _ W+a+1 W+(a+l)/n. Es obvio que. p. Eli 3» EWi. p. De forma que. XJ. > (EIi/EWip .. p. Ademas A/n. 3* Eli > 0 , de forma que. Por tanto X3. p • * -. (A/n) k. 3. Ell (. 1. ). EWi. (EIi) k. 51. (n/A) k. ^l/(EIi)k.

(60) De. la. definicion. de. (n _k ) se. 0P. obtiene. el. resultado. que. queriamos demostrar. Lema 3.. Para 0 < z < -J-. z - — 2. - — 3. - 2z4. se cumple. <. In (1-z). <. -z - — 2. - — 3. Demostraci6n. Llamemos. Hi(z) = l n ( l - z ). Tenemos que Hi(0 ) = 0 Hi'(z). ,. i = 0,1. y. = - ( 1 - z ) " 1 + 1 + z + z2 + 8 i z 3 = - z 3 / ( l - z) + 8 i z 3. Por. z2 z3 + z + — + — + 2iz* 2 3. = - z3 - z4 -. (-z3 + 8iz3. =. . . . + 8iz3. - 8iz4)/.(l. - z). tanto Ho'(z). = - z 3 / ( l - z) < 0. Hi'(z). = (7z3 - 8 z 3 ) / ( l. - z). = z 3 (7 - 8 z ) / ( l para 0 < z < l. - z) > 0 c.q.d.. Lema 4. Sea z = x / a ; Q i ( x , a ). x2 x3 2ix4 = - — 2a 3a 2 a3. 52. ,. i = 0,1.

(61) entonces exp(-x) exp(Qi(x,a)) < (1 - z) a < exp(-x) exp(Qo(x,a)).. Demostracion Multiplicando anterior. por. a,. ambos y. miembros. tomando. de la desigualdad. exponenciales. se. del. obtiene. lema este. resultado. Llamando Z = X/A,. siendo X y A las expresiones definidas en. el lema 2 ,tenemos que Z = (W + a + l)-i. y. R4 = (1 - Z) A Definimos R4* = R4. si Z < 1. = exp(- X) exp (Qi(X,A)). si Z > ±. Obviamente tenemos exp (- X) exp (Qi(X,A)) < R4 * <. exp (- X) exp (Qo(X,A)). (3.4.2). Lema 5. Con la definicion de R4* dada anteriormente, se tiene que: R4 = R4* + Op (n~k). para cualquier k natural.. Demostraci6n. R4 - R4* = 0. si Z < i. = (1 - Z) A - exp (- X) exp (Qi(X,A)). 53. si Z > ±.

(62) Basta con demostrar que nk (R4 - R4* ). p. 5* 0. cuando n — > ». Sea e > 0. Entonces Pr( nk (R4 - R4 * ) > e ) = Pr (n* ( (1 - Z)A - exp (- X) exp (Qi(X,A))) > e, Z > * ) < Pr (Z > i) = Pr (W + a + 1 < 2) Demostraremos lugar. que esta probabilidad converge a cero.. observemos. negativas min(Xi,. que. si Xi , Ti. son. y absolutamente continuas, Ti). es. tambien una v.a.. v.a.. En. primer. independientes. no. la variable aleatoria Wi =. no negativa. y. absolutamente. continua. Por tanto existe T > 0 tal que 1 > Pr(Wi > x) = v > 0. Tomemos c > 0 y definimos Wj*. - x. siWj. > x. =0. en caso contrario. n n forma la desigualdad S Wj* > c implica E Wj > c y por 1 1 n n n tanto Pr ( 2 Wj* > c) < Pr( S Wj > c). El suceso { S Wj* > c } 1 1 1. De. esta. ocurre iguales. si. al menos [C/T] + 1 valores de. .... , Wn*. son. a x. Se deduce por tanto que. n Pr(SWj*>c)= 1. n n k 2 ( ) v k=[c/T]+l k. n Pr ( E Wj* < c) = 1 Debido. Wi *,. a. la. forma. n. [C/T]. S k=0 de. la. (. k ) v. n-k (1-v). o bien. n-k (1-v). k distribuci6n. 54. binomial,. para. n.

(63) suficientemente grande, el mayor sumando de la ultima igualdad es el correspondiente al indice k = [C/T] y por tanto n e n [C/T] n-[c/x] Pr ( E Wj* < c) = [-] ( ) v (1 - v) 1 T [C/T] c v [C/T] n(n-l) ... (n-[c/T]+l) [_] ( ) T. 1-v. [C/T] ( [ C / T ] - 1 ) .... 1. n. [C/T]. const - n. n (1 - v) <. (1-v). > 0 . Por tanto n —><». Pr(W < c) —=> 0. c.q.d.. Lema 6. Qi. Qo 2. = - X2/2A. (X,A). (X,A). = Op. + 0P. (n-2). i. = 0,. 1. (n-2). Demostracion. Es inmediata a partir de los lemas anteriores.. Lema 1_. R4 = exp (- X) (1 - X2/2A + 0P (n~2) ). Demostracion. De. la. desigualdad de Hardy-Littlewood-Polya se 55. tiene. que.

(64) para x < 0 1 + x < exp(x) < l + x + x 2 / 2 Utilizando esta desigualdad, la de la fdrmula (3.4.2) y los lemas anteriores se obtiene el resultado de este lema. Teorema 1 Con las definiciones establecidas anteriormente, se tiene: R4 = exp(-Y) { 1 + (l/2nW) [~2p + Y (2a + 1)] } +. 0P (n~2). Demostraci6n I+p X = W+a+1. I+p/n. l+p/(nl). = _ = Y _ W+(a+l)/n l+(a+l)/(nW). ya que Y = I/W = I/W _2 [1 + (a+l)/nW]-i = 1 - [(a+l)/nW] + [(a+l)/nW] _. _3. _2oo. C(a+l)/nW] + ... = 1 - [(a+l)/nW] + [(a+l)/nW]. _ j. S [-(a+l)/nW] j=0. _ 2 _ -1 = 1 - [(a+l)/nW] + [(a+l)/nW] [1 + (a+l)/nW] 1 - [(a+l)/nW] + 0P (n-2) _. p. ya que. C(a+1)/W] —.x> (a+l)/EWi. y. P [1 +(a+l)/nW]"1 —-> 1 . Por tanto. X = Y (1 + p/nl) [1 - (a+l)/nW] + 0P (n"2) = Y [l+~p/nl - (a+l)/nW] + 0P (n~2) Utilizando la desigualdad HLP mencionada anteriormente, tenemos. 56.

(65) exp (- X) = exp (- Y) exp {- Y [p/nl - (a+l)/nW ] + 0P (n"2) } = exp (- Y) [1 + Y ((a+l)/nW - p/nl) ] + 0P (n~2) Por otra parte X 2 /A. = (I+p)/(W+a+l)2 =. Por. T/nW2 + 0 P. ]2. = (I + p / n ) / n [ W+(a+l)/n. (n-2). tanto. R4 = exp ( - Y) [ 1 + Y ( ( a + l ) / n W - p / n l ) =. exp(-Y). { 1 + (l/2nW). ] [ 1 - I / 2 n W 2 ] + 0P. [ - 2 p + Y (2a + 1 ) ]. }. +. 0P. (n~2). (n~2) c.q.d.. Nota. La formula 3.4.1 tiene un termino mas en el desarrollo de IU que. la. utilizan. de. este teorema.. En la demostracion. los cuatro primeros lemas vistos aqui,. de. la. misma. se. y para el resto. de la demostracion las ideas son similares. Como los calculos son bastante mas laboriosos, se ha dejado para el apendice 1. Las. transformaciones que hay que realizar para el estimador. Rs son mas sencillas. Vienen dadas por el siguiente teorema. Teorema 2. Con las definiciones establecidas anteriormente, se tiene: R5 = exp (-Y) {1 + (1/nW) [~p + 1 + Y(a - 1)3 +. 57.

(66) (l/2n 2 W 2 ) C(p - l)(2a + p -3) - 2Y(a - l)(a + p - 2) + Y 2 (a 2 - 2a + 1) ] }. +. 0 P (n~3 ). Demostracion. I+p-1 =. I/W. W+a-1 Por. l+(p-l)/nl _ l+(a-l)/nW. un razonamiento analogo al realizado en la demostracion. del. teorema 1, tenemos que [ 1 + (a-l)/nW ]-i = 1 - (a-l)/nW + C(a-l)/nW]2 + 0 P (n~ 3 ) Sustituyendo I+P-1 = Y [1 + (p-l)/nl ] [1 - (a-l)/nW + (a-l) 2 /n 2 W 2. ] +. W+a-1 0P. (n-3). =. Y + (1/nW) [p-1 - Y(a-l) ]. +. (l/n 2 W 2 ) [(a-l)2Y - (p-l)(a-l) ] + 0 P (n" 3 ) Teniendo. en. cuenta que W + a - 1 > 0,. y que. p. >. 1,. podemos. aplicar la desigualdad LHP: 1 + x + x 2 /2 + x 3 /3! < exp(x) < 1 + x + x 2 /2 que es valida para cualquier x < 0. Por tanto llamando X a (1/nW) [p-1 - Y(a-l) ]. + (l/n 2 W 2 ) [(a-l)2Y - (p-l)(a-l) ]. tenemos que. 58.

(67) X2 = (l/n2W2) [p-1 - Y(a-l) lz. +. Op (n-3). X3 = 0P (n- 3 ) Aplicando. estos. resultados. y. simplificando,. obtenemos. la. expresion de Rs.. 3.5. Expansi6n. asint6tica. de la. Esperanza,. Varianza. y. Error. Cuadr£tico Medio del estimador R4.. Para. la expansion asintotica de momentos de los estimadores. R4 y R5 utilizaremos como herramienta de analisis el teorema 5 de Hurt (1986), cuyo enunciado escribimos a continuacion:. Teorema 1. Sea. {X(t)}teT. un proceso estocastico r-dimensional y. g =. g(x,t) una funcion real definida en Rr x T. Supongamos que a). Para todo teT g es (q+1) veces totalmente. diferenciable. con respecto a las x±s en el intervalo r K = % [Si - 6, 9i + 8] i=l donde. 8. > 0 es independiente de t y 8 = (81,. ...,. 6r). es. vector parametro, b) Existen enteros p,u, p > q+1, 0 < u < p tales que max i<i<r E |Xi (t) - 8i j«+ 1 |g(x,t)|. < Ci. + C2. S. max i < i < r para todo xeRr,. E |X± ( t ). )Xi|u. - 8i JP. t e T , donde Ci y C2 s o n i n d e p e n d i e n t e s de x y t , 59. un.

(68) c). Todas. las. derivadas. de g hasta. el. orden. q+1. est&n. acotadas en K x T. Llamando 3. 3. mi. mr. D g(mi , ... , ir; B) s ( 3 g / dYi. . • -dYr. ) y= e. q+1 si. max 1 <± < r. E |Xi(t). - 6± I. q. 5=~ 0. c u a n d o t —>• to. 1. entonces. J. E g ( X ( t ) , t ) = g ( 8 , t ) + 2 — j =l j !. 2 ... 2 D g(mi, mi + . . . + m r = j. .... ,. rar;. 9). mi , . . . , m r >0 mi E(Xi(t). - 6). mr .... (Xr(t). - 8). q+1 + 0. (maxi<i<r. E IXi(t). - 9i I. ). q+2 si. max i <i < r. var. (g(X(t),t). q 2. q 2. E |Xi(t). - 8i |. s> 0. c u a n d o t — > to. =. i 2. j = l k=l. entonces. j!k!. .... 2. 2. .... j D g ( m i , . . . , m r ; 8 ) -. 2. mi + . . . + m r = j m + . . . + n r = k m i , . . . , m r >0 m + . . . + n r >0. k. mi. D g(m,. .... , nr ; 8) cov [ ( X i ( t ) - 8i ) ni. (Xi(t). - 9i ). mr. . . . (Xr ( t ) - 8r ). nr .... (Xr(t). - 8r ). ] + 0 (maxi<i<r. E | Xi ( t ). Utilizando este teorema obtendremos la expansion de. la. esperanza,. varianza y error cuadr&tico medio. hacer. suponiendo. que las distribuciones de fallo 60. - 8i |. q+2 ). asintotica (ECM) del. estimador R4 con terminos en el resto de orden 0 (n - 3 ). a. ,. Lo vamos y. censura.

(69) esten relacionadas segun el modelo de tasa de fallo proporcional, que. en nuestro caso implica que la distribucion de. tambien. exponencial.. En. este. modelo. Wj. =. censura. min. sea. (Xj,Tj). se. y a los parametros de las distribuciones de tiempo. de. distribuye exponencialmente con parametro S que cumple 1/8 = 1/9 + 1/cr siendo. 8. vida y censura respectivamente. Necesitamos Ij 8/8. de. es una v.a.. calcular los momentos de I , 1/W. e. Y. =. I/W.. que toma los valores cero-uno con Pr (Ij = 1). =. Por tanto I = Ii + ... + In sigue una distribucion Binomial parametros n y 8/8.. Sus tres primeros momentos. respecto. al. origen son: E I = n 8/8 E I2 = n (n-1) (6/8) 2 + n 6/8 E I3 = n (n-1) (n-2) (8/8) 3 + 3n (n-1) (8/8) 2 + n (8/8) W = Wi + .... + W n sigue una distribucion Gamma de parametros n y. 8, por lo que E W - k existe para k < n y -k. co. E W. -k. (l/8) n. x 0. -x/8 n-1 e x dx. =. r(n). -k 8. r(n-k) r(n). En particular, E W"1 = [8 (n-1)]" 1 E W-2 = [S2 (n-1) (n-2)]" 1 E W-3 = [83 (n-1) (n-2) (n-3)]" 1 Teniendo. en cuenta la independencia de I y W, 61. y realizando. las.

Referencias

Documento similar

La moral especial (o institucional, la M de G ARZÓN ) parece ofrecer de- masiados pretextos; terminaría por justificar cualquier tipo de acción requerida por ra- zones

Proporcione esta nota de seguridad y las copias de la versión para pacientes junto con el documento Preguntas frecuentes sobre contraindicaciones y

El tercero tiene notas bajas pero la mayor es estadística, una de las temáticas trabajadas de forma más mecánica, asimismo el último arquetipo muestra que, aun con notas buenas,

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

diabetes, chronic respiratory disease and cancer) targeted in the Global Action Plan on NCDs as well as other noncommunicable conditions of particular concern in the European

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

o Si dispone en su establecimiento de alguna silla de ruedas Jazz S50 o 708D cuyo nº de serie figura en el anexo 1 de esta nota informativa, consulte la nota de aviso de la

 Tejidos de origen humano o sus derivados que sean inviables o hayan sido transformados en inviables con una función accesoria..  Células de origen humano o sus derivados que