Estimación de la solución de Ecuación (5.12)

Para hallar la estimación



ˆ , primero se estudia qué sucede con el denominador de la expresión (5.11) y también el del segundo término en la ecuación (5.10). La función ( , ) ( ) ( ) 1 (1 ( )) h Y h h

 



    resulta

numéricamente no calculable cuando



toma valores muy grandes en valor absoluto ya que, por ejemplo, S-plus asigna el valor 1 a

( )



, cuando



9

y Excel, en cambio, lo hace cuando



6

Para el problema que se está estudiando, esta función será evaluada para



6

. Así es como se la trabajará en los programas que requieran su cálculo.

Retomando el problema en que se anula el denominador en las expresiones (5.12) y (5.13), se tiene que:

( , )

( )

(

( )

)

0

1 ( )

h

Y h

K

h

 

 



 



 

, (5.16) o equivalentemente, ( ) ( ) K

 

   

  

, o sea, g K( , )



K

    

( )  ( )0. (5.17) Se observa que en la primera ecuación si



existe, resultará menor que cero ya que la función Y h( , )



es positiva. Sin embargo, esta función no es continua en toda la recta y para evaluarla numéricamente resultará inestable cuando la FDA N(0,1) está próxima a 1. Por esta razón, se obtuvo la función g K( , )



que es más sencilla de calcular. Luego, se hallan posibles ceros de la función g K( , )



, tal que



6

. La ecuación (5.17) es no lineal en



, de modo que será resuelta numéricamente utilizando el método de bisección para cada valor de

K

dado.

No se puede escribir g K( , )



en términos de funciones “elementales” como polinomios, seno, coseno, etc., ya que está involucrada la FDA

(0,1)

N , la cual puede ser obtenida fácilmente desde varios softwares. Se puede observar que

g K( , )

es una función continua y derivable, cuya derivada primera es la siguiente:

´( , ) ´( ) 1 ( ) ( ) ( ) 1 ( ) ( ) ( 1) ( ) 1 ( ) g K



K

 

 

  

  K

 

 

  

   K

 

 



donde 2 2 ´( ) ( ) 2 e 



 

 



     .

Recordando que se llamó K c n

 , o sea el cociente entre el número de observaciones censuradas y de observaciones completas. Si se

considera, de acuerdo a la notación,

p

n

N



la razón de censura, entonces: K (1 p N)

1

p N

p

  



De lo anterior puede verse que los valores de K son independientes del tamaño de muestra. Los valores de K mayores que 1 indican un mayor número de observaciones censuradas en relación a las completas.

Interesa analizar los ceros de la función ( , )g K  , la cual tiene las siguientes propiedades:

1. g K´( , )



0, si



0

, ya que resulta (K1)

 

( )0 y 1 ( )



0, por lo tanto la función

g K( , )

es creciente si



0

( , 0)

(0)

0

2 K

g K

K







3. Si



0

,g K( , )



K

  

( ) (1( ))



0, porque cada sumando de

( , )

g K



lo es.

De estas tres condiciones se infiere que la función g K( , )



, si tiene un cero, debe ser un valor negativo, como ya se había notado.

Para ver que g K( , )



, en efecto tiene un cero, basta probar que esta función toma un valor negativo, para algún 0, ya que como se trata de una función continua, el Teorema del Valor Medio asegura que la función tomará todos los valores comprendidos entre dicho valor negativo y ₀

  , y por lo tanto deberá pasar por cero.

Dado que K es menor o igual que 9 para todo p mayor o igual que 0.1, resulta,

( , 2) ( 2) 2(1 ( 2)) 0.9772499 1.9545 9*0.9772499 1.9545 -1.468581

g K  K      K    

Por lo tanto, cualquiera sea el valor de la constante 0K9 , la función g K( , )



siempre toma un valor negativo en -2, lo que indica que existe un cero que pertenece al intervalo

( 2, 0)

Para hallar este cero de la función en

g K( , )

y teniendo en cuenta que

g K( , 2) 0

, se desarrolló un programa, para cada valor de K fijo, que permite aproximar la raíz de

g K( , )

con la precisión que se desee. Este programa está basado Teorema del Valor Medio y utiliza el método de bisección y se ha elegido un error 7

10 e

 . El método tiene un orden de convergencia lineal pero es muy rápido para encontrar la raíz de

g K( , )

, para cada K fijo.

Utilizando el programa 5.1 que se encuentra en Apéndice 2, se obtuvo Tabla 5.2.1 que presenta el valor del cero de la función g K( , )



para algunos valores de p y de K.

Tabla 5.2.1

Valor de p Valor de K Cero hallado

0.1 9 -1.420187 0.2 4 -1.061516 0.3 7/3 -0.8189452 0.4 3/2 -0.6516243 0.5 1 -0.5060548 0.6 2/3 -0.3813478 0.7 3/7 -0.271502 0.8 1/4 -0.1728157 0.9 1/9 -0.08287959

Volviendo ahora al problema inicial planteado en Ecuación (5.12), hay que encontrar



tal que resulte un cero de la función que se llamará, 2 2 2

1 ( , )( ( , )

)

( , )

(

)

( ( , )

)

s

Y h

f h

x

T

Y h



 



 











. (5.18) Siendo  T   

 , donde



y  son los parámetros desconocidos que se desea estimar.

Según lo visto, esta función no está definida en los valores indicados en Tabla 5.2.1 para el correspondiente valor de K. Cerca de dichos valores la función toma valores grandes.

La función f h( , )



es continua fuera de un intervalo alrededor de los puntos señalados en Tabla 5.2.1.

Se desarrollaron dos programas para encontrar el valor de



, cero de

)

,

(h

f

, uno por el ya mencionado método de bisección y otro por el método de la secante, que permite llegar en general a la estimación de la raíz más rápido que por el método de bisección, siendo en general su convergencia de orden cuadrático.

El método de la secante es muy similar al conocido método de Newton- Raphson, sólo que en lugar de tomar la pendiente de la recta tangente toma la de la recta secante, de allí su nombre. En efecto, para obtener el valor de

x

tal que ( ) 0f x  , a partir de dos valores iniciales

x

_o y

x

₁, se genera una sucesión x x₂, ₃, ,_ x_n_₁ y se define:

1 1 2 1 1 2

(

)(

)

(

)

(

)

n n n n n n n

f x

x

f x

     







La ventaja del método de la secante sobre el de Newton-Raphson es que no es necesario evaluar la derivada de la función f x( ), que en el caso de la función (5.18) es complicado de obtener. Su ventaja sobre el método de bisección es que la sucesión, si converge, lo hace más rápidamente requiriendo menos iteraciones para hallar la solución con la misma precisión.

Generalmente, tanto el método de la secante como el de Newton- Raphson se emplean para refinar una primera aproximación obtenida con otras técnicas, como bisección.

El problema fundamental en cualquiera de los métodos numéricos es partir de valores iniciales adecuados. En general tanto en el método de bisección como en el de la secante, de acuerdo a la definición de dichos métodos, se requiere partir de dos valores iniciales distintos. Como en cualquier problema numérico, si los puntos no se eligen correctamente la sucesión puede no converger o puede converger a valores que pueden no resultar los ceros buscados.

Un teorema (Burden and Faires, 1985) asegura que si 2

( )

C [ , ]

f x



a b

[a,b]

p

es tal que

f p( )0

f´( )p

0

, entonces existe un



0 tal que el método de Newton-Raphson (y el de la secante) genera una sucesión

(p

_{i i}

)

que converge a p para cualquier aproximación inicial

[p- ,p+ ]

Para evitar verificar estas hipótesis en el caso de la función (5.18), es recomendable para resolver un problema particular, emplear el método de bisección o bien iniciar una sucesión por bisección y luego pasar a secante.

Se propone tomar como uno de los puntos iniciales de la sucesión, la estimación de  dada en (5.19), ˆ ˆ_´ ˆ T T x s        , (5.19)

que ya se observó resulta siempre positivo. Si el otro valor inicial es tal que resulta muy próximo al cero del denominador según la razón de censura que se tenga, la sucesión diverge o puede converger a mínimos locales que no resultan ceros de la función en estudio. Lo mismo sucede si, a partir de un cierto valor inicial, la sucesión es tal que en algún paso se obtienen valores cercanos al cero.

Se elaboró un programa de bisección el cual, tal como se indicó anteriormente, se recomienda emplear para hallar la solución buscada o bien para obtener aproximaciones iniciales para luego pasar al programa de la secante. En la presente tesis, se utilizará en general el primer método, ya que asegura que si converge lo hace al cero de la función buscada.

También se elaboró un programa que calcula las estimaciones de máxima verosimilitud para una muestra dada, con censura simple a la derecha de tipo II o de tipo I. En este último caso, se debe dar además un valor inicial adicional que es el valor de censura fijo T (programa 5.4.2).

Como h es la proporción de observaciones censuradas, ésta es siempre es positiva. Luego, si por haber partido de un valor inicial no apropiado se obtiene un valor de

h

que es negativo o si se está muy cerca de los puntos de discontinuidad del denominador, el procedimiento devuelve un mensaje de error e incluye una condición de parada si no se llega a la solución con una precisión establecida previamente en 10-7_.

Para los programas mencionados, se debe dar sólo un valor inicial ya que la estimación indicada en (5.19) es calculada dentro del programa.

problema práctico en particular, se desarrolló el programa 5.5 que se encuentra en Apéndice 2, el cual que no necesita un valor inicial. Dicho programa calcula las estimaciones de máxima verosimilitud para una muestra censurada de tipo II proveniente de una distribución normal, mediante bisección y utiliza distintos valores entre una sucesión de valores iniciales (grilla) hasta encontrar el que asegura la convergencia. Este programa puede utilizarse tanto para muestras con censura como completas, de cualquier tamaño y poseer cualquier proporción de observaciones censuradas, por lo que resulta ser muy general. En el caso de que no haya observaciones censuradas, este programa simplemente devuelve las estimaciones de máxima verosimilitud usuales para muestra completas dadas en (4.1).

Como los estimadores han sido deducidos para el caso de una muestra normal, para muestras de distribuciones que no son normales con censura a la derecha, el programa puede no converger. Esta situación está considerada dentro del programa, en cuyo caso señala un mensaje de error.

In document Tests de bondad de ajuste basados en la distribución empírica para datos con y sin censura (página 91-97)