Prueba de bondad de ajuste para la distribución pareto, basada en la información de Kullback-Leibler

(1)

COLEGIO DE POSTGRADUADOS

INSTITUCIÓN DE ENSEÑANZA E INVESTIGACIÓN EN CIENCIAS AGRÍCOLAS

CAMPUS MONTECILLO

POSTGRADO DE SOCIOECONOMÍA, ESTADÍSTICA E INFORMÁTICA ESTADÍSTICA

PRUEBA DE BONDAD DE AJUSTE PARA LA

DISTRIBUCIÓN PARETO, BASADA EN LA

INFORMACIÓN DE KULLBACK-LEIBLER

ANA CELIA LUQUE GUERRERO

T E S I S

PRESENTADA COMO REQUISITO PARCIAL

PARA OBTENER EL GRADO

DOCTOR EN CIENCIAS

MONTECILLO, TEXCOCO, ESTADO DE MÉXICO

(2)

RESUMEN

PRUEBA DE BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN PARETO,

BASADA EN LA INFORMACIÓN DE KULLBACK-LEIBLER

Ana Celia Luque Guerrero, Dr.

Colegio de Postgraduados, 2007

En este trabajo se presenta una prueba de bondad de ajuste para la distribución Pareto basada en la información de discriminación de Kullback-Leibler (1951) propuesta por Sheng Song (2002). Considerando que la distribución Pareto, no presenta el parámetro de escala, se aplicó la transformación logaritmo a esta distribución obteniendo como resultado la distribución Exponencial de dos parámetros, la cual es una distribución de localización y escala (Lehman y Casella, 1998). Se comprobó que la estadística de prueba de Kullback-Leibler es invariante. Se aplicó la metodología que propone Song, la cual se basa en los espacios m’ésimos entre estadísticas de orden validados por la log verosimilitud. El cálculo de m se obtuvo a través de Simulación Monte Carlo . También mediante un experimento de Simulación Monte Carlo se calculó el poder de la prueba de Kullback-Leibler propuesta, la cual se comparó con el poder de la prueba de bondad de ajuste de Kolmogorov-Smirnov considerando las distribuciones, Lognormal, Weibull y Gamma como alternativas a la distribución Pareto. Con respecto al tamaño de la prueba, los resultados obtenidos por medio de simulación son muy parecidos a los valores α que se consideraron, confirmando que la prueba trabaja adecuadamente. Como conclusión más importante, se observó que la prueba de Kullback-Leibler resultó ser más poderosa que la prueba de Kolmogorov-Smirnov. Todos los cálculos se hicieron en lenguaje R.

(3)

ABSTRACT

GOODNESS-OF-FIT TEST FOR PARETO DISTRIBUTION, BASED ON

KULLBACK-LEIBLER INFORMATION

Ana Celia Luque Guerrero, Dr.

Colegio de Postgraduados, 2007

This paper presents a goodness-of-fit test for Pareto distribution based on the Kullback-Leibler (1951) discrimination information, as proposed by Sheng Song (2002). By considering the fact that Pareto distribution does not present the scale parameter, the logarithm transformation was used. As a result, a exponential distribution with location parameter was obtained, which is a localization and scale distribution (Lehman and Casella, 1998). It was proven that Kulback-Leibler test statistic is invariant. The methodology proposed by Song was used, which is based on mth-order spaces among order statistics validated by loglikelihood. The calculus of m was obtained through Monte Carlo Simulation. Additionally, the power of the proposed Kullback-Leibler test was also estimated. This was then compared to the Kolmogorov-Smirnov goodness-of-fit test by considering the Lognormal, Weibull and Gamma distributions as alternatives to Pareto distribution. With regard to the size of the test, the results obtained are quite similar to the

α values considered. This confirmed the adequate function of the test. It was observed, as the most remarkable conclusion, that the Kullback-Leibler test was more powerful that the Kolmogorov-Smirnov one

.

(4)

DEDICATORIA

A MIS PADRES

BLAS LUQUE Y CELIA GUERRERO, quienes con su gran ejemplo y apoyo

me impulsaron constantemente con mucho amor, motivando mi superación.

Papi, sintiendo siempre tu presencia y tu protección desde cualquier lugar que te encuentres. Con mis mejores recuerdos para ti…- Siempre conmigo, siempre contigo-

A MI ESPOSO

LOMBARDO, mi compañero y amigo. Afortunadamente tuve y tengo la dicha de recorrer este camino y lo hago contigo, compartiendo momentos difíciles y muchos otros más, felices y gratificanes.

A MIS HIJAS

(5)

AGRADECIMIENTOS

Alcanzar el objetivo de obtener un Doctorado en Ciencias es el mejor momento para dar las Gracias a todas las personas que me apoyaron y me ayudaron a través de estos años satisfactorios, pero también difíciles.

En primer lugar, expreso mi agradecimiento y reconocimiento al Dr. Humberto Vaquera Huerta, por su claridad, interés y entusiasmo, que orientó y motivó en todo momento mi proceso formativo; desde mi ingreso al doctorado hasta la dirección de esta tesis; investigación que presento con gran satisfacción y que complementa de manera importante mi formación como Estadística.

Agradezco de manera sensible a uno de los profesores que más he admirado desde que conocí el mundo de la Estadística, al Dr. Ignacio Méndez Ramírez, quien junto con su esposa Lupita me han brindado el privilegio de su amistad, e innumerables atenciones que motivaron mi pasión por el conocimiento estadístico.

A mis asesores Dr. Gilberto Rendón Sánchez, Dr. Vicente González Romero y Dr. Enrique Villa Diharce, por compartir conmigo su experiencia, sabiduría y fraterna compañia.

A mis sinodales Dr. Sergio Pérez Elizalde y Dr. David del Valle Paniagua, de quienes siempre recibí respaldo y atenciones como estudiante, y en la última parte de mi tesis, por sus sugerencias, de gran valor.

A todos mis profesores del Instituto de Socioeconomía, Estadística e Informática Estadística del Colegio de Postgraduados, por su gran apoyo y enseñanza comprometida.

A todo el personal del Instituto de Socioeconomía, Estadística e Informática Estadística del Colegio de Postgraduados por su gran comprensión y sincera amistad.

A las autoridades del Instituto Politécnico Nacional en especial al Dr. Enrique Villa Rivera, Director General del I.P.N., visionario que en todo momento impulsa y alienta la superación académica de todo el personal del Instituto.

Al Dr. Luis Humberto Fabila Castillo, Secretario de Investigación y Postgrado del I.P.N, por su respaldo y motivación para seguir adelante, hasta culminar exitosamente esta etapa.

Al Dr. Adrián Luis García García, ex Director del CICATA, Unidad Querétaro, quien alentó y apoyo en todo momento mi proceso formativo.

(6)

A mis compañeros del CICATA Unidad Querétaro, por su amistad y apoyo solidario.

Al Comité Técnico de Prestaciones a Becarios del IPN (COTEPABE), a la Comisión de Operación y Fomento de Actividades Académicas del IPN (COFAA), y al CONACyT, por el importante apoyo complementario que recibí, a través de permisos, beca y reconocimiento de mis estudios.

A mis compañeros de estudios tanto de Maestría como de Doctorado de Estadística, con quienes compartí muchos momentos especiales y emotivos. Mi especial agradecimiento a Paulino Pérez Rodríguez y a Hortensia Reyes Cervantes.

A todos los amigos con quienes tuve oportunidad de estudiar y convivir durante este tiempo. Gracias

(7)

CONTENIDO

1. INTRODUCCIÓN ... 1

2. OBJETIVOS ... 4

3. MARCO TEÓRICO ... 5

3.1 DISTRIBUCIÓN PARETO ... 5

3.1.1 REGLA 80/20 ... 5

3.1.2 DEFINICIÓN DE LA DISTRIBUCIÓN PARETO ... 6

3.1.3 ESTIMADORES DE MÁXIMA VEROSIMILITUD DE LA DISTRIBUCIÓN PARETO ... 8

3.1.4 OTRAS APLICACIONES DE LA DISTRIBUCIÓN PARETO ... 9

3.2 CONCEPTOS DE LA TEORÍA DE LA INFORMACIÓN ... 9

3.2.1ENTROPÍA ... 10

3.2.2MEDIDAS DE ENTROPÍA ... 10

3.2.3UNIDADES DE ENTROPÍA ... 11

3.2.4ENTROPÍA DE SHANNON PARA UNA VARIABLE CONTINUA ... 12

3.2.5ESTIMADOR NO PARAMÉTRICO DE ENTROPÍA ... 12

3.3DISCREPANCIA INTRÍNSECA ... 13

3.3.1MEDIDA DE DIVERGENCIA. DIVERGENCIA DE KULLBACK-LEIBLER ... 13

3.3.2LA ENTROPÍA Y LA DIVERGENCIA DE KULLBACK-LEIBLER ... 14

3.4 PODER O POTENCIA DE UNA PRUEBA... 14

3.5 PRUEBA DE HIPÓTESIS Y TAMAÑO DE LA PRUEBA... 15

4. PRUEBA DE BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN PARETO, BASADA EN LA INFORMACIÓN DE KULLBACK-LEIBLER ... 17

4.1PLANTEAMIENTO DEL PROBLEMA ... 17

4.2TRANSFORMACIÓN DE LA DISTRIBUCIÓN PARETO ... 17

4.3CONSTRUCCIÓN DE LA PRUEBA ... 18

4.4.IMPLEMENTACIÓN DE LA PRUEBA ... 19

5.ESTIMACIÓNDELPODERDELAPRUEBA ... 21

5.1DISTRIBUCIÓN EMPÍRICA DEL ESTADÍSTICO DE PRUEBA DE KULLBACK-LEIBLER ... 21

5.2ESTIMACIÓN DEL PODER DE LA PRUEBA. ... 22

5.3PRUEBA DE KULLBACK-LEIBLER CON LAS DISTRIBUCIONES ALTERNATIVAS ... 22

5.3.1VALORES CRÍTICOS ... 23

5.4PRUEBA DE KOLMOGOROV-SMIRNOV ... 25

6.EJEMPLOSDEAPLICACIÓNDELAPRUEBADEKULLBACK-LEIBLER ... 27

7.DISCUSIÓN DE LOS RESULTADOS ... 28

8.CONCLUSIONES ... 30

9. LITERATURA CITADA ... 31

ANEXOS ... 34

ANEXO A PROGRAMA EN R PARA REALIZAR LA PRUEBA DE BONDAD DE AJUSTE ... 34

ANEXO B TABLAS VALORES CRÍTICOS CMNα DE LA ESTADÍSTICA KLMN ... 44

ANEXO C TABLAS DE LA ESTIMACIÓN DE LA POTENCIA... 48

(8)

LISTA DE FIGURAS

FIGURA 1. FORMA DE LA DISTRIBUCIÓN DE LA ESTADÍSTICA KL_mn ... 21

LISTA DE TABLAS

TABLA1.VALORES CRÍTICOS C_mnα DE LA ESTADÍSTICA KL_mn.TABLA RESUMIDA ... 24

TABLA2.VALORES CRÍTICOS D DE LA ESTADÍSTICA DE KOLMOGOROV_SMIRNOV ... 26

TABLA3.TIEMPOS DE FALLA ... 27

TABLA4.VALORES CRÍTICOS C_mnα DE LA ESTADÍSTICAKL_mn ,α=0.01 ... 43

TABLA5.VALORES CRÍTICOS C_mnα DE LA ESTADÍSTICAKL_mn ,α=0.025 ... 44

TABLA6.VALORES CRÍTICOS C_mnα DE LA ESTADÍSTICA KL_mn,α=0.05 ... 45

TABLA7.VALORES CRÍTICOS C_mnα DE LA ESTADÍSTICA KL_mn,α=0.10 ... 46

TABLA8. POTENCIA DE KOLMOGOROV-SMIRNOV Y KULLBACK-LEIBLER PARA N=10,α =0.10 ... 47

TABLA9. POTENCIA DE KOLMOGOROV-SMIRNOV Y KULLBACK-LEIBLER PARA N=10, α =0.05 ... 47

TABLA17.POTENCIA DE KOLMOGOROV-SMIRNOV Y KULLBACK-LEIBLER PARA N=100,α =0.10 ... 51

TABLA26.ESTIMACIÓN DEL TAMAÑO DE LA PRUEBA DE BONDAD DE AJUSTE DE KULLBACK-LEIBLER ... 56

(9)

1. INTRODUCCIÓN

Desde el punto de vista estadístico, probar si las especificaciones de un modelo

son las adecuadas es extremadamente importante. La validez de los

procedimientos inferenciales dependen en gran parte de la suposición de que una

distribución de datos en particular, sea la correcta.

Se han desarrollado muchos procedimientos para determinar si una variable

aleatoria pertenece a una distribución específica. Todos estos procedimientos se

conocen como “pruebas de bondad de ajuste”.

En este trabajo se presenta el caso de una prueba de bondad de ajuste para la

distribución Pareto, basada en la información de discriminación de

Kullback-Leibler (1951), propuesta por Song (2002).

Para la distribución Pareto se han publicado varios estudios de bondad de ajuste,

entre ellos se tienen los de Porter III y cols. (1992), quienes utilizaron pruebas

modificadas de Kolmogorov-Smirnov, Anderson Darling y Cramer-von Mises.

También Beirlant, de Wet y Goegebeur (2005, 2006), aplicaron pruebas de

bondad de ajuste para la distribución Pareto, modificando la estadística de

Jackson originalmente propuesta para probar exponencialidad.

Estudios relacionados con el uso de la información de Kullback-Leibler en

pruebas de bondad de ajuste, los realizaron Arizono y Ohta (1989), aplicándola s

en una prueba de normalidad, Ebrahimi et al (1992,) y Ebrahimi (1998)

publicaron resultados sobre pruebas de exponencialidad de vida residual, también

basándose en esta información de discriminación de Kullback-Leibler, Senoglu y

Sürücü (2004), hicieron pruebas de bondad de ajuste para probar normalidad,

exponencialidad y uniformidad. Utilizando la misma prueba, Pérez, Vaquera y

Villaseñor (2005), la aplican con la distribución Gumbel y Park (2005), aplicó la

prueba de Kullback-Leibler para exponencialidad considerando datos censurados

(10)

Las áreas de aplicación de la distribución Pareto, incluyen la Economía, en donde

se utiliza para calcular riesgos y obtener información de valores extremos mínimos

en finanzas y seguros, en esta especialidad se le conoce con el nombre de

Distribución Bradford, se aplica también en investigación de operaciones (Porter

III and et al, 1992)

Lawless (1982), Meeker & Escobar (1998), Wu & Chang (2003) y Balakrishnan y

cols. (2004) la han considerado en estudios de tiempos de vida en experimentos

con censura Tipo II. Este tipo de censura, se refiere al caso en el que de un total

de n unidades que se ponen a prueba, ésta finaliza al tiempo en el que la m-ésima

unidad falle (1≤m≤n). De esta forma, la muestra censurada Tipo II, tiene solo las m

observaciones más pequeñas en una muestra aleatoria de n unidades.

Si la distribución Pareto se utiliza en términos de función de sobrevivencia (1-F),

se aplica de esta forma en disciplinas como confiabilidad, telecomunicaciones,

finanzas, seguros, estudios ambientales, geológicos y climatológicos.

Se tienen algunas referencias relacionadas con la distribución Pareto en estudios

en confiabilidad, como el de Ouyang y Wu (1994) quienes publicaron resultados

sobre intervalos predicción para observaciones ordenadas en estudios de pruebas

de vida; también el trabajo de Wu y Chang, (2003) trata sobre inferencia de la

distribución Pareto, basada en censura progresiva tipo II con retiros aleatorios. D.

Hanagal (1996a, 1996b) publicó diferentes estudios de estimación en sistemas de

confiabilidad bajo la distribución Pareto bivariada y otros resultados con la

distribución Pareto multivariada.

En el tema de estimación, se tiene la publicación de K. Vannman (1976), en

donde presenta estimadores basados en las estadísticas de orden de una

distribución Pareto. B. Arnold (1983,1989) también ha estudiado desde el punto

de vista bayesiano esta distribución, realizando estudios de estimación y

(11)

En la sección 4 se presenta el procedimiento de prueba de bondad de ajuste de

Kullback-Leibler, sin embargo, considerando que la distribución Pareto, no

presenta el parámetro de escala, se requirió aplicar la transformación logaritmo a

la distribución Pareto, obteniendo como resultado la distribución exponencial

recorrida, la cual es una distribución de localización y escala.

Con esta transformación, se aplicó la metodología metodología propuesta por

Song (2002), en la que desarrolla una prueba de bondad de ajuste con la

información de discriminación de Kullback-Leibler. Se calcularon los valores

críticos de C_mnα de la estadísticaKL_mn y considerando que su distribución no

depende de los parámetros de localidad y escala, se aplicó la simulación Monte

Carlo. Se consideraron los niveles de significancia α =0.1, 0.025, 0.05 y 0.01,

tamaños de muestra de n=20 a 200 con separación de diez unidades entre un

calculo y otro y se generaron B=5,000 muestras aleatorias de tamaño n,

posteriormente, se calculó la estadística de pruebaKL_mnpara cada m<n/ 2. El valor de C_mn( )α para cada m y n se determinó con el cuantil ( −1 α)x100 de la distribución empírica deKL_mn.

En la sección 5 mediante simulación Monte Carlo se comparó el poder de las

pruebas de Kullback-Leibler propuesta y de Kolmogorov-Smirnov, se utilizaron las

distribuciones Gamma, Weibull y lognormal, como alternativas, y las tres pruebas

de bondad de ajuste se realizaron con los niveles de significancia de α =0.1, 0.05

y 0.01, tamaños de muestra de n=10, 30, 50, 100, 200 y 225 y se generaron =

B 5,000 muestras aleatorias para cada combinación deα y n, posteriormente,

se calculó el valor de la estadística correspondiente para cada una de las

pruebas.

El tamaño de prueba, resultó conveniente para diferentes tamaños de muestra, a

(12)

2. OBJETIVOS

2.1 Objetivo General

• Obtener una prueba de bondad de ajuste para la distribución Pareto, utilizando la distancia de Kullback-Leibler.

2.2 Objetivos Particulares

• Obtener los valores críticos de bondad de ajuste para la distribución Pareto considerando diferentes niveles de significancia y diferentes tamaños de

muestra obteniendo la tabla de valores críticos.

• Conocer el comportamiento de la prueba estudiada con respecto a su tamaño.

• Hacer la comparación de potencia y tamaño de la prueba de bondad de ajuste utilizando la distancia de Kullback-Leibler con la de Kolmogorov

Smirnov, aplicándolas con las distribuciones alternativas, Weibull, Gamma,

(13)

VILFREDO PARETO

July 15, 1848-August 19, 1923

3. MARCO TEÓRICO

3.1 Distribución PARETO

El nombre de ésta distribución es dado en honor al economista y sociólogo

italiano, Vilfredo Pareto (1848-1923), quien fue uno de los líderes de la llamada

Escuela de Lausanne, fundada por León Walras en el siglo XIX. Antes de que

Pareto cambiase su dirección política (hacia ideas del tipo de las de Sorel y

Mussolini), en su "Cours d'Économie Politique" publicado en 1896 y 1897,

presentó una exposición de la llamada Ley de Pareto de la distribución del

ingreso, ( Bouchaud, 2000)

Pareto, argumentó que en todos los países y épocas, la distribución de la riqueza

sigue un patrón regular logarítmico capturado en imágenes como una "cola" - en

cuyo extremo derecho, una pequeña fracción de la población es dueña de la

mayoría de la riqueza. Por ejemplo, en los Estados Unidos, 300 mil personas

(menos del 1,5%) posee el 10% de la riqueza. Bouchaud, (2000) indica que, la ley

de Pareto, sólo describe la cola de la distribución correspondiente a grandes

ingresos/riquezas como las que se encuentran empíricamente. Sin embargo este

concepto no se puede aplicar sobre la totalidad de la distribución.

3.1.1 Regla 80/20

La regla mide el porcentaje de desequilibrio entre la entrada y la salida. El

(14)

para muchos aspectos de la vida. Uno de los ejemplos en negocios más usado

comúnmente es cuando el 80 por 100 de beneficio de una compañía es generado

por el 20% de sus clientes.

Johnson & Kotz (1970), indican que la Ley de Pareto, se formuló para estudiar la

distribución del ingreso en una población utilizando la siguiente expresión

(conservando la notación original): α

−

= Ax

N

(3.1)

donde N es el número de personas que tienen un ingreso ≥x y A, ! son

parámetros (! es el parámetro de forma y también es conocida como la constante de Pareto).

3.1.2 Definición de la distribución Pareto

Johnson & Kotz (1970), indican que la forma de la distribución Pareto es la

]

−η      = ≥ = x k x X x

P( ) Pr k>0, η >0, x>k (3.2)

DondeP(x) es la probabilidad de que el ingreso sea igual o mayor a x y k

representa el ingreso mínimo. Como una consecuencia de (3.1), la función de

distribución acumulada de X, representando al “ingreso” puede escribirse como

η −       − = x k x

F_x( ) 1 k>0, η >0, x>k

(3.3)

Esta distribución es una forma especial Pearson Tipo VI

La relación dada por (3.2) es ahora mejor conocida como “Distribución Pareto de

primera clase”.

Pareto propuso otras dos formas de la distribución. Una se refiere a la

“Distribución Pareto de segunda clase” (en ocasiones llamada distribución Lomax)

y está dada por

η ) ( 1 ) ( 1 C x K x F_x + −

= (3.4)

(15)

La otra distribución propuesta por Pareto es la “Distribución Pareto de tercera

clase” la cual tiene la siguiente función de distribución acumulada

θ ) ( 1 ) ( 2 C x e k x F bx x + −

= − (3.5)

Considerando la función de distribución en (4.2), se tiene la correspondiente

función de densidad Pareto

; )

( = _k₊₁ k

x

x k x

p η k>0, x≥η ≥0, (3.6)

donde x es cualquier número más grande que η, el cual es (necesariamente

positivo), y k es un parámetro positivo.

La distribución Pareto también se le conoce como distribución Zeta o Ley de Zipf,

como la contraparte discreta de la distribución Pareto.

El valor esperado de una variable aleatoria que sigue una distribución Pareto es

1 ) ( − = k k X

E η k >1 (3.7)

(como k es un parámetro positivo, si se tuviera k ≤1, el valor esperado sería infinito).

Su desviación estándar es

2 1 − − = k k k η

σ k >2 (3.8)

(siguiendo la misma condición del comentario anterior si k ≤2, la desviación estándar sería infinita).

Los momentos originales se pueden calcular mediante la siguiente expresión

n k k n n − = ′ η

(16)

pero los momentos están definidos solo para k>n. Esto significa que la función

generadora de momentos, la cual es una serie de Taylor, en x con

! n

µ′ _como

coeficientes, no está definida.

La función característica está dada por

) , ( ) ( ) , /

(t kη k iηt k k iηt

ϕ = − Γ − −

donde Γ(a,x)es la función gama incompleta.

Otras características matemáticas de la distribución Pareto son:

Esta distribución Pareto está relacionada con la distribución exponencial de la

forma siguiente

  



= f x _k

k x

p( / ,η) ln( /η)

Además también la función delta Dirac es un caso límite de la distribución Pareto

) ( ) , / (

lim η =δ −η

∞

→ p x k x

k

3.1.3 Estimadores de Máxima Verosimilitud de la distribución Pareto

Petersen (2000), indica que la función de verosimilitud, L, para la distribución

Pareto con parámetros η y κ, dada una muestra x=(x₁,x₂,...,x_n)es

∏

= + = n i k i k x k x k L 1 1; ) / ,

(θ η 0<θ ≤min

{ }

x_i , k>0

Obteniendo la función logarítmica de verosimilitud

∑

= + − + = n i i x k nk k n k 1 ln ) 1 ( ln ln ) , ( θ η !

se puede ver que !(k,η)_{aumenta monótonamente, con}η_{, esto es, el valor más}

grande del valor de η , es el valor más grande de la función de verosimilitud, así

x≥η, por lo que

i i x min ˆ=

η

Para encontrar el estimador para k, hacemos la correspondiente derivada parcial

y se determina en donde es igual a cero

0 ˆ ln 1 = − + = ∂ ∂

∑

= n i i x n k n k η !

(17)

_i

i x min ˆ=

η , ˆ

(ln _i ln ) i

n k

x η

=

−

∑

3.1.4 Otras aplicaciones de la distribución Pareto

Se tienen algunas referencias relacionadas con la distribución Pareto en estudios

en confiabilidad, como el de Ouyang y Wu (1994) quienes publicaron resultados

sobre intervalos de predicción para observaciones ordenadas en estudios de

pruebas de vida; también el trabajo de Wu y Chang en 2003, trata sobre inferencia

de la distribución Pareto, basada en censura progresiva tipo II con retiros

aleatorios. D. Hanagal (1996a,1996b) publicó diferentes estudios de estimación en

sistemas de confiabilidad bajo la distribución Pareto bivariada y otros resultados

con la distribución Pareto multivariada.

En el tema de estimación, se tiene la publicación de K. Vannman (1976), en

donde presenta estimadores basados en las estadísticas de orden de una

distribución Pareto. B. Arnold (1983, 1989) también ha estudiado desde el punto

de vista bayesiano esta distribución, realizando estudios de estimación y

predicción bayesiana, así como inferencia para poblaciones con datos Pareto.

El uso de la distribución Pareto en estudios de confiabilidad es muy útil para

modelar unidades de una población que tengan distribución exponencial. Estas

unidades presentan una tasa de falla que varía de unidad en unidad de acuerdo a

una distribución gama (",κ), resultando que el tiempo de falla incondicional de una

unidad seleccionada al azar de la población, tiene una distribución Pareto de la

forma en (3.3) y con función de densidad dada en (3.6) Meeker & Escobar (1998).

3.2 Conceptos de la Teoría de la Información

Estos conceptos seutilizan en investigaciones de modelos neuronales y son muy

útiles en el ámbito de la ingeniería, especialmente en el entorno de la teoría de

comunicaciones, donde una de sus aplicaciones más comunes es la compresión

de los datos. Los conceptos a los que se refiere esta teoría son, entre otros,

(18)

3.2.1 Entropía

El concepto básico es la entropía, definida como una medida de incertidumbre

acerca del valor de una variable aleatoria #x$. Especificada por Shannon (1948) como H(#X)$, tiene la siguiente expresión formal:

[

( )

]

log ) ( ) ( 1 x p x p X H n x

∑

= − =

= E _

           ) ( 1 log x p

donde, E(.) es el operador esperanza y p(#x) $%la distribución de probabilidad de la variable aleatoria. Si consideramos más de una variable, la entropía tendrá un

carácter conjunto y si se condiciona su comportamiento, la entropía será de

naturaleza condicional, ambos conceptos se sitúan en el ámbito bidimensional.

Así, sean “x” e “y”, dos variables aleatorias de tipo discreto, donde p(#x, y) $%es la

probabilidad conjunta y p(yx) es $%la probabilidad condicionada, y H(x,y)$% se define como la entropía conjunta:

[

( , )

]

log ) , ( ) , ( 1 1 y x p y x p Y X H n x m y

∑∑

= = − =

=E _

           ) , ( 1 log y x p

la cual es una medida de incertidumbre conjunta entre las dos variables aleatorias.

Y la entropía condicional H(yx)se define como

[

( )

]

log ) , ( ) ( 1 1 x y p y x p X Y H n x m y

∑∑

= = − =

la cual es una medida del grado de incertidumbre de “y”, una vez que se conocen

los valores concretos de “x”.

3.2.2 Medidas de Entropía

En el caso de variables aleatorias continuas se definen las diferentes entropías en

(19)

La entropía fue introducida como medida cuantitativa de la información o, como

medida de la incertidumbre sobre una experiencia cualquiera con un número finito

de resultados posibles.

Si se considera un experimento aleatorio cuyos posibles resultados tienen sus

probabilidades respectivas de ocurrir, se sabe que existe una “cierta”

incertidumbre acerca del resultado particular que se presentará en caso de

realizar el experimento.

Es necesario cuantificar la incertidumbre asociada a un experimento aleatorio.

Para este fin, existen muchas medidas de incertidumbre, entre las más conocidas

se tiene la entropía de Shannon. Es importante ver que la entropía de Shannon

depende del número de resultados y de la probabilidad de ocurrencia de los

mismos.

Otras medidas como la de Hartley, únicamente depende del número de resultados

y no de la probabilidad de ocurrencia de los mismos, y se define como el logaritmo

del número de resultados posibles del experimento.

El objetivo de las medidas de entropía es cuantificar la incertidumbre asociada a

una variable aleatoria. (Pardo, 1997)

3.2.3 Unidades de Entropía

Al requerir medir la entropía, es necesario considerar en qué unidades se tiene

que medir. Se considera que las unidades de entropía se dá en logaritmos, los

cuales se pueden tomar con respecto a cualquier base que sea mayor que la

unidad. Si se toma en base dos, la unidad correspondiente se denomina BIT

(Binary digit) y puede definirse como la entropía correspondiente a una variable

aleatoria con dos resultados equiprobables.

Si se toma en base 10, la unidad correspondiente se denomina DIT (Decimal digit

o unidad de Hartley) y se define como la entropía de una variable aleatoria con

diez resultados equiprobables.

Si se toman en base e, la unidad correspondiente se denomina NAT y se aplica

en el concepto de entropía para variables aleatorias continuas. Cuando se toman

los logaritmos en base natural se tiene la ventaja de que se simplifican los

(20)

como la entropía correspondiente a una variable aleatoria con distribución

uniforme en el intervalo (0,e) (Pardo, 1997)

3.2.4 Entropía de Shannon para una variable aleatoria continua

Definición. Sea X ≡(X₁,...,X_n)una variable aleatoria n-dimensional continua con función de densidad f(x), se denomina entropía de X a la expresión

∫

−

= n

R

dx x f x f X

h( ) ( )log ( )

Supuesto que la integral existe.

La entropía de Shannon en el caso continuo verifica que la entropía h(X)puede ser negativa.

3.2.5 Estimador no paramétrico de entropía

Para conocer la entropía de una función de densidad de probabilidades su

distribución tiene que ser completamente especificada, pero muchos

investigadores han desarrollado métodos no paramétricos para estimarla, como

los resultados que presenta Park (1995) considerando la propuesta de Vasicek

(1976), en la que presenta el estimador de la entropía, que la expresa H f( )

como:

1

0

( ) log d ( )

H f F p dp

dp −

 

=  

 

⌠ 

⌡ (3.10)

usando el hecho de que la pendiente d 1_{( )}

dpF p

− _{se puede expresar en la forma:}

1

1 1 ( )

( ( )) d

F p

dp f F p

−

= (3.11)

De este modo para tener una idea del valor de la pendiente hay que estimar F

con la función de distribución empírica Fn y reemplazar el operador de

diferenciación por una diferencia entre dos cantidades. Esto conduce a un

estimador muy simple de la pendiente que se obtiene como el producto de ₂n m y la

diferencia entre dos cuantiles muestrales, con lo cual el estimador de la entropía

(21)

(

( ) ( )

)

1 1 log 2 n

mn i m i m

i

n

H X X

n ₌ m + −

 

= _ − _

 

∑

(3.12)

Donde m es un entero positivo más pequeño que n/2, X_{( )}_j =X₍₁₎

si j<1, X_{( )}_j =X_{( )}_n si j>n y X₍₁₎ ≤...≤ X₍_n₎son las correspondientes estadísticas de orden, basadas en una muestra aleatoria de tamaño n.

3.3 Discrepancia intrínseca

Es importante considerar la definición original de Kullback (1959), relacionada con

el concepto de discrepancia intrínseca la cual se presenta textualmente :

“Sea S=

{ }

p(x) el conjunto de todas las funciones de densidad regulares y

absolutamente continuas entre sí en un espacio muestral χ con respecto a una

medida dominante P.

dx ) x ( q ) x ( p log ) x ( p ) p q (

K =

∫

está definida, es no negativa y, para todo p,q∈S. 0

) p q (

K = , si y sólo si p=q, c.p.p.

En general, la divergencia de Kullback-Leibler no es simétrica, esto es

) q p ( K ) p q (

K ≠ .

Además si los soportes de p y q , χ_p y χ_q, respectivamente, son tales que

p

q ⊆χ

χ , entonces K(q p) diverge”.

3.3.1 Medida de Divergencia. Divergencia de Kullback-Leibler

Una vez considerada la definición de 3.3, se puede definir que una medida de

divergencia cuantifica la cantidad de información proporcionada por los datos, y

mide el grado de discrepancia entre dos poblaciones caracterizadas por sus

correspondientes distribuciones de probabilidad.

La divergencia de Kullback-Leibler o entropía relativa es una cantidad que mide la

diferencia entre dos funciones de densidad de probabilidad.

(22)

( ) ( ; ) ( ) log

( ) g x

K g f g x dx

f x ∞

−∞

=

_∫

(3.13)

Como K g f( ; )tiene la propiedad de que K g f( ; )≥0 y la igualdad se mantiene si

f

g = , el estimador de la información de Kullback-Leibler también ha sido

considerada como una estadística de prueba de bondad de ajuste por Arizono

(1989) y Ebrahimi (1992) entre otros.

3.3.2 La entropía y la divergencia de Kullback-Leibler en las pruebas de

bondad de ajuste

Las pruebas de bondad de ajuste basadas en la entropía muestral o bien en

divergencia de Kullback-Leibler son consistentes y presentan un buen

desempeño. Vasicek (1976) propuso una prueba de normalidad, basada en el

hecho de que la entropía de esta distribución excede a la de cualquier otra

distribución que tenga la misma varianza. Arizono y Otha (1976) desarrollaron

otra prueba para normalidad, pero basada en la divergencia de Kullback-Leibler,

que puede ser aplicada para hipótesis simples y compuestas.

Ebrahimi et al. (1992) desarrollaron una prueba de exponencialidad basada en la

divergencia de Kullback-Leibler. Song (2002) presentó una metodología general

para desarrollar pruebas de bondad de ajuste con distribución libre asintótica

basada en la divergencia de Kullback-Leibler. El procedimiento puede ser aplicado

a una gama amplia de distribuciones, entre las que destacan las distribuciones

siguientes: Normal, log-normal, logística, Gumbel, exponencial,

3.4 Poder o Potencia de la prueba

La potencia de una prueba es la probabilidad de rechazar la hipótesis nulaH0,

cuando esta es verdadera. La definición de potencia se usa principalmente para

una hipótesis alternativa simple. Si la hipótesis alternativa es compuesta se

emplea el término de Función Potencia, la cual se define como la función a la que

un valor θ del parámetro se le asocia la probabilidad de rechazar la H0si este

valor es el verdadero y su expresión es

[

Re H0

]

)

(θ P_θ chazar

(23)

Si la hipótesis H₀es simple del tipo θ =θ₀ entonces el valor de la función potencia para θ0es elErrorTipoI :

α θ

β( _θ)=

3.5 Prueba de hipótesis y Tamaño de la prueba

Cuando se usa una prueba ϕ, estamos sujetos a cometer cualquiera de los dos

tipos de errores posibles

0 1 )

(x = Si x>

ϕ 0 0 )

(x = Si x≤

ϕ

El criterio para encontrar la prueba óptima, es escoger la prueba ϕ* tal que las probabilidades de ambos errores sean mínimas.

En general, cuando se minimiza la probabilidad del ErrorTipoI se aumenta la

probabilidad del ErrorTipoII y viceversa.

Por esta razón fijamos un nivel de probabilidad αpara la probabilidad del

I Tipo

Error y se trata de obtener la prueba que hace mínima la probabilidad

delErrorTipoII . Es decir, entre todas las pruebas ϕ que satisfacen:

) usando

(ErrorTipoI ϕ

P ϕ ≤α <α₁

0<α <1=α ∈ (0,1)

Note que si ϕ es de tamaño α y α <α₁ entonces ϕ también es de tamaño α₁.

Definición: Una prueba ϕ que satisface * es llamada una prueba de tamañoα.

El interés es que las pruebas, sean del tamaño lo más pequeño posible.

a) Probabilidad de rechazar H0cuando es verdadera

) / (Re ) usando

(ErrorTipoI P chazar H₀usando w

P ϕ = ϕ θ∈

) 1 ) (

( x w

P = ∈

=

− θ

ϕ De donde ϕ es de tamaño α si

α θ θ∈ ((−)=1 )≤ maxP x

w **

b) Probabilidad de No rechazar H0cuando es falsa. * * * ) 0 ) ( ( ) usando

(ErrorTipoII P x w

P = = ∈Ω−

− θ

(24)

=1−P( (x)=1 ∈Ω−w)

− θ

ϕ

Entonces se desea encontrar la ϕ que satisface

α θ ϕ

θ∈ ( (−)=1 )≤ maxP x

w ** y minimiza

) 0

) (

( x w

P = ∈Ω−

− θ

ϕ o

=1−P( (x)=1 ∈Ω−w)

− θ

(25)

4.

PRUEBA DE BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN

PARETO, BASADA EN LA INFORMACIÓN DE

KULLBACK-LEIBLER

4.1 Planteamiento del problema

Una variable aleatoria X, tiene función de distribución Pareto, X~P k( , )η si su función de densidad es de la forma

0 , 0 ) , , ( ) ;

( ⋅ = ₀ η = η₊₁ k> x≥η≥ x k k x f x f _k k (4.1)

donde η es el parámetro de localización y k es el parámetro de forma. Y kˆ y ηˆ

son respectivamente los estimadores de máxima verosimilitud:

∑

= − = _n i i n y n k 1 ) ˆ ln (ln ˆ η

{ }

1 ˆ mín _i

i n y

η

≤ ≤

=

Sean

{

X₁,...,X_n

}

observaciones independientes de una distribución F, con función

de densidad de probabilidad f

( )

x;⋅, x∈ℜ.

Se desea probar el siguiente juego de hipótesis

( )

; ₀( ; , )

:

0 f x f x kη

H ⋅ = (4.2)

contra la hipótesis alternativa:

( )

; ₀( ; , )

:

1 f x f x kη

H ⋅ ≠ (4.3)

El objetivo de esta hipótesis es conocer si una muestra aleatoria proviene de la

distribución Pareto.

4.2 Transformación de la distribución Pareto

Sin embargo, antes de probar la hipótesis de interés, se requiere aplicar una

transformación logaritmo a la distribución Pareto para obtener una distribución

Exponencial de dos parámetros (Lehman y Casella, (1998) pág. 486).

(26)

Y~Exp(ξ,b)con función de densidad

{

y

}

b b

y

f₍_Y₎( )= 1exp −( −ξ I₍_ξ_,_∞₎(y) (4.4)

donde ξ =lnη y b=1/k

4.3 Construcción de la prueba

Ahora se va a considerar la información de discriminación de Kullback-Leibler

entre dos funciones de distribución para probar la hipótesis de interés.

[

]

∫

−∞∞

= f y f y f y dy

F F

KL( , ₀;!) ( )ln ( )/ ₀( ,!) (4.5)

donde!_{es un vector de parámetros que en este caso, contiene a}η;k.

La evaluación de _KL(_F,_F₀;!)_{requiere conocer a}_F _y 0

F , por lo que ahora se debe

obtener un estimador muestral de _KL(_F,_F₀;!)_{, considerando la hipótesis que se}

quiere probar. Para este fin se aplicará la propuesta hecha por Song (2002).

Considerando la información de Kullback-Leibler dada en (4.8) y por propiedades

de los logaritmos se tiene:

∫

−∞∞

∞

− −

= f y f y dy f y f y dy

F F

KL( , ₀;!) ( )ln ( ) ( )ln ₀( ,!) (4.6)

donde:

∫

∞ f(y)ln f(y)dy H(F) ∞

− =− es la entropía de F.

Para obtener la estimación de la entropía,H

( )

F , se puede considerar el estimador

propuesto por Vasicek (1976), dado por:

(

( ) ( )

)

1 1

ln 2 n

mn i m i m

i

n

H Y Y

n ₌ m + −

 

= _ − _

 

∑

(4.7)

donde m es un entero positivo menor que n/ 2,

{

Y₍₁₎,...,Y_{( )}_n

}

, son las estadísticas

de orden de la muestra

{

Y₁,...,Y_n

}

, Y_j =Y_{( )}₁, si j<1 y Y_j =Y₍_n₎ si j>n.

Para estimar de (4.5) la función

∫

∞

− f(y)ln f0(y,!)dy se utilizará la expresión

(27)

(

ˆ,ηˆ

)

ln _, 1

0 1

k Y f

n _i

n

i

∑

=

− _(4.8)

sustituyendo (4.7) y (4.8) en (4.5) se tiene la ecuación completa para el estimador

mn

KL :

(

)

1

( ) ( ) 0 ,

1 1

1 _{ˆ ˆ}

ln ln ,

2

n n

mn i m i m i

i i

n

KL Y Y n f Y k

n m η

−

+ −

= =

 

= _ − _−

 

∑

teniendo como resultado la estadística de prueba para la distribución Exponencial

de dos parámetros.

A partir de este resultado se generaliza a una familia de localidad y escala, la cual

se consideró en este estudio para aplicarla en la prueba de bondad de ajuste de

Kullback-Leibler.

4.4 Implementación de la prueba

Una vez que se aplica la prueba si se obtienen valores grandes del estimador

mn

KL se rechaza H0a favor de la hipótesis alternativa, es decir; se rechaza la

hipótesis nula si KL_mn ≥C_mn(α), así el valor de la constante crítica C_mn(α) se determina por el cuantil

(

1−α

)

100de la distribución de KLmnbajo la hipótesis nula.

Considerando que se tiene definido el tamaño de muestra n, ahora se tiene que

especificar el parámetro m. Song (2002) sugiere que de acuerdo a su teoría, m

debería escogerse de acuerdo al tamaño de muestra finito. Sin embargo en la

práctica escoger el valor de m óptimo es problemático; ya que no sólo depende

del tamaño de muestra, sino también de la alternativa en particular que se

considere. Por lo que Song (2002), probó hipótesis compuestas de normalidad

con parámetros no especificados, contra siete opciones de hipótesis alternativas

obteniendo el poder de la prueba por medio de simulación MonteCarlo.

Estas simulaciones mostraron que aún para n fija, no existe una m que sea óptima

(28)

O sea, si se tiene una distribución alternativa de especial interés, entonces la

mejor forma de escoger m, podría ser la m que proporcione el poder más alto en

la dirección de esta alternativa para el tamaño de muestra n dado y el nivel α

requerido.

Para este fin, se tiene el hecho de que la información de Kullback-Leibler

(

( , 0;

)

0

KL F F ! ≥ _{para todo}!∈Θ_{en donde la igualdad se mantiene para algún}

∈Θ

! _{si y solo si}

0 ( ) ( , )

f x = f x ! _{. En otras palabras, bajo}

(

)

0

( , ; 0

KL F F ! = _{, los}

valores grandes de KL

(

( ,F F₀;!

)

_{favorecen la hipótesis alternativa sobre}H₀.

Sobre esta propiedad se basa el método para seleccionar m. Dadas las

observaciones

{ }

Xi n_i=1, se estima KL F F

(

( , 0;!

)

, con su estimador muestral, KLmn.

La idea básica es escoger m que minimice KL_mn.

La siguiente expresión nos presenta la forma de obtener

m: 0

(

( )

)

1

1 _{ˆ ˆ}

ˆ *: * arg : ln , ,

n

mn mn i

i m

m mín m m máx H H f X k

n ₌ η

 

 

= _ = _ ≤ − _

 

 



∑



(4.10)

es decir, mˆdebe de ser el valor mas pequeño de mˆ *, que maximice la entropía

(29)

5. ESTIMACIÓN DEL PODER DE LA PRUEBA

5.1 Distribución empírica del estadístico de pruebaKLmn

Aplicando simulación Monte Carlo se probó que para este caso particular la

distribución empírica del estadístico de pruebaKL_mnpara la distribución Pareto,

bajo H₀, es prácticamente idéntica aún para tamaños de muestra pequeños y no

depende de los parámetros ky η .Para obtener la distribución empírica de KL_mn

se mantuvieron fijos n,m ,kˆy ηˆ y se generaron B muestras aleatorias de tamaño

n para la distribución Pareto con parámetros ky η . Para calcular el valor de KLmn

se hicieron B realizaciones de la estadística de prueba y se generó la forma

aproximada de la distribución, obteniendo el histograma de las diferentes gráficas

En la figura 1 se presenta la forma de la distribución de la estadística de prueba

mn

KL con n=10, m=4 y B=10,000 para cada combinación de los diferentes valores de parámetros especificados en la gráfica. Los cálculos se hicieron con el

programa en lenguaje R.

-0.2 0.0 0.2 0.4 0.6 0.8

0

.0

0

.5

1

.0

1

.5

2

.0

2

.5

3

.0

[image:29.612.186.434.427.620.2]

KLmn, Pareto( 1 , 1 ) KLmn;Pareto( 2 , 1 ) KLmn;Pareto( 3 , 1 ) KLmn;Pareto( 10 , 50 )

(30)

5.2 Estimación del poder de la prueba

En esta sección se presenta la obtención del poder de la prueba de manera

comparativa para las pruebas de Kullback-Leibler y Kolmogorov Smirnov,

considerando las distribuciones, Lognormal, Weibull y Gamma como alternativas a

la distribución Pareto.

Se utilizaron para las tres pruebas de bondad de ajuste los niveles de significancia

de α =0.1, 0.05 y 0.01, tamaños de muestra de n=10, 30, 50, 100, 200 y 225 y

se generaron B =5,000 muestras aleatorias para cada combinación de α y n,

posteriormente, se calculó el valor de la estadística correspondiente para cada

una de las pruebas.

5.3 Prueba de Kullback-Leibler con las distribuciones alternativas

Para obtener la estadística de prueba KL_mn de Kullback-Leibler, se calculó el

estimador de entropía (H_mn). Este estimador considera las estadísticas de orden,

el valor de n y el valor de m.

Se calculó el poder de la prueba para las 16 distribuciones alternativas con

diferentes combinaciones de los niveles de significancia y tamaños de muestra

antes mencionados. En cada caso las pruebas se realizaron con los parámetros

que se presentan a continuación.

Distribución Weibull: (1,1), (1,3), (2,3), (2,1), (3,1) y, (3.439,1)

Distribución Gamma: (1,1), (1,3), (2,3), (2,1), (3,1) y, (3.439,1)

Distribución Log-normal: (1,1), (1,0.4), (5,3), (10,0.2)

Para la distribución Weibull, se realizaron las pruebas con diferentes valores de

parámetros, estableciendo las siguientes correspondencias con otras

distribuciones de acuerdo a Makino(1984),

Weibull(1,3) = Exp(3)

Weibull(2,3) = Raleigh(;)

(31)

La distribución Weibull que se consideró, tiene parámetro de forma α y parámetro

de escala β con función de densidad

) ) / ( exp( ) 1 ( ) / )( / ( )

(_x _x x a

f = α β β α− − β para x>0

La distribución Gamma que se utilizó tiene parámetro de forma θ y parámetro de

escala β con función de densidad

{

₍ ₎

}

( 1)_exp ( / ) 1

)

( _θ _θ _β

θ

β _x x

x

f ₋ ₋

Γ

= para x >0, θ >0 y β >0

Para la distribución Gamma; solamente por comparación, se aplicaron los mismos

valores de los parámetros que para la distribución Weibull.

Se trabajó con la distribución Lognormal, con parámetro de localización µ y parámetro de forma _σ2_{con función de densidad:}

π σ 2 1 ) ( x x

f = exp

   ₋ − 2 2 2 ) (ln σ µ

x _∀ _x_>₀

Tamborero del Pino y Cejalvo (1996) indican las siguientes características para la

distribución Lognormal de acuerdo a los valores del parámetro de escala:

Lognormal (5,3) = Asimétrica, para valores medios y altos de &

Lognormal (1,0.4)= Conforme & decrece, la distribución es más simétrica Lognormal (1,1) = Exponencial negativa. Si & se acerca a la unidad Lognormal (10,0.2)= Normal. Para valores de &<0.2

Para esta distribución se trabajó con los parámetros antes indicados.

Las potencias de las pruebas de Kullback-Leibler se realizaron con la estadística

de pruebaKLmn, obtenidas por medio de simulación Monte Carlo utilizando el

programa en lenguaje R :

5.3.1 Valores críticos

Para determinar los valores críticos de C_mn( )α y KLmn, y considerando que su

(32)

simulación Monte Carlo. Se consideraron los niveles de significancia α =0.1,

0.025, 0.05 y 0.01, tamaños de muestra de n=20 a 200 con separación de

diez unidades entre un calculo y otro y se generaron B=5,000 muestras

aleatorias de tamaño n, posteriormente, se calculó la estadística de

pruebaKL_mnpara cada m<n/ 2. El valor de C_mn( )α para cada m y n se determinó con el cuantil ( −1 α)x100 de la distribución empírica deKL_mn.

En la tabla 1 se muestran de manera resumida los valores críticos Cmnα de la

estadísticaKLmn para la distribución Pareto, y en las tablas 2, 3, 4 y 5 (anexas) se

presentan los valores críticos para la estadística KL_mn para los niveles de

significancia, de 0.01, 0.025, 0.05 y 0.1 respectivamente.

Nivel de significancia ( α)

n 0.01 0.025 0.05 0.1

Cmn m Cmn m Cmn m Cmn m

20 0.3889 4 0.3440 4 0.3058 4 0.2690 4

30 0.2910 5 0.2573 5 0.2329 5 0.2079 5

40 0.2366 6 0.2127 6 0.1931 6 0.1707 6

50 0.2050 6 0.1851 6 0.1669 6 0.1492 6

60 0.1792 8 0.1603 7 0.1470 6 0.1324 7

70 0.1598 7 0.1443 7 0.1320 7 0.1190 7

80 0.1456 7 0.1322 8 0.1206 8 0.1091 8

90 0.1363 8 0.1226 9 0.1131 10 0.1016 10

100 0.1248 9 0.1142 9 0.1050 9 0.0950 8

110 0.1187 10 0.1067 10 0.0981 10 0.0887 10

120 0.1111 8 0.1010 11 0.0927 11 0.0834 11

130 0.1059 11 0.0952 9 0.0881 10 0.0796 11

140 0.1005 13 0.0921 9 0.0843 11 0.0760 12

150 0.0939 11 0.0864 11 0.0795 12 0.0719 12

160 0.0913 11 0.0834 13 0.0768 11 0.0696 13

170 0.0880 11 0.0800 12 0.0735 12 0.0666 12

180 0.0845 12 0.0772 12 0.0713 12 0.0641 14

190 0.0817 13 0.0748 15 0.0687 15 0.0618 15

200 0.0787 12 0.0714 12 0.0660 14 0.0594 14

[image:32.612.143.469.323.620.2]

(33)

5.4 Prueba de Kolmogorov-Smirnov

La prueba de Kolmogorov-Smirnov indica si un conjunto de observaciones

provienen de alguna distribución continua, completamente especificada. Sin

embargo una de las limitaciones para aplicar esta prueba, es cuando uno o más

parámetros de la distribución deben estimarse a partir de la muestra, por lo que

en estos casos no es muy conveniente aplicar la prueba, ya que no se pueden

utilizar los puntos críticos tabulados comúnmente, (Lilliefors, 1969).

Considerando que la distribución Pareto, no presenta el parámetro de escala, por

lo que no cumple con esta condición para aplicar la prueba de

Kolmogorov-Smirnov. Sin embargo, este problema se resolvió aplicando la transformación

logaritmo a la distribución Pareto, obteniendo como resultado la distribución

exponencial recorrida, la cual es una distribución de localización y escala (Lehman

y Casella, 1998) (explicada en el capítulo 2).

Lilliefors (1969), presenta tablas de la estadística de Kolmogorov-Smirnov, para

probar si un conjunto de observaciones provienen de una población exponencial

cuando la media no es especificada, y se estima a partir de la muestra.

En su trabajo, Lilliefors (1969), menciona que David y Johnson (1948), indican que

si los parámetros estimados son parámetros de escala o localización y los

estimadores satisfacen ciertas condiciones generales, entonces se aplica la

transformación integral de probabilidad, y entonces, la distribución conjunta de las

variables transformadas no dependerán del valor verdadero del parámetro. La

distribución dependerá de la forma funcional de la distribución de las variables

originales. Así se pueden construir las tablas con la estadística de

Kolmogorov-Smirnov para esa distribución en particular.

El procedimiento que presenta Lilliefors (1969) es:

dada una muestra de n observaciones se determina

) ( ) (

* X S X

F Máximo

D= − _n

(34)

muestral. Si el valor deD excede el valor crítico en la tabla, entonces se rechaza

la hipótesis de que las observaciones vienen de una población exponencial.

La tabla 2 muestra los valores críticos de D

Nivel de significancia para D=MáximoF*(X)−S_N(X)

n 0.20 0.15 0.1 0.05 0.01

3 0.451 0.479 0.511 0.551 0.600

4 0.396 0.422 0.449 0.487 0.548

5 0.359 0.382 0.406 0.442 0.504

6 0.331 0.351 0.375 0.408 0.470

7 0.309 0.327 0.350 0.382 0.442

8 0.291 0.308 0.329 0.36 0.419

9 0.277 0.291 0.311 0.341 0.399

10 0.263 0.277 0.295 0.325 0.380

11 0.251 0.264 0.283 0.311 0.365

12 0.241 0.254 0.271 0.298 0.351

13 0.232 0.245 0.261 0.287 0.338

14 0.224 0.237 0.252 0.277 0.326

15 0.217 0.229 0.244 0.269 0.315

16 0.211 0.222 0.236 0.261 0.306

17 0.204 0.215 0.229 0.253 0.297

18 0.199 0.210 0.223 0.246 0.289

19 0.193 0.204 0.218 0.239 0.283

20 0.188 0.199 0.212 0.234 0.278

25 0.170 0.180 0.191 0.210 0.247

30 0.155 0.164 0.174 0.192 0.226

Más de

30 .86/'N .91/'N .96/'N 1.06/'N 1.25/'N

(35)

6. APLICACIÓN DE LA PRUEBA DE KULLBACK-LEIBLER EN UN

EJEMPLO DE OBSERVACIONES DE TIEMPOS DE VIDA

Considerando los resultados de 20 tiempos de falla en un estudio de

sobrevivencia, reportados por Ouyang y Wu (1994) en su trabajo sobre intervalos

de predicción para observaciones ordenadas con distribución Pareto, se aplicaron

los resultados obtenidos en este trabajo. El programa en lenguaje R para este

ejemplo se anexa al final.

30.101 30.150 30.374 30.581 30.871 31.086 31.398 31.752 31.792 31.960 32.260 32.517 32.636 33.002 33.552 33.721 34.002 34.023 34.150 35.274 Tabla 3. Tiempos de falla

Se aplicó la prueba de Kullback-Leibler, para probar si los datos de tiempo de falla

tienen distribución Pareto, contra la alternativa de que no se distribuyen Pareto.

En la prueba se consideró un tamaño de muestra n=20, un valor de m=4 y un nivel de significancia de 0.05

Los resultados obtenidos con el programa de cómputo R se anexan al final del

trabajo.

Se considera la siguiente regla de decisión:

Se rechaza la hipótesis nula si, KL₄_,₂₀ ≥C₄_,₂₀_,(.05) El valor de KL_4,20 = 0.3514342

Valor crítico C4,20(0.05)= 0.3572

Como KL_4,20<C_4,20(.05)entonces No se rechaza la hipótesis nula

El resultado de la prueba indica que los datos de tiempo de falla que se

consideraron en el ejemplo tienen distribución Pareto con un nivel de significancia

(36)

7. DISCUSIÓN DE LOS RESULTADOS

- Se aplicó la prueba de bondad de ajuste de Kullback-Leibler propuesta por

Song (2000), para la distribución Pareto. Debido a que la distribución

Pareto no es invariante, se le aplicó la transformación logaritmo obteniendo

como resultado la distribución Exponencial de dos parámetros, la cual es

una distribución de localización y escala (Lehman y Casella, 1998).

-

- Se obtuvo la tabla de valores críticos C_mnα, de la estadística KL_mn para la

distribución Pareto, estos valores se obtuvieron por simulación Montecarlo

a niveles de significancia, 0.01, 0.025, 0.05 y 0.1, tamaños de muestra n de

5 a 200 y para valores de m de 4 a 15. (Tabla 1)

- La prueba de bondad de ajuste de Kullback-Leibler, para la distribución

Pareto, considerando como distribuciones alternativas la Weibull, Gamma,

y Lognormal, observando en general que para las tres distribuciones, la

potencia de la prueba, aumenta, conforme se incrementa el tamaño de la

muestra.

- Para el caso de la distribución alternativa Weibull, se consideraron 5

combinaciones de parámetros. Para el caso de tamaño de muestra

n = 10 a los diferentes niveles de significancia considerados (0.10, 0.05 y

0.1), el poder de la prueba de Kullback-Leibler, presentó valores más altos

en la mayoría de los casos, que para la prueba de Kolmogorov-Smirnov.

(Tablas 4, 5 y 6).

- Para esta misma distribución, la potencia de Kullback-Leibler, para n=30

fue mayor en todos los casos y para el tamaño de muestra n=50, n=100,

n=200 y n=225, con α diferentes, la potencia fue igual a uno, viendo que

para estos tres últimos tamaños de muestra, resultó idéntica a la potencia

(37)

- Para la distribución Gamma, con tamaño de muestra igual a 10, el

resultado del poder de la prueba con los diferentes niveles de significancia

considerados (0.01, 0.05 y 0.1), se presentó de manera muy semejante a la

distribución Weibull, siendo mayor en practicamente todos los casos que

para la prueba de Kolmogorov- Smirnov. (Ver Tablas 4 , 5 y 6)

- Para esta misma distribución, la potencia de Kullback-Leibler, para n=30

fue mayor en los 16 casos. Para los tamaños de muestra; n=50, n=100,

n=200 y n=225, la potencia fue igual a uno, viendo que para los tres últimos

tamaños de muestra, resultó idéntica a la potencia de la prueba de

Kolmogorov- Smirnov. (Tablas de la 7 a la 21)

- Tamborero del Pino y Cejalvo (1996) indican que para la distribución

Lognormal, de acuerdo a los valores del parámetro de escala & , si este tiene valores medios y altos entonces la distribución es asimétrica, en este

trabajo se probó la hipótesis alterna de Lognormal (5,3) y en las tablas 8, 9

y 10 se observa que para esta combinación de parámetros al tamaño de

muestra más bajo ( n=10) y para los tres niveles de significancia (0.10, 0.05

y 0.01), la prueba de Kullback-Leibler no reportó valor para la potencia, por

lo que la prueba no converge para estos casos.

- Con tamaños de muestra mayores de 10, la distribución Lognormal,

presentó resultados del potencia de la prueba muy parecidos a los que se

obtuvieron con las distribuciones Weibull y Gamma. (Tablas de la 4 a la 21)

- Con respecto al tamaño de la prueba, los resultados obtenidos por medio

de simulación son muy parecidos a los valores α de que se consideraron.

Se obtuvo el tamaño de la prueba con diferentes parámetros a diferentes

combinaciones de niveles de significancia y tamaños de muestra;

(38)

8. CONCLUSIONES

- Se derivó una prueba de bondad de ajuste de Kullback-Leibler, para la

distribución Pareto observando que la potencia de la prueba de Kullback-

Leibler, aumenta conforme se incrementa el tamaño de la muestra, lo

que demuestra que es una PRUEBA CONSISTENTE

- Con respecto al tamaño de la prueba, los resultados obtenidos por

medio de simulación son muy parecidos a los valores de que

se consideraron.

- Como conclusión más importante, se observó que la prueba de

Kullback-Leibler resultó ser más poderosa que la prueba de bondad de ajuste de

Kolmogorov-Smirnov.