14498, Hernández Reyes, T.D 4

(1)

VARIABLES DE DISTRIBUCÓN CUALITATIVAS. DISTRIBUCIÓN F O DE FISHER.

La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,

En estadística se denomina prueba F de Snedecor a cualquier prueba en la que el estadístico utilizado sigue una distribución F si la hipótesis nula no puede ser rechazada. El nombre fue acuñado en honor a Ronald Fisher.

En estadística aplicada se prueban muchas hipótesis mediante el test F, entre ellas:

 La hipótesis de que las medias de múltiples poblaciones normalmente distribuidas y con la misma desviación estándar son iguales. Esta es, quizás, la más conocida de las hipótesis verificada mediante el test F y el problema más simple del análisis de varianza.

 La hipótesis de que las desviaciones estándar de dos poblaciones normalmente distribuidas son iguales, lo cual se cumple.

En muchos casos, el test F puede resolverse mediante un proceso directo. Se requieren dos modelos de regresión, uno de los cuales restringe uno o más de los coeficientes de regresión conforme a la hipótesis nula. El test entonces se basa en un cociente modificado de la suma de cuadrados de residuos de los dos modelos como sigue:

Dadas n observaciones, donde el modelo 1 tiene k coeficientes no restringidos, y el modelo 0 restringe m coeficientes, el test F puede calcularse como

El valor resultante debe entonces compararse con la entrada correspondiente de la tabla de valores críticos.

Usada en teoría de probabilidad y estadística, la distribución F es una distribución de probabilidad continua. También se le conoce como distribución F de

Snedecor (por George Snedecor) o como distribución F de Fisher-Snedecor. Una variable aleatoria de distribución F se construye como el siguiente cociente:

(2)

 U1 y U2 siguen una distribución chi-cuadrado con d1 y d2 grados de libertad respectivamente, y

 U1 y U2 son estadísticamente independientes.

La distribución F aparece frecuentemente como la distribución nula de una prueba estadística, especialmente en el análisis de varianza. Véase el test F.

La función de densidad de una F(d1, d2) viene dada por

para todo número real x ≥ 0, donde d1 y d2 son enteros positivos, y B es la función beta.

La función de distribución es

DISTRIBUCIÓN X CUADRADA.

En estadística, la distribución χ² (de Pearson), llamada Chi cuadrado o Ji cuadrado, es una distribución de probabilidad continua con un parámetro que representa

los grados de libertad de la variable aleatoria

donde son variables aleatorias normales independientes demedia cero

y varianza uno. El que la variable aleatoria tenga esta distribución se representa habitualmente así: .

Es conveniente tener en cuenta que la letra griega χ se transcribe allatín como chi1_y se pronuncia en castellano como ji.

Función de densidad Su función de densidad es:

donde es la función gamma. Función de distribución acumulada Su función de distribución es

(3)

El valor esperado y la varianza de una variable aleatoria X con distribución χ² son, respectivamente, k y 2k.

APLICACIONES.

La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más

conocida es la de la denominada prueba χ² utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas. Pero también está involucrada en el problema de estimar la media de una población normalmente

distribuida y en el problema de estimar la pendiente de una recta deregresión lineal, a través de su papel en la distribución t de Student.

Aparece también en todos los problemas de análisis de varianza por su relación con la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución χ².

VARIABLES DE DISTRIBUCIÓN CUANTITATIVAS. DISTRIBUCIÓN t (DE STUDENT).

En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de

una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se

desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra.

La distribución t de Student es la distribución de probabilidad del cociente

donde

 Z tiene una distribución normal de media nula y varianza 1  V tiene una distribución ji-cuadrado con grados de libertad  Z y V son independientes

(4)

la media muestral. Entonces

sigue una distribución normal de media 0 y varianza 1.

Sin embargo, dado que la desviación estándar no siempre es conocida de antemano, Gosset estudió un cociente relacionado,

donde

es la varianza muestral y demostró que la función de densidad de T es

donde es igual a n − 1.

La distribución de T se llama ahora la distribución-t de Student.

El parámetro representa el número de grados de libertad. La distribución depende de , pero no de o , lo cual es muy importante en la práctica.

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la

media , siendo entonces el intervalo de confianza para la media

= .

Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también

normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.

para efectos prácticos el valor esperado y la varianza son: E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3

(5)

Equivalentemente, puede escribirse en términos de (correspondiente a la varianza en vez de a la desviación estándar):

Otras propiedades de esta versión de la distribución t son:2

DISTRIBUCIÓN Z.

En estadística y probabilidad se llama distribución normal, distribución de Gauss ó distribución z; a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro estadístico. Esta curva se conoce

como campana de Gauss y es el gráfico de una función gaussiana.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos.

EJEMPLO:

RESOLUCION DEL PROBLEMA: Datos:

n = 30 x =10.547 s = 0.718

Base de datos: Nivel de Hemoglobina en gestaciones de adolescentes en el 3er. Trimestre del embarazo. n = 30

10.9 11.2 9.8 11.6 9.9 10.0 11.2 10.2 10.8 9.5 10.0 10.9 11.5 10.4 10.9

10.3 11.7 11.2 9.8 10.4 11.4 11.3 10.5 10.2 11.1 10.6 9.9 8.9 10.8 9.5

Prueba estadística : Distribución Normal Estándar o Z Si sabemos que:

Media: 10.55

(6)

P(X<11) Hallado en Excel, confirmado en la tabla de la función normalizada z =3.75 La Función de Normalización, z = 0.64

Tenemos los siguientes datos:

Distribución Distribución

Normal Estándar Normal

X 11

Media 10.55 0

Desviación Estándar 0.71 1

Z 0.64

De estos datos podemos hacer la siguiente tabla de distribuciones

X f(X) Z f(Z)

8.42 0.0013 -3 0.0013

9.13 0.0227 -2 0.0227

9.84 0.1591 -1 0.1591

10.55 0.5019 0 0.5019

11.26 0.8432 1 0.8432

11.97 0.9778 2 0.9778

11.26 0.8432 1 0.8432

(7)

INTERPRETACION:

La probabilidad de que el valor de hemoglobina en una gestante adolescente que curse el tercer trimestre del embarazo sea menor a 11 mg/dl es de 0.64. Es decir, el 64% de las gestantes adolescentes que acuden a maternidad de Lima sufren de anemia, asociado a la gestación.

CONCLUSIONES:

 Si se toma una gestante al azahar existe la probabilidad de 0.64 de que tenga anemia es decir valores de Hb < 11 mg/dl.

 El nivel de hemoglobina en gestantes adolescentes en el tercer trimestre, es en un 64% menor a 11 mmg/dl.

ESTUDIO RETROSPECTIVO.

Es un estudio longitudinal en el tiempo que se analiza en el presente, pero con datos del pasado.

ESTUDIO PROSPECTIVO.

Es un estudio longitudinal en el tiempo que se diseña y comienza a realizarse en el presente, pero los datos se analizan transcurrido un determinado tiempo, en el futuro.

ESTUDIO LONGITUDINAL.

Es un tipo de estudio observacional que investiga al mismo grupo de gente de manera repetida a lo largo de un período de años, en ocasiones décadas o incluso siglos, en investigaciones científicas que requieren el manejo de datos estadísticos sobre varias generaciones

consecutivas de progenitores y descendientes.

ESTUDIO TRANSVERSAL.

(8)

un momento dado. Los estudios transversales, frente a los estudios longitudinales, confunden los efectos de edad y de cohorte, pueden no diferenciar si la causa de un cambio está en las diferencias de edad o en las diferencias en el momento del nacimiento.

BIBLIOGRAFÍA.

http://www.monografias.com/trabajos26/distribucion-continua/distribucion-continua.shtml

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal http://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student http://es.wikipedia.org/wiki/Distribuci%C3%B3n_%CF%87%C2%B2 http://www.itch.edu.mx/academic/industrial/estadistica1/cap03c.html http://es.wikipedia.org/wiki/Prueba_F_de_Fisher

http://es.wikipedia.org/wiki/Estudio_longitudinal http://es.wikipedia.org/wiki/Estudio_transversal