Fundamentos de Estadística

(1)

0 .5 s e tg ra y 0 0 .5 s e tg ra y 1

Fundamentos de Estadística

Introducción a la Estadística

Prof. Dr. Eduardo Valenzuela Dom´ınguez [email protected]

(2)

Introducción

Modelación

(3)

Introducción

Modelación

Realidad versus Modelo

(4)

Introducción

Modelación

• _{Modelos Deterministicos}

(5)

Introducción

Modelación

• _{Modelos Deterministicos}

(6)

Definición

Estadistica: Mezcla entre ciencia y arte que

entrega herramientas para modelar fenómenos no-deterministicos

(7)

Definición

Algunas aplicaciones:

(8)

Definición

• _Ingeniería

(9)

Definición

• _Ingeniería

• _{Compañías de Seguros} • _{Estudios de Mercado}

(10)

Definición

entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • _Ingeniería • _{Compañías de Seguros} • _{Estudios de Mercado} • _{Control de Calidad}

(11)

Definición

• _Ingeniería

• _{Compañías de Seguros} • _{Estudios de Mercado}

(12)

Definición

entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • _Ingeniería • _{Compañías de Seguros} • _{Estudios de Mercado} • _{Control de Calidad} • _{Instrumentos Financieros} • _Medicina

(13)

Algunos Términos

• _{Población: Colección completa de todas los}

individuos de interes para el investigador.

• _{Parámetro: Valor que caracteriza un aspecto}

de la población.

• _{Muestra: Subconjunto de la población y que}

es representativa de esta.

(14)

Técnicas de Muestreo

• _{Muestreo Aleatorio simple: Procedimiento}

mediante el cuál todas las muestras de un determinado tamaño, poseen la misma

"chance" de ser extraidas.

• _{Muestreo Aleatorio Estratificado: Esquema}

de muestreo que primero particiona a la población en diversos "estratos" y

posteriormente extrae una mustra aleatoria simple en cada uno de ellos.

(15)

Muestreo

• _{Error muestral: Diferencia entre el valor del}

parámetro poblacional y el producido por el estadistico o estadigrafo basado en una

muestra.

• _{Sesgo muestral: Tendencia a favorecer la}

selección de determinados individuos de la población.

(16)

Muestreo

• _{Población vs Muestra}

• _{Muestreo implica Error muestral}

• _{Acotar la probabilidad de cometer errores}

Estadistica

• _Descriptiva • _Inferencial

(17)

Tipos de Variables

• _{Variables cualitativas: Caracteristica que}

representa una cualidad de los individuos poblacionales.

• _{Variables cuantitativas: Caracteristica que}

corresponde a una magnitud asociada a los individuos de la población.

(18)

Escalas de Medición

• _{Escala nominal: Nombres o clases que se}

utilizan para organizar los datos en categorias separadas y distintas.

• _{Escala ordinal: Mediciones que jerarquizan}

los datos en categorias, ordenadas en virtud de un determinado criterio.

(19)

Escalas de Medición

• _{Escala de intervalos: Mediciones respecto de}

una escala numerica en la cual la diferencia entre valores tiene interpretación y la

ubicación del cero es arbitrario.

• _{Escala de proporciones: Mediciones respecto}

de una escala numerica en la cual tanto la diferencia como los cuocientes tienen

(20)

Estadistica Descriptiva

Proporciona procedimientos que permiten organizar, procesar y presentar los datos

muestrales con el fin de extraer información relevante que este contenida en ellos.

Datos Muestrales Clasificación

(21)

Número de clases

Si se dispone de n datos muestrales, se suele usar la regla de “Sturges”:

k _{= [3}, ₃ · _log n_{] + 1}

Ejemplo: Para n = 1000, usar:

k = [3, 3 _· log 1000] + 1 = [3, 3 _· 3] + 1 = 9 + 1 = 10

(22)

Observaciones y Preguntas

• _{Las clases deben ser excluyentes y todo}

elemento muestral debe pertenecer a una de ellas.

• _{¿Existen clases que concentren mas datos?.} • _{¿Se presenta un comportamiento uniforme?.} • _{¿Se visualiza mas de un punto de}

(23)

Construcción de clases

Si los datos muestrales estan medidos por lo menos al nivel de intervalos y si los

representamos por:

x₁, x₂, . . . , x_n

entonces la amplitud de las clases es de:

(24)

Construcción de clases

con esto se determinan los limites superior e inferior de cada clase:

clase limites relacin A₁ _[a₁ _→ b₁_] b₁ ₌ a₁ ₊ c A₂ ]a₂ → b₂] b₂ = a₂ + c

... ... ...

A_k ]a_k → b_k] b_k = a_k + c

(25)

Ejemplo

Consideremos una muestra de n _{= 50} datos:

68 72 50 70 65 83 77 78 80 93

71 74 60 84 72 84 73 81 84 92

77 57 70 59 85 74 78 79 91 102

83 67 66 75 79 82 93 90 101 80

79 69 76 94 71 97 95 83 86 69

(26)

Continuación Ejemplo

min x_i ₌ ₅₀ y _max x_i ₌ ₁₀₂, por lo que

c = 102₆−50 = 8, 7 redondeando, tomaremos c = 9, con lo que las clases quedan:

clase limites marca de clase A₁ _[50 _→ _59] ₅₄, ₅ A₂ ]59 _→ 68] 63, 5 A₃ _]68 → _77] ₇₂, ₅ A₄ ]77 _→ 86] 81, 5 A₅ ]86 _→ 95] 90, 5 A₆ _]95 _→ _104] ₉₉, ₅

(27)

Gráfico de Tallo y Hoja

Una forma alternativa de visualizar los datos, es mediante el gráfico de tallo y hoja:

La coma decimal esta un digito a la derecha de los dos puntos:

5 : 079

6 : 0567899

(28)

Distribuciones de Frecuencias

Para descubrir como se “reparten” los datos

entre las clases, consideraremos las frecuencias

• _{Frecuencia absoluta: Es el número de}

observaciones muestrales que caen en cada clase: n_i, para i = 1, . . . , k.

• _{Frecuencia relativa: Es la proporción de}

datos con respecto a toda la muestra que

pertenecen a cada clase: f_i, para i = 1, . . . , k.

• _{Se tiene que:} _f_i = ni

(29)

Distribuciones de Frecuencias

• _{Frecuencia absoluta acumulada: Es la suma}

acumulada de las frecuencias absolutas

hasta cada clase: N_i, para i = 1, . . . , k. con

N_i = Pi

j=1 nj, para i = 1, . . . , k

• _{Frecuencia relativa acumulada: Es la suma}

acumulada de las fercuencias relativas hasta cada clase: F_i, para i = 1, . . . , k. con

(30)

Ejemplo

clase limites n_i N_i f_i F_i A₁ _[50 → _59] ₃ _{3 0}, _{06 0}, ₀₆ A₂ ]59 _→ 68] 5 8 0, 10 0, 16 A₃ _]68 → _{77] 15 23 0}, _{30 0}, ₄₆ A₄ ]77 _→ 86] 17 40 0, 34 0, 80 A₅ ]86 _→ 95] 7 47 0, 14 0, 94 A₆ _]95 _→ _{104] 3 50 0}, _{06 1}, ₀₀ total 50 1, 00

(31)

Representaciones Gráficas

Otra forma de representar la información muestral, es mediante gráficos

• _{Histograma: Se grafican las frecuencias con}

respecto a las diversas clases.

• _{Poligono de frecuencias: Representa las}

frecuencias en las marcas de clases unidas por segmentos de rectas.

(32)

Representaciones Gráficas

• _{Ojiva: Poligonal que une las frecuencias}

acumulativas en cada clase.

• _{Gráfico de barras: Las frecuencias se}

representan por barras proporcionales a ellas.

• _{Gráficos circulares: Las frecuencias se}

(33)

Histograma

0.0 0.01 0.02 0.03 Histograma de x

(34)

Ojiva

x Frec 50 60 70 80 90 100 0.0 0.2 0.4 0.6 0.8 1.0 Ojiva de x

(35)

Pastel

(36)

Estadistica descriptiva bivariada

Analisis descriptivo conjunto de dos o mas

variables. Si ₍x₁, y₁₎, ₍x₂, y₂₎, . . . , ₍x_n, y_n₎ es una muestra bivariada de las variables X e Y . Si k

es el número de clases para X y l, para Y , se definen:

• _{Frecuencia absoluta conjunta: El número de}

observaciones muestrales que caen en la clase A_i segun X y en la clase B_j segun Y .

n_i,j , i _{= 1}, . . . , k, j _{= 1}, . . . , l

• _{Frecuencia relativa conjunta: Proporción}

(37)

Tablas de contingencia

Se definen las frecuencias marginales de X e Y

respectivamente por: n_i,. = l X j=1 n_i,j , n_.,j = k X i=1 n_i,j

y las respectivas frecuencias relativas conjuntas y marginales por:

(38)

Ejemplo

[10;30] ]30;50] ]50;70] n_i,. [1000;2000] 15 8 4 ]2000;3000] 5 12 9 ]3000;4000] 2 13 10 ]4000;5000] 1 16 18 n_.,j 113

(39)

Ejemplo

[10;30] ]30;50] ]50;70] n_i,. [1000;2000] 15 8 4 27 ]2000;3000] 5 12 9 26 ]3000;4000] 2 13 10 25 ]4000;5000] 1 16 18 35 n_.,j 113

(40)

Ejemplo

[10;30] ]30;50] ]50;70] n_i,. [1000;2000] 15 8 4 ]2000;3000] 5 12 9 ]3000;4000] 2 13 10 ]4000;5000] 1 16 18 n_.,j 23 49 41 113

(41)

Ejemplo

[10;30] ]30;50] ]50;70] n_i,. [1000;2000] 15 8 4 27 ]2000;3000] 5 12 9 26 ]3000;4000] 2 13 10 25 ]4000;5000] 1 16 18 35 n_.,j 23 49 41 113

(42)

Medidas de tendencia central

Son estadisticos que proporcionan valores

representativos de la muestra, de tal manera que todos los datos muestrales caen en torno a estos valores.

• _Moda

• _Mediana

• _{Media ( geométrica )} • _{Media ( aritmética )}

(43)

Si los datos muestrales han sido agrupados en clases y estas marcas de clase son x₁, . . . , x_k

con frecuencias relativas f_i. Se define la media de x por ¯ x = k X i=1 f_ix_i = 1 n k X i=1 n_ix_i

(44)

Medidas de variabilidad

Las medidas de variabilidad o de dispersión,

pretenden cuantificar el grado de homogeneidad presente en la muestra; determinan que tan

concentrados o dispersos estan los datos. Algunas medidad de dispersión son:

• _Rango

• _{Desviación media}

• _{Rango intercuartílico}

(45)

La varianza se define por: S_x2 = k X i=1 f_i(x_i − x¯)2 = 1 n k X i=1 n_i(x_i − x¯)2

y la desviación estandar por:

(46)

Observación

Cabe hacer notar que cuando la varianza muestral se usa como un estimador de la

varianza poblacional, su definición se modifica levemente en la forma: S2 ₌ 1 n − 1 k X i=1 n_i₍x_i ₋ x_¯₎2

Esta varianza modificada es preferible como

estimador, pues posee mejores propiedades que

(47)

Desigualdad de Tschebyscheff

Una interpretación interesante de la desviacion estandar es la proporcionada por la

“Desigualdad de Tschebyscheff”, que plantea intuitivamente que:

En todo conjunto de observaciones y para todo numero real r > 1, se tiene que al menos ₁ ₋ _r1₂ de ellas caen en el intervalo:

(48)

Gráficamente:

• • • • •

(49)

Resumen

Las principales medidas descriptivas de la muestra son:

•

Resumen de $x$

Min. 1st Q. Med. Mean 3rd Q. Max.

(50)

Gráfico de Cajón

-1.0 -0.5 0.0 0.5 1.0

(51)

Elementos de Inferencia Estadística

Al modelar un fenómeno en la vida real, las

variables que nos interesan generalmente son de naturaleza no-deterministica y en consecuencia pueden representarse por variables aleatorias. Para poder obtener probabilidades asociadas a estas variables aleatorias X, podemos ocupar su funcion de distribucion F_X:

(52)

Problema

Pero en la mayoria de los casos, esta función, dependerá de parámetros desconocidos θ, es decir tenemos:

F_X₍x_; θ_{) =} P _[X _≤ x_]

y para que estos modelos sean de alguna

utilidad, se requiere previamente estimar estos parametros a partir de informacion empírica

recopilada a partir de una muestra aleatoria de

(53)

Problemas

Esto nos lleva a los principales problemas de la inferencia estadistica:

(54)

Problemas

(55)

Problemas

• _{Estimacion puntual.}

(56)

Problemas

• _{Estimacion puntual.}

• _{Estimacion por intervalos de confianza.} • _{Prueba de hipotesis.}

(57)

Estimacion puntual

En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos:

(58)

Estimacion puntual

• _{Método de momentos.}

Lo que hace necesario definir cualidades de los estimadores, para asi poder seleccionar el

(59)

Estimacion puntual

• _{Método de minimos cuadrados.}

(60)

Estimacion puntual

• _{Método de minimos cuadrados.} • _{Método de máxima verosimilitud.}

Lo que hace necesario definir cualidades de los estimadores, para asi poder seleccionar el

(61)

Propiedades

Entre las principales propiedades de los estimadores se cuentan:

(62)

Propiedades

(63)

Propiedades

• _{Insesgamiento} • _{Varianza minima}

(64)

Propiedades

(65)

Propiedades

• _{Error cuadratico minimo} • _Eficiencia

(66)

Propiedades

• _{Error cuadratico minimo} • _Eficiencia

(67)

Ejemplo

Supongamos que la variable aleatoria X esta distribuida normalmente:

X ∼ N ₍µ, σ2₎

Se dice que X₁, . . . , X_n es una Muestra aleatoria de X, si:

(68)

Ejemplo

Usando estos “datos” se pueden obtener

estimadores puntuales de los parametros µ y σ2, los cuales poseen varias de las propiedades

anteriores; ellos son:

¯ X_n = 1 n n X i=1 X_i S_n2 ₌ 1 n − 1 n X i=1 (X_i ₋ X¯_n₎2

(69)

Ejemplo

Notemos que los valores que estos estimadores producen, dependen de los valores muestrales y en consecuencia cambiaran de una a otra

muestra.

Esto nos lleva a considerar las distribuciones muestrales de estos estimadores.

(70)

Distribuciones muestrales

Bajo la suposicion de que:

X ∼ N (µ, σ2)

se puede verificar que la distribucion empirica de la media muestral a partir de una muestra

aleatoria de tamaño n es:

¯

X_n _{∼ N} ₍µ, σ

2

n )

(71)

Distribuciones muestrales

Analogamente la distribucion empirica de la varianza muestral es:

(n − ₁₎S_n2

σ2 ∼ χ

2₍_n

− 1)

que se denomina Chi cuadrado con n − 1 grados de

libertad y que para usarla al igual que la normal,

(72)

Otras distribuciones

Ademas de estas distribuciones, es necesario considerar otras mas que aparecen en los

procesos de estimacion y prueba de hipotesis, ellas son:

• _{La distribucion} t de student con k grados de libertad, que se simboliza por t(k).

• _{La distribucion} Fisher con k y l grados de libertad,

(73)

Otras distribuciones

Analogamente a la distribucion normal y chi-cuadrado, para evaluar probabilidades asociadas a ellas, es necesario obtener los valores usando una tabla estadistica, una

calculadora que las tenga implementadas o un programa computacional adecuado.

(74)

Observación

Cabe hacer notar que si bien es cierto estos estimadores puntuales, al evaluarlos en los datos muestrales, nos proporcionan una

estimacion puntual, que sirve para aproximar el valor desconocido del parametro en estudio;

ellos no entregan idea alguna sobre el error que se produce en este proceso de estimacion.

(75)

Observación

Para poder cuantificar este error, se requeriria

estimar los parametros por medio de un intervalo de confianza, que nos indique una region que

pudiera contener al parametro buscado, mas una evaluacion de la proporcion de veces que

tomaremos una decision correcta al usar este

procedimiento, para estimar los parametros; esto se conoce como el coeficiente de confianza

(76)

Estimacion por intervalos de confianza

Llamaremos un intervalo de confianza para el

parametro θ con coeficiente de confianza γ, a un intervalo del tipo:

[T₁₍X₁, . . . , X_n_); T₂₍X₁, . . . , X_n_)]

que cumpla:

(77)

Estimacion por intervalos de confianza

Se puede ver que si X ∼ N (µ, σ2), entonces el

intervalo de confianza para µ con coeficiente de confianza γ esta dado por:

[ ˆX_n ₋ √Sn

n · t(1+γ)/2(n − 1); ˆXn +

S_n

√

(78)

Observación

Existen algunas situaciones en las cuales la varianza σ2 se conoce y por lo tanto no se requiere previamente estimarla.

Tambien en aquellos casos en que el tamaño muestral n crece tendiendo a infinito n _{→ ∞}, se puede verificar que la distribucion t de student se aproxima en un cierto sentido a la distribucion

(79)

Observación

Para estas situaciones, que se denominan

muestras grandes, el intervalo de confianza para la media muestral Xˆ_n se transforma en:

[ ˆX_n ₋ √σ

n · z(1+γ)/2; ˆXn +

σ

√

(80)

Continuación

Analogamente se puede obtener el intervalo de confianza para σ2 con coeficiente de confianza

γ, resultando: (n − 1) _· S_n2 χ₍₁₊_γ₎_/₂(n − 1); (n − 1) _· S_n2 χ₍₁₋_γ₎_/₂(n − 1)

El uso de estos intervalos de confianza nos permite estimar los parametros de interes,

indicando la “precision” que permiten obtener los datos disponibles.

(81)

Prueba de Hipótesis

Existen situaciones en las cuales se tiene algun conocimiento previo sobre los parametros de

una distribución ( Hipotesis ) y se desea analizar si este supuesto es consecuente con los datos muestrales. Esto lleva a una Prueba de

(82)

(83)

Prueba de Hipótesis

(84)

Prueba de Hipótesis

• _{Una hipotesis nula} _H₀_.

(85)

Prueba de Hipótesis

• _{Una hipotesis alternativa} _H₁_.

• _{Una funcion de los datos} _T(_X₁_{, . . . , X}_n)_{, cuya}

(86)

Prueba de Hipótesis

distribución bajo H₀ se conozca.

(87)

Prueba de Hipótesis

distribución bajo H₀ se conozca.

• _{Un nivel de significancia} 0 _{< α <} 1_. • _{Una región de rechazo.}

(88)

Acciones

Al tomar la decisión de rechazar o no la hipótesis nula sobre la base de los datos muestrales, se

producen las siguientes posibilidades:

acción ; realidad H₀ verdadera H₀ falsa

rechazar H₀ Error I Correcto

no rechazar H₀ Correcto Error II La idea es limitar a valores pequeños las probabilidades de estos errores.

(89)

• • • • •