0 .5 s e tg ra y 0 0 .5 s e tg ra y 1
Fundamentos de Estadística
Introducción a la Estadística
Prof. Dr. Eduardo Valenzuela Dom´ınguez [email protected]
Introducción
ModelaciónIntroducción
ModelaciónRealidad versus Modelo
Introducción
ModelaciónRealidad versus Modelo
• Modelos Deterministicos
Introducción
ModelaciónRealidad versus Modelo
• Modelos Deterministicos
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos no-deterministicos
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos no-deterministicos
Algunas aplicaciones:
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos no-deterministicos
Algunas aplicaciones:
• Ingeniería
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos no-deterministicos
Algunas aplicaciones:
• Ingeniería
• Compañías de Seguros • Estudios de Mercado
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • Ingeniería • Compañías de Seguros • Estudios de Mercado • Control de Calidad
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos no-deterministicos
Algunas aplicaciones:
• Ingeniería
• Compañías de Seguros • Estudios de Mercado
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • Ingeniería • Compañías de Seguros • Estudios de Mercado • Control de Calidad • Instrumentos Financieros • Medicina
Algunos Términos
• Población: Colección completa de todas los
individuos de interes para el investigador.
• Parámetro: Valor que caracteriza un aspecto
de la población.
• Muestra: Subconjunto de la población y que
es representativa de esta.
Técnicas de Muestreo
• Muestreo Aleatorio simple: Procedimiento
mediante el cuál todas las muestras de un determinado tamaño, poseen la misma
"chance" de ser extraidas.
• Muestreo Aleatorio Estratificado: Esquema
de muestreo que primero particiona a la población en diversos "estratos" y
posteriormente extrae una mustra aleatoria simple en cada uno de ellos.
Muestreo
• Error muestral: Diferencia entre el valor del
parámetro poblacional y el producido por el estadistico o estadigrafo basado en una
muestra.
• Sesgo muestral: Tendencia a favorecer la
selección de determinados individuos de la población.
Muestreo
• Población vs Muestra
• Muestreo implica Error muestral
• Acotar la probabilidad de cometer errores
Estadistica
• Descriptiva • Inferencial
Tipos de Variables
• Variables cualitativas: Caracteristica que
representa una cualidad de los individuos poblacionales.
• Variables cuantitativas: Caracteristica que
corresponde a una magnitud asociada a los individuos de la población.
Escalas de Medición
• Escala nominal: Nombres o clases que se
utilizan para organizar los datos en categorias separadas y distintas.
• Escala ordinal: Mediciones que jerarquizan
los datos en categorias, ordenadas en virtud de un determinado criterio.
Escalas de Medición
• Escala de intervalos: Mediciones respecto de
una escala numerica en la cual la diferencia entre valores tiene interpretación y la
ubicación del cero es arbitrario.
• Escala de proporciones: Mediciones respecto
de una escala numerica en la cual tanto la diferencia como los cuocientes tienen
Estadistica Descriptiva
Proporciona procedimientos que permiten organizar, procesar y presentar los datos
muestrales con el fin de extraer información relevante que este contenida en ellos.
Datos Muestrales Clasificación
Número de clases
Si se dispone de n datos muestrales, se suele usar la regla de “Sturges”:
k = [3, 3 · log n] + 1
Ejemplo: Para n = 1000, usar:
k = [3, 3 · log 1000] + 1 = [3, 3 · 3] + 1 = 9 + 1 = 10
Observaciones y Preguntas
• Las clases deben ser excluyentes y todo
elemento muestral debe pertenecer a una de ellas.
• ¿Existen clases que concentren mas datos?. • ¿Se presenta un comportamiento uniforme?. • ¿Se visualiza mas de un punto de
Construcción de clases
Si los datos muestrales estan medidos por lo menos al nivel de intervalos y si los
representamos por:
x1, x2, . . . , xn
entonces la amplitud de las clases es de:
Construcción de clases
con esto se determinan los limites superior e inferior de cada clase:
clase limites relacin A1 [a1 → b1] b1 = a1 + c A2 ]a2 → b2] b2 = a2 + c
... ... ...
Ak ]ak → bk] bk = ak + c
Ejemplo
Consideremos una muestra de n = 50 datos:
68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69
Continuación Ejemplo
min xi = 50 y max xi = 102, por lo que
c = 1026−50 = 8, 7 redondeando, tomaremos c = 9, con lo que las clases quedan:
clase limites marca de clase A1 [50 → 59] 54, 5 A2 ]59 → 68] 63, 5 A3 ]68 → 77] 72, 5 A4 ]77 → 86] 81, 5 A5 ]86 → 95] 90, 5 A6 ]95 → 104] 99, 5
Gráfico de Tallo y Hoja
Una forma alternativa de visualizar los datos, es mediante el gráfico de tallo y hoja:
La coma decimal esta un digito a la derecha de los dos puntos:
5 : 079
6 : 0567899
Distribuciones de Frecuencias
Para descubrir como se “reparten” los datos
entre las clases, consideraremos las frecuencias
• Frecuencia absoluta: Es el número de
observaciones muestrales que caen en cada clase: ni, para i = 1, . . . , k.
• Frecuencia relativa: Es la proporción de
datos con respecto a toda la muestra que
pertenecen a cada clase: fi, para i = 1, . . . , k.
• Se tiene que: fi = ni
Distribuciones de Frecuencias
• Frecuencia absoluta acumulada: Es la suma
acumulada de las frecuencias absolutas
hasta cada clase: Ni, para i = 1, . . . , k. con
Ni = Pi
j=1 nj, para i = 1, . . . , k
• Frecuencia relativa acumulada: Es la suma
acumulada de las fercuencias relativas hasta cada clase: Fi, para i = 1, . . . , k. con
Ejemplo
clase limites ni Ni fi Fi A1 [50 → 59] 3 3 0, 06 0, 06 A2 ]59 → 68] 5 8 0, 10 0, 16 A3 ]68 → 77] 15 23 0, 30 0, 46 A4 ]77 → 86] 17 40 0, 34 0, 80 A5 ]86 → 95] 7 47 0, 14 0, 94 A6 ]95 → 104] 3 50 0, 06 1, 00 total 50 1, 00Representaciones Gráficas
Otra forma de representar la información muestral, es mediante gráficos
• Histograma: Se grafican las frecuencias con
respecto a las diversas clases.
• Poligono de frecuencias: Representa las
frecuencias en las marcas de clases unidas por segmentos de rectas.
Representaciones Gráficas
• Ojiva: Poligonal que une las frecuencias
acumulativas en cada clase.
• Gráfico de barras: Las frecuencias se
representan por barras proporcionales a ellas.
• Gráficos circulares: Las frecuencias se
Histograma
0.0 0.01 0.02 0.03 Histograma de xOjiva
x Frec 50 60 70 80 90 100 0.0 0.2 0.4 0.6 0.8 1.0 Ojiva de xPastel
Estadistica descriptiva bivariada
Analisis descriptivo conjunto de dos o masvariables. Si (x1, y1), (x2, y2), . . . , (xn, yn) es una muestra bivariada de las variables X e Y . Si k
es el número de clases para X y l, para Y , se definen:
• Frecuencia absoluta conjunta: El número de
observaciones muestrales que caen en la clase Ai segun X y en la clase Bj segun Y .
ni,j , i = 1, . . . , k, j = 1, . . . , l
• Frecuencia relativa conjunta: Proporción
Tablas de contingencia
Se definen las frecuencias marginales de X e Y
respectivamente por: ni,. = l X j=1 ni,j , n.,j = k X i=1 ni,j
y las respectivas frecuencias relativas conjuntas y marginales por:
Ejemplo
[10;30] ]30;50] ]50;70] ni,. [1000;2000] 15 8 4 ]2000;3000] 5 12 9 ]3000;4000] 2 13 10 ]4000;5000] 1 16 18 n.,j 113Ejemplo
[10;30] ]30;50] ]50;70] ni,. [1000;2000] 15 8 4 27 ]2000;3000] 5 12 9 26 ]3000;4000] 2 13 10 25 ]4000;5000] 1 16 18 35 n.,j 113Ejemplo
[10;30] ]30;50] ]50;70] ni,. [1000;2000] 15 8 4 ]2000;3000] 5 12 9 ]3000;4000] 2 13 10 ]4000;5000] 1 16 18 n.,j 23 49 41 113Ejemplo
[10;30] ]30;50] ]50;70] ni,. [1000;2000] 15 8 4 27 ]2000;3000] 5 12 9 26 ]3000;4000] 2 13 10 25 ]4000;5000] 1 16 18 35 n.,j 23 49 41 113Medidas de tendencia central
Son estadisticos que proporcionan valoresrepresentativos de la muestra, de tal manera que todos los datos muestrales caen en torno a estos valores.
• Moda
• Mediana
• Media ( geométrica ) • Media ( aritmética )
Si los datos muestrales han sido agrupados en clases y estas marcas de clase son x1, . . . , xk
con frecuencias relativas fi. Se define la media de x por ¯ x = k X i=1 fixi = 1 n k X i=1 nixi
Medidas de variabilidad
Las medidas de variabilidad o de dispersión,
pretenden cuantificar el grado de homogeneidad presente en la muestra; determinan que tan
concentrados o dispersos estan los datos. Algunas medidad de dispersión son:
• Rango
• Desviación media
• Rango intercuartílico
La varianza se define por: Sx2 = k X i=1 fi(xi − x¯)2 = 1 n k X i=1 ni(xi − x¯)2
y la desviación estandar por:
Observación
Cabe hacer notar que cuando la varianza muestral se usa como un estimador de la
varianza poblacional, su definición se modifica levemente en la forma: S2 = 1 n − 1 k X i=1 ni(xi − x¯)2
Esta varianza modificada es preferible como
estimador, pues posee mejores propiedades que
Desigualdad de Tschebyscheff
Una interpretación interesante de la desviacion estandar es la proporcionada por la
“Desigualdad de Tschebyscheff”, que plantea intuitivamente que:
En todo conjunto de observaciones y para todo numero real r > 1, se tiene que al menos 1 − r12 de ellas caen en el intervalo:
Gráficamente:
• • • • •Resumen
Las principales medidas descriptivas de la muestra son:
•
Resumen de $x$
Min. 1st Q. Med. Mean 3rd Q. Max.
Gráfico de Cajón
-1.0 -0.5 0.0 0.5 1.0Elementos de Inferencia Estadística
Al modelar un fenómeno en la vida real, lasvariables que nos interesan generalmente son de naturaleza no-deterministica y en consecuencia pueden representarse por variables aleatorias. Para poder obtener probabilidades asociadas a estas variables aleatorias X, podemos ocupar su funcion de distribucion FX:
Problema
Pero en la mayoria de los casos, esta función, dependerá de parámetros desconocidos θ, es decir tenemos:
FX(x; θ) = P [X ≤ x]
y para que estos modelos sean de alguna
utilidad, se requiere previamente estimar estos parametros a partir de informacion empírica
recopilada a partir de una muestra aleatoria de
Problemas
Esto nos lleva a los principales problemas de la inferencia estadistica:
Problemas
Esto nos lleva a los principales problemas de la inferencia estadistica:
Problemas
Esto nos lleva a los principales problemas de la inferencia estadistica:
• Estimacion puntual.
Problemas
Esto nos lleva a los principales problemas de la inferencia estadistica:
• Estimacion puntual.
• Estimacion por intervalos de confianza. • Prueba de hipotesis.
Estimacion puntual
En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos:
Estimacion puntual
En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos:
• Método de momentos.
Lo que hace necesario definir cualidades de los estimadores, para asi poder seleccionar el
Estimacion puntual
En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos:
• Método de momentos.
• Método de minimos cuadrados.
Estimacion puntual
En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos:
• Método de momentos.
• Método de minimos cuadrados. • Método de máxima verosimilitud.
Lo que hace necesario definir cualidades de los estimadores, para asi poder seleccionar el
Propiedades
Entre las principales propiedades de los estimadores se cuentan:
Propiedades
Entre las principales propiedades de los estimadores se cuentan:
Propiedades
Entre las principales propiedades de los estimadores se cuentan:
• Insesgamiento • Varianza minima
Propiedades
Entre las principales propiedades de los estimadores se cuentan:
• Insesgamiento • Varianza minima
Propiedades
Entre las principales propiedades de los estimadores se cuentan:
• Insesgamiento • Varianza minima
• Error cuadratico minimo • Eficiencia
Propiedades
Entre las principales propiedades de los estimadores se cuentan:
• Insesgamiento • Varianza minima
• Error cuadratico minimo • Eficiencia
Ejemplo
Supongamos que la variable aleatoria X esta distribuida normalmente:
X ∼ N (µ, σ2)
Se dice que X1, . . . , Xn es una Muestra aleatoria de X, si:
Ejemplo
Usando estos “datos” se pueden obtener
estimadores puntuales de los parametros µ y σ2, los cuales poseen varias de las propiedades
anteriores; ellos son:
¯ Xn = 1 n n X i=1 Xi Sn2 = 1 n − 1 n X i=1 (Xi − X¯n)2
Ejemplo
Notemos que los valores que estos estimadores producen, dependen de los valores muestrales y en consecuencia cambiaran de una a otra
muestra.
Esto nos lleva a considerar las distribuciones muestrales de estos estimadores.
Distribuciones muestrales
Bajo la suposicion de que:X ∼ N (µ, σ2)
se puede verificar que la distribucion empirica de la media muestral a partir de una muestra
aleatoria de tamaño n es:
¯
Xn ∼ N (µ, σ
2
n )
Distribuciones muestrales
Analogamente la distribucion empirica de la varianza muestral es:
(n − 1)Sn2
σ2 ∼ χ
2(n
− 1)
que se denomina Chi cuadrado con n − 1 grados de
libertad y que para usarla al igual que la normal,
Otras distribuciones
Ademas de estas distribuciones, es necesario considerar otras mas que aparecen en los
procesos de estimacion y prueba de hipotesis, ellas son:
• La distribucion t de student con k grados de libertad, que se simboliza por t(k).
• La distribucion Fisher con k y l grados de libertad,
Otras distribuciones
Analogamente a la distribucion normal y chi-cuadrado, para evaluar probabilidades asociadas a ellas, es necesario obtener los valores usando una tabla estadistica, una
calculadora que las tenga implementadas o un programa computacional adecuado.
Observación
Cabe hacer notar que si bien es cierto estos estimadores puntuales, al evaluarlos en los datos muestrales, nos proporcionan una
estimacion puntual, que sirve para aproximar el valor desconocido del parametro en estudio;
ellos no entregan idea alguna sobre el error que se produce en este proceso de estimacion.
Observación
Para poder cuantificar este error, se requeriria
estimar los parametros por medio de un intervalo de confianza, que nos indique una region que
pudiera contener al parametro buscado, mas una evaluacion de la proporcion de veces que
tomaremos una decision correcta al usar este
procedimiento, para estimar los parametros; esto se conoce como el coeficiente de confianza
Estimacion por intervalos de confianza
Llamaremos un intervalo de confianza para elparametro θ con coeficiente de confianza γ, a un intervalo del tipo:
[T1(X1, . . . , Xn); T2(X1, . . . , Xn)]
que cumpla:
Estimacion por intervalos de confianza
Se puede ver que si X ∼ N (µ, σ2), entonces elintervalo de confianza para µ con coeficiente de confianza γ esta dado por:
[ ˆXn − √Sn
n · t(1+γ)/2(n − 1); ˆXn +
Sn
√
Observación
Existen algunas situaciones en las cuales la varianza σ2 se conoce y por lo tanto no se requiere previamente estimarla.
Tambien en aquellos casos en que el tamaño muestral n crece tendiendo a infinito n → ∞, se puede verificar que la distribucion t de student se aproxima en un cierto sentido a la distribucion
Observación
Para estas situaciones, que se denominan
muestras grandes, el intervalo de confianza para la media muestral Xˆn se transforma en:
[ ˆXn − √σ
n · z(1+γ)/2; ˆXn +
σ
√
Continuación
Analogamente se puede obtener el intervalo de confianza para σ2 con coeficiente de confianza
γ, resultando: (n − 1) · Sn2 χ(1+γ)/2(n − 1); (n − 1) · Sn2 χ(1−γ)/2(n − 1)
El uso de estos intervalos de confianza nos permite estimar los parametros de interes,
indicando la “precision” que permiten obtener los datos disponibles.
Prueba de Hipótesis
Existen situaciones en las cuales se tiene algun conocimiento previo sobre los parametros de
una distribución ( Hipotesis ) y se desea analizar si este supuesto es consecuente con los datos muestrales. Esto lleva a una Prueba de
Prueba de Hipótesis
Prueba de Hipótesis
• Una hipotesis nula H0.
Prueba de Hipótesis
• Una hipotesis nula H0.
• Una hipotesis alternativa H1.
• Una funcion de los datos T(X1, . . . , Xn), cuya
Prueba de Hipótesis
• Una hipotesis nula H0.
• Una hipotesis alternativa H1.
• Una funcion de los datos T(X1, . . . , Xn), cuya
distribución bajo H0 se conozca.
Prueba de Hipótesis
• Una hipotesis nula H0.
• Una hipotesis alternativa H1.
• Una funcion de los datos T(X1, . . . , Xn), cuya
distribución bajo H0 se conozca.
• Un nivel de significancia 0 < α < 1. • Una región de rechazo.
Acciones
Al tomar la decisión de rechazar o no la hipótesis nula sobre la base de los datos muestrales, se
producen las siguientes posibilidades:
acción ; realidad H0 verdadera H0 falsa
rechazar H0 Error I Correcto
no rechazar H0 Correcto Error II La idea es limitar a valores pequeños las probabilidades de estos errores.
• • • • •