Curso de nivelación Estadística y Matemática
Pruebas de hipótesis, Mínimos Cuadrados Ordinarios y ModelosARIMA
Luis Diego Fernández Gómez Programa Técnico en Riesgo, 2017
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón
3 Modelo de Regresión
Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste
4 Modelo de series de tiempo
Componentes de una serie de tiempo Estadísticos importantes
Estacionariedad
Pasos para realizar una prueba de hipótesis
Prueba de hipotesisEnuncia laH0 y la H1, además del nivel de signicancia (α).
Seleccionar el estadístico de prueba apropiado y calcular el valor del estadístico de prueba de los datos muestrales. Establecer la región crítica (cálcule los grados de libertad si es el caso).
Tome la decisión.
Si el valor del estadístico de prueba cae en la región crítica o si el P-value es menor que el nivel de signicancia, rechazar laH0.
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión
Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo
Componentes de una serie de tiempo Estadísticos importantes
Estacionariedad
Asociación
¾Qué es la asociación?
Es la relación entre dos variables. Existe una relación entre dos variables si los valores de una variable tienden a ocurrir con más frecuencia con ciertos valores de otra variable. Busca medir la fuerza o intensidad de la relación.
Para determinar la medida de asociación a calcular se debe determinar primero el nivel de medición de las dos variables en estudio.
Ejemplos medidas de Asociación
Si tenemos variables nominalesClasicación Urbana Rural Total Fila (total marginal)
Por encima del promedio Promedio
Frecuencia Conjunta Por debajo del promedio
Total columna (total marginal)
Si tenemos variables de intervalo o razón
ρ=cov(X,Y) σXσY
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón
3 Modelo de Regresión Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo
Componentes de una serie de tiempo Estadísticos importantes
Estacionariedad
Correlación de Pearson
PasosPrimero realizar un gráco de dispersión.
Para determinar la existencia o no de la relación entre las variables.
Análizar la forma o patrón de la relación, aquí repasaremos la relación lineal
Dirección de la relación.
Luego se debe calcular el coeciente de correlación de Pearson: Cuanticar la relación lineal entre las variables
Siρ=1, existe una asoción lineal positiva.
Siρ=−1, existe una asoción lineal negativa.
Siρ=0, no hay relación lineal pero puede existir una
Correlación de Pearson
Pasos ρX,Y = ∑nx=1 Xi−X Yi−Y (n−1)σXσYAgenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión
Regresión Lineal Simple
Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo
Componentes de una serie de tiempo Estadísticos importantes
Estacionariedad
Regresión lineal simple
El modelo de regresión se basa en métodos estadísticos para estimar relaciones teoricas y poner a prueba estas teorías así como poner en práctica algunas conclusiones.
Es importante determinar si la relación entre las variables son deterministicas o estocásticas (aleatorias).
Serie estocástica una parte conocida (sistemática) susceptible de predecir y de una parte totalmente desconocida (aleatoria). Serie determinística el futuro se puede predecir sin error. Es una variable que está determinada o ja y que no cambia de una muestra a otra.
Ejemplo
Regresión lineal simple
Datos muestrales
Yi= ˆβ0+ ˆβ1Xi+εi Yi = ˆYi+εi
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión
Regresión Lineal Simple
Mínimos Cuadrados Ordinarios
Medidas de Bondad de Ajuste 4 Modelo de series de tiempo
Componentes de una serie de tiempo Estadísticos importantes
Estacionariedad
Míminos Cuadrados Ordinarios
¾Qué son los mínimos cuadrados ordinarios?
Se basa en la idea de determinar una recta que se ajuste a los datos muestrales mejor que cualquier otra recta.
Por lo tanto, busca mínimizar el error al cuadrado de los datos. MCO n
∑
i=1 Yi−Yˆi =εi n∑
i=1 Yi−Yˆi 2 =⇒m´ınima n∑
i=1 Yi−βˆ0−βˆ1Xi 2 =⇒m´ınimaMíminos Cuadrados Ordinarios
Modelo Simple ˆ β0= ¯Y−βˆ1X¯ ˆ β1=Cov(X,Y) Var(X) Modelo Múltiple ˆ β = X0X−1X0YSupuestos MCO
Supuestos de especicación y forma La variable X (explicativa) está dada.
No correlación entre el término de error y las variables explicativas.
El modelo esta bien especicado. Lineal en los parámetros.
Supuestos sobre el residuo No autocorrelación. Homocedasticidad. Normalidad.
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión
Regresión Lineal Simple Mínimos Cuadrados Ordinarios
Medidas de Bondad de Ajuste
4 Modelo de series de tiempo
Componentes de una serie de tiempo Estadísticos importantes
Estacionariedad
Error estándar de la estimación
Error estándar de la estimaciónMedida del grado de dispersión de los valores deYi alrededor
de la recta de regresión Fórmula Se = v u u t∑ Yi−Yiˆ 2 n−k
Coeciente de Determinación
Coeciente de DeterminaciónMide que parte de la variabilidad total de la variable dependiente es explicada por el modelo.
Fórmula R2=SCE SCR R2= (correlacion´ )2=Cov(Y,X) 2 σx2σy2
Limitaciones
Algunas limitaciones
No pueden determinar relaciones Causa-Efecto.
Problema cuando dos variables no relacionadas parecen presentar alguna relación (Correlación espurea).
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión
Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo
Componentes de una serie de tiempo
Estadísticos importantes Estacionariedad
Series de tiempo
Qué es una serie de tiempo?
Las series de tiempo son colecciones de observaciones sobre un determinado fenómeno efectuadas en sucesivos momentos del tiempo, usualmente equiespaciados. Corresponde a una realización de un proceso generador de datos.
Series de tiempo
Componentes de una serie de tiempo
Tendencia (T): Es un movimiento de larga duración que se mantiene durante todo el período de observación.
Movimientos cíclicos (C): Son oscilaciones alrededor de la tendencia producidos por periodos alternativos de prosperidad y depresión.
Variación estacional (E): Son los movimientos que se producen dentro del año y que se repiten de un año a otro. Se observa en algunas series de periodicidad mayor al año
(mensual, trimestral, semanal, etc).
Movimientos irregulares (I): Son las oscilaciones erráticas o accidentales que obedecen a variadas causas. No siguen ningún patrón (son impredecibles).
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión
Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo
Componentes de una serie de tiempo
Estadísticos importantes
Estacionariedad
Estadísticos
Autocorrelación
La correlación entreYt y Yt−k se conoce como autocorrelación de
ordenk y se denota como ρk. (rk es el estimador muestral). Yt−k
se le conoce como rezagadak periodos. rk =∑
n−k
t=1(Yt−Y¯)(Yt−k−Y¯) ∑nt=1(Yt−Y¯)2
Estadísticos
Autocorrelación parcial
La correlación parcial mide el grado de asociación entreYt y Yt−k,
cuando el efecto de otros rezagos es removido. La correlación parcial es calculada mediante una ecuación de regresión, donde los coecientes de los rezagos de Y representan la correlación parcial, del siguiente modo
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión
Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo
Componentes de una serie de tiempo Estadísticos importantes
Estacionariedad
Qué es la estacionariedad?
EstacionariedadSe dice que el proceso está en equilibrio estadístico alrededor de un valor medio.
La distribución de probabilidad es común e invariante en el tiempo:
La media es única (local y global) y representativa de todo el período analizado.
La varianza es constante y nita.
La función de autocorrelación decae rápidamente en el tiempo. Un shock en un momento dado tiene efecto en el corto plazo.
Agenda
1 Pruebas de Hipótesis 2 Medidas de Asociación
Asociación
Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión
Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo
Componentes de una serie de tiempo Estadísticos importantes
Estacionariedad
Qué tipos de modelos se pueden utilizar
Ar(p) Yt=c+φ1Yt−1+φ2Yt−2+...+φpYt−p+εt Ma(q) Yt=c+θ1εt−1+θ2εt−2+...+θqεt−q+εt Arma(p,q) Yt=c+φ1Yt−1+...+φpYt−p+θ1εt−1+...+θqεt−q+εtPronóstico
Autoselección del modelo
Existen diversos algorítmos que permiten determinar el orden más adecuado para un modelo ARIMA, en nuestro caso se utiliza el siguiente cómando: Ejemplo auto.arima(x,d=NA,D=NA, max.p=5,max.q=5,max.P=2,max.Q=2, max.order=5,max.d=2,max.D=1,start.p=2, start.q=2,start.P=1,start.Q=1, stationary=FALSE,seasonal=TRUE)
Bibliografía
Woodridge, J.
Introducción a la Econometría. Thomson Learning, 2001.
Maddala, G.
Introducción a la Econometría
Prentice Hall, 1996.
Woodridge, J.
EconometricAnalysis of Cross Section And Panel Data. MIT
press, 2010.
Webster L., Allen
Estadística aplicada a los negocios y la economía