• No se han encontrado resultados

Curso de nivelación Estadística y Matemática

N/A
N/A
Protected

Academic year: 2021

Share "Curso de nivelación Estadística y Matemática"

Copied!
41
0
0

Texto completo

(1)

Curso de nivelación Estadística y Matemática

Pruebas de hipótesis, Mínimos Cuadrados Ordinarios y Modelos

ARIMA

Luis Diego Fernández Gómez Programa Técnico en Riesgo, 2017

(2)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón

3 Modelo de Regresión

Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste

4 Modelo de series de tiempo

Componentes de una serie de tiempo Estadísticos importantes

Estacionariedad

(3)

Pasos para realizar una prueba de hipótesis

Prueba de hipotesis

Enuncia laH0 y la H1, además del nivel de signicancia (α).

Seleccionar el estadístico de prueba apropiado y calcular el valor del estadístico de prueba de los datos muestrales. Establecer la región crítica (cálcule los grados de libertad si es el caso).

Tome la decisión.

Si el valor del estadístico de prueba cae en la región crítica o si el P-value es menor que el nivel de signicancia, rechazar laH0.

(4)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión

Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo

Componentes de una serie de tiempo Estadísticos importantes

Estacionariedad

(5)

Asociación

¾Qué es la asociación?

Es la relación entre dos variables. Existe una relación entre dos variables si los valores de una variable tienden a ocurrir con más frecuencia con ciertos valores de otra variable. Busca medir la fuerza o intensidad de la relación.

Para determinar la medida de asociación a calcular se debe determinar primero el nivel de medición de las dos variables en estudio.

(6)

Ejemplos medidas de Asociación

Si tenemos variables nominales

Clasicación Urbana Rural Total Fila (total marginal)

Por encima del promedio Promedio

Frecuencia Conjunta Por debajo del promedio

Total columna (total marginal)

Si tenemos variables de intervalo o razón

ρ=cov(X,Y) σXσY

(7)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón

3 Modelo de Regresión Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo

Componentes de una serie de tiempo Estadísticos importantes

Estacionariedad

(8)

Correlación de Pearson

Pasos

Primero realizar un gráco de dispersión.

Para determinar la existencia o no de la relación entre las variables.

Análizar la forma o patrón de la relación, aquí repasaremos la relación lineal

Dirección de la relación.

Luego se debe calcular el coeciente de correlación de Pearson: Cuanticar la relación lineal entre las variables

Siρ=1, existe una asoción lineal positiva.

Siρ=−1, existe una asoción lineal negativa.

Siρ=0, no hay relación lineal pero puede existir una

(9)

Correlación de Pearson

Pasos ρX,Y = ∑nx=1 Xi−X Yi−Y (n−1)σXσY

(10)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión

Regresión Lineal Simple

Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo

Componentes de una serie de tiempo Estadísticos importantes

Estacionariedad

(11)
(12)

Regresión lineal simple

El modelo de regresión se basa en métodos estadísticos para estimar relaciones teoricas y poner a prueba estas teorías así como poner en práctica algunas conclusiones.

Es importante determinar si la relación entre las variables son deterministicas o estocásticas (aleatorias).

Serie estocástica una parte conocida (sistemática) susceptible de predecir y de una parte totalmente desconocida (aleatoria). Serie determinística el futuro se puede predecir sin error. Es una variable que está determinada o ja y que no cambia de una muestra a otra.

Ejemplo

(13)

Regresión lineal simple

Datos muestrales

Yi= ˆβ0+ ˆβ1Xi+εi Yi = ˆYi+εi

(14)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión

Regresión Lineal Simple

Mínimos Cuadrados Ordinarios

Medidas de Bondad de Ajuste 4 Modelo de series de tiempo

Componentes de una serie de tiempo Estadísticos importantes

Estacionariedad

(15)

Míminos Cuadrados Ordinarios

¾Qué son los mínimos cuadrados ordinarios?

Se basa en la idea de determinar una recta que se ajuste a los datos muestrales mejor que cualquier otra recta.

Por lo tanto, busca mínimizar el error al cuadrado de los datos. MCO n

i=1 Yi−Yˆi =εi n

i=1 Yi−Yˆi 2 =⇒m´ınima n

i=1 Yi−βˆ0−βˆ1Xi 2 =⇒m´ınima

(16)
(17)

Míminos Cuadrados Ordinarios

Modelo Simple ˆ β0= ¯Y−βˆ1X¯ ˆ β1=Cov(X,Y) Var(X) Modelo Múltiple ˆ β = X0X−1X0Y

(18)
(19)

Supuestos MCO

Supuestos de especicación y forma La variable X (explicativa) está dada.

No correlación entre el término de error y las variables explicativas.

El modelo esta bien especicado. Lineal en los parámetros.

Supuestos sobre el residuo No autocorrelación. Homocedasticidad. Normalidad.

(20)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión

Regresión Lineal Simple Mínimos Cuadrados Ordinarios

Medidas de Bondad de Ajuste

4 Modelo de series de tiempo

Componentes de una serie de tiempo Estadísticos importantes

Estacionariedad

(21)

Error estándar de la estimación

Error estándar de la estimación

Medida del grado de dispersión de los valores deYi alrededor

de la recta de regresión Fórmula Se = v u u t∑ Yi−Yiˆ 2 n−k

(22)

Coeciente de Determinación

Coeciente de Determinación

Mide que parte de la variabilidad total de la variable dependiente es explicada por el modelo.

Fórmula R2=SCE SCR R2= (correlacion´ )2=Cov(Y,X) 2 σxy2

(23)
(24)

Limitaciones

Algunas limitaciones

No pueden determinar relaciones Causa-Efecto.

Problema cuando dos variables no relacionadas parecen presentar alguna relación (Correlación espurea).

(25)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión

Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo

Componentes de una serie de tiempo

Estadísticos importantes Estacionariedad

(26)

Series de tiempo

Qué es una serie de tiempo?

Las series de tiempo son colecciones de observaciones sobre un determinado fenómeno efectuadas en sucesivos momentos del tiempo, usualmente equiespaciados. Corresponde a una realización de un proceso generador de datos.

(27)

Series de tiempo

Componentes de una serie de tiempo

Tendencia (T): Es un movimiento de larga duración que se mantiene durante todo el período de observación.

Movimientos cíclicos (C): Son oscilaciones alrededor de la tendencia producidos por periodos alternativos de prosperidad y depresión.

Variación estacional (E): Son los movimientos que se producen dentro del año y que se repiten de un año a otro. Se observa en algunas series de periodicidad mayor al año

(mensual, trimestral, semanal, etc).

Movimientos irregulares (I): Son las oscilaciones erráticas o accidentales que obedecen a variadas causas. No siguen ningún patrón (son impredecibles).

(28)
(29)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión

Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo

Componentes de una serie de tiempo

Estadísticos importantes

Estacionariedad

(30)

Estadísticos

Autocorrelación

La correlación entreYt y Yt−k se conoce como autocorrelación de

ordenk y se denota como ρk. (rk es el estimador muestral). Yt−k

se le conoce como rezagadak periodos. rk =∑

n−k

t=1(Yt−Y¯)(Yt−k−Y¯) ∑nt=1(Yt−Y¯)2

(31)

Estadísticos

Autocorrelación parcial

La correlación parcial mide el grado de asociación entreYt y Yt−k,

cuando el efecto de otros rezagos es removido. La correlación parcial es calculada mediante una ecuación de regresión, donde los coecientes de los rezagos de Y representan la correlación parcial, del siguiente modo

(32)
(33)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión

Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo

Componentes de una serie de tiempo Estadísticos importantes

Estacionariedad

(34)

Qué es la estacionariedad?

Estacionariedad

Se dice que el proceso está en equilibrio estadístico alrededor de un valor medio.

La distribución de probabilidad es común e invariante en el tiempo:

La media es única (local y global) y representativa de todo el período analizado.

La varianza es constante y nita.

La función de autocorrelación decae rápidamente en el tiempo. Un shock en un momento dado tiene efecto en el corto plazo.

(35)
(36)
(37)

Agenda

1 Pruebas de Hipótesis 2 Medidas de Asociación

Asociación

Medidas de asociación para variables intervalo y razón 3 Modelo de Regresión

Regresión Lineal Simple Mínimos Cuadrados Ordinarios Medidas de Bondad de Ajuste 4 Modelo de series de tiempo

Componentes de una serie de tiempo Estadísticos importantes

Estacionariedad

(38)

Qué tipos de modelos se pueden utilizar

Ar(p) Yt=c+φ1Yt−12Yt−2+...+φpYt−p+εt Ma(q) Yt=c+θ1εt−12εt−2+...+θqεt−q+εt Arma(p,q) Yt=c+φ1Yt−1+...+φpYt−p+θ1εt−1+...+θqεt−q+εt

(39)

Pronóstico

Autoselección del modelo

Existen diversos algorítmos que permiten determinar el orden más adecuado para un modelo ARIMA, en nuestro caso se utiliza el siguiente cómando: Ejemplo auto.arima(x,d=NA,D=NA, max.p=5,max.q=5,max.P=2,max.Q=2, max.order=5,max.d=2,max.D=1,start.p=2, start.q=2,start.P=1,start.Q=1, stationary=FALSE,seasonal=TRUE)

(40)
(41)

Bibliografía

Woodridge, J.

Introducción a la Econometría. Thomson Learning, 2001.

Maddala, G.

Introducción a la Econometría

Prentice Hall, 1996.

Woodridge, J.

EconometricAnalysis of Cross Section And Panel Data. MIT

press, 2010.

Webster L., Allen

Estadística aplicada a los negocios y la economía

Referencias

Documento similar

La recta de regresión de Y sobre X se muestra como una buen modelo para explicar la relación entre dos variables numéricas?. En una población se obtiene con una bondad de ajuste de

Partiendo de mínimos cuadrados ordinarios para estimar el modelo lineal general se irá avanzando en otros métodos a medida que se vayan relajando supuestos como

Suma y resta de Matrices Multiplicación de Matrices Inversa de una matriz Cadenas de Markov 2 Derivadas Definición Reglas de diferenciación Derivadas parciales 3 Integrales

III.- OBJETIVOS a Comprender los métodos de estimación de máxima verosimilitud y de los mínimos cuadrados b Conocer y comprender los modelos estadísticos de regresión lineal simple y

 Resolver problemas de modelamiento que impliquen estimar e interpretar métodos estadísticos multivariados como regresión lineal y análisis de componentes principales..

Se utilizó el método de regresión lineal múltiple aproximación de mínimos cuadrados para más de dos variables, para determinar el modelo matemático que relacione los

En este apartado vamos a tratar cómo estimar un modelo de regresión por mínimos cuadrados ordinarios, así como la creación de variables ficticias, cómo realizar contrastes

2.17.- Regresión lineal simple (Conceptos generales. Regresión lineal de una población. Método de los mínimos cuadrados. Inferencia de coeficientes de regresión. Inferencia de