Conceptos básicos de geoestadistica, Eloy Colell [2009]

(1)

Conceptos B´asicos

de Geoestad´ıstica

(2)

(3)

Conceptos B´asicos de Geoestad´ıstica

Editado por

(4)

(5)

Este trabajo es distribuido bajo la licencia Creative Commons Attribution–Noncommercial–NoDerivs 3.0 License.

http://creativecommons.org/licenses/by-nc-nd/3.0 Impreso el d´ıa 15 de agosto de 2010.

(6)

(7)

´Indice general

I

Estad´ıstica

11

1. Estad´ıstica Descriptiva 15

1.1. Propiedades de los Datos . . . 15

1.1.1. Posición . . . 16 1.1.2. Centralización . . . 16 1.1.3. Dispersión . . . 17 1.1.4. Forma . . . 18 1.2. Estad´ıstica Bivariable . . . 20 1.2.1. Covarianza . . . 20 1.2.2. Coeficiente de correlación . . . 21 2. Estad´ıstica Inferencial 23 2.1. Probabilidad . . . 23 2.2. Probabilidad Condicional . . . 24 2.3. Variable Aleatoria . . . 24

2.4. Distribuci´on de probabilidad / Funci´on de densidad . . . 24

2.5. Funci´on de distribuci´on . . . 25

(8)

2.7. Varianza y Desviaci´on T´ıpica . . . 28

2.8. Momentos . . . 29

2.9. Distribuciones de Probabilidad conocidas . . . 30

2.9.1. Distribuci´on Uniforme . . . 30

2.9.2. Distribuci´on de Bernoulli . . . 31

2.9.3. Distribuci´on Binomial . . . 31

2.9.4. Distribuci´on de Poisson . . . 32

2.9.5. Distribuci´on Hipergeom´etrica . . . 32

2.9.6. Distribuci´on Geom´etrica o de Pascal . . . 33

2.9.7. Distribuci´on Binomial negativa . . . 34

2.10. Funciones de Densidad conocidas . . . 34

2.10.1. Distribuci´on Uniforme . . . 35

2.10.2. Distribuci´on Normal o de Laplace-Gauss . . . 35

2.10.3. Distribución Gamma . . . 36 2.10.4. Distribución Exponencial . . . 36 2.10.5. Distribuciónχ2de Pearson . . . 37 2.10.6. Distribución Beta . . . 37 2.10.7. Distribución t de Student . . . . 38 2.10.8. Distribución F de Fisher-Snedecor . . . 38 2.11. Teor´ıa de Muestras . . . 38 2.11.1. Inferencia Estad´ıstica . . . 40

2.11.2. Contraste de Hip ´otesis . . . 41

II

Series Temporales

43

(9)

ÍNDICE GENERAL 5 3.1. Tendencia . . . 48 3.1.1. Análisis gráfico . . . 49 3.1.2. Medias móviles . . . 49 3.1.3. Método anal´ıtico . . . 51 3.1.4. Alisado exponencial . . . 54 3.2. Variación Estacional . . . 55 3.3. Variación C´ıclica . . . 58

3.4. Variaci´on Residual (o Indeterminada) . . . 58

4. Enfoque Causal 61 4.1. Tasas de variaci´on . . . 62

III

Geoestad´ıstica

65

5. Variables regionalizadas 69 6. Hip´otesis estad´ıstica 71 6.1. Estacionalidad de Segundo Orden . . . 71

6.2. Hip ´otesis Intr´ınseca . . . 72

6.3. Comparaci´on de las dos hip ´otesis . . . 72

6.4. Selecci´on de la variable regionalizada . . . 74

7. Variograma 75 7.1. Variograma Experimental . . . 77

7.2. Variograma Te´orico . . . 77

7.2.1. Modelos con un tope . . . 78

(10)

7.3. Ajuste a un modelo teórico . . . 83 7.3.1. A ojo . . . 83 7.3.2. M´ınimos cuadrados . . . 84 7.3.3. Probabilidad máxima . . . 84 7.4. Isotrop´ıa y anisotrop´ıa . . . 85 7.4.1. Anisotrop´ıa geométrica . . . 85 7.4.2. Anisotrop´ıa zonal . . . 86 8. Kriging 87 8.1. Kriging Ordinario . . . 87

8.1.1. Kriging Ordinario Puntual . . . 87

8.1.2. Kriging Ordinario por Bloques . . . 89

8.1.3. El variograma y el kriging . . . 91

8.1.4. El Kriging en la pr´actica . . . 91

8.1.5. Kriging con un variograma “falso” . . . 92

8.1.6. Validaci´on cruzada . . . 92

8.1.7. Kriging con datos inciertos . . . 92

8.1.8. Kriging Simple . . . 93

8.2. M´etodos no estacionales . . . 94

8.2.1. Kriging Universal . . . 95

8.2.2. Kriging con Deriva Externa . . . 99

8.3. Actualizaci´on Simple . . . 99

8.4. Kriging sobre Series Temporales . . . 101

8.4.1. Intr´ınsecas en el espacio-tiempo . . . 101

8.4.2. Intr´ınsecas en el espacio e independientes del tiempo . . . 102

(11)

´INDICE GENERAL 7 8.4.4. Series temporales interpretadas como diferentes realizaciones . . . 103

(12)

(13)

´Indice de figuras

1.1. Coeficiente de Asimetr´ıa . . . 19 1.2. Coeficiente de Kurtosis . . . 20 1.3. Coeficiente de Correlación . . . 21 2.1. Distribución de Probabilidad . . . 25 2.2. Función de Distribución . . . 26 3.1. Serie Temporal . . . 47 3.2. Tendencia . . . 48 3.3. Medias Móviles . . . 51

3.4. M´etodo Anal´ıtico Lineal . . . 52

3.5. M´etodo Anal´ıtico Polinomial . . . 53

3.6. M´etodo Anal´ıtico Exponencial . . . 54

3.7. Alisado Exponencial . . . 56

3.8. IGVE . . . 57

3.9. Desestacionalizaci´on . . . 60

3.10. Ciclicidad por Medias M´oviles . . . 60

4.1. Serie temporal de diferenciales anuales . . . 62

(14)

4.3. Ejemplo de mapa 2D . . . . 67

6.1. La Hip ´otesis Intr´ınseca y la Estacionalidad de Segundo Orden . . . 73

6.2. El variograma y la covarianza . . . . 73

7.1. Nube de puntos de un variograma . . . 76

7.2. Variograma Experimental . . . 76

7.3. Variograma te´orico con efecto pepita puro. . . 79

7.4. Variograma te´orico del modelo esf´erico. . . 80

7.5. Variograma te´orico del modelo exponencial. . . 81

7.6. Variograma te´orico del modelo Gaussiano. . . 82

(15)

Parte I

(16)

(17)

13

Es la rama de la matemática que se ocupa del estudio, análisis y clasificación de datos aleatorios. Se pueden clasificar dos tipos de estad´ısticas: la descriptiva[Ber, Men, Cap, Fer04a] y la inferencial.

(18)

(19)

Cap´ıtulo 1

Estad´ıstica Descriptiva

Se encarga de la organizaci´on, presentaci´on y s´ıntesis de datos. Para esto es necesario clasificar

cada uno de los datos xi (valores de la variable X medida) en clases o intervalos de clases Cj, donde j

representa la j_{− esima clase o intervalo de clase. Esa disposici´on de datos clasificados en forma tabular}

permite construir la distribuci´on de frecuencias ( f ), la cual puede ser mostrada de forma:

Absoluta Cantidad de elementos xipertenecientes a una clase o intervalo de clase Cj. Se llama frecuencia

absoluta, o simplemente frecuencia y se representa mediante la funci´on fj.

Relativa Porci´on de los elementos totales que pertenecen a una clase o intervalo de clase. Se calcula a partir

de la formula fR j= fj

n, siendo n la cantidad de elementos de la muestra y cumplir´a con la ecuaci´on

∑fR j= 1.

Acumulada N´umero de veces que ha aparecido en la muestra un elemento (xi) de una clase o intervalo

de clase menor o igual. Implica cierto orden entre las clases, y se representa mediante la funci´on

fA j= j

∑

t=1

ftpara las absolutas y fAR j= j

∑

t=1

fRtpara las relativas.

1.1. Propiedades de los Datos

En el análisis o interpretación de datos numéricos, se pueden utilizar medidas descriptivas que representan las propiedades de posición, centralización, dispersión y forma, para resumir las carac-ter´ısticas sobresalientes del conjunto de datos. Si estas medidas se calculan con una muestra de datos se denominan estad´ısticos, mientras que si se calculan con la población de datos, se denominan paráme-tros.

(20)

1.1.1. Posici´on

Las propiedades de posición están representadas por los Percentiles, Quartiles y Deciles, detallados a continuación.

Percentiles

Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el

percentil de orden 15 (P15(X)) deja por debajo al 15 % de las observaciones, y por encima queda el

85 %.

Quartiles

Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles:

El primer cuartil Q1(X), es el menor valor xique es mayor que una cuarta parte de los datos.

El segundo cuartil Q2(X), es el menor valor xique es mayor que la mitad de los datos.

El tercer cuartil Q3(X), es el menor valor xique es mayor que tres cuartas partes de los datos.

Deciles

Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son

tam-bi´en un caso particular de los percentiles. Ejemplo, D1(X) = P10(X).

1.1.2. Centralizaci´on

Las propiedades de centralización están representadas por la Media Aritmética, Mediana y Moda, detalladas a continuación.

Mediana

Aparece en el medio de una sucesi´on ordenada de valores.

Si el tama ño de la muestra (n) es un n úmero impar, se representa por el valor numérico de la observa-ción ordenada (coincidiendo en este caso con el percentil 50):

˜

X= x₍n+1

(21)

1.1. PROPIEDADES DE LOS DATOS 17

Por otro lado, si el n ´umero de la muestra es par, se representa con la media de los dos valores intermedios en el arreglo ordenado:

˜ X=x( n 2)+ x(2n+1) 2 (1.2) Media Aritm´etica

Se encuentra al sumar todos los valores en la muestra y luego, al dividir el total por n (el n ´umero de observaciones en la muestra). ¯ X=1 n n

∑

i=1 xi (1.3)

Adem´as se podr´ıa calcular mediante las frecuencias absolutas, donde k representa a la cantidad de clasificaciones de los datos realizadas.

¯ X=1 n k

∑

j=1 ˜ Cjfj (1.4)

Siendo ˜Cjla mediana entre los valores posibles dentro de una clase o intervalo de clase.

Si hay valores extremos, la Media Aritm´etica no es una buena medida de tendencia central. En estos casos se preferir´a la Mediana.

Moda

Es el valor más t´ıpico o más observado. Es la clase con mayor frecuencia. Cuando se trabaja con tablas de frecuencias para variables continuas existirá un intervalo modal.

ˆ

X= Ci;(∀ j, fi≥ fj) (1.5)

1.1.3. Dispersi´on

Las propiedades de dispersión están representadas por el Rango, Varianza, Desv´ıo Estándar y Coeficiente de variación, detallados a continuación.

Rango

Definido como recorrido o amplitud, es la diferencia entre el mayor y el menor valor de los xi.

(22)

Varianza

Es el promedio de los cuadrados de las diferencias entre cada elemento de la muestra y la media obtenida. S2(X) = n

∑

i=1 (xi− ¯X)2 n_{− 1} (1.7)

Si se utiliza n en el divisor se calcula un par´ametro, mientras que con n_{− 1 se obtiene el estad´ıstico}

(ya que se tiene en cuenta la propiedad de los grados de libertad).

Desviaci´on Est´andar

La varianza está compuesta de las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación t´ıpica que se define como la ra´ız cuadrada positiva de la varianza.

S(X) =qS2_{(X) =} v u u u t n

∑

i=1 (xi− ¯X)2 n_{− 1} (1.8) Coeficiente de variaci´on

Es una medida relativa propuesta por Pearson que se utiliza para comparar la dispersión de dos o más series de datos que están expresados en unidades diferentes. A menor diferencia entre los CV más homogéneas son las variables.

CV(X) =S(X)

| ¯X| (1.9)

1.1.4. Forma

Las propiedades de forma est´an representadas por el Coeficiente de Asimetr´ıa y Kurtosis, detalla-das a continuaci´on.

Coeficiente de asimetr´ıa

Cuantifican el grado de asimetr´ıa de la distribución en torno a una medida de centralización. Una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda (valor positivo). Si las frecuencias descienden más

(23)

1.1. PROPIEDADES DE LOS DATOS 19

lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda (valor negativo). Es normal cuando la distribución es simétrica (valor nulo). Ver el ejemplo de la Figura 1.1.

Existen varias medidas de la asimetr´ıa de una distribuci´on de frecuencias.

Seg ´un Pearson:

CAP(X) =

¯

X_{− ˆX}

S(X) (1.10)

Seg ´un Fisher:

CAF(X) = n

∑

i=1 [(xi− ¯X)3fRi] S(X)3 (1.11)

Seg ´un Bowley:

CAB(X) = Q3(X) + Q1(X) − 2 ˜X Q3(X) − Q1(X) = 1 + 2 Q1(X) − ˜X Q3(X) − Q1(X) (1.12) 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 0 0.2 0.4 0.6 0.8 1 Asimetrica a la derecha Normal Asimetrica a la izquierda

Figura 1.1: Disposici´on gr´afica de acuerdo al Coeficiente de Asimetr´ıa

Coeficiente de Kurtosis

Describe el grado de esbeltez de una distribuci´on con respecto a la distribuci´on normal. Se calcula por: CK(X) = n

∑

i=1 [(xi− ¯X)4fRi] S(X)4 (1.13)

(24)

0 0.5 1 1.5 2 2.5 0 0.2 0.4 0.6 0.8 1 Platicurtica Mesocurtica (Normal) Leptocurtica

Figura 1.2: Disposici´on gr´afica de acuerdo al Coeficiente de Kurtosis.

La distribución normal tiene kurtosis igual a tres, es llamada mesoc úrtica. A las distribuciones más agudas, con colas relativamente anchas, se las llama leptoc úrtica, tienen valores de kurtosis mayores que tres, y las distribuciones achatadas en el centro se llaman platic úrticas, tienen valores menores que

tres. En ocasiones se acostumbra a definir la kurtosis como CK_{(X) − 3. Ver el ejemplo de la Figura 1.2.}

1.2. Estad´ıstica Bivariable

Al analizar modelos complejos que dependen de dos o m´as variables, se comienzan a buscar meto-dolog´ıas que comiencen a analizar relaciones entre las diferentes distribuciones de frecuencias (repre-sentadas por variables), en un intento por resumir los resultados.

Las m´as importantes son: la Covarianza y el Coeficiente de correlaci´on.

1.2.1. Covarianza

Determina si existe una relaci´on lineal entre dos variables. Se calcula promediando las

puntuacio-nes diferenciales por su tama ˜no muestral. El resultado fluct ´ua entre+∞y₋∞, por lo que la magnitud

del resultado carece de significado, y lo ´unico importante es el signo que adopte.

Cov(X,Y ) =1 n n

∑

i=1 (xi− ¯X)(yi− ¯Y ) (1.14)

Si Cov(X,Y ) > 0 pendiente de la recta de regresi´on positiva. Indica que hay dependencia directa, es decir las

(25)

1.2. ESTAD´ISTICA BIVARIABLE 21

Si Cov(X,Y ) < 0 pendiente de la recta de regresi´on negativa. Indica que hay dependencia inversa o negativa,

es decir las variaciones de las variables tienen sentido opuesto.

Si Cov_{(X,Y ) ≈ 0 no es posible determinar la pendiente de la recta de regresi´on, por lo que no existe relaci´on}

lineal entre las 2 variables. Podr´ıa existir otro tipo de relaci´on.

1.2.2. Coeficiente de correlaci´on

Eval úa la relación lineal entre dos variables. Permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es satisfactorio. Ver el ejemplo de la Figura 1.3.

Seg ´un Pearson:

CCP(X,Y ) =

Cov(X,Y )

S(X)S(Y ) (1.15)

El coeficiente de correlaci´on, CCP(X,Y ), presenta valores entre –1 y +1.

Cuando r_{≈ 0 no hay correlaci´on lineal entre las variables. La nube de puntos est´a muy dispersa y no se}

puede trazar una recta de regresi´on.

Cuando r_{≈ +1 hay una buena correlaci´on positiva entre las variables seg´un un modelo lineal y la recta de}

regresi´on que se determine tendr´a pendiente positiva.

Cuando r_{≈ −1 hay una buena correlaci´on negativa entre las variables seg´un un modelo lineal y la recta de}

regresi´on que se determine tendr´a pendiente negativa.

20 40 60 80 100 120 140 0 20 40 60 80 100 120 CCP(X,Y)≈ +1 2 4 6 8 10 12 14 16 18 20 0 20 40 60 80 100 120 CCP(X,Y)≈ 0 -120 -100 -80 -60 -40 -20 0 20 0 20 40 60 80 100 120 CCP(X,Y)≈ -1

(26)

(27)

Cap´ıtulo 2

Estad´ıstica Inferencial

Trata de generalizar la información obtenida en una muestra a una población. La bondad de estas deducciones se mide en términos probabil´ısticos, es decir, toda inferencia se acompa ña de su probabilidad de acierto. Por esto se utilizan las probabilidades en las estimaciones, ya que permitirán el avance sobre el Contraste de hipótesis y la Inferencia Bayesiana[Pé03].

2.1. Probabilidad

Mide la frecuencia con la que ocurre un suceso en un experimento bajo condiciones suficientemente estables[Wik]. La notaci´on utilizada es:

P(A) = l´ım

nc→∞

nA

nc

(2.1)

Donde A es el suceso estudiado, nAel n ´umero de veces que el evento A ha ocurrido y ncel n ´umero

de veces que el experimento fue realizado. La tendencia de nca infinito determina la estabilidad de las

condiciones del experimento.

Los resultados de la funci´on se encuentran dentro del intervalo[0, 1] de tal forma que:

Al suceso imposible le corresponde el valor 0. Al suceso seguro le corresponde el valor 1.

(28)

2.2. Probabilidad Condicional

Esta determinada por la posibilidad de que ocurra un suceso dado, como consecuencia de otro. Esta se representa mediante:

P_{(A|B) =}P(A ∩ B)

P(B) (2.2)

A Suceso condicionado por B. B Suceso independiente.

Si se cambia la forma de representar la ecuaci´on

P_{(A|B)P(B) = P(A ∩ B) = P(B|A)P(A)} (2.3)

P_{(A|B) =}P(B|A)P(A)

P(B) (2.4)

2.3. Variable Aleatoria

Se encuentra definida por una función real que asocia un resultado numérico a cada experimento aleatorio. Por ejemplo, si el experimento aleatorio consiste en lanzar 4 veces un dado, y el objetivo es determinar el n úmero de veces que sale el 6 y se define una función X que asigna un valor numérico (cantidad de 6 obtenidos) a cada resultado del experimento. De esta manera tenemos por ejemplo que

X(1632) = 1 o que X(1234) = 0, ya que en el primer experimento sale un 6 en el segundo lanzamiento,

mientras que en el ´ultimo experimento no sale ninguna vez.

Las variables aleatorias y sus distribuciones de probabilidad pueden considerarse una generalización del concepto de frecuencia. Se introducen como el modelo matemático ideal al que se aproximan las distribuciones de frecuencias que se obtendr´ıan en una repetición indefinida de pruebas de este expe-rimento.

Usualmente se clasifican de acuerdo al n ´umero de valores que pueden asumir: las variables aleato-rias discretas (solo pueden adoptar un n ´umero finito o contable de valores) y las variables aleatoaleato-rias continuas (surgen cuando tratamos con cantidades de una escala continua).

2.4. Distribuci´on de probabilidad / Funci´on de densidad

Dependiendo si la variable aleatoria es discreta (v.a.d) o continua (v.a.c.), se mencionará Distribución de Probabilidad o Función de Densidad respectivamente.

(29)

2.5. FUNCI ´ON DE DISTRIBUCI ´ON 25

Sea X una v.a.d. que toma los valores x1, x2, x3, .... Se define P(X = xi) como la probabilidad siguiente:

P(X = xi) = P(xi) = P{ω∈ E/X(ω) = xi} (2.5)

A la tabla formada por los valores que toma la variable junto con sus probabilidades recibe el nombre de distribuci´on de probabilidad de la variable:

X x1 x2 . . . xn . . . P(X = x) P(X = x1) P(X = x2) . . . P(X = xn) . . . 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 -0.4 -0.2 0 0.2 0.4 f(x) P(ei)

Figura 2.1: Ejemplo de una Distribuci´on de Probabilidad.

Ver el ejemplo de la Figura 2.1.

Por otra parte, dada una v.a.c. X , se dice que una funci´on real f(x) no negativa es la funci´on de densidad

de probabilidad (o simplemente funci´on de densidad) de la variable aleatoria X si el ´area encerrada

entre la curva y el eje 0X es igual a la unidad y, adem´as, la probabilidad de que X se encuentre entre

dos valores x1y x2con x1< x2es igual al ´area comprendida entre estos dos valores, es decir,

Z ∞ −∞ f(x)dx = 1 (2.6) P(x1< X < x2) = Z x₂ x1 f(x)dx (2.7)

2.5. Funci´on de distribuci´on

Sea X una v.a., asociada a ella se define la funci´on de distribucin F :R→ [0,1] de la siguiente manera:

(30)

Las propiedades de la funci´on de distribuci´on son:

1. 0_{≤ F(x) ≤ 1∀x ∈ R por representar F(x) la probabilidad de un suceso.} 2. F₍₋∞) = l´ımx→−∞F(x) = 0; pues F(−∞) = P[X ≤ −∞] = P[/0] = 0.

3. F(∞) = l´ımx→∞F(x) = 1; pues F(∞) = P[X ≤∞] = P[E] = 1.

4. F es mon ´otona creciente (no estrictamente), es decir, si x1< x2⇒ F(x1) ≤ F(x2).

5. F es continua por la derecha, es decir, l´ım_h_→0+F(x + h) = F(x).

La función de distribución puede ser especialmente útil para calcular probabilidades ya que:

P_{(X ≤ x) = F(x) (por definici´on).} P_{(X > x) = 1 − P(X ≤ x) = 1 − F(x).} P(x1< X ≤ x2) = P(X ≤ x2) − P(X ≤ x1) = F(x2) − F(x1). 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 0 0.2 0.4 0.6 0.8 1

(a) Distribucion de probabilidad

f(x) FX(a)-FX(b) FX(a) P(a) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0 0.2 0.4 0.6 0.8 1 (b) Funcion de distribucion F_X b a

Figura 2.2: Ejemplo de una Funci´on de Distribuci´on.

En el caso particular que dado X una v.a.d., representa a la funci´on acumulativa

F_{(X) = P(X ≤ x) =}

∑

xi≤x

(31)

2.6. ESPERANZA MATEM ´ATICA 27

Mientras que si X es una v.a.c. se encuentra representado por

F_{(X) = P(X ≤ x) =} Zx

−∞

f(t)dt (2.10)

siendo f_{(t) = P(X = t); ∀t ∈ [−}∞,∞].

Luego se puede expresar f(x) = dF(x)

dx , que es la relación entre la función de distribución y la de

densidad.

Adem´as, si X toma valores en el intervalo(a, b), entonces las integrales infinitas anteriores se reducen

a integrales finitas, como se muestra a continuaci´on.

Zb a f(x)dx = 1 (2.11) F(x) =          0 si x_{≤ a} Z x a f(t)dt si a < x < b 0 si x_{≥ b} (2.12)

2.6. Esperanza Matem´atica

Sea X una v.a.d., la media o esperanza matem´atica se encuentra determinada por la expresi´on:

µX= E[X] = n

∑

i=1

xi.P(X = xi) (2.13)

A diferencia de la media definida en la estad´ıstica descriptiva, los datos est´an probabilizados, por lo que no son exactos.

Por otra parte si X es una v.a.c. quedar´ıa determinada por la siguiente expresi´on:

µX= E[X] =

Z∞

−∞x. f (x)dx (2.14)

El comportamiento de la esperanza matem´atica respecto de las transformaciones lineales es el siguiente:

(32)

2.7. Varianza y Desviaci´on T´ıpica

Dada una v.a.d. X , la varianza viene dada por:

σ2 X= V [X] = E[(X − µX)2] = n

∑

i=1 (xi− µX)2.P(X = xi) (2.16)

y si se desarrolla el cuadrado y se aplican las propiedades de la esperanza, se obtiene:

σ2 X= n

∑

i=1 (x2i − 2xiµX+ µ2X).P(X = xi) (2.17) σ2 X= n

∑

i=1 x2_i.P(X = xi) − 2µX n

∑

i=1 xi.P(X = xi) + µ2X n

∑

i=1 P(X = xi) (2.18) σ2 X= n

∑

i=1 x2_i.P(X = xi) − 2µX.µX+ 1.µ2X (2.19) σ2 X= n

∑

i=1 x2_i.P(X = xi) − 2µ2X+ µ2X (2.20) σ2 X= n

∑

i=1 x2_i.P(X = xi) − µ2X (2.21) V[X] = E[X2] − (E[X])2 (2.22)

Por otra parte, para una v.a.c. X la varianza se define como:

σ2

X= V [X] = E[(X − µX)2] =

Z ∞

−∞(xi− µX)

2_{. f (x)dx} _(2.23)

Pudiendo simplificarse al igual que la v.a.d. mediante la siguiente formula:

V[X] = E[X2] − (E[X])2 (2.24)

Por ´ultimo, ya sea una v.a.d o una v.a.c, la desviaci´on t´ıpica se define como:

σX= +

q σ2

(33)

2.8. MOMENTOS 29

2.8. Momentos

Dada una v.a.d. X , se llama momento de orden k respecto del par´ametro c a la esperanza matem´atica de

la variable_{(X − c)}k_{, es decir:} Mk(c) = n

∑

i=1 (xi− c)k.P(X = xi) (2.26)

Si c= 0 se obtienen los momentos respecto al origen que se representan por mk.

mk= E[Xk] = n

∑

i=1

xk_i.P(X = xi) (2.27)

Si c= µXse obtienen los momentos centrales que se representan por µk.

µk= E[(X − µX)k] = n

∑

i=1

(xi− µX)k.P(X = xi) (2.28)

Mientras que para una v.a.c. X , se llama momento de orden k respecto del par´ametro c a la esperanza

matem´atica de la variable_{(X − c)}k_{, es decir:}

Mk(c) =

Z ∞

−∞(x − c)

k_{. f (x)dx} _(2.29)

Si c= 0 se obtienen los momentos respecto al origen que se representan por mk.

mk= E[Xk] =

Z ∞ −∞

xk. f (x)dx (2.30)

Si c= µXse obtienen los momentos centrales que se representan por µk.

µk= E[(X − µX)k] =

Z ∞

−∞(x − µX)

k_{. f (x)dx} _(2.31)

Por ´ultimo, ya sea una v.a.d. o una v.a.c., se cumplen las propiedades de los momentos:

m0= 1

m1= µX

m2=σ2+ µ2X

(34)

µ1= 0

µ2=σ2= m2− µ2X

2.9. Distribuciones de Probabilidad conocidas

La ley de probabilidades de una v.a.d. X se define si se conoce su distribuci´on de probabilidad P(xi) =

P(X = xi) con i = 1, 2, .., ó bien si se conoce su función de distribución F(x), cumpliéndose:

∑

i≥1 P(X = xi) = 1 F_{(x) = P(X ≤ x) =}

∑

xi≤x P(X = xi)

A continuaci´on se listan algunas de las principales distribuciones de la v.a.d..

2.9.1. Distribuci´on Uniforme

Una v.a.d. X que toma los valores enteros x1, x2, x3, ..., xncon probabilidades

P[X = xk] =

1

n con k= 1, 2, ..., n (2.32)

recibe el nombre de variable uniforme discreta, su distribuci´on de probabilidad distribuci´on uniforme

discreta y se denota por X U(x1, x2, ..., xn).

En el caso particular de que la variable tomo como valores los primeros n ´umeros naturales:

P[X = k] =1

n con k= 1, 2, ..., n (2.33)

Luego, su media, varianza y desviaci´on t´ıpica son:

µx= n+ 1 2 σ2 x= n2_{− 1} 12 σx= r n2_{− 1} 12

(35)

2.9. DISTRIBUCIONES DE PROBABILIDAD CONOCIDAS 31

2.9.2. Distribuci´on de Bernoulli

Recibe el nombre de prueba de Bernoulli, aquel experimento que s´olo admite 2 resultados posibles excluyentes:

Suceso A (representa el ´exito) con probabilidad P(A) = p.

Suceso Ac(representa el fracaso) con probabilidad P(Ac_{) = 1 − p = q.}

Dada la v.a.d. X asociada al experimento que asocia el valor 1 al suceso A con probabilidad p y el valor

0 al suceso Accon probabilidad q. Esta variable recibe el nombre de variable de Bernoulli y se denota

por X Ber(p).

La distribuci´on de probabilidad es:

P_{(X = 1) = p y P(X = 0) = 1 − p = q con p + q = 1} (2.34)

µx= p

σ2

x= p.q

σx= √p.q

2.9.3. Distribuci´on Binomial

Si se supone que se realizan n pruebas de Bernoulli sucesivas e independientes. Entonces, a la v.a.d.

X , que representa el n ´umero de veces que ocurre el suceso A (´exito) en las n pruebas, se la denomina

variable binomial de par´ametro n y p, y se denota por X B(n, p), siendo p la probabilidad de ´exito de

cada prueba de Bernoulli.

La variable binomial X se la puede considerar como la suma de n variables independientes de Bernou-lli, es decir:

(36)

La v.a. definida toma los valores 0, 1, 2, ..., n con la siguiente probabilidad: P(X = k) =n k .pk_.qn−k_con          n= 1, 2, 3, ... k= 1, 2, ..., n 0< p < 1 (2.36)

µx= n.p

σ2

x= n.p.q

σx= √n.p.q

2.9.4. Distribuci´on de Poisson

Una v.a.d. X sigue una distribuci´on de probabilidad de Poisson de par´ametroλy se denota por X P(λ),

si puede tomar todos los valores enteros 0, 1, 2, ... con la siguiente probabilidad:

P(X = k) =λ k k!.e −λ_con (_k_{= 0, 1, 2, ...} λ> 0 (2.37)

µx=λ σ2 x=λ σx= √ λ

2.9.5. Distribuci´on Hipergeom´etrica

Si se considera una poblaci´on de N elementos de dos clases distintas de los cuales D elementos son de

la clase A y N_{− D elementos son de la clase A}c_.

Al tomar un elemento de esta poblaci´on, la probabilidad de que proceda de una u otra clase es:

P(A) =D

N = p → D = p.N (2.38)

P(Ac_{) =}N− D

(37)

2.9. DISTRIBUCIONES DE PROBABILIDAD CONOCIDAS 33

Si se considera el experimento consistente en tomar n elementos consecutivos de una población sin reemplazamiento. A la v.a.d. X , n úmero de elementos de la clase A en una muestra de tama ño n, se la denomina variable hipergeométrica.

Entonces, se denomina distribución hipergeométrica de parámetros N, D y n, y se denota con la

expre-sión X H(N, D, n), a la distribución de probabilidad que se detalla a continuación:

P[X = k] = D k N−D n−k N n = p.N k q.N n−k N n con          N= 1, 2, 3, ... n= 1, 2, ..., N p= 0,_N1,_N2, ..., 1 (2.40)

µx= n.p σ2 x= n.p.q. N_{− n} N_{− 1} σx= r n.p.q.N− n N_{− 1}

2.9.6. Distribuci´on Geom´etrica o de Pascal

Si se considera un experimento que consiste en realizar sucesivas pruebas de Bernoulli. A la v.a.d. X , n úmero de pruebas necesarias para obtener el primer éxito, se la denomina variable geométrica.

Entonces, se denomina distribución geométrica o de Pascal de parámetro p y se denota por X Ge(p),

a la distribuci´on de probabilidad que se detalla a continuaci´on:

P[X = k] = p.qk−1con

(_k= 1, 2, 3, ...

0_{< p < 1; q = 1 − p}

(2.41)

µx= 1 p σ2 x= q p2

(38)

σ= √_q

p

2.9.7. Distribuci´on Binomial negativa

Si se considera un experimento que consiste en realizar sucesivas pruebas de Bernoulli. A la v.a.d. X , n úmero de fracasos antes de obtener el n-ésimo éxito, se la denomina binomial negativa.

Entonces, se denomina distribuci´on binomial negativa de par´ametros n y p, y se denota por X

BN(n, p), a la distribuci´on de probabilidad que se detalla a continuaci´on:

P[X = k] =n + k − 1 k .pn.qkcon          k= 0, 1, 2, 3, ... n= 1, 2, ... 0< p < 1 (2.42)

µx= n.q p σ2 x= n.q p2 σx= √_n_.q p

2.10. Funciones de Densidad conocidas

La ley de probabilidades de una v.a.c. X se define si se conoce su funci´on de densidad f(x) o bien si se

conoce su funci´on de distribuci´on F(x), tal que:

P_{(a < X ≤ b) =} Zb a f(x)dx F_{(x) = P(X ≤ x)} Z∞ −∞ f(x)dx = 1

(39)

2.10. FUNCIONES DE DENSIDAD CONOCIDAS 35

Adem´as, cumple la siguiente relaci´on:

F(x) = Zx −∞ f(t)dt (2.43) f(x) =dF(x) dx (2.44)

A continuaci´on se listan algunas de las principales distribuciones de la v.a.c..

2.10.1. Distribuci´on Uniforme

Una v.a.c. X sigue una distribuci´on uniforme en el intervalo[a, b] y se denota por X U[a, b] cuando su

funci´on de densidad es:

f(x) =      0 si x_{6∈ [a,b]} 1 b_{− a} si x∈ [a,b] (2.45)

µx= a+ b 2 σ2 x=(b − a) 2 12 σx= b_{− a} √ 12

2.10.2. Distribuci´on Normal o de Laplace-Gauss

Una v.a.c. X sigue una distribuci´on normal de media µ y desviaci´on t´ıpicaσy se denota por X N(µ,σ)

cuando su funci´on de densidad es:

f(x) = 1 σ√2πe− 1 2( x−µ σ )2 con (−∞< µ <∞ σ> 0 (2.46)

µx= µ

σ2

x=σ2

(40)

Variable normal tipificada

Si la v.a.c. X es N(µ,σ), la variable normal tipificada también será una distribución normal de media

µz= 0 y desviaci´on t´ıpicaσz= 1:

Z=X− µ

σ (2.47)

Entonces, Z N(0, 1) y su funci´on de densidad es:

f(z) =√1_2πe−21z2 _con₋∞_{< z <}∞ _(2.48)

2.10.3. Distribuci´on Gamma

Una v.a.c. X sigue una distribuci´on gamma y se denota por X G(α, p) cuando su funci´on de densidad

es:

f(x) = α

p

Γ(p)e

−αx_xp−1_{con x}_{> 0} _(2.49)

Se define la funci´on gamma Euler comoΓ(p) =

Z ∞

0

e−xxp−1dx que resulta continua y convergente para p> 0. Entre sus propiedades se destaca:

p.1) Γ(1) = 1

p.2) Γ_{(p) = (p − 1)}Γ_{(p − 1)}

p.3) Si p_{∈ Z}∗entoncesΓ_{(p) = (p − 1)!}

2.10.4. Distribuci´on Exponencial

Es un caso particular de la distribuci´on gamma con p= 1.

X Exp(α) si f (x) =

(α_e−αx_{si x}_{> 0}

0 en el resto

(2.50)

µx=

1 α

(41)

2.10. FUNCIONES DE DENSIDAD CONOCIDAS 37 σ2 x= 1 α2 σx= 1 α

2.10.5. Distribuci´on

χ

2

de Pearson

Es un caso particular de la distribuci´on gamma conα= 1/2 y p = n/2 que se genera mediante la suma

de los cuadrados de n v.a.c. N(0, 1) independientes entre si, es decir, si X1, X2, ..., Xnson n v.a.c. N(0, 1)

independientes entre si, entonces la v.a.c. positivaχ2_nrecibe el nombreχ2de Pearson con n grados de

libertad.

χ2

n= X12+ X22+ ... + Xn2 (2.51)

Entonces, su funci´on de densidad es:

f(x) = 1

2n/2_Γ_(n/2)e−x/2x(n/2)−1con x> 0 (2.52)

µx= n σ2 x= 2n σx= √ 2n

2.10.6. Distribuci´on Beta

Una v.a.c. X sigue una distribuci´on beta y se denota por X β(p, q) si sigue la siguiente funci´on de

distribuci´on:

f(x) =x

p₋₁_{(1 − x)}q₋₁

β(p, q) con x∈ [0,1] (2.53)

Luego, se define la funci´on beta como:

β(p, q) =Γ_Γ(p).Γ(q) (p + q) =

Z 1

0

(42)

2.10.7. Distribuci´on t de Student

Se denomina t de Student con n grados de libertad, si las n+ 1 v.a.c. X, X1, X2, ..., Xnse distribuyen seg ´un

una N(0,σ). tn= X s 1 n n

∑

i=1 X_i2 =pZ X2 n/n (2.55)

Entonces, su funci´on de densidad es:

f(x) = 1 √ n.β1 2, n 2 1+x 2 n − n+ 1 2 _con (_n_{= 1, 2, ...} −∞< x <∞ (2.56)

µx= 0 σ2 x= n n_{− 2}si n> 2 σx= r _n n_{− 2} si n> 2

2.10.8. Distribuci´on F de Fisher-Snedecor

Seanχ2_n 1yχ 2 n2 dos v.a.c.χ 2_{de Pearson con n}

1y n2grados de libertad respectivamente, independientes

entre si. Entonces se denomina F de Fisher-Snedecor con n1y n2grados de libertad a la variable:

Fn1,n2= χ2 n1/n1 χ2 n2/n2 (2.57)

Luego, su funci´on de densidad es:

f(x) =_ΓΓ((n1+ n2)/2) (n1/2)Γ(n2/2) nn1/2 1 n n2/2 2 x(n1/2)−1 (n1x+ n2)(n1+n2)/2 con x> 0 (2.58)

2.11. Teor´ıa de Muestras

La Estad´ıstica tiene como objeto el estudio de un conjunto de personas, cosas o, en general, elementos con alguna caracter´ıstica com ´un a todos ellos. Sin embargo, si se quiere obtener informaci´on sobre una

(43)

2.11. TEOR´IA DE MUESTRAS 39

población, se puede obtener datos de la totalidad (censo) o bien de una parte (muestra). La parte de la estad´ıstica que estudia la relación entre las muestras de una población y la población misma recibe el nombre de Teor´ıa de Muestras.

En la pr´actica, suele ocurrir que no es posible estudiar los datos de toda la poblaci´on, ya que:

el n úmero de la población es muy elevado, el estudio llevar´ıa tanto tiempo que ser´ıa impracticable o econ ómicamente inviable.

el estudio puede implicar la destrucción del elemento estudiado. Por ejemplo, vida útil de una lámpara. los elementos pueden existir conceptualmente, pero no en la realidad. Por ejemplo, la proporción de piezas defectuosas que producirá una máquina.

En estos casos se seleccionan muestras, que permiten obtener el comportamiento promedio para for-mular leyes generales.

Los m´etodos mas destacados para obtener muestras son:

Muestreo aleatorio simple Se elige al azar con reemplazamiento (un elemento no puede ser elegido 2

ve-ces).

Muestreo estratificado Los elementos de la poblaci´on se dividen en clases o estratos. La muestra se toma

asignando un n ´umero o cuota de miembros a cada estrato (proporcional a su tama˜no relativo o a su variabilidad) y escogiendo los elementos por muestreo aleatorio simple dentro del estrato.

Muestreo sistemático Los elementos de la población están ordenados en listas. Se divide la población en

tantas partes como el tamaño muestral y se elige al azar un n úmero de orden en cada parte de la población.

En la teor´ıa de muestras se distinguen dos tipos de objetivos:

1 Deducir caracter´ısticas (par´ametros) de la poblaci´on (Inferencia Estad´ıstica).

2 Analizar la concordancia o no de los resultados muestrales con determinadas hip ´otesis (Contraste de

Hip ótesis). Población              Censo Muestra        Inferencia estad´ıstica (Estimación Puntual

Estimaci´on por intervalos Contraste de hip ´otesis

(44)

2.11.1. Inferencia Estad´ıstica

Es evidente el hecho de que las medidas o caracter´ısticas de una muestra son variables aleatorias, ya que dependen de los valores de la variable aleatoria de la poblaci´on.

Por tanto, una muestra es un vector de valores x1, x2, ..., xn∈ En, teniendo asociado cada valor una

probabilidad de ser elegido.

Se llamar´a estad´ıstico a una funci´on F : En_{→ R, es decir, una formula de las variables que transforma}

los valores tomados de la muestra en un n úmero real. Además, a la distribución de F se la llama distribución del estad´ıstico en el muestreo.

Cuando se realiza una afirmación acerca de los parámetros de la población en estudio, basándose en la información contenida en la muestra se realiza una estimación puntual, pero si se se ñala un intervalo de valores dentro del cual se tiene confianza que esté el valor del parámetro, se realiza una estimación

por intervalos.

Estimaci´on Puntual

El proceso de estimación puntual utiliza un estad´ıstico para obtener alg ún parámetro de la población. Como tal, el estad´ıstico utiliza una variable aleatoria que tiene cierta distribución que depende, en general, del parámetro en cuestión. Además, se utilizarán dos criterios esenciales para medir la bondad del estimador:

que sea centrado o insesgado, es decir, que su media coincida con el par´ametro a estimar.

que sea de m´ınima varianza o que tenga la menor varianza entre todos los estimadores del par´ametro.

Estimaci´on por Intervalos

En la práctica, no sólo interesa dar una estimación puntual de un parámetro X sino un intervalo de valores dentro del cual se tiene confianza de que esté el parámetro. Por tanto, lo que se busca es un

esti-mador denominado estiesti-mador por intervalo compuesto de una pareja de estad´ısticos Li(l´ımite inferior)

y Ls (l´ımite superior), y siendo 1−αel nivel de confianza, mientras queαes el nivel de significaci´on,

tales que:

(45)

2.11. TEOR´IA DE MUESTRAS 41

Es decir, se llama intervalo de confianza para el par´ametro X con nivel de confianza 1₋α, a una

expresi´on del tipo Li≤ X ≤ Lsdonde los l´ımites Liy Lsdependen de la muestra y se calculan de manera

tal que si se construyen muchos intervalos, cada vez con distintos valores muestrales, el 100_{(1 −}α) %

de ellos contendr´an el verdadero valor del par´ametro.

La amplitud del intervalo está ´ıntimamente relacionada con los niveles de confianza y significación. Si la amplitud del intervalo es peque ña entonces la afirmación de que el parámetro pertenece al intervalo

tiene gran significaci´on (αes grande) pero ofrece poca confianza (1₋αes peque ˜na). Pero si la amplitud

del intervalo es grande entonces la afirmaci´on de que el par´ametro pertenece al intervalo tiene menor

significaci´on (αes peque ˜no) aunque ofrece mucha confianza (1₋αes grande).

Por ejemplo, la afirmación “la altura media de una población está entre 1, 68 y 1, 72 metros” con

α= 0, 25 es más significativa que la afirmación “la altura media de una población está entre 1, 60 y 1, 82 metros” conα= 0, 01, aunque esta última afirmación ofrece más confianza 1 −α= 0, 99 que la

primera 1₋α= 0, 75.

2.11.2. Contraste de Hip´otesis

Otro objetivo fundamental de la teor´ıa de muestras, es confirmar o rechazar hipótesis sobre un paráme-tro poblacional, mediante el empleo de muestras. Es decir, contrastar una hipótesis estad´ısticamente es juzgar si cierta propiedad supuesta para cierta población es compatible con lo observado en una muestra de ella.

A continuaci´on se pasan a definir algunos conceptos importantes:

Contraste de hip´otesis Procedimiento estad´ıstico mediante el cual se investiga la aceptaci´on o rechazo de

una afirmaci´on acerca de una o varias caracter´ısticas de una poblaci´on.

Hip´otesis nula, H0 Es la hip ´otesis que se quiere contrastar y es, por tanto, la que se acepta o rechaza como

conclusi´on del contraste.

Hip´otesis alternativa, Ha Es la hip ´otesis que se opone a la H0, de forma que si se acepta la Hase descarta

la H0, y rec´ıprocamente, si se rechaza Hase acepta H0.

Estad´ıstico de contraste Es una funci´on de la muestra aleatoria simple, que aplica la muestra(x1, x2, ..., x3)

en un punto de la recta real.

Región de aceptación Conjunto de valores del estad´ıstico de contraste que lleva a la decisión de aceptar la

hip ´otesis nula H0.

Regi´on cr´ıtica o de rechazo Conjunto de valores del estad´ıstico de contraste que lleva a la decisi´on de

(46)

Error tipo I,α Error que se comete en la decisi´on del contraste cuando se rechaza la hip ´otesis nula H0,

siendo cierta.

Error tipo II,β Error que se comete en la decisi´on del contraste cuando se acepta la hip ´otesis nula H0,

siendo falsa.

Nivel de significaci´on Es la probabilidad de cometer el error de tipo I, y se denota porα. Tambi´en se suele

denominar tama˜no del contraste.

Potencia de un contraste, 1₋α Es la probabilidad de rechazar la hip ´otesis nula H0, siendo falsa. Se

utili-zará siempre contrastes de máxima potencia (o máximo nivel de confianza), dentro de los que tienen un determinado nivel de significación.

Contraste unilateral Es aquél cuya región cr´ıtica está formada por un solo intervalo de la recta real. Contraste bilateral Es aquél cuya región cr´ıtica está formada por dos intervalos disjuntos de la recta real.

Por ´ultimo, para realizar un contraste de hip´otesis es conveniente seguir las siguientes fases:

1 Enunciado y determinaci´on de las hip ´otesis H0y Ha.

2 Elecci´on del nivel de significaci´onα.

3 Especificaci´on del tama˜no muestral.

4 Selección de estad´ıstico o función de decisión. 5 Determinación de la región cr´ıtica.

6 Cálculo del valor del estad´ıstico de contraste o función de decisión para la muestra particular.

(47)

Parte II

(48)

(49)

45

Hasta ahora las muestras se han analizado con el objetivo de ser comparadas contra una poblaci´on en un momento determinado, sin tener en cuenta la evoluci´on de la variable en el tiempo.

Si se tuviese en cuenta la evolución de la variable, mediante una sucesión de muestras ordenadas en el tiempo, al conjunto de datos resultante se lo denomina Serie Temporal, Histórica, Cronológica o de Tiempo[Fer04b].

Luego, el an´alisis de una serie temporal implica el manejo conjunto de dos variables, la variable en estudio y la variable temporal, que determina cuando se han realizado las observaciones.

Las observaciones de la variable en estudio pueden estar referidas a un:

Instante de tiempo: Se denominan magnitudes stock o niveles. Por ejemplo, cantidad de empleados de una

empresa al final de cada mes.

Intervalo de tiempo: Se denominan flujos. Por ejemplo, ventas de una empresa a lo largo de cada mes.

La diferencia entre una y otra es que la primera no es sumable, pues se incurrir´ıa en duplicaciones, mientras que la segunda es acumulable. Las ventas de un mes se pueden sumar con la del anterior y as´ı se podr´ıan obtener las ventas de los 2 ´ultimos meses. Mientras que la observaci´on de los empleados de un mes, no se puede sumar a los empleados del mes anterior, porque se podr´ıan estar sumando dos veces los mismos empleados.

Esto ´ultimo destaca la importancia de la Homogeneidad, ya que si la amplitud temporal variase ser´ıa dif´ıcil hacer comparaciones entre las diferentes observaciones de una Serie Temporal. Por otra parte esta homogeneidad se pierde de forma natural, con el transcurso del tiempo, de manera que cuando las series son muy largas no hay garant´ıa de que los datos iniciales y finales sean comparables.

Pero la necesidad de que las series temporales no sean muy largas, para que sus datos no pierdan la homogeneidad, entra en contradicción con el objetivo más elemental de la Estad´ıstica que es el de detectar regularidades en los fenómenos de masas.

Lo que se pretende con una serie temporal es describir y predecir el comportamiento de un fen´omeno que cambia en el tiempo. Esas variaciones que experimenta una serie temporal pueden ser:

Evolutivas: El valor medio de la serie cambia, no permanece fijo en el tiempo.

Estacionales: El valor medio de la serie y su variabilidad no cambian, aunque sufra oscilaciones en torno a

(50)

Esta clasificaci´on permite hablar de Series Temporales Evolutivas o Series Temporales Estacionales, de acuerdo al resultado del an´alisis realizado.

Por otra parte, existen dos tipos de enfoques para analizar una Serie Temporal: el Enfoque Cl´asico y el Enfoque Causal.

(51)

Cap´ıtulo 3

Enfoque cl´asico

Una forma de comenzar el análisis de una serie temporal, es mediante su representación gráfica. Para ello se hará uso de un sistema cartesiano en el que los per´ıodos de tiempo se ubican en el eje de las

abscisas y los valores de la variable aleatoria (yt) se llevan al eje de ordenadas. El resultado es un

diagrama de dispersi´on, con la particularidad de que el eje de abscisas se reserva siempre a la misma variable: el tiempo. -100 -80 -60 -40 -20 0 20 40 0 0.2 0.4 0.6 0.8 1

Figura 3.1: Ejemplo de una serie temporal.

En este tipo de representaci´on se pueden detectar las caracter´ısticas mas sobresalientes de una serie temporal, tales como el movimiento a largo plazo de la variable aleatoria, la amplitud de las oscilaciones, la posible existencia de ciclos, la presencia de valores at´ıpicos o an´omalos, etc. Ver el ejemplo de la Figura 3.1.

(52)

El enfoque cl´asico asume que el comportamiento de la serie temporal se puede explicar en funci´on del

tiempo: yt= f (t). Bajo este esquema, la serie ser´ıa una variable dependiente y el tiempo una

indepen-diente o explicativa. Sin embargo, es necesario dejar bien claro que el tiempo, en si, no es una variable explicativa, es simplemente el “soporte” o escenario en el que se realiza o tiene lugar la serie temporal.

Desde este enfoque, cualquier serie temporal se supone que es el resultado de cuatro componentes:

tendencia (T), variaciones estacionales (E), variaciones c´ıclicas (C) y variaciones residuales o accidentales (R). Pero esta descomposici´on de la serie no deja de ser un procedimiento dise ˜nado para que el estudio

de la misma resulte m´as f´acil, pues esas componentes no siempre existen.

3.1. Tendencia

La tendencia se define como aquella componente que recoge el comportamiento de la serie a largo plazo, prescindiendo de las variaciones a corto y mediano plazo. Para poder detectarla es necesario que la serie conste de un n úmero de observaciones elevado, a lo largo de muchos a ños, para que se pueda determinar si la serie muestra un movimiento a largo plazo que responda a una determinada ley de crecimiento, decrecimiento (series evolutivas) o estabilidad (series estacionarias). Ese comportamiento tendencial puede responder a distintos perfiles: lineal, exponencial, parab ólico, log´ıstico, etc.

0 50 100 150 200 0 0.2 0.4 0.6 0.8 1 A B C

Figura 3.2: Identificaci´on de la tendencia.

Ver en el ejemplo de la Figura 3.2 como cambia la forma de percibir la tendencia si es que se toma el intervalo de tiempo inadecuado.

Si se intenta establecer la tendencia teniendo en cuenta solo el intervalo comprendido entre A y B, la

(53)

3.1. TENDENCIA 49

mayor (por ejemplo desde A hasta C) la tendencia asciende.

El problema es que el concepto de largo plazo va ´ıntimamente relacionado a la naturaleza de la varia-ble, por lo que la longitud utilizada para determinar una tendencia no es comparable entre variables.

Los métodos más habituales en la determinación de la tendencia son: el análisis gráfico, las medias

m´oviles, los m´etodos anal´ıticos y los de alisado exponencial.

3.1.1. An´alisis gr´afico

Es el procedimiento mas simple, ya que no utiliza ning ´un procedimiento anal´ıtico que garantice la objetividad del resultado, y deja la posibilidad que dos analistas distintos lleguen a distintos resultados.

Todo depende del conocimiento que tenga el investigador de la serie temporal estudiada. Ya que en una primera instancia se realiza la representaci´on gr´afica, para luego trazar la tendencia a mano alzada.

Aunque no es aconsejable confiar en los resultados que pueda arrojar este tipo de an´alisis de tendencia, suele utilizarse como un paso previo para cualquier tipo de an´alisis a realizarse en una serie.

3.1.2. Medias m´oviles

Consiste en promediar los valores de la variable aleatoria para per´ıodos de tiempo fijos a lo largo de todo el horizonte de la serie temporal.

El resultado de este proceso mec´anico es la eliminaci´on de los movimientos a corto y mediano plazo, as´ı como las irregularidades debidas a factores no controlables ni predecibles. Es decir, a la serie se le

quitan dos de sus componentes, quedando con la tendencia y la ciclicidad1_.

La idea que subyace detrás de este método es que la media de cualquier conjunto de valores sirve para eliminar la dispersión o variabilidad de la serie motivada por factores coyunturales o esporádicos.

Estos promedios ser´an las medias aritm´eticas de un conjunto k de valores consecutivos, con el requisito de que k sea inferior al total de observaciones. El procedimiento espec´ıfico var´ıa si k es par o impar.

(54)

Si k es entero impar, entonces las sucesivas medias se obtendr´ıan de la siguiente forma: y∗_t = k−1 2

∑

i=−k−1 2 yt+i k (3.1) y∗_t = y_t₋k−1 2 + yt−k−12 +1+ yt−k−12 +2+ ... + yt+ ... + yt+k−22 −1+ yt+k−12 −1+ yt+k−12 k (3.2)

A la media y_t∗se la denomina centrada y se la hace corresponder con la observaci´on del momento t,

que es el valor central de la suma.

Si k es entero par, no se podr´ıa determinar el valor central de k, por lo que no se corresponder´ıa con ninguno de los observados en la serie original. Esto se supera al aplicar nuevamente el m´etodo

de medias m´oviles con k= 2, quedando ahora si los valores centrales relacionados con los valores

observados originalmente.

La f´ormula que se utiliza para ambos casos, cuando k es un entero par, es la siguiente:

y∗_t_−0,5= k 2−1

∑

i=−k2 yt+i k (3.3)

Luego, sea k entero par o impar, es importante determinar el tama ño óptimo que suavice la serie temporal y que deje expuesta la tendencia. Si k es muy grande entonces el proceso de suavizado puede llegar a ser tan fuerte que se pierda más información de la deseada. Por otro lado, si k es muy peque ño no se conseguirán eliminar todas las perturbaciones ajenas a la tendencia.

Si la serie demuestra estacionalidad, o alg ´un tipo de ciclicidad, el valor de k deber´ıa ser mayor o igual al intervalo de tiempo necesario para que se produzca un ciclo. En caso de ser estacionalidad, k deber´ıa ser mayor o igual al a ˜no. Para cualquier otro caso, en donde exista incertidumbre se recomienda que k sea igual a 3 o 5.

En el ejemplo de la Figura 3.3, se muestra una serie temporal y su tendencia calculada por medias

móviles. Además se muestra la serie original sin la tendencia calculada (filtrada por el método aditivo2).

2_{La uni´on de los componentes de una serie se realiza a partir de dos m´etodos, en el aditivo yt}_{= T}

t+Ct+ Et+ Rt, mientras que en el multiplicativo yt= Tt∗Ct∗ Et∗ Rt.

(55)

3.1. TENDENCIA 51 -150 -100 -50 0 50 0 0.2 0.4 0.6 0.8 1

(a) Serie temporal original

tendencia (k=21) serie temporal -60 -50 -40 -30 -20 -10 0 10 20 30 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

(b) Serie temporal original sin la tendencia

serie temporal sin tendencia

Figura 3.3: Obtenci´on de la tendencia por Medias M´oviles.

Al igual que en el análisis gráfico se introduce subjetividad en la selección del valor de k. Además, no se puede alcanzar el objetivo de la predicción en el análisis de las series temporales, pues la tendencia obtenida mediante medias móviles no permite la proyección hacia el futuro.

3.1.3. M´etodo anal´ıtico

Selecciona una función matemática que modelice de forma adecuada la tendencia de la serie temporal. El procedimiento de ajuste suele ser el de los m´ınimos cuadrados, aunque para comenzar el análisis se recurre a la representación gráfica que informa de manera aproximada el tipo de función. Otra alternativa es hacer uso del conocimiento previo de la naturaleza de una serie temporal.

La utilizaci´on de este m´etodo con respecto a los anteriores tiene dos ventajas:

Se mide la bondad del ajuste, dejando de lado la subjetividad del analista.

Se determina una funci´on expl´ıcita, que permite realizar predicciones.

(56)

Lineal

Modelo en el que la variable aleatoria se hace depender linealmente del tiempo, y en donde se presentan variaciones constantes para periodos sucesivos de tiempo. La forma general del mismo es:

yt= y∗t+ Rt= a + bt + Rt (3.4)

Donde:

t Tiempo cronol´ogico.

b Variaci´on media entre periodos. yt Serie temporal original.

y∗_t Estimaci´on de la Tendencia.

Rt Resto de las componentes no identificadas, representadas como un residuo.

-200 20 40 60 80 100 120 140 160 0 0.2 0.4 0.6 0.8 1

serie temporal -200 20 40 60 80 100 120 140 160 0 0.2 0.4 0.6 0.8 1

(b) Tendencia con el modelo lineal

tendencia lineal (y = 110.55x+-5.0624) serie temporal -60 -40 -20 0 20 40 60 0 0.2 0.4 0.6 0.8 1

(c) Serie temporal original sin la tendencia calculada

Figura 3.4: Obtenci´on de la tendencia por el M´etodo Anal´ıtico Lineal.

Polinomial

Modelo en el que la relaci´on de la variable aleatoria con el tiempo se expresa a partir de un polinomio. Las variaciones no son constantes, ni en t´erminos absolutos ni relativos.

(57)

3.1. TENDENCIA 53

El grado del polinomio va a decidir la familia de funciones que se utilice en el modelo, aunque el mas com ún de todos es el modelo de función parabólica. La forma general del mismo es:

yt= y∗t + Rt= a + bt + ct2+ Rt (3.5)

Donde:

t Tiempo cronol´ogico. yt Serie temporal original.

0 5 10 15 20 25 30 35 0 0.5 1 1.5 2

serie temporal 0 5 10 15 20 25 30 35 0 0.5 1 1.5 2

(b) Tendencia con el modelo polinomial

tendencia polinomial 24.713x2-48.907x+30.135 serie temporal -10 -5 0 5 10 0 0.5 1 1.5 2

(c) Serie temporal original sin la tendencia

Figura 3.5: Obtenci´on de la tendencia por el M´etodo Anal´ıtico Polinomial.

Exponencial

Modelo en el que la relación de la variable aleatoria con el tiempo se expresa a partir de una función exponencial, por lo que la serie temporal cambia a razón de una tasa constante. El ajuste por m´ınimos cuadrados es fácilmente realizable, debido a que la función es linealizable. La forma general del modelo es:

(58)

Donde:

t Tiempo cronol´ogico. yt Serie temporal original.

a Tasa de variación inicial. b Tasa de variación instantánea.

0 0.5 1 1.5 2 0 0.5 1 1.5 2

serie temporal 0 0.5 1 1.5 2 2.5 0 0.5 1 1.5 2

(b) Tendencia con el modelo exponencial

tendencia polinomial (-0.00371635+0.0421471i) e(1.30309-0.0485662i)x

2_{+(-0.538773-0.859227i)x} serie temporal -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0 0.5 1 1.5 2

(c) Serie temporal original sin la tendencia

Figura 3.6: Obtenci´on de la tendencia por el M´etodo Anal´ıtico Exponencial

3.1.4. Alisado exponencial

Los métodos para calcular la tendencia explicados hasta aqu´ı, ya sea el de medias móviles o alguno de los métodos anal´ıticos, se agrupan dentro del conjunto de técnicas para el alisado proporcional.

El alisado exponencial consiste, al igual que los métodos anteriores, en medias ponderadas; pero con la particularidad que la ponderación decrece conforme nos alejamos del origen. Esto es útil para la predicción de series no estacionales y con una tendencia no definida.