Conceptos B´asicos
de Geoestad´ıstica
Conceptos B´asicos de Geoestad´ıstica
Editado por
Copyright c 2009 de los editores y contribuyentes Algunos derechos reservados.
Este trabajo es distribuido bajo la licencia Creative Commons Attribution–Noncommercial–NoDerivs 3.0 License.
http://creativecommons.org/licenses/by-nc-nd/3.0 Impreso el d´ıa 15 de agosto de 2010.
´Indice general
I
Estad´ıstica
11
1. Estad´ıstica Descriptiva 15
1.1. Propiedades de los Datos . . . 15
1.1.1. Posici´on . . . 16 1.1.2. Centralizaci´on . . . 16 1.1.3. Dispersi´on . . . 17 1.1.4. Forma . . . 18 1.2. Estad´ıstica Bivariable . . . 20 1.2.1. Covarianza . . . 20 1.2.2. Coeficiente de correlaci´on . . . 21 2. Estad´ıstica Inferencial 23 2.1. Probabilidad . . . 23 2.2. Probabilidad Condicional . . . 24 2.3. Variable Aleatoria . . . 24
2.4. Distribuci´on de probabilidad / Funci´on de densidad . . . 24
2.5. Funci´on de distribuci´on . . . 25
2.7. Varianza y Desviaci´on T´ıpica . . . 28
2.8. Momentos . . . 29
2.9. Distribuciones de Probabilidad conocidas . . . 30
2.9.1. Distribuci´on Uniforme . . . 30
2.9.2. Distribuci´on de Bernoulli . . . 31
2.9.3. Distribuci´on Binomial . . . 31
2.9.4. Distribuci´on de Poisson . . . 32
2.9.5. Distribuci´on Hipergeom´etrica . . . 32
2.9.6. Distribuci´on Geom´etrica o de Pascal . . . 33
2.9.7. Distribuci´on Binomial negativa . . . 34
2.10. Funciones de Densidad conocidas . . . 34
2.10.1. Distribuci´on Uniforme . . . 35
2.10.2. Distribuci´on Normal o de Laplace-Gauss . . . 35
2.10.3. Distribuci´on Gamma . . . 36 2.10.4. Distribuci´on Exponencial . . . 36 2.10.5. Distribuci´onχ2de Pearson . . . 37 2.10.6. Distribuci´on Beta . . . 37 2.10.7. Distribuci´on t de Student . . . . 38 2.10.8. Distribuci´on F de Fisher-Snedecor . . . 38 2.11. Teor´ıa de Muestras . . . 38 2.11.1. Inferencia Estad´ıstica . . . 40
2.11.2. Contraste de Hip ´otesis . . . 41
II
Series Temporales
43
´INDICE GENERAL 5 3.1. Tendencia . . . 48 3.1.1. An´alisis gr´afico . . . 49 3.1.2. Medias m´oviles . . . 49 3.1.3. M´etodo anal´ıtico . . . 51 3.1.4. Alisado exponencial . . . 54 3.2. Variaci´on Estacional . . . 55 3.3. Variaci´on C´ıclica . . . 58
3.4. Variaci´on Residual (o Indeterminada) . . . 58
4. Enfoque Causal 61 4.1. Tasas de variaci´on . . . 62
III
Geoestad´ıstica
65
5. Variables regionalizadas 69 6. Hip´otesis estad´ıstica 71 6.1. Estacionalidad de Segundo Orden . . . 716.2. Hip ´otesis Intr´ınseca . . . 72
6.3. Comparaci´on de las dos hip ´otesis . . . 72
6.4. Selecci´on de la variable regionalizada . . . 74
7. Variograma 75 7.1. Variograma Experimental . . . 77
7.2. Variograma Te´orico . . . 77
7.2.1. Modelos con un tope . . . 78
7.3. Ajuste a un modelo te´orico . . . 83 7.3.1. A ojo . . . 83 7.3.2. M´ınimos cuadrados . . . 84 7.3.3. Probabilidad m´axima . . . 84 7.4. Isotrop´ıa y anisotrop´ıa . . . 85 7.4.1. Anisotrop´ıa geom´etrica . . . 85 7.4.2. Anisotrop´ıa zonal . . . 86 8. Kriging 87 8.1. Kriging Ordinario . . . 87
8.1.1. Kriging Ordinario Puntual . . . 87
8.1.2. Kriging Ordinario por Bloques . . . 89
8.1.3. El variograma y el kriging . . . 91
8.1.4. El Kriging en la pr´actica . . . 91
8.1.5. Kriging con un variograma “falso” . . . 92
8.1.6. Validaci´on cruzada . . . 92
8.1.7. Kriging con datos inciertos . . . 92
8.1.8. Kriging Simple . . . 93
8.2. M´etodos no estacionales . . . 94
8.2.1. Kriging Universal . . . 95
8.2.2. Kriging con Deriva Externa . . . 99
8.3. Actualizaci´on Simple . . . 99
8.4. Kriging sobre Series Temporales . . . 101
8.4.1. Intr´ınsecas en el espacio-tiempo . . . 101
8.4.2. Intr´ınsecas en el espacio e independientes del tiempo . . . 102
´INDICE GENERAL 7 8.4.4. Series temporales interpretadas como diferentes realizaciones . . . 103
´Indice de figuras
1.1. Coeficiente de Asimetr´ıa . . . 19 1.2. Coeficiente de Kurtosis . . . 20 1.3. Coeficiente de Correlaci´on . . . 21 2.1. Distribuci´on de Probabilidad . . . 25 2.2. Funci´on de Distribuci´on . . . 26 3.1. Serie Temporal . . . 47 3.2. Tendencia . . . 48 3.3. Medias M´oviles . . . 513.4. M´etodo Anal´ıtico Lineal . . . 52
3.5. M´etodo Anal´ıtico Polinomial . . . 53
3.6. M´etodo Anal´ıtico Exponencial . . . 54
3.7. Alisado Exponencial . . . 56
3.8. IGVE . . . 57
3.9. Desestacionalizaci´on . . . 60
3.10. Ciclicidad por Medias M´oviles . . . 60
4.1. Serie temporal de diferenciales anuales . . . 62
4.3. Ejemplo de mapa 2D . . . . 67
6.1. La Hip ´otesis Intr´ınseca y la Estacionalidad de Segundo Orden . . . 73
6.2. El variograma y la covarianza . . . . 73
7.1. Nube de puntos de un variograma . . . 76
7.2. Variograma Experimental . . . 76
7.3. Variograma te´orico con efecto pepita puro. . . 79
7.4. Variograma te´orico del modelo esf´erico. . . 80
7.5. Variograma te´orico del modelo exponencial. . . 81
7.6. Variograma te´orico del modelo Gaussiano. . . 82
Parte I
13
Es la rama de la matem´atica que se ocupa del estudio, an´alisis y clasificaci´on de datos aleatorios. Se pueden clasificar dos tipos de estad´ısticas: la descriptiva[Ber, Men, Cap, Fer04a] y la inferencial.
Cap´ıtulo 1
Estad´ıstica Descriptiva
Se encarga de la organizaci´on, presentaci´on y s´ıntesis de datos. Para esto es necesario clasificar
cada uno de los datos xi (valores de la variable X medida) en clases o intervalos de clases Cj, donde j
representa la j− esima clase o intervalo de clase. Esa disposici´on de datos clasificados en forma tabular
permite construir la distribuci´on de frecuencias ( f ), la cual puede ser mostrada de forma:
Absoluta Cantidad de elementos xipertenecientes a una clase o intervalo de clase Cj. Se llama frecuencia
absoluta, o simplemente frecuencia y se representa mediante la funci´on fj.
Relativa Porci´on de los elementos totales que pertenecen a una clase o intervalo de clase. Se calcula a partir
de la formula fR j= fj
n, siendo n la cantidad de elementos de la muestra y cumplir´a con la ecuaci´on
∑fR j= 1.
Acumulada N´umero de veces que ha aparecido en la muestra un elemento (xi) de una clase o intervalo
de clase menor o igual. Implica cierto orden entre las clases, y se representa mediante la funci´on
fA j= j
∑
t=1
ftpara las absolutas y fAR j= j
∑
t=1
fRtpara las relativas.
1.1.
Propiedades de los Datos
En el an´alisis o interpretaci´on de datos num´ericos, se pueden utilizar medidas descriptivas que representan las propiedades de posici´on, centralizaci´on, dispersi´on y forma, para resumir las carac-ter´ısticas sobresalientes del conjunto de datos. Si estas medidas se calculan con una muestra de datos se denominan estad´ısticos, mientras que si se calculan con la poblaci´on de datos, se denominan par´ame-tros.
1.1.1.
Posici´on
Las propiedades de posici´on est´an representadas por los Percentiles, Quartiles y Deciles, detallados a continuaci´on.
Percentiles
Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el
percentil de orden 15 (P15(X)) deja por debajo al 15 % de las observaciones, y por encima queda el
85 %.
Quartiles
Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles:
El primer cuartil Q1(X), es el menor valor xique es mayor que una cuarta parte de los datos.
El segundo cuartil Q2(X), es el menor valor xique es mayor que la mitad de los datos.
El tercer cuartil Q3(X), es el menor valor xique es mayor que tres cuartas partes de los datos.
Deciles
Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son
tam-bi´en un caso particular de los percentiles. Ejemplo, D1(X) = P10(X).
1.1.2.
Centralizaci´on
Las propiedades de centralizaci´on est´an representadas por la Media Aritm´etica, Mediana y Moda, detalladas a continuaci´on.
Mediana
Aparece en el medio de una sucesi´on ordenada de valores.
Si el tama ˜no de la muestra (n) es un n ´umero impar, se representa por el valor num´erico de la observa-ci´on ordenada (coincidiendo en este caso con el percentil 50):
˜
X= x(n+1
1.1. PROPIEDADES DE LOS DATOS 17
Por otro lado, si el n ´umero de la muestra es par, se representa con la media de los dos valores intermedios en el arreglo ordenado:
˜ X=x( n 2)+ x(2n+1) 2 (1.2) Media Aritm´etica
Se encuentra al sumar todos los valores en la muestra y luego, al dividir el total por n (el n ´umero de observaciones en la muestra). ¯ X=1 n n
∑
i=1 xi (1.3)Adem´as se podr´ıa calcular mediante las frecuencias absolutas, donde k representa a la cantidad de clasificaciones de los datos realizadas.
¯ X=1 n k
∑
j=1 ˜ Cjfj (1.4)Siendo ˜Cjla mediana entre los valores posibles dentro de una clase o intervalo de clase.
Si hay valores extremos, la Media Aritm´etica no es una buena medida de tendencia central. En estos casos se preferir´a la Mediana.
Moda
Es el valor m´as t´ıpico o m´as observado. Es la clase con mayor frecuencia. Cuando se trabaja con tablas de frecuencias para variables continuas existir´a un intervalo modal.
ˆ
X= Ci;(∀ j, fi≥ fj) (1.5)
1.1.3.
Dispersi´on
Las propiedades de dispersi´on est´an representadas por el Rango, Varianza, Desv´ıo Est´andar y Coeficiente de variaci´on, detallados a continuaci´on.
Rango
Definido como recorrido o amplitud, es la diferencia entre el mayor y el menor valor de los xi.
Varianza
Es el promedio de los cuadrados de las diferencias entre cada elemento de la muestra y la media obtenida. S2(X) = n
∑
i=1 (xi− ¯X)2 n− 1 (1.7)Si se utiliza n en el divisor se calcula un par´ametro, mientras que con n− 1 se obtiene el estad´ıstico
(ya que se tiene en cuenta la propiedad de los grados de libertad).
Desviaci´on Est´andar
La varianza est´a compuesta de las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersi´on la desviaci´on t´ıpica que se define como la ra´ız cuadrada positiva de la varianza.
S(X) =qS2(X) = v u u u t n
∑
i=1 (xi− ¯X)2 n− 1 (1.8) Coeficiente de variaci´onEs una medida relativa propuesta por Pearson que se utiliza para comparar la dispersi´on de dos o m´as series de datos que est´an expresados en unidades diferentes. A menor diferencia entre los CV m´as homog´eneas son las variables.
CV(X) =S(X)
| ¯X| (1.9)
1.1.4.
Forma
Las propiedades de forma est´an representadas por el Coeficiente de Asimetr´ıa y Kurtosis, detalla-das a continuaci´on.
Coeficiente de asimetr´ıa
Cuantifican el grado de asimetr´ıa de la distribuci´on en torno a una medida de centralizaci´on. Una distribuci´on es asim´etrica a la derecha si las frecuencias (absolutas o relativas) descienden m´as lentamente por la derecha que por la izquierda (valor positivo). Si las frecuencias descienden m´as
1.1. PROPIEDADES DE LOS DATOS 19
lentamente por la izquierda que por la derecha diremos que la distribuci´on es asim´etrica a la izquierda (valor negativo). Es normal cuando la distribuci´on es sim´etrica (valor nulo). Ver el ejemplo de la Figura 1.1.
Existen varias medidas de la asimetr´ıa de una distribuci´on de frecuencias.
Seg ´un Pearson:
CAP(X) =
¯
X− ˆX
S(X) (1.10)
Seg ´un Fisher:
CAF(X) = n
∑
i=1 [(xi− ¯X)3fRi] S(X)3 (1.11)Seg ´un Bowley:
CAB(X) = Q3(X) + Q1(X) − 2 ˜X Q3(X) − Q1(X) = 1 + 2 Q1(X) − ˜X Q3(X) − Q1(X) (1.12) 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 0 0.2 0.4 0.6 0.8 1 Asimetrica a la derecha Normal Asimetrica a la izquierda
Figura 1.1: Disposici´on gr´afica de acuerdo al Coeficiente de Asimetr´ıa
Coeficiente de Kurtosis
Describe el grado de esbeltez de una distribuci´on con respecto a la distribuci´on normal. Se calcula por: CK(X) = n
∑
i=1 [(xi− ¯X)4fRi] S(X)4 (1.13)0 0.5 1 1.5 2 2.5 0 0.2 0.4 0.6 0.8 1 Platicurtica Mesocurtica (Normal) Leptocurtica
Figura 1.2: Disposici´on gr´afica de acuerdo al Coeficiente de Kurtosis.
La distribuci´on normal tiene kurtosis igual a tres, es llamada mesoc ´urtica. A las distribuciones m´as agudas, con colas relativamente anchas, se las llama leptoc ´urtica, tienen valores de kurtosis mayores que tres, y las distribuciones achatadas en el centro se llaman platic ´urticas, tienen valores menores que
tres. En ocasiones se acostumbra a definir la kurtosis como CK(X) − 3. Ver el ejemplo de la Figura 1.2.
1.2.
Estad´ıstica Bivariable
Al analizar modelos complejos que dependen de dos o m´as variables, se comienzan a buscar meto-dolog´ıas que comiencen a analizar relaciones entre las diferentes distribuciones de frecuencias (repre-sentadas por variables), en un intento por resumir los resultados.
Las m´as importantes son: la Covarianza y el Coeficiente de correlaci´on.
1.2.1.
Covarianza
Determina si existe una relaci´on lineal entre dos variables. Se calcula promediando las
puntuacio-nes diferenciales por su tama ˜no muestral. El resultado fluct ´ua entre+∞y−∞, por lo que la magnitud
del resultado carece de significado, y lo ´unico importante es el signo que adopte.
Cov(X,Y ) =1 n n
∑
i=1 (xi− ¯X)(yi− ¯Y ) (1.14)Si Cov(X,Y ) > 0 pendiente de la recta de regresi´on positiva. Indica que hay dependencia directa, es decir las
1.2. ESTAD´ISTICA BIVARIABLE 21
Si Cov(X,Y ) < 0 pendiente de la recta de regresi´on negativa. Indica que hay dependencia inversa o negativa,
es decir las variaciones de las variables tienen sentido opuesto.
Si Cov(X,Y ) ≈ 0 no es posible determinar la pendiente de la recta de regresi´on, por lo que no existe relaci´on
lineal entre las 2 variables. Podr´ıa existir otro tipo de relaci´on.
1.2.2.
Coeficiente de correlaci´on
Eval ´ua la relaci´on lineal entre dos variables. Permite saber si el ajuste de la nube de puntos a la recta de regresi´on obtenida es satisfactorio. Ver el ejemplo de la Figura 1.3.
Seg ´un Pearson:
CCP(X,Y ) =
Cov(X,Y )
S(X)S(Y ) (1.15)
El coeficiente de correlaci´on, CCP(X,Y ), presenta valores entre –1 y +1.
Cuando r≈ 0 no hay correlaci´on lineal entre las variables. La nube de puntos est´a muy dispersa y no se
puede trazar una recta de regresi´on.
Cuando r≈ +1 hay una buena correlaci´on positiva entre las variables seg´un un modelo lineal y la recta de
regresi´on que se determine tendr´a pendiente positiva.
Cuando r≈ −1 hay una buena correlaci´on negativa entre las variables seg´un un modelo lineal y la recta de
regresi´on que se determine tendr´a pendiente negativa.
20 40 60 80 100 120 140 0 20 40 60 80 100 120 CCP(X,Y)≈ +1 2 4 6 8 10 12 14 16 18 20 0 20 40 60 80 100 120 CCP(X,Y)≈ 0 -120 -100 -80 -60 -40 -20 0 20 0 20 40 60 80 100 120 CCP(X,Y)≈ -1
Cap´ıtulo 2
Estad´ıstica Inferencial
Trata de generalizar la informaci´on obtenida en una muestra a una poblaci´on. La bondad de estas deducciones se mide en t´erminos probabil´ısticos, es decir, toda inferencia se acompa ˜na de su probabilidad de acierto. Por esto se utilizan las probabilidades en las estimaciones, ya que permitir´an el avance sobre el Contraste de hip´otesis y la Inferencia Bayesiana[P´e03].
2.1.
Probabilidad
Mide la frecuencia con la que ocurre un suceso en un experimento bajo condiciones suficientemente estables[Wik]. La notaci´on utilizada es:
P(A) = l´ım
nc→∞
nA
nc
(2.1)
Donde A es el suceso estudiado, nAel n ´umero de veces que el evento A ha ocurrido y ncel n ´umero
de veces que el experimento fue realizado. La tendencia de nca infinito determina la estabilidad de las
condiciones del experimento.
Los resultados de la funci´on se encuentran dentro del intervalo[0, 1] de tal forma que:
Al suceso imposible le corresponde el valor 0. Al suceso seguro le corresponde el valor 1.
2.2.
Probabilidad Condicional
Esta determinada por la posibilidad de que ocurra un suceso dado, como consecuencia de otro. Esta se representa mediante:
P(A|B) =P(A ∩ B)
P(B) (2.2)
A Suceso condicionado por B. B Suceso independiente.
Si se cambia la forma de representar la ecuaci´on
P(A|B)P(B) = P(A ∩ B) = P(B|A)P(A) (2.3)
P(A|B) =P(B|A)P(A)
P(B) (2.4)
2.3.
Variable Aleatoria
Se encuentra definida por una funci´on real que asocia un resultado num´erico a cada experimento aleatorio. Por ejemplo, si el experimento aleatorio consiste en lanzar 4 veces un dado, y el objetivo es determinar el n ´umero de veces que sale el 6 y se define una funci´on X que asigna un valor num´erico (cantidad de 6 obtenidos) a cada resultado del experimento. De esta manera tenemos por ejemplo que
X(1632) = 1 o que X(1234) = 0, ya que en el primer experimento sale un 6 en el segundo lanzamiento,
mientras que en el ´ultimo experimento no sale ninguna vez.
Las variables aleatorias y sus distribuciones de probabilidad pueden considerarse una generalizaci´on del concepto de frecuencia. Se introducen como el modelo matem´atico ideal al que se aproximan las distribuciones de frecuencias que se obtendr´ıan en una repetici´on indefinida de pruebas de este expe-rimento.
Usualmente se clasifican de acuerdo al n ´umero de valores que pueden asumir: las variables aleato-rias discretas (solo pueden adoptar un n ´umero finito o contable de valores) y las variables aleatoaleato-rias continuas (surgen cuando tratamos con cantidades de una escala continua).
2.4.
Distribuci´on de probabilidad / Funci´on de densidad
Dependiendo si la variable aleatoria es discreta (v.a.d) o continua (v.a.c.), se mencionar´a Distribuci´on de Probabilidad o Funci´on de Densidad respectivamente.
2.5. FUNCI ´ON DE DISTRIBUCI ´ON 25
Sea X una v.a.d. que toma los valores x1, x2, x3, .... Se define P(X = xi) como la probabilidad siguiente:
P(X = xi) = P(xi) = P{ω∈ E/X(ω) = xi} (2.5)
A la tabla formada por los valores que toma la variable junto con sus probabilidades recibe el nombre de distribuci´on de probabilidad de la variable:
X x1 x2 . . . xn . . . P(X = x) P(X = x1) P(X = x2) . . . P(X = xn) . . . 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 -0.4 -0.2 0 0.2 0.4 f(x) P(ei)
Figura 2.1: Ejemplo de una Distribuci´on de Probabilidad.
Ver el ejemplo de la Figura 2.1.
Por otra parte, dada una v.a.c. X , se dice que una funci´on real f(x) no negativa es la funci´on de densidad
de probabilidad (o simplemente funci´on de densidad) de la variable aleatoria X si el ´area encerrada
entre la curva y el eje 0X es igual a la unidad y, adem´as, la probabilidad de que X se encuentre entre
dos valores x1y x2con x1< x2es igual al ´area comprendida entre estos dos valores, es decir,
Z ∞ −∞ f(x)dx = 1 (2.6) P(x1< X < x2) = Z x2 x1 f(x)dx (2.7)
2.5.
Funci´on de distribuci´on
Sea X una v.a., asociada a ella se define la funci´on de distribucin F :R→ [0,1] de la siguiente manera:
Las propiedades de la funci´on de distribuci´on son:
1. 0≤ F(x) ≤ 1∀x ∈ R por representar F(x) la probabilidad de un suceso. 2. F(−∞) = l´ımx→−∞F(x) = 0; pues F(−∞) = P[X ≤ −∞] = P[/0] = 0.
3. F(∞) = l´ımx→∞F(x) = 1; pues F(∞) = P[X ≤∞] = P[E] = 1.
4. F es mon ´otona creciente (no estrictamente), es decir, si x1< x2⇒ F(x1) ≤ F(x2).
5. F es continua por la derecha, es decir, l´ımh→0+F(x + h) = F(x).
La funci´on de distribuci´on puede ser especialmente ´util para calcular probabilidades ya que:
P(X ≤ x) = F(x) (por definici´on). P(X > x) = 1 − P(X ≤ x) = 1 − F(x). P(x1< X ≤ x2) = P(X ≤ x2) − P(X ≤ x1) = F(x2) − F(x1). 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 0 0.2 0.4 0.6 0.8 1
(a) Distribucion de probabilidad
f(x) FX(a)-FX(b) FX(a) P(a) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0 0.2 0.4 0.6 0.8 1 (b) Funcion de distribucion FX b a
Figura 2.2: Ejemplo de una Funci´on de Distribuci´on.
Ver el ejemplo de la Figura 2.2.
En el caso particular que dado X una v.a.d., representa a la funci´on acumulativa
F(X) = P(X ≤ x) =
∑
xi≤x
2.6. ESPERANZA MATEM ´ATICA 27
Mientras que si X es una v.a.c. se encuentra representado por
F(X) = P(X ≤ x) = Zx
−∞
f(t)dt (2.10)
siendo f(t) = P(X = t); ∀t ∈ [−∞,∞].
Luego se puede expresar f(x) = dF(x)
dx , que es la relaci´on entre la funci´on de distribuci´on y la de
densidad.
Adem´as, si X toma valores en el intervalo(a, b), entonces las integrales infinitas anteriores se reducen
a integrales finitas, como se muestra a continuaci´on.
Zb a f(x)dx = 1 (2.11) F(x) = 0 si x≤ a Z x a f(t)dt si a < x < b 0 si x≥ b (2.12)
2.6.
Esperanza Matem´atica
Sea X una v.a.d., la media o esperanza matem´atica se encuentra determinada por la expresi´on:
µX= E[X] = n
∑
i=1
xi.P(X = xi) (2.13)
A diferencia de la media definida en la estad´ıstica descriptiva, los datos est´an probabilizados, por lo que no son exactos.
Por otra parte si X es una v.a.c. quedar´ıa determinada por la siguiente expresi´on:
µX= E[X] =
Z∞
−∞x. f (x)dx (2.14)
El comportamiento de la esperanza matem´atica respecto de las transformaciones lineales es el siguiente:
2.7.
Varianza y Desviaci´on T´ıpica
Dada una v.a.d. X , la varianza viene dada por:σ2 X= V [X] = E[(X − µX)2] = n
∑
i=1 (xi− µX)2.P(X = xi) (2.16)y si se desarrolla el cuadrado y se aplican las propiedades de la esperanza, se obtiene:
σ2 X= n
∑
i=1 (x2i − 2xiµX+ µ2X).P(X = xi) (2.17) σ2 X= n∑
i=1 x2i.P(X = xi) − 2µX n∑
i=1 xi.P(X = xi) + µ2X n∑
i=1 P(X = xi) (2.18) σ2 X= n∑
i=1 x2i.P(X = xi) − 2µX.µX+ 1.µ2X (2.19) σ2 X= n∑
i=1 x2i.P(X = xi) − 2µ2X+ µ2X (2.20) σ2 X= n∑
i=1 x2i.P(X = xi) − µ2X (2.21) V[X] = E[X2] − (E[X])2 (2.22)Por otra parte, para una v.a.c. X la varianza se define como:
σ2
X= V [X] = E[(X − µX)2] =
Z ∞
−∞(xi− µX)
2. f (x)dx (2.23)
Pudiendo simplificarse al igual que la v.a.d. mediante la siguiente formula:
V[X] = E[X2] − (E[X])2 (2.24)
Por ´ultimo, ya sea una v.a.d o una v.a.c, la desviaci´on t´ıpica se define como:
σX= +
q σ2
2.8. MOMENTOS 29
2.8.
Momentos
Dada una v.a.d. X , se llama momento de orden k respecto del par´ametro c a la esperanza matem´atica de
la variable(X − c)k, es decir: Mk(c) = n
∑
i=1 (xi− c)k.P(X = xi) (2.26)Si c= 0 se obtienen los momentos respecto al origen que se representan por mk.
mk= E[Xk] = n
∑
i=1
xki.P(X = xi) (2.27)
Si c= µXse obtienen los momentos centrales que se representan por µk.
µk= E[(X − µX)k] = n
∑
i=1
(xi− µX)k.P(X = xi) (2.28)
Mientras que para una v.a.c. X , se llama momento de orden k respecto del par´ametro c a la esperanza
matem´atica de la variable(X − c)k, es decir:
Mk(c) =
Z ∞
−∞(x − c)
k. f (x)dx (2.29)
Si c= 0 se obtienen los momentos respecto al origen que se representan por mk.
mk= E[Xk] =
Z ∞ −∞
xk. f (x)dx (2.30)
Si c= µXse obtienen los momentos centrales que se representan por µk.
µk= E[(X − µX)k] =
Z ∞
−∞(x − µX)
k. f (x)dx (2.31)
Por ´ultimo, ya sea una v.a.d. o una v.a.c., se cumplen las propiedades de los momentos:
m0= 1
m1= µX
m2=σ2+ µ2X
µ1= 0
µ2=σ2= m2− µ2X
2.9.
Distribuciones de Probabilidad conocidas
La ley de probabilidades de una v.a.d. X se define si se conoce su distribuci´on de probabilidad P(xi) =
P(X = xi) con i = 1, 2, .., ´o bien si se conoce su funci´on de distribuci´on F(x), cumpli´endose:
∑
i≥1 P(X = xi) = 1 F(x) = P(X ≤ x) =∑
xi≤x P(X = xi)A continuaci´on se listan algunas de las principales distribuciones de la v.a.d..
2.9.1.
Distribuci´on Uniforme
Una v.a.d. X que toma los valores enteros x1, x2, x3, ..., xncon probabilidades
P[X = xk] =
1
n con k= 1, 2, ..., n (2.32)
recibe el nombre de variable uniforme discreta, su distribuci´on de probabilidad distribuci´on uniforme
discreta y se denota por X U(x1, x2, ..., xn).
En el caso particular de que la variable tomo como valores los primeros n ´umeros naturales:
P[X = k] =1
n con k= 1, 2, ..., n (2.33)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= n+ 1 2 σ2 x= n2− 1 12 σx= r n2− 1 12
2.9. DISTRIBUCIONES DE PROBABILIDAD CONOCIDAS 31
2.9.2.
Distribuci´on de Bernoulli
Recibe el nombre de prueba de Bernoulli, aquel experimento que s´olo admite 2 resultados posibles excluyentes:
Suceso A (representa el ´exito) con probabilidad P(A) = p.
Suceso Ac(representa el fracaso) con probabilidad P(Ac) = 1 − p = q.
Dada la v.a.d. X asociada al experimento que asocia el valor 1 al suceso A con probabilidad p y el valor
0 al suceso Accon probabilidad q. Esta variable recibe el nombre de variable de Bernoulli y se denota
por X Ber(p).
La distribuci´on de probabilidad es:
P(X = 1) = p y P(X = 0) = 1 − p = q con p + q = 1 (2.34)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= p
σ2
x= p.q
σx= √p.q
2.9.3.
Distribuci´on Binomial
Si se supone que se realizan n pruebas de Bernoulli sucesivas e independientes. Entonces, a la v.a.d.
X , que representa el n ´umero de veces que ocurre el suceso A (´exito) en las n pruebas, se la denomina
variable binomial de par´ametro n y p, y se denota por X B(n, p), siendo p la probabilidad de ´exito de
cada prueba de Bernoulli.
La variable binomial X se la puede considerar como la suma de n variables independientes de Bernou-lli, es decir:
La v.a. definida toma los valores 0, 1, 2, ..., n con la siguiente probabilidad: P(X = k) =n k .pk.qn−kcon n= 1, 2, 3, ... k= 1, 2, ..., n 0< p < 1 (2.36)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= n.p
σ2
x= n.p.q
σx= √n.p.q
2.9.4.
Distribuci´on de Poisson
Una v.a.d. X sigue una distribuci´on de probabilidad de Poisson de par´ametroλy se denota por X P(λ),
si puede tomar todos los valores enteros 0, 1, 2, ... con la siguiente probabilidad:
P(X = k) =λ k k!.e −λcon (k= 0, 1, 2, ... λ> 0 (2.37)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx=λ σ2 x=λ σx= √ λ
2.9.5.
Distribuci´on Hipergeom´etrica
Si se considera una poblaci´on de N elementos de dos clases distintas de los cuales D elementos son de
la clase A y N− D elementos son de la clase Ac.
Al tomar un elemento de esta poblaci´on, la probabilidad de que proceda de una u otra clase es:
P(A) =D
N = p → D = p.N (2.38)
P(Ac) =N− D
2.9. DISTRIBUCIONES DE PROBABILIDAD CONOCIDAS 33
Si se considera el experimento consistente en tomar n elementos consecutivos de una poblaci´on sin reemplazamiento. A la v.a.d. X , n ´umero de elementos de la clase A en una muestra de tama ˜no n, se la denomina variable hipergeom´etrica.
Entonces, se denomina distribuci´on hipergeom´etrica de par´ametros N, D y n, y se denota con la
expre-si´on X H(N, D, n), a la distribuci´on de probabilidad que se detalla a continuaci´on:
P[X = k] = D k N−D n−k N n = p.N k q.N n−k N n con N= 1, 2, 3, ... n= 1, 2, ..., N p= 0,N1,N2, ..., 1 (2.40)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= n.p σ2 x= n.p.q. N− n N− 1 σx= r n.p.q.N− n N− 1
2.9.6.
Distribuci´on Geom´etrica o de Pascal
Si se considera un experimento que consiste en realizar sucesivas pruebas de Bernoulli. A la v.a.d. X , n ´umero de pruebas necesarias para obtener el primer ´exito, se la denomina variable geom´etrica.
Entonces, se denomina distribuci´on geom´etrica o de Pascal de par´ametro p y se denota por X Ge(p),
a la distribuci´on de probabilidad que se detalla a continuaci´on:
P[X = k] = p.qk−1con
(k= 1, 2, 3, ...
0< p < 1; q = 1 − p
(2.41)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= 1 p σ2 x= q p2
σ= √q
p
2.9.7.
Distribuci´on Binomial negativa
Si se considera un experimento que consiste en realizar sucesivas pruebas de Bernoulli. A la v.a.d. X , n ´umero de fracasos antes de obtener el n-´esimo ´exito, se la denomina binomial negativa.
Entonces, se denomina distribuci´on binomial negativa de par´ametros n y p, y se denota por X
BN(n, p), a la distribuci´on de probabilidad que se detalla a continuaci´on:
P[X = k] =n + k − 1 k .pn.qkcon k= 0, 1, 2, 3, ... n= 1, 2, ... 0< p < 1 (2.42)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= n.q p σ2 x= n.q p2 σx= √n.q p
2.10.
Funciones de Densidad conocidas
La ley de probabilidades de una v.a.c. X se define si se conoce su funci´on de densidad f(x) o bien si se
conoce su funci´on de distribuci´on F(x), tal que:
P(a < X ≤ b) = Zb a f(x)dx F(x) = P(X ≤ x) Z∞ −∞ f(x)dx = 1
2.10. FUNCIONES DE DENSIDAD CONOCIDAS 35
Adem´as, cumple la siguiente relaci´on:
F(x) = Zx −∞ f(t)dt (2.43) f(x) =dF(x) dx (2.44)
A continuaci´on se listan algunas de las principales distribuciones de la v.a.c..
2.10.1.
Distribuci´on Uniforme
Una v.a.c. X sigue una distribuci´on uniforme en el intervalo[a, b] y se denota por X U[a, b] cuando su
funci´on de densidad es:
f(x) = 0 si x6∈ [a,b] 1 b− a si x∈ [a,b] (2.45)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= a+ b 2 σ2 x=(b − a) 2 12 σx= b− a √ 12
2.10.2.
Distribuci´on Normal o de Laplace-Gauss
Una v.a.c. X sigue una distribuci´on normal de media µ y desviaci´on t´ıpicaσy se denota por X N(µ,σ)
cuando su funci´on de densidad es:
f(x) = 1 σ√2πe− 1 2( x−µ σ )2 con (−∞< µ <∞ σ> 0 (2.46)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= µ
σ2
x=σ2
Variable normal tipificada
Si la v.a.c. X es N(µ,σ), la variable normal tipificada tambi´en ser´a una distribuci´on normal de media
µz= 0 y desviaci´on t´ıpicaσz= 1:
Z=X− µ
σ (2.47)
Entonces, Z N(0, 1) y su funci´on de densidad es:
f(z) =√12πe−21z2 con−∞< z <∞ (2.48)
2.10.3.
Distribuci´on Gamma
Una v.a.c. X sigue una distribuci´on gamma y se denota por X G(α, p) cuando su funci´on de densidad
es:
f(x) = α
p
Γ(p)e
−αxxp−1con x> 0 (2.49)
Se define la funci´on gamma Euler comoΓ(p) =
Z ∞
0
e−xxp−1dx que resulta continua y convergente para p> 0. Entre sus propiedades se destaca:
p.1) Γ(1) = 1
p.2) Γ(p) = (p − 1)Γ(p − 1)
p.3) Si p∈ Z∗entoncesΓ(p) = (p − 1)!
2.10.4.
Distribuci´on Exponencial
Es un caso particular de la distribuci´on gamma con p= 1.
X Exp(α) si f (x) =
(αe−αxsi x> 0
0 en el resto
(2.50)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx=
1 α
2.10. FUNCIONES DE DENSIDAD CONOCIDAS 37 σ2 x= 1 α2 σx= 1 α
2.10.5.
Distribuci´on
χ
2de Pearson
Es un caso particular de la distribuci´on gamma conα= 1/2 y p = n/2 que se genera mediante la suma
de los cuadrados de n v.a.c. N(0, 1) independientes entre si, es decir, si X1, X2, ..., Xnson n v.a.c. N(0, 1)
independientes entre si, entonces la v.a.c. positivaχ2nrecibe el nombreχ2de Pearson con n grados de
libertad.
χ2
n= X12+ X22+ ... + Xn2 (2.51)
Entonces, su funci´on de densidad es:
f(x) = 1
2n/2Γ(n/2)e−x/2x(n/2)−1con x> 0 (2.52)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= n σ2 x= 2n σx= √ 2n
2.10.6.
Distribuci´on Beta
Una v.a.c. X sigue una distribuci´on beta y se denota por X β(p, q) si sigue la siguiente funci´on de
distribuci´on:
f(x) =x
p−1(1 − x)q−1
β(p, q) con x∈ [0,1] (2.53)
Luego, se define la funci´on beta como:
β(p, q) =ΓΓ(p).Γ(q) (p + q) =
Z 1
0
2.10.7.
Distribuci´on t de Student
Se denomina t de Student con n grados de libertad, si las n+ 1 v.a.c. X, X1, X2, ..., Xnse distribuyen seg ´un
una N(0,σ). tn= X s 1 n n
∑
i=1 Xi2 =pZ X2 n/n (2.55)Entonces, su funci´on de densidad es:
f(x) = 1 √ n.β1 2, n 2 1+x 2 n − n+ 1 2 con (n= 1, 2, ... −∞< x <∞ (2.56)
Luego, su media, varianza y desviaci´on t´ıpica son:
µx= 0 σ2 x= n n− 2si n> 2 σx= r n n− 2 si n> 2
2.10.8.
Distribuci´on F de Fisher-Snedecor
Seanχ2n 1yχ 2 n2 dos v.a.c.χ 2de Pearson con n1y n2grados de libertad respectivamente, independientes
entre si. Entonces se denomina F de Fisher-Snedecor con n1y n2grados de libertad a la variable:
Fn1,n2= χ2 n1/n1 χ2 n2/n2 (2.57)
Luego, su funci´on de densidad es:
f(x) =ΓΓ((n1+ n2)/2) (n1/2)Γ(n2/2) nn1/2 1 n n2/2 2 x(n1/2)−1 (n1x+ n2)(n1+n2)/2 con x> 0 (2.58)
2.11.
Teor´ıa de Muestras
La Estad´ıstica tiene como objeto el estudio de un conjunto de personas, cosas o, en general, elementos con alguna caracter´ıstica com ´un a todos ellos. Sin embargo, si se quiere obtener informaci´on sobre una
2.11. TEOR´IA DE MUESTRAS 39
poblaci´on, se puede obtener datos de la totalidad (censo) o bien de una parte (muestra). La parte de la estad´ıstica que estudia la relaci´on entre las muestras de una poblaci´on y la poblaci´on misma recibe el nombre de Teor´ıa de Muestras.
En la pr´actica, suele ocurrir que no es posible estudiar los datos de toda la poblaci´on, ya que:
el n ´umero de la poblaci´on es muy elevado, el estudio llevar´ıa tanto tiempo que ser´ıa impracticable o econ ´omicamente inviable.
el estudio puede implicar la destrucci´on del elemento estudiado. Por ejemplo, vida ´util de una l´ampara. los elementos pueden existir conceptualmente, pero no en la realidad. Por ejemplo, la proporci´on de piezas defectuosas que producir´a una m´aquina.
En estos casos se seleccionan muestras, que permiten obtener el comportamiento promedio para for-mular leyes generales.
Los m´etodos mas destacados para obtener muestras son:
Muestreo aleatorio simple Se elige al azar con reemplazamiento (un elemento no puede ser elegido 2
ve-ces).
Muestreo estratificado Los elementos de la poblaci´on se dividen en clases o estratos. La muestra se toma
asignando un n ´umero o cuota de miembros a cada estrato (proporcional a su tama˜no relativo o a su variabilidad) y escogiendo los elementos por muestreo aleatorio simple dentro del estrato.
Muestreo sistem´atico Los elementos de la poblaci´on est´an ordenados en listas. Se divide la poblaci´on en
tantas partes como el tama˜no muestral y se elige al azar un n ´umero de orden en cada parte de la poblaci´on.
En la teor´ıa de muestras se distinguen dos tipos de objetivos:
1 Deducir caracter´ısticas (par´ametros) de la poblaci´on (Inferencia Estad´ıstica).
2 Analizar la concordancia o no de los resultados muestrales con determinadas hip ´otesis (Contraste de
Hip ´otesis). Poblaci´on Censo Muestra Inferencia estad´ıstica (Estimaci´on Puntual
Estimaci´on por intervalos Contraste de hip ´otesis
2.11.1.
Inferencia Estad´ıstica
Es evidente el hecho de que las medidas o caracter´ısticas de una muestra son variables aleatorias, ya que dependen de los valores de la variable aleatoria de la poblaci´on.
Por tanto, una muestra es un vector de valores x1, x2, ..., xn∈ En, teniendo asociado cada valor una
probabilidad de ser elegido.
Se llamar´a estad´ıstico a una funci´on F : En→ R, es decir, una formula de las variables que transforma
los valores tomados de la muestra en un n ´umero real. Adem´as, a la distribuci´on de F se la llama distribuci´on del estad´ıstico en el muestreo.
Cuando se realiza una afirmaci´on acerca de los par´ametros de la poblaci´on en estudio, bas´andose en la informaci´on contenida en la muestra se realiza una estimaci´on puntual, pero si se se ˜nala un intervalo de valores dentro del cual se tiene confianza que est´e el valor del par´ametro, se realiza una estimaci´on
por intervalos.
Estimaci´on Puntual
El proceso de estimaci´on puntual utiliza un estad´ıstico para obtener alg ´un par´ametro de la poblaci´on. Como tal, el estad´ıstico utiliza una variable aleatoria que tiene cierta distribuci´on que depende, en general, del par´ametro en cuesti´on. Adem´as, se utilizar´an dos criterios esenciales para medir la bondad del estimador:
que sea centrado o insesgado, es decir, que su media coincida con el par´ametro a estimar.
que sea de m´ınima varianza o que tenga la menor varianza entre todos los estimadores del par´ametro.
Estimaci´on por Intervalos
En la pr´actica, no s´olo interesa dar una estimaci´on puntual de un par´ametro X sino un intervalo de valores dentro del cual se tiene confianza de que est´e el par´ametro. Por tanto, lo que se busca es un
esti-mador denominado estiesti-mador por intervalo compuesto de una pareja de estad´ısticos Li(l´ımite inferior)
y Ls (l´ımite superior), y siendo 1−αel nivel de confianza, mientras queαes el nivel de significaci´on,
tales que:
2.11. TEOR´IA DE MUESTRAS 41
Es decir, se llama intervalo de confianza para el par´ametro X con nivel de confianza 1−α, a una
expresi´on del tipo Li≤ X ≤ Lsdonde los l´ımites Liy Lsdependen de la muestra y se calculan de manera
tal que si se construyen muchos intervalos, cada vez con distintos valores muestrales, el 100(1 −α) %
de ellos contendr´an el verdadero valor del par´ametro.
La amplitud del intervalo est´a ´ıntimamente relacionada con los niveles de confianza y significaci´on. Si la amplitud del intervalo es peque ˜na entonces la afirmaci´on de que el par´ametro pertenece al intervalo
tiene gran significaci´on (αes grande) pero ofrece poca confianza (1−αes peque ˜na). Pero si la amplitud
del intervalo es grande entonces la afirmaci´on de que el par´ametro pertenece al intervalo tiene menor
significaci´on (αes peque ˜no) aunque ofrece mucha confianza (1−αes grande).
Por ejemplo, la afirmaci´on “la altura media de una poblaci´on est´a entre 1, 68 y 1, 72 metros” con
α= 0, 25 es m´as significativa que la afirmaci´on “la altura media de una poblaci´on est´a entre 1, 60 y 1, 82 metros” conα= 0, 01, aunque esta ´ultima afirmaci´on ofrece m´as confianza 1 −α= 0, 99 que la
primera 1−α= 0, 75.
2.11.2.
Contraste de Hip´otesis
Otro objetivo fundamental de la teor´ıa de muestras, es confirmar o rechazar hip´otesis sobre un par´ame-tro poblacional, mediante el empleo de muestras. Es decir, contrastar una hip´otesis estad´ısticamente es juzgar si cierta propiedad supuesta para cierta poblaci´on es compatible con lo observado en una muestra de ella.
A continuaci´on se pasan a definir algunos conceptos importantes:
Contraste de hip´otesis Procedimiento estad´ıstico mediante el cual se investiga la aceptaci´on o rechazo de
una afirmaci´on acerca de una o varias caracter´ısticas de una poblaci´on.
Hip´otesis nula, H0 Es la hip ´otesis que se quiere contrastar y es, por tanto, la que se acepta o rechaza como
conclusi´on del contraste.
Hip´otesis alternativa, Ha Es la hip ´otesis que se opone a la H0, de forma que si se acepta la Hase descarta
la H0, y rec´ıprocamente, si se rechaza Hase acepta H0.
Estad´ıstico de contraste Es una funci´on de la muestra aleatoria simple, que aplica la muestra(x1, x2, ..., x3)
en un punto de la recta real.
Regi´on de aceptaci´on Conjunto de valores del estad´ıstico de contraste que lleva a la decisi´on de aceptar la
hip ´otesis nula H0.
Regi´on cr´ıtica o de rechazo Conjunto de valores del estad´ıstico de contraste que lleva a la decisi´on de
Error tipo I,α Error que se comete en la decisi´on del contraste cuando se rechaza la hip ´otesis nula H0,
siendo cierta.
Error tipo II,β Error que se comete en la decisi´on del contraste cuando se acepta la hip ´otesis nula H0,
siendo falsa.
Nivel de significaci´on Es la probabilidad de cometer el error de tipo I, y se denota porα. Tambi´en se suele
denominar tama˜no del contraste.
Potencia de un contraste, 1−α Es la probabilidad de rechazar la hip ´otesis nula H0, siendo falsa. Se
utili-zar´a siempre contrastes de m´axima potencia (o m´aximo nivel de confianza), dentro de los que tienen un determinado nivel de significaci´on.
Contraste unilateral Es aqu´el cuya regi´on cr´ıtica est´a formada por un solo intervalo de la recta real. Contraste bilateral Es aqu´el cuya regi´on cr´ıtica est´a formada por dos intervalos disjuntos de la recta real.
Por ´ultimo, para realizar un contraste de hip´otesis es conveniente seguir las siguientes fases:
1 Enunciado y determinaci´on de las hip ´otesis H0y Ha.
2 Elecci´on del nivel de significaci´onα.
3 Especificaci´on del tama˜no muestral.
4 Selecci´on de estad´ıstico o funci´on de decisi´on. 5 Determinaci´on de la regi´on cr´ıtica.
6 C´alculo del valor del estad´ıstico de contraste o funci´on de decisi´on para la muestra particular.
Parte II
45
Hasta ahora las muestras se han analizado con el objetivo de ser comparadas contra una poblaci´on en un momento determinado, sin tener en cuenta la evoluci´on de la variable en el tiempo.
Si se tuviese en cuenta la evoluci´on de la variable, mediante una sucesi´on de muestras ordenadas en el tiempo, al conjunto de datos resultante se lo denomina Serie Temporal, Hist´orica, Cronol´ogica o de Tiempo[Fer04b].
Luego, el an´alisis de una serie temporal implica el manejo conjunto de dos variables, la variable en estudio y la variable temporal, que determina cuando se han realizado las observaciones.
Las observaciones de la variable en estudio pueden estar referidas a un:
Instante de tiempo: Se denominan magnitudes stock o niveles. Por ejemplo, cantidad de empleados de una
empresa al final de cada mes.
Intervalo de tiempo: Se denominan flujos. Por ejemplo, ventas de una empresa a lo largo de cada mes.
La diferencia entre una y otra es que la primera no es sumable, pues se incurrir´ıa en duplicaciones, mientras que la segunda es acumulable. Las ventas de un mes se pueden sumar con la del anterior y as´ı se podr´ıan obtener las ventas de los 2 ´ultimos meses. Mientras que la observaci´on de los empleados de un mes, no se puede sumar a los empleados del mes anterior, porque se podr´ıan estar sumando dos veces los mismos empleados.
Esto ´ultimo destaca la importancia de la Homogeneidad, ya que si la amplitud temporal variase ser´ıa dif´ıcil hacer comparaciones entre las diferentes observaciones de una Serie Temporal. Por otra parte esta homogeneidad se pierde de forma natural, con el transcurso del tiempo, de manera que cuando las series son muy largas no hay garant´ıa de que los datos iniciales y finales sean comparables.
Pero la necesidad de que las series temporales no sean muy largas, para que sus datos no pierdan la homogeneidad, entra en contradicci´on con el objetivo m´as elemental de la Estad´ıstica que es el de detectar regularidades en los fen´omenos de masas.
Lo que se pretende con una serie temporal es describir y predecir el comportamiento de un fen´omeno que cambia en el tiempo. Esas variaciones que experimenta una serie temporal pueden ser:
Evolutivas: El valor medio de la serie cambia, no permanece fijo en el tiempo.
Estacionales: El valor medio de la serie y su variabilidad no cambian, aunque sufra oscilaciones en torno a
Esta clasificaci´on permite hablar de Series Temporales Evolutivas o Series Temporales Estacionales, de acuerdo al resultado del an´alisis realizado.
Por otra parte, existen dos tipos de enfoques para analizar una Serie Temporal: el Enfoque Cl´asico y el Enfoque Causal.
Cap´ıtulo 3
Enfoque cl´asico
Una forma de comenzar el an´alisis de una serie temporal, es mediante su representaci´on gr´afica. Para ello se har´a uso de un sistema cartesiano en el que los per´ıodos de tiempo se ubican en el eje de las
abscisas y los valores de la variable aleatoria (yt) se llevan al eje de ordenadas. El resultado es un
diagrama de dispersi´on, con la particularidad de que el eje de abscisas se reserva siempre a la misma variable: el tiempo. -100 -80 -60 -40 -20 0 20 40 0 0.2 0.4 0.6 0.8 1
Figura 3.1: Ejemplo de una serie temporal.
En este tipo de representaci´on se pueden detectar las caracter´ısticas mas sobresalientes de una serie temporal, tales como el movimiento a largo plazo de la variable aleatoria, la amplitud de las oscilaciones, la posible existencia de ciclos, la presencia de valores at´ıpicos o an´omalos, etc. Ver el ejemplo de la Figura 3.1.
El enfoque cl´asico asume que el comportamiento de la serie temporal se puede explicar en funci´on del
tiempo: yt= f (t). Bajo este esquema, la serie ser´ıa una variable dependiente y el tiempo una
indepen-diente o explicativa. Sin embargo, es necesario dejar bien claro que el tiempo, en si, no es una variable explicativa, es simplemente el “soporte” o escenario en el que se realiza o tiene lugar la serie temporal.
Desde este enfoque, cualquier serie temporal se supone que es el resultado de cuatro componentes:
tendencia (T), variaciones estacionales (E), variaciones c´ıclicas (C) y variaciones residuales o accidentales (R). Pero esta descomposici´on de la serie no deja de ser un procedimiento dise ˜nado para que el estudio
de la misma resulte m´as f´acil, pues esas componentes no siempre existen.
3.1.
Tendencia
La tendencia se define como aquella componente que recoge el comportamiento de la serie a largo plazo, prescindiendo de las variaciones a corto y mediano plazo. Para poder detectarla es necesario que la serie conste de un n ´umero de observaciones elevado, a lo largo de muchos a ˜nos, para que se pueda determinar si la serie muestra un movimiento a largo plazo que responda a una determinada ley de crecimiento, decrecimiento (series evolutivas) o estabilidad (series estacionarias). Ese comportamiento tendencial puede responder a distintos perfiles: lineal, exponencial, parab ´olico, log´ıstico, etc.
0 50 100 150 200 0 0.2 0.4 0.6 0.8 1 A B C
Figura 3.2: Identificaci´on de la tendencia.
Ver en el ejemplo de la Figura 3.2 como cambia la forma de percibir la tendencia si es que se toma el intervalo de tiempo inadecuado.
Si se intenta establecer la tendencia teniendo en cuenta solo el intervalo comprendido entre A y B, la
3.1. TENDENCIA 49
mayor (por ejemplo desde A hasta C) la tendencia asciende.
El problema es que el concepto de largo plazo va ´ıntimamente relacionado a la naturaleza de la varia-ble, por lo que la longitud utilizada para determinar una tendencia no es comparable entre variables.
Los m´etodos m´as habituales en la determinaci´on de la tendencia son: el an´alisis gr´afico, las medias
m´oviles, los m´etodos anal´ıticos y los de alisado exponencial.
3.1.1.
An´alisis gr´afico
Es el procedimiento mas simple, ya que no utiliza ning ´un procedimiento anal´ıtico que garantice la objetividad del resultado, y deja la posibilidad que dos analistas distintos lleguen a distintos resultados.
Todo depende del conocimiento que tenga el investigador de la serie temporal estudiada. Ya que en una primera instancia se realiza la representaci´on gr´afica, para luego trazar la tendencia a mano alzada.
Aunque no es aconsejable confiar en los resultados que pueda arrojar este tipo de an´alisis de tendencia, suele utilizarse como un paso previo para cualquier tipo de an´alisis a realizarse en una serie.
3.1.2.
Medias m´oviles
Consiste en promediar los valores de la variable aleatoria para per´ıodos de tiempo fijos a lo largo de todo el horizonte de la serie temporal.
El resultado de este proceso mec´anico es la eliminaci´on de los movimientos a corto y mediano plazo, as´ı como las irregularidades debidas a factores no controlables ni predecibles. Es decir, a la serie se le
quitan dos de sus componentes, quedando con la tendencia y la ciclicidad1.
La idea que subyace detr´as de este m´etodo es que la media de cualquier conjunto de valores sirve para eliminar la dispersi´on o variabilidad de la serie motivada por factores coyunturales o espor´adicos.
Estos promedios ser´an las medias aritm´eticas de un conjunto k de valores consecutivos, con el requisito de que k sea inferior al total de observaciones. El procedimiento espec´ıfico var´ıa si k es par o impar.
Si k es entero impar, entonces las sucesivas medias se obtendr´ıan de la siguiente forma: y∗t = k−1 2
∑
i=−k−1 2 yt+i k (3.1) y∗t = yt−k−1 2 + yt−k−12 +1+ yt−k−12 +2+ ... + yt+ ... + yt+k−22 −1+ yt+k−12 −1+ yt+k−12 k (3.2)A la media yt∗se la denomina centrada y se la hace corresponder con la observaci´on del momento t,
que es el valor central de la suma.
Si k es entero par, no se podr´ıa determinar el valor central de k, por lo que no se corresponder´ıa con ninguno de los observados en la serie original. Esto se supera al aplicar nuevamente el m´etodo
de medias m´oviles con k= 2, quedando ahora si los valores centrales relacionados con los valores
observados originalmente.
La f´ormula que se utiliza para ambos casos, cuando k es un entero par, es la siguiente:
y∗t−0,5= k 2−1
∑
i=−k2 yt+i k (3.3)Luego, sea k entero par o impar, es importante determinar el tama ˜no ´optimo que suavice la serie temporal y que deje expuesta la tendencia. Si k es muy grande entonces el proceso de suavizado puede llegar a ser tan fuerte que se pierda m´as informaci´on de la deseada. Por otro lado, si k es muy peque ˜no no se conseguir´an eliminar todas las perturbaciones ajenas a la tendencia.
Si la serie demuestra estacionalidad, o alg ´un tipo de ciclicidad, el valor de k deber´ıa ser mayor o igual al intervalo de tiempo necesario para que se produzca un ciclo. En caso de ser estacionalidad, k deber´ıa ser mayor o igual al a ˜no. Para cualquier otro caso, en donde exista incertidumbre se recomienda que k sea igual a 3 o 5.
En el ejemplo de la Figura 3.3, se muestra una serie temporal y su tendencia calculada por medias
m´oviles. Adem´as se muestra la serie original sin la tendencia calculada (filtrada por el m´etodo aditivo2).
2La uni´on de los componentes de una serie se realiza a partir de dos m´etodos, en el aditivo yt= T
t+Ct+ Et+ Rt, mientras que en el multiplicativo yt= Tt∗Ct∗ Et∗ Rt.
3.1. TENDENCIA 51 -150 -100 -50 0 50 0 0.2 0.4 0.6 0.8 1
(a) Serie temporal original
tendencia (k=21) serie temporal -60 -50 -40 -30 -20 -10 0 10 20 30 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
(b) Serie temporal original sin la tendencia
serie temporal sin tendencia
Figura 3.3: Obtenci´on de la tendencia por Medias M´oviles.
Al igual que en el an´alisis gr´afico se introduce subjetividad en la selecci´on del valor de k. Adem´as, no se puede alcanzar el objetivo de la predicci´on en el an´alisis de las series temporales, pues la tendencia obtenida mediante medias m´oviles no permite la proyecci´on hacia el futuro.
3.1.3.
M´etodo anal´ıtico
Selecciona una funci´on matem´atica que modelice de forma adecuada la tendencia de la serie temporal. El procedimiento de ajuste suele ser el de los m´ınimos cuadrados, aunque para comenzar el an´alisis se recurre a la representaci´on gr´afica que informa de manera aproximada el tipo de funci´on. Otra alternativa es hacer uso del conocimiento previo de la naturaleza de una serie temporal.
La utilizaci´on de este m´etodo con respecto a los anteriores tiene dos ventajas:
Se mide la bondad del ajuste, dejando de lado la subjetividad del analista.
Se determina una funci´on expl´ıcita, que permite realizar predicciones.
Lineal
Modelo en el que la variable aleatoria se hace depender linealmente del tiempo, y en donde se presentan variaciones constantes para periodos sucesivos de tiempo. La forma general del mismo es:
yt= y∗t+ Rt= a + bt + Rt (3.4)
Donde:
t Tiempo cronol´ogico.
b Variaci´on media entre periodos. yt Serie temporal original.
y∗t Estimaci´on de la Tendencia.
Rt Resto de las componentes no identificadas, representadas como un residuo.
-200 20 40 60 80 100 120 140 160 0 0.2 0.4 0.6 0.8 1
(a) Serie temporal original
serie temporal -200 20 40 60 80 100 120 140 160 0 0.2 0.4 0.6 0.8 1
(b) Tendencia con el modelo lineal
tendencia lineal (y = 110.55x+-5.0624) serie temporal -60 -40 -20 0 20 40 60 0 0.2 0.4 0.6 0.8 1
(c) Serie temporal original sin la tendencia calculada
serie temporal sin tendencia
Figura 3.4: Obtenci´on de la tendencia por el M´etodo Anal´ıtico Lineal.
Ver el ejemplo de la Figura 3.4.
Polinomial
Modelo en el que la relaci´on de la variable aleatoria con el tiempo se expresa a partir de un polinomio. Las variaciones no son constantes, ni en t´erminos absolutos ni relativos.
3.1. TENDENCIA 53
El grado del polinomio va a decidir la familia de funciones que se utilice en el modelo, aunque el mas com ´un de todos es el modelo de funci´on parab´olica. La forma general del mismo es:
yt= y∗t + Rt= a + bt + ct2+ Rt (3.5)
Donde:
t Tiempo cronol´ogico. yt Serie temporal original.
y∗t Estimaci´on de la Tendencia.
Rt Resto de las componentes no identificadas, representadas como un residuo.
0 5 10 15 20 25 30 35 0 0.5 1 1.5 2
(a) Serie temporal original
serie temporal 0 5 10 15 20 25 30 35 0 0.5 1 1.5 2
(b) Tendencia con el modelo polinomial
tendencia polinomial 24.713x2-48.907x+30.135 serie temporal -10 -5 0 5 10 0 0.5 1 1.5 2
(c) Serie temporal original sin la tendencia
serie temporal sin tendencia
Figura 3.5: Obtenci´on de la tendencia por el M´etodo Anal´ıtico Polinomial.
Ver el ejemplo de la Figura 3.5.
Exponencial
Modelo en el que la relaci´on de la variable aleatoria con el tiempo se expresa a partir de una funci´on exponencial, por lo que la serie temporal cambia a raz´on de una tasa constante. El ajuste por m´ınimos cuadrados es f´acilmente realizable, debido a que la funci´on es linealizable. La forma general del modelo es:
Donde:
t Tiempo cronol´ogico. yt Serie temporal original.
y∗t Estimaci´on de la Tendencia.
a Tasa de variaci´on inicial. b Tasa de variaci´on instant´anea.
Rt Resto de las componentes no identificadas, representadas como un residuo.
0 0.5 1 1.5 2 0 0.5 1 1.5 2
(a) Serie temporal original
serie temporal 0 0.5 1 1.5 2 2.5 0 0.5 1 1.5 2
(b) Tendencia con el modelo exponencial
tendencia polinomial (-0.00371635+0.0421471i) e(1.30309-0.0485662i)x
2+(-0.538773-0.859227i)x serie temporal -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0 0.5 1 1.5 2
(c) Serie temporal original sin la tendencia
serie temporal sin tendencia
Figura 3.6: Obtenci´on de la tendencia por el M´etodo Anal´ıtico Exponencial
Ver el ejemplo de la Figura 3.6.
3.1.4.
Alisado exponencial
Los m´etodos para calcular la tendencia explicados hasta aqu´ı, ya sea el de medias m´oviles o alguno de los m´etodos anal´ıticos, se agrupan dentro del conjunto de t´ecnicas para el alisado proporcional.
El alisado exponencial consiste, al igual que los m´etodos anteriores, en medias ponderadas; pero con la particularidad que la ponderaci´on decrece conforme nos alejamos del origen. Esto es ´util para la predicci´on de series no estacionales y con una tendencia no definida.