• No se han encontrado resultados

TEMA 3: DISTRIBUCIONES BIDIMENSIONALES.

N/A
N/A
Protected

Academic year: 2021

Share "TEMA 3: DISTRIBUCIONES BIDIMENSIONALES."

Copied!
8
0
0

Texto completo

(1)

3.1. Conceptos Generales. ... 1

3.2. Distribuciones bidimensionales de frecuencias... 1

3.2.1. Tablas de correlación y contingencia. ... 1

3.2.2. Distribuciones marginales y condicionadas. ... 3

3.3. Momentos en distribuciones bidimensionales:... 5

3.3.1. Momentos respecto al origen (no centrados). ... 5

3.3.2. Momentos respecto a la media (centrados): La covarianza. ... 5

3.4. Independencia estadística:... 7

3.1. Conceptos Generales.

Hasta ahora hemos estudiado sobre cada observación de las que forman la muestra el valor que presenta un determinado carácter. En este tema estudiaremos sobre cada observación dos caracteres (por ejemplo: peso y altura, edad y salario,...). Estos dos caracteres tendrán unas variables asociadas que denotaremos por X e Y. cada variable tomara unos valores x1 , x2 , ...,xk (la variable X) y y1 , y2 ,..., yp (la variable Y).

A la variable (X,Y) la llamaremos variable estadística bidimensional y sus valores serán los pares de valores (xi , yj ).

Los razonamientos que presentaremos para dos variables (estadística bidimensional) son extrapolables en mayor o menor medida para “n” variables (estadística n-dimensional).

Representación numérica.

La tabla estadística más sencilla para representar una variable bidimensional consiste en colocar en dos columnas los pares de valores según se han ido observando. Un mismo subíndice afecta a ambos elementos del par y nos indica que observación nos ha proporcionado dicho par de valores (xi , yi ), el último subíndice, “n” es igual al número de observaciones:

EJEMPLO 1: LA SUPERFICIE EN HECTAREAS(X) Y PRODUCCION EN Qm.(Y) DE 5 FINCAS:

FINCA SUP.Ha.(X) PRODUC. Qm(Y)

1 10 100

2 5 75

3 10 50

4 15 75

5 5 75

3.2. Distribuciones bidimensionales de frecuencias.

3.2.1. Tablas de correlación y contingencia.

En esta representación los distintos valores de la variable X los notamos xi i= 1, 2, ..., k y los distintos valores de la variable Y los notamos yi i= 1, 2, ..., p.

A cada observación le corresponde un par de valores (xi , yj ). Al numero de observaciones que han presentado el valor xi de X e yj de Y se le denomina

(2)

Notaremos con fi j a la frecuencia relativa de dicho par:

nij

fi j = ---

N Donde N es el número de observaciones:

N=

∑∑

= = k i p j ij

n

1 1

NOTA: (interpretación del doble sumatorio)

kp k k p p j p j p kj j k i p j p j j ij k i p j ij

n

n

n

n

n

n

n

n

n

n

n

n

n

n

+

+

+

+

+

+

+

+

+

+

+

+

=

+

+

+

=

=

∑ ∑

∑∑

= = = = = = =

...

...

...

...

...

)

(

2 1 2 22 21 1 1 1 12 11 2 1 1 1 1 1 1

Es fácil comprobar que:

∑∑

∑∑

= = = =

=

=

p j k i ij k i p j ij

n

n

N

1 1 1 1

Se denomina distribución bidimensional de frecuencias al conjunto de valores (( xi ,

yj ) , nij) donde i= 1,2,..., k y j = 1,2,...,p.

Esta distribución bidimensional se representa adecuadamente mediante una tabla de doble entrada llamada tabla de correlación:

X/Y y1 y2 y3 ... yp x1 n11 n12 n13 ... n1p x2 n21 n22 n23 ... n2p ... ...

xk nk1 nk2 nk3 ... nkp

EJEMPLO 2: DISTRIBUCION SEGÚN SALARIOS (Y, EN EUROS) Y EDADES(X) DE

UN GRUPO DE 100 JOVENES. X/Y 50-100 * 75 100-150 125 150-200 175 SUMA FILA 20 10 3 2 15 21 5 15 5 25 22 2 20 15 37 23 0 13 10 23 SUMA COL. 17 51 32 100

* CUANDO ALGUNA DE LAS VARIABLES ESTAN AGRUPADAS EN INTERVALOS SE TOMA COMO VALOR xi O yj LA MARCA DE CLASE.

n42 = 13 SIGNIFICA QUE 13 DE LOS CIEN JOVENES

(3)

Si las variables objeto de estudio fueran cualitativas, la tabla se denominaría tabla de contingencia.

Si llamamos: n. j = Σ nij con “j” fijo, dicho valor se corresponde con la suma de las

frecuencias absolutas de la columna “j” de nuestra tabla.

Si llamamos: n i . = Σ ni j con “i” fijo, dicho valor se corresponde con la suma de

las frecuencias absolutas de la fila “i” de nuestra tabla.

El número total de observaciones “N” también puede obtenerse como:

= = = =

=

=

=

k i p j j k i i p j ij

n

n

n

N

1 1 . 1 . 1

En nuestro ejemplo 2 los n i . y los n. j son los datos que aparecen en la última columna y fila respectivamente.

3.2.2. Distribuciones marginales y condicionadas.

Distribuciones marginales.

De estas tablas de doble entrada (de correlación o contingencia), es posible extraer la información correspondiente a cada una de las variables (independientemente de la otra), posibilidad relevante ya que su análisis como variable unidimensional puede ser de utilidad.

A las distribuciones unidimensionales extraídas de una variable bidimensional se les denomina distribuciones marginales. Éste nombre deriva del hecho de que las

frecuencias de la distribución marginal se obtienen sumando en el margen de la derecha o inferior de la tabla de correlación las correspondientes frecuencias bidimensionales.

Dada una tabla de correlación de una variable bidimensional (X, Y) las distribuciones marginales para X e Y serán:

Distrib. Marginal primera Distrib. Marginal segunda

X n i . f i . Y n..j f . j x1 n 1 . f 1 . y1 n. 1 f. 1 x2 n 2 . f 2 . y2 n. 2 f. 2 ... ... ... xk n k. f k . yp n. p f. p SUMAS N 1 N 1 Donde: n i . n..j

f i . = --- = Σ fij CON “i” FIJO f . j = --- = Σ fij CON “j” FIJO

N N En nuestro ejemplo 2 las distribuciones marginales serian: La distribución marginal primera:

X n i . 20 15 21 25 22 37 23 23 SUMA COL. 100

(4)

La distribución marginal segunda: Y n. j 75 17 125 51 175 32 SUMA COL. 100

nota: a las medidas (media, varianza,...) calculadas sobre la distribución marginal se les añade el calificativo de marginal (media marginal, varianza marginal,...).

Distribuciones Condicionadas.

Las distribuciones condicionadas expresan como se distribuyen, según una de las dos variables, el conjunto de observaciones que cumplen una condición. Esta condición viene expresada por un valor o conjunto de valores que presenta la otra variable.

Es decir, la distribución condicionada de X cuando y toma el valor yc o el conjunto de valores yr

O la distribución condicionada de Y cuando x toma el valor xc o el conjunto de valores xr

Utilizando nuestro ejemplo 2, una distribución condicionada, seria la distribución según salarios (variable Y) condicionada a que la edad (variable X) sea 21 años, (x2 = 21).

Es decir la distribución de la variable y condicionada a que la variable X tome el valor 21 (Y⏐x= 21).

y

x= 21

n

j / 2

50 - 100

5

100 – 150 15

150 – 200

5

Se puede observar que cada una de las filas de frecuencias de la tabla de correlación define una distribución condicionada para la variable y, salvo la última que define su distribución marginal. Análogamente cada una de las columnas de frecuencias de la tabla de correlación define una distribución condicionada para la variable x, salvo la última que define su distribución marginal.

Las distribuciones condicionadas son distribuciones unidimensionales a las cuales se les puede aplicar todo lo conocido para ese tipo de distribuciones. A las características calculadas sobre las distribuciones condicionadas se les añade el calificativo de condicionada (media condicionada, varianza condicionada,...).

Para las distrib. condicionadas Y⏐xi notaremos las frecuencias relativas como fj / i :

n

ij

f

j / i

= ---

n

i .

(5)

3.3. Momentos en distribuciones bidimensionales:

3.3.1. Momentos respecto al origen (no centrados).

Se define el momento respecto al origen de la variable bidimensional (X , Y) de orden ( r , s) y lo denotamos como a r s

ij k i p j s j r i rs

x

y

n

N

a

∑∑

= =

=

1 1

1

Casos particulares: a 1 0 = es la media marginal de X a 0 1 = es la media marginal de Y

3.3.2. Momentos respecto a la media (centrados): La covarianza.

Se define el momento respecto a la media de la variable bidimensional (X , Y) de orden ( r , s) y lo denotamos como m r s

ij k i p j s j r i rs

x

x

y

y

n

N

m

∑∑

= =

=

1 1

)

(

)

(

1

Casos particulares: m 1 0 = 0 = m 0 1 m 2 0 = es la varianza marginal de X m 0 2 = es la varianza marginal de Y

El momento respecto a la media más importante es la covarianza que se nota y define como: XY ij k i p j j i

x

y

y

n

S

x

N

m

=

∑∑

=1 =1 11

(

)(

)

1

La covarianza ayuda a cuantificar la covariación entre dos variables del siguiente modo:

• Cuando Sxy > 0, hay una tendencia a que a mayores observaciones de X correspondan mayores observaciones de Y. Por ejemplo, a mayor cantidad de agua de lluvia en un año, suele corresponder una mejor cosecha.

• Cuando Sxy < 0, la tendencia resulta contraria; es decir, a mayor valor de X solemos encontrar menores valores de Y. Por ejemplo, a mayor renta per cápita en los países suele corresponder una menor mortalidad infantil.

Este valor dependerá de los valores de las variables, por tanto de sus unidades. Para poder eliminar las unidades y tener una medida adimensional utilizamos el COEFICIENTE DE CORRELACIÓN (rxy)

y x xy xy

S

S

S

r

=

(6)

siendo también invariante frente a transformaciones lineales (cambio de origen y escala) de las variable. Citamos las siguientes propiedades:

Es un coeficiente adimensional.

• -1 ≤ rxy ≤ 1

• Si hay relación lineal positiva rxy > 0 y próximo a 1. • Si hay relación lineal negativa rxy <0 y próximo a -1. • Si no hay relación lineal rxy se aproxima a 0.

• Si X e Y son independientes Sxy = 0 y por tanto rxy = 0.

RECAPITULACION

A) TABLA DE CORRELACION/CONTINGENCIA:

X/Y

y

1

y

2

y

3

... y

n

...

y

p

n

i

.

x

1

n

11

n

12

n

13

... n

1n

... n

1p

n

1

.

x

2

n

21

n

22

n

23

... n

2n

... n

2p

n

2

.

...

...

x

m

n

m1

n

m2

n

m3

...

n

mn

...

n

mp

n

m

.

...

x

k

n

k1

n

k2

n

k3

... n

kn

... n

kp

n

k

.

n.

j

n.

1

n.

2

n.

3

n.

n

n.

p

n

B) DISTRIB.MARGINALES Y CONDICIONADAS:

MARGINAL 1ª(X)

MARGINAL 2ª(Y)

COND.Y

x

m

COND.X

y

n

X

n

i

. f

i

. Y n.

j

f.

j

Y

x

m

n

j/m

X

y

n

n

i/n

x

1

n

1

. f

1

. y

1

n.

1

f.

1

y

1

n

m1

x

1

n

1n

x

2

n

2

. f

2

. y

2

n.

2

f.

1

y

2

n

m2

x

2

n

2n

... ... ... ... ... ... ... ... ... ...

x

m

n

m

. f

m

. ... ... ... ... ... x

m

n

mn

... ... ... y

n

n.

n

f.

n

y

n

n

mn

... ...

x

k

n

k

. f

k

. ... ... ... ... ... x

k

n

kn

y

p

n.

p

f.

p

y

p

n

mp

Σ

N

1

n

1

n

m

.

n.

n

(7)

Frecuecians Relativas: fi. = ni./N f.j = n.j/N fj/m = nm j/nm. ; fi/n = ni n/n.n Medias Marginales:

x

= (1/N) Σ xi ni. = Σ xi fi. ;

y

= (1/N) Σ yj n.j = Σ yj f.j Medias Condicionadas: p

x

= (1/n.

n

)

Σ

x

i

n

in

=

Σ

x

i

f

i/n

;

y

m

= (1/n

m

.)

Σ

y

j

n

mj

=

Σ

y

j

f

j/m

Relaciones entre distrib. Marginales y condicionadas:

nij nij ni. - fij = --- = --- --- = fj/i fi. N ni. N nij nij n.j - fij = --- = --- --- = fi/j f.j N n.j N -

x

= (1/N) Σ xi ni. = Σ xi fi. = Σ xi Σ fij = Σ xi Σ fi/j f.j = Σ(Σxi fi/j )f.j = Σ xj f.j -

y

= (1/N) Σ yj n.j = Σ yj f.j = Σ yj Σ fij = Σ yj Σ fj/i fi.= Σ(Σyj fj/i ) fi.= Σ yi fi. 3.4. Independencia estadística:

Dos variables X e Y son estadísticamente independientes cuando el condicionamiento no tiene ningún efecto diferenciador.

(Piénsese que si las características en estudio son, por ejemplo, el peso(x) y el número de miembros de la unidad familiar (y), en principio y al menos intuitivamente, la variable peso se comportara independientemente del condicionamiento que podamos hacer en cuanto al número de miembros de la unidad familiar).

En términos de frecuencias relativas, la independencia estadística se traducirá (condición de independencia) en que:

fj/i = f.j Y fi/j = fi. ∀i, j Y dado que fij = fj/i fi. = fi/j f.j

En caso de independencia estadística, tendremos que: fij = fi. f.j ∀i, j

O en términos de frecuencias absolutas:

nij ni. n.j ni. n.j

- --- = --- --- ⇔ nij = --- ∀i, j N N N N

Estas dos últimas expresiones son las que se suelen tomar como caracterización de la independencia.

Veamos que: si dos variables x e y son estadísticamente independientes entonces su covarianza es cero m11 = 0(el reciproco no tiene por que ser cierto):

(8)

Recordemos que m11 = a11 - a10 a01

Vamos a demostrar que si hay independencia a11 = a10 a01 a 11 = (1/n) ΣΣ xi yj nij = ΣΣ xi yj nij = ΣΣ xi yj ni. n.j

N N N = Σ xi ni. Σyj n.j = a10 a01

N N Por tanto:

Independencia ⇒ Covarianza cero Covarianza cero ⇒ Independencia

Bibliografía básica

* Mª Angeles palacios, Fernando A. López Hernández , José García Córdoba y Manuel Ruiz Marín. “INTRODUCCIÓN A LA ESTADÍSTICA PARA LA EMPRESA”. Librería Escarabajal

* Martín-Pliego López, Fco. “Introducción a la estadística económica y empresarial”. Ed. Thomson

* Casas, J. M., Callealta, J., Núñez, J., Toledo, M. y Ureña, C. (1986). Curso Básico de Estadística Descriptiva. I.N.A.P.

* Hermoso Gutiérrez, J. A. y Hernández Bastida, A. (1997). Curso Básico de Estadística Descriptiva y Probabilidad. Ed. Némesis.

Para saber más o aclarar dudas:

http://www3.uji.es/~mateu/t2-ig12.doc http://descartes.cnice.mecd.es/Estadistica/distrib_bidimensionales/distribuciones_bidimens ionales.htm http://www.eumed.net/cursecon/libreria/drm/cap3.pdf http://personal.redestb.es/ztt/tem/t15_distribuciones_bidimensionales.htm http://www.aulafacil.com/CursoEstadistica/Lecc-10-est.htm http://www.ugr.es/~jsalinas/activi/C4.pdf

Referencias

Documento similar

(1886-1887) encajarían bien en una antología de textos históricos. Sólo que para él la literatura es la que debe influir en la historia y no a la inversa, pues la verdad litera- ria

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y

En este sentido, puede defenderse que, si la Administración está habilitada normativamente para actuar en una determinada materia mediante actuaciones formales, ejerciendo

En la parte central de la línea, entre los planes de gobierno o dirección política, en el extremo izquierdo, y los planes reguladores del uso del suelo (urbanísticos y

 Para recibir todos los números de referencia en un solo correo electrónico, es necesario que las solicitudes estén cumplimentadas y sean todos los datos válidos, incluido el