Módulo I Clases 28-08, 31-08

Texto completo

(1)

1

Probabilidad y

Estadística

(2)

Definición y caracterización

Para resolver diferentes problemas es conveniente traducir los resultados posibles de un

experimento aleatorio en números; es decir, definir una función que asigne un único número real a

cada elemento del espacio muestral.

La función que a cada suceso o evento del espacio muestral le asigna un número real que lo

representa es una

variable aleatoria.

Si se arrojan dos monedas y se observa el número de caras:

S = {cc,cs, sc, ss}

La

observación de interés

es

nuestra variable

, la identificamos con letras mayúsculas de

imprenta,

X

: Número de caras obtenidas en el lanzamiento.

(3)

3

Un experimento aleatorio puede generar un espacio muestral discreto o continuo:

Espacio muestral discreto la variable es discreta

Espacio muestral continuo la variable es continua

Variable aleatoria discreta: una cantidad finita ó numerable de valores posibles.

Variable aleatoria continua: conjunto de valores posibles es un intervalo a valores reales (podría definirse con extremos infinitos).

¿Cómo asignamos probabilidades a las variables aleatorias que pueden definirse a partir de un experimento aleatorio?

(4)

4

Una distribución de probabilidad representa un modelo teórico que describe la forma en que varían los resultados de un experimento aleatorio. Y se construye a partir de una función que asigna un valor de probabilidad a cada resultado posible.

Si la variable es discreta, la función que asigna probabilidades para cada valor de variables se denomina

función masa; si la variable es continua la denominamos función densidad.

Si X=número de caras en el lanzamiento de dos monedas, ésta variable es discreta y la probabilidad de cada elemento es:

P(X = 0) = P(SS) = ¼; P(X = 1) = P(SC o CS) = ½; P(X = 2) = P(CC) = ¼

(5)

5

Función masa p(X) y densidad de probabilidad f(X)

Para cualquier distribución de probabilidad de una variable aleatoria discreta X, la función masa P(X) debe cumplir:

(6)

6

Función distribución o acumulada de probabilidad F(X)

Se denomina función

distribución de probabilidades a la función acumulada de la función

masa o de la función densidad

.

(7)

Utilizando tanto f(x) como F(x) es posible calcular probabilidades:

7

V A Discreta

V. A Continua

(8)

8

1-

En el caso de v.a. continuas no necesitamos ser cuidadosos en la

especificación de incluir o no los extremos de los intervalos para el cálculo de

probabilidades.

2-

Si

X

es una v.a. continua,

P

(

X

=

x

) = 0

3-

La función masa o densidad de probabilidad contienen la misma información

que su correspondiente función de distribución, según sea el caso se puede

(9)

9

Supongamos una v.a. discreta, que varía entre cero y cuatro y la función de masa es proporcional al

valor de la variable:

(10)

10

(11)

11

(12)

12

La producción de un día de 850 piezas manufacturadas contiene 50 piezas que no cumplen con los requerimientos del cliente. Se seleccionan del lote dos piezas al azar y sin reemplazo. Sea la variable aleatoria X igual al número de piezas de la muestra que no cumplen. ¿Cuál es la función de

(13)

13

(14)

14

EJEMPLO: Se desea estudiar el nivel de colesterol en cierto tipo de pollos.

(15)
(16)
(17)

17

Si Y es una Variable aleatoria función de X; por ejemplo Y =2X+1 ó Y=X2

¿ Cómo puedo calcular F(Y) si solo conozco que f(X)= x si x >1 y 0 en otro caso ?

Generalizando si

𝐹 𝑦 = 𝑃 𝑌 < 𝑦 = 𝑃 𝐺 𝑋 < 𝑦 = 𝑃 𝑋 < 𝐺−1 𝑦 = න

1

𝐺−1 𝑦

𝑓 𝑥 𝑑𝑥

Y =G(X)

𝑌 = 2𝑋 + 1

𝐹 𝑦 = 𝑃 𝑌 < 𝑦 = 𝑃 2𝑋 + 1 < 𝑦 = 𝑃 𝑋 < (𝑦 − Τ1 2ሻ = න

1

𝑦− Τ1 2

𝑓 𝑥 𝑑𝑥

Aplicando el concepto de calculo de función distribución se puede obtener F(y)

(18)

18

Para caracterizar una variable aleatoria discreta o continua es necesario conocer su función de distribución de probabilidades, y esta puede caracterizarse según los parámetros que las definen. Ahora, buscaremos para cada una de ellas medidas relativas a la posición y dispersión:

Esperanza de una variable aleatoria

La esperanza es una medida de tendencia central. Es un promedio ponderado de los valores que la variable puede tomar, en el que los pesos son las respectivas probabilidades o valores de densidad.

La esperanza E(X) no es un resultado que esperamos ocurra si X se observa sólo una vez.

Pero si observáramos un gran número de repeticiones independientes de X, el promedio de esos resultados estaría cerca de E(X).

(19)
(20)

20

(21)
(22)
(23)

23

Otras medidas de posición que nos pueden interesar son la mediana y la moda

Media esperada es E(x)

Moda el valor más frecuente, máxima función densidad ¿Cómo la encontramos?

La Mediana

(24)

24

Varianza de una variable aleatoria

La variancia constituye una medida de dispersión de los valores de X alrededor de la esperanza matemática de X, y se define de manera general como:

Siendo

(25)

25

(26)
(27)

27

Ahora a practicar!!!!

En el MODULO I practico 2

(28)

VARIABLE ALEATORIA CONJUNTA

28

Describir un fenómeno puede requerir dos o más variables aleatorias

Distribución conjunta

La probabilidad de ocurrencia de un evento así

caracterizado requiere definir una función de

probabilidad de la variable aleatoria conjunta con

dominio en R

n

y con imagen en R.

(29)

29

La

función de probabilidad conjunta

de una variable aleatoria conjunta corresponde a la

probabilidad de que cada una de sus dimensiones sean menores o iguales a valores específicos

de sus componentes, esto es:

Esta función, también llamada de distribución o distribución acumulativa conjunta, es no

decreciente y toma valores en el intervalo cerrado [0,1].

Para

variables aleatorias conjuntas discretas

(las que se pueden contar o enumerar en cada

una de las

dimensiones), la probabilidad también puede definirse con la

función de masa conjunta,

que

expresa la probabilidad de que ambas dimensiones tomen valores específicos de

X

y de

Y

, esto

es:

(30)

30

La

función de probabilidad conjunta

de una variable aleatoria conjunta corresponde a la

probabilidad de que cada una de sus dimensiones sean menores o iguales a valores específicos

de sus componentes, esto es:

Esta función, también llamada de distribución o distribución acumulativa conjunta, es no decreciente y toma valores en el intervalo cerrado [0,1].

Mantiene las propiedades de

la función distribución para

(31)

31

Veamos un ejemplo

Consideremos el

experimento que consiste en arrojar dos dados

, el espacio muestral para este experimento tiene 36 elementos igualmente probables.

El punto muestral (3; 3) denota el resultado para el cual ambos dados muestran un 3;

El punto muestral (4; 1) denota el resultado para el cual el primer dado mostro un cuatro y el segundo dado un 1.

Los 36 puntos del muestral asociamos dos números, X e Y.

Definimos las variables

X = Suma de los dos dados Y el valor absoluto de la diferencia de los dados.

Para el punto muestral (3; 3), las variables X e Y toman los valores X = 3+ 3=6 e Y = 0, Para (4; 1), X = 5 e Y = 3.

(32)

32

suma de los dos dados

valor absoluto de la diferencia de los dados

Distribución Marginal de X

Distribución Marginal de Y

(33)

33

Para cada dimensión de la variable aleatoria conjunta se definen funciones marginales de masa o de probabilidad, reciben este nombre justamente por ser las que se obtienen de los márgenes de la tabla de distribución conjunta, tenemos una distribución marginal para X (PX) y otra para Y (Py):

También definimos la función distribución de una variable condicionada a que la otra toma ciertos valores, a esa distribución la llamamos distribución condicional y se calcula a partir de la definición de probabilidad condicional entre eventos es decir se define como la probabilidad conjunta sobre la

probabilidad marginal correspondiente a la condición,

Observar la diferencia entre distribución condicional y

(34)

34

Volviendo al ejemplo donde X es Suma de los dos dados e Y el valor absoluto de la diferencia de los dados:

• Es una distribución de probabilidad que suma 1.

• Si fijamos X=4, la probabilidad de P(X=2/Y=2)=0.25

(35)

35

¿Cuándo dos variables aleatorias son independientes?

Haciendo la analogía con eventos, dos variables aleatorias serían equivalentes si la probabilidad de

ocurrencia de X condicionada a la ocurrencia de Y coincide con la probabilidad de que X tome cada valor, es decir:

Si X e Y son independientes

¿¿¿¿En nuestro ejemplo X e Y son independientes???

(36)

36

Relación lineal entre dos variables aleatorias

Dadas dos o más variables aleatorias discretas o continuas es natural preguntarse si existe o no alguna relación entre ellas, una opción para dar respuesta a esta pregunta consiste en calcular la covarianza entre ellas. La covarianza es una medida de la variación conjunta que hay entre las variables analizadas dos a dos.

Esta medida no debe ser utilizada de modo exclusivo para medir la relación entre las dos variables, ya que es sensible al cambio de unidad de medida, además de que la información que proporciona es sobre

relación lineal y no de otro tipo entre las variables en cuestión. Se define como:

donde 𝐸 𝑋𝑌 = ෍ 𝑥𝑦𝑃 𝑥, 𝑦 ∀ 𝑥 𝑒 𝑦

Si la covarianza es positiva, indica que las dos variables crecen o decrecen a la vez.

Si la covarianza es negativa, indica que cuando una variable crece, la otra tiene tendencia a decrecer

(37)

37

Si X e Y son independientes, la E(XY)= E(X) E(Y) luego por definición Cov(X,Y)=0

Si X e Y son independientes la Cov(X,Y)=0

Es un si y

sólo si???

NO!!!!!

La cov(X,Y)=0 NO IMPLICA QUE SEAN INDEPENDIENTES, sólo indica que no hay asociación

(38)

38

Debido a que la covarianza no está acotada, definimos a partir de ella un coeficiente

para cuantificar la relación lineal entre las variables,

el coeficiente de correlación

.

Desvío estándar de cada variable

(recordamos raíz de la varianza)

El coeficiente puede analizarse a partir de un gráfico de dispersión. Si se toman dos variables y se representan en el plano cartesiano los pares. Si los puntos forman una nube más o menos amorfa,

podemos suponer que ambas variables no se interrelacionan, o lo que es lo mismo, el conocimiento de una no aporta información sobre la otra.

(39)

39

Este coeficiente toma siempre valores comprendidos entre -1 y 1

Si =1, existe dependencia funcional lineal directa, los puntos del diagrama de dispersión están situados en una línea recta creciente.

Si 0< <1, la correlación es positiva y será más fuerte según se aproxime más a 1, donde las dos variables se comportan en igual sentido

Si =0, no existe correlación lineal, pero puede existir alguna dependencia funcional entre ellas.

Si -1< <0, la correlación es negativa y será más fuerte según se aproxime más a -1, donde la relación entre las variables es inversa si una crece la otra decrece.

(40)

40

=0.92

=0.09

(41)

41

A resolver problemas!!!!

Pueden terminar el practico!!!!

Ejercicios para pensar y resolver del practico 2: desde el 12 al 25

Recuerden que el 2 de septiembre y el 7 de septiembre no hay clase general, repasamos y practicamos en los encuentros grupales

HEMOS FINALIZADO LA UNIDAD I, QUE SERÁ

EVALUADA EL 9 DE SEPTIEMBRE.

MUY IMPORTANTE!!!! EN CADA PROBLEMA QUE

RESUELVEN DEBEN SER ORDENADOS DEFINIENDO

LA VARIABLE DESCRIBIENDO E INTERPRETANDO

Figure

Actualización...

Referencias

Actualización...

Related subjects :