• No se han encontrado resultados

Introducción Teoría de la probabilidad

N/A
N/A
Protected

Academic year: 2021

Share "Introducción Teoría de la probabilidad"

Copied!
107
0
0

Texto completo

(1)

Grado en Ingeniería Grado en Ingeniería Grado en Ingeniería Grado en Ingeniería Asignatura: Estadística Asignatura: Estadística Tema: 2.

Tema: 2. Probabilidad e inferencia Probabilidad e inferencia estadísticaestadística Asignatura: Estadística

Asignatura: Estadística Tema: 2.

(2)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(3)

Inferencia estadística Inferencia estadística Inferencia estadística Inferencia estadística Población Muestra

Inferencia estadística: Proceso Inferencia estadística: Proceso mediante el cual se utiliza la información de la muestra para extraer conclusiones de la

(4)

Ejemplo 1: ¿proporción poblacional? Ejemplo 1: ¿proporción poblacional? Ejemplo 1: ¿proporción poblacional? Ejemplo 1: ¿proporción poblacional?

Supongamos que somos fabricantes de juguetes para niños. Para la fabricación de nuestra última novedad, dependemos de un proveedor que nos suministra los componentes electrónicos necesarios. La proporción de componentes La proporción de componentes La proporción de componentes La proporción de componentes defectuosos que consideramos admisible es 0.001.

defectuosos que consideramos admisible es 0.001. defectuosos que consideramos admisible es 0.001. defectuosos que consideramos admisible es 0.001.

Recibimos un lote de 50000 componentes, como no tenemos recursos para inspeccionarlos todos, se decide realizar una inspección de 500 componentes y en función de los resultados de esta inspección decidiremos aceptar o rechazar todo el lote.

Frequency Table for Circuitos_Defec

Recibimos el lote Inspeccionamos una muestra información de la muestra En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con En la muestra observamos que la proporción de defectuosos es de 0.002. ¿con

Relative Cumulative Cum. Rel.

Class Value Frequency Frequency Frequency Frequency

1 0 499 0.9980 499 0.9980

2 1 1 0.0020 500 1.0000

(5)

---Ejemplo 2: ¿media y varianza poblacional? Ejemplo 2: ¿media y varianza poblacional? Ejemplo 2: ¿media y varianza poblacional? Ejemplo 2: ¿media y varianza poblacional?

Supongamos que somos fabricantes de láminas de carbono. Una característica importante que debemos controlar es la resistencia a la rotura. El responsable de la planta ha establecido un valor objetivo, en función de lo que demanda el mercado: la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser : la resistencia media de todas las láminas que se fabriquen debe ser igual o superior a 2800 N/mm

igual o superior a 2800 N/mm igual o superior a 2800 N/mm

igual o superior a 2800 N/mm2222 y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2.y la desviación típica no superior a 20 N/mm2. Para verificar si se cumple este criterio, y dado que no se pueden inspeccionar todas las láminas porque la prueba para determinar su resistencia supone la destrucción de la misma, se decide realizar la prueba a 80 laminas.

En la muestra observamos que la resistencia media es de 2788.52 N/mm2, con una desviación de. 21.28 N/mm2 ¿con la información que nos suministra la ¿con la información que nos suministra la ¿con la información que nos suministra la ¿con la información que nos suministra la muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio muestra podemos decir que el proceso de fabricación no cumple con el criterio Summary Statistics for Resistencia

Count = 80

Average = 2788.52 Median = 2788.78

Standard deviation = 21.2788

Histogram for Resistencia

Resistencia fr eq ue n cy 2700 2730 2760 2790 2820 2850 0 10 20 30 40

(6)

Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones Ejemplo 3: Comparación de poblaciones

Somos responsables de elegir donde se situará un nuevo parque eólico. Tenemos dos posibles localizaciones, dentro del mismo municipio. Para tomar nuestra decisión, recurrimos a la estadística. Se observa la velocidad del viento durante 730 horas de forma

simultánea en dos localizaciones alternativas (variables Parque1 y Parque2). Se quiere utilizar estos datos para decidir en qué

localización instalar un parque de producción de energía eólica. localización instalar un parque de producción de energía eólica.

Summary Statistics Veloc_Parque1 Veloc_Parque2 ---Count 730 730 Average 5.80179 5.63285 Median 5.31 5.045 Standard deviation 3.24126 3.25496 Minimum 0.27 0.14 Maximum 16.28 17.82 Lower quartile 3.26 3.24 Upper quartile 7.96 7.44 Skewness 0.649086 0.952801 Box-and-Whisker Plot 0 3 6 9 12 15 18 Veloc_Parque1 Veloc_Parque2

(7)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(8)

La probabilidad es el arma que vamos a utilizar para poder generalizar nuestras

conclusiones a toda la población de referencia Teoría de la probabilidad Teoría de la probabilidad Teoría de la probabilidad Teoría de la probabilidad referencia

(9)

Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción

Experimento Experimento Experimento

Experimento: Proceso de observar una característica. Experimento aleatorio:

Experimento aleatorio: Experimento aleatorio:

Experimento aleatorio: Experimento cuyo resultado es inciertoinciertoinciertoincierto Ejemplos:

Ejemplos: Ejemplos: Ejemplos:

Lanzar una moneda 3 veces y observar el numero de caras Medir el peso de un estudiante

Medir la corriente en un cable de cobre

Medir la temperatura de un fluido en un tanque (proceso industrial) Medir la temperatura de un fluido en un tanque (proceso industrial) Medir el caudal de un fluido que circula por una tubería

El numero mensual de reclamaciones de una compañía El tiempo de atención al cliente de una sucursal bancaria

(10)

Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción

Ejemplo: Nº de “seis” en el lanzamiento de tres dados

Si repetimos el experimento en distintos momentos obtenemos distintos resultados, además el resultado es inciertoresultado es inciertoresultado es inciertoresultado es incierto

¿Por qué? ¿Por qué? ¿Por qué? ¿Por qué? Movimiento de la mano Factores ambientales …. Factores FactoresFactores Factores no controlados no controlados no controlados no controlados ….

(11)

Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción Teoría de la probabilidad. Introducción

Todos tenemos la idea intuitiva de lo que es la probabilidad. Decimos de forma habitual cosas como:

La probabilidad de que salga un seis al lanzar un dado es 1 entre 6

Si realizo una apuesta simple la

probabilidad de que me toque la primitiva es muy pequeña (1 entre 14 millones)1 entre 14 millones)1 entre 14 millones)1 entre 14 millones)

muy pequeña (1 entre 14 millones)1 entre 14 millones)1 entre 14 millones)1 entre 14 millones)

1

P(A)

0

La probabilidad se define sobre un

suceso y trata de cuantificar su

(12)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(13)

Fenómenos y experimentos aleatorios

Fenómenos y experimentos aleatorios

Fenómenos y experimentos aleatorios

Fenómenos y experimentos aleatorios

Un experimento es determinista cuando existe un conjunto de circunstancias que, antes de su ejecución, determinan

completamente su resultado.

Un experimento es aleatorio si no podemos predecir su resultado de antemano:

antemano:

Se conocen previamente y con exactitud los posibles resultados del experimento.

Es imposible saber su resultado antes de su realización.

Se puede repetir indefinidamente, en las mismas condiciones iniciales, obteniendo resultados distintos.

(14)

Sucesos Sucesos Sucesos Sucesos

El

espacio muestral

es el conjunto de todos los

posibles resultados del experimento aleatorio, lo

denotamos por

E

.

Ejemplo: Experimento, lanzar dado, E={1,2,3,4,5,6}

Un

suceso

es cualquier subconjunto del espacio

muestral.

muestral.

Un suceso elemental un elemento del espacio muestral.

Ejemplo: (lanzar dado), sale un seis, A={6}

Un suceso compuesto es un conjunto de sucesos elmentales.

(15)

Sucesos Sucesos Sucesos Sucesos

El suceso seguro es el que siempre ocurre al realizar el experimento, E.

Ejemplo: (lanzar dado) E={1,2,3,4,5,6}

El suceso imposible es el que nunca ocurre como resultado del experimento ∅.

(16)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Operación unión. Dados dos sucesos A y B, el suceso A

B

(alternativamente A

+

B) ocurre cuando ocurre A u ocurre B u ocurren ambos simultáneamente.

A={1,2} ; B={2,3,4}

(17)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Operación intersección. Dados dos sucesos A y B, el suceso A

B

(alt. A

B) ocurre cuando ocurren simultáneamente A y B.

A={1,2} ; B={2,3,4}

A={1,2} ; B={2,3,4}

(18)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Operaciones con sucesos (conjuntos)

Suceso contrario (o complementario). Dado un suceso A, su contrario Ac (alt. A ) ocurre cuando A no ocurre.

E={1,2,3,4,5,6} ; A={1,2}

(19)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(20)

Definición de probabilidad Definición de probabilidad Definición de probabilidad Definición de probabilidad

Una probabilidad es una función P que asigna a cada suceso asociado al experimento un valor real tal que

1. 0 ≤ P(A) ≤ 1 ;

2. P(E ) = 1 ;

3. Si A y B son mutuamente excluyentes (es decir A ∩ B = ∅) 3. Si A y B son mutuamente excluyentes (es decir A ∩ B = ∅)

P(Α ∪ Β)= P(A)+P(B).

De las tres propiedades anteriores, deducimos que cualquier probabilidad satisface:

1. Para cualesquiera A y B, P(A ∪ B) = P(A)+P(B)−P(A ∩ B )

(21)

Consideración final Consideración final Consideración final Consideración final

Leyes de los Grandes Números

.

Si repetimos muchas

veces un experimento, la

frecuencia relativa de un

0.6 0 .8 fr e c u e n c ia r e la ti v a c a ra

frecuencia relativa de un

suceso

A

cualquiera

tiende a estabilizarse en

torno a un valor

(PROBABILIDAD DEL

SUCESO).

0 200 400 600 800 1000 0 .0 0 .2 0 .4 numero lanzamientos fr e c u e n c ia r e la ti v a c a ra

(22)

Descripción breve del tema Descripción breve del tema Descripción breve del tema Descripción breve del tema

1. Introducción

2. Fenómenos y experimentos aleatorios

Sucesos y operaciones con sucesos (conjuntos)

3. Concepto de probabilidad y propiedades

Definición de probabilidad

Primeras propiedades de la probabilidad y alguna consideración

4. Asignación de probabilidades en la prácticaconsideración 4. Asignación de probabilidades en la práctica

Equiprobabilidad, regla de Laplace

5. Probabilidad condicionada

Concepto de probabilidad condicionada Independencia de sucesos

6. Teorema de Bayes

(23)

Equiprobabilidad, regla de Laplace Equiprobabilidad, regla de Laplace Equiprobabilidad, regla de Laplace Equiprobabilidad, regla de Laplace

Si un experimento tiene un número finito de resultados

posibles y no hay razón que privilegie un resultado frente a otro, para cualquier A

a

favorables

casos

de

número

A

=

posibles

casos

de

número

a

favorables

casos

de

número

)

(

A

A

P

=

(24)

La probabilidad condicionada La probabilidad condicionada La probabilidad condicionada La probabilidad condicionada

Dados dos sucesos A y B con P(B)>0, definimos la probabilidad de A condicionada a B como la probabilidad de que ocurra A sabiendo que ha ocurrido B, .

P(B)

B)

P(A

P(A|B)

=

Α Α∩Β Β

(25)

Independencia entre sucesos Independencia entre sucesos Independencia entre sucesos Independencia entre sucesos

Dos sucesos

A

y

B

son independientes si

P

(

A

|

B

)=

P

(

A

)

P

(

A

|

B

)=

P

(

A

)

Es decir que ocurra B es irrelevante para que

ocurra A

(26)

Teorema de la probabilidad total Teorema de la probabilidad total Teorema de la probabilidad total Teorema de la probabilidad total

Dados A1, A2,…,An mutuamente excluyentes con

A1 ∪ A2 ∪ … ∪ An =E, entonces la probabilidad de un suceso

B cualquiera viene dada por

B|A

P

A

P

B

P

n i i i

=

=

1

)

(

)

(

)

(

Α1 Α2 ... Β Α3 Αn

(27)

Teorema de la probabilidad total

Teorema de la probabilidad total -- EjemploEjemplo Teorema de la probabilidad total

Teorema de la probabilidad total -- EjemploEjemplo

Supongamos que el mismo artículo es fabricado por dos máquinas: A y B. La probabilidad de que el articulo sea defectuoso varía según la máquina de que provenga, así el 2.2% de los artículos producidos por A son

defectuosos, mientras que en el caso de B, el 1.4% de los artículos son defectuosos.

Sabiendo que el 36% de los artículos producidos en una fábrica provienen de la máquina A y el resto de B, calcula la probabilidad de que un artículo de dicha fábrica sea defectuoso.

B 01688 . 0 64 0 014 0 36 0 022 0 ) ( ) ( ) ( ) ( ) (D = P D|A P A + P D|B P B = . × . + . × . = P

de dicha fábrica sea defectuoso.

defectuoso B por producido A por producido ≡ ≡ ≡ D B A 014 . 0 ) | ( 022 . 0 ) | ( 64 . 0 ) ( 36 . 0 ) ( = = = = B D P A D P B P A P

(28)

Teorema de

Teorema de BayesBayes Teorema de

Teorema de BayesBayes

Dados A1, A2,…,An mutuamente excluyentes con

A1 ∪ A2 ∪ … ∪ An =E, y dado un suceso B cualquiera con

P(B)>0, entonces se cumple

B|A

P

A

P

B|A

P

A

P

B

P

B

A

P

|B

A

P

j j n j i i i i

)

(

)

(

)

(

)

(

)

(

)

(

)

(

1 =

=

=

(29)

Teorema de

Teorema de BayesBayes –– Ejemplo (continuación)Ejemplo (continuación) Teorema de

Teorema de BayesBayes –– Ejemplo (continuación)Ejemplo (continuación)

Un artículo procedente de la fábrica con las máquinas A y B es defectuoso. Calcula la probabilidad de que haya sido producido por la máquina A

) ( ) | ( ) ( ) | ( ) ( ) | ( ) ( ) ( ) | ( × + × × = ∩ = B P B D P A P A D P A P A D P D P D A P D A P 4692 . 0 64 0 014 0 36 0 022 0 36 0 022 0 ) ( ) | ( ) ( ) | ( ) ( = × + × × = × + × . . . . . . B P B D P A P A D P D P

(30)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(31)

Una variable aleatoria es una variable cuyo valor numérico está determinado por el resultado del experimento aleatorio

Variables aleatorias Variables aleatorias Variables aleatorias Variables aleatorias Ε S2 S1 a b X(s1)=a X(s2)=b X

(32)

Variables aleatorias Variables aleatorias Variables aleatorias Variables aleatorias

Lanzamos 2 veces una moneda.

Podemos definir la variable aleatoria

X = número de caras Ε CC XC CX XX 0 2 X(xx)=a X(cc)=2 T XC 1 X(cx)=1 X(xc)=1

(33)

Variables aleatorias. Ejemplos Variables aleatorias. Ejemplos Variables aleatorias. Ejemplos Variables aleatorias. Ejemplos

Nº de artículos defectuosos en un lote de materia prima Nº de clientes atendidos al día

Nº de BIT transmitidos correctamente Peso de las piezas fabricadas

Temperatura del fluido Resistencia del material Resistencia del material

Corriente que circula por un cable …

(34)

Variables aleatorias. Clasificación Variables aleatorias. Clasificación Variables aleatorias. Clasificación Variables aleatorias. Clasificación

Atendiendo al rango, las variables aleatorias se clasifican como:

Discretas Discretas Discretas

Discretas: El rango es finito o infinito numerable

Nº de artículos defectuosos en un lote de materia prima Nº de clientes atendidos al día

Nº de BIT transmitidos correctamente Continuas:

Continuas: Continuas:

Continuas: El rango es un intervalo de la recta real Peso de las piezas fabricadas

Temperatura del fluido Temperatura del fluido Resistencia del material

Corriente que circula por un cable

Para definir perfectamente una variable aleatoria se necesita conocer:

(35)

Variables aleatorias Discretas Variables aleatorias Discretas Variables aleatorias Discretas Variables aleatorias Discretas

Definimos la función de probabilidadfunción de probabilidadfunción de probabilidadfunción de probabilidad, p(x)=P(X=x). A cada valor de la variable le asocia su probabilidad.

E = Lanzar 2 veces una moneda X = Número de caras 0,5 0,6 C C X P 0 0,1 0,2 0,3 0,4 0,5 0 1 2 C C X X C X X C X PX 0 ¼=0.25 1 2/4=0.5 2 ¼=0.25

(36)

Variables aleatorias Discretas Variables aleatorias Discretas Variables aleatorias Discretas Variables aleatorias Discretas

Definimos la función de distribuciónfunción de distribuciónfunción de distribuciónfunción de distribución, F(x)=P(X x). A cada valor le asocia la

probabilidad de que la variable sea menor o igual a él.

Medidas características Medidas característicasMedidas características Medidas características Media: µ = E[X ] =

xi p(xi) Media: Varianza:

= = E[X ] xi p(xi) µ 2 2 2 2 ] [ ] [ ] ) [(X E X E X E − = − = µ σ

= ( ) ] [ donde E X 2 xi2 p xi

(37)

Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas

Desafortunadamente, el método para describir la distribución de las v.a. discretas es inadecuado para describir una v.a. continuas, no se puede asociar a cada valor de la v.a. su probabilidad.

Buscamos una función que nos permita calcular probabilidades Candidatos a funciones de densidad,… muchos:

0,4 x d en si ty -5 -3 -1 1 3 5 0 0,1 0,2 0,3

(38)

Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas

La función de densidad función de densidad función de densidad función de densidad describe la distribución de probabilidad de una variable continua

= ≥ ∞ ∞ − b x x f x f 1 d ) ( 0 ) ( ∫ = < < b a dx x f b X a P( ) ( )

= < < b a x x f b X a P( ) ( )d d en si ty -5 -3 -1 1 3 5 0 0,1 0,2 0,3 0,4 a a b

(39)

Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas

Ejemplo: Ejemplo: Ejemplo:

Ejemplo: Sea X el tiempo de funcionamiento de una maquina en un año (en horas x100)    < < 2.5 0 si 5 . 2 4 . 0 x x        − ≤ < = caso otro en 0 5 5 . 2 si 5 . 2 4 . 0 8 . 0 5 . 2 ) (x x x f

(40)

Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas

Definimos la función de distribuciónfunción de distribuciónfunción de distribuciónfunción de distribución, F(x)=P(X x). A cada valor le asocia la

probabilidad de que la variable sea menor o igual a él.

Medidas características Medidas característicasMedidas características Medidas características Media: E[X ]

xf (x)dx +∞ = = µ Media: Varianza: x x xf X E[ ] ( )d

-∫

∞ = = µ 2 2 2 2 ] [ ] [ ] ) [(X E X E X E − = − = µ σ x x f x X E[ ] ( )d donde -2 2

+∞ ∞ =

(41)

Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas

Observando conjuntos de datos observamos un patrón, un modelo que se repite con mucha frecuencia.

Histogram for altura

150 160 170 180 190 200 0 10 20 30 40 fr e q u e n c y

Histogram for Matematicas

Matematicas fr e q u e n c y 5.8 6.3 6.8 7.3 7.8 8.3 8.8 0 5 10 15 20 25 30 150 160 170 180 190 200 altura Matematicas

Altura alumnos Nota matemáticas

Histogram for PESO

fr e q u e n c y 98 99 100 101 102 0 10 20 30 40

Histogram for Resistencia

Resistencia fr e q u e n c y 2700 2730 2760 2790 2820 2850 0 10 20 30 40

(42)

Modelos de distribución de probabilidad Modelos de distribución de probabilidad Modelos de distribución de probabilidad Modelos de distribución de probabilidad

Cuando se estudian las variable aleatorias:

Definir en cada problema los valores y las probabilidades pueden ser muy complejo.

Ejemplo: Niños y niñas en familias de cuatro hijos Ejemplo: Altura de individuos

Lo simplificamos mediante distribuciones de probabilidad “conocidas”:

“conocidas”:

– Variables discretas: Distribución Binomial,…., – Variables continuas: Distribución Normal

Mean 10 7 25 5 20 Exponential Distribution d en si ty 0,08 0,12 0,16 0,2 Mean,Std. dev. 0,1 0,1,5 0,2 1,1 1,2 Normal Distribution d en si ty 0,2 0,3 0,4 Event prob.,Trials 0,1,10 0,2,10 0,5,10 Binomial Distribution b ab il it y 0,2 0,3 0,4

(43)

Proceso de

Proceso de BernoulliBernoulli Proceso de

Proceso de BernoulliBernoulli

Consideremos un experimento en el que se van realizando pruebas con las siguientes características:

Cada prueba tiene dos posibles resultados

Aceptable-defectuoso, niño-niña,…

La probabilidad de éxito en cada prueba es constante Las pruebas son independientes.

Las pruebas son independientes.

(44)

Proceso de

Proceso de BernoulliBernoulli Proceso de

Proceso de BernoulliBernoulli

Ejemplos: Ejemplos: Ejemplos: Ejemplos:

Lanzamiento de una moneda: Posible resultado: Cara ó cruz

Probabilidades contantes: P(Cara)=0.5; P(Cruz)=0.5 Observaciones independiente

Producción de piezas:

Posible resultado: Defectuosa o Aceptable.

Probabilidades fijas. P(Defectuosa)=0.01 ; P (Aceptable)=0.99 Probabilidades fijas. P(Defectuosa)=0.01 ; P (Aceptable)=0.99

Observaciones independientes (el observar si una pieza es defectuosa o aceptable, no me dice nada de si otra pieza es defectuosa o no)

Sexo recién nacidos:

Posible resultado: Niño ó Niña.

Probabilidades fijas. P(Niño)=0.5 ; P (Niña)=0.5

Observaciones independientes (El saber el sexo del último recién nacido en un hospital, no da información del sexo del próximo)

(45)

Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

En un proceso de Bernoulli

Tomamos una muestra de tamaño n, y contamos el numero de éxitos (por ejemplo, numero de defectuosos en 50 piezas)

La distribución Binomial nos da la probabilidad de obtener un numero de éxitos (por ejemplo, nos da la probabilidad de obtener 4 defectos en 50 piezas

X~B(n,p)

Función de probabilidad Medidas características

X~B(n,p) k n k

p

p

k

n

k

X

P





=

=

)

(

1

)

(

2 (1 ) p np np − = = σ µ

(46)

Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

Distribución binomial Distribución binomial Distribución binomial

(47)

Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

Ejemplo 1: Un aparato electrónico contiene 40 circuitos integrados. La probabilidad de que un circuito sea defectuoso es 0.01 y los circuitos son independientes. El aparato funciona solo si no hay ningún circuito

defectuoso. ¿Cuál es la probabilidad de que el aparato funcione? Sea X= Número de circuitos defectuosos en los 40 de un aparato La probabilidad solicitada es P(X=0)

¿Qué distribución sigue X? ¿Qué distribución sigue X?

Se observan 40 pruebas de Bernoulli:

Cada prueba, observar un circuito, tiene dos posibles resultados; funciona, no funciona La probabilidad de que un circuito funcione es constante, 0.01

Los circuitos son independientes

El número de defectuosos en 40 pruebas es una Binomial (40, 0.01)

X∼B(40,0.01) 40 − ×   = =

(48)

Ejemplo 1: Un aparato electrónico contiene 40 circuitos integrados. La probabilidad de que un circuito sea defectuoso es 0.01 y los

circuitos son independientes. El aparato funciona solo si no hay ningún circuito defectuoso. ¿Cuál es la probabilidad de que el aparato funcione?

Cumulative Distribution ---Distribution: Binomial

Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

Distribution: Binomial

Lower Tail Area (<)

Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5

0 0.0 Probability Mass (=)

Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5

0 0.668972 Upper Tail Area (>)

Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5

(49)

Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

Ejemplo 2: Supongamos que recibimos un lote con muchas piezas y no tenemos recursos para inspeccionarlas todas. Para decidir si aceptamos el lote o lo rechazamos seleccionamos una muestra de 20 unidades y en función de las piezas defectuosas en la muestra rechazamos o aceptamos todo el lote.

La regla de decisión es: aceptamos el lote si en la muestra hay como máximo 2 unidades defectuosas.

como máximo 2 unidades defectuosas.

Si la proporción de defectos en el lote fuera 0.05, ¿Cuál sería la probabilidad de calcular la probabilidad de rechazar el lote?

Si la proporción de defectos en el lote fuera 0.2, ¿Cuál sería la probabilidad de calcular la probabilidad de rechazar el lote?

(50)

Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial Proceso de

Proceso de BernoulliBernoulli. Distribución . Distribución BinomialBinomial

Cumulative Distribution

---Distribution: Binomial

Lower Tail Area (<)

Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5

2 0.73584 0.0691753 Acepto el lote si en la muestra hay 0, 1 ó 2

defectuosos = rechazo el lote si en la

Ejemplo 2:

Probability Mass (=)

Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5

2 0.188677 0.13691

Upper Tail Area (>)

Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5

2 0.0754835 0.793915

defectuosos = rechazo el lote si en la muestra hay más de 2 defectuosos Si p(D)=0.05 , P(rechazar el lote)= 0.0754 Si p(D)=0.2 , P(rechazar el lote)= 0.7939

(51)

Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas Variables aleatorias continuas

Ejemplo: Ejemplo: Ejemplo:

Ejemplo: Sea X el tiempo de funcionamiento de una maquina en un año (en horas x100) 4 . 0 4 . 0 ) ( ) 2 . 3 ( 2 . 3 5 . 2 2 . 3 = − + = = <

∞ − dx x f X P 74 . 0 ) 5 . 2 4 . 0 8 . 0 ( 5 . 2 4 . 0 5 . 2 0 = − +

xdx x dx

(52)

Distribución normal o gaussiana Distribución normal o gaussiana Distribución normal o gaussiana Distribución normal o gaussiana

La distribución normal es sin duda la distribución de probabilidad mas importante:

Aproxima lo observado en muchos procesos de medición: medidas físicas del cuerpo humano, características psíquicas, medidas de calidad de procesos industriales

En muchas situaciones otras distribuciones se pueden aproximar a una Norma Es la base de la inferencia estadística. Aunque una variable aleatoria no sea normal, la media de la muestras sigue una distribución normal

Su importancia es una consecuencia del teorema central del límite: cuando Su importancia es una consecuencia del teorema central del límite: cuando los resultados de un experimentos son debidos a un conjunto muy grande de causas independientes, que actúan sumando sus efectos, siendo cada efecto de poca importancia respecto al conjunto, es esperable que los resultados sigan una distribución normal

Mean,Std. dev. 0,1 Normal Distribution 0,2 0,3 0,4 si ty

(53)

Distribución normal Distribución normal Distribución normal Distribución normal

Su función de densidad es:

2 2 2 ) (

2

1

)

(

σ µ

π

σ

− −

=

x

e

x

f

2

)

(

)

(

σ

µ

=

=

X

Var

X

E

Media 10 0,4 Sta. dev. Normal Distribution 0,8 10 11 9 0 3 6 9 12 15 18 0 0,1 0,2 0,3 Sta. dev. 1 0.5 2 d en si ty 5 9 13 17 0 0,2 0,4 0,6 0,8

(54)

Distribución normal Distribución normal Distribución normal Distribución normal Regla empírica 0,3 0,4 -5 -3 -1 1 3 5 0 0,1 0,2 µ+σ µ+2σ µ+3σ µ-σ µ-2σ µ-3σ 0.68 0.95 0.997

(55)

Distribución normal Distribución normal Distribución normal Distribución normal

El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas.

¿Cuál es la probabilidad de que el semiconductor falle antes de 6000 horas?

¿Qué tiempo de vida es excedido por el 95.05% de los semiconductores?

¿Cuál es la probabilidad de que el semiconductor falle entre las 6200 y las 7600 horas de vida?

(56)

Modelos de distribución de probabilidad Modelos de distribución de probabilidad Modelos de distribución de probabilidad Modelos de distribución de probabilidad

(57)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(58)

Inferencia estadística Inferencia estadística Inferencia estadística Inferencia estadística Población Muestra

Inferencia estadística: Proceso Inferencia estadística: Proceso mediante el cual se utiliza la información de la muestra para extraer conclusiones de la

(59)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(60)

Ajuste a modelo de probabilidad Ajuste a modelo de probabilidad Ajuste a modelo de probabilidad Ajuste a modelo de probabilidad

Consiste en identificar el modelo de probabilidad que sigue la variable de interés. ¿Qué modelo ha generado los datos observados?

Para ajustar un modelo de probabilidad para la variable:

1. Analizar el tipo de variable y la información que suministra la muestra.

2. Proponer un modelo adecuado de distribución de probabilidad para la variable de interés (Normal, Exponencial, Poisson,…..). para la variable de interés (Normal, Exponencial, Poisson,…..). 3. Estimar los parámetros desconocidos del modelo propuesto 4. Comprobar que el modelo propuesto es “adecuado”

El modelo ajustado te ayuda a tomar decisiones respecto a la población.

Histogram for Azucar

cy

80 100

(61)

Ajuste de modelo: Identificación de modelo. Ajuste de modelo: Identificación de modelo. Ajuste de modelo: Identificación de modelo. Ajuste de modelo: Identificación de modelo.

Se observa la aceleración en 155 coches (Seconds from 0 to 60 millas/hora).

Teniendo en cuenta el tipo de variable y la información que suministra la muestra,

(62)

Ajuste de modelo: Identificación de modelo. Ajuste de modelo: Identificación de modelo. Ajuste de modelo: Identificación de modelo. Ajuste de modelo: Identificación de modelo.

Se observa la aceleración en 155 coches.

La distribución normal (función de densidad, una campaña de Gauss) parece que se ajusta bien.

(63)

Ajuste a modelo: Estimación de parámetros Ajuste a modelo: Estimación de parámetros Ajuste a modelo: Estimación de parámetros Ajuste a modelo: Estimación de parámetros

A la vista del histograma parece razonable proponer la distribución normal

La distribución normal depende de dos parámetros, la media y la varianza poblacional, ambos desconocidos (recordar que solo hemos observado una muestra, no toda la población).

Para dar valores a los parámetros, estimarlos, utilizamos la información que suministra la muestra.

Count = 155 Average = 16.2761 Median = 15.8 Variance = 6.35131 Standard deviation = 2.52018 Minimum = 11.2

(64)

Ajuste de modelo: Estimación parámetros Ajuste de modelo: Estimación parámetros Ajuste de modelo: Estimación parámetros Ajuste de modelo: Estimación parámetros

muestra) varianza muestra, (Media ) , ( N N µ σ =

Histog ram fo r accel

30 40 50 fr eq ue nc y Estimación de parámetros 10 14 18 22 26 accel 0 10 20 30 fr eq ue nc y

)

52

.

2

;

27

.

16

(

N

Summary Statistics for accel Count = 155

Average = 16.2761 Median = 15.8 Variance = 6.35131

(65)

Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis

¿el modelo de probabilidad estimado es idóneo? ¿los datos

aportan evidencia suficiente en contra del modelo de probabilidad asumido?

Gráficamente. Si observamos el grafico parece que los datos observados confirman el modelo propuesto

Histog ram fo r accel 30 40 50 fr eq ue nc y

¿hay alguna forma de verificar que el modelo propuesto es adecuado? 10 14 18 22 26 accel 0 10 20 30 fr eq ue nc y

(66)

Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis Ajuste a modelo: Diagnosis

El test de Bondad de Ajuste de Chi-Cuadrado de Pearson compara la

frecuencia observada con la frecuencia esperada bajo el modelo propuesto, si existe mucha discrepancia entre lo observado y lo esperado entonces

rechazamos el modelo propuesto

Goodness-of-Fit Tests for accel

Chi-Square Test

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square at or below 12.4931 4 10.33 3.88 12.4931 13.4768 15 10.33 2.11 13.4768 14.1551 6 10.33 1.82 14.1551 14.7062 18 10.33 5.69 14.1551 14.7062 18 10.33 5.69 14.7062 15.1906 13 10.33 0.69 15.1906 15.6376 13 10.33 0.69 15.6376 16.0653 13 10.33 0.69 16.0653 16.487 10 10.33 0.01 16.487 16.9146 10 10.33 0.01 16.9146 17.3616 10 10.33 0.01 17.3616 17.846 5 10.33 2.75 17.846 18.3972 10 10.33 0.01 18.3972 19.0755 7 10.33 1.08 19.0755 20.0591 9 10.33 0.17 above 20.0591 12 10.33 0.27 ---Chi-Square = 19.8711 with 12 d.f. P-Value = 0.0695631

(67)

Ajuste de modelo: Cálculo de probabilidades Ajuste de modelo: Cálculo de probabilidades Ajuste de modelo: Cálculo de probabilidades Ajuste de modelo: Cálculo de probabilidades

)

52

.

2

;

27

.

16

(

n

Aceleració

N

Conocer el modelo de probabilidad nos permite responder a preguntas relacionadas con la población.

¿Cuál es la probabilidad de que la aceleración de un coche sea superior a 17 (Seconds from 0 to 60)?

Tail Areas for accel

area below 17.0 = 0.613034 area below 14.6485 = 0.259191 area below 16.2761 = 0.499993 area below 17.9037 = 0.740802 area below 19.5314 = 0.901767

(68)

Ajuste a modelo. Ejemplo 2: Proporción de defectos Ajuste a modelo. Ejemplo 2: Proporción de defectos Ajuste a modelo. Ejemplo 2: Proporción de defectos Ajuste a modelo. Ejemplo 2: Proporción de defectos

Los artículos fabricados los clasifico en defectuosos y no defectuosos.

Observo 5000 artículos.

Frequency Table for defecto

Relative Cumulative Cum. Rel. Class Value Frequency Frequency Frequency Frequency ---No defectuoso 4495 0.8990 4495 0.8990

Ejercicio:

Identifica modelo de probabilidad

Estima parámetro o parámetros desconocidos

Calcular la probabilidad de que en un lote de 50 piezas haya mas de 3 defectuosas.

No defectuoso 4495 0.8990 4495 0.8990 Defectuoso 505 0.1010 5000 1.0000

(69)

---Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(70)

Estimadores y su distribución Estimadores y su distribución Estimadores y su distribución Estimadores y su distribución

Definiciones del Tema 1 (Estadística Descriptiva) Definiciones del Tema 1 (Estadística Descriptiva) Definiciones del Tema 1 (Estadística Descriptiva) Definiciones del Tema 1 (Estadística Descriptiva)

Población Población Población

Población: conjunto de individuos sobre el cual estamos

interesados en sacar conclusiones (habitualmente demasiado grande para abarcarlo).

Muestra Muestra Muestra

Muestra: subconjunto de la población al que tenemos acceso y sobre el que realizamos las observaciones.

sobre el que realizamos las observaciones. Parámetro

Parámetro Parámetro

Parámetro: cantidad numérica calculada sobre la población (ejemplos: media µ, varianza σ2 y proporción p). Determina

completamente un modelos paramétricos. Estadístico

Estadístico Estadístico

Estadístico: cantidad numérica calculada sobre la muestra. Cuando un estadístico conduce a un valor aproximado de un parámetro se le llama estimadorestimadorestimador del parámetro.estimador

(71)

Estimadores y su distribución Estimadores y su distribución Estimadores y su distribución Estimadores y su distribución

Una muestra aleatoria simple X1, X2,…, Xn está compuesta por n

variables aleatorias independientes con la misma distribución. Estimadores Estimadores Estimadores Estimadores Media muestral Media muestral Media muestral

Media muestral: La utilizamos para estimar la media poblacional µ.

Proporción muestral Proporción muestral Proporción muestral

Proporción muestral: La utilizamos para estimar la proporción

(

n

)

N X n X n i i µ,σ 1 1 ≈ =

= Proporción muestral Proporción muestral Proporción muestral

Proporción muestral: La utilizamos para estimar la proporción poblacional p.

Varianza muestral Varianza muestral Varianza muestral

Varianza muestral: La utilizamos para estimar la varianza poblacional σ2.

− − = n Xi X S 2 2 ( )         ≈ = n p p p N n X

(72)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(73)

Intervalos de confianza Intervalos de confianza Intervalos de confianza Intervalos de confianza

Los intervalos de confianza proporcionan una zona en la que previsiblemente estará el valor autentico del parámetro.

Se calculan con una confianza determinada. Normalmente 95% Casos que veremos:

Intervalo de confianza para la media

Intervalo de confianza para la desviación típica (población normal) Intervalo de confianza para la desviación típica (población normal) Intervalo de confianza para la proporción

(74)

Intervalos de confianza Intervalos de confianza Intervalos de confianza Intervalos de confianza

Supongamos que somos fabricantes de laminas de carbono. Una característica importante que debemos controlar es la resistencia a la rotura.

La resistencia observada en 80 laminas.

Summary Statistics for Resistencia

Count = 80

Average = 2788.52

Histogram for Resistencia

fr eq ue n cy 20 30 40

¿Es el verdadero valor de la resistencia media de

todas las laminas fabricadas 2788.52 ?

Average = 2788.52 Median = 2788.78 Standard deviation = 21.2788 Resistencia fr eq ue n cy 2700 2730 2760 2790 2820 2850 0 10

(75)

Un intervalo de confianza proporciona una zona en la que con una confianza

predeterminada estará el verdadero valor del parámetro

Intervalo de confianza Intervalo de confianza Intervalo de confianza Intervalo de confianza

El verdadero valor de la resistencia media de todas las laminas fabricadas es con un nivel de confianza del 95%: laminas fabricadas es con un nivel de confianza del 95%:

52 . 2788 79 . 2783

Confidence Intervals for Resistencia

95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26]

26 . 2793

(76)

Intervalos de confianza Intervalos de confianza Intervalos de confianza Intervalos de confianza

Las formulas para calcular los intervalos de confianza están en cualquiera de los libros indicados en la bibliografía.

(77)

Intervalo de confianza para la media Intervalo de confianza para la media Intervalo de confianza para la media Intervalo de confianza para la media

Calculo del intervalo de confianza para la media. Menú Statgraphics:

Describe / Numerical data / One-Variable Analysis… Tabular Option / Confidencel Intervals

Confidence Intervals for Resistencia

95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26] 95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26] 95.0% confidence interval for standard deviation: [18.4158;25.2042]

(78)

Intervalo de confianza para la desviación típica Intervalo de confianza para la desviación típica Intervalo de confianza para la desviación típica Intervalo de confianza para la desviación típica

Supongamos que somos fabricantes de laminas de carbono. Una característica importante que debemos controlar es la resistencia a la rotura (distribuida según modelo normal).

Se observa la resistencia en 80 laminas

Summary Statistics for Resistencia Count = 80 Average = 2788.52 Median = 2788.78 Standard deviation = 21.2788 fr eq ue n cy 0 10 20 30 40

El verdadero valor de la Deviación Típica de la resistencia de todas las laminas fabricadas es con un nivel de confianza del 95%:

41 . 18

Confidence Intervals for Resistencia

20 . 25 Standard deviation = 21.2788 Resistencia 2700 2730 2760 2790 2820 2850

(79)

Intervalo de confianza para la desviación típica Intervalo de confianza para la desviación típica Intervalo de confianza para la desviación típica Intervalo de confianza para la desviación típica

Calculo del intervalo de confianza para la desviación típica Menú Statgraphics:

Describe / Numerical data / One-Variable Analysis… Tabular Option / Confidencel Intervals

Confidence Intervals for Resistencia

95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26] 95.0% confidence interval for mean: 2788.52 +/- 4.73538 [2783.79;2793.26] 95.0% confidence interval for standard deviation: [18.4158;25.2042]

(80)

Intervalo de confianza para la proporción Intervalo de confianza para la proporción Intervalo de confianza para la proporción Intervalo de confianza para la proporción

Los artículos fabricados los clasifico en defectuosos y no defectuosos. Observo 5000 artículos.

Codificamos los valores. 0=No defectuoso, 1=Defectuoso

Frequency Table for defecto

Relative Cumulative Cum. Rel. Class Value Frequency Frequency Frequency Frequency ---No defectuoso 4495 0.8990 4495 0.8990 Defectuoso 505 0.1010 5000 1.0000

Intervalo de confianza para la proporción de artículos defectuosos fabricados

Defectuoso 505 0.1010 5000 1.0000

---Confidence Intervals for Art_defect

(81)

En todo intervalo de confianza hay una noticia buena y otra mala:

La buena: hemos usado una técnica que en % alto de casos acierta. La mala: no sabemos si ha acertado en nuestro caso.

Interpretación de los intervalos de confianza Interpretación de los intervalos de confianza Interpretación de los intervalos de confianza Interpretación de los intervalos de confianza

Confidence Intervals for Resistencia 95.0% confidence interval

(82)

Inferencia. Índice Inferencia. Índice Inferencia. Índice Inferencia. Índice Introducción Teoría de la probabilidad Experimentos aleatorios Probabilidad Variables aleatorias

Discretas. Distribución Binomial Continuas. Distribución Normal

Inferencia estadística: Inferencia estadística:

Ajuste a modelo de probabilidad

Identificación de un modelo y estimación de parámetros Diagnosis

Utilización del modelo: cálculo de probabilidades Intervalos de confianza y contrastes de hipótesis:

Estimadores y su distribución Intervalos de confianza

(83)

Contraste de Hipótesis Contraste de Hipótesis Contraste de Hipótesis Contraste de Hipótesis Contraste de Hipótesis Contraste de Hipótesis Contraste de Hipótesis Contraste de Hipótesis

En investigaciones empíricas muchas veces existe una teoría preconcebida relativa a la característica de la población sometida a estudio. Este tipo de circunstancias es estudiado mediante un contraste de hipótesis, e implica la existencia de dos hipótesis que reflejan esta idea a priori y que tendremos que contratar con la realidad observada.

(84)

Contrastando una hipótesis Contrastando una hipótesis

¿es la edad media 40 años? Son demasiados. ..

=

¡Gran diferencia! Rechazo la hipótesis Muestra aleatoria

(85)

Contraste de Hipótesis: analogía con juicio penal Contraste de Hipótesis: analogía con juicio penal Contraste de Hipótesis: analogía con juicio penal Contraste de Hipótesis: analogía con juicio penal

1. Establecemos las hipótesis

2. Se observan las pruebas

Si las pruebas aportan suficiente evidencia en contra de H0, entonces rechazamos H0 Si las pruebas no aportan suficiente evidencia, entonces no rechazamos H0

   culpable es acusado : inocente es acusado : 1 0 El H El

H La hipótesis nula es la hipótesis que

mantendremos a no ser que haya suficiente evidencia para rechazarla (nunca se prueba)

Es decir si hay mucha discrepancia entre las pruebas y H0, entonces rechazamos H0

3. Errores Realidad Inocente culpable D eci si ón inocente - Error II

El error que más nos preocupa es Error tipo I (rechazar H0 , siendo cierta). Realizaremos el contraste intentando controlar este error

α=P(EI)=P(rechazar H0 / H0es cierta) β= P(EI)=P(aceptar H0 / H0 es falsa)

(86)

Contraste de hipótesis Contraste de hipótesis Contraste de hipótesis Contraste de hipótesis

Contraste de hipótesis en estadística es

contestar a preguntas

Siempre se contesta en términos de

probabilidad

Es semejante a los intervalos de confianza.

Es semejante a los intervalos de confianza.

Hay contrastes que se pueden resolver

(87)

Contraste de Hipótesis. Etapas Contraste de Hipótesis. Etapas Contraste de Hipótesis. Etapas Contraste de Hipótesis. Etapas

Definir el contraste: Definir la hipótesis nula (H0 ) y hipótesis alternativa (H1 )

Decidir:

Rechazo H0 y acepto H1 (la muestra aporta suficientes pruebas en contra de la hipótesis nula) o

Aceptar H0 (la muestra no aporta suficientes pruebas en contra Aceptar H0 (la muestra no aporta suficientes pruebas en contra de la hipótesis nula)

La herramienta que vamos a utilizar para tomar la decisión es el p-valor. Si p-valor es pequeño

(88)

Contraste de hipótesis Contraste de hipótesis Contraste de hipótesis Contraste de hipótesis

Un ingeniero esta interesado en la tasa de combustión de un combustible sólido. Él sospecha, y es lo que quiere demostrar que la tasa de

combustión es en media superior a 40.

Tomare una muestra y realizaré un

contraste para demostrar mi

Summary Statistics for Combustion Count = 100 Average = 40.92 Median = 40.897 Variance = 1.09515 Standard deviation = 1.04649 Minimum = 38.4888 demostrar mi sospecha Maximum = 43.6189 Range = 5.1301 Lower quartile = 40.1761 Upper quartile = 41.6151 Stnd. skewness = 0.873252 Stnd. kurtosis = -0.129913

Histog ram fo r C ombustion

38 39 40 41 42 43 44 0 5 10 15 20 25 30 fr eq ue nc y

(89)

Contraste de hipótesis. Definir hipótesis Contraste de hipótesis. Definir hipótesis Contraste de hipótesis. Definir hipótesis Contraste de hipótesis. Definir hipótesis

Definir la Hipótesis nula y alternativa. Tipos de contrastes    > ≤ 0 1 0 0 : : µ µ µ µ H H    ≠ = 0 1 0 0 : : µ µ µ µ H H

Contrate Bilateral Contrastes unilaterales

  < ≥ 0 1 0 0 : : µ µ µ µ H H Hipótesis nula Hipótesis nula Hipótesis nula

Hipótesis nula Hipótesis alternativaHipótesis alternativaHipótesis alternativaHipótesis alternativa

a) La que contrastamos a) Niega a la hipótesis nula

Lo que queremos demostrar

b) Los datos pueden refutarla b) Los datos pueden demostrar evidencia a favor

c) No debería ser rechazada sin una buena razón c) No debería ser aceptada sin una gran evidencia a

(90)

Definir el contraste: definir hipótesis nula e hipótesis alternativa

Contrate de hipótesis. Definir hipótesis Contrate de hipótesis. Definir hipótesis Contrate de hipótesis. Definir hipótesis Contrate de hipótesis. Definir hipótesis

  > = 40 : 0 µ µ H ¿es la tasa de combustión media del solido superior

  > 40 : 1 µ H

del solido superior a 40?

(91)

Contrate de hipótesis. Decisión Contrate de hipótesis. Decisión Contrate de hipótesis. Decisión Contrate de hipótesis. Decisión

   > = 40 : 40 : 1 0 µ µ H H

¿es la tasa de combustión media del s superior a 40

Intuitivamente rechazaremos H0 si la media muestral es mucho más grande que 40

Para establecer un criterio para aceptar o rechazar la hipótesis nula utilizaremos el p-valor

. 40 si

rechazamos H0 X >> Gran diferencia entre lo observado y lo esperado

(92)

Contrate de hipótesis. Herramienta de decisión: p

Contrate de hipótesis. Herramienta de decisión: p--valorvalor Contrate de hipótesis. Herramienta de decisión: p

Contrate de hipótesis. Herramienta de decisión: p--valorvalor

El p-valor da una idea de lo verosímil que es la

hipótesis nula con los datos que tenemos

P-valor es bajo (menor que 0.05)…poco

1 0.75

0.5 Acepto Η0

que 0.05)…poco

razonable que H0 sea verdad

P-valor alto(mayor que 0.05)…es bastante

posible que H0 se verdad

0.025

0 0.05

(93)

Contrate de hipótesis. Decisión Contrate de hipótesis. Decisión Contrate de hipótesis. Decisión Contrate de hipótesis. Decisión

   > = 40 : 40 : 1 0 µ µ H H

¿es la tasa de combustión media del s superior a 40

Hypothesis Tests for Combustion Sample mean = 40.92

Sample median = 40.897

t-test

---Null hypothesis: mean = 40.0 Alternative: greater than

Computed t statistic = 8.79089 P-Value = 1.9218E-7

Reject the null hypothesis for alpha = 0.05.

Tenemos evidencia

(94)

Contrastes de hipótesis Contrastes de hipótesis Contrastes de hipótesis Contrastes de hipótesis

Casos que veremos:

Intervalo de confianza para la media

Intervalo de confianza para la desviación típica (población normal)

Intervalo de confianza para la proporción Comparación de poblaciones

Comparación de medias Comparación de medias

Comparación de varianzas (poblaciones normales) Comparación de proporciones

(95)

Contraste media Contraste media Contraste media Contraste media

Un fabricante de bolsas asegura que sus bolsas soportan al menos 17 Kg. Nosotros sospechamos que soportan menos.

Tomamos una muestra de 238 datos. A la vista de los datos, tenemos evidencia en contra del fabricante.

1. Definimos contraste H : µ ≥17

Summary Statistics for Bolsas Count = 238

Average = 16.9259

Standard deviation = 0.889525

Histogram for Bolsas

13 15 17 19 21 Bolsas 0 20 40 60 80 100 fr eq u e n c y 1. Definimos contraste

2. Calculamos el p-valor. Statgraphics (Describe / Numerical data / One-Variable Analysis/ Tabular Option / Confidencel Intervals)

   < ≥ 17 : 17 : 1 0 µ µ H H t-test

---Null hypothesis: mean = 17.0 Alternative: less than

Computed t statistic = -1.28473 P-Value = 0.100071

(96)

Contraste varianza. Solo para poblaciones normales Contraste varianza. Solo para poblaciones normales Contraste varianza. Solo para poblaciones normales Contraste varianza. Solo para poblaciones normales

La temperatura ideal para una sala es 22 grados. El sistema refrigeración intenta mantener la temperatura alrededor de este valor objetivo. El sistema de

refrigeración será de alta calidad si la desviación típica de la temperatura en menor de 0.3 grados. Sospechamos que este sistema no es de calidad alta

Se realizan 67 observaciones. (hemos comprobado que se ajusta a una normal)

1. Definimos contraste

H0 :σ ≤ 0.3

Summary Statistics for Temperatura: Count = 67

Average = 22.052

Standard deviation = 0.499787

1. Definimos contraste

2. Calculamos el p-valor. Statgraphics (Describe / Hyphotesis tests)

   > ≤ 3 . 0 : 3 . 0 : 1 0 σ σ H H Hypothesis Tests

---Sample standard deviation = 0.499787 Sample size = 67

95.0% lower confidence bound for sigma: [0.437922] Null Hypothesis: standard deviation = 0.3

(97)

Contraste Proporciones (muestras grandes) Contraste Proporciones (muestras grandes) Contraste Proporciones (muestras grandes) Contraste Proporciones (muestras grandes)

El porcentaje de pupitres para zurdos en la Universidad es del 3% Suponemos que no hay pupitres para zurdos suficientes.

Tomamos una muestra de 223 alumnos.

Frequency Table for zurdos

Relative Cumulative Cum. Rel. Value Frequency Frequency Frequency Frequency ---diestros 214 0.9596 214 0.9596 zurdos 9 0.0404 223 1.0000

---1. Definimos contraste

2. Calculamos el p-valor. Statgraphics (Describe / Hyphotesis tests)

   > ≤ 03 . 0 : 03 . 0 : 1 0 p H p H Hypothesis Tests ---Sample proportion = 0.0404 Sample size = 100

Approximate 95.0% lower confidence bound for p: [0.0140121] Null Hypothesis: proportion = 0.03

(98)

Comparación de proporciones Comparación de proporciones Comparación de proporciones Comparación de proporciones

¿El porcentaje de alumnos y alumnas zurdas es igual? Tomamos una muestra de 223 alumnos, y 212 alumnas:

7.62% de chicos zurdos 3.76% de chicas zurdas

1. Definimos contraste 1. Definimos contraste

2. Calculamos el p-valor. Statgraphics (Compare / Hyphotesis tests)

   = = chicas chi chicas chi p p H p p H cos 1 cos 0 : :

(99)

Comparación de proporciones Comparación de proporciones Comparación de proporciones Comparación de proporciones

2. Calculamos el p-valor. Statgraphics (Compare / Hyphotesis tests)

Hypothesis Tests

---Sample proportions = 0.0762 and 0.0376 Sample sizes = 223 and 212

Sample sizes = 223 and 212

Approximate 95.0% confidence interval for difference between proportions: [-0.00462411;0.0818241] Null Hypothesis: difference between proportions = 0.0

Alternative: not equal

Computed z statistic = 1.73016 P-Value = 0.0836016

Do not reject the null hypothesis for alpha = 0.05.

(100)

Comparación de poblaciones Normales Comparación de poblaciones Normales Comparación de poblaciones Normales Comparación de poblaciones Normales

Dos proveedores suministran bombillas ¿Hay diferencias significativas entre la duración de las bombillas de los dos proveedores?

Tomamos una muestra de 200 bombillas de cada proveedor Box-and-Whisker Plot Box-and-Whisker Plot 1000 1100 1200 1300 1400 1500 1600 Bombillas1 bombillas2 Summary Statistics Bombillas1 bombillas2 ---Count 250 250

(101)

Comparación de poblaciones Normales Comparación de poblaciones Normales Comparación de poblaciones Normales Comparación de poblaciones Normales

¿Hay diferencias significativas entre la duración de las bombillas de los dos proveedores?

1. Definimos los contrastes

2. Calculamos el p-valor. Statgraphics (Compare / Two Sample)

   ≠ = 2 1 1 2 1 0 : : µ µ µ µ H H    ≠ = 2 1 1 2 1 0 : : σ σ σ σ H H

2. Calculamos el p-valor. Statgraphics (Compare / Two Sample)

a) Comparación desviaciones típicas b) Comparación de medias

Referencias

Documento similar

Proporcione esta nota de seguridad y las copias de la versión para pacientes junto con el documento Preguntas frecuentes sobre contraindicaciones y

Debido al riesgo de producir malformaciones congénitas graves, en la Unión Europea se han establecido una serie de requisitos para su prescripción y dispensación con un Plan

Como medida de precaución, puesto que talidomida se encuentra en el semen, todos los pacientes varones deben usar preservativos durante el tratamiento, durante la interrupción

•cero que suplo con arreglo á lo que dice el autor en el Prólogo de su obra impresa: «Ya estaba estendida esta Noticia, año de 1750; y pareció forzo- so detener su impresión

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y