MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

(1)

DEPARTAMENTO DE MÉTODOS ESTADÍSTICOS EUITI UNIVERSIDAD DE ZARAGOZA

MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

CUADERNO PARA EL EXAMEN 2009-2010

Isolina Alberto Moralejo

(2)

INGENIERÍA TÉCNICA INDUSTRIAL

MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

OBJETIVOS DE LA ASIGNATURA

Todo lo relacionado con la toma, procesamiento, análisis e interpretación de datos numéricos pertenece al terreno de la Estadística. En esta asignatura se aprenderá a extraer información de conjuntos de datos, a interpretar esta información y a obtener conclusiones, basadas en datos experimentales, que ayuden al ingeniero a la toma de decisiones. Esto incluye tareas tan diversas como decidir si revisar o no un proceso de fabricación que puede estar desajustado, lanzar o no un nuevo producto al mercado, comprar o no una nueva máquina, etc.

A lo largo del curso se expondrán aplicaciones de la estadística a problemas concretos de la ingeniería.

PRÁCTICAS

Las prácticas de la asignatura serán sesiones de 2 horas distribuidas en semanas alternas. Los grupos de prácticas se deberán formar en la primera semana del cuatrimestre. Los grupos de prácticas, así como los horarios de las mismas los podréis consultar en el aula.

Procurad hacer los grupos de forma que no se os solapen las prácticas de Métodos Estadísticos con las de otras asignaturas.

Las prácticas se realizarán con el programa Microsoft Excel.

(3)

CRITERIOS DE EVALUACIÓN

La evaluación de la asignatura será mediante una prueba escrita. Dicha prueba constará de dos partes. La primera consistirá en la resolución de ejercicios teórico-prácticos y puntuará sobre 7.5 puntos. La segunda consistirá en el análisis de un conjunto de datos en el ordenador utilizando el software Microsoft Excel y puntuará sobre 2.5 puntos. Se dispondrá de dos horas y media para la primera parte y una hora para la segunda.

Como mínimo habrá que sacar un 3 (sobre 7.5 puntos) en la primera parte y un 0.75 (sobre 2.5 puntos) en la segunda parte. Una vez conseguido esto, la nota de la asignatura se calculará sumando las notas obtenidas en las dos partes.

Para la realización del examen únicamente se dispondrá del cuaderno de examen que está disponible en reprografía.

Para el examen es imprescindible llevar calculadora.

No se guardan partes de la asignatura (teoría o prácticas) entre convocatorias.

En cada examen hay que presentarse a ambas partes.

[Nota: el Departamento de Métodos Estadísticos está ubicado en el edificio

Leonardo Torres Quevedo]

(4)

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL

Datos {xi}, i = 1,...,N; K clases, k = 1,....K; marca de clase =x_k

Media =

∑ ∑ ∑

=

k k k k

k k i

i

x N f

x n N

x

Varianza =

∑ ∑ ∑

−

=

−

=

−

=

k k k k

k k i

i

x x N f

x x n N

x x

s ²

2 2

2 ( )

) ( )

(

Cuasi-varianza =

1 ) ( 1

) ( ˆ

2 2

2

−

− =

−

=

∑ ∑

N x x n N

x x

s ^k

k k i

i

Desviación típica = s= s²

Cuasidesviación típica =sˆ= sˆ²

La desigualdad de Chebychev garantiza que el porcentaje de observaciones dentro del intervalo x±ks es, al menos, de ⎟

⎠

⎜ ⎞

⎝⎛ −

2

1 1

k 100%

Coeficiente de variación =

x CV = s

Grupos en una variable cuantitativa según una cualitativa

La variable X con N observaciones, media

x

y varianza s² se divide en L grupos (h = 1,...,L).

En cada uno de ellos se calcula el número de datos, la media y la varianza:

2 1 1 1,x ,s

n

2 2 2 2,x ,s n

...

, 2

, _h _h

h x s n

...

, 2

, _L _L

L x s n

Llamamos

N

w_h = n^h al peso relativo o ponderación de cada grupo. Entonces, la media y la varianza globales se calculan:

Media ponderada =

∑

=

= ^L

h h hx w x

1

Varianza = ² ⁼

∑

² ⁺

∑ (

⁻

)

²

h h h h

h

hs w x x

w s

(5)

ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL

(xi, yi), i = 1,...,N Covarianza =

N y y x x y

x ⁱ

i

∑

i ⁻ ⁻

=

) )(

( ) ,

cov(

Recta de regresión: yˆ =a+bx, donde:

2 2

) ,

; cov(

) , cov(

x

x s

y b x

s x y y x

a= − =

Coeficiente de correlación lineal = = cov( , ); −1≤r ≤1 s

s y r x

y x

PROBABILIDAD

Cuando un suceso A puede ocurrir condicionado a la ocurrencia de varios Bi, mutuamente excluyentes y exhaustivos (sistema completo de sucesos) (Σ P(Bi) = 1), se tiene que:

Teorema de la Probabilidad Total:

∑

=

= ⁿ

i

i i P B B A P A P

1

) ( )

| ( )

(

Teorema de Bayes:

∑

=

= n i

i i

j j j

B P B A P

B P B A A P

B P

1

) ( )

| (

) ( )

| ) (

| (

APROXIMACIONES ENTRE VARIABLES

TEOREMA CENTRAL DEL LÍMITE

Sean Xi, i = 1,...,n, una muestra aleatoria simple procedente de una población X (no necesariamente normal), con media μ y varianza σ². Si n es suficientemente grande (n>30),

Y = Σ X_i se distribuye N (nμ, nσ²) X = Y/n se distribuye N (

n

2

,σ μ ⁾

(6)

VARIABLES ALEATORIAS DISCRETAS

Variable Parámetros Definición Rango de valores Función de probabilidad Tabla/Función de distribución

Media Varianza Reproductividad

Bernoulli Ber (p)

p∈(0,1)

⎩⎨

=⎧

éxito si

fracaso X si

1

0 k=0,1 P(X=k)=p^k(1-p)^1-k p p(1-p)

Si {Xi}i=1,...,n ≈ Ber (p) independientes ⇒

Bin (n,p)

∑ ≈

= n i

Xi 1 Binomial

Bin (n,p)

n >0 entero p∈(0,1)

Número de éxitos en n realizacio- nes del experi- mento.

Muestreo con reposición.

k=0,1,...,n

k n

k p

k p k n X

P ⎟⎟⎠ − ⁻

⎜⎜ ⎞

⎝

=⎛

= ) (1 )

(

Ver tabla np np(1-p)

Si X1 ≈ Bin (n1,p) y X2 ≈ Bin (n2,p) independientes ⇒

X1 + X2 ≈ Bin (n1+n2,p)

Poisson P(λ)

λ >0 Número de ocurrencias en un intervalo continuo de amplitud una unidad.

k=0,1,2,3,....

) !

( k

k e X P

λk λ

= −

= Ver tabla λ λ Si X1 ≈ P(λ1) y X2 ≈ P(λ2)

independientes ⇒ X1 + X2 ≈ P(λ1+λ2)

Geométrica Geom(p)

p∈(0,1)

Número de fracasos antes del primer éxito.

k=0,1,2,3,.... P(X =k)=(1−p)^kp

) 1

1 ( 1 )

(k = − −p ^k⁺ F

p

−p 1

2

1 p

−p

Si {Xi}i=1,...,n≈ Geom (p) independientes ⇒

∑ ≈

= n i

Xi 1

BN (n,p)

Binomial nega- tiva

BN(n,p)

n >0 entero p∈(0,1)

Número de fracasos antes del n-ésimo éxito.

k=0,1,2,3,.... p ^k pⁿ

k k k n

X

P 1 (1 )

)

( ⎟⎟ −

⎠

⎜⎜ ⎞

⎝

⎛ + −

=

= Relación con la Binomial:

) 1 ( 1

) (

) , ( ) , (

−

=

+ n

F k F

p k n Bin p n

BN p

p n(1− )

2

) 1 (

p p n −

Si X1 ≈ BN (n1,p) y X2 ≈ BN (n2,p) independientes ⇒

X1 + X2 ≈ BN (n1+n2,p)

Hipergeométrica H(N,D,n)

D≤N n≤N N,D,n enteros positivos

Número de exitos en la muestra.

Muestreo sin reposición.

k=max{0, n+D-N}, 1,..., min{n,D}

⎟⎟⎠

⎜⎜ ⎞

⎝

⎛

⎟⎟⎠

⎜⎜ ⎞

⎝

⎟⎟⎛

⎠

⎜⎜ ⎞

⎝

⎛

−

=

n N

k D k n

D N k X

P( ) N

nD

1 ) )(

1 (

−

− N

n N p np con p=D/N

No es reproductiva

(7)

VARIABLES ALEATORIAS CONTINUAS

Variable Parámetros Función de densidad Tabla/Función de distribución Esperanza Varianza Reproductividad Uniforme

U(a,b)

a < b

⎪⎩

⎪⎨

⎧ ∈

= −

caso otro en

b a x a si x b

f

0

) , 1 (

) (

⎪⎪

⎩

⎪⎪⎨

⎧

≥

− ∈

−

≤

=

b x si

b a x a si b

a x

a x si x

F 1

) , ( 0

)

( 2

b a+

12 )

(b−a ² No es reproductiva

Exponencial Exp(λ) λ >0

⎪⎩

⎪⎨

⎧ ∈ ∞

= ⁻

caso otro en

x si x e

f

x

0

) , 0 ) (

( λ λ

⎪⎩

⎪⎨

⎧

>

−

= ₋ ≤

0 1

0 0

) (

x si e

x si x

F λx

λ 1

2

1 λ

Si {Xi}i=1,...,n ≈ Exp (λ) independientes

⇒

∑ ≈

= n i

Xi 1

γ (n, λ) Gamma

γ(p,λ) λ >0 p >0

⎪⎩

⎪⎨

⎧ ∈ ∞

= Γ ⁻ ⁻

caso otro en

x si x p e x

f

p p x

0

) , 0 ) (

) ( (

λ 1

λ

λ p

λ2

p

Si X1 ≈ γ(p1,λ) y X2 ≈ γ(p2,λ) independientes ⇒

X1 + X2 ≈ γ( p1+p2,λ)

Normal N(μ,σ²)

μ ∈ (-∞,+∞)

σ²∈ (0,+∞) ²

2

2 ) (

2 ) 1

( ^σ

μ

π σ

− −

=

x

e x

f

x∈ (-∞,+∞)

Ver tabla μ σ² Si X1 ≈ N(μ1,σ1

2)y X2 ≈ N(μ2, σ2 2) independientes ⇒

X1 + X2 ≈ N(μ1+μ2, σ12+σ22

)

VARIABLES ALEATORIAS CONTINUAS ASOCIADAS AL MUESTREO EN POBLACIONES NORMALES

Chi-cuadrado χ²n

n=grados de libertad n >0 entero

Es un caso particular de Gamma con

p=n/2 y λ=1/2 Ver tabla para percentiles n 2n

Si X1 ≈ χ²n y X2 ≈ χ²m independientes

⇒

X1 + X2 ≈ χ²n+m

t de Student tn

n=grados de libertad

n >0 entero Ver tabla para percentiles 0

−2 n

n si n >2

Si X1 ≈ tn y X2 ≈ tm independientes ⇒ X1 + X2 ≈ tn+m

F de Snedecor- Fisher

Fn,m

n=g.l. numerador m=g.l. denominador n,m >0 enteros

Ver tabla para percentiles No es reproductiva

(8)

INTERVALOS DE CONFIANZA

1. Intervalo de confianza para la media μ de una distribución normal de varianza σ² conocida:

⎥⎦

⎢ ⎤

⎣

⎡ − +

= ₋ ₋

n z

x n z

x

I σ σ

α α/2 1 /2

1 ,

2. Intervalo de confianza para la media μ de una distribución normal de varianza σ² desconocida:

(a) Muestras pequeñas (n≤30):

⎥⎦

⎢ ⎤

⎣

⎡ − +

= ₋ ₋ ₋ ₋

n t s

x n t s

x

I _n _n ˆ

ˆ ,

2 / 1

; 1 2

/ 1

;

1 α α

(b) Muestras grandes (n>30):

⎥⎦

⎢ ⎤

⎣

⎡ − +

= ₋ ₋

n z s

x n z s

x

I ˆ

ˆ ,

2 / 1 2

/

1α α

3. Intervalo de confianza para la varianza σ² de una distribución normal:

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡ − −

=

−

− 2

2 /

; 1

2 2

2 / 1

; 1

2 ( 1)ˆ ˆ ,

) 1 (

α α χ

χ_n _n

s n s I n

4. Intervalo de confianza para la diferencia de medias (μ₁-μ₂) de dos distribuciones normales independientes:

(a) Varianzas poblacionales σ y ²_X σ conocidas: _Y²

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡ − − + − + +

= ₋ ₋

Y Y X X Y

Y X X

n z n

y n x

z n y x I

2 2 2 / 1 2

2 2 /

1 ,( )

)

( σ σ σ σ

α α

(b) Varianzas poblacionales desconocidas:

(b1) Varianzas desconocidas pero iguales:

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡ − − + − + +

= ₊ ₋ ₋ ₊ ₋ ₋

Y X p n

n Y

X p n

n x y t s n n

n s n

t y x

I X Y X Y

1 ˆ 1

) ( 1 , ˆ 1

)

( ₂_;₁_α_/₂ ₂_;₁_α_/₂

donde

2 )ˆ 1 ˆ (

) 1 ˆ (

2 2

2

− +

= −

Y X

Y Y X X

p n n

s n s

s n es un promedio ponderado de las

cuasivarianzas muestrales.

(9)

(b2) Varianzas desconocidas y distintas:

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡ − − + − + +

= ₋ ₋

Y Y X X f

Y Y X X

f n

s n t s

y n x

s n t s

y x I

2 2 2 / 1

; 2

2 2 / 1

;

ˆ ) ˆ

( ˆ , ) ˆ

( _α _α

donde

( ) ( )

²

1 ˆ 1 ˆ

ˆ ˆ

2 2 2 2

2 2 2

− + +

+

⎟⎟

⎠

⎞

⎜⎜

⎝

⎛ +

=

Y Y Y X

X X

Y Y X X

n n s n

n s

n s n s

f aproximado al entero más próximo, son los

grados de libertad de la t de Student (aproximación de Welch)

5. Intervalo de confianza para el cociente de varianzas

σ

_X²

σ

_Y² de dos poblaciones normales independientes:

⎥⎥

⎦

⎤

⎢⎢

⎣

=⎡ ⁻ ⁻ ⁻

−

− 2

2 / 1

; 1

; 1 2

2 / 1

; 1

; 1 2

2

ˆ ˆ ˆ ,

ˆ

Y n n X n

n Y

X

s F s F

s

I s ^Y ^X

Y X

α α

6. Intervalo de confianza para el parámetro p de una distribución binomial Bin(n,p):

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡ −

− +

−

= ₋ ₋

n p z p

n p p z p

p

I ˆ(1 ˆ)

,ˆ ˆ) 1 ˆ(

ˆ ₁_α_/₂ ₁_α_/₂

donde pˆ = x/n es la frecuencia relativa muestral.

7. Intervalo de confianza para la diferencia de parámetros (p1-p2) de dos distribuciones binomiales independientes Bin(n1,p1) y Bin(n2,p2):

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡ −

− + +

− −

− +

−

= ₋ ₋

Y Y Y X

X X Y

X Y

Y Y X

X X Y

X n

p p n

p z p

p n p

p p n

p z p

p p

I ˆ (1 ˆ ) ˆ (1 ˆ )

ˆ ) (ˆ ), 1 ˆ ˆ ( ˆ ) 1 ˆ ( ˆ )

(ˆ ₁_α_/₂ ₁_α_/₂

8. Intervalo de confianza para la media de la diferencia de datos emparejados:

(a) Muestras pequeñas (n≤30):

⎥⎦

⎢ ⎤

⎣

⎡ − +

= ₋ ₋ ₋ ₋

n t s

d n t s

d

I _n ^d _n ˆ^d

ˆ ,

2 / 1

; 1 2

/ 1

;

1 α α

donde:

n d d

n

i

∑

i

= =¹ ; d_i =x_i −y_i;

1 ) (

ˆ ¹

2 2

−

=

∑

=

n d d s

n

i i d

(b) Muestras grandes (n>30):

⎥⎦

⎢ ⎤

⎣

⎡ − +

= ₋ ₋

n z s

d n z s

d

I ^d ˆ^d

ˆ ,

2 / 1 2

/

1α α

(10)

Fórmulas para líneas centrales y límites de control de los Gráficos de Control Gráfico de Dispersión medida por Línea Central Límites

Medias Desviaciones típicas

x c n

x s

2

± 3

Medias Rangos

x d n

x R

2

± 3

Desviaciones típicas Desviaciones típicas s B₃s ; B₄s

Rangos Rangos _R D₃R ; D₄R

k R R k y

s ₌

∑

sⁱ ₌

∑

ⁱ _;

2

ˆ c

= s

σ ó

2

ˆ d

= R

σ donde si y Ri son la desviación típica y el rango de cada muestra, respectivamente. μˆ =x .Se tienen k muestras cada una de tamaño n.

Coeficientes para los gráficos de control

n c2 B3 B4 d2 D3 D4

2 0.5642 0 3.267 1.128 0 3.276

3 0.7236 0 2.568 1.693 0 2.575

4 0.7979 0 2.266 2.059 0 2.282

5 0.8407 0 2.089 2.326 0 2.115

6 0.8686 0.030 1.970 2.534 0 2.004 7 0.8882 0.118 1.882 2.704 0.076 1.924 8 0.9027 0.185 1.815 2.847 0.136 1.864 9 0.9139 0.239 1.761 2.970 0.184 1.816 10 0.9227 0.284 1.716 3.078 0.223 1.777 11 0.9300 0.321 1.679 3.173 0.256 1.744 12 0.9359 0.354 1.646 3.258 0.284 1.719 13 0.9410 0.382 1.618 3.336 0.308 1.692 14 0.9453 0.406 1.594 3.407 0.329 1.671 15 0.9490 0.428 1.572 3.472 0.348 1.652 16 0.9523 0.448 1.552 3.532 0.364 1.636 17 0.9551 0.466 1.534 3.588 0.379 1.621 18 0.9576 0.482 1.518 3.640 0.392 1.608 19 0.9599 0.497 1.503 3.689 0.404 1.596 20 0.9619 0.510 1.490 3.735 0.414 1.586 21 0.9638 0.523 1.477 3.778 0.425 1.575 22 0.9655 0.534 1.466 3.819 0.434 1.566 23 0.9670 0.545 1.455 3.858 0.443 1.557 24 0.9684 0.555 1.445 3.895 0.452 1.548

MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

CUADERNO PARA EL EXAMEN 2009-2010

Isolina Alberto Moralejo

INGENIERÍA TÉCNICA INDUSTRIAL

MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

OBJETIVOS DE LA ASIGNATURA

A lo largo del curso se expondrán aplicaciones de la estadística a problemas concretos de la ingeniería.

PRÁCTICAS

Las prácticas de la asignatura serán sesiones de 2 horas distribuidas en semanas alternas. Los grupos de prácticas se deberán formar en la primera semana del cuatrimestre. Los grupos de prácticas, así como los horarios de las mismas los podréis consultar en el aula.

Procurad hacer los grupos de forma que no se os solapen las prácticas de Métodos Estadísticos con las de otras asignaturas.

Las prácticas se realizarán con el programa Microsoft Excel.

CRITERIOS DE EVALUACIÓN

Como mínimo habrá que sacar un 3 (sobre 7.5 puntos) en la primera parte y un 0.75 (sobre 2.5 puntos) en la segunda parte. Una vez conseguido esto, la nota de la asignatura se calculará sumando las notas obtenidas en las dos partes.

Para la realización del examen únicamente se dispondrá del cuaderno de examen que está disponible en reprografía.

Para el examen es imprescindible llevar calculadora.

No se guardan partes de la asignatura (teoría o prácticas) entre convocatorias.

En cada examen hay que presentarse a ambas partes.

[Nota: el Departamento de Métodos Estadísticos está ubicado en el edificio

Leonardo Torres Quevedo]

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL

∑ ∑ ∑

∑ ∑ ∑

∑ ∑

x

∑

∑

∑ (

)

ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL

∑

PROBABILIDAD

∑

∑

APROXIMACIONES ENTRE VARIABLES

TEOREMA CENTRAL DEL LÍMITE

VARIABLES ALEATORIAS DISCRETAS

VARIABLES ALEATORIAS CONTINUAS

VARIABLES ALEATORIAS CONTINUAS ASOCIADAS AL MUESTREO EN POBLACIONES NORMALES

INTERVALOS DE CONFIANZA

( ) ( )

σ

σ

∑

∑

∑

∑

TABLAS

Binomial

Poisson

Normal estándar

t de Student

Chi-cuadrado de Pearson

F de Snedecor-Fisher