DEPARTAMENTO DE MÉTODOS ESTADÍSTICOS EUITI UNIVERSIDAD DE ZARAGOZA
MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA
CUADERNO PARA EL EXAMEN 2009-2010
Isolina Alberto Moralejo
INGENIERÍA TÉCNICA INDUSTRIAL
MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA
OBJETIVOS DE LA ASIGNATURA
Todo lo relacionado con la toma, procesamiento, análisis e interpretación de datos numéricos pertenece al terreno de la Estadística. En esta asignatura se aprenderá a extraer información de conjuntos de datos, a interpretar esta información y a obtener conclusiones, basadas en datos experimentales, que ayuden al ingeniero a la toma de decisiones. Esto incluye tareas tan diversas como decidir si revisar o no un proceso de fabricación que puede estar desajustado, lanzar o no un nuevo producto al mercado, comprar o no una nueva máquina, etc.
A lo largo del curso se expondrán aplicaciones de la estadística a problemas concretos de la ingeniería.
PRÁCTICAS
Las prácticas de la asignatura serán sesiones de 2 horas distribuidas en semanas alternas. Los grupos de prácticas se deberán formar en la primera semana del cuatrimestre. Los grupos de prácticas, así como los horarios de las mismas los podréis consultar en el aula.
Procurad hacer los grupos de forma que no se os solapen las prácticas de Métodos Estadísticos con las de otras asignaturas.
Las prácticas se realizarán con el programa Microsoft Excel.
CRITERIOS DE EVALUACIÓN
La evaluación de la asignatura será mediante una prueba escrita. Dicha prueba constará de dos partes. La primera consistirá en la resolución de ejercicios teórico-prácticos y puntuará sobre 7.5 puntos. La segunda consistirá en el análisis de un conjunto de datos en el ordenador utilizando el software Microsoft Excel y puntuará sobre 2.5 puntos. Se dispondrá de dos horas y media para la primera parte y una hora para la segunda.
Como mínimo habrá que sacar un 3 (sobre 7.5 puntos) en la primera parte y un 0.75 (sobre 2.5 puntos) en la segunda parte. Una vez conseguido esto, la nota de la asignatura se calculará sumando las notas obtenidas en las dos partes.
Para la realización del examen únicamente se dispondrá del cuaderno de examen que está disponible en reprografía.
Para el examen es imprescindible llevar calculadora.
No se guardan partes de la asignatura (teoría o prácticas) entre convocatorias.
En cada examen hay que presentarse a ambas partes.
[Nota: el Departamento de Métodos Estadísticos está ubicado en el edificio
Leonardo Torres Quevedo]
ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL
Datos {xi}, i = 1,...,N; K clases, k = 1,....K; marca de clase =xk
Media =
∑ ∑ ∑
=
=
=
k k k k
k k i
i
x N f
x n N
x
x
Varianza =
∑ ∑ ∑
−
=
−
=
−
=
k k k k
k k i
i
x x N f
x x n N
x x
s 2
2 2
2 ( )
) ( )
(
Cuasi-varianza =
1 ) ( 1
) ( ˆ
2 2
2
−
−
− =
−
=
∑ ∑
N x x n N
x x
s k
k k i
i
Desviación típica = s= s2
Cuasidesviación típica =sˆ= sˆ2
La desigualdad de Chebychev garantiza que el porcentaje de observaciones dentro del intervalo x±ks es, al menos, de ⎟
⎠
⎜ ⎞
⎝⎛ −
2
1 1
k 100%
Coeficiente de variación =
x CV = s
Grupos en una variable cuantitativa según una cualitativa
La variable X con N observaciones, media
x
y varianza s2 se divide en L grupos (h = 1,...,L).En cada uno de ellos se calcula el número de datos, la media y la varianza:
2 1 1 1,x ,s
n
2 2 2 2,x ,s n
...
, 2
, h h
h x s n
...
, 2
, L L
L x s n
Llamamos
N
wh = nh al peso relativo o ponderación de cada grupo. Entonces, la media y la varianza globales se calculan:
Media ponderada =
∑
=
= L
h h hx w x
1
Varianza = 2 =
∑
2 +∑ (
−)
2h h h h
h
hs w x x
w s
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
(xi, yi), i = 1,...,N Covarianza =
N y y x x y
x i
i
∑
i − −=
) )(
( ) ,
cov(
Recta de regresión: yˆ =a+bx, donde:
2 2
) ,
; cov(
) , cov(
x
x s
y b x
s x y y x
a= − =
Coeficiente de correlación lineal = = cov( , ); −1≤r ≤1 s
s y r x
y x
PROBABILIDAD
Cuando un suceso A puede ocurrir condicionado a la ocurrencia de varios Bi, mutuamente excluyentes y exhaustivos (sistema completo de sucesos) (Σ P(Bi) = 1), se tiene que:
Teorema de la Probabilidad Total:
∑
=
= n
i
i i P B B A P A P
1
) ( )
| ( )
(
Teorema de Bayes:
∑
== n i
i i
j j j
B P B A P
B P B A A P
B P
1
) ( )
| (
) ( )
| ) (
| (
APROXIMACIONES ENTRE VARIABLES
TEOREMA CENTRAL DEL LÍMITE
Sean Xi, i = 1,...,n, una muestra aleatoria simple procedente de una población X (no necesariamente normal), con media μ y varianza σ2. Si n es suficientemente grande (n>30),
Y = Σ Xi se distribuye N (nμ, nσ2) X = Y/n se distribuye N (
n
2
,σ μ )
VARIABLES ALEATORIAS DISCRETAS
Variable Parámetros Definición Rango de valores Función de probabilidad Tabla/Función de distribución
Media Varianza Reproductividad
Bernoulli Ber (p)
p∈(0,1)
⎩⎨
=⎧
éxito si
fracaso X si
1
0 k=0,1 P(X=k)=pk(1-p)1-k p p(1-p)
Si {Xi}i=1,...,n ≈ Ber (p) independientes ⇒
Bin (n,p)
∑ ≈
= n i
Xi 1 Binomial
Bin (n,p)
n >0 entero p∈(0,1)
Número de éxitos en n realizacio- nes del experi- mento.
Muestreo con reposición.
k=0,1,...,n
k n
k p
k p k n X
P ⎟⎟⎠ − −
⎜⎜ ⎞
⎝
=⎛
= ) (1 )
(
Ver tabla np np(1-p)
Si X1 ≈ Bin (n1,p) y X2 ≈ Bin (n2,p) independientes ⇒
X1 + X2 ≈ Bin (n1+n2,p)
Poisson P(λ)
λ >0 Número de ocurrencias en un intervalo continuo de amplitud una unidad.
k=0,1,2,3,....
) !
( k
k e X P
λk λ
= −
= Ver tabla λ λ Si X1 ≈ P(λ1) y X2 ≈ P(λ2)
independientes ⇒ X1 + X2 ≈ P(λ1+λ2)
Geométrica Geom(p)
p∈(0,1)
Número de fracasos antes del primer éxito.
k=0,1,2,3,.... P(X =k)=(1−p)kp
) 1
1 ( 1 )
(k = − −p k+ F
p
−p 1
2
1 p
−p
Si {Xi}i=1,...,n≈ Geom (p) independientes ⇒
∑ ≈
= n i
Xi 1
BN (n,p)
Binomial nega- tiva
BN(n,p)
n >0 entero p∈(0,1)
Número de fracasos antes del n-ésimo éxito.
k=0,1,2,3,.... p k pn
k k k n
X
P 1 (1 )
)
( ⎟⎟ −
⎠
⎜⎜ ⎞
⎝
⎛ + −
=
= Relación con la Binomial:
) 1 ( 1
) (
) , ( ) , (
−
−
=
=
+ n
F k F
p k n Bin p n
BN p
p n(1− )
2
) 1 (
p p n −
Si X1 ≈ BN (n1,p) y X2 ≈ BN (n2,p) independientes ⇒
X1 + X2 ≈ BN (n1+n2,p)
Hipergeométrica H(N,D,n)
D≤N n≤N N,D,n enteros positivos
Número de exitos en la muestra.
Muestreo sin reposición.
k=max{0, n+D-N}, 1,..., min{n,D}
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⎟⎟⎛
⎠
⎜⎜ ⎞
⎝
⎛
−
−
=
=
n N
k D k n
D N k X
P( ) N
nD
1 ) )(
1 (
−
−
− N
n N p np con p=D/N
No es reproductiva
VARIABLES ALEATORIAS CONTINUAS
Variable Parámetros Función de densidad Tabla/Función de distribución Esperanza Varianza Reproductividad Uniforme
U(a,b)
a < b
⎪⎩
⎪⎨
⎧ ∈
= −
caso otro en
b a x a si x b
f
0
) , 1 (
) (
⎪⎪
⎩
⎪⎪⎨
⎧
≥
− ∈
−
≤
=
b x si
b a x a si b
a x
a x si x
F 1
) , ( 0
)
( 2
b a+
12 )
(b−a 2 No es reproductiva
Exponencial Exp(λ) λ >0
⎪⎩
⎪⎨
⎧ ∈ ∞
= −
caso otro en
x si x e
f
x
0
) , 0 ) (
( λ λ
⎪⎩
⎪⎨
⎧
>
−
= − ≤
0 1
0 0
) (
x si e
x si x
F λx
λ 1
2
1 λ
Si {Xi}i=1,...,n ≈ Exp (λ) independientes
⇒
∑ ≈
= n i
Xi 1
γ (n, λ) Gamma
γ(p,λ) λ >0 p >0
⎪⎩
⎪⎨
⎧ ∈ ∞
= Γ − −
caso otro en
x si x p e x
f
p p x
0
) , 0 ) (
) ( (
λ 1
λ
λ p
λ2
p
Si X1 ≈ γ(p1,λ) y X2 ≈ γ(p2,λ) independientes ⇒
X1 + X2 ≈ γ( p1+p2,λ)
Normal N(μ,σ2)
μ ∈ (-∞,+∞)
σ2 ∈ (0,+∞) 2
2
2 ) (
2 ) 1
( σ
μ
π σ
− −
=
x
e x
f
x∈ (-∞,+∞)
Ver tabla μ σ2 Si X1 ≈ N(μ1,σ1
2)y X2 ≈ N(μ2, σ2 2) independientes ⇒
X1 + X2 ≈ N(μ1+μ2, σ12+σ22
)
VARIABLES ALEATORIAS CONTINUAS ASOCIADAS AL MUESTREO EN POBLACIONES NORMALES
Chi-cuadrado χ2n
n=grados de libertad n >0 entero
Es un caso particular de Gamma con
p=n/2 y λ=1/2 Ver tabla para percentiles n 2n
Si X1 ≈ χ2n y X2 ≈ χ2m independientes
⇒
X1 + X2 ≈ χ2n+m
t de Student tn
n=grados de libertad
n >0 entero Ver tabla para percentiles 0
−2 n
n si n >2
Si X1 ≈ tn y X2 ≈ tm independientes ⇒ X1 + X2 ≈ tn+m
F de Snedecor- Fisher
Fn,m
n=g.l. numerador m=g.l. denominador n,m >0 enteros
Ver tabla para percentiles No es reproductiva
INTERVALOS DE CONFIANZA
1. Intervalo de confianza para la media μ de una distribución normal de varianza σ2 conocida:
⎥⎦
⎢ ⎤
⎣
⎡ − +
= − −
n z
x n z
x
I σ σ
α α/2 1 /2
1 ,
2. Intervalo de confianza para la media μ de una distribución normal de varianza σ2 desconocida:
(a) Muestras pequeñas (n≤30):
⎥⎦
⎢ ⎤
⎣
⎡ − +
= − − − −
n t s
x n t s
x
I n n ˆ
ˆ ,
2 / 1
; 1 2
/ 1
;
1 α α
(b) Muestras grandes (n>30):
⎥⎦
⎢ ⎤
⎣
⎡ − +
= − −
n z s
x n z s
x
I ˆ
ˆ ,
2 / 1 2
/
1α α
3. Intervalo de confianza para la varianza σ2 de una distribución normal:
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡ − −
=
−
−
− 2
2 /
; 1
2 2
2 / 1
; 1
2 ( 1)ˆ ˆ ,
) 1 (
α α χ
χn n
s n s I n
4. Intervalo de confianza para la diferencia de medias (μ1-μ2) de dos distribuciones normales independientes:
(a) Varianzas poblacionales σ y 2X σ conocidas: Y2
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡ − − + − + +
= − −
Y Y X X Y
Y X X
n z n
y n x
z n y x I
2 2 2 / 1 2
2 2 /
1 ,( )
)
( σ σ σ σ
α α
(b) Varianzas poblacionales desconocidas:
(b1) Varianzas desconocidas pero iguales:
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡ − − + − + +
= + − − + − −
Y X p n
n Y
X p n
n x y t s n n
n s n
t y x
I X Y X Y
1 ˆ 1
) ( 1 , ˆ 1
)
( 2;1α/2 2;1α/2
donde
2 )ˆ 1 ˆ (
) 1 ˆ (
2 2
2
− +
− +
= −
Y X
Y Y X X
p n n
s n s
s n es un promedio ponderado de las
cuasivarianzas muestrales.
(b2) Varianzas desconocidas y distintas:
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡ − − + − + +
= − −
Y Y X X f
Y Y X X
f n
s n t s
y n x
s n t s
y x I
2 2 2 / 1
; 2
2 2 / 1
;
ˆ ) ˆ
( ˆ , ) ˆ
( α α
donde
( ) ( )
21 ˆ 1 ˆ
ˆ ˆ
2 2 2 2
2 2 2
− + +
+
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛ +
=
Y Y Y X
X X
Y Y X X
n n s n
n s
n s n s
f aproximado al entero más próximo, son los
grados de libertad de la t de Student (aproximación de Welch)
5. Intervalo de confianza para el cociente de varianzas
σ
X2σ
Y2 de dos poblaciones normales independientes:⎥⎥
⎦
⎤
⎢⎢
⎣
=⎡ − − −
−
−
− 2
2 / 1
; 1
; 1 2
2 / 1
; 1
; 1 2
2
ˆ ˆ ˆ ,
ˆ
Y n n X n
n Y
X
s F s F
s
I s Y X
Y X
α α
6. Intervalo de confianza para el parámetro p de una distribución binomial Bin(n,p):
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡ −
− +
−
= − −
n p z p
n p p z p
p
I ˆ(1 ˆ)
,ˆ ˆ) 1 ˆ(
ˆ 1α/2 1α/2
donde pˆ = x/n es la frecuencia relativa muestral.
7. Intervalo de confianza para la diferencia de parámetros (p1-p2) de dos distribuciones binomiales independientes Bin(n1,p1) y Bin(n2,p2):
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡ −
− + +
− −
− +
−
−
= − −
Y Y Y X
X X Y
X Y
Y Y X
X X Y
X n
p p n
p z p
p n p
p p n
p z p
p p
I ˆ (1 ˆ ) ˆ (1 ˆ )
ˆ ) (ˆ ), 1 ˆ ˆ ( ˆ ) 1 ˆ ( ˆ )
(ˆ 1α/2 1α/2
8. Intervalo de confianza para la media de la diferencia de datos emparejados:
(a) Muestras pequeñas (n≤30):
⎥⎦
⎢ ⎤
⎣
⎡ − +
= − − − −
n t s
d n t s
d
I n d n ˆd
ˆ ,
2 / 1
; 1 2
/ 1
;
1 α α
donde:
n d d
n
i
∑
i= =1 ; di =xi −yi;
1 ) (
ˆ 1
2 2
−
−
=
∑
=
n d d s
n
i i d
(b) Muestras grandes (n>30):
⎥⎦
⎢ ⎤
⎣
⎡ − +
= − −
n z s
d n z s
d
I d ˆd
ˆ ,
2 / 1 2
/
1α α
Fórmulas para líneas centrales y límites de control de los Gráficos de Control Gráfico de Dispersión medida por Línea Central Límites
Medias Desviaciones típicas
x c n
x s
2
± 3
Medias Rangos
x d n
x R
2
± 3
Desviaciones típicas Desviaciones típicas s B3s ; B4s
Rangos Rangos R D3R ; D4R
k R R k y
s =
∑
si =∑
i ;2
ˆ c
= s
σ ó
2
ˆ d
= R
σ donde si y Ri son la desviación típica y el rango de cada muestra, respectivamente. μˆ =x .Se tienen k muestras cada una de tamaño n.
Coeficientes para los gráficos de control
n c2 B3 B4 d2 D3 D4
2 0.5642 0 3.267 1.128 0 3.276
3 0.7236 0 2.568 1.693 0 2.575
4 0.7979 0 2.266 2.059 0 2.282
5 0.8407 0 2.089 2.326 0 2.115
6 0.8686 0.030 1.970 2.534 0 2.004 7 0.8882 0.118 1.882 2.704 0.076 1.924 8 0.9027 0.185 1.815 2.847 0.136 1.864 9 0.9139 0.239 1.761 2.970 0.184 1.816 10 0.9227 0.284 1.716 3.078 0.223 1.777 11 0.9300 0.321 1.679 3.173 0.256 1.744 12 0.9359 0.354 1.646 3.258 0.284 1.719 13 0.9410 0.382 1.618 3.336 0.308 1.692 14 0.9453 0.406 1.594 3.407 0.329 1.671 15 0.9490 0.428 1.572 3.472 0.348 1.652 16 0.9523 0.448 1.552 3.532 0.364 1.636 17 0.9551 0.466 1.534 3.588 0.379 1.621 18 0.9576 0.482 1.518 3.640 0.392 1.608 19 0.9599 0.497 1.503 3.689 0.404 1.596 20 0.9619 0.510 1.490 3.735 0.414 1.586 21 0.9638 0.523 1.477 3.778 0.425 1.575 22 0.9655 0.534 1.466 3.819 0.434 1.566 23 0.9670 0.545 1.455 3.858 0.443 1.557 24 0.9684 0.555 1.445 3.895 0.452 1.548