• No se han encontrado resultados

MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

N/A
N/A
Protected

Academic year: 2022

Share "MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA"

Copied!
11
0
0

Texto completo

(1)

DEPARTAMENTO DE MÉTODOS ESTADÍSTICOS EUITI UNIVERSIDAD DE ZARAGOZA

MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

CUADERNO PARA EL EXAMEN 2009-2010

Isolina Alberto Moralejo

(2)

INGENIERÍA TÉCNICA INDUSTRIAL

MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

OBJETIVOS DE LA ASIGNATURA

Todo lo relacionado con la toma, procesamiento, análisis e interpretación de datos numéricos pertenece al terreno de la Estadística. En esta asignatura se aprenderá a extraer información de conjuntos de datos, a interpretar esta información y a obtener conclusiones, basadas en datos experimentales, que ayuden al ingeniero a la toma de decisiones. Esto incluye tareas tan diversas como decidir si revisar o no un proceso de fabricación que puede estar desajustado, lanzar o no un nuevo producto al mercado, comprar o no una nueva máquina, etc.

A lo largo del curso se expondrán aplicaciones de la estadística a problemas concretos de la ingeniería.

PRÁCTICAS

Las prácticas de la asignatura serán sesiones de 2 horas distribuidas en semanas alternas. Los grupos de prácticas se deberán formar en la primera semana del cuatrimestre. Los grupos de prácticas, así como los horarios de las mismas los podréis consultar en el aula.

Procurad hacer los grupos de forma que no se os solapen las prácticas de Métodos Estadísticos con las de otras asignaturas.

Las prácticas se realizarán con el programa Microsoft Excel.

(3)

CRITERIOS DE EVALUACIÓN

La evaluación de la asignatura será mediante una prueba escrita. Dicha prueba constará de dos partes. La primera consistirá en la resolución de ejercicios teórico-prácticos y puntuará sobre 7.5 puntos. La segunda consistirá en el análisis de un conjunto de datos en el ordenador utilizando el software Microsoft Excel y puntuará sobre 2.5 puntos. Se dispondrá de dos horas y media para la primera parte y una hora para la segunda.

Como mínimo habrá que sacar un 3 (sobre 7.5 puntos) en la primera parte y un 0.75 (sobre 2.5 puntos) en la segunda parte. Una vez conseguido esto, la nota de la asignatura se calculará sumando las notas obtenidas en las dos partes.

Para la realización del examen únicamente se dispondrá del cuaderno de examen que está disponible en reprografía.

Para el examen es imprescindible llevar calculadora.

No se guardan partes de la asignatura (teoría o prácticas) entre convocatorias.

En cada examen hay que presentarse a ambas partes.

[Nota: el Departamento de Métodos Estadísticos está ubicado en el edificio

Leonardo Torres Quevedo]

(4)

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL

Datos {xi}, i = 1,...,N; K clases, k = 1,....K; marca de clase =xk

Media =

∑ ∑ ∑

=

=

=

k k k k

k k i

i

x N f

x n N

x

x

Varianza =

∑ ∑ ∑

=

=

=

k k k k

k k i

i

x x N f

x x n N

x x

s 2

2 2

2 ( )

) ( )

(

Cuasi-varianza =

1 ) ( 1

) ( ˆ

2 2

2

− =

=

∑ ∑

N x x n N

x x

s k

k k i

i

Desviación típica = s= s2

Cuasidesviación típica =sˆ= sˆ2

La desigualdad de Chebychev garantiza que el porcentaje de observaciones dentro del intervalo x±ks es, al menos, de ⎟

⎜ ⎞

⎝⎛ −

2

1 1

k 100%

Coeficiente de variación =

x CV = s

Grupos en una variable cuantitativa según una cualitativa

La variable X con N observaciones, media

x

y varianza s2 se divide en L grupos (h = 1,...,L).

En cada uno de ellos se calcula el número de datos, la media y la varianza:

2 1 1 1,x ,s

n

2 2 2 2,x ,s n

...

, 2

, h h

h x s n

...

, 2

, L L

L x s n

Llamamos

N

wh = nh al peso relativo o ponderación de cada grupo. Entonces, la media y la varianza globales se calculan:

Media ponderada =

=

= L

h h hx w x

1

Varianza = 2 =

2 +

∑ (

)

2

h h h h

h

hs w x x

w s

(5)

ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL

(xi, yi), i = 1,...,N Covarianza =

N y y x x y

x i

i

i

=

) )(

( ) ,

cov(

Recta de regresión: yˆ =a+bx, donde:

2 2

) ,

; cov(

) , cov(

x

x s

y b x

s x y y x

a= − =

Coeficiente de correlación lineal = = cov( , ); −1≤r ≤1 s

s y r x

y x

PROBABILIDAD

Cuando un suceso A puede ocurrir condicionado a la ocurrencia de varios Bi, mutuamente excluyentes y exhaustivos (sistema completo de sucesos) (Σ P(Bi) = 1), se tiene que:

Teorema de la Probabilidad Total:

=

= n

i

i i P B B A P A P

1

) ( )

| ( )

(

Teorema de Bayes:

=

= n i

i i

j j j

B P B A P

B P B A A P

B P

1

) ( )

| (

) ( )

| ) (

| (

APROXIMACIONES ENTRE VARIABLES

TEOREMA CENTRAL DEL LÍMITE

Sean Xi, i = 1,...,n, una muestra aleatoria simple procedente de una población X (no necesariamente normal), con media μ y varianza σ2. Si n es suficientemente grande (n>30),

Y = Σ Xi se distribuye N (nμ, nσ2) X = Y/n se distribuye N (

n

2

,σ μ )

(6)

VARIABLES ALEATORIAS DISCRETAS

Variable Parámetros Definición Rango de valores Función de probabilidad Tabla/Función de distribución

Media Varianza Reproductividad

Bernoulli Ber (p)

p∈(0,1)

=

éxito si

fracaso X si

1

0 k=0,1 P(X=k)=pk(1-p)1-k p p(1-p)

Si {Xi}i=1,...,n ≈ Ber (p) independientes ⇒

Bin (n,p)

∑ ≈

= n i

Xi 1 Binomial

Bin (n,p)

n >0 entero p∈(0,1)

Número de éxitos en n realizacio- nes del experi- mento.

Muestreo con reposición.

k=0,1,...,n

k n

k p

k p k n X

P ⎟⎟⎠ −

⎜⎜ ⎞

=⎛

= ) (1 )

(

Ver tabla np np(1-p)

Si X1 ≈ Bin (n1,p) y X2 ≈ Bin (n2,p) independientes ⇒

X1 + X2 ≈ Bin (n1+n2,p)

Poisson P(λ)

λ >0 Número de ocurrencias en un intervalo continuo de amplitud una unidad.

k=0,1,2,3,....

) !

( k

k e X P

λk λ

=

= Ver tabla λ λ Si X1 ≈ P(λ1) y X2 ≈ P(λ2)

independientes ⇒ X1 + X2 ≈ P(λ12)

Geométrica Geom(p)

p∈(0,1)

Número de fracasos antes del primer éxito.

k=0,1,2,3,.... P(X =k)=(1−p)kp

) 1

1 ( 1 )

(k = − −p k+ F

p

p 1

2

1 p

p

Si {Xi}i=1,...,n≈ Geom (p) independientes ⇒

∑ ≈

= n i

Xi 1

BN (n,p)

Binomial nega- tiva

BN(n,p)

n >0 entero p∈(0,1)

Número de fracasos antes del n-ésimo éxito.

k=0,1,2,3,.... p k pn

k k k n

X

P 1 (1 )

)

( ⎟⎟ −

⎜⎜ ⎞

⎛ + −

=

= Relación con la Binomial:

) 1 ( 1

) (

) , ( ) , (

=

=

+ n

F k F

p k n Bin p n

BN p

p n(1− )

2

) 1 (

p p n

Si X1 ≈ BN (n1,p) y X2 ≈ BN (n2,p) independientes

X1 + X2 ≈ BN (n1+n2,p)

Hipergeométrica H(N,D,n)

D≤N n≤N N,D,n enteros positivos

Número de exitos en la muestra.

Muestreo sin reposición.

k=max{0, n+D-N}, 1,..., min{n,D}

⎟⎟⎠

⎜⎜ ⎞

⎟⎟⎠

⎜⎜ ⎞

⎟⎟⎛

⎜⎜ ⎞

=

=

n N

k D k n

D N k X

P( ) N

nD

1 ) )(

1 (

N

n N p np con p=D/N

No es reproductiva

(7)

VARIABLES ALEATORIAS CONTINUAS

Variable Parámetros Función de densidad Tabla/Función de distribución Esperanza Varianza Reproductividad Uniforme

U(a,b)

a < b

⎪⎩

⎪⎨

⎧ ∈

= −

caso otro en

b a x a si x b

f

0

) , 1 (

) (

⎪⎪

⎪⎪⎨

− ∈

=

b x si

b a x a si b

a x

a x si x

F 1

) , ( 0

)

( 2

b a+

12 )

(ba 2 No es reproductiva

Exponencial Exp(λ) λ >0

⎪⎩

⎪⎨

⎧ ∈ ∞

=

caso otro en

x si x e

f

x

0

) , 0 ) (

( λ λ

⎪⎩

⎪⎨

>

=

0 1

0 0

) (

x si e

x si x

F λx

λ 1

2

1 λ

Si {Xi}i=1,...,n ≈ Exp (λ) independientes

∑ ≈

= n i

Xi 1

γ (n, λ) Gamma

γ(p,λ) λ >0 p >0

⎪⎩

⎪⎨

⎧ ∈ ∞

= Γ

caso otro en

x si x p e x

f

p p x

0

) , 0 ) (

) ( (

λ 1

λ

λ p

λ2

p

Si X1 ≈ γ(p1,λ) y X2 ≈ γ(p2,λ) independientes ⇒

X1 + X2 ≈ γ( p1+p2,λ)

Normal N(μ,σ2)

μ ∈ (-∞,+∞)

σ2 ∈ (0,+∞) 2

2

2 ) (

2 ) 1

( σ

μ

π σ

=

x

e x

f

x∈ (-∞,+∞)

Ver tabla μ σ2 Si X1 ≈ N(μ11

2)y X2 ≈ N(μ2, σ2 2) independientes

X1 + X2 ≈ N(μ12, σ1222

)

VARIABLES ALEATORIAS CONTINUAS ASOCIADAS AL MUESTREO EN POBLACIONES NORMALES

Chi-cuadrado χ2n

n=grados de libertad n >0 entero

Es un caso particular de Gamma con

p=n/2 y λ=1/2 Ver tabla para percentiles n 2n

Si X1 ≈ χ2n y X2 ≈ χ2m independientes

X1 + X2 ≈ χ2n+m

t de Student tn

n=grados de libertad

n >0 entero Ver tabla para percentiles 0

−2 n

n si n >2

Si X1 ≈ tn y X2 ≈ tm independientes ⇒ X1 + X2 ≈ tn+m

F de Snedecor- Fisher

Fn,m

n=g.l. numerador m=g.l. denominador n,m >0 enteros

Ver tabla para percentiles No es reproductiva

(8)

INTERVALOS DE CONFIANZA

1. Intervalo de confianza para la media μ de una distribución normal de varianza σ2 conocida:

⎥⎦

⎢ ⎤

⎡ − +

=

n z

x n z

x

I σ σ

α α/2 1 /2

1 ,

2. Intervalo de confianza para la media μ de una distribución normal de varianza σ2 desconocida:

(a) Muestras pequeñas (n≤30):

⎥⎦

⎢ ⎤

⎡ − +

=

n t s

x n t s

x

I n n ˆ

ˆ ,

2 / 1

; 1 2

/ 1

;

1 α α

(b) Muestras grandes (n>30):

⎥⎦

⎢ ⎤

⎡ − +

=

n z s

x n z s

x

I ˆ

ˆ ,

2 / 1 2

/

1α α

3. Intervalo de confianza para la varianza σ2 de una distribución normal:

⎥⎥

⎢⎢

⎡ − −

=

2

2 /

; 1

2 2

2 / 1

; 1

2 ( 1)ˆ ˆ ,

) 1 (

α α χ

χn n

s n s I n

4. Intervalo de confianza para la diferencia de medias (μ12) de dos distribuciones normales independientes:

(a) Varianzas poblacionales σ y 2X σ conocidas: Y2

⎥⎥

⎢⎢

⎡ − − + − + +

=

Y Y X X Y

Y X X

n z n

y n x

z n y x I

2 2 2 / 1 2

2 2 /

1 ,( )

)

( σ σ σ σ

α α

(b) Varianzas poblacionales desconocidas:

(b1) Varianzas desconocidas pero iguales:

⎥⎥

⎢⎢

⎡ − − + − + +

= + +

Y X p n

n Y

X p n

n x y t s n n

n s n

t y x

I X Y X Y

1 ˆ 1

) ( 1 , ˆ 1

)

( 2;1α/2 2;1α/2

donde

2 )ˆ 1 ˆ (

) 1 ˆ (

2 2

2

− +

− +

= −

Y X

Y Y X X

p n n

s n s

s n es un promedio ponderado de las

cuasivarianzas muestrales.

(9)

(b2) Varianzas desconocidas y distintas:

⎥⎥

⎢⎢

⎡ − − + − + +

=

Y Y X X f

Y Y X X

f n

s n t s

y n x

s n t s

y x I

2 2 2 / 1

; 2

2 2 / 1

;

ˆ ) ˆ

( ˆ , ) ˆ

( α α

donde

( ) ( )

2

1 ˆ 1 ˆ

ˆ ˆ

2 2 2 2

2 2 2

− + +

+

⎟⎟

⎜⎜

⎛ +

=

Y Y Y X

X X

Y Y X X

n n s n

n s

n s n s

f aproximado al entero más próximo, son los

grados de libertad de la t de Student (aproximación de Welch)

5. Intervalo de confianza para el cociente de varianzas

σ

X2

σ

Y2 de dos poblaciones normales independientes:

⎥⎥

⎢⎢

=⎡

2

2 / 1

; 1

; 1 2

2 / 1

; 1

; 1 2

2

ˆ ˆ ˆ ,

ˆ

Y n n X n

n Y

X

s F s F

s

I s Y X

Y X

α α

6. Intervalo de confianza para el parámetro p de una distribución binomial Bin(n,p):

⎥⎥

⎢⎢

⎡ −

− +

=

n p z p

n p p z p

p

I ˆ(1 ˆ)

,ˆ ˆ) 1 ˆ(

ˆ 1α/2 1α/2

donde pˆ = x/n es la frecuencia relativa muestral.

7. Intervalo de confianza para la diferencia de parámetros (p1-p2) de dos distribuciones binomiales independientes Bin(n1,p1) y Bin(n2,p2):

⎥⎥

⎢⎢

⎡ −

− + +

− −

− +

=

Y Y Y X

X X Y

X Y

Y Y X

X X Y

X n

p p n

p z p

p n p

p p n

p z p

p p

I ˆ (1 ˆ ) ˆ (1 ˆ )

ˆ ) (ˆ ), 1 ˆ ˆ ( ˆ ) 1 ˆ ( ˆ )

1α/2 1α/2

8. Intervalo de confianza para la media de la diferencia de datos emparejados:

(a) Muestras pequeñas (n≤30):

⎥⎦

⎢ ⎤

⎡ − +

=

n t s

d n t s

d

I n d n ˆd

ˆ ,

2 / 1

; 1 2

/ 1

;

1 α α

donde:

n d d

n

i

i

= =1 ; di =xiyi;

1 ) (

ˆ 1

2 2

=

=

n d d s

n

i i d

(b) Muestras grandes (n>30):

⎥⎦

⎢ ⎤

⎡ − +

=

n z s

d n z s

d

I d ˆd

ˆ ,

2 / 1 2

/

1α α

(10)

Fórmulas para líneas centrales y límites de control de los Gráficos de Control Gráfico de Dispersión medida por Línea Central Límites

Medias Desviaciones típicas

x c n

x s

2

± 3

Medias Rangos

x d n

x R

2

± 3

Desviaciones típicas Desviaciones típicas s B3s ; B4s

Rangos Rangos R D3R ; D4R

k R R k y

s =

si =

i ;

2

ˆ c

= s

σ ó

2

ˆ d

= R

σ donde si y Ri son la desviación típica y el rango de cada muestra, respectivamente. μˆ =x .Se tienen k muestras cada una de tamaño n.

Coeficientes para los gráficos de control

n c2 B3 B4 d2 D3 D4

2 0.5642 0 3.267 1.128 0 3.276

3 0.7236 0 2.568 1.693 0 2.575

4 0.7979 0 2.266 2.059 0 2.282

5 0.8407 0 2.089 2.326 0 2.115

6 0.8686 0.030 1.970 2.534 0 2.004 7 0.8882 0.118 1.882 2.704 0.076 1.924 8 0.9027 0.185 1.815 2.847 0.136 1.864 9 0.9139 0.239 1.761 2.970 0.184 1.816 10 0.9227 0.284 1.716 3.078 0.223 1.777 11 0.9300 0.321 1.679 3.173 0.256 1.744 12 0.9359 0.354 1.646 3.258 0.284 1.719 13 0.9410 0.382 1.618 3.336 0.308 1.692 14 0.9453 0.406 1.594 3.407 0.329 1.671 15 0.9490 0.428 1.572 3.472 0.348 1.652 16 0.9523 0.448 1.552 3.532 0.364 1.636 17 0.9551 0.466 1.534 3.588 0.379 1.621 18 0.9576 0.482 1.518 3.640 0.392 1.608 19 0.9599 0.497 1.503 3.689 0.404 1.596 20 0.9619 0.510 1.490 3.735 0.414 1.586 21 0.9638 0.523 1.477 3.778 0.425 1.575 22 0.9655 0.534 1.466 3.819 0.434 1.566 23 0.9670 0.545 1.455 3.858 0.443 1.557 24 0.9684 0.555 1.445 3.895 0.452 1.548

(11)

TABLAS

Binomial

Poisson

Normal estándar

t de Student

Chi-cuadrado de Pearson

F de Snedecor-Fisher

Referencias

Documento similar

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

El nuevo Decreto reforzaba el poder militar al asumir el Comandante General del Reino Tserclaes de Tilly todos los poderes –militar, político, económico y gubernativo–; ampliaba

De acuerdo con Harold Bloom en The Anxiety of Influence (1973), el Libro de buen amor reescribe (y modifica) el Pamphihis, pero el Pamphilus era también una reescritura y

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,