• No se han encontrado resultados

UD 5 Introducción a la Inferencia Estadística

N/A
N/A
Protected

Academic year: 2021

Share "UD 5 Introducción a la Inferencia Estadística"

Copied!
101
0
0

Texto completo

(1)

DEIOAC – Estadística Fuente: Romero, R.; Zúnica, L. R. Métodos estadísticos en ingeniería. I.S.B.N 84-9705-727-9

UD 5 – Introducción a la

Inferencia Estadística

(2)

Contenido

-

UD5 Introducción a la Inferencia Estadística

-5.4. Introducción a la Regresión Lineal

5.4. Introducción a la Regresión Lineal

2.2. Estadística Descriptiva Bidimensional - 2

2.2. Estadística Descriptiva Bidimensional - 2

5.3 Introducción al Análisis de la Varianza

5.2 Inferencia básica en poblaciones normales

5.1 Distribuciones en el muestreo

5.1 Distribuciones en el muestreo

(3)

5.3 - ANOVA

Análisis de la Varianza

(ANalysis Of VAriance)

(4)

Contenidos

1. Idea Intuitiva del ANOVA

2. ANOVA con un sólo factor controlado 2.1. Un ejemplo

2.2. Descomposición de la Suma de Cuadrados. Test F

2.3. Intervalos LSD

2.4. Análisis de residuos

3. ANOVA con más de un factor. Factores cuantitativos 4. Ejemplos y ejercicios

(5)

Idea intuitiva del ANOVA

 Técnica estadística muy poderosa para el estudio

del efecto de uno o más factores sobre la media de una variable

Idea básica: descomponer la variabilidad total

observada en unos datos en las partes asociadas a cada factor estudiado más una parte residual, con la que después se compararán las primeras

 Técnica básica para el estudio de observaciones

que dependen de varios factores, siendo la herramienta fundamental en el análisis de los

Modelos de Regresión Lineal y de Diseño de Experimentos

(6)

Idea intuitiva del ANOVA

Ejemplo intuitivo

Efecto del tipo de algoritmo y del nivel de tráfico

en la red de interconexión de un multicomputador, sobre la latencia de los mensajes enviados por la red Veamos unos resultados hipotéticos en algunos casos extremos:

(7)

Ejemplo intuitivo

ALTURA 1 2 3 A L G O R IT M O 1 20 20 20 20 20 20 2 20 20 20 20 20 20 Factor 2 Factor 1 2 variantes: 2 algoritmos diferentes 3 niveles: 3 niveles de TRÁFICO en la red

Valor observado: LATENCIA

(media) de los mensajes

enviados utilizando el algoritmo 2 con un nivel de tráfico

intermedio (2) en la red

(8)

Ejemplo intuitivo

TRÁFICO 1 2 3 A L G O R IT M O 1 20 20 20 20 20 20 2 20 20 20 20 20 20 Latencia media = 20

La suma de los cuadrados de las desviaciones de cada valor observado de la LATENCIA con respecto a su media:

(

)

2

(

) (

2

)

2

(

)

2

0

20 20

20 20

20 20

ikj ikj

x

x

=

+

+

+

=

Suma de Cuadrados Total (SCT) Caso A Nada influye SCTotal=0

(9)

(

)

2

(

) (

2

)

2

(

)

2

300

20 25

20 25

30 25

ikj ikj

x

x

=

+

+

+

=

Ejemplo intuitivo

TRÁFICO 1 2 3 A L G O R IT M O 1 20 20 20 20 20 20 2 30 30 30 30 30 30 Latencia media = 25 Caso B SCT=300  Hay variabilidad.

Al “analizar la varianza” se observa que la variabilidad se debe sólo al efecto del tipo de algoritmo utilizado

El factor algoritmo influye sobre la media de la latencia de los mensajes

(10)

(

) (

2

)

2

(

)

2

500

20 30

25 30

40 30

TOTAL

SC

=

+

+

+

=

Ejemplo intuitivo

TRÁFICO

1 2 3 A L G O R I T M O 1 20 20 25 25 30 30 2 30 30 35 35 40 40 Latencia media = 30 Caso C SCT=500  Hay variabilidad

Al “analizar la varianza” se observa que la variabilidad se debe tanto al efecto del algoritmo como al efecto del nivel de

tráfico en la red

El factor algoritmo y el factor nivel de tráfico de la red influyen sobre el promedio de la latencia de los mensajes

No hay interacción entre ambos factores. El efecto del tráfico es lineal

(11)

TRÁFICO 1 2 3 A L G O R IT M O 1 20 20 25 25 30 30 2 30 30 35 35 50 50

(

) (

2

)

2

(

)

2

1066 67

20 31 67

25 31 67

50 31 67

TOTAL

SC

=

'

+

'

+ +

'

=

'

Ejemplo intuitivo

Latencia media = 31’67 Caso D SCT=1066’67  Hay variabilidad

Al “analizar la varianza” se observa que la variabilidad se debe tanto al efecto del tipo de algoritmo como al efecto del

nivel de tráfico de la red y a su interacción

El factor algoritmo, el factor tráfico y su interacción

influyen sobre el promedio de la latencia. El efecto del nivel de

tráfico sobre la latencia media de los mensajes es mayor utilizando el algoritmo 2 que el 1

(12)

TRÁFICO 1 2 3 A L G O R IT M O 1 19 21 27 24 28 32 2 30 31 36 33 47 51

(

) (

2

)

2

(

)

2

1001

19 31 6

21 31 6

51 31 6

TOTAL

SC

=

'

+

'

+ +

'

=

Ejemplo intuitivo

Latencia media = 31’6 Caso E Único realista SCT=1001  Hay variabilidad

Se observa que la variabilidad se debe tanto al efecto del algoritmo como al efecto del nivel de tráfico y a su

interacción, así como al de los factores no controlados

El factor algoritmo, el factor tráfico y su interacción, así como otros factores no controlados o no tenidos en cuenta

influyen sobre el promedio de la latencia de los mensajes

(13)

Grados de libertad (gl)

SCT  glT = nº de datos – 1

SCF  glF = nº de variantes –1

SCInteracciónproducto de los gl de los factores que interaccionan

SCR  glR= glT - glF - glinter En el ejemplo:  SCT  12 - 1= 11 glSCalgoritmo  2 – 1 = 1 gl  SCtráfico  3 – 1 = 2 gl  SCalgoritmoXtráfico  1 x 2 = 2 gl  SCR  11 – 5 = 6 gl

En paralelo a esta descomposición de la SCTotal se realiza una descomposición de los “grados de

libertad” totales en los grados de libertad asociados

(14)

Significación de un efecto

 La comparación de la “varianza” asociada a

cada efecto con la varianza residual permite estudiar si dicho efecto es o no significativo  Estas varianzas se estiman dividiendo cada

suma de cuadrados por sus grados de libertad, obteniéndose unos estadísticos a los que se denomina Cuadrados Medios:

SC

CM

g .l

(15)

Test F

 El CMTotal es la varianza de los datos observados

(no se suele calcular)

 El CMResidual es una estimación de la σ2 existente

en las poblaciones muestreadas, asumiendo la misma σ2 para todas las poblaciones (o una

estimación del promedio de dichas varianzas, en el caso de que difieran de unas poblaciones a otras)

 El CM asociado a cada efecto:

 es otra estimación de la σ2 independiente de la

del CMResidual, si el efecto no existe en la población

 tiende a ser mayor que σ2, si existe un efecto

(16)

Test F

Si no existe un efecto real del factor a nivel

poblacional el CMfactor será muy parecido al

CMresidual glF,glR

CMF

F

ratio

F

CMR

=

La F-ratio será muy parecida a 1 con una distribución F de Fisher con los grados de

libertad correspondientes

(17)

Test F

Si existe un efecto real del factor a nivel

poblacional el CMfactor >>> CMresidual

La F-ratio será demasiado elevada para ser una F

de Fisher con los grados de libertad

correspondientes

El factor influye sobre la media de la respuesta

,

glF glR

CMF

F

CMR

>>

(18)

Test F

 Los programas estadísticos no muestran los

valores críticos de la distribución F manejada. En su lugar, utilizan el p-value asociado (en la distribución manejada, porcentaje de valores

mayores que el correspondiente estadístico

calculado) Prob (Fglf, glr > Fratio) = p-value

 Cuanto menor sea este p-value más fuerte será la

evidencia respecto a la existencia poblacional del efecto correspondiente

(19)

Contenidos

1. Idea Intuitiva del ANOVA

2. ANOVA con un sólo factor controlado 2.1. Un ejemplo

2.2. Descomposición de la Suma de Cuadrados. Test F

2.3. Intervalos LSD

2.4. Análisis de residuos

3. ANOVA con más de un factor. Factores cuantitativos 4. Ejemplos y ejercicios

(20)

ANOVA con un factor. Ejemplo

Una factoría de motores tiene 2 proveedores de los cigüeñales que mecaniza. Un tercer proveedor ofrece sus cigüeñales algo más caros argumentando sus mejores propiedades dinámicas, concretamente que su equilibrado dinámico (número de gramos de material que hay que eliminar hasta conseguir que el centro de gravedad de la pieza coincida con el eje de giro) es menor.

La factoría decide hacer una prueba comparando 10 cigüeñales del nuevo proveedor (código=1) con 10 de cada uno de sus 2 proveedores tradicionales (códigos 2 y 3). Los resultados obtenidos se recogen en la siguiente tabla:

(21)

Ejemplo Proveedores cigüeñales

Factor estudiado PROVEEDOR

Variantes del factor 1 2 3

Resultados obtenidos Equilibrado dinámico (grs) 23 35 50 28 36 43 21 29 36 27 40 34 95 43 45 41 49 52 37 51 52 30 28 43 32 50 44 36 52 34

(22)

Ejemplo Proveedores cigüeñales

¿Hay evidencia suficiente respecto a la superioridad de los cigüeñales del nuevo proveedor para cambiar a éste, pese al precio ligeramente más elevado?

CUESTIÓN CLAVE

El ejemplo que consideramos es un caso particular de Diseño de Experimentos:

 se estudia el efecto de un único factor (el proveedor) con

3 variantes (los 3 proveedores a comparar) sobre la media de la variable respuesta (el equilibrado dinámico, que debe ser el menor posible)

(23)

Ejemplo Proveedores cigüeñales

 Experimento:

Factores: PROVEEDOR

Variantes: Prov. 1, 2, 3

Variable respuesta: Equilibrado Dinámico (EQUIDINA)

Objetivo: ¿existen diferencias entre los

equilibrados dinámicos medios en los

cigüeñales de los 3 proveedores?

0 1 2 3 1 i j

1 2 3

H : m

m

m

H : i, j ;i

j / m

m ;i, j : , ,

=

=

ANOVA

(24)

Descomposición de la Suma de Cuadrados. Test F

Descomposición de la variabilidad total:

Variabilidad Total en los datos = Variabilidad debida a diferencias entre proveedores

(efecto del factor proveedor) + Variabilidad residual (diferencias dentro de cada proveedor) ¿Cómo se obtiene...?

(25)

Ejemplo Proveedores cigüeñales

PROVEEDORES 1 2 3 23 35 50 28 36 43 21 29 36 27 40 34 95 43 45 41 49 52 37 51 52 30 28 43 32 50 44 36 52 34 37 41.3 43.3 medias 40.53 Media de todos los datos

(26)

Ejemplo Proveedores cigüeñales

Cuantificación de la variabilidad: Variabilidad Total en los datos = Variabilidad debida a diferencias entre proveedores

(efecto del factor proveedor) + Variabilidad residual (diferencias dentro de cada proveedor) Suma de Cuadrados Total SCT Suma de Cuadrados Factor SCF Suma de Cuadrados Residual SCR

(27)

Ejemplo Proveedores cigüeñales

PROVEEDORES 1 2 3 23 35 50 28 36 43 21 29 36 27 40 34 95 43 45 41 49 52 37 51 52 30 28 43 32 50 44 36 52 34 37 41.3 43.3 40.53

Suma de Cuadrados Total (SCT):

(23– 40.53)2 + (28– 40.53)2 + ... +

(36– 40.53)2 + (35– 40.53)2 + ... +

(44– 40.53)2 + (34– 40.53)2 = 5465

Suma de los cuadrados de las desviaciones de cada dato con respecto a la media general

(28)

Ejemplo Proveedores cigüeñales

PROVEEDORES 1 2 3 23 35 50 28 36 43 21 29 36 27 40 34 95 43 45 41 49 52 37 51 52 30 28 43 32 50 44 36 52 34 37 41.3 43.3 40.53

Suma de Cuadrados Factor

(SCF):

10 x (37– 40.53)2

+ 10 x (41.3– 40.53)2 +

+ 10 x (43.3– 40.53)2 = 207

Suma de los cuadrados de las desviaciones de la media de cada proveedor con

(29)

(23– 37)2 + ... + (36– 37)2 +

(35– 41.3)2 + ... + (52– 41.3)2 +

(50– 43.3)2 + ... + (34– 43.3)2 = 5258

Suma de los cuadrados de las desviaciones de cada dato

con respecto a la media del proveedor correspondiente

Ejemplo Proveedores cigüeñales

PROVEEDORES 1 2 3 23 35 50 28 36 43 21 29 36 27 40 34 95 43 45 41 49 52 37 51 52 30 28 43 32 50 44 36 52 34 37 41.3 43.3 40.53

Suma de Cuadrados Residual

(30)

Grados de libertad (gl)

SCT  glT = nº de datos – 1 SCF  glF = nº de variantes –1 SCR  glR= glT - glF En el ejemplo: SCT  30 - 1= 29 gl SCF  3 – 1 = 2 gl SCR  29 – 2 = 27 gl

(31)

Significación de un efecto

La comparación de la SC asociada a cada efecto

con la SCresidual permite estudiar si dicho efecto es o no significativo

 Para llevar a cabo dicha comparación, cada suma

de cuadrados SC se divide por sus grados de

libertad, obteniéndose unos estadísticos a los

que se denomina Cuadrados Medios:

SC

CM

g .l

(32)

Test F

Si el CMfactor es muy parecido al CMresidual

glF,glR

CMF

F

ratio

F

CMR

=

La F-ratio será muy parecida a 1, con una distribución F de Fisher con los grados de

libertad correspondientes

0 1 2 3

Aceptamos

H : m

=

m

=

m

No hay diferencias significativas entre los proveedores

(33)

Test F

Si el CMfactor >>> CMresidual

La F-ratio será demasiado elevada para ser una

F de Fisher con los grados de libertad

correspondientes

Sí hay diferencias significativas entre los proveedores,

con respecto al valor medio del equilibrado dinámico de los cigüeñales

Al menos uno de los tres proveedores tiene una

media diferente a la de los otros dos

(Existe un efecto real del factor a nivel poblacional)

0 1 2 3

(34)

¿Cómo estudiar si el efecto de un factor es o no

significativo?

VARIABILIDAD RESIDUAL (CMR) VARIABILIDAD FACTOR (CMF)

m2 σ m1 σ m3 σ m1= m2 = m3 σ 1 C M RC M F C M R C M F ≈  ≈ 1 C M RC M F C M R C M F >>  >>

(35)

Si no es cierta H0 (al menos uno de los tres proveedores tiene una media diferente a la de los otros dos) la Fratio (o la Fcalculada) tiende a ser

mayor que una F2, 27

La H0 se contrasta, por tanto, viendo si el valor obtenido para la F-ratio es “demasiado grande” para ser una F de Fisher, lo que viene cuantificado por el p-value correspondiente que no es más que la Prob(F2,27 > Fratio). Si dicho p-value es inferior al riesgo de 1ª especie α con el que se trabaja (generalmente se opera con α= 0.05), o sea si la Fratio excede al valor crítico de una F2, 27 para dicha probabilidad α, se considera que el efecto del factor será significativo

(36)

Ejemplo Proveedores cigüeñales

 Tabla resumen del ANOVA

Origen Variación Suma de Cuadrados Grados Libertad Cuadrado Medio F ratio Total 5465 29 - -Proveedor 207 2 103’5 0’532 Residual 5258 27 194’7 -Riesgo de 1ª especie: α=0’05 Tabla: F2,27(5%) = 3’35 >> 0’532 Aceptamos H0

¡NO HAY DIFERENCIAS SIGNIFICATIVAS ENTRE PROVEEDORES!

(37)

Test F (p-value)

Distribucion F 2,27 x d en si ty 0 1 2 3 4 5 0 0,2 0,4 0,6 0,8 1 1,2 f=3,35 F-ratio=0,53 (P_value=0,59) > (α=0,05)  Aceptamos H0

TEST F Comparando la P_value con α Gráficamente

α=0’05 2,27 ratio 2,27 P(F F ) P(F 0,53 P _ value ) 0,59 ≥ = ≥ = = = α=0 ,05 2,27 / P(F > f) = 0,05

(38)

DEIOAC–Estadística–etsinf

DEIOAC–Estadística–etsinf

Construcción Tabla resumen del ANOVA

Origen Variación Suma de Cuadrados Grados Libertad Cuadrado Medio F ratio Total SCT glT - -Factor SCF glF CMF=SCF/glF CMF/CMR Residual SCR glR CMR=SCR/glR

-1) Establecer Riesgo de 1ª especie: α

2) Buscar valor f en Tabla:

3) Comparar f con el F ratio

4) Aceptar o Rechazar H0  NO hay/SI hay diferencias significativas entre los tratamientos

α

F R

gl ,gl

f / P(F

> f) = α

Resolución del Test o contraste

α¡OJO!NO se

(39)

Ejemplo Proveedores cigüeñales

Analysis of Variance for EQUIDINA - Type III Sums of Squares

---Source Sum of Squares Df Mean Square F-Ratio P-Value ---MAIN EFFECTS A:PROVEEDO 207,267 2 103,633 0,53 0,5934 RESIDUAL 5258,2 27 194,748 ---TOTAL (CORRECTED) 5465,47 29 ---All F-ratios are based on the residual mean square error.

Los resultados se sintetizan en la Tabla Resumen

del Anova, proporcionada por Statgraphics

El p-value es superior a 0.05 ¡el efecto del proveedor sobre la media del equilibrado dinámico

NO es significativo!, es decir es admisible la

(40)

Contenidos

1. Idea Intuitiva del ANOVA

2. ANOVA con un sólo factor controlado

2.1. Un ejemplo

2.2. Descomposición de la Suma de Cuadrados. Test F

2.3. Intervalos LSD

2.4. Análisis de residuos

3. ANOVA con más de un factor. Factores cuantitativos 4. Ejemplos y ejercicios

(41)

Análisis de residuos

 Tiene una gran importancia práctica completar

cualquier análisis de datos reales con un estudio de

los residuos de los datos. En estos residuos, se

refleja el efecto de todos los factores no controlados que pueden haber afectado a los resultados

obtenidos

El Statgraphics calcula los residuos

automáticamente y permite guardarlos en una variable que por defecto denomina RESIDUALS

 También proporciona diferentes representaciones gráficas de los mismos

(42)

Análisis de residuos

 El “cumplimiento” de las tres hipótesis básicas del

ANOVA: Normalidad, Independencia,

Homocedasticidad (igualdad de varianzas de las poblaciones) se puede “comprobar” a partir de

diferentes tipos de análisis realizados sobre los residuos

 Permite detectar datos anómalos o pautas de variabilidad sospechosas

 Los residuos deben ser independientes, presentar

distribución normal y tener de media 0. La varianza de los residuos es la varianza residual (CMR del

(43)

Análisis de residuos

Residuos: diferencia entre cada dato y la media

del tratamiento que se ha aplicado para obtener dicho dato

Objetivo: Validar análisis previos Ejemplo:

37

4

23

− =

1

9

1

41

7

5

'

3

=

'

Primer valor observado del equilibrado dinámico del prov. 1

Media del equilibrado dinámico de la

muestra del prov. 1

Residuo 1

El residuo de una observación recoge el efecto que sobre dicha observación han tenido todos los factores no incluidos en el experimento

(44)

Análisis de residuos

Residual Plot for EQUIDINA

R E S ID U O S PROVEEDOR 1 2 3 -60 -40 -20 0 20 40 60

Residual Plot for EQUIDINA

R E S ID U O S PROVEEDOR 1 2 3 -60 -40 -20 0 20 40

60 Los residuos deben

estar alrededor de cero, distribuidos más o menos de manera uniforme Dato anómalo: la 5ª observación del prov. 1 debe ser

35, no 95

¡Una observación anómala puede invalidar por completo todas las conclusiones de un análisis!

(45)

 Estudiando los datos introducidos, con los que ha

operado el programa, se observa que el 5º dato del proveedor 1 se ha introducido como 95, en vez de 35 que era su valor correcto

Análisis de residuos

Si se vuelve a realizar el ANOVA ... Factor estudiado PROVEEDOR

Variantes del factor 1 2 3

Resultados obtenidos Equilibrado dinámico (grs) 23 35 50 28 36 43 21 29 36 27 40 34 35 43 45 41 49 52 37 51 52 30 28 43 32 50 44 36 52 34

(46)

Ejemplo Proveedores

(sin dato anómalo)

 Tabla resumen del ANOVA

Origen Variación Suma de Cuadrados Grados Libertad Cuadrado Medio F ratio Total 2409’46 29 - -Proveedor 871’26 2 435’6 7’64 Residual 1538’2 27 56’97 -Riesgo de 1ª especie: α=0’05 Tabla: F2,27(5%) = 3’35 << 7’64 Rechazamos H0

¡SI HAY DIFERENCIAS SIGNIFICATIVAS ENTRE PROVEEDORES!

(47)

Ejemplo Proveedores cigüeñales

Distribucion F 2,27 x d en si ty 0 1 2 3 4 5 0 0,2 0,4 0,6 0,8 1 1,2 3.35 α=0’05 Aceptación Rechazo 7’6 Rechazamos H0 TEST F (Gráficamente)

(48)

Analysis of Variance for EQUIDINA - Type III Sums of Squares

---Source Sum of Squares Df Mean Square F-Ratio P-Value ---MAIN EFFECTS A:PROVEEDO 871,267 2 435,633 7,65 0,0023 RESIDUAL 1538,2 27 56,9704 ---TOTAL (CORRECTED) 2409,47 29 ---All F-ratios are based on the residual mean square error.

Ejemplo Proveedores cigüeñales

Se recoge a continuación el cuadro resumen del

ANOVA, obtenido una vez corregido el dato erróneo

Las conclusiones son ahora distintas, detectándose un efecto significativo estadísticamente (p-value = 0.0023) del factor Proveedor. (Obsérvese que un

único dato anómalo, de un total de 30, había

conducido en una FRatio catorce veces menor que la correcta)

(49)

Comparación de medias

Si el test F resulta significativo:

 ¿Es mejor el Proveedor 1 que el 2 y el 3?

 ¿Son mejores el 1 y el 2 que el 3, no habiendo

diferencias entre los primeros?

 ...

Estudiar entre qué proveedores existen diferencias significativas

Un valor significativo de la Fratio sólo indicaría que al menos una de las tres medias difiere de las restantes, pero no precisa cuáles son las que difieren entre sí

(50)

 Intervalos LSD (Least Signficative Difference) son

intervalos para la media de cada tratamiento.

 Intuitivamente, se calculan como la mitad del

intervalo de confianza para la diferencia de medias, pero no corresponde a un intervalo de confianza para las medias.

 Interpretación práctica:

Comparación de medias. Intervalos LSD

La diferencia entre la media de dos tratamientos

no será significativa si los respectivos intervalos LSD se solapan.

(51)

Intervalos LSD

¿Entre qué proveedores existen diferencias

significativas con respecto al equilibrado dinámico?

Means and 95,0 Percent LSD Intervals

PROVEEDOR E Q U ID IN A 1 2 3 27 31 35 39 43 47

Means and 95,0 Percent LSD Intervals

PROVEEDOR E Q U ID IN A 1 2 3 27 31 35 39 43 47 Los intervalos se solapan: entre los prov 2 y 3 no hay diferencias

significativas del eq. dinámico

Pero entre el prov. 1 y el 2 ó el 3 si hay diferencias significativas 27'53,34' 47     37'83, 44'77     39'83, 46 '77    

(52)

Ejemplo Proveedores

(con dato anómalo)

Means and 95,0 Percent LSD Intervals

PROVEEDOR E Q U ID IN A 1 2 3 30 32 34 36 38 40 42 44 46 48 50

¿Entre que tratamientos existen diferencias

significativas con respecto al equilibrado dinámico? Los 3 intervalos se solapan: no hay

diferencias

significativas del eq. dinámico entre los proveedores

(53)

Análisis de residuos

1 2 3

Residual Plot for EQUIDINA

-14 -9 -4 1 6 11 16 re si d u al PROVEEDOR 1 2 3

Residual Plot for EQUIDINA

-14 -9 -4 1 6 11 16 re si d u al PROVEEDOR

(54)

Contenidos

1. Idea Intuitiva del ANOVA

2. ANOVA con un sólo factor controlado

2.1. Un ejemplo

2.2. Descomposición de la Suma de Cuadrados. Test F

2.3. Intervalos LSD

2.4. Análisis de residuos

3. ANOVA con más de un factor. Factores cuantitativos 4. Ejemplos y ejercicios

(55)

Ejemplo 2: ANOVA con 2 factores

Objetivo: analizar el efecto que sobre el tiempo

medio de respuesta de un sistema informático tienen dos factores :

Factor cualitativo: FICHEROS con 3 variantes codificadas como 1, 2 y 3 I=3

Distribución de los ficheros en los discos.

Factor cuantitativo: BUFFERS con 3 niveles 10, 20, 30 J=3

(56)

Tratamientos y pruebas

Cada uno de los 9 tratamientos (9 combinaciones

posibles) se ha probado 2 veces N=2

Plan Factorial Equilibrado y replicado

Cada prueba consistió en un día completo:

 obteniéndose los tiempos medios de respuesta

 evaluados para un proceso estándar consistente en la

compilación de un determinado programa en lenguaje C.

(57)

Resultados

BUFFERS 10 20 30 1 2’7 2’4 2’0 2’2 1’8 1’6 2 3’1 3’2 2’7 2’5 2’2 1’9 3 3’7 3’9 2’9 3’2 3’5 3’8 F IC H E R O S

(58)

Sumas de Cuadrados y g.l.

Ficheros SC =5'914 (nº de variantes – 1)

(I – 1)=(3-1)=2 g.l. Buffers SC =1'688 (nº de niveles– 1)

(J – 1)=(3-1)=2 g.l.

Suma de Cuadrados Total SCT=8'74

(nº de datos– 1)

(IxJxN – 1)=(3x3x2 - 1)=17 g.l.

(59)

Sumas de Cuadrados y g.l.

=

FicherosxBuffers

SC

0'875

(I – 1)x(J – 1)

(3-1)x(3-1) = 2x2 = 4 g.l.

Suma de Cuadrados Interacción

SC Factor i x Factor j = SCFixFj

… Más adelante veremos con más detalle qué representan las interacciones entre factores.

(60)

Sumas de Cuadrados y g.l.

Suma de Cuadrados Residual

p Residual SCTotal- SCEf SC = Residual

=8'74-(5'914+1'568+0'875)=

SC

0'265

SCT  18-1=17 g.l.  SCFICHEROS  3-1=2 g.l.  SCBUFFERS  3-1=2 g.l.  SCFICHxBUFF 2x2=4 g.l. 8 g.l  SCR  17-8=9 g.l.  Suficientes

(61)

Tabla Resumen del ANOVA

Origen Variación SC g.l. CM ratioF F _tabla α=0’05 Total 8’743 FICHEROS 5’914 BUFFERS 1’688 FICHxBUFF 0’876 Residual

(62)

Tabla Resumen del ANOVA

Origen Variación SC g.l. CM ratioF F _tabla α=0’05 Total 8’743 17 - -FICHEROS 5’914 2 2’957 100’433 4’26 = F2,9 BUFFERS 1’688 2 0’844 28’66 4’26 = F2,9 FICHxBUFF 0’876 4 0’219 7’437 3’63 = F4,9 Residual 0’265 9 0’029

>

>

>

Los efectos simples de FICHEROS y BUFFERS resultan significativos, pues su Fratio es mayor que el valor en

tablas de una F2,9 (α=0,05) .

Por el mismo motivo, también es significativo el efecto de la interacción FICHEROSxBUFFERS (F4,9 α)

(63)

Means and 95,0 Percent LSD Intervals FICHEROS T M R E S P 1 2 3 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8

Análisis efecto FICHEROS: Intervalos LSD

1 X = 2 '116 2 X = 2 ' 6 3 X = 3'5

Para el promedio de BUFFERS ensayados, con la distribución de FICHEROS 1 se obtienen Tiempos medios de Respuesta

significativamente menores que para la distribución 2, y a su vez para ésta se tienen Tiempos de Respuesta

(64)

Means and 95,0 Percent LSD Intervals FICHEROS T M R E S P 1 2 3 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8

Efecto simple de un factor

El efecto simple de un factor se define sobre el promedio de las condiciones estudiadas de los restantes factores

1 X = 2 '116 2 X = 2 ' 6 3 X = 3'5 = X 2 '74 Media general = − = = − = F3 X3 3, X 2,74 5 Ef 0,76

El efecto simple de la distribución de FICHEROS 3 hace aumentar el Tiempo MEDIO DE RESPUESTA en 0,76

(65)

Efecto de la interacción doble

Cuando se estudia más de un factor, aparece el concepto de INTERACCIÓN.

Puede ser doble, triple, etc, según sea entre dos, tres, … factores. El estudio de interacciones de

orden superior a 3 son difíciles de interpretar y rara vez tienen sentido.

Aparece cuando el efecto de un determinado

factor es diferente según el nivel (o variante) considerada del otro factor.

(66)

Ejemplos de efectos simples e interacciones dobles

Factor A - + B a nivel -B a nivel + Resultado A B x + + A B x + − A B x − + A B x − −

A no tiene efecto B tiene efecto No hay interacción Resultado Factor A - + A B x + − A B x + + A B x − + A B x − −

A tiene efecto B tiene efecto No hay interacción

A tiene efecto B tiene efecto

Ligera interacción

Fuerte interacción

(carece de sentido hablar de efectos simples)

Resultado Factor A - + A B x + − A B x + + A B x − + A B x − − Factor A - + Resultado A B x + + A B x + − A B x − + A B x − −

(67)

Efecto de la interacción doble

El efecto de la interacción existe porque el efecto del factor Buffers es distinto para las diferentes variantes de ficheros Interaction Plot BUFFERS 1,6 2 2,4 2,8 3,2 3,6 4 T M R E S P 10 20 30 FICHEROS 1 2 3

(68)

Factores cuantitativos: Introducción

 Factores

 Cualitativos  Cuantitativos

 Factores cualitativos:

 Tipo de procesador en cierto sistema

 Tipo de procedimiento de análisis utilizado en determinado

laboratorio

 Tipo de proveedor del cableado de red

 Tipo de material utilizado en la fabricación de cierto

producto

 Topología de la red  ...

(69)

Factores cuantitativos: Introducción

 Factores

 Cualitativos  Cuantitativos

 Factores cuantitativos:

 Tamaño de la memoria caché

 Cantidad de abono utilizado en cierto cultivo

 Velocidad de agitación de una mezcla en un proceso

químico

 Cantidad de pegamento utilizado en un proceso de

adhesivado

 Nivel de carga de un sistema informático

 Número de procesadores en un multicomputador  Nivel de presión ejercida en cierto proceso ...

(70)

Factores cuantitativos : Introducción

Factores cuantitativos: si su efecto resulta significativo en el ANOVA ……

 No tiene sentido comprobar entre qué niveles

del factor existen diferencias significativas

Sino si se observa algún tipo de pautas en esas

diferencias

 Interesa estudiar la naturaleza del efecto del

(71)

Factores cuantitativos

EJEMPLO: Estudio de PRESTACIONES de un multicomputador

• Analizar la LATENCIA de los mensajes de una red de interconexión en función del TRÁFICO (tasa de inyección de mensajes) de esa red.

• Se ensayan 4 ó 5 niveles de tráfico diferentes y se mide la latencia media. ANOVA: TRÁFICO significativo.

Cuestión Clave:

¿Existen diferencias significativas en la LATENCIA MEDIA de los mensajes con “poco” y “mucho”

(72)

Factores cuantitativos

EJEMPLO: Estudio de PRESTACIONES de un multicomputador

• Analizar la LATENCIA de los mensajes de una red en función del TRÁFICO (tasa de inyección de mensajes) de esa red.

• Se ensayan 4 ó 5 niveles de tráfico diferentes y se mide la latencia media. ANOVA: TRÁFICO significativo.

Cuestión Clave:

¿Cómo evoluciona la LATENCIA MEDIA de los mensajes a medida que aumenta o disminuye el

nivel de TRÁFICO?

(73)

Es obvio que a medida que aumenta el tráfico también aumenta la latencia media, pero cómo ...

¿En la misma

proporción a medida que

aumenta el el nivel de TRÁFICO?  EFECTO LINEAL Tráfico Latencia media

EJEMPLO: Estudio del TRUOGHPUT

A medida que aumenta el el nivel de TRÁFICO, ¿son

mayores los incrementos

de la latencia media?  EFECTO CUADRÁTICO Tráfico Latencia media

(74)

Factores cuantitativos

EJEMPLO: Estudio de PRESTACIONES de un multicomputador

• Es obvio que a medida que aumenta el tráfico también aumenta la latencia media, pero cómo ...

A medida que aumenta el nivel de TRÁFICO, ¿son menores los incrementos de la latencia media?

EFECTO CUADRÁTICO Tráfico

Latencia media

(75)

EJEMPLO: Buffers y Ficheros

No tiene sentido decir que para 10 buffers el TM de Respuesta

es mayor y que entre 20 y 30 buffers no hay diferencia,

obteniéndose los menores TM de respuesta (aunque se ha de tener en cuenta).

10 20 30

Means and 95,0 Percent LSD Intervals

BUFFERS 2,2 2,4 2,6 2,8 3 3,2 3,4 T M R E S P

Lo importante es si se aprecia o no una posible relación lineal

o cuadrática para, en el caso de que ésta fuera significativa, obtener la expresión matemática correspondiente y obtener el

número óptimo de ficheros, que puede ser no se haya

(76)

NOTA sobre Condiciones Operativas Óptimas

¿Qué número de buffers y qué protocolo se deberían usar para

que el TM de Respuesta fuera el menor?

Interactions and 95,0 Percent LSD Intervals

BUFFERS 1,5 1,7 1,9 2,1 2,3 2,5 2,7 2,9 3,1 3,3 3,5 3,7 3,9 4,1 T M R E S P 10 20 30 FICHEROS 1 2 3 COO Nº buffers = 30 Distribución de Ficheros = 1 o 2 Pero entre la distribución de Ficheros 1 y 2 NO hay diferencias significativas Cuanto menor, mejor

(77)

Fact. cuantitativos. Combinación de efectos

ZCuadrática <0 0 >0 ZLineal <0 0 >0

(78)

Factores cuantitativos: Ejemplo1

 Con el fin de estudiar el comportamiento de un

sistema informático, y tratar de minimizar el

tiempo medio de utilización de CPU, se ha llevado a cabo un experimento para conocer la posible influencia que la carga pueda tener sobre dicho tiempo.

 Se han ensayado 3 niveles de carga (50, 100 y 150

Mflops/seg.) y se ha medido el tiempo medio de utilización de CPU en segundos. Cada tratamiento se ha probado 5 veces en diferentes ejecuciones .

 Los resultados del experimento se recogen en la

(79)

Factores cuantitativos: Ejemplo1

 Factor: Carga

 Niveles: 3 (50, 100 y 150 Mflops/seg)

 Variable respuesta:Tiempo medio de Utilización CPU (seg) CARGA (Mflops/s) 50 100 150 38 54 63 40 47 65 42 52 57 37 53 58 43 49 62 T1= 200 T2= 255 T3= 305 TG=760 1 = 40 X X2 = 51 X3 = 61

(80)

Objetivo: estudiar si el factor CARGA afecta a la variable respuesta Tiempo medio de utilización de CPU”

Factores cuantitativos: Ejemplo1

0 50 100 150 1 i j

50 100 150

H : m

m

m

H : i, j ;i

j / m

m

i, j :

,

,

=

=

Hipótesis a contrastar: ANOVA

(81)

2 2 2 , 2 1 760 38506, 67 15 1209, 33 1103, 33 106 ij i j I i i i TG N x SG SG SG T SCT S N SC CF F R T C SC S = = = = = − = = − = = − =

Factores cuantitativos: Ejemplo1

1103, 33 551, 66 2 106 8,83 12 551, 66 _ 62, 45 8,8 _ 3 SC SCF CM gl glF SCR glR CMF F ratio CMR CMF CMR F ratio =  = = =  = = = =  = =

(82)

Factores cuantitativos: Ejemplo1

 Tabla resumen del ANOVA

Origen Variación Suma de Cuadrados Grados Libertad Cuadrado Medio F ratio Total 1209’33 14 - -CARGA 1103’33 2 551’66 62’45 Residual 106 12 8’83 -Riesgo de 1ª especie: α=0’05 Tabla: F2,12(5%) = 3’88 << 62’45 Rechazamos H0

¡SÍ HAY DIFERENCIAS SIGNIFICATIVAS ENTRE LOS NIVELES DE CARGA!

(83)

50 100 150 Medias y 95,0% de Fisher LSD CARGA 37 42 47 52 57 62 67 T C P U

Factores cuantitativos: Ejemplo1

A medida que aumenta la CARGA el tiempo medio de utilización de CPU crece linealmente.

(84)

Factores cuantitativos: Ejemplo1

A medida que aumenta la CARGA el tiempo medio de utilización de CPU crece linealmente.

Carga

Tiempo CPU

(85)

Contenidos

1. Idea Intuitiva del ANOVA

2. ANOVA con un sólo factor controlado

2.1. Un ejemplo

2.2. Descomposición de la Suma de Cuadrados. Test F

2.3. Intervalos LSD

2.4. Análisis de residuos

3. ANOVA con más de un factor. Factores cuantitativos

(86)

Ejercicios

 A continuación tienes dos ejercicios adicionales a

las explicaciones de esta tercera parte de la Unidad Didáctica 5.

 Intenta responder a las diferentes preguntas que

se plantean en los dos ejercicios.

 Recuerda que puedes consultar ejercicios resueltos

de ANOVA, tanto en el documento de Ejercicios

resueltos UD5_3 como en los diferentes exámenes resueltos de la asignatura que se encuentran en la

carpeta de Recursos de PoliformaT.

No te olvides aclarar las posibles dudas con tu

(87)

Ejercicio 1

Con el objeto de analizar el comportamiento de los sistemas de memoria caché en un tipo de multiprocesador se plantea llevar a cabo un estudio de la influencia de dos de las características más importantes de estos sistemas (Nº de procesadores y protocolo) sobre las prestaciones de los mismos (3 niveles y 3 variantes).

Cada uno de los 9 tratamientos se ensayó 3 veces, midiéndose en cada prueba la tasa de fallos (%) de los sistemas de memoria producida por la ejecución de un determinado programa tipo.

(88)

Ejercicio 1

CPU’s

Para mantener la

coherencia entre las memorias necesitamos un protocolo

(89)

Ejercicio 1

PROTOCOLO (PROT)

MSI MESI DRAGON

N º D E P R O C E S A D O R E S (N P R O ) 2 25,80 30,00 35,25 26,25 32,25 33,17 24,60 33,75 37,01 4 32,40 40,05 48,45 28,80 37,35 47,70 30,90 37,05 45,75 6 19,05 20,10 14,70 15,60 19,95 16,65 14,70 21,90 20,10 DATOS ADICIONALES SCT = 2601,63 SCPROT = 376,06 SCPROTxNPRO = 212,62 CMNPRO = 976,62

(90)

Ejercicio 1

a) ¿Cuál es la variable respuesta?, ¿cuáles son los factores?, indica de qué tipo son.

b) Construye la tabla resumen del ANOVA e indica qué efectos han resultado significativos y por qué (α=0,05). Explica los cálculos realizados.

c) Analiza el efecto del tipo de protocolo utilizado mediante los intervalos LSD que se acompañan, e indica qué porcentaje de fallos se ha obtenido, en promedio, para cada variante.

(91)

Ejercicio 1

d) Estudia la naturaleza del efecto del número de

procesadores a nivel descriptivo mediante los

correspondientes gráficos de medias. ¿Existen indicios de una posible relación lineal o cuadrática (positiva o negativa) entre el porcentaje de fallos de los sistemas de memoria y el número de procesadores? Justifica la respuesta.

e) Interpreta gráficamente los gráficos de la

interacción entre el tipo de protocolo y el número

(92)

Ejercicio 1: Tabla Resumen del ANOVA

109

Source Sum of Squares Df Mean Square F-Ratio P-Value

MAIN EFFECTS A:NPRO 1953,24 2 976,62 294,41 0,0000 B:PROT 376,06 2 188,03 56,68 0,0000 INTERACTIONS AB 212,619 4 53,2287 16,02 0,0000 RESIDUAL 59,7099 18 3,3172 TOTAL (CORRECTED) 2601,63 26 Origen Variación SC g.l. CM F ratio F_tabla α=0’05 Total 2601,63 - -NPROC 976,62 = F PROTO 376,06 = F NPROxPROT 212,62 = F Residual

(93)

Ejercicio 1: Intervalos LSD

PROTOCOLO

DRAGON MESI MSI Medias y 95,0% de Fisher LSD 23 25 27 29 31 33 35 T a s a _ fa ll o s

Para el promedio del número de procesadores estudiados, existen diferencias significativas en el promedio de la tasa de fallos resultante con los tres protocolos analizados.

A falta de estudiar la interacción, el protocolo MSI proporciona un valor de la tasa de fallos significativamente más bajo que los otros dos protocolos.

(94)

Ejercicio 1: Intervalos LSD

Nº PROCESADORES 2 4 6 Medias y 95,0% de Fisher LSD 17 21 25 29 33 37 41 T a s a _ fa ll o s

A medida que aumenta el número de procesadores (y para el promedio de los protocolos analizados) aumenta la tasa promedio de fallos y luego disminuye, dando lugar a una tendencia o pauta cuadrática negativa.

A falta de estudiar la interacción, trabajar con 6 procesadores conduce a un valor medio de la tasa de fallos significativamente menor.

(95)

Ejercicio 1: Interacción doble

Nº PROCESADORES Interacciones y 95,0% de Fisher LSD 10 20 30 40 50 T a s a _ fa ll o s 2 4 6 PROTO DRAGON MESI MSI

El paso de 4 a 6 procesadores proporciona una disminución en la tasa media de fallos más marcada con el protocolo DRAGON que con los otros dos protocolos analizados. En estos dos últimos, el comportamiento de la tasa promedio de fallos conforme aumenta el número de procesadores es muy similar, proporcionando MSI en todos los casos valores más bajos de la tasa de fallos.

Sería adecuado trabajar con 6 procesadores y el protocolo MSI con el fin de reducir la tasa media de fallos.

(96)

Ejercicio 1: Interacción doble

PROTOCOLO Gráfico de Interacciones 16 26 36 46 56 T a s a _ fa ll o s

DRAGON MESI MSI

NPRO 2 4 6 Nº PROCESADORES Gráfico de Interacciones 16 26 36 46 56 T a s a _ fa ll o s 2 4 6 PROTO DRAGON MESI MSI

(97)

Ejercicio 2

Se ha llevado a cabo un diseño de experimentos con el objeto de conocer la posible influencia de dos tipos de

puerto de conexión (codificados como A y B) y de tres niveles de memoria RAM (64, 128 y 192), sobre los

tiempos medios de transmisión de un servidor. Los resultados del experimento, expresados en segundos por Mb de información, son los que se indican a continuación:

RAM 64 128 192 Conexión A 5,462 5,769 5,615 3,308 3,923 4,231 2,692 2,923 3,077 B 6,154 6,538 6,077 5,231 5,307 5,538 4,307 4,615 4,692

(98)

Ejercicio 2

a) Realizar un ANOVA para estudiar qué efectos resultan significativos sobre el tiempo medio de transmisión del servidor, teniendo en cuenta los dos factores en estudio y su interacción (α=0,1).

NOTA: SCT= 24,0078; SCCONX=7,295;

CMRAM=7,493; CMR=0,0683.

b) Indicar cuál de los dos tipos de puerto resulta más interesante. Justifica el procedimiento utilizado para llegar a la decisión adoptada.

(99)

Ejercicio 2

c) Estudia la naturaleza del factor memoria a

nivel descriptivo mediante los correspondientes gráficos de medias. ¿Existen indicios de una posible relación lineal o cuadrática (positiva o negativa) entre el tiempo medio de transmisión y el tamaño de memoria? Justifica la respuesta.

d) Interpreta gráficamente los gráficos de la

interacción entre el tipo de conexión y el

tamaño de memoria.

e) ¿Con qué tipo de conexión y cantidad de RAM se debería trabajar con el fin de obtener el menor

tiempo medio de transmisión?. Justifica la

(100)

Ejercicio 2: Tabla Resumen del ANOVA

117 Origen Variación SC g.l. CM F ratio F_tabla α=0’05 Total 24,0078 - -CONX 7,295 = F RAM 7,493 = F CONXxRAM = F Residual 0,0683

(101)

Ejercicio 2

Means and 90,0 Percent LSD Intervals

CONX T M T R A N S M A B 4 4,3 4,6 4,9 5,2 5,5

Means and 90,0 Percent LSD Intervals

RAM T M T R A N S M 64 128 192 3,5 4 4,5 5 5,5 6 6,5 Interaction Plot RAM T M T R A N S M CONX A B 2,8 3,8 4,8 5,8 6,8 64 128 192

Referencias

Documento similar

Si una mujer tiene más de un factor de riesgo, es posible que el aumento del riesgo sea mayor que la suma de los factores individuales, en este caso se debe considerar su riesgo

Las nueve plantas del bloque albergan un total de 72 apartamentos de 48 metros cuadrados, conte- niendo cada uno dos dormitorios , el más grande de los cuales di spone de

(bilateral) Suma de cuadrados y productos cruzados Covarianza N

En esta tesis hemos desarrollado distintos algoritmos para la resolución de problemas de mínimos cuadrados: mínimos cuadrados ordinarios, generalizados, ponderados,

Fundación Ramón Menéndez Pidal / Universidad Autónoma de Madrid... Fundación Ramón Menéndez Pidal / Universidad Autónoma

Entonces el área del cuadrado de lado c construido sobre el lado AC es igual a la suma de las áreas de los cuadrados de lados a y b construidos sobre los lados AB y BC del

Para ello, al crear una partida se añadía la siguiente información a la base de datos: la lista de jugadores (para este prototipo, unos identificadores arbitrarios a

Desarrollar habilidades lógicas y matemáticas que permitan distinguir la estrategia adecuada para obtener antiderivadas mediante el análisis de diferentes técnicas..