Estadistica Aplicada al Analisis Quimico

22 

Loading.... (view fulltext now)

Loading....

Loading....

Loading....

Loading....

Texto completo

(1)

DEPARTAMENTO DE QUIMICA

ESTADISTICA APLICADA AL ANALISIS QUIMICO

Bases para la Validación de Métodos Analíticos

Recopilado por J. Sandoval

LA GENTE SOLO VE LO QUE ESTA PREPARADA PARA VER”

Emerson

1

CUANDO SE APLICA LA ESTADISTICA

A UN ANALISIS

(QUIMIOMETRIA)

2 ANALISIS DISEÑO EXPERIMENTAL ANTES MANIPULACION DE DATOS DESPUES

LA APLICACION DE LA ESTADISTICA EN TODOS LOS PASOS DE UNA MEDICION QUIMICA ASEGURA LA CALIDAD DE LA MEDICION

ADQUISICION DE DATOS

DURANTE

CONTROL ESTADISTICO DE CALIDAD

EN LAS MEDICIONES QUIMICAS

CALIDAD

CONFIABILIDAD

3

UN RESULTADO CONFIABLE ES AQUEL

QUE DEMUESTRA SER VALIDO

VALIDEZ:

GRADO AL CUAL UNA MEDICION (REALIZADA

MEDIANTE UN INSTRUMENTO Y/O PROCEDIMIENTO ANALITICO ESPECIFICOS) PRODUCE EL RESULTADO ESPERADO

DEFINICION PRACTICA DE

ESTADISTICA

HERRAMIENTA UTILIZADA PARA DISCRIMINAR

ENTRE LAS PARTES SISTEMATICA (DETERMINADA)

Y AL AZAR (INDETERMINADA) DE UNA SEÑAL O

RESULTADO ANALITICO

4

y =

D

+

d

(2)

OBJETIVO DE UNA MEDICION

:

DETERMINAR LA MAGNITUD DE

LA PARTE SISTEMATICA DE LA SEÑAL

PARA SEPARAR LA PARTE SISTEMATICA DE UNA

SEÑAL ESPECIFICA, EL ANALISTA DEBERA TENER UN

CONOCIMIENTO PREVIO DE LAS POSIBLES FUENTES

DE ESA PARTE SISTEMATICA

LA ESTADISTICA ES UN COMPLEMENTO QUE LE

AYUDA INDIRECTAMENTE EN DICHA SEPARACION

5 6

EXACTITUD

Y

PRECISION

CERCANIA AL VALOR “VERDADERO” REPRODUCIBILIDAD

ERROR SISTEMATICO

SU PRESENCIA PUEDE SER DETECTADA MEDIANTE PRUEBAS ESTADISTICAS SENCILLAS. DICHAS PRUEBAS, SIN EMBARGO, NO PERMITEN IDENTIFICAR EL ORIGEN DEL ERROR SISTEMATICO

LA MANERA MAS SIMPLE DE DETERMINAR LA PRESENCIA DE ERROR SISTEMATICO ES CUANTIFICAR EL ANALITO EN UN MATERIAL DE REFERENCIA (ESTANDAR)*

7 * MATERIAL DE REFERENCIA:

CONTIENE UNO O MAS ANALITOS EN CONCENTRACION CONOCIDA CON

ALTAS EXACTITUD Y PRECISION

PUEDEN OBTENERSE EN

National Institute of Standards and Technology (NIST) American Society for Testing and Materials (ASTM)

ERROR ALEATORIO

(AL AZAR, INDETERMINADO)

TIENE SU ORIGEN EN LOS EFECTOS DE VARIABLES

FUERA DE CONTROL (TAL VEZ INCONTROLABLES)

EN LAS MEDICIONES

TIENE IGUAL PROBABILIDAD DE SER POSITIVO O

NEGATIVO

ESTA SIEMPRE PRESENTE Y NO PUEDE

CORREGIRSE

(3)

DOS CONCEPTOS BASICOS:

POBLACION

Y

MUESTRA

POBLACION

COLECCION COMPLETA DE OBJETOS QUE COMPARTEN UNA O MAS CARACTERISTICAS

DESDE UN PUNTO DE VISTA ANALITICO:

EL NUMERO INFINITO DE RESULTADOS QUE, EN PRINCIPIO, SE PUEDE OBTENER CON UNA INFINITA

CANTIDAD DE MUESTRA Y EN UNA INFINITA CANTIDAD DE TIEMPO

MUESTRA

UN SUBCONJUNTO DE UNA POBLACION

9

PUNTOS IMPORTANTES

EN ESTADISTICA

ESTRICTAMENTE, LAS LEYES DE LA ESTADISTICA SE APLICAN SOLO

A POBLACIONES. CUANDO ESTAS LEYES SE APLICAN A MUESTRAS

DE DATOS DE LABORATORIO, SE ASUME QUE LA MUESTRA ES

REPRESENTATIVA DE LA POBLACION

LA ESTADISTICA TIENE SUS BASES EN LA TEORIA DE

PROBABILIDADES (UNA TEORIA UTILIZADA PARA EXPLICAR

EVENTOS AL AZAR)

LA ESTADISTICA NO MANEJA “ABSOLUTOS”: SOLO PUEDE DECIR

SI UN EVENTO ES ESTADISTICAMENTE SIGNIFICATIVO O ESTADISTICAMENTE INSIGNIFICANTE

10

DOS DEFINICIONES BASICAS EN ESTADISTICA:

MEDIA Y DESVIACION STANDARD

MEDIA

POBLACION:

MUESTRA:

n

NÚMERO DE MEDICIONES

x

i

i-

ÉSIMA MEDICIÓN DE

x

11

n

x

n 1 i n i

lim

  

n

x

x

n 1 i i

DOS DEFINICIONES BASICAS EN ESTADISTICA:

MEDIA Y DESVIACION ESTANDAR

12 DESVIACION ESTANDAR POBLACION: MUESTRA:

s

n-1 en su calculadora GRADOS DE LIBERTAD UN GRADO DE LIBERTAD SE PIERDE CUANDO LA MEDIA SE USA EN EL CALCULO POSTERIOR DE CUALQUIER PARAMETRO

n

x

n 1 i 2 i n

lim

  

s

1

n

x

x

s

n 1 i 2 i

(4)

DESVIACION ESTANDAR

13

LA DESVIACION ESTANDAR ES

UNA MEDIDA CUANTITATIVA

DE LA PRECISON

(

REPRODUCIBILIDAD

o

DISPERSION DE LAS

MEDICIONES ALREDEDOR DE

LA MEDIA

)

DESVIACION ESTANDAR RELATIVA

(RSD)

14

TAMBIEN CONOCIDA COMO COEFICIENTE

DE VARIACION

(CV)

x

s

RSD

100

x

s

RSD

%

GRADOS DE LIBERTAD

NUMERO DE VALORES NO RESTRINGIDOS

Ejemplo:

ESCOJA UN TOTAL DE 5 VALORES AL AZAR:

3 5 17 2 10

5 GRADOS DE LIBERTAD

ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:

3 5 17 2 13

4 GRADOS DE LIBERTAD

PARA OBTENER UN PROMEDIO DE 8 DESPUES DE ESCOJER LOS PRIMEROS 4 VALORES, EL 13 Y SOLAMENTE EL 13 PUEDE SER EL 5oVALOR

15

Ejemplo:

ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 Y

UNA DESVIACION ESTANDAR DE 6: 3 5 17 3.725 11.275 3 GRADOS DE LIBERTAD

PARA OBTENER UN PROMEDIO DE 8 Y UNA DESVIACION ESTANDAR DE 6 , SOLAMENTE LOS NUMEROS 3.725 Y 11.275

PUEDEN SER EL 4oY EL 5oVALORES, DESPUES DE ESCOJER LOS

PRIMEROS 3 NUMEROS

16

GRADOS DE LIBERTAD

(CONTINUACION)

EN GENERAL...

SI UNO TIENE

n

DATOS Y CALCULA

m

PARAMETROS ESTADISTICOS, LOS GRADOS DE LIBERTAD SON DE

(

n - m

)

(5)

DISTRIBUCIONES

50 determinaciones de la concentración (g/mL) del ión nitrato en una muestra de agua 17 media= 0.500 g/mL desv. estd. = 0.0165 g/mL TABLA DE FRECUENCIA LA DISTRIBUCION SE PUEDE VISUALIZAR MEDIANTE UN HISTOGRAMA 0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47 0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50 0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47 0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48 0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51 Concentracion Frecuencia 0.46 1 0.47 3 0.48 5 0.49 10 0.50 10 0.51 13 0.52 5 0.53 3 18 0 2 4 6 8 10 12 14 0.46 0.47 0.48 0.49 0.50 0.51 0.52 0.53 Concentracion, g/mL Fre c ue nc ia

HISTOGRAMA DE LOS DATOS DE CONCENTRACION DE ION NITRATO

LA DISTRIBUCION DE LAS MEDICIONES ES CERCANAMENTE SIMETRICA CON RESPECTO A LA MEDIA

LA SIMETRIA SE HACE MAS APARENTE A MEDIDA QUE

n

SE INCREMENTA

ES UN ESTIMADO DE

S ES UN ESTIMADO DE

s

x

LA DISTRIBUCION NORMAL O GAUSSIANA

19 FRACCION DE LA POBLACION CUYOS VALORES SE ENCUENTRAN ENTRE

x

Y

x+dx

s

s

2

2

x

exp

y

2 2

ydx

N

dN

Funcion de densidad de probabilidad

LA DISTRIBUCION NORMAL O GAUSSIANA

20

La probabilidad de que la variable aleatoria x tome un valor dentro de un determinado rango es la integral de la funciónysobre dicho rango

El área total encerrada bajo la curva es igual a 1:



ydx

1

b a

ydx

b

x

a

P

(

)

 s       s     2 2 x exp y 2 2

(6)

LA DISTRIBUCION NORMAL O GAUSSIANA

21

RELACION

MUY UTIL:

DIFERENCIA EN UNIDADES DE DESVIACION ESTANDAR ECUACION MAS COMPACTA:

s

x

z

dz

e

2

1

N

dN

z22

 s       s     2 2 x exp y 2 2

LA DISTRIBUCION NORMAL “ESTANDAR”

22

Se llama distribución normal "estándar" a aquélla en la

que sus parámetros toman los valores μ = 0 y σ = 1. En este

caso la función de densidad tiene la siguiente expresión:

x

x

x

z

1

0

s

dx

e

N

dN

x22

2

1

   s       s     2 2 x exp y 2 2

dz

e

2

1

N

dN

z22

Que, naturalmente, coincide con:

Puesto que...

INTERPRETACION GEOMETRICA DE LA

DESVIACION ESTANDAR

s

23

A MAYOR

s

, MAS ANCHA LA CURVA

DISTRIBUCIONES NORMALES CON LA MISMA MEDIA PERO DIFERENTES VALORES DE LA DESVIACION ESTANDAR

OTRAS DISTRIBUCIONES COMUNES

DISTRIBUCIONES APROXIMADAMENTE LOG-NORMAL: CONCENTRACION DEL ANTICUERPO INMUNOGLOBULINA M EN SUERO DE INDIVIDUOS MACHOS

EL TAMAÑO DE LAS GOTITAS FORMADAS POR LOS NEBULIZADORES DE ABSORCION/ EMISION ATOMICA TAMBIEN EXHIBEN ESTA DISTRIBUCION

(7)

25

OTRAS PROPIEDADES DE LA DISTRIBUCION NORMAL

PREGUNTA: CUAL ES LA PROBABILIDAD DE QUE REPLICAS DE UNA

MEDICION SE ENCUENTREN DENTRO DE UN RANGO PARTICULAR ALREDEDOR DE LA MEDIA? 26

s

1

x

1

z

s

2

x

2

z

s

3

x

3

z

En el intervalo [μ - 2σ, μ + 2σ] se encuentra comprendida, aproximadamente, el 95% de la distribución

OTRAS PROPIEDADES DE LA DISTRIBUCION NORMAL

OTRA PREGUNTA: CUAL ES RANGO ALREDEDOR DE LA MEDIA PARA EL CUAL HAY UNA PROBABILIDAD DADA DE QUE REPLICAS DE UNA MEDICION SE ENCUENTREN DENTRO DE EL?

EN OTRAS PALABRAS:

CUAL ES EL VALOR DE z PARA UN PORCENTAJE DADO DE VALORES OBSERVADOS?

27

%Valores Observados Intervalo alrededor de Desviaciones estandares, z

50 ± 0.67s 0.67 68 ± 1.00s 1.00 80 ± 1.29s 1.29 90 ± 1.64s 1.64 95 ± 1.96s 1.96 98 ± 2.33s 2.33 99 ± 2.58s 2.58 99.7 ± 3.00s 3.00 99.9 ± 3.29s 3.29 28 A SU DESVIACION ESTANDARD SE LE CONOCE COMO ERROR ESTANDARD

DE LA MEDIA 0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47 0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50 0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47 0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48 0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51 0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486

RESULTADOS DE 50 DETERMINACIONES DE LA CONCENTRACION DE ION NITRATO, EN g/mL

LA DISTRIBUCION DE MEDIAS

NOTESE QUE ESTAS MEDIAS EXHIBEN UNA

DISPERSION MENOR

QUE LOS DATOS ORIGINALES

PARTE DE UNA

(8)

TEOREMA DEL LIMITE CENTRAL

INDEPENDIENTEMENTE DEL TIPO DE DISTRIBUCION DE LOS DATOS... ENTRE MAS MUESTRAS DE DATOS SE TOMAN, MAS NORMALMENTE DISTRIBUIDA SE HACE LA DISTRIBUCION DE LAS MEDIAS DE ESAS MUESTRAS

EN OTRAS PALABRAS,

AUN SI LA POBLACION ORIGINAL NO ES NORMALMENTE DISTRIBUIDA, LA DISTRIBUCION DE LAS MEDIAS TIENDE A SER MAS NORMALMENTE DISTRIBUIDA A MEDIDA QUE n AUMENTA

29 EN LA PRACTICA,

s

x xi

s

m i x

n

x m

s

s

n

s

s

x m

CONFIABILIDAD DE UN RESULTADO ANALITICO

RESULTADO ANALÍTICO

:

INTERVALO DE CONFIANZA*_

RANGO DENTRO DEL CUAL UNO PUEDE RAZONABLEMENTE ASUMIR QUE SE ENCUENTRA EL VALOR REAL

LIMITES DE CONFIANZA_

LOS VALORES EXTREMOS DE ESE RANGO

* “CONFIANZA” SIGNIFICA QUE UNO PUEDE AFIRMAR CON UN

GRADO ESPECIFICO DE CERTEZA (i. e. , UNA CIERTA PROBABILIDAD) QUE EL INTERVALO INCLUYE EL VALOR REAL

30

confianza

de

ervalo

int

x

RANGO DE CONFIANZA Y DISTRIBUCION DE LAS MEDIAS

DISTRIBUCION DE MEDIAS MOSTRANDO EL RANGO DENTRO DEL CUAL SE ENCUENTRA EL 95% DE LAS MEDIAS

31

LIMITES DE CONFIANZA

SI SE CONOCE

s

:

32 P  1 

n

z

x

IC

s

1.96

(95%)

2.58

(99%)

Z =

(9)

LIMITES DE CONFIANZA

SI NO SE CONOCE s

(MUESTRAS PEQUEÑAS):

33

n

ts

x

IC

t

t

f

,

P

1

n

f

P

1

t

ES FUNCIÓN DE:

LOS GRADOS DE LIBERTAD

LA PROBABILIDAD, P, DE QUE

SE

ENCUENTRE DENTRO DEL RANGO

ESTABLECIDO

ALGUNAS VECES SE USA (LA PROBABILIDAD DE QUE

SE ENCUENTRE FUERA DEL RANGO ESTABLECIDO)

VALORES DE

t

34

f

,

P

t

t

P=0.95 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 0 20 40 60 80 100 120 Degrees of freedom t-va lu e

EJEMPLO

SE DETERMINÓ LA CONCENTRACIÓN DE PLOMO EN LA SANGRE DE 50 NIÑOS DE UNA ESCUELA CERCA A UNA CARRETERA CON MUCHO TRÁFICO. LA MEDIA DE LAS MUESTRAS FUÉ DE 10.1 ng/mL Y LA DESVIACIÓN ESTÁNDAR FUÉ DE 0.6 ng/mL.

(a) CALCULAR EL INTERVALO DE CONFIANZA DE LA CONCENTRACIÓN MEDIA DE PLOMO EN TODOS LOS NIÑOS DE LA ESCUELA.

(b) CUAL DEBERÍA SER EL TAMAÑO DE LA MUESTRA PARA REDUCIR EL RANGO DE CONFIANZA A 0.2 ng/mL (ES DECIR, ±0.1 ng/mL)? 35

LIMITES DE CONFIANZA

36

50

n

ppb

6

.

0

s

ppb

1

.

10

x

n

s

t

x

IC

17

.

0

1

.

10

50

6

.

0

01

.

2

1

.

10

IC

10.2

7

9.9

3

Intervalo de confianza

lim. superior lim. inferior 10.1 0.17 0.17 0.34 Rango de confianza

(10)

37

?

n

ppb

6

.

0

s

ppb

1

.

10

x

n

s

t

x

IC

Tamaño de la muestra

10.1 0.1 0.1 0.2

1

.

0

n

s

t

2

1

.

0

ts

n

2 2

10

4

.

1

144

1

.

0

6

.

0

2

n

 

LIMITES DE CONFIANZA

EN GENERAL_

EL TAMAÑO DE MUESTRA (

n

)

NECESARIO PARA ESTIMAR LA

PRECISION DENTRO DE ± C ES

38 2

C

ts

n

MAS SOBRE LA DISTRIBUCION NORMAL

EN GENERAL UNO ASUME QUE REPETIDAS DETERMINACIONES DE UN ANALITO SIGUEN UNA DISTRIBUCION NORMAL

LA ASUNCION NO ES DEL TODO GRATUITA:

 ESTUDIOS MATEMATICOS DE LA DISTRIBUCION NORMAL (AL MENOS POR 300 AÑOS) HAN MOSTRADO QUE EN SITUACIONES EN LAS QUE MUCHOS PEQUEÑOS ERRORES AFECTAN CADA MEDICION, EL ERROR TOTAL EN EL RESULTADO SIGUE SIEMPRE UNA DISTRIBUCION NORMAL

 MUCHOS CIENTIFICOS HAN ENCONTRADO UN GRAN NUMERO DE SITUACIONES EN LAS QUE MEDICIONES REPETIDAS SIGUEN UNA DISTRIBUCION NORMAL

39

USO DE LAS “COLAS“ DE

UNA DISTRIBUCION NORMAL DE ERROR

HAY SITUACIONES EN LAS QUE ES IMPORTANTE

DETERMINAR LA FRECUENCIA CON LA CUAL

CIERTOS RESULTADOS EXTREMOS PODRIAN

OCURRIR EN UNO DE LOS LADOS DE LA CURVA

NORMAL DE ERROR:

TIPICAMENTE, EL ANALISTA DEBE ASEGURARSE

QUE NO MAS QUE UN PEQUEÑO PORCENTAJE DE

LAS MUESTRAS SEA MAYOR O MENOR QUE

ALGUN VALOR LIMITE PREDETERMINADO

(11)

USO DE LAS “COLAS“ DE

UNA DISTRIBUCION NORMAL DE ERROR

RETOMEMOS LAS DETERMINACIONES DE LA

CONCENTRACIÓN (ppm) DE IÓN NITRATO EN UNA MUESTRA DE AGUA

MEDIA= 0.500 ppm DESV. ESTD. = 0.0165 ppm

SUPONGAMOS QUE DESEAMOS ESTIMAR EL PORCENTAJE DE DETERMINACIONES QUE EXCEDE 0.53 ppm

41

QUE PORCENTAJE DE LAS DETERMINACIONES EXCEDE 0.53?

“COLAS“ DE LA DISTRIBUCION NORMAL

EL PORCENTAJE REQUERIDO PUEDE OBTENERSE DE LA

TABLA DE DISTRIBUCION NORMAL “ESTANDAR” (VIDE INFRA), PERO PARA USAR ESTA TABLA DEBEMOS PRIMERO ESTANDARIZAR EL VALOR (0.53) EN EL QUE ESTAMOS

INTERESADOS.

ESTO SE HACE EN TERMINOS DE

z

, LA DESVIACION DEL

VALOR CON RESPECTO A LA MEDIA, EXPRESADA EN

UNIDADES DE DESVIACION ESTANDAR, ES DECIR :

42

s

x

x

x

z

lim

s

1

.

818

0165

.

0

50

.

0

53

.

0

“COLAS“ DE DISTRIBUCION NORMAL

RECUERDE QUE ESTE VALOR DE

z

NOS DICE

QUE EL VALOR (0.53) ESTA 1.818

DESVIACIONES ESTANDAR POR ENCIMA

DE LA MEDIA (0.50)

43

818

.

1

z

USANDO EL VALOR DE

z

Y LA TABLA DE

DISTRIBUCION NORMAL ESTANDAR, VEMOS

QUE APROXIMADAMENTE 3.45% DE LAS

DETERMINACIONES EXCEDEN 0.53 ppm

TABLA DE DISTRIBUCION NORMAL ESTANDAR Standardized value = (value – mean)/SD

44 S ta nd ar di ze d va lu e % e xc ee di ng th e va lu e S ta nd ar di ze d va lu e % e xc ee di ng th e va lu e S ta nd ar di ze d va lu e % e xc ee di ng th e va lu e S ta nd ar di ze d va lu e % e xc ee di ng th e va lu e S ta nd ar di ze d va lu e % e xc ee di ng th e va lu e S ta nd ar di ze d va lu e % e xc ee di ng th e va lu e S ta nd ar di ze d va lu e % e xc ee di ng th e va lu e 0.000 50.0 0.842 20.0 1.645 5.0 2.054 2.00 2.575 0.50 2.877 0.200 3.287 0.050 0.025 49.0 0.860 19.5 1.655 4.9 2.0641.95 2.582 0.49 2.885 0.195 3.317 0.045 0.050 48.0 0.878 19.0 1.664 4.8 2.0751.90 2.589 0.48 2.893 0.190 3.349 0.040 0.075 47.0 0.896 18.5 1.675 4.7 2.0861.85 2.597 0.47 2.901 0.185 3.385 0.035 0.101 46.0 0.915 18.0 1.685 4.6 2.0971.80 2.604 0.46 2.910 0.180 3.427 0.030 0.126 45.0 0.935 17.5 1.695 4.5 2.1081.75 2.612 0.45 2.919 0.175 3.476 0.025 0.151 44.0 0.954 17.0 1.706 4.4 2.1201.70 2.619 0.44 2.928 0.170 3.534 0.020 0.176 43.0 0.974 16.5 1.717 4.3 2.1321.65 2.627 0.43 2.937 0.165 3.607 0.015 0.202 42.0 0.994 16.0 1.728 4.2 2.1441.60 2.635 0.42 2.946 0.160 3.707 0.010 0.228 41.0 1.015 15.5 1.739 4.1 2.1571.55 2.643 0.41 2.956 0.155 3.869 0.005 0.253 40.0 1.036 15.0 1.751 4.0 2.1701.50 2.652 0.40 2.966 0.150 0.279 39.0 1.058 14.5 1.762 3.9 2.1831.45 2.660 0.39 2.977 0.145 0.305 38.0 1.080 14.0 1.774 3.8 2.1971.40 2.669 0.38 2.987 0.140 0.332 37.0 1.103 13.5 1.786 3.7 2.2111.35 2.678 0.37 2.998 0.135 0.358 36.0 1.126 13.0 1.799 3.6 2.2261.30 2.687 0.36 3.010 0.130 0.385 35.0 1.150 12.5 1.812 3.5 2.2411.25 2.696 0.35 3.022 0.125 0.412 34.0 1.175 12.0 1.825 3.4 2.2571.20 2.706 0.34 3.034 0.120 0.440 33.0 1.200 11.5 1.838 3.3 2.2731.15 2.716 0.33 3.047 0.115 0.468 32.0 1.226 11.0 1.852 3.2 2.2901.10 2.726 0.32 3.060 0.110 0.496 31.0 1.254 10.5 1.866 3.1 2.3081.05 2.736 0.31 3.074 0.105 0.524 30.0 1.282 10.0 1.881 3.0 2.3261.00 2.747 0.30 3.089 0.100 0.553 29.0 1.311 9.5 1.896 2.9 2.3450.95 2.758 0.29 3.104 0.095 0.583 28.0 1.341 9.0 1.911 2.8 2.3650.90 2.770 0.28 3.120 0.090 0.613 27.0 1.372 8.5 1.927 2.7 2.3860.85 2.781 0.27 3.136 0.085 0.643 26.0 1.405 8.0 1.943 2.6 2.4090.80 2.794 0.26 3.154 0.080 0.674 25.0 1.439 7.5 1.960 2.5 2.4320.75 2.806 0.25 3.172 0.075 0.706 24.0 1.476 7.0 1.977 2.4 2.4570.70 2.819 0.24 3.192 0.070 0.739 23.0 1.514 6.5 1.995 2.3 2.4830.65 2.833 0.23 3.214 0.065 0.772 22.0 1.555 6.0 2.014 2.2 2.5120.60 2.847 0.22 3.237 0.060 0.806 21.0 1.598 5.5 2.033 2.1 2.5420.55 2.862 0.21 3.261 0.055

(12)

“COLAS“ DE DISTRIBUCION NORMAL

LA TABLA DE DISTRIBUCION NORMAL ESTANDAR

TAMBIEN PUEDE USARSE “EN REVERSA”:

QUE VALOR ES PROBABLE DE SER EXCEDIDO POR

EL 10% DE LAS DETERMINACIONES MAS ALTAS?

45

QUE VALOR ES EXCEDIDO POR EL 10% DE LAS DETERMINACIONES?

“COLAS“ DE DISTRIBUCION NORMAL

LOCALIZANDO EL 10% EN LA COLUMNA DE LA

DERECHA DE LA TABLA DE DISTRIBUCION

NORMAL ESTANDAR, OBTENEMOS UN VALOR, z,

DE 1.282, DEL CUAL SE PUEDE OBTENER EL VALOR

DESCONOCIDO:

46

CONCLUIMOS QUE EL 10% MAS ALTO DE LAS

DETERMINACIONES EXCEDE 0.52 ppm

0165

.

0

50

.

0

x

282

.

1

lim

52

.

0

0165

.

0

282

.

1

50

.

0

x

lim

EJERCICIO DE TALLER

EL OCTANAJE DE LA GASOLINA SE PUEDE INCREMENTAR MEDIANTE LA ADICION DE TETRAETILO DE PLOMO (TEL,

TETRAETHYLLEAD), PERO EL LIMITE MAXIMO DE TEL PERMITIDO

ES 0.50 g/gal. SI MAXIMO EL 0.5% DE LAS MUESTRAS DE GASOLINA PUEDEN EXCEDER ESTE LIMITE Y LA DESVIACION ESTANDAR DEL CONTENIDO DE TEL EN LA COMPAÑIA AES sA= 0.05 g/gal, CUAL ES LA CONCENTRACIO MEDIA QUE ESTA COMPAÑIA PUEDE USAR EN SU GASOLINA?

LA COMPAÑIA BMANTIENE UN CONTROL MAS ESTRICTO EN SUS PROCEDIMIENTOS, DE TAL MANERA QUE sB= 0.01 g/gal. CUANTO

TEL PUEDE AÑADIR EN PROMEDIO ESTA COMPAÑIA?

(13)

PRUEBAS DE SIGNIFICACION

TAMBIEN LLAMADAS

PRUEBAS DE HIPOTESIS (NULA)

UN PROCEDIMIENTO SISTEMATICO QUE NOS PERMITE

DECIDIR SI UN CONJUNTO DE MEDICIONES REPETIDAS

MUESTRA EVIDENCIA DE ERROR SISTEMATICO

49

EL PROPOSITO DE UNA PRUEBA DE SIGNIFICACION ES

SACAR UNA CONCLUSION ACERCA DE UNA POBLACION

UTILIZANDO DATOS PROVENIENTES DE UNA MUESTRA

PRUEBAS DE SIGNIFICACION

EJEMPLO: (Analyst 1983, 108, 64)

EN UN METODO PARA DETERMINAR PLOMO EN SANGRE POR ABSORCION ATOMICA SE OBTUVIERON LOS SIGUIENTES VALORES PARA UNA MUESTRA STANDARD QUE CONTIENE

38.9 ppb DE PLOMO:

50

ppb

x

37

.

80

s

0

.

964

ppb

38.9 37.4 37.1

EXISTE ALGUNA EVIDENCIA DE ERROR SISTEMATICO?

LA CUESTION ES SI LA DIFERENCIA ENTRE EL RESULTADO Y EL VALOR REAL ES ESTADISTICAMENTE SIGNIFICATIVA, O SI SE DEBE A MERAS VARIACIONES FORTUITAS (AL AZAR)

SE SIGUE UN PROCEDIMIENTO DE 6 PASOS

PASO 1:

HIPOTESIS “NULA” ( H

0

) : EL RESULTADO NO ES

INEXACTO

OJO: UNO NO SABE SI ESTA DECLARACION ES

CIERTA O ES FALSA, PERO SERA ASUMIDA

CIERTA HASTA QUE SE PRUEBE QUE ES FALSA

PASO 2:

HIPOTESIS ALTERNA ( H

1

) : EL RESULTADO ES

INEXACTO

51

PROCEDIMIENTO DE SEIS PASOS

PASO 3:

PRUEBA ESTADISTICA

OJO: ESTE PASO CONDENSA LA INFORMACION DE LA

MUESTRA EN UN SIMPLE NUMERO

52

s

n

x

t

calc

98

.

1

964

.

0

3

9

.

38

8

.

37

calc

t

(14)

PASO 4:

VALORES CRITICOS : COMPARE EL RESULTADO DE LA

PRUEBA ESTADISTICA (

t

calc) CON VALORES TEORICOS TABULADOS

t

crit

= 4.3 (P = 95%, f = 2)

SI

t

calc EXCEDE EL VALOR CRITICO, LA HIPOTESIS NULA SE RECHAZA.

LOS VALORES CRITICOS PUEDEN INTEPRETARSE COMO

VALORES QUE SON IMPROBABLES* QUE SEAN EXCEDIDOS POR LA PRUEBA ESTADISTICA (tcalc) SI LA HIPOTESIS NULA ES CIERTA

* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES MENOR DE 5% (ES DECIR, MENOS QUE 1 EN 20)

53

PASO 5:

DECISION: RETENEMOS LA HIPOTESIS NULA

PASO 6:

CONCLUSION: HEMOS SIDO INCAPACES DE PROBAR QUE EL

RESULTADO ES INEXACTO

54

NOTA IMPORTANTISIMA:

LA DECISION DE RETENER LA HIPOTESIS NULA NO

SIGNIFICA QUE SE HA DEMOSTRADO QUE ES CIERTA;

SIMPLEMENTE, NO SE PUDO DEMOSTRAR QUE SEA FALSA

VALORES CRITICOS PARA LA PRUEBA

t

55

LA HIPOTESIS NULA SE USA

(O SE DEBERIA USAR)

EN LAS CORTES CRIMINALES:

EL ACUSADO SE ASUME “NO CULPABLE”

HASTA QUE SE DEMUESTRE QUE ES CULPABLE

56

VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL

LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA QUE LA HIPOTESIS NULA DEBE CONSERVARSE

CONCLUSION:

NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE...

(15)

PRUEBAS DE SIGNIFICACION

ENFASIS SOBRE LO IMPORTANTE

H0ES UNA DECLARACION DE QUE “NO HAY

DIFERENCIA”, ES DECIR, QUE CUALQUIER DIFERENCIA

OBSERVADA ES DEBIDA SOLO AL AZAR

H0ES LA HIPOTESIS QUE EL INVESTIGADOR ESPERA

RETENER

EL UMBRAL DE ERROR,

(= 1-P)

, ES EL RIESGO (LA PROBABILIDAD) QUE EL INVESTIGADOR ESTA

DISPUESTO A TOMAR SI RECHAZARA INCORRECTAMENTE LA H0VERDADERA

57

COMPARACION DE LAS MEDIAS DE

DOS MUESTRAS

SE QUIEREN COMPARAR LOS RESULTADOS DE UN

NUEVO METODO ANALITICO CON AQUELLOS

OBTENIDOS POR UN SEGUNDO METODO

(REFERENCIA)

58

CONOCIDOS:

2 1 2 1 2 1

&

&

&

n

n

s

s

x

x

COMPARACION DE DOS MEDIAS

CASO I:

s

1Y

s

2NO SON SIGNIFICATIVAMENTE DIFERENTES

H

0: LOS DOS METODOS NO PRODUCEN RESULTADOS DIFERENTES

PRUEBA ESTADISTICA:

t

calcTIENE f1+ f2(O SEA, n1+n2-2) GRADOS DE LIBERTAD

59 2 1 2 1

1

1

n

n

s

x

x

t

calc

*

*

UN PROMEDIO PONDERADO CON 2 1 2 2 2 2 1 1 2

f

f

s

f

s

f

s

x

1NO

x

2

Y QUE ES UN PROMEDIO “PONDERADO”?

A CADA NUMERO

x

iEN EL CONJUNTO (

x

1

, x

2

, x

3

, …., x

n)

SE LE ASIGNA UN FACTOR DE PONDERACIONwi

EL PROMEDIO PONDERADO SE DEFINE COMO

NOTESE QUE SI TODOS LOS FACTORES DE PONDERACION FUERAN IGUALES EL PROMEDIO PONDERADO SE REDUCE AL PROMEDIO COMUN

60

 

n i i n i i i w

w

x

w

x

1 1

(16)

CASO II:

s

1Y

s

2SON SIGNIFICATIVAMENTE DIFERENTES

H

0: LOS DOS METODOS NO PRODUCEN RESULTADOS DIFERENTES

PRUEBA ESTADISTICA: 61 2 2 2 1 2 1 2 1

n

s

n

s

x

x

t

calc

2 1 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1                         n n s n n s n s n s f REDONDEADO AL ENTERO MAS CERCANO

COMPARACION DE DOS MEDIAS

x

1NO

x

2

CON

CUANDO SE USE LA PRUEBA

t

...

s

1

=

s

2 ? 62 SI NO 2 1

f

f

f

CASO I CASO II

USE LA PRUEBA F PARA RESOLVER ESTE CONDICIONAL 2 2 2 1 2 1 2 1 n s n s x x tcalc    2 1 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1                         n n s n n s n s n s f 2 1 2 1 1 1 n n s x x tcalc    2 1 2 2 2 2 1 1 2

f

f

s

f

s

f

s

2 1 2 1 2 1 n n s vs s x x EJEMPLO (CASO I)

COMPARACION DE DOS METODOS PARA LA DETERMINACION DE BORO EN MATERIAL VEGETAL

63

PRUEBAS DE SIGNIFICACION

Resultados obtenidos (ppm) media desv std n

MET. ESPECTROFOTOMETRICO 28.00 0.30 10 MET. FLUORIMETRICO 26.25 0.23 8

SON LOS RESULTADOS DE ESTOS DOS METODOS SIGNIFICATIVAMENTE DIFERENTES? (Analyst 1983, 108, 368)

64 Subindices: E: Espectrofotométrico F: Fluorimétrico

9

1

10

1

n

f

10

n

ppm

30

.

0

s

ppm

00

.

28

x

E E E E E

7

1

8

1

n

f

8

n

ppm

23

.

0

s

ppm

65

.

26

x

F F F F F

CASO I :

s

E NO

s

F

F E 0

:

x

NO

x

H

H

1

:

x

E

x

F F E F E ca lc

n

1

n

1

s

x

x

t

F E 2 F F 2 E E 2

f

f

s

f

s

f

s

(17)

65

271604

.

0

7

9

23

.

0

7

30

.

0

9

s

2 2

58

.

13

8

1

10

1

2716

.

0

25

.

26

00

.

28

n

1

n

1

s

x

x

t

F E F E calc

16

7

9

f

f

f

E

F

tcrit(16 GdL, 95%) = 2.12 tcrit(16 GdL, 99%) = 2.92

t

calc

(13.58) > t

crit

(2.12) ? SI (aun por encima del 99%)

66

DECISION: Se rechaza H

0

x

E

NO

x

F

Se retiene H

1

x

E

x

F

CONCLUSION: SI, LOS RESULTADOS DE ESTOS

DOS METODOS SON SIGNIFICATIVAMENTE

DIFERENTES

PRUEBAS DE SIGNIFICACION

EJEMPLO (CASO II)

LA SIGUIENTE TABLA PROPORCIONA LA CONCENTRACION DE TIOL EN SANGRE DE DOS GRUPOS DE VOLUNTARIOS. EL PRIMER GRUPO ES “NORMAL” Y EL SEGUNDO SUFRE DE ARTRITIS REUMATOIDE. (Analyst, 1983, 107,195) Concentración de tiol (mM) 67 Normal Reumatoide 1.84 2.81 1.92 4.06 1.94 3.62 1.92 3.27 1.85 3.27 1.91 3.76 2.07 ES LA CONCENTRACION DE TIOL EN LA SANGRE DE LOS ENFERMOS DE ARTRITIS REUMATOIDE DIFERENTE DE AQUELLA DE LOS INDIVIDUOS “NORMALES”?

68 Subindices: N: Normal R: Reumatoide

7

n

mM

07559

.

0

s

mM

9214

.

1

x

N N N

CASO II :

s

N

s

R

6

n

mM

4404

.

0

s

mM

465

.

3

x

R R R

R N 0

:

x

NO

x

H

H

1

:

x

N

x

R 47 . 8 6 440 . 0 7 0755 . 0 645 . 3 921 . 1 n s n s x x t 2 2 R 2 R N 2 N R N calc          

(18)

69 5 2 1 6 6 440 . 0 1 7 7 0755 . 0 6 440 . 0 7 0755 . 0 2 1 n n s 1 n n s n s n s f 2 2 2 2 2 2 2 R 2 R 2 R N 2 N 2 N 2 R 2 R N 2 N                                                   

tcrit(5 GdL, 95%) = 2.57 tcrit(5 GdL, 99%) = 4.06

t

calc

(8.47) > t

crit

(2.57) ?

SI (aun por encima del 99%)

DECISION: Se rechaza H0

xNNOxR

Se retiene H1

x

N

x

R

CONCLUSION: SI, LA CONCENTRACION DE TIOL EN LA SANGRE

DE LOS ENFERMOS DE ARTRITIS REUMATOIDE ES DIFERENTE DE AQUELLA DE LOS INDIVIDUOS “NORMALES”

LA PRUEBA

t

POR PAREJAS

CIRCUNSTANCIAS EN LAS CUALES ES NECESARIO O DESEABLE HACER UNA COMPARACION DE MEDIAS POR PAREJAS:

CANTIDAD LIMITADA DE UNA O MAS MUESTRAS (SOLO HAY MUESTRA SUFICIENTE PARA UNA DETERMINACION POR CADA METODO)

MUESTRAS DE ORIGENES DIFERENTES Y POSIBLEMENTE CON CONCENTRACIONES DIFERENTES*

MUESTRAS QUE SE RECIBEN EN UN PERIODO DE TIEMPO LARGO (SE HACE NECESARIO ELIMINAR EFECTOS DE CONDICIONES AMBIENTALES VARIABLES COMO TEMPERATURA, PRESION, ETC.)

ASUNCION: CUALQUIER ERROR (SISTEMATICO O AL AZAR) ES

INDEPENDIENTE DE LA CONCENTRACION

* EN CASO DE DIFERENCIAS DE CONCENTRACION MUY AMPLIAS ES MEJOR USAR ANALISIS DE

REGRESION (VER LUEGO)

70

EJEMPLO DE PRUEBA

t

POR PAREJAS

LA SIGUIENTE TABLA PROPORCIONA LA CONCENTRACION DE PLOMO (g/mL) POR DOS METODOS DIFERENTES PARA 4 MUESTRAS:

71 LOS DOS METODOS PROPORCIONAN VALORES PARA LAS CONCENTRACIONES MEDIAS DE PLOMO QUE DIFIEREN SIGNIFICATIVAMENTE? MUESTRA EXTRACCION OXIDATIVA EXTRACCION DIRECTA 1 71 76 2 61 68 3 50 48 4 60 57 DIF -5 -7 +2 +3 72

0

NO

x

:

H

0 DIF

0

x

:

H

0 DIF

0

.

70

991

.

4

4

75

.

1

s

n

x

s

n

0

x

t

DIF DIF DIF DIF DIF DIF calc

3

1

4

1

n

f

4

n

991

.

4

s

75

.

1

x

DIF E DIF DIF DIF

tcrit(3 GdL, 95%) = 3.18

DECISION: Se retiene H0

xDIFNO0

tcalc(0.70) > tcrit(3.18) ? NO

No, los dos métodos no proporcionan valores para las concentraciones medias de plomo que difieren significativamente

(19)

PRUEBA F

PARA LA COMPARACION DE DESVIACIONES STANDARD

UTIL PARA COMPARAR LA PRECISION DE

DIFERENTES METODOS

LA PRUEBA F CONSIDERA EL COCIENTE DE LAS DOS

VARIANZAS MUESTRALES*

(SIEMPRE, VARIANZA MAYOR / VARIANZA MENOR):

73 2 2 2 1

s

s

F

calc

*

SE ASUME QUE LAS POBLACIONES DE DONDE SE TOMAN LAS MUESTRAS SON NORMALES

2 1

s

s

PRUEBA F

PARA LA COMPARACION DE DESVIACIONES STANDARD

74

H

0

:

LAS DESVIACIONES ESTANDAR DE LAS POBLACIONES NO SON DIFERENTES

(

ES DECIR, EL COCIENTE DE VARIANZAS NO DIFIERE SIGNIFICATIVAMENTE DE LA UNIDAD

)

EVALUACION:

RECHAZAR LA HIPOTESIS NULA SI Fcalc> Fcrit

s

1NO

s

2

PRUEBA F

* 2 FORMAS 2 *

PRUEBA DE UNA COLA (UNILATERAL):

PRUEBA SI UN METODO A ES MAS PRECISO QUE

UN METODO B

OJO:

UNO ESTA INTERESADO EN DETECTAR LA DIFERENCIA

EN UNA SOLA DIRECCION

PRUEBA DE DOS COLAS (BILATERAL):

PRUEBA SI LOS METODOS A Y B DIFIEREN EN SU

PRECISION

OJO:

UNO ESTA INTERESADO EN DETECTAR CUALQUIER DIFERENCIA EN CUALQUIER DIRECCION

(20)

PRUEBA F - EJEMPLOS

UNA COLA:

SE COMPARO UN METODO PROPUESTO PARA LA DETERMINACION DE DE LA DEMANDA DE OXIGENO EN AGUAS RESIDUALES CON UN METODO STANDARD. SE OBTUVIERON LOS SIGUIENTES RESULTADOS (ppm) EN UNA MUESTRA:

77 METODO media desv std n

STANDARD 72 3.31 9 PROPUESTO 72 1.51 8

ES EL METODO PROPUESTO MAS PRECISO QUE EL METODO ESTANDAR?

78 Subindices: S: Standard P: Propuesto

8

1

9

1

n

f

9

n

ppm

31

.

3

s

S S S S

7

1

8

1

n

f

8

n

ppm

51

.

1

s

F P P P

S P 0

:

s

NO

s

H

S P 1

:

s

s

H

2 P 2 S calc

s

s

F

8 GdL 7 GdL

81

.

4

51

.

1

31

.

3

2 2

79

Fcrit(8/7, 95%) = 3.73

F

calc

(4.81) > F

crit

(3.73) ? SI

DECISION: Se rechaza H0

sPNOsS

CONCLUSION: EL METODO PROPUESTO ES MAS PRECISO QUE

EL METODO ESTANDAR

Se retiene H1

sPsS

PRUEBA F - EJEMPLOS

DOS COLAS:

DATOS ANTERIORES DE BORO EN MATERIAL VEGETAL

80 METODO media desv std n

ESPECTROFOTOMETRICO 28.00 0.30 10 FLUORIMETRICO 26.25 0.23 8

CHEQUEAR LA ASUNCION DE QUE LAS DOS VARIANZAS NO DIFIEREN SIGNIFICATIVAMENTE

(21)

81 Subindices: E: Espectrofotométrico F: Fluorimétrico

9

1

10

1

n

f

10

n

ppm

30

.

0

s

E E E E

7

1

8

1

n

f

8

n

ppm

23

.

0

s

F F F F

CASO I :

s

E NO

s

F

F E 0

:

s

NO

s

H

H

1

:

s

E

s

F

70

.

1

23

.

0

30

.

0

s

s

F

2 2 2 F 2 E calc

VERIFICAR QUE ESTO ES CIERTO

82

Fcrit(9/7, 95%) = 4.82

F

calc

(1.70) > F

crit

(4.82) ? NO

DECISION: Se retiene H0

sENOsF

CONCLUSION: SE CONFIRMA LA ASUNCION DE QUE LAS DOS

VARIANZAS NO DIFIEREN SIGNIFICATIVAMENTE

EXISTE UNA PEQUEÑA PROBABILIDAD DE QUE HAYAMOS TOMADO UNA MALA DECISION

(DOS POSIBLES ERRORES EN PRUEBAS DE SIGNIFICACION)

83

DECISION

______________________________ RECHACE LA NO RECHACE LA

HIPOTESIS NULA Y HIPOTESIS NULA Y CONCLUYA QUE NO CONCLUYA QUE

EL RESULTADO ES EL RESULTADO ES

REALIDAD INEXACTO INEXACTO ______________________________________________ HIPOTESIS NULA SE TOMO LA ERROR DEL ES FALSA; ES DECIR, DECISION CORRECTA TIPO II EL RESULTADO ES

INEXACTO

HIPOTESIS NULA ERROR DEL SE TOMO LA ES CIERTA; ES DECIR, TIPO I DECISION CORRECTA EL RESULTADO NO ES INEXACTO

EJERCICIO DE TALLER

Una de sus amigas se ha metido en el negocio de fabricar vinos.

En una fiesta de catadores de vino ella le dijo a usted que estaba

segura que un cierto restaurante estaba etiquetando el vino de ella

como si fuera importado y que estaba cobrando precios

exhorbitantes. Usted le respondió que estaba tomando el curso de

Estadística en Univalle y que si ella le proporcionaba unas cuantas

botellas, usted podría determinar si los dos vinos eran el mismo.

(Durante una de esas fiestas, uno dice casi cualquier cosa).

Cual es su conclusión, con base en los siguientes resultados de

contenido (%v/v) de alcohol?

•Vino de su amiga:

12.50, 12.34, 12.38, 12.33, 12.28, 12.41

•Vino del restaurante: 12.49, 12.62, 12.69, 12.64

(22)

EJERCICIO DE TALLER

85

Cuando se hacen mediciones por replicado, a veces un resultado parece diferir sustancialmente de los demás. Una prueba de significación llamada “prueba-Q” o “prueba de Dixon” puede utilizarse para chequear si el valor “sospechoso” puede descartarse antes de calcular la media y la desviación estándar. Para aplicar esta prueba, se calcula un cociente de

rechazo Q, definido como

resultado sospechoso - resultado más próximo

rango de resultados

y se ve si excede el valor crítico apropiado en la tabla estadística de cocientes, que aparece en la página siguiente.

Si Qcalc.> Qcrit., el resultado sospechoso puede descartarse. Aplicar la prueba-Q a los siguientes datos del contenido de estronsio (g/mL) en una muestra, para ver si el valor sospechoso puede o no descartarse: 1.15, 1.02. 1.10, y 1.88.

Q

Figure

Actualización...

Referencias

Actualización...

Related subjects :