Elementos de decisión estadística en Bachillerato :: Números: revista de Didáctica de las Matemáticas

(1)

(2)

-·

32 ELEMENTOS DE DECISIÓN ESTADÍSTICA EN BACHIUERATO

En estos términos podemos considerar los siguientes ejemplos:

Ejemplo 1: Tablas d que se esta contrato, pe Puede optar

e decisión: Un empresario tiene un taller de serigrafía en el mpan camisetas publicitarias. En este momento opta a un ro una de las máquinas necesarias se encuentra estropeada. por repararla o cambiarla por una nueva más eficiente. Tras realizar un estudio de los posibles beneficios y pérdidas, la situación es la siguiente

A: Repara la maquinaria

B: Compra maquinaria nueva

Obtiene

el contrato

400.000 pts 700.000 pts

No obtiene

el contrato -10.000 pts -80.000 pts

El cono cimiento que del negocio tiene el empresario le permite forma subjetiva) una probabilidad del 20% al suceso contrato», con lo que si designamos X = "posibles ganan-emos para las opciones A y B:

asignar (de «Obtener el cias", tendr

X.= Posibles ganancias 400.000 -10.000

P(X) 20/100 80/100

Xe= Posibles ganancias 700.000 -80.000

P(X) 20/100 80/100

Calcula µ8=76.000.

ndo las ganancias esperadas, tendremos: µA=72.000, Dado que la opción A tiene una esperanza de ganancias a B, el empresario elegirá la opción B.

menor que 1 Ejemplo2:

Laesper anza de vida de un paciente de cáncer es de 6 años. Si se opera ón tiene éxito, su esperanza de vida es de 15 años, pero hay lidad de 1/3 de quedarse igual que antes de la operación, y o, una probabilidad p de morir en ella. ¿qué valores debería y la operaci

una probabi por otro lad

(3)

JOSÉ MIGUEL RODRÍGUEZ MORALES 33

Llamamos X= "nº de años que puede vivir el paciente", que podrá tomar los valores O (si muere en la operación, 6 (si no resulta efectiva), ó 15 (si todo sale bien). La probabilidad respectiva de cada valor es p,

1/3 y 1- (1/3 + p).

Para que la operación sea deseable, la esperanza de la variable X, ha de ser como mínimo mayor que 6, que es la esperanza si no se realiza la operación. Por tanto:

µ

=

0 X p + 6 X

i

+ 15 X [ 1 - (

i

+ p)]

=

12 - 15p

~

₆

para lo cual ha de ser : p ~ 0,4 .

Ejemplo 3:

En unas negociaciones sindicales correspondientes al sector turísti-co, la patronal alega que en un establecimiento tipo de 40 empleados, la suma de los sueldos mensuales pagados por el empresario supera los 5.000.000 de pesetas y que tal cantidad de gasto en sueldos impide que durante este año haya subidas salariales.

Los sindicatos, que no terminan de creerse las cifras de la patronal, piden la mediación en el conflicto de un representante de la ad ministra-ción. Este representante, a partir de las cifras oficiales según las cuales, en el sector la media de sueldos es de 120.000 pesetas con una desviación típica de 10.000 pesetas decide dar la razón a los sindicatos utilizando los siguientes argumentos:

Si la patronal tuviera razón, para establecimientos de 40 empleados la

media superaría las 5·00₄

°

₀

°

00 = 125.000 pts, pero de los datos oficiales,

y haciendo uso del Teorema Central del Límite, las medias de muestras de tamaño 40, siguen la distribución:

(4)

34 U.l:Ml:NTOS l>I:" l>l:"CISWN l:S"/iWÍSTIC\ U\I liAClllU.l:Ri\fU

y por tanto la probabilidad de que sea cierto lo alegado por la patronal

es:

p(X > 125.000)

=

p(z

> 12500

1

°

5

~;º·ººº)= p(Z > 3,16) ::::

o

Formulación

de hipótesis-naturaleza del

ensayo

de hipótesis

Aunque se pueden considerar como decisiones los ejemplos

anterio-res, en general en estadística las decisiones se toman sobre unas

determinadas hipótesis.

Así por ejemplo, se tratará de tomar decisiones acerca de hipótesis tales como si un nuevo proceso de producción es más eficiente que uno anterior, o si la proporción de personas favorables al divorcio ha aumentado, si un medicamento nuevo es más efectivo, o cuál de dos sistemas de aprendizaje es mejor. Tales hipótesis se expresan siempre en

función de un parámetro estadístico. Así la hipótesis de que una moneda no está cargada se expresaría como p = 0'5 (p =proporción de caras en

una serie de lanzamientos).

Pero no se puede estudiar directamente la hipótesis que entra en juego, sino que se trata el problema de forma indirecta. Lo equivalente a confirmar una hipótesis dada, es negar o rechazar su alternativa lógica.

Para poder decidir sobre una hipótesis (que normalmente establecerá que existe una tendencia o relación en la población), examinamos la contraria a la que se denomina hipótesis nula (que establecerá que no

existe tal tendencia o relación). En cada proceso de decisión, habrán

de establecerse la hipótesis nula o hipótesis de partida H₀(que es la

que se contrastará), y la hipótesis alternativa H, (sobre la que se

quiere decidir) complementaria de la anterior.

Para entender mejor el proceso, suele establecerse un paralelismo

entre el contraste de hipótesis y el juicio a una persona. No se puede

iniciar un proceso judicial tratando de demostrar la inocencia de una persona (inocencia que estaría representada por la hipótesis nula). Tal inocencia se presupone. Lo que se hace en un juicio, es partir de la

inocencia, y a la luz de la o las pruebas , rechazar o no la presunción,

(5)

JOSÉ MIGUEL RODRfGUEZ MORALES 35 Tomaremos pues como cierta la hipótesis nula, y la mantendremos hasta que no se demuestre lo contrario, es decir hasta que en un juicio se nos haga comprender la incompatibilidad de dicha hipótesis con las pruebas presentadas, de forma que tengamos evidencias suficientes para aceptar lo establecido en la hipótesis alternativa.

Esquemas de decisión

Dado que "la ausencia de evidencia no implica evidencia de ausen-cia", si las pruebas presentadas no son evidencia suficiente a favor de la hipótesis alternativa, en principio, el no rechazo de la hipótesis nula no tendría porqué llevar aparejado la aceptación de lo establecido por dicha hipótesis.

En general, las hipótesis nulas se establecen con el ánimo de rechazarlas. Cuando tras obtener unos resultados muestrales que nos hacen formular una hipótesis de que "en la población total existe una determinada relación" formularemos una hipótesis nula en el sentido de que "no existe tal relación en la población", es decir que los resultados obtenidos en la muestra son debidos al azar y no a lo postulado por la hipótesis alternativa. A partir de aquí, lo que interesa es saber si podemos aceptar o no (con una probabilidad de error

a

llamada nivel de significación), la hipótesis alternativa.

Cuando el esquema es el descrito anteriormente, el esquema de trabajo que adoptamos es:

ESQUEMA 1

Hipótesis Acción Decisión Redacción de la conclusión Riesgo de partida

Se rechaza H₀ Se acepta H₁ Existen evidencias suficientes Nivel de

a un nivel de significación del significación

a % de que (significado de

la hipótesis H₁) a

Hº

No se Ninguna No existen evidencias No existe

rechaza H₀ suficientes a un nivel de riesgo

significación del a % de que

(6)

36 ELEMENTOS DE DECISIÓN ESTADÍSTICA EN BACHILLERATO

Existen sin embargo otros casos, en los que no es posible la

indefini-ción sobre lo establecido en la hipótesis nula. En estos casos, el test debe dar lugar siempre a una decisión: aceptar H₁o aceptar H₀• Se presentan las siguientes posibilidades:

H₀ES CIERTA H₀ES FALSA

No rechazamos H₀

(Aceptamos H₀) Decisión correcta ~ =Error tipo 11

Rechazamos H₀

(Aceptamos H₁)

a

=Error tipo 1 Decisión correcta

Es decir, el esquema de decisión en este caso es :

ESQUEMA2

Hipótesis de partida Acción Decisión Riesgo

Se rechaza H₀ Se acepta H, Error tipo 1

Ho

No se rechaza H₀ Se acepta H₀ Error tipo 11

Regla de decisión-prueba de contraste

Si ya están formuladas las hipótesis,¿ bajo que condiciones podrá ser rechazada la hipótesis nula?. O lo que es lo mismo, ¿cuando

considera-remos que tenemos evidencias suficientes de la hipótesis alternativa?. Éste es el momento de elegir la regla de decisión, es decir, establecer un

criterio que permita rechazar o no la hipótesis nula.

Por lo general , una prueba o regla de decisión para contrastar

una hipótesis consiste en un suceso o resultado experimental S, cuya

posibilidad de ocurrencia sea muy pequeña siendo cierta la

hipóte-sis H₀, es decir:

p(S/H_{0 )}=a (Nivel de significación)

Si ocurre el suceso S, rechazaremos la hipótesis H0, y no lo

(7)

JOSt MIGUEL RODRÍGUEZ MORALES 37

La justificación es simple: o bien la hipótesis es cierta y se ha producido un suceso de muy pequeña probabilidad, o bien la hipótesis

es falsa. Es como si hiciésemos una reducción al absurdo, sólo que la

contradicción con la hipótesis de partida no se establece de forma

absoluta, sino en términos de probabilidad.

Si ocurre S, parece pues natural que apostemos por la segunda opción y rechacemos la hipótesis H₀, haciéndonos cargo de que existe una

probabilidad

a

(es la probabilidad de que haya ocurrido S aún siendo

cierta H₀) de equivocarnos.

Veremos ahora algunos ejemplos que nos permitirán aclarar lo antes

expuesto:

Ejemplo 4:

Supongamos que a n personas se les mide la presión sanguínea bajo

el efecto de un medicamento y sin él. Sean las observaciones x_1,x_{2 , .}.. , xn e y 1, y 2 , .... , y n . Diremos que el i-ésimo ensayo es un éxito si x; >Y; y

fracaso si \< Y; (para tener mayor simplicidad supondremos que no hay dos medidas que lleven al mismo resultado). Si el medicamento no tiene

efecto sobre la presión, nuestras observaciones corresponden a una

B ( n; \/2). Un suceso S que sirva como señal de que el medicamento afecta a la presión, podría ser que el número de éxitos fuera superior a n/2 . Es evidente que cuanto mayor sea el número de éxitos exigidos por S menor

será el nivel de significación.

Ejemplo 5:

Un método para rehabilitar alcohólico se sabe por experiencia que es efectivo en el 80% de los casos de cierta enfermedad. Un nuevo método que está siendo ensayado, ha rehabilitado a 89 de 100 pacientes elegidos al azar. Imaginemos que queremos tomar una decisión sobre Ja eficacia

del nuevo método ( H₁: "El nuevo método es más efectivo que el

anterior" ). Establecemos que H₀= "El nuevo método es igual o menos efectivo que el anterior", y como suceso de prueba que S

=

"Al realizar

un muestreo, se obtiene al menos una efectividad del 89%".

En términos de parámetros, la efectividad del nuevo medicamento es

(8)

Si suponemos cierto H₀, el número X de éxitos (curaciones) en 100

intentos se distribuye según B(100;0'8), que es equivalente a N(80;4).

Pero en tal caso , la probabilidad de que ocurra S sería:

o:=

p(S ! H₀)

=

p(X ~ 89) = p(Z ~ 89

4

8

º)

=

p(Z ~ 2,25) = 0,0122"' 1,22%

1

Si establecemos un nivel de significación superior al 1 '22%, debere-mos rechazar H₀(y en consecuencia aceptar que es más efectivo el nuevo método) y no podremos hacerlo en otro caso.

Ejemplo 6:

Dos amigos Ay B,juegan acara o cruz con una moneda. Lanzan una moneda en 100 ocasiones, y A, que eligió cara, ha ganado en 62

ocasiones. Tras este resultado, B afirma que la moneda está trucada, de forma que la probabilidad de obtener cara es 2/3, mientras A mantiene que la moneda es correcta y el resultado es debido al azar. Se te encarga

dictaminar sobre cual de los dos tiene estadísticamente la razón. Ahora debemos aceptar obligatoriamente una de las dos hipótesis, es

decir, obrar de acuerdo al segundo esquema.

Establecemos las hipótesis:

Si X es el número de caras (éxitos) después de 100 intentos, su

distribución es una 8(100; ~) "'N(50;5) si es cierta H₀, y una 8(100;

%)

"'N(66;4'71) si es cierta H₁•

Supongamos cierta H0 .De la Fig. 1, establecemos S como un

intervalo de forma que

' Hemos supuesto una efectividad igual. Si supusiéramos que el nuevo medicamento

(9)

JOSÉ MIGUEL RODRIGUEZ MORALES 39

a= p(X ES/ H_{0 )}= 0,05

de donde obtenemos que dicho intervalo será de la forma (a,100) ,

siendo:

Ho: X es N(50;5) H,: X es N(66'6;4'71)

p( X > a / H₀)

=

0'05

Ho

50

+-a=58'2 66,6

~ s

H,

i=il o.= Error tipo 1 _ _ O p=Error tipo 11

Fig. 1

En la tabla de la normal tipificada, p(Z > l '65)

=

0'05 y por tanto

a

=

50 + 1,65 · 5

=

58.2 .

Puesto que el resultado muestra! es 62, podemos rechazar la hipótesis

nula y aceptar que la moneda tiene una probabilidad de cara de 2/3. Al tomar esta decisión nos equivocaremos en un 5% de los casos. (Error de tipo I o nivel de significación)

Si embargo si hubiéramos obtenido un resultado muestral de 57

caras, habríamos aceptado la hipótesis nula, y también tendríamos una

probabilidad de error, el de tipo II. Para calcular dicha probabilidad,

supongamos que H₁es cierta. El error se producirá cuando un resultado muestra! sea menor de 58'2 , pues entonces aceptaremos H₀ , y la

probabilidad de que ello ocurra es:

~

= p( X<a / H¡) = p(z < 58

· ~

;

~

6

•

6

)=

p(Z < -177)

=

0'0384"' 3'84%

Dado que muchos de los parámetros sobre los que se suele establecer

un contraste de hipótesis tienen una distribución normal , la regla de

decisión S queda determinada como en el ejemplo anterior, por una

región, denominada región crítica o de rechazo que quedará a la derecha, izquierda o ambos lados de la distribución muestra! del parámetro

(10)

40

Región

Crítica

Región

Critica r~ Región_Cr_ítica / ' Fig. 2

De esta forma, rechazaremos H₀cuando se verifique S, es decir el estadístico (parámetro muestra!) quede en esta región, y no lo haremos en caso contrario (Fig. 2).

Los errores

Podríamos decir en consecuencia que si queremos establecer una prueba para rechazar o no una hipótesis, deberemos de buscar un suceso

de muy baja probabilidad (cuanto más baja, más específica2 será la

prueba) bajo la suposición de veracidad de la hipótesis nula. Para poder rechazar que H

0 = "una moneda no está cargada", podríamos establecer S ="salen 65 o más caras al lanzarla 100 veces",

de forma que

a

=0, 13% , es decir la prueba dará un resultado erróneo

en sólo 13 de cada 1000 casos. Si S ="salen 70 o mas caras", es evidente

que la prueba sería más específica

Sin embargo, tal y como se puede observar en la Fig. 1 , en general

una disminución del riesgo

a

lleva aparejado un aumento del riesgo~. y cuanto mayor sea, en mayor número de casos se aceptará una falsa hipótesis nula, diciéndose en este caso que la potencia o sensibilidad del

test disminuye3 _•_{En casos como el ejemplo 5 y en}_mucho_s_otro_s_en

general, se podrán reducir ambos riesgos, si aumentamos el tamaño

muestra!, pues este aumento dará lugar a una menor variabilidad

muestra!.

Para ilustrar la importancia de cada uno de los errores, puede servir el siguiente texto, propuesto como ejemplo de comentario-inves tiga-ción para los alumnos

(11)

41

Los tests de consumo de drogas son pruebas analíticas, que permiten

establecer el consumo de drogas, aunque no se pueden considerar

definitivas.

Para poder entenderlo, empezaremos por definir, las posibles s

itua-ciones que se presentan que están descritas en el diagrama adjunto:

~Positivo

____. Consumidor - - - .

--- ~ Negativo

"d ____. No consum1 or

---.

Positivo Negativo

Decisión correcta

Falso negativo Falso positivo

Decisión correcta

Imagina por ejemplo un test que da positivo (es decir interpreta que

hay consumo de drogas) sobre el 99% de los consumidores de drogas.

Este 99% es la denominada sensibilidad del test, y significa que a un J %

de los consumidores, el test dará un denominado falso negativo.

Por otro lado, habrá casos en que no consumidores, den positivo en el test. Estos resultados se llaman falsos positivos.

Imaginemos que la probabilidad de que se tome la decisión correcta

con un no consumidor, a la que se denomina especificidad del test es del

98%.

A pesar de que al ser la sensibilidad y especificidad del test valores

muy grandes, se tenga la sensación de que es muy fiable, en la práctica,

si de las personas a las que se aplica, un 3% son consumidores,

aproximadamente el 40% de los positivos que detecte el test son.falsos

positivos.

Lo argumentado, resulta importante, por cuánto, este tipo de tests,

resultan de utili~ación cada ve~ más frecuente.

En Norteamérica, casi la mitad de las empresas realizan

habitual-mente tests sobre consumo de drogas a todos sus empleados. Por lo

argumentado antes, y teniendo en cuenta la gravedad de un error, se

debe de ser muy precavido con este tipo de tests

¿Cuáles son las hipótesis nula y alternativa formuladas? ¿Cuál es el nivel _{de significación¿ ¿Cuál el error}_{de tipo}_11._?

¿Cuál de ellos juzgas más importante, y porqué? ¿Cuál crees que

(12)

¿Podrías probar la aseveración de que "si de las personas a las que

se aplica, un 3% son consumidores, aproximadamente el 40% de los

positivos que detecte el test son falsos positivos".?

¿ Sabrías encontrar una forma de utilizar el test anterior para

reducir el riesgo que consideres más perjudicial ?

Bibliografía

SIXTO RÍOS : Métodos Estadísticos . Ediciones del Castillo (1970)

TRIOLA-FRANKLIN: Business Statistics. Addison Wesley (1994) ROBERT JOHNSON : Estadística Elemental - Grupo Editorial Iberoamérica (1990)

José Miguel Rodríguez Morales