-·
32 ELEMENTOS DE DECISIÓN ESTADÍSTICA EN BACHIUERATO
En estos términos podemos considerar los siguientes ejemplos:
Ejemplo 1: Tablas d que se esta contrato, pe Puede optar
e decisión: Un empresario tiene un taller de serigrafía en el mpan camisetas publicitarias. En este momento opta a un ro una de las máquinas necesarias se encuentra estropeada. por repararla o cambiarla por una nueva más eficiente. Tras realizar un estudio de los posibles beneficios y pérdidas, la situación es la siguiente
A: Repara la maquinaria
B: Compra maquinaria nueva
Obtiene
el contrato
400.000 pts 700.000 pts
No obtiene
el contrato -10.000 pts -80.000 pts
El cono cimiento que del negocio tiene el empresario le permite forma subjetiva) una probabilidad del 20% al suceso contrato», con lo que si designamos X = "posibles ganan-emos para las opciones A y B:
asignar (de «Obtener el cias", tendr
X.= Posibles ganancias 400.000 -10.000
P(X) 20/100 80/100
Xe= Posibles ganancias 700.000 -80.000
P(X) 20/100 80/100
Calcula µ8=76.000.
ndo las ganancias esperadas, tendremos: µA=72.000, Dado que la opción A tiene una esperanza de ganancias a B, el empresario elegirá la opción B.
menor que 1 Ejemplo2:
Laesper anza de vida de un paciente de cáncer es de 6 años. Si se opera ón tiene éxito, su esperanza de vida es de 15 años, pero hay lidad de 1/3 de quedarse igual que antes de la operación, y o, una probabilidad p de morir en ella. ¿qué valores debería y la operaci
una probabi por otro lad
JOSÉ MIGUEL RODRÍGUEZ MORALES 33
Llamamos X= "nº de años que puede vivir el paciente", que podrá tomar los valores O (si muere en la operación, 6 (si no resulta efectiva), ó 15 (si todo sale bien). La probabilidad respectiva de cada valor es p,
1/3 y 1- (1/3 + p).
Para que la operación sea deseable, la esperanza de la variable X, ha de ser como mínimo mayor que 6, que es la esperanza si no se realiza la operación. Por tanto:
µ
=
0 X p + 6 Xi
+ 15 X [ 1 - (i
+ p)]=
12 - 15p~
6para lo cual ha de ser : p ~ 0,4 .
Ejemplo 3:
En unas negociaciones sindicales correspondientes al sector turísti-co, la patronal alega que en un establecimiento tipo de 40 empleados, la suma de los sueldos mensuales pagados por el empresario supera los 5.000.000 de pesetas y que tal cantidad de gasto en sueldos impide que durante este año haya subidas salariales.
Los sindicatos, que no terminan de creerse las cifras de la patronal, piden la mediación en el conflicto de un representante de la ad ministra-ción. Este representante, a partir de las cifras oficiales según las cuales, en el sector la media de sueldos es de 120.000 pesetas con una desviación típica de 10.000 pesetas decide dar la razón a los sindicatos utilizando los siguientes argumentos:
Si la patronal tuviera razón, para establecimientos de 40 empleados la
media superaría las 5·004
°
0
°
00 = 125.000 pts, pero de los datos oficiales,y haciendo uso del Teorema Central del Límite, las medias de muestras de tamaño 40, siguen la distribución:
34 U.l:Ml:NTOS l>I:" l>l:"CISWN l:S"/iWÍSTIC\ U\I liAClllU.l:Ri\fU
y por tanto la probabilidad de que sea cierto lo alegado por la patronal
es:
p(X > 125.000)
=
p(z
> 125001
°5
~;º·ººº)= p(Z > 3,16) ::::o
Formulación
de hipótesis-naturaleza del
ensayo
de hipótesis
Aunque se pueden considerar como decisiones los ejemplos
anterio-res, en general en estadística las decisiones se toman sobre unas
determinadas hipótesis.
Así por ejemplo, se tratará de tomar decisiones acerca de hipótesis tales como si un nuevo proceso de producción es más eficiente que uno anterior, o si la proporción de personas favorables al divorcio ha aumentado, si un medicamento nuevo es más efectivo, o cuál de dos sistemas de aprendizaje es mejor. Tales hipótesis se expresan siempre en
función de un parámetro estadístico. Así la hipótesis de que una moneda no está cargada se expresaría como p = 0'5 (p =proporción de caras en
una serie de lanzamientos).
Pero no se puede estudiar directamente la hipótesis que entra en juego, sino que se trata el problema de forma indirecta. Lo equivalente a confirmar una hipótesis dada, es negar o rechazar su alternativa lógica.
Para poder decidir sobre una hipótesis (que normalmente establecerá que existe una tendencia o relación en la población), examinamos la contraria a la que se denomina hipótesis nula (que establecerá que no
existe tal tendencia o relación). En cada proceso de decisión, habrán
de establecerse la hipótesis nula o hipótesis de partida H0 (que es la
que se contrastará), y la hipótesis alternativa H, (sobre la que se
quiere decidir) complementaria de la anterior.
Para entender mejor el proceso, suele establecerse un paralelismo
entre el contraste de hipótesis y el juicio a una persona. No se puede
iniciar un proceso judicial tratando de demostrar la inocencia de una persona (inocencia que estaría representada por la hipótesis nula). Tal inocencia se presupone. Lo que se hace en un juicio, es partir de la
inocencia, y a la luz de la o las pruebas , rechazar o no la presunción,
JOSÉ MIGUEL RODRfGUEZ MORALES 35 Tomaremos pues como cierta la hipótesis nula, y la mantendremos hasta que no se demuestre lo contrario, es decir hasta que en un juicio se nos haga comprender la incompatibilidad de dicha hipótesis con las pruebas presentadas, de forma que tengamos evidencias suficientes para aceptar lo establecido en la hipótesis alternativa.
Esquemas de decisión
Dado que "la ausencia de evidencia no implica evidencia de ausen-cia", si las pruebas presentadas no son evidencia suficiente a favor de la hipótesis alternativa, en principio, el no rechazo de la hipótesis nula no tendría porqué llevar aparejado la aceptación de lo establecido por dicha hipótesis.
En general, las hipótesis nulas se establecen con el ánimo de rechazarlas. Cuando tras obtener unos resultados muestrales que nos hacen formular una hipótesis de que "en la población total existe una determinada relación" formularemos una hipótesis nula en el sentido de que "no existe tal relación en la población", es decir que los resultados obtenidos en la muestra son debidos al azar y no a lo postulado por la hipótesis alternativa. A partir de aquí, lo que interesa es saber si podemos aceptar o no (con una probabilidad de error
a
llamada nivel de significación), la hipótesis alternativa.Cuando el esquema es el descrito anteriormente, el esquema de trabajo que adoptamos es:
ESQUEMA 1
Hipótesis Acción Decisión Redacción de la conclusión Riesgo de partida
Se rechaza H0 Se acepta H1 Existen evidencias suficientes Nivel de
a un nivel de significación del significación
a % de que (significado de
la hipótesis H1) a
Hº
No se Ninguna No existen evidencias No existe
rechaza H0 suficientes a un nivel de riesgo
significación del a % de que
36 ELEMENTOS DE DECISIÓN ESTADÍSTICA EN BACHILLERATO
Existen sin embargo otros casos, en los que no es posible la
indefini-ción sobre lo establecido en la hipótesis nula. En estos casos, el test debe dar lugar siempre a una decisión: aceptar H1 o aceptar H0• Se presentan las siguientes posibilidades:
H0 ES CIERTA H0 ES FALSA
No rechazamos H0
(Aceptamos H0) Decisión correcta ~ =Error tipo 11
Rechazamos H0
(Aceptamos H1)
a
=Error tipo 1 Decisión correctaEs decir, el esquema de decisión en este caso es :
ESQUEMA2
Hipótesis de partida Acción Decisión Riesgo
Se rechaza H0 Se acepta H, Error tipo 1
Ho
No se rechaza H0 Se acepta H0 Error tipo 11
Regla de decisión-prueba de contraste
Si ya están formuladas las hipótesis,¿ bajo que condiciones podrá ser rechazada la hipótesis nula?. O lo que es lo mismo, ¿cuando
considera-remos que tenemos evidencias suficientes de la hipótesis alternativa?. Éste es el momento de elegir la regla de decisión, es decir, establecer un
criterio que permita rechazar o no la hipótesis nula.
Por lo general , una prueba o regla de decisión para contrastar
una hipótesis consiste en un suceso o resultado experimental S, cuya
posibilidad de ocurrencia sea muy pequeña siendo cierta la
hipóte-sis H0, es decir:
p(S/H0 ) =a (Nivel de significación)
Si ocurre el suceso S, rechazaremos la hipótesis H0, y no lo
JOSt MIGUEL RODRÍGUEZ MORALES 37
La justificación es simple: o bien la hipótesis es cierta y se ha producido un suceso de muy pequeña probabilidad, o bien la hipótesis
es falsa. Es como si hiciésemos una reducción al absurdo, sólo que la
contradicción con la hipótesis de partida no se establece de forma
absoluta, sino en términos de probabilidad.
Si ocurre S, parece pues natural que apostemos por la segunda opción y rechacemos la hipótesis H0, haciéndonos cargo de que existe una
probabilidad
a
(es la probabilidad de que haya ocurrido S aún siendocierta H0) de equivocarnos.
Veremos ahora algunos ejemplos que nos permitirán aclarar lo antes
expuesto:
Ejemplo 4:
Supongamos que a n personas se les mide la presión sanguínea bajo
el efecto de un medicamento y sin él. Sean las observaciones x1, x2 , ... , xn e y 1, y 2 , .... , y n . Diremos que el i-ésimo ensayo es un éxito si x; >Y; y
fracaso si \< Y; (para tener mayor simplicidad supondremos que no hay dos medidas que lleven al mismo resultado). Si el medicamento no tiene
efecto sobre la presión, nuestras observaciones corresponden a una
B ( n; \/2). Un suceso S que sirva como señal de que el medicamento afecta a la presión, podría ser que el número de éxitos fuera superior a n/2 . Es evidente que cuanto mayor sea el número de éxitos exigidos por S menor
será el nivel de significación.
Ejemplo 5:
Un método para rehabilitar alcohólico se sabe por experiencia que es efectivo en el 80% de los casos de cierta enfermedad. Un nuevo método que está siendo ensayado, ha rehabilitado a 89 de 100 pacientes elegidos al azar. Imaginemos que queremos tomar una decisión sobre Ja eficacia
del nuevo método ( H1: "El nuevo método es más efectivo que el
anterior" ). Establecemos que H0= "El nuevo método es igual o menos efectivo que el anterior", y como suceso de prueba que S
=
"Al realizarun muestreo, se obtiene al menos una efectividad del 89%".
En términos de parámetros, la efectividad del nuevo medicamento es
38 ELEMENTOS DE DECISIÓN ESTADÍSTICA EN BACHILLERATO
Si suponemos cierto H0, el número X de éxitos (curaciones) en 100
intentos se distribuye según B(100;0'8), que es equivalente a N(80;4).
Pero en tal caso , la probabilidad de que ocurra S sería:
o:=
p(S ! H0)=
p(X ~ 89) = p(Z ~ 894
8º)
=
p(Z ~ 2,25) = 0,0122"' 1,22%1
Si establecemos un nivel de significación superior al 1 '22%, debere-mos rechazar H0 (y en consecuencia aceptar que es más efectivo el nuevo método) y no podremos hacerlo en otro caso.
Ejemplo 6:
Dos amigos Ay B,juegan acara o cruz con una moneda. Lanzan una moneda en 100 ocasiones, y A, que eligió cara, ha ganado en 62
ocasiones. Tras este resultado, B afirma que la moneda está trucada, de forma que la probabilidad de obtener cara es 2/3, mientras A mantiene que la moneda es correcta y el resultado es debido al azar. Se te encarga
dictaminar sobre cual de los dos tiene estadísticamente la razón. Ahora debemos aceptar obligatoriamente una de las dos hipótesis, es
decir, obrar de acuerdo al segundo esquema.
Establecemos las hipótesis:
Si X es el número de caras (éxitos) después de 100 intentos, su
distribución es una 8(100; ~) "'N(50;5) si es cierta H0, y una 8(100;
%)
"'N(66;4'71) si es cierta H1•Supongamos cierta H0 .De la Fig. 1, establecemos S como un
intervalo de forma que
' Hemos supuesto una efectividad igual. Si supusiéramos que el nuevo medicamento
JOSÉ MIGUEL RODRIGUEZ MORALES 39
a= p(X ES/ H0 ) = 0,05
de donde obtenemos que dicho intervalo será de la forma (a,100) ,
siendo:
Ho: X es N(50;5) H,: X es N(66'6;4'71)
p( X > a / H0)
=
0'05Ho
50
+-a=58'2 66,6
~ s
H,
i=il o.= Error tipo 1 _ _ O p=Error tipo 11
Fig. 1
En la tabla de la normal tipificada, p(Z > l '65)
=
0'05 y por tantoa
=
50 + 1,65 · 5=
58.2 .Puesto que el resultado muestra! es 62, podemos rechazar la hipótesis
nula y aceptar que la moneda tiene una probabilidad de cara de 2/3. Al tomar esta decisión nos equivocaremos en un 5% de los casos. (Error de tipo I o nivel de significación)
Si embargo si hubiéramos obtenido un resultado muestral de 57
caras, habríamos aceptado la hipótesis nula, y también tendríamos una
probabilidad de error, el de tipo II. Para calcular dicha probabilidad,
supongamos que H1 es cierta. El error se producirá cuando un resultado muestra! sea menor de 58'2 , pues entonces aceptaremos H0 , y la
probabilidad de que ello ocurra es:
~
= p( X<a / H¡) = p(z < 58·
~
;
~
6•
6)=
p(Z < -177)=
0'0384"' 3'84%Dado que muchos de los parámetros sobre los que se suele establecer
un contraste de hipótesis tienen una distribución normal , la regla de
decisión S queda determinada como en el ejemplo anterior, por una
región, denominada región crítica o de rechazo que quedará a la derecha, izquierda o ambos lados de la distribución muestra! del parámetro
40
Región
Crítica
Región
Critica r~ RegiónCrítica / ' Fig. 2
De esta forma, rechazaremos H0 cuando se verifique S, es decir el estadístico (parámetro muestra!) quede en esta región, y no lo haremos en caso contrario (Fig. 2).
Los errores
Podríamos decir en consecuencia que si queremos establecer una prueba para rechazar o no una hipótesis, deberemos de buscar un suceso
de muy baja probabilidad (cuanto más baja, más específica2 será la
prueba) bajo la suposición de veracidad de la hipótesis nula. Para poder rechazar que H
0 = "una moneda no está cargada", podríamos establecer S ="salen 65 o más caras al lanzarla 100 veces",
de forma que
a
=0, 13% , es decir la prueba dará un resultado erróneoen sólo 13 de cada 1000 casos. Si S ="salen 70 o mas caras", es evidente
que la prueba sería más específica
Sin embargo, tal y como se puede observar en la Fig. 1 , en general
una disminución del riesgo
a
lleva aparejado un aumento del riesgo~. y cuanto mayor sea, en mayor número de casos se aceptará una falsa hipótesis nula, diciéndose en este caso que la potencia o sensibilidad deltest disminuye3 • En casos como el ejemplo 5 y en muchos otros en
general, se podrán reducir ambos riesgos, si aumentamos el tamaño
muestra!, pues este aumento dará lugar a una menor variabilidad
muestra!.
Para ilustrar la importancia de cada uno de los errores, puede servir el siguiente texto, propuesto como ejemplo de comentario-inves tiga-ción para los alumnos
41
Los tests de consumo de drogas son pruebas analíticas, que permiten
establecer el consumo de drogas, aunque no se pueden considerar
definitivas.
Para poder entenderlo, empezaremos por definir, las posibles s
itua-ciones que se presentan que están descritas en el diagrama adjunto:
~Positivo
____. Consumidor - - - .
--- ~ Negativo
"d ____. No consum1 or
---.
Positivo NegativoDecisión correcta
Falso negativo Falso positivo
Decisión correcta
Imagina por ejemplo un test que da positivo (es decir interpreta que
hay consumo de drogas) sobre el 99% de los consumidores de drogas.
Este 99% es la denominada sensibilidad del test, y significa que a un J %
de los consumidores, el test dará un denominado falso negativo.
Por otro lado, habrá casos en que no consumidores, den positivo en el test. Estos resultados se llaman falsos positivos.
Imaginemos que la probabilidad de que se tome la decisión correcta
con un no consumidor, a la que se denomina especificidad del test es del
98%.
A pesar de que al ser la sensibilidad y especificidad del test valores
muy grandes, se tenga la sensación de que es muy fiable, en la práctica,
si de las personas a las que se aplica, un 3% son consumidores,
aproximadamente el 40% de los positivos que detecte el test son.falsos
positivos.
Lo argumentado, resulta importante, por cuánto, este tipo de tests,
resultan de utili~ación cada ve~ más frecuente.
En Norteamérica, casi la mitad de las empresas realizan
habitual-mente tests sobre consumo de drogas a todos sus empleados. Por lo
argumentado antes, y teniendo en cuenta la gravedad de un error, se
debe de ser muy precavido con este tipo de tests
¿Cuáles son las hipótesis nula y alternativa formuladas? ¿Cuál es el nivel de significación¿ ¿Cuál el error de tipo 11.?
¿Cuál de ellos juzgas más importante, y porqué? ¿Cuál crees que
42 ELEMENTOS DE DECISIÓN ESTADÍSTICA EN BACHILLERATO
¿Podrías probar la aseveración de que "si de las personas a las que
se aplica, un 3% son consumidores, aproximadamente el 40% de los
positivos que detecte el test son falsos positivos".?
¿ Sabrías encontrar una forma de utilizar el test anterior para
reducir el riesgo que consideres más perjudicial ?
Bibliografía
SIXTO RÍOS : Métodos Estadísticos . Ediciones del Castillo (1970)
TRIOLA-FRANKLIN: Business Statistics. Addison Wesley (1994) ROBERT JOHNSON : Estadística Elemental - Grupo Editorial Iberoamérica (1990)
José Miguel Rodríguez Morales