MODELOS E SIMULAÇÃO NO ENSINO DE PROBABILIDADE: UMA ANÁLISE DO POTENCIAL DO APPLETS E PLANILHAS
2. CLASIFICACIÓN DE LOS PROBLEMAS BINARIOS DE PROBABILIDAD CONDICIONAL
Yáñez (2001), con base en un análisis algebraico sobre las relaciones fundamentales que existen entre probabilidades conjuntas, marginales y condicionales, clasifica los problemas binarios (los que solo tienen dos eventos A y B con sus respectivos complementos) resolubles de probabilidad condicional en los siguientes cuatro niveles que, a su vez, agrupan varios casos dependiendo de la información que contengan:
De Nivel 0: aquellos que en su parte informativa no presentan información condicional. Caso 1: Tres intersecciones
Caso 2: Dos intersecciones y una marginal Caso 3: Dos marginales y una intersección
De Nivel 1: aquellos que en su parte informativa presentan una condicional. Caso 4: Dos marginales y una condicional
Caso 5: Dos intersecciones y una condicional
Caso 6: Una marginal, una intersección y una condicional
De Nivel 2: aquellos que en su parte informativa presentan dos condicionales. Caso 7: Una marginal y dos condicionales
-38-
i) Una condicional asociada con la marginal y la otra asociada con el complemento de la marginal.
ii) Una condicional asociada con la marginal dada, y la otra asociada con la otra marginal. iii) Las condicionales están asociadas con la otra marginal y su complemento.
Caso 8: Una intersección y dos condicionales
De Nivel 3: aquellos que en su parte informativa presentan tres condicionales. Caso 9: Tres condicionales
El análisis del nivel de dificultad de la solución algebraica de los 9 casos considerados permitió a Yáñez conjeturar que el nivel de dificultad de un problema de probabilidad condicional (cuando se pretende hallar todos los elementos faltantes) depende directamente del número de probabilidades condicionales que contenga su parte informativa.
De otro lado, el análisis de la potencia de los diagramas de árbol y de las tablas 2x2 para resolver estos problemas, le permitió definir claramente los límites de la capacidad que tienen estas dos populares representaciones para resolver problemas de probabilidad condicional. Así, por ejemplo, el diagrama de árbol es totalmente congruente con los problemas de probabilidad condicional analizados por Gigerenzer y Hoffrage (1995) y Martignon y Wassner (2002) (caso 7(i)) lo que da fuerza al hecho de que la información dada admite un orden que permite concatenar los razonamientos de forma continua. En la Figura 1 se visualiza la ubicación de la información dada en un problema congruente con el tipo 7(i) (Yáñez, 2001): dos condicionales y una marginal que junto con su complemento son los eventos condicionantes de las condicionales dadas. Obsérvese como rápidamente se hallan los complementos (B),
A |B y
A |B
, y luego, al multiplicar las marginales por las respectivas condicionales en cada rama, se obtienen las intersecciones
AB
,
AB
,
AB
y
AB
; la suma de las intersecciones adecuadas, como lo indica el mismo diagrama, arroja como resultado las marginales
A y
A . Con estos datos ya es posible responder a cualquier pregunta que se haga conociendo las relaciones básicas entre probabilidades.Figura 1. Diagrama de árbol para un problema binario tipo 7(i) de probabilidad condicional.
En este orden de ideas, y con ánimo explicativo, veamos lo que sucede con el árbol cuando se cambia el tipo de información y se pide responder a la misma pregunta. Consideremos el caso 2: dos intersecciones y una marginal. Cualesquiera que sean estas, se observa que su ubicación en el diagrama de árbol ya no es continua, aspecto que dificulta los razonamientos necesarios para resolver el problema. El caso 7 (i) lleva a hacer una construcción en secuencia y siempre hacia adelante del diagrama de árbol, mientras que para el caso 2 la construcción obliga a ir adelante para luego retroceder para completar todos los datos, aspecto que, de alguna manera, complica la obtención de la información necesaria para dar solución al problema. Sin embargo, para el caso 2, por el tipo de información que se presenta, los datos se pueden ajustar mucho mejor a una tabla de doble entrada, lo que facilitaría mucho la obtención de los demás datos y, por ello, la solución del problema. Sin embargo, en problemas que responden, por ejemplo, al caso 5 (dos intersecciones y una condicional) no se puede decir que la tabla o el árbol se comporte uno mejor que otro. Adicionalmente, al resolver completamente los dos problemas con la representación algebraica se observa que los problemas de caso 5 son más exigentes que los de caso 2.
De este análisis se infiere, a priori, que cambiar el tipo de información hace que unos problemas sean más fáciles de resolver que otros y que, por consiguiente, resolver un problema de probabilidad condicional con éxito esté ligado al tipo de información que se presenta. Respecto al efecto que pueda tener el formato de presentación de la información sobre la solución de los problemas de probabilidad condicional no se encuentran razones matemáticas más allá de las aritméticas, en el sentido de que las frecuencias naturales son más simples que las razones involucradas en los formatos de porcentajes y probabilidades.
-40-
3. METODOLOGÍA
La población objeto de estudio son los estudiantes universitarios que han tomado al menos un curso de probabilidad y estadística. La muestra estuvo conformada por 457 estudiantes activos de la Universidad Industrial de Santander, Bucaramanga, Colombia, del primer y segundo semestre académico del 2009 de las carreras de Licenciatura en Matemáticas (101), Economía (21), Ingeniería de Sistemas (68), Ingeniería Industrial (90), Ingeniería Eléctrica (35), Ingeniería Civil (100) e Ingeniería Electrónica (62) que participaron respondiendo solamente alguno de los tres cuestionarios construidos.
La investigación se desarrolló en tres fases que se dieron en momentos distintos y con cuestionarios diferentes.
La primera fase fue un estudio piloto con el objetivo de generar una idea a priori sobre la dificultad de los problemas binarios de probabilidad condicional y evaluar la redacción de los mismos. En esta fase participaron 50 estudiantes de licenciatura en matemáticas que se encontraban tomando un curso de estadística: 32 de ellos se enfrentaron a 5 problemas asociados a los casos 1,2,3,4 y 5 de la clasificación de Yáñez (2001); los otros 18 presentaron otra prueba con 4 problemas pertenecientes a los casos 6,7,8 y 9. Los resultados mostraron que los problemas de nivel 2 y 3 (casos 7, 8 y 9) fueron de enorme dificultad para los estudiantes en tanto que los de nivel 0 y 1 presentaron mayores índices de respuesta. En consecuencia se decidió que en las siguientes fases se presentarían problemas correspondientes a los casos 2 y 5.
Los problemas de los casos 2 y 5, según la clasificación de Yáñez (2001), poseen la siguiente estructura: Caso 2: Dos intersecciones y una marginal (nivel 0, pues no presenta condicionales en su información) que no estén asociadas, es decir, que la suma de las probabilidades conjuntas no sea igual a la probabilidad marginal. Caso 5: Dos intersecciones y una condicional (nivel 1, presenta una condicional en su información) de tal forma que la intersección entre el evento condicionante y el evento condicionado sea una de las intersecciones dadas. Los formatos utilizados fueron el de probabilidad, el de frecuencias naturales o absolutas y el de porcentajes.
Los formatos tienen las siguientes características: en el formato de probabilidad la información es probabilística con datos en expresión decimal y se indaga por una probabilidad; en el formato de frecuencias absolutas la información está dada con valores enteros y solo se menciona la palabra probabilidad en la pregunta; para el caso 5 con información condicional ésta se presenta en formato de muestreo sistemático (Mellers y McGraw, 1999) que tiene la forma: “de cada 100 que están en A, n también están en B” ; en el formato de porcentajes o frecuencias relativas se presenta la información en porcentajes y la pregunta indaga por un porcentaje (problema aritmético) o una probabilidad.
En la segunda fase se consideró pertinente dividir la muestra seleccionada de estudiantes en dos grupos: el primero conformado por 281 estudiantes que estaban en su primer curso de estadística; el segundo grupo lo conformaban 151 estudiantes que cursaban un segundo curso de estadística. Ambos grupos ya habían estudiado los temas relacionados con probabilidad condicional, incluido el teorema de Bayes. Para el primer grupo se elaboraron dos problemas de probabilidad condicional de caso 2, y dos problemas de aritmética relacionados con porcentajes con el ánimo de saber si los contextos aleatorios son los que dificultan los problemas o si, en últimas, se trata es de debilidades en el razonamiento proporcional. Todos los problemas planteaban una pregunta de probabilidad condicional y tenían la siguiente estructura: uno con formato de frecuencias absolutas, otro con formato de probabilidades; los dos problemas aritméticos eran uno con formato de frecuencias absolutas y el otro con porcentajes. Para el segundo grupo se diseñaron tres problemas del caso 5: dos de probabilidad y uno aritmético, con diferentes formatos y con preguntas diferentes. El aritmético con formato de porcentajes y pregunta de porcentaje marginal; ambos problemas de probabilidad con formato de probabilidades, en uno se pregunta por una probabilidad marginal y en el otro se pregunta por la probabilidad de una intersección. En el Anexo 1 se encuentra el texto de los problemas aplicados en ambos grupos.
Ya conocidos los resultados de las dos primeras fases, se diseñó una tercera que consistió de dos problemas de caso 5, uno con formato de frecuencias absolutas y otro con formato de porcentajes, y ambos con tres preguntas en formato de probabilidad que indagaban por una condicional, una marginal y una intersección. Se seleccionaron 25 estudiantes de licenciatura en matemáticas que cursaban estadística II y que habían recibido instrucción sobre el manejo de los diagramas de árbol y de las tablas de doble entrada. En esta fase se pretendía conocer si el formato de presentación de los problemas tenía alguna influencia en su solución y en la representación utilizada para resolverlos.