• No se han encontrado resultados

SISTEMAS EXPERTOS BASADOS EN PROBABILIDADES En los primeros sistemas expertos, se eligió la probabilidad como medida para

In document Sistemas Expertos Con Visual Prolog (página 81-100)

tratar la incertidumbre pero, desgraciadamente, muy pronto se encontraron algunos problemas, debidos al uso incorrecto de algunas hipótesis de independencia, utilizadas para reducir la complejidad de los cálculos. Como resultado, en las primeras etapas de los sistemas expertos, la probabilidad fue considerada como una medida de incertidumbre poco práctica.

La mayoría de las críticas a los métodos probabilísticos se basaban en el altísimo número de parámetros necesarios, la imposibilidad de una asignación o estimación precisa de los mismos, o las hipótesis poco realistas de independencia. Problema Probabilístico

• El problema siguiente muestra un análisis histórico de 200 días sobre el número de consultas diarias realizadas a un sistema de información empresarial (EIS) residente en un servidor central.

• Se sabe que el número de consultas diarias va de 0 a 5 por lo que las frecuencias relativas serían A días de 0 consultas/total de días, B días de 1 consulta/total de días ….. F días de 5 consultas/total de días.

• Por ejemplo:

CONSULTAS DIAS FREL FACUM

0 10 0,05 0,05 1 25 0,125 0,175 2 50 0,25 0,425 3 50 0,25 0,675 4 40 0,2 0,875 5 25 0,125 1 200

Esta función de probabilidad la creamos en Prolog de la siguiente forma: domains i=integer r=real predicates inicio funcion(i,i,i,i,i,i,r) clauses inicio:-

write("Ingrese la cantidad de días con 0 solicitudes : "),readreal(A),nl, write("Ingrese la cantidad de días con 1 solicitudes : "),readreal(B),nl, write("Ingrese la cantidad de días con 2 solicitudes : "),readreal(C),nl, write("Ingrese la cantidad de días con 3 solicitudes : "),readreal(D),nl, write("Ingrese la cantidad de días con 4 solicitudes : "),readreal(E),nl, write("Ingrese la cantidad de días con 5 solicitudes : "),readreal(F),nl, funcion(A,B,C,D,E,F,Prob),

write("El número de solicitudes probables es de ", Prob),nl. funcion(A,B,C,D,E,F,Prob):- Suma=A+B+C+D+E+F,A1=A/Suma,B1=B/Suma,C1=C/Suma,D1=D/Suma,E1=E/S uma,F1=F/Suma, Prob=A1*0+B1*1+C1*2+D1*3+E1*4+F1*5. goal inicio. Probabilidades

El concepto de probabilidad resulta familiar a cualquier profesional. Sin embargo, una definición precisa exige considerar la naturaleza matemática de dicho concepto. La probabilidad de ocurrencia de un determinado suceso podría definirse como la proporción de veces que ocurriría dicho suceso si se repitiese un experimento o una observación en un número grande de ocasiones bajo condiciones similares. Por definición, entonces, la probabilidad se mide por un número entre cero y uno: si un suceso no ocurre nunca, su probabilidad asociada es cero, mientras que si ocurriese siempre su probabilidad sería igual a uno. Así, las probabilidades suelen venir expresadas como decimales, fracciones o porcentajes.

La definición anterior de probabilidad corresponde a la conocida como definición frecuentista. Así, a partir de una población con N elementos, de los cuales k presentan una característica A, se estimará la probabilidad de la característica A como (A) = k/N. Así, por ejemplo, en una población de 100 pacientes, 5 de los cuales son diabéticos, la probabilidad de padecer diabetes p(Diabetes) se estimará como el cociente 5/100= 0.05.

Es conveniente conocer algunas de las propiedades básicas del cálculo de probabilidades:

Para un suceso A, la probabilidad de que suceda su complementario (o equivalentemente, de que no suceda A) es igual a uno menos la probabilidad de A.

Si un fenómeno determinado tiene dos posibles resultados A y B mutuamente excluyentes (es decir, que no pueden darse de forma simultánea, como ocurre en el lanzamiento de una moneda al aire), la probabilidad de que una de esas dos posibilidades ocurra se calcula como la suma de las dos probabilidades individuales.

La extensión de la ley aditiva anterior al caso de más de dos sucesos mutuamente excluyentes A, B, C… indica que:

Consideremos, como ejemplo, un servicio de urología en el que el 38,2% de los pacientes a los que se les practica una biopsia prostática presentan una hiperplasia benigna (HB), el 18,2% prostatitis (PR) y en un 43,6% el diagnóstico es de cáncer (C). La probabilidad de que en un paciente que se somete a una biopsia de próstata no se confirme el diagnóstico de cáncer prostático será igual a:

Es decir, en un 56,4% de los casos se logra descartar un diagnóstico maligno. De modo equivalente, la probabilidad anterior podría haberse calculado como la probabilidad del suceso contrario al del diagnóstico de cáncer

Nótese la importancia del hecho de que los sucesos anteriores sean mutuamente excluyentes. Sin esta condición, la ley de adición no será válida. Por ejemplo, se sabe que en una determinada Unidad de Cuidados Intensivos (UCI) el 6,9% de los pacientes que ingresan lo hacen con una infección adquirida en el exterior, mientras que el 13,7% adquieren una infección durante su estancia en el hospital. Se conoce además que el 1,5% de los enfermos ingresados en dicha unidad presentan una infección de ambos tipos.

¿Cuál será entonces la probabilidad de que un determinado paciente presente una infección de cualquier tipo en UCI? Para realizar el cálculo, si se suman simplemente las probabilidades individuales (0,069+0,137) la probabilidad de un suceso doble (infección comunitaria y nosocomial) se estará evaluando dos veces, la primera como parte de la probabilidad de padecer una infección comunitaria y la segunda como parte de la probabilidad de adquirir una infección en la UCI.

Para obtener la respuesta correcta se debe restar la probabilidad del doble suceso. Así si un fenómeno determinado tiene dos posibles resultados A y B, la probabilidad de que una de esas dos posibilidades ocurra viene dada, en general, por la expresión:

Por lo tanto, si dos o más sucesos no son mutuamente excluyentes, la probabilidad de que ocurra uno de ellos o ambos se calcula sumando las probabilidades individuales de que ocurra una de esas circunstancia, pero restando la probabilidad de que ocurra la común.

Es decir, 19 de cada 100 enfermos registrará alguna infección (ya sea de tipo comunitario o nosocomial) durante su ingreso en la citada unidad.

A veces, la probabilidad de que un determinado suceso tenga lugar depende de que otro suceso se haya producido o no con anterioridad. Esto es, en ocasiones el hecho de que se produzca un determinado fenómeno puede hacer más o menos probable la aparición de otro. Este tipo de probabilidades se denominan probabilidades condicionadas, y se denotará por P(A/B) a la probabilidad condicionada del suceso A suponiendo que el suceso B haya ocurrido ya.

La ley multiplicativa de probabilidades indica que la probabilidad de que dos sucesos A y B ocurran simultáneamente es igual a:

La ley multiplicativa anterior se utiliza también con el fin de determinar una probabilidad condicional P(A/B) a partir de los valores de P(A y B) y P(B):

Desarrollo de 1 caso

Supongamos, por ejemplo, que queremos estudiar la incidencia del hecho de ser fumador como factor de riesgo en el desarrollo de una enfermedad en una determinada población. Para ello se diseñó un estudio prospectivo y, tras seleccionar una muestra de 180 sujetos, los resultados son los que se muestran en la Tabla 1.

la probabilidad de desarrollar la enfermedad (E) en la población de estudio es:

Mientras que la probabilidad de padecer la enfermedad un fumador (F) es:

En el ejemplo, se constata por lo tanto que la incidencia de la enfermedad es diferente en la población fumadora que en la no fumadora (85,7% vs 18,2%). Así pues, la probabilidad de desarrollar la enfermedad depende de si se es o no fumador.

¿Cual es la probabilidad de no desarrollar la enfermedad en la población de estudio ?

Ejercicio

Desarrolle una aplicación en Visual prolog que satisfaga la tabla 1. Los datos Fumadores – Enfermos / Fumadores – Sanos y No Fumadores – Enfermos / No Fumadores Sanos deberán ingresarse al programa.

El programa calculará las 3 funciones expresadas en la diapositiva 10 así como la función de la pregunta que se hace al final de dicha dispositiva

Los botones y las etiquetas pueden tener cualquier nombre. Al hacer click en calcular hace las sumatorias en los Edit que son de sólo lectura. Cuando selecciona una opción del ListBox se muestra la probabilidad en el Edit de porcentaje.

Idc_n1 Idc_n2

Idc_n3 Idc_n4

Idc_t1 Idc_t2

Idc_t3 Idc_t4 Idc_total

Idc_resultado

Dominios y predicados

Sección de creación de componentes

Botón calcular

Sucesos excluyentes e independientes Sucesos mutuamente excluyentes

Excluir significa “dejar fuera”, de manera que dos sucesos serán excluyentes o mutuamente excluyentes si ellos no tienen elementos comunes (es decir uno excluye al otro. Asumamos que existe en una urna 5 bolas azules, 4 rojas y 3 verdes. Supongamos que se elige una bolita al azar, entonces hay tres tipos de sucesos que son de interés

El suceso “que la bolita sea azul” que lo denotamos por la letra A. El suceso “Que la bolita sea roja” que lo denotamos por la letra R. El suceso “que la bolita sea verde” que lo denotamos por la letra V

Observe que ninguno de estos sucesos tienen elementos comunes, de manera que entre ellos son mutuamente excluyentes. Podemos calcular la probabilidad de obtener una bolita azul, esto es

De igual forma podemos calcular la probabilidad de sacar una bolita roja, esto es

De igual forma podemos calcular la probabilidad de sacar una bolita verde, esto es

Ahora bien, nos preguntamos ¿cuál es la probabilidad de sacar una bolita roja o una bolita azul?

Es decir, cuando los sucesos son mutuamente excluyentes, la probabilidad de la ocurrencia de uno de ellos es simplemente la suma de cada una de las probabilidades

Sucesos independientes

Nos vamos a apoyar en la urna anterior con las bolitas de color roja, azul y verde Pero ahora sacaremos dos bolitas, una tras otra y con reposición. Esto significa que sacamos la primera bolita, anotamos su color, y la regresamos a la urna, y luego hacemos la segunda extracción.

5

Pr( )

12

A

3

Pr( )

12

V

4

Pr( )

12

R

4

5

9

Pr(

)

Pr( ) Pr( )

12

12

12

R o A

R

A

Definamos el suceso “la primera bolita extraída fue de color azul, que llamaremos suceso A1; y definamos el suceso “la segunda bolita extraída fue de color azul”, que llamaremos A2.

Queremos calcular la probabilidad del siguiente suceso “la primera bolita sea azul y la segunda bolita también sea azul”.

En términos de nuestra notación de sucesos, queremos calcular la probabilidad de que ocurra el suceso A1 y que ocurra el suceso A2. Mire cuidadosamente los siguiente cuadritos, el primer cuadro denotará las formas de obtener una bola cualquiera y el segundo cuadro las formas de obtener una bola cualquiera de la segunda extracción.

12 12 = 144

Ahora vamos a calcular las formas diferentes de obtener una bola azul en la primera extracción y una bola azul en la segunda extracción:

5 5 = 25

Luego la probabilidad de obtener dos bolitas azules de dos extracciones con reposición (con reemplazo) es

Por otro lado, la probabilidad de que en la primera extracción la bolita sea azul, esto es

Una vez repuesta la bolita, la probabilidad de sacar en la segunda extracción una bolita azul, esto es

25

144

5

Pr( 1)

12

A

5

Pr( 2)

12

A

De manera que podemos ver que la probabilidad de obtener A1 y A2, es igual al producto de la probabilidad de A1 por la probabilidad de A2, esto es

Y cuando esto ocurre, se dice que los sucesos A1 y A2 son independientes, De otra forma A y B dos sucesos son independientes cuando la ocurrencia de uno en nada altera la ocurrencia del otro.

Con la misma urna, nuevamente sacaremos dos bolitas, pero esta vez lo haremos sin reposición (sin reemplazo). Esto significa que una vez que hagamos la primera extracción, la bolita no es devuelta a la urna, o sea que en la segunda extracción tendremos una bolita menos.

Sea el suceso “la primera bolita es azul”, que denotaremos por A1. Sea el suceso “la segunda bolita es roja”, que denotaremos por R2. Queremos calcular la probabilidad de que la primera bolita sea azul y la segunda bolita sea roja, ¿cómo la calculamos?

Como antes, utilicemos nuestros cuadraditos para saber todos los posibles resultados de estas dos extracciones sin reposición

12 11 = 132

Luego, vamos a ver nuestros resultados para que la primera sea azul, y la segunda sea roja (sin reemplazo)

5 4 = 20

Luego la probabilidad de A1 y R2 es

Con el ejemplo anterior queremos decir que cualquier suceso que dependa de la primera extracción afectará a cualquier otro suceso que dependa de la segunda extracción, y por lo tanto ellos no serán independientes (se dice que son dependientes)

Pr( 1A y A2)

Pr( 1) Pr( 2)A

A

20

132

A modo de ejemplo, calcular la probabilidad de que (siempre sin reemplazo) en la primera extracción salga bolita verde (V1) y en la segunda extracción salga bolita verde (V2)

Ejercicio

Haga un programa de menú que permita tener 3 formularios y en cada uno ingresar N bolas rojas, verdes y azules (3 edit) y muestre

Formulario 1: La probabilidad de que sea de X color la primera bola que saquemos.

Formulario 2: La probabilidad de que sea de X color la primera e Y color la segunda con reposición.

Formulario 3: La probabilidad de que sea de X color la primera e Y color la segunda sin reposición.

Sistema de Diagnóstico

El sistema lo hemos hecho en Excel para tener una idea de lo que queremos y luego lo hemos resuelto de 2 formas usando Visual Basic para aplicaciones como una forma de mostrar que los Sistemas Expertos se pueden desarrollar con cualquier lenguaje siempre que se cumpla con la forma lógica proposicional.

Base de Conocimientos

3

2

6

12 11

132

Se tienen 3 enfermedades que tienen 10 síntomas, algunos de los cuales son comunes a 2 o más enfermedades. Dado un paciente que presenta algunos de estos síntomas, ¿Cuál es la probabilidad de padecer cualquiera de las enfermedades?. Nótese que en la parte inferior se suma la cantidad de síntomas de cada enfermedad.

Datos de Entrada

A la derecha se coloca con una “X” los síntomas del paciente. Motor de Inferencia

ES la parte del sistema que “piensa” la solución. En este caso hemos usado la función SI de Excel. Abajo contamos las coincidencias y calculamos la probabilidad.

Solución hecha en Visual Basic para Aplicaciones

Para comparar los resultados se han ingresado los mismos síntomas que en el ejemplo con Excel, pero pudiera ingresarse con una “X” cualquier otro síntoma.

En el código los valores de los cuadros de texto se almacenarán en variables “a”, “b”. etc. Tal como se muestra en la imagen.

Se crea una función por cada enfermedad en un módulo, para tomar las “X” que coindicen. a b c d e f g h i j

Se crean funciones para calcular la probabilidad en función del número de síntomas de cada enfermedad.

Ejercicio

In document Sistemas Expertos Con Visual Prolog (página 81-100)

Documento similar