• No se han encontrado resultados

CAPÍTULO 3. IMPLEMENTACIÓN Y EVALUACIÓN DE LA HERRAMIENTA

3.4 Vulnerabilidades

Lo siguiente es un análisis no exhaustivo de los problemas encontrados en el proceso de traducción. Se abordan aquí las dificultades que son específicas de las limitaciones estructurales.

3.4.1 Vulnerabilidades de la versión anterior del sistema

Es importante resaltar que en esta investigación se analizaron las vulnerabilidades de la versión anterior, de las cuales muchas fueron tratadas aportando mejores resultados. Uno de estos problemas es la ambigüedad léxica.

La ambigüedad léxica constituye un clásico problema en la RI. Son las relaciones semánticas que existen entre diferentes palabras (sinonimia, etc.) y las palabras que tienen significados múltiples (homógrafos). Los homógrafos plantean un nuevo problema en la recuperación de información en XML, donde algunas palabras pueden ser entendidas como condiciones normales de consultas basadas en contenidos, y también como nombres de etiquetas (o un sinónimo de un nombre de etiqueta).

55

Estas deficiencias fueron tratadas con la creación del diccionario del dominio explicado en la sección 2.3.1 y recomendándole al usuario que encierre entre comillas dobles (“”) los contenidos que desea recuperar de forma específica, previendo así que en estos contenidos se encuentren requisitos estructurales, los cuales deben ser interpretados por el traductor como información a ser recuperada y no como una etiqueta del documento XML. Ejemplo:

LN: Devolver las autopsias que presentaron como causa básica de muerte la hipertensión arterial y como causa directa de muerte "paro respiratorio".

LNE2NEXI 2.0: //Autopsia[about(.//CBM, hipertensión arterial ) AND about(.//CDM," paro respiratorio " )]

En este ejemplo, si el contenido (respiratorio) no estuviera encerrado entre comillas dobles entonces sería reemplazado por la expresión //Respiratorio como se muestra a continuación:

LN: Devolver las autopsias que presentaron como causa básica de muerte la hipertensión arterial y como causa directa de muerte paro respiratorio.

LNE2NEXI 2.0: //Autopsia[about(.//CBM, hipertensión arterial ) AND about (.//CDM//Respiratorio, paro )]

Esta traducción no es correcta, por lo que sería muy ineficiente el proceso de recuperación de información correspondiente a la consulta en lenguaje natural realizada por el usuario.

Después de este análisis no se puede afirmar completamente que se le ha dado solución a este problema clásico de la RI, ya que en muchas ocasiones los usuarios no están familiarizados con la estructura de los documentos XML que conforman la colección documental.

3.4.2 Análisis de las vulnerabilidades de esta versión de la herramienta

A continuación se muestran ejemplos de consultas que fueron mal interpretadas por el traductor, debido a su forma de redacción, la cual es muy variante en el idioma español. Para evitar fallas en la traducción se recomienda seguir la secuencia [estructura] + [contenido].

LN: Obtener pacientes que tienen infarto como causa directa de muerte.

56

En esta consulta el traductor la interpreta correctamente porque es un solo contenido (infarto) y un solo requisito estructural (causa directa de muerte). Por otra parte, si la consulta fuera:

LN: Pacientes que tengan de forma normal el hígado y los pulmones y que además tengan el corazón de forma cónica.

El traductor devuelve la consulta en NEXI:

LNE2NEXI 2.0: //Autopsia[about(.//Higado, forma normal ) AND about(.//Pulmones, forma cónica ) AND about(.//Corazon ,forma cónica )]

Se observa que el contenido (forma cónica) se le atribuye a la etiqueta (Pulmones), cuando su contenido debiera ser (forma normal).

Para que la consulta sea analizada correctamente por el traductor, debe ser redactada de la siguiente manera:

LN: Pacientes que tengan el hígado y los pulmones de forma normal y que además tengan el corazón de forma cónica.

Quedando su traducción de la siguiente forma:

LNE2NEXI 2.0: //Autopsia[about(.//Higado, forma normal ) AND about(.//Pulmones, forma normal ) AND about(.//Corazon, forma cónica )]

Otra de las deficiencias encontradas es a la hora de expresar varios contenidos correspondientes a un solo requisito estructural.

LN: Devolver las autopsias donde las glándulas tiroides sean de forma normal y presenten color pardo homogéneo.

En esta consulta los contenidos (forma normal) y (color pardo homogéneo) pertenecen a la etiqueta (GlandulaTiroides). El traductor detecta la presencia del verbo “presenten” después de la conjunción “y” indicando una nueva solicitud de información a la cual no le atribuye un requisito estructural.

LNE2NEXI 2.0: //Autopsia[about(.//GlandulaTiroides, forma normal ) AND about(., color pardo homogéneo)]

Esta traducción no está correcta del todo, ya que el contenido (color pardo homogéneo) va a ser recuperado dentro del campo (Autopsia) y el mismo está restringido sólo a la etiqueta (GlandulaTiroides) según la consulta realizada por el usuario. Para prevenir estas

57

traducciones con información extra en casos como estos, es necesario no usar aquellos verbos que pueden indicar nuevas solicitudes de información (sean, presenten, tengan, hablen, traten, contengan, etc.). Es importante comprender que se restringe el uso de los mismos sólo cuando se trata de consultas con varios contenidos que pertenecen a un mismo requisito estructural, como se analizó en la consulta anterior.

A continuación se muestra cómo debe ser redactada la consulta anterior y su correcta traducción.

LN: Devolver las autopsias donde las glándulas tiroides sean de forma normal y de color pardo homogéneo.

LNE2NEXI 2.0: //Autopsia[about(.//GlandulaTiroides, forma normal) AND about(.//GlandulaTiroides, color pardo homogéneo)]

Es muy importante el uso correcto de las conjunciones (y, e, o, u) en las consultas. En el siguiente ejemplo se observa cómo el traductor interpreta incorrectamente la consulta, donde confunde el uso del “con”, en su lugar debió utilizarse la conjunción “y” para que fuera correctamente interpretada como operador lógico AND.

LN: Obtener pacientes que presentaron ateromatosis severa con el corazón graso.

LNE2NEXI 2.0: //Autopsia[about(.//Corazon, ateromatosis severa graso)]

Se obtuvo una consulta que restringe los contenidos (ateromatosis severa) y (graso) a un mismo requisito estructural (Corazon). Para una correcta traducción debe ser redactada reemplazando el “con” por el “y”:

LN: Obtener pacientes que presentaron ateromatosis severa y el corazón graso.

LNE2NEXI 2.0: //Autopsia[about(., ateromatosis severa ) AND about(.//Corazon, graso )]

Documento similar