• No se han encontrado resultados

Listado de Tablas

N/A
N/A
Protected

Academic year: 2022

Share "Listado de Tablas "

Copied!
96
0
0

Texto completo

(1)

Propuesta ontológica que representa la literatura colombiana en bibliotecas digitales:

estudio de caso Tesauro del Sistema de Información de la Literatura Colombiana

Valery Sofía Moreno Moreno Diana Alexandra Pulido Bernal

Trabajo de grado presentado como requisito para optar al título de Profesional en Ciencia de la Información, Bibliotecología y Archivística

Director: Liliana Margarita Herrera Soto

Pontificia Universidad Javeriana Facultad de Comunicación y Lenguaje

Carrera Ciencia de la Información, Bibliotecología y Archivística Bogotá D. C., 2021

(2)

AGRADECIMIENTOS

Sobre todas las cosas, agradezco a Dios por una más de sus promesas cumplidas en mi vida.

A mi hija Vanessa, porque cada día recibo a través de sus ojos la fortaleza y apoyo para seguir en pie, en este mismo punto, a su padre, quién inicio este proyecto y

paralelamente lo hemos culminado.

A mi madre, por haberse vinculado con su apoyo emocional al final de este proceso, a los sí se puede expresados por algunos conocidos

Agradecimientos especiales a mi compañera de trabajo grado Dianis.

Valery Sofía Moreno

Primero debo agradecer a mi mami por su apoyo y amor incondicional, por no dejarme desfallecer y darme una voz de aliento todos los días, nada hubiera sido posible sin ella.

A mi papi y a mi hermana, por creer en mí siempre, por su amor y apoyo emocional en los momentos difíciles.

A mi hermano, que desde el cielo me estuvo acompañando con su eterna sonrisa y sé lo orgulloso que estaría de mi en este momento.

A mis sobrinas, que con su amor y ternura me daban la fuerza para seguir con este proceso.

A mis familiares y amigos, que siempre creyeron en mí, me apoyaron y me alentaron en todo momento.

Finalmente, a mi compañera Sofi, por su paciencia y entrega durante estos meses, por su amistad y cariño sincero.

Diana Pulido Bernal

(3)

Agradecimientos especiales a la profesora y tutora de este trabajo de grado Liliana Herrera, por su compromiso desde el primer instante, por su organización, paciencia y apoyo con nosotras durante estos meses.

Valery Sofía Moreno y Diana Pulido Bernal

(4)

Contenido

Introducción

1 Planteamiento del problema ... 11

2 Pregunta ... 14

3 Justificación ... 14

4 Objetivos ... 15

4.1 Objetivo general ... 15

4.2 Objetivos específicos ... 15

5 Estado del arte ... 16

6 Marco teórico ... 20

6.1 Organización de la información en la web ... 21

6.1.1 Taxonomías ... 21

6.1.2 Folksonomías... 21

6.1.3 Tesauros ... 22

6.1.4 Ontologías ... 23

6.1.5 Tipos de ontologías ... 25

6.2 Bibliotecas digitales ... 28

6.3 Ontologías y bibliotecas digitales ... 31

6.4 Requerimientos funcionales... 32

6.4.1 Lenguaje de representación ... 32

6.4.2 Herramienta para edición ... 32

6.4.3 Infraestructura para el uso de ontologías en bibliotecas digitales ... 33

6.5 Acceso al conocimiento en bibliotecas digitales: área literatura colombiana ... 33

7 Propuesta Metodológica ... 35

7.1 Enfoque de investigación ... 35

7.2 Tipo de investigación ... 35

7.3 Resultados esperados ... 36

8 Metodologías para ontologías ... 38

8.1 Propuesta de metodología ontológica para el Tesauro del Sistema de Información en Literatura Colombiana- SILC ... 53

9 Propuesta ontológica para el Tesauro del Sistema de Información de la Literatura Colombiana – SILC. ... 54

10 Propuesta ontológica del Sistema de Información de Literatura Colombiana – SILC, utilizando la herramienta Protégé ... 61

10.1 Herramienta Cmaptools ... 65

10.2 Esquematización de facetas en plantillas ... 69

(5)

10.2.1 Plantilla 1. Dominio y Alcance de la Ontología ... 70

10.2.2 Plantilla 2. Escenarios de Motivación ... 71

10.2.3 Plantilla 3. Preguntas de Competencia. ... 72

10.2.4 Plantilla 4. Listado de Términos ... 73

10.2.5 Plantilla 5. Terminología ... 74

10.2.6 Plantilla 6. Definición de Conceptos y Herencia de Conceptos ... 75

10.2.7 Plantilla 7. Propiedades de los Conceptos ... 76

10.2.8 Plantilla 8. Relaciones ... 77

10.2.9 Plantilla 9. Características de las Propiedades ... 78

10.2.10 Plantilla 10. Restricciones ... 79

10.2.11 Plantilla 11. Instancias ... 80

11 Conclusiones ... 87

12 Recomendaciones ... 90

13 Referencias ... 91

(6)

Listado de Tablas

Tabla 1. Evaluación metodologías para ontologías. ... 48 Tabla 2. Muestra de facetas Tesauro SILC ... 61

(7)

Lista de Gráficos

Gráfico 1. Relación Tipología y Autor en Cmaptools. ... 66

Gráfico 2. Relación Autor y Departamento en Cmaptools. ... 67

Gráfico 3. Relación Departamento y Categoría en Cmaptools. ... 68

Gráfico 4. Facetas representadas en Cmaptools. ... 69

Gráfico 5. Opciones Protégé ... 81

Gráfico 6. Creación de Conceptos en Protégé. ... 82

Gráfico 7. Creación de Instancias en Protégé. ... 83

Gráfico 8. Relaciones y Propiedades en Protégé ... 84

Gráfico 9. Unión de Instancias con Relaciones en Protégé. ... 85

Gráfico 10. Prueba: Preguntas 1. ... 86

Gráfico 11. Prueba: Preguntas 2. ... 86

(8)

Listado de Plantillas

Plantilla 1 Dominio y Alcance de la Ontología ... 70

Plantilla 2 Escenarios de Motivación ... 71

Plantilla 3 Preguntas de Competencia... 72

Plantilla 4 Listado de Términos ... 73

Plantilla 5 Terminología ... 74

Plantilla 6 Definición de Conceptos y Herencia de Conceptos ... 75

Plantilla 7 Propiedades de los Conceptos ... 76

Plantilla 8 Relaciones ... 77

Plantilla 9 Características de las Propiedades ... 78

Plantilla 10 Restricciones ... 79

Plantilla 11 Instancias ... 80

(9)

INTRODUCCIÓN

Con la inclusión de la web semántica las formas de organizar la información han cambiado, por tal motivo se han diseñado estrategias mediante las cuales la organización y recuperación sea acertada, con el fin de satisfacer las necesidades de los usuarios.

Partiendo de lo anterior, este Trabajo de Grado desarrolla una propuesta ontológica que plantea la búsqueda y recuperación de información de la literatura colombiana, ya que de esta manera se podrá contribuir a dar mayor visibilidad a esta área del conocimiento en el país. Ahora bien, para llevar a cabo la construcción de esta propuesta se recurrió al Tesauro del Sistema de Información de Literatura Colombiana SILC, teniendo la respectiva

autorización por parte de sus autores, además, por ser tan extenso el tema se limitó y

seleccionó a 5 de sus facetas de un total de 16, con el fin de crear una muestra sobre cómo se visualiza una ontología de esta área del conocimiento.

Así pues, los métodos de recuperación del conocimiento han trascendido, es por esto que se quiso valorar el trabajo realizado para el Tesauro y demostrar que es una opción, donde vale la pena usarlos como base para la construcción de ontologías, ya que permiten tener una semántica y una mejor lectura contextualizada con el fin de poder ser incluidas en bibliotecas digitales.

Esta propuesta ontológica representa una parte del Tesauro de literatura colombiana según los lineamientos del SILC; para la organización de la información se tomó como referente la metodología diseñada por los ingenieros Tito Muto y Ceidy Álvarez (s.f.), hasta el paso 9, ya que hasta este punto guía la construcción por medio de 11 plantillas, y para la edición en el software Protégé se tomó la guía metodológica propuesta por Cristhian Camilo Torres Galindo (2016); cabe resaltar, que la versión de Protégé empleada fue la 3.4. ya que se tenían previos conocimientos sobre su uso.

(10)

Adicionalmente, y después del empleo de la metodología de Muto y Álvarez, la cual guía la construcción de la ontología, se complementó con la metodología de Torres Galindo que orienta la edición en el software Protégé, después se construye una muestra de preguntas que la ontología está en capacidad de responder. Sin embargo, se debe tener en cuenta que estas preguntas representan únicamente las 5 facetas que se seleccionaron para esta muestra, ya que en total son 16.

Lo anterior evidencia que las ontologías al representar una parte del conocimiento permiten respuestas contextualizadas, lo cual permitirá mayor precisión en la búsqueda de información.

Finalmente, se deja esta propuesta a disponibilidad de quiénes deseen continuar con la construcción y representación de la literatura colombiana, con el fin de contribuir al

conocimiento desde la carrera Ciencia de la Información, Bibliotecología y Archivística en Colombia.

(11)

1 Planteamiento del problema

La producción de información es una actividad que no se detiene y ha sido el motivo para que las sociedades construyan unidades de información con el fin de almacenar,

organizar y recuperar grandes volúmenes de datos; estas unidades de información a través de los años han desarrollado técnicas que han evolucionado la transformación de sus modelos tradicionales a modelos tecnológicos avanzados para facilitar la búsqueda y recuperación de información. Según la Federación de Bibliotecas Digitales (citado en Cabrera, Domínguez, 2005):

Las bibliotecas digitales son organizaciones que fomentan los recursos, incluido el personal especializado, para seleccionar, estructurar, ofrecer acceso intelectual, traducir, distribuir, preservar la integridad y garantizar la permanencia de las

colecciones digitales, de forma que estén disponibles para una o varias comunidades en un ambiente internacional coordinado. (p.18)

Por lo tanto, las bibliotecas para llevar a cabo sus procesos acuden al uso de herramientas para la descripción de sus contenidos y su recuperación, donde el empleo de lenguajes documentales juega un papel muy importante para organizar y permitir la recuperación dentro de sus buscadores. Estas recurren a lenguajes controlados ya sean precoordinados, como las listas de encabezamiento de materias (Sistema de clasificación decimal Dewey y Sistema de clasificación universal) o postcoordinados, como: folksonomías, taxonomías, tesauros. Estos lenguajes permiten la combinación de términos, bien sea en el momento de la indización o en la recuperación, se caracterizan porque sus búsquedas tienen que ser por términos normalizados, es por esto, que los resultados de las búsquedas tienen menos asertividad con la necesidad de los usuarios, ya que el proceso de organizar la información es transparente al usuario, es decir que, este no tiene conocimiento de qué términos son los más adecuados para realizar su búsqueda de información.

(12)

La escasa relación conceptual de estos lenguajes delimita los conceptos en la recuperación de información, cabe resaltar que existen otras herramientas como lo son las ontologías. Ahora bien, las bibliotecas digitales que emplean ontologías tienen en cuenta factores como:

- Posibilidad de existencia de ontologías múltiples para combinar dos o más taxonomías que introducen conceptualizaciones específicas.

- Abstracción de las ontologías para la creación de redes ontológicas que posibiliten una descripción completa del mundo.

- Multiplicidad de la representación. Un concepto puede ser caracterizado y

representado de muchas formas, por lo que pueden coexistir múltiples descripciones de un mismo concepto.

- Mapeo de ontologías. Establece relaciones entre los elementos de una o más

ontologías, para permitir conexiones, especializaciones, generalizaciones, etc. (Martín y León, 2011, p. 79).

En otras palabras, las ontologías permiten la organización, explotación y reutilización de información por áreas de conocimiento, estas facilitan la relación semántica entre

conceptos, la estructura en la cual están construidas facilita la recuperación de información con sentido, lo cual propicia mayor asertividad de los resultados en los motores de búsqueda gracias a su estructura semántica, es decir que, la unión de diferentes palabras en un contexto facilita las respuestas. Algunas bibliotecas digitales han recurrido a la construcción de

ontologías que organicen la información almacenada en búsqueda de una semántica con mayor profundidad, está dada en los siguientes niveles: significado de las palabras, relaciones y cambios semánticos.

(13)

De hecho, en la búsqueda realizada relacionada con prototipos, se encontraron aplicados a la geografía, el clima, la lectura, entre otras, pero no se halló alguno que represente a la literatura, teniendo en cuenta que:

El lenguaje se adquiere fundamentalmente por impregnación y esta se produce a través de la lectura. Con la lectura de obras literarias se consigue el desarrollo de ese lenguaje que es de suma importancia en un mundo como el que estamos viviendo;

porque en la medida en que una persona sea más capaz de dominar la palabra será menos susceptible de manipulación. (Alonso, s.f., p. 2)

En consecuencia, conservar la producción literaria de un país significa preservar su identidad, la literatura es un medio de difusión de cultura con relación a su conocimiento y transformación, de esta manera las sociedades se hacen visibles con sus aportes a la

construcción del conocimiento a través de los años. Teniendo en cuenta lo anterior, una investigación que proponga la construcción de una ontología aplicada a la literatura colombiana es una oportunidad que permitirá dar mayor visibilidad a esta área del

conocimiento en las bibliotecas digitales que la apropien; no hay que olvidar que la biblioteca resulta ser mediadora entre la sociedad y el conocimiento, pues aparte de contar con espacios físicos y colecciones, también ha creado espacios virtuales con el objetivo de llevar la

información hasta el alcance de todos.

Es importante resaltar que el acceso a estos contenidos en entornos digitales se ha apoyado en organizar la información con el empleo de lenguajes normalizados, por lo tanto, para proponer un modelo ontológico para la literatura colombiana a partir del Tesauro del Sistema de Información de la Literatura Colombiana – SILC, es necesario revisar

investigaciones sobre ontologías y aplicadas en bibliotecas digitales para tomarlas como referente, seguidamente, buscar el fundamento teórico y metodológico que mejor aplique

(14)

para representar esta parte de la literatura, otro punto, es el análisis y evaluación de los

conceptos que emplea la literatura colombiana, que servirán para la propuesta ontológica, que se podría encontrar en investigaciones relacionadas a la normalización y representación de esta área, pueden ser en tesauros, vocabularios, diccionarios especializados, etc.

2 Pregunta

¿Qué modelo ontológico es el más adecuado para la representación de la literatura colombiana a partir del Tesauro del Sistema de Información de la Literatura Colombiana – SILC?

3 Justificación

Teniendo en cuenta que la representación de información por medio de ontologías tiene la capacidad de mostrar una parte del conocimiento, por este motivo, y porque para el país es importante la visibilidad de su producción literaria, es una necesidad desarrollar una investigación para la propuesta de un modelo ontológico de sus propias obras. De esta manera, la Ciencia de la Información contribuye significativamente a la recuperación de su memoria en cualquier biblioteca digital a nivel mundial, ya que está basada en una estructura de conocimiento como es un Tesauro.

Considerando que la base para realizar esta propuesta es el Tesauro del Sistema de Información de la Literatura Colombiana - SILC de la Universidad de Antioquia, la ontología en literatura no estará basada en una colección de biblioteca específica, sino que analizará las ontologías y requisitos que debe tener los conceptos que representan a la literatura

colombiana en diferentes aspectos.

En consecuencia, la propuesta ontológica no estará compuesta en el nivel de detalle de los metadatos que identifican a cada recurso como lo puede ser títulos, nombre de autores,

(15)

etc., para una obra en específico, sino en conceptos más generales como género, temáticas, épocas, entre otros que se den en la literatura colombiana, lo que quiere decir que se le dará continuidad al tesauro ya antes mencionado.

Ahora bien, teniendo en cuenta los soportes citados en el planteamiento del problema, se observan vacíos en relación con los entornos donde se aplican ontologías, además se identifica que aquellas que han sido aplicadas tienen en cuenta diferentes aspectos para su funcionamiento, es decir, que para representar la literatura colombiana además de que la ontología cuente con una estructura y metodología, se debe contemplar los requisitos

funcionales necesarios para llevarla a bibliotecas digitales, estos comprenden factores como:

lenguaje de representación, herramienta para la edición y plataforma o infraestructura para bibliotecas digitales. Por lo tanto, esta investigación aportará una propuesta ontológica de representación del dominio de la literatura colombiana que pueda adaptarse a cualquier biblioteca digital que desee mejorar la experiencia de sus usuarios en relación con búsquedas de la producción colombiana.

4 Objetivos

4.1 Objetivo general

Proponer un modelo ontológico para la literatura colombiana a partir del Tesauro del Sistema de Información de la Literatura Colombiana – SILC.

4.2 Objetivos específicos

● Evaluar las diferentes estructuras de ontologías utilizadas en bibliotecas digitales.

● Establecer la ontología para el Tesauro del Sistema de Información de la Literatura Colombiana – SILC.

(16)

● Representar una muestra del Tesauro del Sistema de Información de la Literatura Colombiana – SILC, en la herramienta Protégé, con base en el modelo ontológico.

5 Estado del arte

La organización de la información en bibliotecas digitales es una tarea importante, de esta depende la calidad de la recuperación de información que normalmente es evaluada en el nivel de satisfacción de los usuarios. Para esto, algunas bibliotecas digitales han recurrido al uso de ontologías para representar una parte de sus colecciones, ya que su estructura

semántica permite una recuperación de información con mayor precisión, es decir, que a las ontologías se les atribuye la organización de la información para ser recuperada por

diferentes agentes en la web semántica. Esto permite que la biblioteca digital sea reconocida por el buen servicio que presta al usuario, y así mismo, conlleva a que los usuarios tengan preferencias frente a dónde buscar información.

A continuación, se expondrán investigaciones realizadas en Colombia sobre ontologías realizadas por varios autores:

Con respecto a Giraldo et al. (2011) realizaron una investigación sobre el

comportamiento de la web semántica con el uso de ontologías, luego surgió un modelo para representar la búsqueda semántica de objetos digitales aplicado a bibliotecas digitales, para esto emplearon lenguajes de recuperación semántica. Posteriormente, realizaron un análisis comparativo para el desarrollo del prototipo que se aplicaría para la representación y búsqueda de objetos digitales teniendo en cuenta los atributos propios de cada uno, la estructura ontológica utilizada fue de dominio, para llevar a cabo su construcción se empleó la metodología Ontology-101, en cuanto a la edición de esta ontología se utilizó el lenguaje de representación RDF y RDF-SCHEMA en la herramienta Protégé. Finalmente se aplicó en la biblioteca digital BiDiAPI (Biblioteca Digital Aplicada).

(17)

Asimismo, Romero Borda (2014) modeló la metodología de Tito Muto1 para aplicarla en una ontología de fotografía basada en los términos empleados por el fondo fotográfico de Nereo López Meza de la Biblioteca Nacional de Colombia. Esto resultó muy útil ya que permite la visibilidad de los contenidos y términos de la fotografía, sin embargo, esta no fue llevada a edición en ninguna herramienta, pero sugiere dónde se podría editar teniendo en cuenta la compatibilidad con diferentes lenguajes.

Por otro lado, Torres Galindo (2016) diseñó una guía metodológica en la cual se tienen en cuenta los términos del diccionario geográfico de Colombia para la transición de estos términos a un lenguaje ontológico, está enfocado en la geografía del municipio de La Calera (Cundinamarca). Esta investigación analizó diversas metodologías usadas para la construcción de ontologías y partiendo de ello diseñó una con la capacidad de recopilar los términos contenidos en el diccionario geográfico de Colombia, además se realizó la edición en la herramienta Protégé con el lenguaje OWL. Esta ontología refleja el dominio de un área de conocimiento enfocado a mejorar la búsqueda en la web semántica.

Por su parte, Ciprian y Rodríguez (2017) investigaron los diferentes modelos ontológicos con el fin de diseñar un modelo ontológico aplicado a una biblioteca digital, exactamente para la colección de libros antiguos y valiosos de la biblioteca Alfonso Borrero Cabal S.J. de la Pontificia Universidad Javeriana; la herramienta de edición utilizada fue Protégé en la versión 5.0 y se aplicó bajo la plataforma Greenstone. Adicional, utilizaron lenguajes como RDF, OWL y XML para la construcción de la ontología, también

seleccionaron la metodología de investigación “Ciencia basada en el diseño”, este modelo ontológico fue realizado al ver que el acceso a la colección de libros antiguos y valiosos de la biblioteca era muy limitado y restringido.

1 Ingeniero de sistemas, Magister en Ingeniería de sistemas y computación, profesor de cátedra en la Pontificia Universidad Javeriana.

(18)

De igual importancia, Montenegro (2018) realizó una investigación con la cual plantea una propuesta para la búsqueda y recuperación de información sobre las leyes del Congreso de la República de Colombia en su biblioteca, donde analizó el contexto del Congreso frente a su producción bibliográfica, a partir de este análisis empleó el diseño metodológico propuesto por Quiñonez, A. (como se citó en Montenegro Sánchez, 2018), el cual usó para la construcción ontológica mencionada. Esta investigación sugiere las características del Congreso y su colección en una ontología de dominio, al ser solo una propuesta, esta no fue implementada en una biblioteca digital, en consecuencia, tampoco se editó en ninguna herramienta.

Y por último en Colombia, Ramírez Sosa (2019) creó un sistema experto basado en ontologías con el objetivo de identificar fraudes en tarjetas de crédito, para esto creó una red de ontologías con la metodología NeOn y Linked Data, utilizó la herramienta de edición Protégé y empleó el lenguaje OWL y RDF.

Por otra parte, en el contexto internacional se han realizado las siguientes investigaciones:

En cuanto a España, Sá y Lopes (2011) investigaron y diseñaron la ontología OIR para representar el intercambio de referencias de documentos académicos en bibliotecas digitales como: JeromeDL y ScholOnto, en estas se puede visualizar el análisis de la relación semántica que se da en este dominio; la metodología que siguieron fue la OntoClean, que después la editaron en Protégé con el lenguaje OWL, esta ontología deja una vez más en evidencia la representación contextualizada de un dominio, considerándose como un avance significativo para la Ciencia de la Información, ya que, de esta manera se contribuye a visibilizar esta área del conocimiento, siento un aporte directo a la memoria colectiva del país.

(19)

Igualmente, Piña Landaburu (2017) en España, desarrolló un sistema de

representación, en busca de recopilar y dar visibilidad al conocimiento relacionado con la guerra civil española. Para esto empleó una ontología ya que su estructura no solo permite el dominio del conocimiento sino además permite tener acceso a la información de una manera contextualizada; para la edición de esta ontología accedieron a los recursos propuestos por la Universidad de Stanford, para edición Protégé y Webprotégé y la metodología que se utilizó fue la Guía para la creación de ontologías. Teniendo en cuenta que para una correcta lectura en la web semántica se quieren ciertos lenguajes, allí no se limitó a emplear uno solo, sino que utilizó tres, XML, RDF, OWL.

Por lo que se refiere a Ecuador, Guamán y Martínez (2015) basaron su investigación en el análisis que conlleva la construcción de un modelo ontológico para la búsqueda de objetos de aprendizaje con un sistema multiagente, donde recurrieron a la metodología Menthology para la construcción de los objetos de aprendizaje a representar en la ontología y para los agentes inteligentes en el desarrollo del software emplearon la metodología ICONIX, la edición de la ontología la realizaron en Protégé con lenguajes RDFs/OWL. Debido al trabajo complementario de estas metodologías concluyeron que los agentes de software al emplear la recuperación de información que suministran las ontologías pueden ser de uso práctico para personas inexpertas.

(20)

6 Marco teórico

Los sistemas de recuperación de información (SRI) suelen conllevar un lenguaje de consulta y una serie de procesos cognitivos, por lo que es muy difícil su

automatización de forma completa. — Las necesidades de los usuarios varían con el tiempo, entorno..., por lo que los SRI deben poder adaptarse a estos cambios y evolucionar con los usuarios. (Hípola et al., 2000, p. 11)

Así mismo, las bibliotecas digitales cuentan con sistemas para recuperar la información que contienen, para esto deben implementar herramientas que organicen y representen sus colecciones, teniendo en cuenta que estas suplan las necesidades de sus usuarios; otra forma de representación de conocimiento son las ontologías.

Ahora bien, con esta investigación se espera modelar una propuesta ontológica en esta área con el fin de visibilizar la literatura colombiana al ser implementada en una biblioteca digital para que el usuario ya no se encuentre sesgado a la recuperación de información en un lenguaje controlado, pues la propuesta guiará para que la ontología gestione las búsquedas en lenguaje natural y la profundidad semántica en la cual se estructure y facilite el

procesamiento de la información con mayor precisión en la Web. Esto llevará a una mayor visibilidad de los recursos y una mejor experiencia al usuario, dado que la recuperación de información será acertada respecto a los criterios de búsqueda.

Es necesario recalcar que la web ha implementado diferentes maneras de organizar la información, por esto se pretende analizar las probabilidades de realizar una transición de un tesauro a una ontología, con el fin de apostarle a las tendencias de la web semántica. Para esto es vital el conocimiento sobre las diferentes formas en las que está organizada la información en estos medios.

(21)

6.1 Organización de la información en la web

En efecto la información tal y como se encuentra en la web tiene diversas formas de organización, algunas de estas son: las taxonomías, folksonomías y los tesauros, que se encuentran basados en un lenguaje HTML, lo cual permite que los humanos puedan entender el contenido. A continuación, presentamos algunos conceptos relacionados:

6.1.1 Taxonomías

Las taxonomías son una de las formas de organizar la información, estas se pueden entender como: “un tipo de vocabulario controlado en que todos los términos están

conectados mediante algún modelo estructural (jerárquico, arbóreo, facetado, etc.) y especialmente orientado a los sistemas de navegación, organización y búsqueda de contenidos de los sitios web” (Centelles, 2005, párr. 28).

La organización de los contenidos en sitios web se realiza con el fin de representar la información y dar un mayor uso, es así como las taxonomías estructuran la organización para una navegación dinámica entre los contenidos (Díaz et al., 2009).

6.1.2 Folksonomías

Por otra parte, se encuentran las folksonomías, otra forma de organización de la información, “Las folksonomías se apartan de las estructuras jerarquizadas para aproximarse a una organización basada en la colaboración. Son un método de clasificación explotado por varios servicios web donde los usuarios añaden información o fotografías o clasifican páginas web” (Díaz et al., 2009, p. 253).

En esta misma línea Yedid, (2013) considera que:

Las propias características intrínsecas de las folksonomías y, particularmente, el hecho de que las mismas se basan en la utilización del lenguaje natural, no

controlado, hacen que este nuevo modelo de indización presente grandes diferencias

(22)

con el modelo de indización tradicional, basado en la utilización de algún tipo de vocabulario controlado (generalmente, un tesauro). En este sentido, se puede decir que las folksonomías adolecen de los mismos problemas que sufren todos los sistemas de indización basados en lenguaje natural, que son principalmente la ambigüedad, la sinonimia, la polisemia, la homonimia y el problema de la variación del llamado “nivel básico”. (p. 18).

Por último, se dice que una folksonomía es un tipo de sistema de clasificación distribuido. Por lo general, lo crea un grupo de personas, generalmente los usuarios de recursos. Los usuarios agregan etiquetas a elementos en línea, como imágenes, videos, marcadores y texto. Luego, estas etiquetas se comparten y, a veces, se refinan. (Guy &

Tonkin, 2016, párr. 1)

6.1.3 Tesauros

Teniendo en cuenta que la propuesta ontológica a desarrollar durante esta investigación toma como base el Tesauro del Sistema de Información de la Literatura

Colombiana - SILC es de suma importancia tener claro qué es un tesauro, por lo que se dan a conocer a continuación conceptos propuestos por diferentes autores.

Los tesauros son lenguajes postcoordinados, puesto que yuxtaponen los conceptos para coordinarlos después de la memorización de los documentos. Tales conceptos están representados por descriptores, que constituyen los términos admitidos y normalizados para la indización y la búsqueda documental y pueden asociarse libremente entre sí en función de la profundidad concedida a la indización. Aquí radica uno de los puntos fuertes de los tesauros, ya que con ellos puede realizarse una descripción más exhaustiva del contenido temático de los documentos, aumentando

(23)

así sus posibilidades de recuperación desde diversos puntos de vista. (Laguens García, 2006, p. 108)

Por otro lado, para Codina y Pedraza- Jiménez (2011)

Los tesauros sirven también para representar las necesidades de información de los usuarios, o sea las preguntas que formulan al sistema (los usuarios indizan las

preguntas). Por lo tanto, los tesauros son intermediarios en un proceso de información que ayuda al usuario a representar sus necesidades de información mediante el mismo sistema de descriptores que, previamente, sirvió para indizar o representar el

contenido de los documentos. (p. 557).

Para la propuesta ontológica basada en el Tesauro SILC el concepto más adecuado para el proceso es el de Codina y Pedraza- Jiménez mencionado anteriormente ya que son los usuarios quienes obtienen el mejor provecho pues pueden representar sus necesidades sin ser expertos en búsqueda y recuperación de información en la web. Es por esto que un producto de la web es la web semántica que busca gestionar la información de manera conceptualizada con sentido semántico, basada en lenguaje XML que permite que el usuario no solo pueda interactuar con el sistema, sino que la información a representar contenga significado y contenido estructurado. Cabe resaltar que los sistemas de información recurren a estructuras que cuenten con lógica matemática la cual también hace parte de las ontologías.

6.1.4 Ontologías

Las ontologías suelen ser un apoyo a la web semántica, por la estructura en la cual se construyen, ya que permiten la semántica y la lingüística con el fin de mejorar la experiencia a quienes realizan búsquedas en donde se gestionan las respuestas por medio de una.

Para Gruber (2008):

(24)

Las ontologías suelen especificarse en lenguajes que permiten la abstracción de las estructuras de datos y estrategias de implementación; en la práctica, los lenguajes de las ontologías se acercan más de la lógica de primer orden que los lenguajes utilizados para modelar bases de datos. Por ello, las ontologías se dice que están en el nivel

"semántico", mientras que los esquemas de las bases de datos son modelos de datos en el nivel "lógico" o "físico" (p. 1)

En otras palabras, las ontologías usadas para recuperar información deben contar con un nivel de abstracción para que se dé la semántica, esto es posible por la lógica de

predicados que permite la relación entre conceptos, en este punto, cambian los significados de manera racional dependiendo de las relaciones previamente dadas, su uso se hace útil en fuentes de información por la interpretación racional; esta lógica evita la polisemia o

ambigüedad y es evidente en resultados con mayor asertividad respecto a la necesidad de los usuarios.

Siguiendo con la estructura de los tesauros Guarino (1195) menciona que:

Una ontología es un artefacto ingenieril constituido por un vocabulario específico para describir una cierta realidad, más un conjunto de supuestos explícitos

concernientes al significado pretendido de las palabras del vocabulario. Este conjunto de supuestos tiene generalmente la forma de teorías lógicas de primer orden, donde las palabras del vocabulario aparecen como predicados unarios o binarios,

respectivamente llamados conceptos y relaciones. En el caso más simple, una ontología describe una jerarquía de conceptos relacionados por relaciones de subsunción; en los casos más sofisticados, se añaden axiomas para expresar otras relaciones entre conceptos y restringir la posible interpretación. (p. 336)

(25)

Teniendo en cuenta la relación entre conceptos para Neches et al., (1991), “Una ontología define los términos y las relaciones básicas para la comprensión de un área, así como las reglas para combinar los términos para definir las extensiones del vocabulario” (p.

40).

De acuerdo con lo anterior, para esta propuesta se va a trabajar un diseño de ontología partiendo de la definición de Neches, que permite realizar conexiones entre los términos propios que representan un área, esto con el fin de contextualizar la información; así la satisfacción de los usuarios frente a los resultados en sus búsquedas aumenta.

6.1.5 Tipos de ontologías

Entre tanto, para construir una ontología que pueda representar la literatura

colombiana se pueden integrar diferentes tipos de acuerdo con lo que se pretende extraer de ellas. Para este caso se tendrán en cuenta los siguientes aspectos: nivel de descripción de conocimiento, el agente que las va a usar y el tipo de abstracción o razonamiento, que a continuación se presentan:

Ontologías según lo que desean modelar. Jurisica, Mylopoulos y Yu (2004) las clasifican de acuerdo al mundo real utilizando términos para cada una: Estáticas, describen lo que hay en el mundo por medio de entidades, donde se identifican atributos y sus

relaciones con otras entidades de manera única; las Dinámicas, relacionadas a la descripción con términos de estados y procesos; también se encuentran las Intencionales, estas

involucran al agente respecto a expresiones y razonamientos sobre creencias, motivaciones, metas, etc., y por último las Sociales, que representan estructuras sociales en relación con su jerarquía, rol de autoridad en el mundo real.

Según el nivel de descripción de conocimiento. Guarino (1998) plantea la siguiente jerarquía: Nivel superior, aquellas que reúnen los conceptos generales de un área de

(26)

conocimiento en diferentes dimensiones (espacio, tiempo, materia, objeto etc.) mientras que las de dominio, reúnen los conceptos propios de una parte de un área; las de tareas, como lo pueden ser actividades, procesos, y por último, se encuentran las ontologías de aplicación, que son el resultado de integrar una de dominio con una de tareas, transformándose en un dominio especializado.

Según el agente que las usa. Taylor (2009) las clasifica como lingüísticas y no lingüísticas, las primeras, se caracterizan por la función de la gramática, la semántica y la sintaxis, lenguaje utilizado por los humanos mientras que las no lingüísticas son un lenguaje utilizado por máquinas. Cabe resaltar que, al unirse aspectos lingüísticos y no lingüísticos en una ontología, podría ser usada tanto por humanos como por máquinas.

Ontologías según el nivel de abstracción o razonamiento. Corcho (2003) las

caracteriza como lightweight porque no hacen inferencias, solo incluyen conceptos, relaciones y propiedades, coherentes con los tesauros, mientras las heavyweight incluyen axiomas que permiten la restricción entre los conceptos y relaciones, en otras palabras, pueden hacer inferencias. Ahora bien, las ontologías usadas para recuperar información deben contar con un nivel de abstracción para que se dé la semántica, esto se hace posible por la lógica de predicados que permite la relación entre conceptos. En este punto, los

significados cambian de manera racional dependiendo de las relaciones previamente dadas, su uso es muy útil en fuentes de información por la interpretación racional, esta lógica evita la polisemia o ambigüedad, y es evidenciada en resultados con mayor asertividad respecto a la necesidad de los usuarios.

Se debe agregar que, para proponer un modelo ontológico se pueden incluir varios tipos de ontologías, con el fin que la propuesta a diseñar responda a las necesidades propias del área a representar.

(27)

Criterios y componentes para la estructura. Teniendo en cuenta lo mencionado

anteriormente, para el diseño de una ontología Gruber (1995) recomienda que se deben tener en cuenta los siguientes criterios:

● Claridad: Cada una de las definiciones empleadas deben ser objetivas y contar con un significado explícito en lenguaje natural que la soporte.

● Coherencia: Permite inferencias entre las definiciones dadas.

● Extensibilidad: Contemplar de manera anticipada nuevas definiciones partiendo de las que ya se tienen, esto con el fin de poderlas especializar en algún momento.

● Sesgo de codificación mínimo: Los conceptos no deben estar dependientes a una particularidad, pero sí al nivel del conocimiento al que aplique.

● Compromiso ontológico mínimo: Evitar afirmaciones, permitir especializarse según se haga necesario en el momento de representarla.

También, define los componentes que requiere la estructura ontológica, estos son:

● Conceptos: Son representaciones del conocimiento, pueden ser clases de objetos, estrategias, etc.

● Relaciones: Enlazan los diferentes conceptos de manera semántica.

● Funciones: Relación concreta, que se da por la relación de varios conceptos permitiendo asignar órdenes semánticas.

● Instancias: Son los objetos de los conceptos, se caracterizan por sus atributos.

● Axiomas: Son relaciones que deben cumplir los conceptos para cumplir una condición, permite que se den las restricciones.

Ahora bien, los criterios y componentes para que se den las relaciones en ontologías en los tesauros son similares, permiten organizar el conocimiento a nivel de detalle,

relaciones y restricciones oportunas, por esto, se puede tener en cuenta el análisis previo

(28)

realizado para el Tesauro y tomarlo como suministro. En cuanto a la particularidad de las ontologías, estas permiten hacer inferencias de acuerdo con lo que se desea representar. Sus inferencias estarán dadas según el análisis que se realizará para la representación de la literatura colombiana, estas surgen cuando la propuesta del modelo ontológico planteado se encuentre en edición, por otra parte, aspectos como el público objetivo, el campo de acción a aplicar y dónde se desea modelar cobran importancia, ya que, en relación con estos, se elige una metodología que guíe la construcción de la propuesta ontológica.

Se debe tener en cuenta que no existe una metodología que indique un modelo rígido a seguir para la construcción de ontologías, dada esta libertad se han creado una variedad de metodologías basadas en criterios que responden a las necesidades particulares de lo que se quiera representar, estas se desarrollan en fases que varían de acuerdo con cada modelo, partiendo de lo anterior, se puede decir que, el profesional de la información puede valerse de esta flexibilidad para tomar algunos criterios de diferentes metodologías que se ajusten a su necesidad y de esta manera crear una nueva, siento esta mixta y única. Lo más importante en la elección de una metodología para la construcción de una propuesta ontológica es el

objetivo que conlleva a su construcción, pues ésta pretende responder a necesidades específicas.

En consecuencia, las ontologías usadas para la organización de información en bibliotecas digitales son un apoyo para estar cerca a la extensión de la web.

6.2 Bibliotecas digitales

Una biblioteca digital es una colección en línea de objetos digitales de buena calidad, creados o recopilados y administrados de conformidad con principios aceptados en el plano internacional para la creación de colecciones, y que se ponen a disposición de

(29)

manera coherente y perdurable y con el respaldo de los servicios necesarios para que los usuarios puedan encontrar y utilizar esos recursos. (IFLA, 2021, párr. 5)

Así mismo, Bauste (como se citó en Noguez-Ortiz, 2010) afirma que:

El énfasis está en los contenidos, las colecciones y los usuarios, haciendo referencia a los procesos de selección, digitalización y comunicación por parte de los usuarios.

Desde el punto de vista de los bibliotecarios, la biblioteca digital es una organización que les agrega valor a los recursos de información digital y vela por la preservación de las colecciones al tiempo que garantiza el acceso. Esta conjunción del trabajo de los investigadores y el de los profesionales de la información en un mismo espacio virtual, ha disminuido las diferencias entre ambas teorías (p. 99).

En consecuencia, los factores que han condicionado el desarrollo de las bibliotecas digitales son diversos y están estrechamente relacionados con las tecnologías de la información y las comunicaciones, con el desarrollo de las Ciencia de Información y dentro de esta con los enormes progresos en las teorías de recuperación de información, las relaciones usuarios-sistema, los catálogos en línea, la bibliometría, los sistemas automatizados para bibliotecas, y también con la aparición de nuevas necesidades en la sociedad. (Cabrera, 2015, p. 364)

Según Zamora Fonseca y Cañedo Iglesias (2008), “Algunos autores plantean que las bibliotecas digitales son esencialmente bibliotecas electrónicas. Si se acepta esto como cierto, la biblioteca digital sería una continuación del desarrollo de la biblioteca electrónica, pero que ha evolucionado hacia la introducción de elementos digitales” (p. 11).

(30)

Adicionalmente, Noguez-Ortiz (2010) plantea que las definiciones de biblioteca electrónica, híbrida, virtual y los centros relacionados con la información e inclusive la biblioteca Web 2.0 se encuentran relacionados con el término biblioteca digital.

Teniendo en cuenta lo anterior, la biblioteca electrónica Mercury de la Universidad Carnegie Mellon es conocida como la primera biblioteca digital en una universidad de Estados Unidos, cuando se puso a disposición de los usuarios solamente contaba con una docena de bases de datos textuales y una colección de imágenes de páginas de artículos de revistas de informática (Arms, 2012).

Después de conocer algunas definiciones realizadas por algunos autores es importante tener en cuenta cómo las organizaciones internacionales y nacionales definen la biblioteca digital, por ser un referente en esta área.

Así mismo, en el contexto internacional, adicional al primer concepto dado por la Federación Internacional de Asociaciones de Bibliotecarios y Bibliotecas IFLA al inicio de este apartado, cabe resaltar la importancia que tienen las bibliotecas digitales según la IFLA, ya que éstas aportan conocimiento a los usuarios en el ámbito cultural, patrimonial y

científico de un país, por esto sugieren que los gobiernos nacionales adopten estrategias de digitalización de la información, esto para asegurar a los usuarios el acceso a ella y por supuesto la preservación de los materiales físicos que se encuentran en deterioro (IFLA, 2021).

Dada la anterior cita, se puede inferir que las organizaciones internacionales se preocupan por el patrimonio documental de cada uno de los países, en busca de mejorar la prestación de sus servicios de información de la mano de las nuevas tecnologías.

(31)

En este sentido en Colombia, la Red Nacional Académica de Tecnología Avanzada RENATA (2021) menciona que: Una BiDi está compuesta por una o más colecciones organizadas de documentos digitales que a través de un conjunto de servicios digitales, permite a los usuarios acceder a información relevante de acuerdo con su necesidad de información. Son múltiples los inconvenientes que han tenido que afrontar las bibliotecas para que dichas colecciones y documentos sean visibles en una red como Internet, como las limitaciones en ancho de banda y calidad del servicio del Internet actual, esto unido al desarrollo dispar de los recursos (humano, tecnológico, económico, social, etc.) de las

instituciones colombianas que ocasionan el aislamiento y la falta de integración de iniciativas regionales y nacionales. (párr. 2).

En consecuencia, la importancia de las bibliotecas digitales radica en la organización de la información y su fácil acceso, donde los usuarios pueden hacer consultas desde

cualquier lugar, ya que los materiales están disponibles 24-7. Cabe resaltar que, algunos de los materiales que se encuentran en físico también están disponibles de manera digital, esto con el fin de su preservación, pues de esta manera no se exponen a una constante

manipulación.

6.3 Ontologías y bibliotecas digitales

La web semántica ha generado nuevas necesidades, y algunas bibliotecas digitales han transformado sus espacios aprovechando los avances y facilidades que brinda la tecnología, es así como la organización y recuperación de información es uno de los aspectos en los cuales han trabajado mediante el uso de ontologías.

Weinstein y Birmingham (como se citó en Sá Ramalho y Spotti Lopes, 2011) mencionan que el uso de ontologías en bibliotecas tiene los siguientes beneficios:

(32)

● Consultas más precisas: como todos los conceptos de una ontología pueden ser utilizados como puntos de acceso para consultas, posibilitan expresiones de búsqueda más adecuadas y precisas.

● Explicitar búsquedas imprecisas para consultas precisas: en ontologías, los atributos son definidos por sus relaciones con otros atributos, ofreciendo numerosas secuencias intuitivamente naturales para auxiliar los usuarios en la articulación de sus

necesidades y refinamiento de las consultas, tornándose cada vez más específicas.

● Integración de catálogos: el mismo tipo de raciocinio usado para agrupar

descripciones bibliográficas puede ser aplicado para integrar múltiples catálogos.

● Cálculo de las necesidades de licencia por servicio: los relacionamientos de la ontología pueden proporcionar un lenguaje para expresar contratos de licencia, así como también medios para computar tasas de servicio en tiempo de ejecución.

6.4 Requerimientos funcionales 6.4.1 Lenguaje de representación

Es necesario un lenguaje de representación para utilizar las ontologías en la Web semántica, se debe tener en cuenta que debe ser compatible con la herramienta para editar la ontología, los lenguajes más utilizados son: OIL, XOL, SHOE, entre otros.

6.4.2 Herramienta para edición

Paralelamente, existen una variedad de software de código abierto para la edición de ontologías como: Protégé, SWOOP, OntoStudio, WebODE, entre otros; estos se caracterizan por contar con una interfaz gráfica que permite visualizar el modelo, en estos se puede observar las preguntas y respuestas a las que puede responder la ontología de tal manera que se pueden ajustar para evitar cruce e información repetitiva.

(33)

6.4.3 Infraestructura para el uso de ontologías en bibliotecas digitales

La infraestructura es un aspecto clave para el funcionamiento adecuado de la ontología de literatura colombiana en una biblioteca digital, además de ejecutarse en la herramienta de edición necesita una plataforma para crear y construir sus contenidos, existen infraestructuras de acceso abierto como: Greenstone, DSpace, Fedora, entre otros.

6.5 Acceso al conocimiento en bibliotecas digitales: área literatura colombiana Uno de los principales objetivos de una ontología no se enfoca en cambiar la

organización de revistas, libros y recursos relacionados, sino, representar el conocimiento de manera que el usuario tenga al alcance el contenido de dominios, facilidad de navegación dentro de él, y a su vez contar con filtros como delimitar por temas de interés (Suárez, 2018).

Para crear una ontología se requiere que existan ciertas necesidades específicas en un contexto, Berners (como se citó en Suárez, 2018) afirma que estas necesidades son:

a) Necesidades representadoras con características específicas (dominios nuevos, dominios en los que sea necesarias explicaciones conceptuales, dominios no

abordados adecuadamente por otros sistemas para la organización del conocimiento) bajo el esquema de ontologías profundas.

b) Dominios específicos de conocimiento con necesidades particulares de organización y recuperación: terminología, jerarquía, descripción, etc., bajo el esquema de ontologías ligeras.

c) Necesidades de organización-recuperación que se inserten dentro del modelo de la web semántica. (p. 33)

Cada día son más los países interesados en ser reconocidos por sus aportes investigativos, dado que es una manera de reconocimiento intelectual que abre puertas al

(34)

desarrollo del país en general. Mansilla Torres (2006) afirma que: “La literatura no sólo representa la identidad cultural de la comunidad o colectividad desde donde emerge como escritura artística institucionalmente aceptada y legitimada en cuanto tal, sino que produce identidad” (párr. 1).

Partiendo de lo anterior, visibilizar la literatura es dar a conocer aspectos autóctonos y recónditos que generan el interés de diversas culturas, esto no solamente genera un atractivo nacional, sino también a nivel internacional, lo cual genera movimiento en la economía.

En consecuencia,

La ciencia y la divulgación son complementarias; mientras la ciencia se apoya, para darle sentido a sus conceptos, en metodologías teóricas y prácticas, la divulgación se apoya en herramientas del lenguaje para explicar los conceptos de la ciencia,

reproducir las imágenes, usar los modelos y rescatar el espíritu del conocimiento científico, pues no se trata solo de redactar una “noticia científica”, se trata de expresar ideas, resultados, hipótesis, planteamientos, tesis, etc. (Briceño, 2012, p. 3)

Para esta propuesta se realizará teniendo en cuenta el Tesauro del Sistema de Información de Literatura Colombiana en el aspecto donde se relacionan diferentes contenidos, teniendo en cuenta que no se ha elaborado algo parecido en otros países

latinoamericanos, y que puede llegar a ser una motivación para otros lugares donde quieran dar a conocer su producción literaria.

(35)

7 Propuesta Metodológica

7.1 Enfoque de investigación

El enfoque de esta investigación será cualitativo, teniendo en cuenta que para Hernández Sampieri (2014):

El enfoque cualitativo también se guía por áreas o temas significativos de investigación. Sin embargo, en lugar de que la claridad sobre las preguntas de

investigación e hipótesis preceda a la recolección y el análisis de los datos (como en la mayoría de los estudios cuantitativos), los estudios cualitativos pueden desarrollar preguntas e hipótesis antes, durante o después de la recolección y el análisis de los datos. Con frecuencia, estas actividades sirven, primero, para descubrir cuáles son las preguntas de investigación más importantes; y después, para perfeccionarlas y

responderlas. (p.7).

Esta investigación pretende buscar los conceptos que se emplean para relacionar a la literatura colombiana, esto con el fin de identificar las cualidades propias que mejor la representan, de tal manera que a partir de estos se pueda construir variedad de relaciones.

7.2 Tipo de investigación

El tipo de investigación es un estudio de caso dado que la ontología tendrá como herramienta el Tesauro del Sistema de Información de Literatura Colombiana – SILC. Un estudio de caso para Chetty (como se citó en Martínez Carazo, 2006) lo define como:

● Es adecuada para investigar fenómenos en los que se busca dar respuesta a cómo y por qué ocurren.

● Permite estudiar un tema determinado.

(36)

● Es ideal para el estudio de temas de investigación en los que las teorías existentes son inadecuadas.

● Permite estudiar los fenómenos desde múltiples perspectivas y no desde la influencia de una sola variable.

● Permite explorar en forma más profunda y obtener un conocimiento más amplio sobre cada fenómeno, lo cual permite la aparición de nuevas señales sobre los temas que emergen, y

● Juega un papel importante en la investigación, por lo que no debería ser utilizado meramente como la exploración inicial de un fenómeno determinado. (p. 175)

Dentro de los métodos de procesamiento de información se utilizarán técnicas como la revisión documental ya que se compone de “Una serie de métodos y técnicas de búsqueda, procesamiento y almacenamiento de la información contenida en los documentos, en primera instancia, y la presentación sistemática, coherente y suficientemente argumentada de nueva información en un documento científico, en segunda instancia” (Tancara, 1993, p. 94).

La sistematización de la información se hará mediante la creación de cuadros

comparativos de las diferentes estructuras y metodologías para hacer ontologías de las cuales se establecerá cuál es la más adecuada para el Tesauro. Después de esto, se construye un mapa conceptual en CmapTools para organizar la información de tal manera que se visualicen las relaciones y jerarquías que se verán reflejadas en la ontología

7.3 Resultados esperados

Los resultados de esta investigación son útiles para la selección de la tipología de ontología más adecuada y la metodología más pertinente para la propuesta ontológica de literatura colombiana, que será útil para investigadores, docentes, literatos, amantes de la literatura y usuarios afines interesados en la producción literaria colombiana, pues al emplear

(37)

esta ontología en un buscador de biblioteca digital facilita la recuperación de información de manera contextualizada, estas búsquedas se caracterizan por aspectos como rapidez y

asertividad a la hora de generar resultados, en este punto, no es necesario realizar una

variedad de búsquedas donde se empleen diferentes sinónimos ya que la ontología comprende y procesa la necesidad de información previa expresada en lenguaje natural.

(38)

8 Metodologías para ontologías

El propósito de este capítulo es realizar un análisis y evaluación de las diferentes metodologías utilizadas en las investigaciones presentadas en el estado del arte, con el fin de escoger una de ellas para la construcción de la propuesta o bien realizar un híbrido que se acomode a las necesidades para lograr el objetivo.

Para empezar, Giraldo, Ruíz y Mateus, (2011) aseguran que, se empleó una guía para la construcción de ontologías desde cero, esta se llama Ontology-101, la cual se compone de una serie de pasos, los cuales son:

● Dominio y alcance de la ontología: en este paso se especifica el área o tema el cual va a trabajar la ontología, para qué se va a usar y qué preguntas podrá responder.

● Considera reutilización: se pueden tener en cuenta ontologías ya existentes, con el fin de perfeccionarla o ampliarla aún más.

● Enumeración de términos: se enumeran los términos más importantes y sobre los cuales se va a hacer más énfasis en la ontología.

● Establece clases y jerarquía de clases: para establecer las clases y jerarquías de las clases se hace mediante una herramienta de edición, en la mayoría de los casos se usa la herramienta Protégé.

Esta ontología fue implementada en la biblioteca digital BiDiAPI, una de las ventajas de esta guía es que puede llegar a tener en cuenta otras ontologías, no se limita simplemente a empezar de cero.

Con respecto a Romero Borda, L. (2014) para el diseño de la ontología en fotografía recurrió a la metodología propuesta por Muto y Alvarez (s.f.), está consta de 10 paso los

(39)

cuales incluyen 11 plantillas mediante las cuales se estructura la información para la ontología; a continuación, se expondrá una breve descripción de cada una de estas:

1. Delimitación del dominio y alcance de la ontología (plantilla 1): concretar si la

ontología que se plantea se encuentra enfocada a una colección específica, y examinar aspectos propios que contienen los recursos que conforman el todo. Ahora bien, en esta plantilla se diligenciaron los siguientes criterios: propósito, dominio, alcance, limitaciones y fuentes de información.

2. Definir escenarios de motivación (plantilla 2): esta plantilla aclara el para qué y el porqué de crear la ontología, además el contexto en el cual se aplicará y a quiénes es útil.

3. Formular preguntas de competencia (plantilla 3): se crean preguntas basadas en las posibles respuestas en la que la ontología estará en la capacidad de dar, estas

preguntas contarán con diferentes componentes (compositivo, formal y contextual) de acuerdo con el nivel de las preguntas, ya que pueden estar dadas para diferentes categorías.

4. Enumerar términos importantes en la ontología (plantilla 4 y 5): define los conceptos de manera jerárquica (superclase, clase, subclase e instancia) de tal manera que se empieza desde lo más general hasta los más específico dentro del área, los campos requeridos en esta plantilla están dados como: terminología y relación. También define los términos y sus relaciones, de forma que, se puedan agrupar por áreas dentro del todo, los campos a diligenciar son: término, sinónimos, tipo y descripción.

5. Definir conceptos y herencia de conceptos (plantilla 6): se realizan las diferentes relaciones entre los conceptos, ya sean por asociación o herencia, dados en concepto general y conceptos especializados.

(40)

6. Definir propiedades de los conceptos (plantilla 7 y 8): se definen las propiedades son atributos que identifican y hacen únicos a los conceptos, se deben diligenciar los campos de: concepto, sinónimos, instancias y propiedades del concepto, para los anteriores campos se tiene en cuenta la plantilla 5, además se requiere de la información de la plantilla 6 para diligenciar en la plantilla 7 los campos de:

propiedades de herencia, rol y relaciones. Para la plantilla 8 se requiere de cierta información de la plantilla 7 para crear las relaciones entre los conceptos es importante completar la información de: nombre de la relación, concepto fuente, concepto de llegada, herencia, cardinalidad y relación inversa.

7. Definir las características de las propiedades (plantilla 9): después haber definido cada una de las propiedades se debe especificar las características de estas, para esto se usa como base parte de la información consignada en la plantilla 7 y 8. Se define el tipo de valor, unidad de medida, rango de valores, cardinalidad, si es o no requerido, valor por defecto, valor fijo y propiedad inversa; lo anterior se le asigna a cada concepto para que opere dentro de la ontología.

8. Definir restricciones (plantilla 10): las restricciones son condiciones para las propiedades de conceptos, esto con el fin de identificar la coherencia de la

información, se asigna nombre a la descripción, se incluyen los conceptos, se extraen las propiedades y relaciones de la plantilla 7, y se asigna un nombre a la variable usada.

9. Crear instancias (plantilla 11): finalmente, para crear las instancias se seleccionan los términos de la plantilla 5, que también se incluyen en la plantilla 10, se deben

describir los campos: concepto, propiedad y valores.

10. Evaluación: se debe hacer una revisión detallada teniendo en cuenta la información consignada en la plantilla 2, verificar los requisitos que se definieron en la plantilla 1,

(41)

también se debe revisar que el diagrama de conceptos sea coherente con las preguntas de competencia.

Ahora bien, la metodología elegida permitió modelar el fondo fotográfico de Nereo López Mesa de la Biblioteca Nacional de Colombia, al finalizar la investigación se identificó que las ventajas de esta propuesta se enmarcan en la flexibilidad de poder ser aplicable a cualquier colección de fotografía, en busca de optimizar la búsqueda y recuperación de información de estos recursos, lo cual impacta en la visibilidad de los mismos. Cabe aclarar que este diseño ontológico no fue editado en ninguna herramienta ni tampoco fue

implementado.

Así mismo, Ciprian y Rodríguez (2017) utilizaron la metodología anteriormente descrita, para este caso, realizaron únicamente una propuesta, por lo que tampoco fue implementada.

Por otro lado, Torres Galindo (2016) diseño una guía metodológica donde tuvo en cuenta los términos registrados en el diccionario geográfico de Colombia y adaptarlos a una ontología. En consecuencia, se enfocó en el análisis de diferentes metodologías que

estuvieran en la facultad de guiar la construcción de dicha guía, no obstante, decidió diseñar una propia, partiendo de la metodología de construcción de ontologías terminológicas.

Las ontologías terminológicas con frecuencia son usadas para unificar vocabularios, lo que resultó ser una ventaja, ya que, cuando el diccionario está normalizado, el análisis de departamentos es mucho más específico. Dado lo anterior, la ontología tuvo en cuenta la estructura y organización de los términos del diccionario geográfico de Colombia, pero se basó únicamente en el Municipio de La Calera.

(42)

Cabe aclarar, que, al utilizar los términos del vocabulario, la metodología se enfoca en el registro de estos en una estructura ontológica. En relación con la metodología esta se compone por los siguientes pasos:

● Paso 1: descarga y desarrollo de la herramienta Protegé Destkop 5.0 beta para Windows.

● Paso 2: verificar la estructura y el lenguaje para la correcta edición de la ontología en la herramienta.

● Paso 3: se inicia la organización de información de manera jerárquica en clases.

● Paso 4: se deben consultar los parámetros de la guía para la construcción de

ontologías en OWL, con el fin de identificar qué datos del diccionario se registrarán para la ontología.

● Paso 5: se crean los object property y los individuals; las propiedades, se relacionan con términos, se tienen en cuenta que las propiedades y los términos al unirse representan una definición, por ejemplo; PerteneceA, LocalizadoEn, CercaA, etc.

● Paso 6: se unen los individuals y los property para relacionar los datos.

Partiendo de lo anterior, se puede decir que la reutilización de términos normalizados que se hallan en diccionarios, tesauros, etc., resultan ser de gran ayuda para la construcción de ontologías, además de la facilidad de construir ontologías robustas con mayor alcance en menos tiempo de análisis en sobre los términos a usar.

Por su parte, Montenegro Sánchez, M. (2018) realizó una propuesta ontológica para la Biblioteca del Congreso de la República de Colombia mediante la cual garantiza la búsqueda y recuperación de información, para esto, recurrió a la metodología diseñada por Quiñonez, A. (como se citó en Montenegro Sánchez, 2018) esta consta de 4 fases, donde en cada una se

(43)

deben cumplir con actividades y productos, las fases en las que se encuentra elaborada la metodología son las siguientes:

● Fase de identificación: en esta fase se observa, recopila y analiza el contexto, como es para el caso desde el organigrama, para conseguir esto se realizan una serie de

actividades para determinar aspectos como el objetivo, el alcance y el diagrama de la ontología.

● Fase de análisis: en esta fase se analiza con detalle las diferentes áreas con las que cuenta el tema general como pueden ser los tipos, factores que se relacionen, funciones y demás aspectos que vinculen alguna relación, cada una de estas actividades generan productos que se deben incluir en el diagrama de la ontología.

● Fase de determinación: en esta fase ya no se evalúan, sino que se determinan los conceptos, relaciones e instancias para realizar la conceptualización en la propuesta ontológica.

● Fase de presentación: en este punto, el producto es la ontología, su representación gráfica y sustentada.

La anterior metodología fue la guía para la construcción de la propuesta a la

Biblioteca del Congreso de la República de Colombia en el marco de la transparencia de la información, una de las desventajas de esta ontología es su aplicabilidad, a pesar que, para el levantamiento de información se analizaron las bibliotecas del congreso de otros países, para la construcción de la ontología se basó en los contenidos de autoría almacenados en

diferentes portales web del Congreso, es decir que solo sería útil para esta institución.

(44)

En cuanto a, Ramírez Sosa, J. (2019) creó un sistema experto basado en ontologías, para esto, siguió dos metodologías, la NeOn para la integrar la red de ontologías y la Linked Data para la semántica.

Metodología NeOn, esta se compone por 9 escenarios, pero para el sistema experto solo utilizó las siguientes:

● Escenario 1: definir los requerimientos de la problemática del contexto de aplicación, claridad sobre propósito, alcance, lenguaje de implementación, usuarios finales previstos, usos previstos y requerimientos.

● Escenario 2: reutilización y rediseño de contenidos no ontológicos.

● Escenario 3: reutilización de contenidos ontológicos.

● Escenario 9: localización de estos contenidos.

Metodología Linked Data:

● Especificación: este es el resultado del modelado, y el modelado es previamente realizado por la metodología NeOn en la ontología que se pretende realizar.

● Generación RDF: en este punto, se realiza la carga de información transaccional y seguidamente se genera el RDF.

● Publicación: el RDF generado despliega un triple store.

Al integrar y seguir los lineamientos de estas metodologías se consiguió crear un sistema experto basado en las reglas que permiten las ontologías para la detección de fraude en transacciones bancarias de tarjetas de crédito. De los resultados de esta investigación se puede destacar un gran aporte en cuanto a la integridad de ontologías, y especialmente este producto, ya que es un sistema experto que da solución a una problemática que puede presentarse en cualquier entidad financiera, lo que quiere decir que puede ser adaptado.

Referencias

Documento similar