EVALUACIÓN DE HERRAMIENTAS DE BÚSQUEDA FEDERADA PARA SU IMPLEMENTACIÓN EN BIBLIOTECAS UNIVERSITARIAS

(1)

EVALUACIÓN DE HERRAMIENTAS DE BÚSQUEDA FEDERADA PARA SU IMPLEMENTACIÓN EN BIBLIOTECAS UNIVERSITARIAS

ELIANA MERCEDES MATALLANA FONSECA NANCY SOFIA SARMIENTO BALLESTEROS

PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE COMUNICACION Y LENGUAJE

CARRERA DE CIENCIA DE LA INFORMACIÓN – BIBLIOTECOLOGIA BOGOTÁ D.C.

2009

(2)

2

EVALUACIÓN DE HERRAMIENTAS DE BÚSQUEDA FEDERADA PARA SU IMPLEMENTACIÓN EN BIBLIOTECAS UNIVERSITARIAS

ELIANA MERCEDES MATALLANA FONSECA NANCY SOFIA SARMIENTO BALLESTEROS

Trabajo de grado presentado como requisito para optar al Título de Profesional en Ciencia de la Información-Bibliotecología

Director

ALFREDO MENÉNDEZ

PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE COMUNICACION Y LENGUAJE

CARRERA DE CIENCIA DE LA INFORMACIÓN – BIBLIOTECOLOGIA BOGOTÁ D.C.

2009

(3)

9

A mi papá (q.e.p.d), mi mamá, mis hermanos y Andrés.

Gracias por su apoyo.

Eliana Matallana Fonseca.

Dedico este trabajo a Dios quien me ilumina y fortalece cada día para salir adelante. A mis papás Sofía y Eduardo quienes me han enseñado a ser responsable y a cumplir con mis deberes para lograr mis metas. A mis hermanos Antonio, Yaneth y Nury que me apoyan en todo momento; y a mis sobrinos Juliana, Juan Felipe y Juan Sebastián a quienes les quiero decir que con perseverancia pueden lograr sus sueños.

Nancy Sofía Sarmiento B.

(4)

10 CONTENIDO

Pág.

INTRODUCCIÓN 17

1. DESCRIPCIÓN DEL PROBLEMA 20

1.1 ANTECEDENTES 21

1.2 PLANTEAMIENTO DEL PROBLEMA 22

1.3 JUSTIFICACIÓN 24

2. OBJETIVOS 26

2.1 OBJETIVO GENERAL 26

2.2 OBJETIVOS ESPECIFICOS 26

3. METODOLOGÍA 27

4. MARCO TEÓRICO 28

4.1 LOS SERVICIOS DE RECUPERACIÓN DE INFORMACIÓN EN LAS BIBLIOTECAS UNIVERSITARIAS 28

4.2 ANALISIS DOFA 30

4. 3 BENCHMARKING 32

4.4 TIPOLOGIAS DE WEB 33

4.4.1 World Wide Web 35

4.4.2 Web 2.0 38

4.4.3 Web semántica 39

4.4.4 W3C (World Wide Web Consortium) 44

4.5 INTERNET INVISIBLE 45

(5)

11

4.6 MOTORES DE BÚSQUEDA 46

4.7 LOS SISTEMAS DE BÚSQUEDA FEDERADA 49

4.7.1 Beneficios de una herramienta de búsqueda federada 51

5. DESARROLLO DE EVALUACIÓN DE HERRAMIENTAS DE BÚSQUEDA FEDERADA 54

5.1 GENERALIDADES 56

5.2 DESCRIPCION DE LAS HERRAMIENTAS DE BUSQUEDA FEDERADA 56

5.2.1 DBWIZ 56

5.2.1.1 Antecedentes de DBWiz 56

5.2.1.2 Funciones 57

5.2.2 Swetswise Searcher 72

5.2.2.1 Antecedentes 72

5.2.3 Metalib 77

5.2.4 WebFeat 91

6. CRITERIOS PARA EVALUAR HERRAMIENTAS DE BÚSQUEDA 98

FEDERADA 6.1 REQUERIMIENTOS LOCALES 98

6.2 REQUERIMIENTOS DE APLICACIÓN 99

6.3 FUNCIONES DE BUSQUEDA 100

6.4 FUNCIONES DE PERSONALIZACION DEL USUARIO 101

(6)

12

6.5 FUNCIONES DE CONTROL DE ACCESO 102

6.6 INTEGRACIÓN DEL OPAC 102

6.7 CONSIDERACIONES DEL DISTRIBUIDOR 102

6.8 HERRAMIENTAS DE GESTIÓN 102

7. BENCHMARKING COMPETITIVO DE LAS HERRAMIENTAS DE BUSQUEDA FEDERADA 103

8. ANÁLISIS DOFA DE LAS HERRAMIENTAS DE BUSQUEDA FEDERADA 106

8.1 ANALISIS DOFA DE DBWIZ 106

8.2 ANALISIS DOFA DE SWETSWISE SEARCHER 107

8.3 ANALISIS DOFA DE METALIB 109

8.4 ANALISIS DOFA DE WEBFET 111

9. EVALUACIÓN GENERAL DE HERRAMIENTAS DE BUSQUEDA FEDERADA 113

10. CONCLUSIONES 121

11. RECOMENDACIONES 123

GLOSARIO 125

BIBLIOGRAFIA 131

ANEXOS 138

(7)

13

LISTA DE GRÁFICOS

Pág.

Gráfico 1. Diferencias entre la web 1.0 y la Web 2.0 36 Gráfico 2. Arquitectura de la web semantica 41

Gráfico 3. Mapa conceptual de la Web semántica 43

(8)

14

LISTA DE FIGURAS

Pág.

Figura 1: Búsqueda básica DBWIZ 58

Figura 2: Búsqueda avanzada DBWIZ 59

Figura 3: Resultados DBWIZ 60

Figura 4: Registro de citas DBWIZ 61

Figura 5: Resultados ordenados por año DBWIZ 61

Figura 6: Limitar resultados de la búsqueda DBWIZ 62 Figura 7: Opciones de administración DDWIZ 63 Figura 8: Opciones de configuración DBWIZ 63

Figura 9: Adicionar una nueva categoría DBWIZ 64

Figura 10: Edición de una categoría DBWIZ 65

Figura 11: Agregar un recurso a una categoría DBWIZ 65 Figura 12: Listado de los recursos DBWIZ 66

Figura 13: Activación de una categoría DBWIZ 66

Figura 14: Búsqueda de recursos DBWIZ – configuración 67

Figura 15: Detalles de recursos DBWIZ 67

Figura 16: Configuración de recursos DBWIZ 68 Figura 17: Configuración de las opciones de visualización DBWIZ 68

Figura 18: Autorización de IDs DBWIZ 69

Figura 19: Plantillas DBWIZ 70

Figura 20: Edición de plantillas DBWIZ 70

Figura 21: Hojas de estilo de DBWIZ 70

(9)

15

Figura 22: Edición de la hoja de estilo DBWIZ 71

Figura 23: Personalización de la búsqueda SwetWise Searcher 73 Figura 24: Personalización de resultados SwetWise Searcher 74 Figura 24: Panel de control SwetWise Searcher 74

Figura 25: Historial de búsqueda SwetWise Searcher 75 Figura 26: Contenidos de fuente de información SwetWise Searcher 77 Figura 27. Búsqueda rápida SwetWise Searcher Metalib 79 Figura 28. Resultado de la búsqueda rápida Metalib 80

Figura 29. Presentación de resultados Metalib 81

Figura 30. Despliegue de resultados Metalib 82

Figura 31. Búsqueda en bases de datos Metalib 83 Figura 32. Selección de bases de datos Metalib 83 Figura 33. Búsqueda en revistas electrónicas Metalib 84 Figura 34. Elección de bases de datos Metalib 85 Figura 35. Configuración de perfil de usuario Metalib 86 Figura 36. Ambiente personalizado Metalib 87

Figura 37. Catalogación de contenidos mediante DublinCore 89 Figura 38. Búsqueda en WebFeat 103

Figura 39. Interfaz del usuario WebFeat 94

Figura 40. Categorías de temas WebFeat 95

Figura 41. Patrón de autenticación WebFeat 95

Figura 42. Configuración del catálogo WebFeat 96

Figura 43. Guardar, imprimir y enviar resultados por e-mail WebFeat 96

(10)

16

LISTA DE ANEXOS

Pág.

ANEXO A. Evaluación de criterios aplicados a la herramienta de

búsqueda federada –DBWIZ 138

ANEXO B. Evaluación de criterios aplicados a la herramienta de

búsqueda federada – SwetWise Searcher 141 ANEXO C. Evaluación de criterios aplicados a la herramienta de

búsqueda federada – Metalib 144 ANEXO D. Evaluación de criterios aplicados a la herramienta de

búsqueda federada – WebFeat 147

(11)

17

INTRODUCCIÓN

La información científica comenzó a publicarse únicamente en papel, esto ocasionaba no sólo la demora en su difusión por los costos de edición, publicación y distribución y el tiempo que le tomaba a las editoriales, sino que las investigaciones no se pudieran conocer. Luego apareció una variedad de servicios, aplicaciones y tecnologías, que utilizan equipos y programas informáticos, y se transmiten a través de las redes de telecomunicaciones, denominadas Tecnologías de la Información y las Comunicaciones (TIC), que produjo un crecimiento exponencial en los recursos, y un cambio en la sociedad con respecto a la difusión de la información; entonces, aparecieron nuevas posibilidades en el acceso, el almacenamiento y la utilización de la información, dando origen a una nueva sociedad llamada “la sociedad de la información”.

A través de las conexiones en red se comenzaron a eliminar las barreras geográficas; esto condujo a la globalización de la información, lo que a su vez permitió que ésta estuviera al alcance de toda la comunidad científica y social.

Debido a este despliegue de tecnología y de facilidad de acceso a la información, las instituciones dedicadas al manejo de la información tuvieron la necesidad de cambiar las tecnologías tradicionales a otras más acordes con los nuevos tiempos, implementando nuevas herramientas con el fin de administrar más eficientemente sus recursos.

Debido al cambio que se ha producido en las tecnologías y en los medios de recuperación, almacenamiento y difusión de la información, las bibliotecas también están buscando nuevos recursos y herramientas para ofrecer a sus usuarios la posibilidad de acceder a la información científica. Para ello recurren a otros recursos diferentes al formato impreso con el fin de que los usuarios tengan otras opciones para llegar a la información que satisfaga sus necesidades.

(12)

18

Estos recursos que sirven como herramientas de apoyo a las bibliotecas para difundir la información científica son los recursos electrónicos. La ISBD (ER) denomina recursos electrónicos a los materiales que se manejan mediante computador, incluyendo los que requieren el uso de dispositivos periféricos (un lector de CD-ROM), se utilicen de manera interactiva o no. Pueden incluir datos (texto, gráficos, imágenes, sonidos, o su combinación), programas (instrucciones que procesan los datos) o la combinación de datos y programas (servicios online, multimedia interactivos). Según la Norma ISO 690:1987 y 690-2 los recursos electrónicos constituyen las bases de datos y programas informáticos ya sea en línea (Internet) o soportes informáticos tangibles (CD-ROM, disquete, videos).

Los recursos electrónicos requieren de herramientas por medio de las cuales puedan ser localizados, como es el caso de los motores de búsqueda. Luego se comenzaron a utilizar otras herramientas que hacían la búsqueda mediante varios buscadores, son los metabuscadores. Pero las Bibliotecas requieren de herramientas más sofisticadas que puedan realizar búsquedas simultáneas a través de todos sus recursos electrónicos, es allí donde entran a jugar un papel importante las Herramientas de Búsqueda Federada.

Anteriormente se realizó un proyecto en conjunto con diferentes bibliotecas universitarias para evaluar este tipo de herramientas, pero la que seleccionaron no cumplió con las expectativas del proyecto. Por tal motivo, se tuvo en cuenta que aún se encuentran allí las Herramientas de Búsqueda Federada^∗ (HBF) como un producto para mejorar el acceso a todos los recursos con los que cuenta una biblioteca universitaria.

Los objetivos de este trabajo están dirigidos hacia la evaluación de este tipo de herramientas para proponer cuál es la que más se adapta a las necesidades de las bibliotecas universitarias. Como existe una amplia variedad de esta clase de

∗En el desarrollo de este trabajo de grado las herramientas de búsqueda federada se abreviaran con estas letras HBF

(13)

19

herramientas, se eligieron cuatro para hacer la evaluación: MetaLib, WebFeat, Sweets Wise Searcher y DBWiz.

A partir de los criterios previamente establecidos para evaluar estas herramientas, se realizó un análisis, y una comparación, que permitirá a una biblioteca universitaria elegir posteriormente la que más se adapte a su presupuesto y necesidades para que sea potencialmente implementada.

Además, son herramientas que a corto plazo deberían hacer parte de algunas, si no de la mayoría de bibliotecas universitarias en Colombia. Esto no sólo mejoraría los servicios de búsqueda y recuperación de información sino que disminuiría el tiempo utilizado en esos procesos.

(14)

20

1. DESCRIPCIÓN DEL PROBLEMA 1.1 ANTECEDENTES

Las bibliotecas universitarias tienen como principal objetivo facilitar a la comunidad académica el acceso a sus recursos y servicios, basados en los principios esenciales de la gestión de calidad hacia la excelencia enfocada al servicio a los usuarios, por lo tanto, se deben comprender sus necesidades presentes y futuras, cumplir sus requisitos y esforzarse en ampliar sus expectativas.

Para crear servicios de calidad y que estén basados en las necesidades de los usuarios se requiere una rápida evolución en tecnologías de información y comunicación dentro de la biblioteca universitaria.

La comunidad universitaria está inmersa en una gran cantidad de información especialmente de fuentes electrónicas que presenta Internet, a través de las cuales, se accede a millones de recursos de información de una manera relativamente fácil, pero que no todas las veces arroja información relevante.

Como dice Eiton Brun¹, la razón por la que no tan sólo consiguen información muy poco relevante formalmente (sus ecuaciones de búsqueda son simplemente pobres, o el lugar en el que buscan no es el adecuado), sino que lo que consiguen es, frecuentemente, también irrelevante semánticamente, es decir, que no les sirve para resolver la necesidad de información que tenían, porque confunden la información que desean obtener con lo que realmente preguntan. Los grandes depósitos de información que constituyen Internet no sirven de nada si no se les interroga adecuadamente, pero tampoco sirven de nada si quien pregunta no sabe realmente cuál es el problema que quiere resolver buscando información. Por lo general, se dirigen a la Web antes de haber meditado sobre cuál es en realidad el problema, es decir, sobre cuál es la información que necesitan.

1 EITO BRUN, Ricardo. La gestión de recursos electrónicos en bibliotecas: la oferta de innovative. En: El profesional de la información, 2008, mayo‐junio, v. 17, n. 3, pp.353

(15)

21

Una solución a este problema es optar por adquirir una herramienta de búsqueda federada: “Los sistemas de búsqueda federada tienen como interfaz una página de consulta que permite consultar simultáneamente bases de datos y revistas-e hospedadas en sitios web de distintos proveedores, recursos internos, etc. Estos sistemas permiten que los usuarios puedan consultar múltiples bases de datos desde un único punto”.² De esta manera las bibliotecas académicas pueden empezar a recuperar información de más alta calidad disponible.

Estas herramientas se están convirtiendo en un producto importante para las bibliotecas académicas y públicas, con productos comerciales y de acceso abierto para elegir; es así como bibliotecas de universidades de prestigio a nivel mundial como Harvard, Cambridge, Stanford, California y Simon Fraser han sido las pioneras en adaptar estas herramientas.

En Colombia la Red Universitaria Metropolitana de Bogotá “RUMBO” fue la pionera en adaptar la herramienta de búsqueda federada SearchSolver de Wolters Kluwer. SearchSolver™ “es la última generación en motores de búsquedas federadas que permite a los usuarios hacer una simple búsqueda a través de una variedad de contenidos, fuentes y así permitir poner a disposición la gran variedad de contenido institucional disponible. Los resultados de la búsqueda son mostrados de una forma fácil de usar, con un formato uniforme que permite al usuario ampliar los resultados de búsqueda o expandir su rango de información así: mostrando el número de resultados asociados con cada una de las bases de datos, ayudando a identificar la fuente correcta de información, sirviendo a la misión del bibliotecario de promover el contenido institucional.

2EITO BRUN, Ricardo. La gestión de recursos electrónicos en bibliotecas: la oferta de innovative. En: El profesional de la información, 2008, mayo‐junio, v. 17, n. 3, pp.353.

(16)

22

El manual de Search Solver³ especifica que este producto permite hacer una búsqueda ilimitada de recursos simultáneamente a través de revistas electrónicas, bases de datos bibliográficas, portales en internet y OPACs. Además, muestra los resultados, después de clasificar o exportar consistentemente a través de las interfaces en un solo paso, depura y limita los resultados usando la interfaz de Search Solver y conecta a fuentes externas, usando Ovid LinkSolver o cualquier otro software para manejo de OpenURL.

A comienzos de 2009 en la ciudad de Cali, la Red Universitaria de Alta Velocidad (RUAV) realizó una investigación para evaluar algunas herramientas de búsqueda federada, entre las que se encontraban Webfeat, 360 search, Powersearch, TDNet y Metalib. En dicha investigación se basaron en cuatro clases de criterios: de funcionalidad, tecnológicos, económicos y de soporte, lo que dio como resultado la elección de Webfeat porque sus características se ajustaron a las condiciones de la RUAV.⁴

1.2 PLANTEAMIENTO DEL PROBLEMA

Los servicios basados en información son un gran apoyo a la comunidad universitaria, esto sumado al surgimiento de nuevas tecnologías hacen que la Biblioteca se preocupe por generar nuevas ayudas para la satisfacción de sus usuarios.

En la actualidad, Internet es una de las primeras herramientas que se consultan para suplir las necesidades de información dentro de las comunidades universitarias, pero se encuentra que uno de los problemas que siempre se

3 OVID. Search Solver, manual del usuario. 2005.

4 CANO RESTREPO, Wbeimar. Aplicación y puesta en marcha de un buscador federado “Webfeat” caso: Red Universitaria de alta velocidad del Cauca. Ponencia presentada en Bibliotic 2009 Bogotá ,Colombia 12 – 15 de Mayo de 2009. p. 4.

(17)

23

presenta en la recuperación de información es que Internet se ha transformado en un medio en donde se publica excesivamente y es allí en donde aparecen problemas en la búsqueda; de esta manera surgen los motores de búsqueda convirtiéndose en una herramienta indispensable en Internet.

Para el caso de las universidades, se presenta un panorama diferente, donde los contenidos almacenados en (Internet global) no son suficientes para proporcionar información relevante a la comunidad académica. En el internet global no se integra la información publicada en Internet invisible como es el caso de las bases de datos, las cuales incluyen información académica y/o científica, y que tienen una característica importante como lo es poder acceder directamente a ella sin necesidad de trasladarse hasta la biblioteca.

Anglada I de Ferrer, comenta que la “biblioteca en el escenario futuro se formará por la simultaneidad de medios y técnicas que convivirán sin exclusividades”⁵, por lo tanto, esta unidad de información deberá estar preparada para adoptar nuevas herramientas de información a su colección y servicios.

Basados en los antecedentes, anteriormente descritos, nace la necesidad de evaluar y poner a consideración cuatro herramientas de búsqueda federada (dbWiz, Metalib, WebFeat y SwetsWise) las cuales han sido adaptadas en universidades reconocidas a nivel nacional y del extranjero.

El desarrollo de este proyecto surge como una iniciativa para introducir a aquellas bibliotecas universitarias que pretendan apropiarse de una herramienta de búsqueda federada y de esta manera suplir las necesidades de sus usuarios, y además busca responder a la pregunta: ¿Qué cualidades, características y

5 ANGLADA I DE FERRER, L.M.: “Biblioteca Digital ¿mejor, peor o solo distinto?” En: Anales de Documentación. Nº 3, 2000. p. 25‐39

(18)

24

funciones debe tener una herramienta de búsqueda federada para responder a las necesidades de las bibliotecas universitarias de Bogotá?

1.3 JUSTIFICACIÓN

Cada vez más la universidad adquiere nuevas herramientas para su comunidad con el fin de facilitar el aprendizaje, como es el caso de los sistemasde gestión de cursos, como Moodle, que ayudan a docentes a desarrollar comunidades en línea a través de la creación de, una contraseña y una conexión a internet. Este proceso facilita tanto a los profesores como a los alumnos el monitoreo del proceso de evaluación en cuanto a los objetivos requeridos por la asignatura o el curso, permitiendo así obtener una retroalimentación constante sin tener que estar presencialmente en la universidad.

Con respecto a lo anterior los profesionales en información deben promover la implementación de una herramienta de búsqueda federada ya que aporta a la universidad un gran beneficio; por medio de ésta, se integran recursos electrónicos de calidad en diversos formatos y logran acceder de forma remota. La herramienta de búsqueda federada permite que la comunidad se encuentre con información científica actualizada, proporcionada por las bases de datos que se integran a dicha herramienta.

En este sentido, Martínez y Vallejo afirman que “los bibliotecólogos ocupados en organizar la información, tendrán que aplicar los principios y normas que han utilizado en la organización de otros tipos de materiales para elaborar los registros de estos nuevos dispositivos de información. Así mismo, estos recursos de información tendrán que ser incorporados dentro del catálogo de la biblioteca,

(19)

25

independientemente de la forma física que éste pueda adoptar y de las opciones que dentro de él se utilicen para almacenar y recuperar la información.”⁶

El Bibliotecólogo tendrá la capacidad lograr recuperar la información que se presente en los diferentes formatos, como también estará en la capacidad de interactuar con los estudiantes, los profesores y administrativos para la configuración de la herramienta, de manera que se convierta en el principal recursos de búsqueda a la hora de buscar información de calidad.

6 MARTÍNEZ ARELLANO, Filiberto Felipe y VALLEJO HERNÁNDEZ ,Lourdes Milagros. Catalogación de documentos electrónicos: Archivos de Datos y Programas. [en línea]. Disponible en:

http://www.bibliodgsca.unam.mx/libros/lib1fima/lib1fima.htm. [Citado 31 de octubre de 2009].

(20)

26 2. OBJETIVOS

2.1 OBJETIVO GENERAL

Evaluar herramientas de búsquedas federadas que permitan integrar recursos electrónicos suscritos y de acceso abierto disponibles en Internet, con el fin de proponer su implementación en las bibliotecas universitarias de Bogotá.

2.2 OBJETIVOS ESPECIFICOS

- Proponer criterios de evaluación para seleccionar herramientas de búsqueda federada óptimas para las bibliotecas universitarias

- Realizar un análisis DOFA de las herramientas de búsqueda federadas dbWiz, Metalib, WebFeat y SwetsWise.

- Realizar un benchmarking de las siguientes herramientas de búsqueda federadas: dbWiz, Metalib, WebFeat y SwetsWise.

(21)

27 3. METODOLOGÍA

La metodología a desarrollar en este proyecto es de carácter documental y cualitativa, en donde se realiza una investigación bibliográfica de la literatura existente sobre el tema.

Se evaluarán cuatro herramientas de búsqueda federada: dbWIZ, Metalib, WebFeat y SwetsWise; estos software han sido seleccionados por ser los más utilizados en diferentes universidades.

La investigación se desarrolló en cuatro etapas:

1. Realización de un estado de arte sobre los metabuscadores y su importancia en la recuperación de información en la web y en las bibliotecas universitarias.

2. Investigación y selección de diferentes herramientas de búsqueda federada que han sido adoptados por diferentes universidades en todo el mundo.

3. Descripción y evaluación de los cuatro software seleccionados.

4. Creación de un benchmarking, con el fin de definir las cualidades y características sobresalientes de cada una de las herramientas para que una biblioteca universitaria pueda elegir la que mejor se adecúe a sus necesidades.

(22)

28 4. MARCO TEORICO

4.1 LOS SERVICIOS DE RECUPERACIÓN DE INFORMACIÓN EN LAS BIBLIOTECAS UNIVERSITARIAS:

Cada día las bibliotecas se están transformando en cuanto a tecnología se refiere, convirtiéndose así en un centro de recursos que interactúa frecuentemente con el usuario por medio de los servicios y herramientas que incorpora en sus colecciones⁷.

Las nuevas formas de presentar la información como formato electrónico, visual, auditivo hace que se presente un concepto de unidad de información denominada por varios autores como la “biblioteca híbrida”. A continuación se da a conocer algunas definiciones:

“Es un modelo de biblioteca en el que el usuario, desde un interfaz vía web o windows y a través de páginas o pantallas, puede acceder a los recursos digitales, representados en siete bloques: a) Pasarela a Internet; b) Fuentes primarias: revistas electrónicas, materiales digitalizados en el propio centro, literatura gris; c) Fuentes secundarias:

bases de datos, CD-ROM; d) Catálogos: OPACS locales, catálogos de consorcios; e) Acceso a editoriales y librerías; f) Intermediarios comerciales: agentes de suscripción, host; g) Servicios de información en tiempo real: medios de comunicación (Oppenheim y Smithson, 1999)”⁸.

7MATEO, María Elena. La “biblioteca híbrida” o el acceso universal a la información. Consultado en:

http://www.documentalistaenredado.net/144/la-biblioteca-hbrida-o-el-acceso-universal-a-la-informacin/print/ . Marzo de 2005. Consultado el 10-11-2009

8 FABA PÉREZ, Cristina, NUÑO MORAL, María Victoria. La nueva gestión en las bibliotecas virtuales. En:

Boletín de la Asociación Andaluza de Bibliotecarios, nº 74, (Marzo 2004), p. 21.

(23)

29

Mateo⁹, la define como una biblioteca diseñada para armonizar todo tipo de tecnologías en el contexto de una biblioteca en funcionamiento, al mismo tiempo que para explorar la integración de sistemas y servicios en contextos electrónicos e impresos.

Para Gómez Hernández¹⁰, la biblioteca es un sabio equilibrio que combina lo inmaterial, la información, con lo espacial, lo virtual con lo real, el encuentro con la información lejana, con la orientación presente e interpersonal. Lo cognitivo con lo afectivo, el saber con la lectura. La comunicación de la información, con la comunicación afectiva. La biblioteca por tanto debe ser un espacio de comunicación que ayude a la gente a estar informada y tener criterios sobre su saber. La biblioteca deberá aportar a la vez una colección de recursos informativos en sentido amplio, con salas digitales adaptadas al uso de las tecnologías, junto a instalaciones culturales y propuestas sociales.

De acuerdo con estos conceptos se crea el escenario de la biblioteca hibrida, el cual es adoptado por la gran mayoría de las universidades y con esto surgen los servicios de información enfocados a la recuperación de información en diferentes formatos.

“Las bibliotecas ya no ofrecen sólo documentos de las que son dueñas, sino que también dan acceso a otras colecciones cuya consulta es sólo posible mientras dure la suscripción a la misma. Los recursos electrónicos, debido a su elevado coste, se están contratando de esta forma; es decir, las bibliotecas no compran determinados recursos electrónicos, sino que se paga por el acceso a los servidores de

9 MATEO, María Elena. La “biblioteca híbrida” o el acceso universal a la información. [en línea]. Disponible en:http://www.documentalistaenredado.net/144/la‐biblioteca‐hbrida‐o‐el‐acceso‐universal‐a‐la‐

informacin/print/.[Citado 10 de noviembre de 2009].

10GÓMEZ HERNÁNDEZ, José Antonio. Legitimación y funciones de la biblioteca en el contexto de la sociedad digital. En: SCIRE, Vol. 4, Nº 2, 1998 , p. 73.

(24)

30

determinadas empresas, donde están depositados estos documentos.

Por lo general, las colecciones que se consultan de esta forma son monografías electrónicas (libros electrónicos, tesis, etc.), publicaciones periódicas en formato digital y bases de datos”¹¹.

La biblioteca universitaria ocupa un lugar muy importante dentro de la investigación, es así como el bibliotecario debe estar al tanto de las nuevas herramientas tecnológicas que se ofrecen en el mercado para adaptarlas a sus usuarios y de esta manera prestar un buen servicio y contribuyendo al desarrollo de la calidad en la educación.

4.2 ANALISIS DOFA:

“El análisis DOFA ayuda a determinar si la organización está capacitada para desempeñarse en su medio. Mientras más competitiva en comparación con sus competidores esté la empresa mayores probabilidades tiene de éxito. La simple noción de competencia conlleva consecuencias poderosas para el desarrollo de una estrategia efectiva. El análisis DOFA, así como el de vulnerabilidad integran el diagnóstico estratégico y lo hace por tanto global”¹².

Debido a la facilidad, el análisis DOFA se ha podido adaptar a la creación de nuevos servicios y productos, evaluación de nuevas tecnologías, procesos de planta, logística, penetración de mercados, estructuración empresarial, preparación de portafolios de inversión, aplicación de políticas internas, planeación estratégica, nuevas inversiones, implementación de procesos, y muchos temas más.

11 MERLO VEGA, José Antonio. Servicios bibliotecarios para la comunidad universitaria. En Orera Orera, Luisa (ed.). La biblioteca universitaria: análisis en su entorno híbrido. Madrid: Síntesis, 2005, p. 24.

12 SERNA GÓMEZ, Humberto. Gerencia estratégica: Planeación y gestión, teoría y metodología. 5ª ed.

Santafé de Bogotá: 3R Editores, 1997.p. 157

(25)

31

El análisis DOFA es una herramienta diseñada para ayudar a encontrar un enlace entre los factores externos (oportunidades y amenazas) y los internos (fortalezas y debilidades) que influyen en la toma de decisiones de una organización. Este análisis permitirá la formulación de estrategias para aprovechar sus fortalezas, prevenir el efecto de sus debilidades, utilizar a tiempo sus oportunidades y anticiparse al efecto de las amenazas.

A continuación, se presentará un cuadro en donde se sintetiza el análisis DOFA y se explica el significado de cada parte que la compone:

OPORTUNIDADES (EXTERNO)

AMENAZAS (EXTERNO)

Eventos, hechos o tendencias en el entorno de una organización que podrían facilitar o beneficiar el desarrollo de ésta, si se aprovechan en forma oportuna adecuada

Eventos, hechos o tendencias en el entorno de una organización que inhiben, limitan o dificultan su desarrollo operativo

FORTALEZAS (INTERNO)

DEBILIDADES (INTERNO)

Actividades y atributos internos de una organización que contribuyen y aportan el logro de los objetivos de una institución.

Actividades o atributos internos de una organización que inhiben o dificultan el éxito de una empresa.

En el desarrollo de este trabajo se aplicará el análisis DOFA a las cuatro herramientas de búsquedas federadas seleccionada, de esta manera se profundizara en las (F) Fortalezas y (A) Amenazas, ya que, solo se evaluaran dichas herramientas.

(26)

32 4. 3 BENCHMARKING:

“Es un proceso sistemático y continuo para evaluar los productos, servicios y procesos de trabajo de las organizaciones que son reconocidas como representantes de las mejores prácticas, con el propósito de realizar mejoras organizacionales”¹³.

Teniendo en cuenta esta definición, el benchmarking recopila y selecciona constantemente las prácticas más sobresalientes y el mejor desempeño de las organizaciones para introducirlas a la toma de decisiones y a la comunicación en todos los niveles de la empresa. El benchmarking es un proceso de evaluación y mejora de los productos y servicios, que se logra a través del uso de recursos que apoyan las necesidades de los clientes y permiten obtener su satisfacción.

Además, es considerada una estrategia de negocios, donde se evalúa la competencia para saber en qué se puede mejorar y cómo se puede hacer; y una estrategia que fomenta el trabajo de equipo para permanecer competitivos en las prácticas de la industria. Además, cabe mencionar que el Benchmarking es un proceso que obliga a evaluar las acciones internas frente a los estándares externos para mejorar los objetivos y en consecuencia los productos y servicios.

Benchmarking “no es espionaje, ni copia, su fundamento radica en que posibilita a las organizaciones aprender de los mejores, en todos los aspectos que sea posible hacerlo”¹⁴. Es decir, que se debe basar en la experiencia de las empresas que han sido posicionadas en el primer lugar de acuerdo con su mercado y de esta manera lograr ser mejores que ellas.

13 SPEDOLINI. Michael J. Benchmarking. Norma: Bogotá; 1992. p. 11.

14 SANTOS GRIMALDOS, Edilberto. Planeación estratégica y benchmarking. Herramientas d diagnóstico y prospección empresarial. Ediciones Universidad del Meta. Santafé de Bogotá; 1999. p. 131.

(27)

33 Existen tres tipos de benchmarking:

1. Interno: Identifica los estándares de desarrollo interno de una organización.

2. Competitivo: Identifica información específica acerca de los productos, los procesos y los resultados comerciales de sus competidores y compararlos con los de su organización.

3. Funcional: Identifica las mejores prácticas de cualquier tipo de organización que se haya ganado una reputación de excelencia en el área específica que se esté sometiendo a benchmarking¹⁵.

El benchmarking que se empleará en el desarrollo del trabajo es el competitivo, ya que, se deben identificar los resultados de la competencia y compararlos con cada una de las herramientas de búsqueda federada.

4.4 TIPOLOGIAS DE WEB 4.4.1 World Wide Web

En 1980, Tim Berners-Lee había comenzado a trabajar en el CERN (Laboratorio Europeo de Física de Partículas) en Ginebra (Suiza), en donde se realizaban proyectos de física nuclear. Berners-Lee ya venía trabajando en la idea de un proyecto para el CERN en el cual buscaba facilitar la comunicación entre los investigadores del laboratorio. - A partir de dos suposiciones creó la idea de la Web: una, donde la información estuviera en diferentes computadores y la otra, que se pudiera programar su computador para crear un espacio donde se relacionaran elementos entre sí.

Así, en el momento en que un segmento de información estuviera etiquetado con una dirección se le podría indicar a un computador que la capturara. Al poder

15 SPEDOLINI. Michael J. Benchmarking. Norma: Bogota; 1992.. p. 19‐24

(28)

34

capturar con facilidad diferentes cosas y que el computador pudiera representar la relación de esas cosas que aunque aparentemente no tuvieran relación, pero que compartieran una conexión entre sí, se formaría un Web de información como lo denominó su creador.

Esto supone que ya existía una manera en que todas las personas pudieran acceder a datos que ayudaran a comprender el conocimiento a través de la información que se encontrara almacenada en los computadores. De esta manera, éstos no podrían solucionar todos los problemas de las personas pero ayudarían a analizar diferentes situaciones, entre ellas las relaciones de conexión entre los diferentes entes de la sociedad.

Antes de que le surgiera esta idea a Berners-Lee, ya otras personas habían pensado en ideas similares que no llegaron a concretarse. En 1945, Vannevar Bush escribió un artículo acerca de una máquina llamada Memex, que podía referenciar documentos microfilmados. En 1965, Ted Nelson escribió acerca de ordenadores que permitieran escribir y publicar en un formato no lineal que denominó hipertexto. Más adelante, Doug Engelbart quería que la gente usara el hipertexto como una herramienta de trabajo, para ello creó el ratón (mouse), que ayudaría a agilizar el uso de vínculos de hipertexto. Después apareció la Internet, que permitió la conexión a nivel mundial.

Todas estas ideas que resultaron antes de la creación de la Web, fueron de gran apoyo para hacer realidad la idea de Berners-Lee quien teniendo a su favor la existencia del hipertexto e Internet, lo único que tenía que hacer era buscar la manera de que casaran. Cabe mencionar que aunque esas ideas fueron adelantadas para la época jugaron un papel importante en la creación de la World Wide Web.

(29)

35

En la actualidad, la World Wide Web no es sólo un medio de comunicación de texto, sino de gráficos y objetos multimedia que requieren de Internet como dispositivo de transporte. Al permitir la comunicación a nivel global, la Web ha sido una idea que ha revolucionado la sociedad, porque permite conectarse con personas, entidades, hacer negocios, intercambiar ideas, hacer compras, acceder a información, etc. En cierta forma la Web, así como la Internet, ha permitido acortar las distancias y facilitar el acceso a la información.

4.4.2 Web 2.0

Antes de la Web 2.0, existió la Web 1.0 o la Web común que todo el mundo conoce. La Web común se identifica porque el contenido de un sitio web es producido por un editor para luego ser usada por los visitantes de dicha página. En la Web 2.0, la información es producida de forma directa o indirecta por los usuarios del sitio web y es compartida por varios portales de características similares.

(30)

36

Grafico1.Diferencias entre la web 1.0 y la Web 2.0

Fuente: COZIC, Frédéric. Le Web2.0 illustré en une seule image. [en línea]. Disponible en :

<http://blog.aysoon.com/le-web20-illustre-en-une-seule-image >. [Citado 3 marzo 2009].

Esta ilustración muestra la diferencia entre la Web.1.0 y la Web 2.0: Mientras que en la Web 1.0 el Webmaster editaba una página o sitio Web y los usuarios solamente podían visualizar el contenido de la página; en la Web 2.0 se encuentra el Webmaster, pero los usuarios pueden ayudar a diseñar y construir el sitio Web.

El concepto de Web 2.0 surgió en el año 2004, en una conferencia en la cual Dale Dougherty y O’Reilly observaron que la web era más importante que nunca, con nuevas e interesantes aplicaciones y sitios que aparecían con asombrosa regularidad. Por eso, aprovecharon ese punto de encuentro para hablar sobre el renacimiento y la evolución de la Web 2.0.

(31)

37

La web 2.0 es una nueva generación de web en donde los contenidos de los sitios creados son producidos y compartidos por los propios usuarios. Allí, existen aplicaciones representadas por expresiones tales como: redes sociales, microformatos, tags, RSS, blogs, wikis, entre otras.

Tecnologías que apoyan la Web

Existen varias tecnologías que se están utilizando en la actualidad y que pueden ser de apoyo para continuar evolucionando junto con la Web. A continuación se presentan estas tecnologías que dan origen a un proyecto Web 2.0.

• Transformar software de escritorio hacia la plataforma del web.

• Respeto a los estándares como el XHTML.

• Separación de contenido del diseño con uso de hojas de estilo.

• Sindicación de contenidos.

• Ajax (java script asincrónico y XML).

• Uso de Flash, Flex o Lazlo.

• Uso de Ruby on Rails para programar páginas dinámicas.

• Utilización de redes sociales al manejar usuarios y comunidades.

• Dar control total a los usuarios en el manejo de su información.

• Proveer APIs o XML para que las aplicaciones puedan ser manipuladas por otros.

• Facilitar el posicionamiento con URL sencillos.

La Web 2.0 más que una tecnología, se puede decir que es la actitud con la que deben trabajar todas aquellas personas que llevan a cabo proyectos de este tipo, para que renueven y mejoren los sitios Web, no sólo modificando las versiones y etiquetándolas nuevamente sino realizando cambios importantes. Teniendo en cuenta la tecnología y los cambios que ha producido la Web 2.0 en lo que era la

(32)

38

WWW, se puede concluir que ésta fue prácticamente la que dio paso a la Web semántica, con contenidos más amplios, con información relevante, coherente, precisa y confiable.

4.4.3 Web semántica

Se define de esta forma porque su contenido debe tener un significado, implica que los datos en la Web lo puedan comprender tanto las personas como los computadores. La Web semántica se crea a partir de una idea en la cual los computadores y las personas puedan, leer, entender y utilizar datos a través de la World Wide Web para cubrir las necesidades de información de los usuarios.

La Web semántica es diseñada alrededor de unos recursos, el direccionamiento unificado de esos recursos y un pequeño conjunto de comandos. Además, está diseñada para operar sobre redes grandes y complejas de manera descentralizada. Para entender bien el diseño de esta Web, a continuación se visualizan sus rasgos característicos.

4.4.3.1 Recursos de la Web semántica

Se entiende como la forma de representar una idea para referirse a algo. Se piensa que los recursos son paquetes de datos, ya sean documentos o páginas, pero la noción de recurso va más allá vista de dos maneras: La primera que un recurso puede cambiar con el tiempo y seguir siendo el mismo recurso si está direccionado por el mismo URI (Uniform Resource Identifier), o que exista una serie de proyectos sobre un mismo tema que sean direccionados con la misma URI. De esta manera, se puede entender que un recurso es lo suficientemente flexible como para agrupar ambos aspectos, variación y mezcla de recursos. La

(33)

39

segunda que un recurso sea algo que aún no existe o no ha sido creado, puede ser algo real o algo ficticio, o algo que puede direccionarse a través de una red.

Los recursos se representan mediante unos protocolos, como el FTP (File Transfer Protocol) en donde la representación es una copia del mismo archivo.

Pero en un protocolo como el HTTP, la representación puede o no ser copia de un archivo. Los recursos no sólo se representan a través de protocolos sino por diferentes formas: como un archivo PDF, una página en HTML, una grabación de voz, entre otras.

4.4.3.2 Direccionamiento unificado

La Web semántica propone que los recursos puedan ser referidos o identificados mediante URIs. Las URIs más conocidas son las que direccionan recursos que pueden ubicarse y capturarse, esas se llaman URLs (Uniform Resource Locators).

Son URIs que cuentan con una estructura uniforme que permite usar otros protocolos además del HTTP y el FTP; también se pueden insertar dentro de hipervínculos, de manera que la información ubicada pueda ser localizada fácilmente.

4.4.3.2 Conjunto de comandos

El protocolo HTTP usa unos comandos para enviar mensajes a través de la Web, estos son conocidos en todo el mundo como clientes y servidores; y otros como los caches, que permiten reducir el tráfico en la red de documentos que han sido previamente buscados. Este modelo de comandos no ofrece seguridad o privacidad personal de la información que sea enviada o requerida, pero a sí mismo puede proveerse de capas adicionales de seguridad.¹⁶

16 PASSIN, Thomas B. Explorer’s guide to the semantic Web. Greenwich: Manning Publications, 2004. 281 p.

ISBN 1‐932394‐20‐6.

(34)

40 4.4.3.3 La escalabilidad y las grandes redes

En la red se encuentra una enorme cantidad de páginas web que aumenta cada día, esto incrementa el tamaño de la red. Esto se presenta por dos cosas: la primera es que la Web es descentralizada, esto significa que si se tiene un computador conectado a la red, se puede poner un servidor en el mismo, que se utilizará posteriormente para adicionar recursos a la Web sin tener que registrarse en otro lugar. La segunda es que toda la información que se requiere está al alcance de la mano y los datos no necesitan ser almacenados por el servidor de una a otra solicitud.

4.4.3.4 La Web y la Web semántica

Para que la Web semántica continúe con el modelo de web actual, debe utilizar los aspectos claves de la World Wide Web que se presentan a continuación:

- Uso de estilo URI para direccionar los recursos.

- Tener nociones de recursos direccionales y no direccionales. Teniendo en cuenta que un recurso no direccionable se refiere a aquello que de lo que se puede hablar (como un objeto o un concepto) pero que no puede ser recuperado mediante una red de comunicaciones.

- Uso de protocolos con un pequeño y universalmente comprendido conjunto de comandos.

- Contiene poca información de estado de preferencia.

- Ser tan descentralizada como sea posible.

(35)

41

- Función en una gran escala, es decir, permite que la privacidad de la información de usuarios y grupos puede ser configurada por ellos mismos y que cada grupo se sienta seguro en el control de su espacio.

- Permitir el almacenamiento en caché local de información para acelerar el acceso y reducir las cargas de la red.

- Tener la capacidad de operar con los eslabones que faltan y con información incompleta e inconsistente.

Según Tomas B. Passin esta es una cuestión que queda abierta hacia los servicios y los agentes están destinados o serán capaces de seguir estas indicaciones. ¹⁷

4.4.3.6 Arquitectura de la Web semántica

Grafico 2. Arquitectura de la web semantica

Fuente: Tim Berners-Lee. Semantic Web -XML2000. Architecture http://www.w3.org/2000/Talks/1206-xml2k-tbl/slide11- 0.html

17PASSIN, Thomas B. Explorer’s guide to the semantic Web. Greenwich: Manning Publications, 2005; p.14.

(36)

42

- XML: Extensible Markup Language. Desde 1998 este lenguaje se ha usado para definir todos los nuevos lenguajes que son usados en el intercambio de datos a través de la Web.

- XML Schema: Es un lenguaje que se usa para definir la estructura de lenguajes XML específicos.

- RDF: Resource Description Framework. Es un lenguaje flexible capaz de describir todos los tipos de información y metadatos.

- RDFSchema: Es un marco que proporciona un medio para especificar vocabularios básicos, para aplicación de RDF específico en los lenguajes a utilizar.

- Ontologías: lenguajes usados para definir vocabularios y establecer el uso de palabras y términos en el contexto de un vocabulario específico.

- Lógica y pruebas: El razonamiento lógico se utiliza para establecer la coherencia y la exactitud de los conjuntos de datos y para inferir conclusiones que no son indicadas explícitamente, pero son requeridas por o en consonancia con un conjunto conocido de datos. Las pruebas trazan o explican los pasos del razonamiento lógico.

- Confianza: Un medio de proporcionar autenticación de la identidad y evidencia de la fiabilidad de datos, servicios y agentes.

Las capas de la Web semántica aportan las siguientes funciones: entender una consulta, comprender sitios web, validar información y deducir nueva información.

Para llevar a cabo estas funciones, se debe normalizar el alfabeto, las referencias, el lenguaje, el formato, las anotaciones sobre significados, los conceptos generales, las reglas y los sistemas de deducción.

(37)

43

La Web semántica ha permitido que la información en Internet sea clasificada y no generalizada, es decir, que el contenido de las páginas web presente un conocimiento y datos inteligentes; y de igual manera al realizar una búsqueda en Internet, recupere páginas que contengan la información que se está solicitando en la búsqueda. En conclusión, el objetivo principal de la Web semántica es que la Web pase de ser una colección de documentos a convertirse en una base de conocimiento.

Gráfico 3. Mapa conceptual de la Web semántica

Fuente: KEILYN RODRÍGUEZ Perojo y RONDA LEÓN, Rodrigo Mapa conceptual de la Web Semántica.

"Web Semántica: un nuevo enfoque para la organización y recuperación de información en la web".[en línea].

Acimed, vol. 13, núm. 6, nov‐dic 2005. Disponible en:

http://bvs.sld.cu/revistas/aci/vol13_6_05/aci030605.htm [Citado 31 de octubre de 2009].

(38)

44 4.4.4 W3C (World Wide Web Consortium)

En 1994 se creó la World Wide Web Consortium (W3C), una comunidad internacional que desarrolla protocolos comunes para garantizar el crecimiento a largo plazo de la Web. El consorcio lo integran un grupo de programadores, desarrolladores web, ejecutivos de la industria y usuarios que colaboran en la definición de especificaciones para el desarrollo de la tecnología web. Una de sus actividades actuales es desarrollar y estandarizar un marco común que permita compartir y reutilizar datos entre distintas aplicaciones y plataformas para hacer posible la Web Semántica.

Desde su origen, detrás del Consorcio se han ubicado por parte de Estados Unidos, el Massachusetts Institute of Technology (MIT) y el Laboratory for Computer Science (LCS); por Europa, el Institut National de Recherche en Informatique et en Automatique (Inria); y desde Japón, la Keio University. Entre los servicios que ofrece la W3C se encuentran la asesoría para encargados y usuarios de la Web, códigos de referencia para crear y promover estándares, y prototipos y aplicaciones demostrativas de nuevas tecnologías. La W3C admite como socios únicamente a Instituciones de pleno derecho o asociadas las cuales deben aportar una cuota anual.

La W3C ha presentado de forma oficial la HTML 4.0, nueva versión para la elaboración de páginas Web. Entre sus ventajas se encuentran: “la facilidad en el uso de tablas, la partición de las páginas en marcos, así como su aplicación en diferentes formatos tanto del mismo HTML, como texto simple o pdf. Además facilita la conversión de los caracteres en diferentes idiomas”.¹⁸ W3C sugiere que

18W3C presenta el HTML 4.0., [en línea ]. En: El profesional de la información, 2008, mayo‐junio, v. 17, n. 3, pp.353. Disponible en:

<http://www.elprofesionaldelainformacion.com/contenidos/1998/junio/w3c_presenta_el_html_40.html>.

[Citado 9 noviembre 2009].

(39)

45

no se use esta versión sólo como formato visual, ya que hay usuarios que adoptan sistemas Braille o sintetizadores de voz y las utilidades del HTML 4.0. podrían ser un obstáculo para ellos. Para mejorar el uso de esta versión, se deberían incluir descripciones con cada una de las imágenes y resúmenes de las tablas de datos para que se orienten los usuarios en el paso de una ventana a otra.

4.5 INTERNET INVISIBLE

Es cuando el contenido no puede ser localizado fácilmente con las herramientas de búsqueda de información usadas por la mayoría de usuarios de la Web. Es efectivamente invisible porque hay dificultad para encontrarla, excepto cuando alguien sabe exactamente dónde buscar. Está hecha de páginas Web HTML que los motores de búsqueda han seleccionado para incluirlas dentro de sus índices.

Clasificar algunos sitios Web ya sean visibles o invisibles es relativamente fácil basándose en la tecnología que emplean. Algunos sitios que usan tecnología de bases de datos y son realmente difíciles para acceso e índice por motores de búsqueda de última generación, son realmente sitios Web de Internet invisible.

Otros sitios usan una variedad de archivos y medios de comunicación, de ellos, algunos son fácilmente indexados, y otros son incomprensibles para los rastreadores de motores de búsqueda.

Hay sitios Web que utilizan una mezcla de ese tipo de archivos y medios de comunicación que no son fácil de clasificar ya sean visibles o invisibles. Estos sitios hicieron que se creara lo que se llama Internet oscuro.

(40)

46

Es importante mencionar que Internet invisible clasifica la información relevante y no permite que cualquier motor de búsqueda acceda al contenido de recursos de información científica. De modo que las herramientas de búsqueda federada, capturan la información a través de motores de búsqueda especializados que sólo acceden a contenidos que ofrecen este tipo de información.

4.6 MOTORES DE BÚSQUEDA

“Un motor de búsqueda conecta las palabras que introducimos (las consultas) con una base de datos que ha creado a partir de una serie de páginas web (un índice).

A continuación elabora una lista de Uniform Resource Locator URL (y resúmenes de contenido) que cree que son las más importantes para su consulta”.¹⁹ Un motor de búsqueda consta de tres partes: el rastreo, el índice y la interfaz que procesa las consultas, y el programa que conecta las consultas de un usuario con el índice.

Estas partes son relevantes para la calidad y la velocidad del motor, y los resultados de una búsqueda dependen de muchos factores existentes en cada uno de dichos componentes.

En cuanto a motores de búsqueda, se reconoce a Archie como la primera aplicación de búsqueda de Internet. Esta aplicación fue creada por Alan Emtage un estudiante de la Universidad de McGill en 1990, la arquitectura de Archie era similar a la de los motores de búsqueda que existen en la Red: “rastreaba las fuentes, creaba un índice y tenía una interfaz de búsqueda”.²⁰ En los años previos a la aparición de la Red no era fácil la búsqueda para los usuarios, razón por la cual sólo los expertos y profesores universitarios utilizaban Archie^.

19 BATTELLE, John. Buscar: cómo Google y sus rivales han revolucionado los mercados y transformado nuestra cultura. Argentina: Tendencias, 2005; p.34.

20 Ibid. pp. 58.

(41)

47

Luego en el año de 1993, los estudiantes de Universidad de Nevada crearon otra aplicación de búsqueda llamada Verónica, que funcionaba como Archie y reemplazó a Gopher, otro sistema usado para compartir archivos a través de Internet, por el FTP. Gopher permitía a los usuarios conectarse directamente con el documento que buscaban y no sólo con la máquina donde se encontraba el documento. El sistema Verónica acercó la búsqueda un poco más a lo que se conoce en la actualidad.

"Entre 1993 y 1996 la Red creció y pasó de tener 130 sitios a más de 600.000.

Debido a este crecimiento, Matthew Gray, pionero del primer motor de búsqueda basado en la Red, el WWW Wanderer, buscaba resolver este problema, que la Red estaba creciendo más rápido de lo que un ser humano podría rastrear"21.

Gray creó el Wanderer para que atravesara sistemáticamente la Red y recopilara sitios. El Wanderer permitía a los usuarios buscar en el índice, pero posteriormente Gray hizo algunos retoques en el rastreador, para que este pudiera buscar en muchos sitios antes de profundizar en ellos.

Después del Wanderer aparecieron motores de búsqueda más potentes, uno de ellos fue el WebCrawler desarrollado en 1994 por Brian Pinkerton, investigador de la Universidad de Washington. WebCrawler fue el primer motor de búsqueda en indexar todo el texto de los documentos en Red que encontraba, gracias a este se abrieron las puertas a los navegadores de la Red, especialmente en AOL.

También se dio un paso importante para hacer que se ampliara el acceso a la Red más allá de los profesores universitarios y los fans de la tecnología.

Después de Webcrawler surgió AltaVista, el primer motor de búsqueda considerado realmente bueno. Digital Equipment Corp. (DEC) quería crear un motor de búsqueda y fue Louis Monier quién escuchó del proyecto en una reunión

21 BATTELLE, John. Buscar: cómo Google y sus rivales han revolucionado los mercados y transformado nuestra cultura. Argentina: Tendencias, 2005; p.34.

(42)

48

y decidió llevarlo a cabo. En ese momento existían cerca de doce motores de búsqueda, algunos con unas interfaces de usuario terribles o que carecían de lenguajes de consulta potentes; otros sólo indexaban URLs y no toda la base de contenido de un sitio web. Monier utilizando el poder del procesador Alpha construyó un nuevo tipo de rastreador; esto permitió que lograra su objetivo de crear un índice de toda la Red y no sólo de URLs.

Poco antes de Google surgieron otros motores de búsqueda como Excite y Yahoo.

Excite surgió en 1994 como una tecnología de búsqueda para las bases de datos dentro de las compañías, pero posteriormente estaba disponible en la Red. En 1995 comenzó con un directorio de Red y un motor de búsqueda de texto completo. Este motor fue más allá de la búsqueda basada en palabras clave con una tecnología que agrupaba las páginas web por conceptos subyacentes.

Yahoo fue creada a comienzos de la década de 1990 por dos estudiantes en Stanford, Jerry Yang y David Filo. Los creadores de Yahoo adoptaron un modelo de directorio para navegación, clasificando los enlaces en categorías, a ellas le agregaron subcategorías y, a finales de 1994, el sitio ya estaba lleno de enlaces.

Yahoo tenía mucha competencia, pero la ventaja que tenía era que su directorio organizaba la Red de una manera adecuada tanto para los adeptos de la tecnología como para los que navegaban en la Red por vez primera, además, fue el primer motor en ofrecer enlaces a sitios de la competencia en caso de que un usuario no encontrara lo que estaba buscando.

Google es un motor de búsqueda cuya marca pertenece a una empresa privada con el mismo nombre fundada en 1998. Este motor fue inventado hacia 1995-1996 por Sergey Brin y Larry Page, dos estudiantes de doctorado en la Universidad de Stanford; está basado en un algoritmo llamado PageRank propiedad de dicha Universidad y que le fue conferido bajo licencia exclusiva a Google hasta 2011. La

(43)

49

diferencia de Google con respecto a otros motores de búsqueda es que no tiene estrategia de portal, no intenta retener al usuario con publicidad sino que lo envía rápidamente hacia las páginas que está buscando.

Existen otras herramientas como los metabuscadores, que son motores de búsqueda que realizan sus búsquedas simultáneamente en diversos buscadores.

Los metabuscadores ofrecen un listado completo de coincidencias que constituyen las mejores respuestas a la pregunta formulada. Generalmente no se obtiene toda la potencia de cada uno de ellos, pero pueden ser útiles cuando no se ha tenido suerte en la búsqueda de otros servicios.

4.7 LOS SISTEMAS DE BÚSQUEDA FEDERADA

Los sistemas de búsqueda federada o simultánea es una iniciativa tecnológica asociada a la gestión de los recursos electrónicos. En la medida en que una Biblioteca aumenta el número de fuentes digitales a las que da acceso, debe ofrecer un mecanismo a los usuarios que les permita recuperar documentos de diferentes bases de datos y proveedores.²² “Los sistemas de búsqueda federada tienen como interfaz una página de consulta que permite consultar simultáneamente bases de datos y revistas-e hospedadas en sitios web de distintos proveedores, recursos internos, etc.” Estos sistemas permiten que los usuarios puedan consultar múltiples bases de datos desde un único punto.²³

22EITO BRUN, Ricardo. La gestión de recursos electrónicos en bibliotecas: la oferta de innovative. En: El profesional de la información, 2008, mayo‐junio, v. 17, n. 3, pp.353.

23Ibid. p.353

(44)

50

Una definición de búsqueda federada muy clara es la que presenta Sol Lederman²⁴ , un especialista en la industria de las búsquedas federadas: “Es el proceso de realizar una búsqueda simultánea en tiempo real y en múltiples fuentes distribuidas desde una página de búsqueda única, por medio de la herramienta de búsqueda federada que actúa como intermediaria”.

Como resultado de los conceptos anteriores, la herramienta de búsqueda federada puede definirse como un sistema que interviene entre el usuario y su búsqueda con el fin de recuperar en tiempo real y en múltiples fuentes de calidad, con la ventaja de diligenciar un solo formulario.

El objetivo es redirigir la búsqueda del usuario a múltiples sitios, recibir los resultados e integrarlos en una sola lista en la cual se eliminarán los posibles duplicados. Para lograrlo, los proveedores deben mostrar sus catálogos y posibilitar la recepción de búsquedas a su sistema desde otras aplicaciones informáticas.²⁵

Para entender cómo funciona una herramienta de búsqueda federada se debe conocer el siguiente contexto que presenta Lederman²⁶ en su artículo Federated search finds content that Google can’t reach:

Existen dos enfoques básicos para encontrar contenido en la Web. El enfoque que Google y todos los principales motores de búsqueda emplea es el de "rastreo" de la Web. Google, durante muchos años, ha acumulado una lista de miles de

24 Lederman, Sol. Federated Search Finds Content that Google Can’t Reach. [en línea]. Disponible en:

http://www.altsearchengines.com/2009/01/11/federated‐search‐finds‐content‐that‐google‐cant‐reach‐

part‐i‐of‐iii/ [Citado 31 de octubre de 2009].

25Ibid. p.353

(45)

51

millones de sitios Web. Hoy en día, Google puede encontrar nuevos sitios Web a través de enlaces de sitios que ya conoce. Periódicamente recupera estos sitios en su lista e identifica los vínculos en ese sitio y, sigue cada vínculo que encuentra para llegar a otras páginas donde se inicia el proceso hasta encontrar más enlaces. De este modo, los sitios de Google detectan que no se encontró nada durante las visitas anteriores.

Este proceso de pasar de una página a otra y luego a otro se conoce como

"Crawling", como una araña que se arrastra de un hilo a otro en su web, de hecho, la web de "arañas" se les conoce como "web crawlers". Cuando se crea un nuevo sitio, basta con crear un enlace a ella desde otro sitio, y el rastreador de Google lo recupera.

La técnica de rastreo no encuentran todas las páginas de la web, de hecho solo un pequeño porcentaje de los contenidos de la web es accesible en Google, existe la

“Web invisible”, en donde se encuentra una gran porción del contenido de la web que esta fuera del alcance, es decir que no lo recupera Google; para lograr acceder a esta información es necesario conocer términos normalizados como los presentados en diferentes tesauros. Google no puede llegar a esta información porque no está diseñado para diligenciar formularios de búsqueda en donde se delimite, se amplié o se especifiqué la búsqueda según lo requiera el usuario.

4.7.1 Beneficios de una herramienta de búsqueda federada

• Eficiencia y ahorro de tiempo

Utilizar un motor de búsqueda federada es un gran ahorro de tiempo para los usuarios, en lugar de buscar en muchas fuentes, de una en una, el motor de búsqueda federada realiza múltiples búsquedas. La herramienta de búsqueda federada utiliza solamente un formulario de búsqueda para cubrir numerosas

(46)

52

fuentes, y combina los resultados en una sola página de resultados.²⁷

Este es uno de principales inconvenientes que se presentan en las universidades, la adquisición de varias fuentes de información pero muchas veces no se cuenta con el tiempo para entrar y buscar en cada una, es así como la implementación de una herramienta de búsqueda federada permite solamente diligenciar un formulario de manera que el usuario pueda ahorrar tiempo y recupere información de manera eficiente.

• Calidad de los resultados

Los motores de búsqueda federada muestran su mejor valor en los entornos en los que se maneja información de calidad, tales como bibliotecas, entornos de investigación de las empresas, y el gobierno federal. Una diferencia importante entre un motor de búsqueda federada y un motor de búsqueda estándar como Google es que el cliente que contrata para el servicio de búsqueda federada selecciona las fuentes de búsqueda. En casi todos los casos, las fuentes serán autorizadas. Google, en cambio, tiene un criterio muy mínimo para la selección de fuente. Si una página Web no se ve como spam Google presentará los resultados de búsqueda. Es así, como los bibliotecarios dirigen y selecciona a los usuarios a recuperar información de excelente calidad.²⁸

(47)

53

La calidad de los resultados es una de las características más importantes, la cual hace que la información que se incluya en la herramienta de búsqueda federada cumpla con los resultados esperados por el usuario.

• Contenido más actualizado

Además de diligenciar los formularios y la combinación de documentos de múltiples fuentes, otro beneficio importante de los motores de búsqueda federada, es su búsqueda de contenidos en tiempo real. Tan pronto como el administrador del contenido actualiza su herramienta, la información está a disposición del usuario en la consulta que éste realiza.

El contenido más actualizado es una gran ventaja de una herramienta de búsqueda federada, y es lo que permite al usuario estar al día con la información de su interés.

Entre los sistemas o software de búsquedas federadas se encuentran Metalib, WebFeat, dbWIZ y SwetsWise searcher. Estos sistemas fueron seleccionados para su evaluación en cuanto a funcionamiento, estructura, características, capacidad de búsqueda, entre otros aspectos, y de esta manera identificar cuál cumple con los indicadores de evaluación para ser utilizado como herramienta de búsqueda de información en una biblioteca universitaria.