3. Confecci´ on de bibliom´ etricas sobre repositorios no estructurados
3.5. Indicadores bibliom´ etricos
Esta secci´on describe el objetivo final de este trabajo, la elaboraci´on de indicadores bibliom´etri- cos. Como se mencion´o previamente, las bibliom´etricas se definen como el an´alisis cuantitativo de la literatura cient´ıfica y t´ecnica, con prop´ositos explicativos, evaluativos y administrativos. En el marco de este trabajo, el termino indicadores bibliom´etricos refiere a los indicadores que brindan alg´un tipo de informaci´on de las entidades derivadas del repositorio objetivo.
La elaboraci´on de indicadores bibliom´etricos es sencilla gracias a la existencia del modelo de datos, que define los posibles tipos de entidades, y al trabajo realizado en las etapas de proce- samiento que aseguran que las entidades creadas cuenten con datos correctos. Estos indicadores deben simplemente consultar la base de datos, calcular un resultado en base a la respuesta en- tregada por la base de datos y presentar este resultado al usuario. Por ejemplo, un indicador que busque conocer el promedio del n´umero de art´ıculos publicados en revistas, debe realizar dos consultas y un c´alculo para obtener el resultado. La primer consulta debe solicitar el n´umero de entidades del tipoResearcher. La segunda, debe obtener el n´umero de entidades del tipoArticle para las cuales la entidad del tipoMedia asociada, es del subtipoJournalMedia (ver Figura 3.3). Finalmente, el valor del indicador es del tipo num´erico y se calcula como el resultado de la segunda consulta dividido por el de la primera.
El enfoque propuesto en esta etapa debe facilitar la creaci´on de indicadores por parte del usuario de la herramienta. Para esto, es necesario desarrollar una interfaz de programaci´on con un nivel de abstracci´on adecuado que permita la implementaci´on de indicadores bibliom´etricos, sin un conocimiento de los detalles de implementaci´on de bajo nivel de la herramienta. El solo conocimiento de los tipos de entidades existentes, junto a un conjunto de rutinas que puedan ser combinadas para consultar la base de datos, deber´ıa ser suficiente para la implementaci´on de nuevos indicadores bibliom´etricos.
Las interfaces definidas ser´an utilizadas para crear un conjunto de indicadores generales que sean aplicables a cualquier repositorio. Los mismos servir´an para proveer al usuario de un conjunto de indicadores base y a su vez cumplir´an con el objetivo de proveer ejemplos de indicadores implementados correctamente.
3.5.1. Indicadores bibliom´etricos base
Los indicadores bibliom´etricos detallados aqu´ı utilizan los tipos de entidades y relaciones del modelo de datos propuesto en la Secci´on 3.2.2, por lo que pueden ser implementados una ´unica vez y funcionar sobre cualquier repositorio ya que no dependen de ninguna particularidad de los mismos. Adem´as de proveer un conjunto base, estos indicadores sirven de ejemplo para la implementaci´on de nuevos indicadores. A continuaci´on se describen los indicadores propuestos.
1. Promedio de art´ıculos de revista por investigador. Este indicador sencillo se construye sumando el n´umero de instancias deArticley dividiendo esta suma por el total de entidades
3.6. CONCLUSIONES 45 de tipo Researcher existentes. En la suma de art´ıculos se debe tener en cuenta que un art´ıculo puede ser escrito por m´as de un investigador. Por esto, es necesario realizar la suma a partir del n´umero de art´ıculos asociados a cada investigador.
2. Promedio de art´ıculos de revista por investigador dentro de cada una de las disciplinas cient´ıficas. Al igual que el indicador anterior, se debe sumar el total de art´ıculos de cada investigador y dividirlo por el n´umero de investigadores. En este caso, los investigadores se agrupan por la disciplina que practican. La disciplina se observa como una relaci´on entre los tipos de entidadesResearcher yDiscipline.
3. Promedio de autores por art´ıculo. Este indicador es similar al descripto en el primer punto solo que la suma se realiza accediendo primero a los art´ıculos. Para cada uno de ellos se debe obtener el n´umero de instancias de la clase Researcher asociadas y sumarlas. Esta suma luego se divide por el n´umero total de art´ıculos, para as´ı obtener el resultado final. 4. Total de art´ıculos de revista, art´ıculos de conferencia y cap´ıtulos de libro. Este sencillo in-
dicador se obtiene agrupando las instancias del tipoArticle, a partir del tipo del atributo media. Este campo puede referenciar a una instancia de las clases JournalMedia, Confe- renceMedia o BookMedia, seg´un el art´ıculo sea de revista, conferencia o cap´ıtulo de libro. Una vez agrupados los art´ıculos, solo resta sumar el n´umero de estos en cada grupo. 5. Las 20 revistas, conferencias y libros m´as populares. La implementaci´on de este indicador
consiste en solicitar, para cada subclase de la claseMedia(JournalMedia,ConferenceMedia yBookMedia), el n´umero total de art´ıculos asociados. Luego, para cada tipo de medio de publicaci´on se deben ordenar las entidades de acuerdo al n´umero de art´ıculos asociados y tomar las 20 entidades con mayor n´umero de asociaciones.
6. Impact factor promedio para las revistas existentes. En este caso, simplemente se debe su- mar el valor del campoimpactFactor de cada una de las instancias de la claseJournalMedia y dividir este valor por el total de instancias.
3.6.
Conclusiones
A lo largo del presente cap´ıtulo se han descripto las etapas que componen la herramienta propues- ta en este trabajo. Para cada una de ellas, se describi´o el conjunto de problemas que presenta y se plante´o una soluci´on general que deber´a ser adaptada a las particularidades de cada repositorio sobre el que se desee utilizar la herramienta.
Se comenz´o por describir el modelo de datos que es utilizado por todas las etapas de proce- samiento. Este modelo contiene los tipos de entidades necesarias para describir el dominio de las publicaciones cient´ıficas y sus autores. Las principales etapas que presenta la herramienta son la obtenci´on de datos, el procesamiento de t´ıtulos y procesamiento de autores. En la eta- pa obtenci´on de datos se accede a los datos provistos por el repositorio objetivo. Luego, en el
46 CAP´ITULO 3. CONFECCI ´ON DE BIBLIOM ´ETRICAS
procesamiento de t´ıtulos y art´ıculos estos datos son utilizados para crear las entidades del tipo art´ıculo e investigador, junto a los v´ınculos entre ellas, con el fin de representar la realidad del repositorio objetivo. Por ´ultimo, se present´o un conjunto de indicadores bibliom´etricos, que pue- den ser aplicados sobre las entidades generadas por la herramienta con el objetivo de obtener informaci´on acerca del repositorio fuente.
En el Cap´ıtulo 4 se describir´a la implementaci´on de la herramienta descripta en este cap´ıtulo, sobre el repositorio del CONICET. Se comenzar´a por describir su estructura, para luego detallar la implementaci´on de cada una de las etapas de procesamiento y de los indicadores bibliom´etricos planteados.
Cap´ıtulo 4
Implementaci´on
En el presente cap´ıtulo se describir´a c´omo el dise˜no planteado en el cap´ıtulo previo se adapt´o para el procesamiento del repositorio del CONICET, el organismo de ciencia y t´ecnica m´as importante de la Argentina. Este cap´ıtulo se encuentra organizado como se detalla a continuaci´on. En la secci´on 4.1 se describe el repositorio objetivo. La Secci´on 4.2 describe el proceso de obtenci´on del repositorio objetivo para su procesamiento. En la Secci´on 4.3 se describe la implementaci´on de la interfaz de acceso a los datos obtenidos del repositorio. La Secci´on 4.4 detalla c´omo se adapt´o el modelo de datos, descripto en el cap´ıtulo anterior, de acuerdo a las caracter´ısticas del repositorio objetivo. Las Secciones 4.5 y 4.6 describen el procesamiento de los art´ıculos contenidos en el repositorio para su transformaci´on en entidades del modelo de datos definido. Finalmente, la Secci´on 4.7 describe la implementaci´on de un conjunto de indicadores bibliom´etricos que brindan informaci´on sobre los datos obtenidos del repositorio.
4.1.
Repositorio Objetivo
El cap´ıtulo previo present´o un enfoque para la derivaci´on de un grafo de entidades, a partir de un repositorio semiestructurado de informaci´on cient´ıfica, y la posterior elaboraci´on de indicadores bibliom´etricos sobre este grafo. Como se menciona en el cap´ıtulo previo, la aplicaci´on de ese enfoque de alto nivel en un repositorio concreto necesita de la adaptaci´on de cada uno de los componentes planteados, teniendo en cuenta las caracter´ısticas del repositorio objetivo. Este cap´ıtulo comienza describiendo las caracter´ısticas del repositorio sobre el que se implement´o la herramienta producida en este trabajo.
El repositorio objetivo seleccionado es el perteneciente al CONICET. Este consejo es el principal organismo dedicado a la promoci´on de la ciencia y la tecnolog´ıa en la Argentina. Su actividad se desarrolla en las ´areas de ciencias agrarias, ingenier´ıa y de materiales; ciencias biol´ogicas y de la salud; ciencias exactas y naturales; ciencias sociales y humanidades1. Este repositorio cuenta con un portal Web donde se encuentra la informaci´on personal de todos los investigadores del
1
http://web.conicet.gov.ar/web/conicet.acercade.descripcion