LISTA DE ANEXOS
4. ACERCA DE LA PROPUESTA METODOLÓGICA
4.5 INSTRUMENTOS METODOLÓGICOS
4.5.1 Etiquetas Dublin Core
La selección del estándar Dublin Core se realizó dado que permite la descripción de documentos y facilita su posterior recuperación. Estos metadatos pueden utilizarse tanto con HTML como con otros lenguajes como XML y RDF, que es un lenguaje de descripción (por sus siglas Resource Description Framework) que facilita representar información sobre recursos en Internet, cualidad que resulta útil para la posterior publicación de la información que se describirá a partir de esta metodología.
Los elementos Dublin Core son 15 en total y se reseñan a continuación: Título
El título es el nombre dado a un recurso, usualmente corresponde a un nombre formal con el que se conoce un recurso.
Dentro de esta metodología se reconocerá como título el nombre que el grupo de investigación ha asignado al documento electrónico. Sin embargo dado que estos nombres no están normalizados, se ajustaran para lograr una uniformidad en ellos, adoptando los patrones establecidos en la presente propuesta metodológica.
Autor
La autoría se atribuye al “responsable de la creación del contenido intelectual del recurso”45. El creador de un recurso puede ser una persona, una organización o un
servicio.
En la descripción de los documentos del proyecto, se tendrán en cuenta dos condiciones: en primer lugar, en algunos archivos no es evidente la autoría y en
45 LAMARCA LAPUENTE, María Jesús. Hipertexto: El nuevo concepto de documento en la cultura
de la imagen. Metadatos Dublin Core. [En línea] (Consultado el 02 de mayo de 2011) Disponible en: http://www.hipertexto.info/documentos/dublin_core.htm
67
segundo lugar, se considera relevante recuperar los nombres de las personas que participan en algunas mesas de trabajo, reuniones o en la elaboración de determinados documentos.
Por lo anterior, en esta propuesta metodológica se estima conveniente identificar como autores a las personas que aparezcan relacionadas en los documentos. Dado que el proyecto se realiza en el marco de una institución universitaria se considerará también la autoría institucional en la descripción de los documentos. En este sentido se empleará la jerarquía de estamentos de la Universidad: la Universidad propiamente dicha, la Facultad y el Programa Académico en ese orden respectivo.
Para el caso de los documentos elaborados por el equipo de trabajo de la Vicerrectoría Académica se especificara de la siguiente manera: la Universidad y a continuación el Proyecto Estudio Descriptivo Prácticas Universitarias.
Materias y palabras clave
Son la representación semántica del tema principal del contenido de un documento o recurso. El tema puede traducirse en palabras clave, frases clave o códigos de clasificación que lo describan. Es recomendable que estas palabras sean asignadas empleando un vocabulario controlado o un esquema de clasificación formal, de tal forma que sean normalizadas.
La asignación de las materias y palabras claves es una de las actividades primordiales en la representación de los contenidos porque posibilita su posterior recuperación, razón por la cual es un tema sensible en esta propuesta metodológica.
Las materias y palabras claves que se emplearán en la presente propuesta metodológica corresponden al listado de términos normalizados que diseñara la estudiante.
Descripción
Se refiere a la descripción del contenido del recurso. Dicha descripción consiste en: resumen, tabla de contenidos, referencia a una representación gráfica de contenido o una descripción de texto libre del contenido, entre otros.
Para esta propuesta metodológica se considerara la descripción de texto libre del contenido para cada documento.
68
Colaborador
Corresponde a la entidad responsable de hacer colaboraciones al contenido del recurso. Como en el caso del autor, el colaborador puede ser una persona, una organización o un servicio.
Para esta descripción no se considera necesario el empleo de esta etiqueta, sin embargo es una alternativa. Típicamente el principal colaborador identificado en los documentos es la Pontificia Universidad Javeriana.
Fecha
Se entiende la fecha asociada con un evento en el ciclo de vida del recurso. Sin embargo, usualmente la fecha está asociada con la creación o disponibilidad del recurso.
Para la presente propuesta metodológica se utilizará un valor de datos codificado según la norma ISO 8601 que sigue el formato YYYY-MM-DD.
Tipo
Se refiere a la naturaleza o categoría del contenido del recurso, que se representa empleando términos que describen las categorías generales, funciones, géneros o niveles de agregación del contenido.
Dublin Core ha desarrollado un vocabulario controlado (por ejemplo, el DCMI Vocabulary, DCMITYPE disponible en: http://dublincore.org/documents/dcmi-type-
vocabulary/ desde el cual puede seleccionarse un valor (término). A continuación
se describen estos términos:
Término Definición Nota
Colección
(Collection)
Una agregación o
conjunto de recursos Una colección se describe como un grupo, pero sus partes también pueden ser descritas por separado.
Conjunto de datos
(Dataset)
Los datos codificados en
una estructura definida. Por ejemplo listas, tablas y bases de datos. Un conjunto de datos puede ser útil al ser procesados directamente por la máquina.
Evento
(Event)
Algo no persistente, una aparición en función del tiempo.
Los metadatos empleados para un evento proporcionan información descriptiva que permite descubrir la finalidad, ubicación, duración, y los agentes responsables asociados a un evento. Ejemplos: exposición, transmisión por Internet, conferencia, seminario, jornada de puertas abiertas, presentación, batalla, juicio, boda, fiesta de té, conflagración, entre otros.
Imagen
(Image)
Una representación
69
animaciones e imágenes en movimiento, cine, diagramas, mapas, notación musical. Debe considerarse que la imagen puede incluir tanto representaciones electrónicas como físicas.
Recursos Interactivos (Interactive Resource)
Un recurso que requiere interacción del usuario para ser entendido,
ejecutado, o
experimentado.
Ejemplos: páginas web, applets, objetos de aprendizaje multimedia, servicios de chat, o entornos de realidad virtual. Imagen en movimiento (Moving Image) Una serie de representaciones
visuales que imparte una impresión de movimiento cuando se muestra en la sucesión.
Ejemplos: animaciones, películas, programas de televisión, videos, zoótropos, o una simulación visual. Instancias del tipo de imagen en movimiento también se describen como casos más amplios del tipo Imagen.
Objetos físicos (Physical Object) Un inanimado, un objeto tridimensional o una sustancia.
Tenga en cuenta que las representaciones digitales de, o sustitutos para estos objetos deben utilizar imagen, texto o uno de los otros tipos.
Servicio
(Service)
Un sistema que
proporciona una o más funciones.
Ejemplos: un servicio de fotocopiado, un servicio bancario, un servicio de autenticación, préstamo interbibliotecario, Z39.50 o un servidor Web.
Software
(Software)
Un programa de
ordenador en formato fuente o compilado.
Ejemplos: un archivo de origen C, MS-Windows. exe ejecutable o script en Perl.
Sonido
(Sound)
Un recurso destinado principalmente a ser oído.
Ejemplos: reproducción de música en formato de archivo, un disco compacto de audio y voz grabada o sonidos. Imagen fija (Still Image) Una representación visual estática.
Ejemplos: pinturas, dibujos, diseños gráficos, planos y mapas. La mejor práctica recomendada es asignar el tipo de texto a las imágenes de los materiales textuales. Instancias del tipo de imagen fija también deben describirse como casos más amplios del tipo Imagen.
Texto
(Text)
Un recurso que consiste
principalmente en
palabras para leer.
Ejemplos: libros, cartas, tesis, poemas, periódicos, artículos, archivos de listas de correo. Tenga en cuenta que facsímiles o imágenes de los textos son aun del género Texto.
Cuadro No 5. Vocabulario Controlado Dublin Core46
En esta propuesta metodológica se emplearan algunos de los términos descritos de este vocabulario controlado.
Formato
Es la manifestación física o digital del recurso. Incluye el tipo de media o dimensiones del recurso. Se emplea para determinar el software, hardware u otro equipamiento necesario para ejecutar u operar con el recurso. Las dimensiones son el tamaño y la duración.
46 Dublin Core. Vocabulario Controlado Dublin Core. [En línea] (Consultado mayo de 2011)
70
Para esta propuesta metodológica se seleccionara un valor de un vocabulario controlado (por ejemplo, la lista de Internet Media Types (MIME) que define los formatos de medios de ordenador).
Identificación
Dublin Core define que la Identificación es una referencia no ambigua para el recurso dentro de un contexto dado y recomienda identificar el recurso por medio de una cadena de números de acuerdo con un sistema de identificación formal, por ejemplo un URI (que incluye el Uniform Resource Locator, URL), el Digital Object Identifier (DOI) y el International Standard Book Number (ISBN).
Se estima conveniente el uso de DOI (Digital Object Identifier), sin embargo no se empleará aún dicho recurso en esta descripción. Provisionalmente se asignará a cada recurso un consecutivo.
Este consecutivo se construirá de la siguiente manera: las letras iniciales del Estudio Descriptivo Prácticas Universitarias (EDPU), seguido de guión, las letras iniciales de la Pontificia Universidad Javeriana (PUJ), seguido de guión un número consecutivo que iniciara en 001.
Fuente
La fuente es una referencia a un recurso del cual se deriva el recurso actual. El recurso actual puede derivarse, en todo o en parte, de un recurso fuente. Se recomienda referenciar el recurso por medio de una cadena o número de conformidad con un sistema formal de identificación.
Para efectos de esta propuesta metodológica, esta etiqueta no aplica y por tanto no se utilizará.
Lengua
Se refiere a la lengua del contenido intelectual del recurso.
Para esta descripción se recomienda el uso de lenguaje Marc para establecer el
idioma, que típicamente será “spa” dado que los documentos se encuentran en
71
Relación
La relación es una referencia a un recurso relacionado. La metodología Dublin Core recomienda referenciar el recurso por medio de una cadena de números de acuerdo con un sistema de identificación formal.
La metodología Dublin Core no ofrece mayor información acerca del sistema de identificación formal, por tanto para la descripción de los documentos se construirá un código alfanumérico que referencie a la carpeta original de ubicación del recurso.
Cobertura
Se refiere a la extensión o ámbito del contenido del recurso. Abarcaría la localización espacial (un nombre de lugar o coordenadas geográficas), el período temporal (una etiqueta del período, fecha o rango de datos) o jurisdicción (el nombre de una entidad administrativa).
La metodología Dublin Core recomienda seleccionar un valor de un vocabulario controlado (del Thesaurus of Geographic Names, TGN por ejemplo) y que, donde sea apropiado, se usen preferentemente los nombres de lugares o períodos de tiempo antes que los identificadores numéricos tales como un conjunto de coordenadas o rangos de datos.
El uso de esta etiqueta en la presente propuesta metodológica se considera opcional.
Derechos
Los Derechos, de acuerdo con la metodología Dublin Core se refieren a la información sobre derechos de propiedad y sobre el recurso. Podrá contener un estamento de gestión de derechos para el recurso, o referencia a un servicio que provea tal información. La información sobre derechos a menudo corresponde a los derechos de propiedad intelectual, copyright y otros derechos de propiedad. Dado que los Derechos sobre los documentos del proyecto pertenecen a la Pontificia Universidad Javeriana, el uso de esta etiqueta no se considera relevante.
72 4.6 RESULTADOS
Las Prácticas Universitarias realizadas en la Pontificia Universidad Javeriana dependen de cada Programa Académico, lo que genera una producción documental en torno a dichas prácticas, que depende del carácter de cada Programa. En la Pontificia Universidad Javeriana se desarrollan Prácticas Universitarias dos tipos: social y profesional. Si bien la Universidad establece unas directrices generales para todos los Programas Académicos de acuerdo a las disposiciones legales para este propósito, cada programa académico es autónomo en la disposición de diferentes escenarios para el desarrollo de la Práctica Universitaria, de tipos específicos de productos resultantes de las Prácticas, de perfiles ajustados para los practicantes, de diferentes tiempos de ejecución, entre otros.
Análisis Preliminar del material
El corpus documental entregado por el equipo de Vicerrectoría Académica estaba compuesto por un total 991 documentos electrónicos, principalmente en formatos Word, Excel, PDF, MP3, Power Point, agrupados en 39 carpetas.
La valoración inicial del corpus documental del proyecto proporcionado por el Equipo de trabajo de Vicerrectoría Académica, es decir el análisis preliminar del material, permitió observar que las carpetas donde se encontraban agrupados los
archivos podrían separarse en tres grandes “núcleos”. El primer núcleo fue denominado “Sesiones de Presentación”, y contenía los audios de las mesas de
trabajo desarrolladas por el Equipo de Trabajo y sus respectivas transcripciones. El segundo núcleo fue denominado “Documentos institucionales” y contenía
documentos como la Misión, Visión, Estatutos, Reglamentos y documentos curriculares de los programas académicos de la Pontificia Universidad Javeriana. El tercer núcleo de archivos identificados estaba conformado por 37 carpetas nombradas de acuerdo al Programa Académico correspondiente. Cada carpeta contenía los documentos recopilados en relación con el tema de Prácticas Universitarias. Dentro de ellas se encontraron: documentos curriculares, audios de las entrevistas realizadas con los directores de los Programas Académicos y los Coordinadores de Prácticas Universitarias con su respectiva transcripción, formatos de inscripción, syllabus, lineamientos de la Práctica Universitaria, entre otros.
Por una parte, se observó que estas carpetas no eran homogéneas en términos de extensión, es decir, no contenían la misma cantidad de archivos, por otra parte, los documentos recopilados no eran similares para todas las Carreras, si bien mantenían la característica común de estar relacionados con el tema de Prácticas Universitarias. En términos de contenido y de los formatos que soportaban los
73
documentos, se observó una considerable variedad. Los núcleos identificados tampoco podrían ser empleados como categorías por su falta de uniformidad. Organización por categorías
Si bien la organización por carreras era coherente, denominar categorías de acuerdo a los nombres de las carreras daría como resultado 37 categorías, que no incluían las Sesiones de Presentación ni los Documentos Institucionales, sin embargo, cada carrera es un programa académico y bajo este concepto podrían agruparse los diferentes archivos en las carpetas por carreras, de allí surgió la primera categoría identificada: PROGRAMAS DE ESTUDIOS.
El reflejo de la organización inicial de los archivos que permitió identificar esta categoría (ver Anexo No 1. Cuadro de Organización Preliminar). Sin embargo esta categoría se agruparon únicamente los documentos cuyo contenido se refiriera al programa académico en cuestión más no al tema de prácticas universitarias, es decir las presentaciones de las facultades, de los departamentos, de los programas académicos, los syllabus, los planes de estudio, por mencionar algunos.
La revisión de los archivos tal como fueron entregados permitió identificar que los títulos de los documentos variaban uno de otro, aunque existía un patrón más o menos común de denominarlos de acuerdo a las carreras. Por ejemplo en la carpeta de Administración se encontró un archivo en Word denominado así:
“Administracion.FormatoInscripcion.Nov17de2010” y algunos conservaban el
patrón similar de nombrar la carrera, el tipo de documento al que aludía el contenido y la fecha de captura probablemente.
A pesar de que existía una carpeta denominada Documentos curriculares, dentro de las carpetas por programas se observaban archivos en PDF que correspondían precisamente a documentos curriculares, no de la Universidad, sino de cada programa específico, por ejemplo: “Administracion.PlanDeEstudios.SF”.
Gracias a esta observación se escogió la siguiente categoría denominada: DOCUMENTOS CURRICULARES, donde se recogieron todos los documentos de las carreras que correspondían a documentos curriculares y lineamientos establecidos.
Dado que el levantamiento de información realizado por el equipo de Vicerrectoría Académica empleo herramientas como la entrevista y sesiones de trabajo, se estableció la siguiente categoría denominada ENTREVISTAS, que permitió recoger los audios de las entrevistas y sus respectivas transcripciones, y los informes elaborados a partir de ellas.
74
Siguiendo esa línea, el equipo de trabajo también aplico cuestionarios a los Directores de Programa y a los Coordinadores de Prácticas Universitarias, también recogió formatos en cada programa académico, razón por la cual se pudo identificar una categoría que fue denominada CUESTIONARIOS.
Finalmente, como una mayoría de los documentos por carreras están relacionados con el tema de prácticas universitarias y considerando que era la temática principal en torno a la cual giraba el tema del Estudio Descriptivo, se decidió denominar la siguiente categoría PRÁCTICAS y se recogieron aquí, todos los documentos recopilados por el equipo de trabajo de Vicerrectoría Académica relacionados con el tema de prácticas universitarias.
Una vez fueron identificadas estas categorías y tras valorar que resultaban suficientes para la clasificación de los documentos, se procedió a aplicar los patrones establecidos para la normalización de los títulos de los documentos.
Parametrización de títulos
Para cada documento se construyo un título forma donde el primer componente estaba ligado al programa académico al cual correspondía en específico, pues finalmente esta denominación es la que más fácilmente se reconoce y asignar el término PROGRAMAS ACADÉMICOS sería muy general y alargaría innecesariamente el título.
Para el siguiente patrón de normalización, determinado por el contenido mismo de los documentos, se relacionaron las “palabras claves” encontradas y se escribieron en una lista aparte y temporal para no variar el uso de los términos. En este sentido, algunos títulos podrían tener más de un componente relacionado con el contenido, se emplearon tantos componentes como fuesen necesarios para no afectar la identificación de los documentos.
El tercer componente es la denominación de la categoría y este término se ubicó al final del título.
Observando los ejemplos anteriores, para el documento denominado:
“Administracion.FormatoInscripcion.Nov17de2010” el título fue normalizado de la
siguiente manera: Administracion.PracticaEmpresarial.Inscripcion.Formato. El
documento denominado “Administracion.PlanDeEstudios.SF”, tras su valoración
se normalizo bajo el título “AdministraciondeEmpresas.DocumentoCurricular”.
Una vez normalizados los títulos, los archivos fueron separados por categorías identificadas en carpetas aparte, es decir para cada categoría se creó una carpeta electrónica y allí fueron trasladados los documentos de acuerdo a este criterio.
75
La normalización de los títulos permitió adicionalmente encontrar una situación que no había sido considerada previamente: la duplicidad de archivos. Se encontraron varios archivos que contenían la misma información aunque en diferente formato, principalmente archivos en Word tenían una copia similar en formato PDF.
Se determino entonces la necesidad de realizar un expurgo de los documentos y se descartaron los archivos en Word bajo el argumento de su vulnerabilidad y se dejaron los archivos en formato PDF.
En consecuencia, de los 991 archivos iniciales, quedaron luego de la normalización y del expurgo, 803 archivos.
Análisis documental del contenido
Dado que no fue identificado un lenguaje documental que se ajustará a las necesidades de descripción del proyecto, se relacionan a continuación los términos normalizados construidos en este marco:
No Término normalizado
1 Acreditación