• No se han encontrado resultados

Concepción de una arquitectura colaborativa de gestión documental como base para la extracción, transformación y carga de datos residentes en documentos

N/A
N/A
Protected

Academic year: 2020

Share "Concepción de una arquitectura colaborativa de gestión documental como base para la extracción, transformación y carga de datos residentes en documentos"

Copied!
98
0
0

Texto completo

(1)UNIVERSIDAD CENTRAL “MARTA ABREU” DE LAS VILLAS Facultad de Matemática, Física y Computación Departamento de Ciencias de la Computación. Concepción de una Arquitectura Colaborativa de Gestión Documental como base para la Extracción, Transformación y Carga de datos residentes en documentos. Tesis Presentada en Opción al Título Académico de Máster en Ciencia de la Computación.. Autor: Ing. Mareilys Luna Pérez. Tutores: Dra. Ana María García Pérez MSc. Iván M. Cárdenas Tandrón. Santa Clara 2013.

(2) “Basta para ser grande, intentar lo grande” José Martí.

(3) RESUMEN Las organizaciones generan una gran cantidad de documentos, en los cuales sostienen muchas de sus operaciones. El gran volumen documental y la diversidad de la información contenida en documentos hacen que estos sean de alto valor estratégico. Gestionar el volumen de información de las organizaciones constituye un reto importante en los días de hoy. El manejo incorrecto de los documentos dada la inexistencia de mecanismos adecuados para su revisión e intercambio, influye en forma negativa en los procesos de toma de decisiones pues se incrementa el margen de error y la desconfianza por parte de los consumidores de la información, al no poder acceder oportunamente a los datos que necesitan, en la mayoría de las veces dispersos en las estaciones de trabajo, o en manos de otros especialistas. Para dar respuesta a las necesidades (1) de manejo de documentos en ambientes colaborativos, y (2) apoyar además los procesos de Toma de Decisiones mediante la integración de la información vital contenida en documentos que viajan de una organización a otra, de forma oportuna, como requisitos fundamentales que justifican la investigación, en el presente trabajo se aborda la concepción, diseño y la implementación de una Arquitectura de Gestión Documental partiendo de la caracterización de las técnicas y herramientas de Gestión Documental, así como de las técnicas y herramientas de Integración de Datos, seleccionando e integrando al Sistema de Gestión Documental Alfresco con Pentaho Data Integration. El estudio e integración de ambas técnicas y herramientas, establecen un marco de referencia práctico para la resolución de problemas similares a los descritos. La solución fue instanciada en el Observatorio de Seguridad Ciudadana (OVS) de la República Bolivariana de Venezuela, dada las necesidades de recepción y revisión del documento de MS Excel “Registro de Cadáveres” desde la Coordinación Nacional de Ciencias Forenses (CNCF), y su procesamiento automatizado, para poder brindar instrumentos de análisis al propio OVS, a otros niveles superiores del Gobierno, e incluso al propio CNCF..

(4) ABSTRACT Nowadays, organizations manage a big amount of documents that support many of the operations and processes. The huge volume and the diversity of the managed information on them, increase its strategic value. Manage this documental volume has become an important challenge. The incorrect management of documents, based on the inexistence of mechanisms to review and to exchange, cause negative effects on the decision support processes because it raises the error margin and the distrust of the consumers of the information, who can’t reach the data on time, frequently, distributed on computers and specialists. To solve these requirements of (1) document management on collaborative environments, and (2) support decisions by the integration of the data on documents, transferred between organizations, this work is focused on the conception, design and implementation of an Architecture of Document Management based on the characterization of the techniques and tools of Document Management and Data Integrations, selecting and integrating the Document Management System Alfresco with Pentaho Data Integration. The study and integration of both techniques and tools, establish a practical reference to solve similar problems. The solution was instanced on the Observatory of Public Safety (OVS) of the Bolivarian Venezuelan Republic, based on the needs of review of a MS Excel document called “Cadaver Registry” from the National Forensic Center (CNCF), and the automatic integration requisite, as an instrument of analysis for the OVS, and superiors levels of the Government, included the CNCF..

(5) DEDICATORIA. A mis padres, por apoyarme y sacar siempre lo mejor de mí..

(6) AGRADECIMIENTOS. A la persona que ha hecho posible la realización de este sueño y a todos mis compañeros de trabajo..

(7) TABLA DE CONTENIDO TABLA DE CONTENIDO ........................................................................................................................................... 7 ÍNDICE DE FIGURAS ................................................................................................................................................ 9 INTRODUCCIÓN ..................................................................................................................................................... 1 CAPÍTULO 1 “TÉCNICAS Y HERRAMIENTAS DE GESTIÓN DOCUMENTAL E INTEGRACIÓN DE DATOS” ..................... 5 1.1. MANEJO DE DOCUMENTOS ....................................................................................................................................5. 1.2. GESTIÓN DOCUMENTAL .........................................................................................................................................5. 1.2.1. Técnicas de Gestión Documental ...........................................................................................................6. 1.2.2. Reglas de Negocio ..................................................................................................................................6. 1.2.3. Flujos de Trabajo ....................................................................................................................................7. 1.2.4. Versionado .............................................................................................................................................8. 1.2.5. Colaboración ..........................................................................................................................................9. 1.2.6. Gestión Documental Inteligente ............................................................................................................9. 1.3. HERRAMIENTAS DE GESTIÓN DOCUMENTAL ............................................................................................................10. 1.3.1. Objetivos generales de un Gestor Documental ....................................................................................10. 1.3.2. Características de un Gestor Documental ............................................................................................10. 1.3.3. Herramientas propietarias para la Gestión Documental .....................................................................12. 1.4. HERRAMIENTAS LIBRES PARA LA GESTIÓN DOCUMENTAL ............................................................................................15. 1.5. VALORACIÓN DEL AUTOR .....................................................................................................................................22. 1.6. INTELIGENCIA DE NEGOCIOS .................................................................................................................................23. 1.6.1. Técnicas de Integración .......................................................................................................................24. 1.6.2. Calidad de los datos .............................................................................................................................28. 1.6.3. Herramientas de ETL ............................................................................................................................29. 1.6.4. Almacenamiento de Datos ...................................................................................................................31. 1.6.5. Análisis de Datos ..................................................................................................................................35. 1.6.6. Protocolos de comunicación ................................................................................................................36. CONCLUSIONES PARCIALES DEL CAPÍTULO .........................................................................................................................38 CAPÍTULO 2 “ARQUITECTURA COLABORATIVA DE GESTIÓN DOCUMENTAL COMO BASE PARA LA EXTRACCIÓN, TRANSFORMACIÓN Y CARGA DE DATOS RESIDENTES EN DOCUMENTOS” ........................................................... 39 2.1. ARQUITECTURA TECNOLÓGICA DE LA SOLUCIÓN........................................................................................................39. 2.2. DESCRIPCIÓN DE LA SOLUCIÓN ..............................................................................................................................41. 2.3. DESCRIPCIÓN DE LOS ESPACIOS DE TRABAJO ............................................................................................................43. 2.4. DESCRIPCIÓN DE LOS ROLES INVOLUCRADOS ............................................................................................................46. 2.5. REPOSITORIOS DOCUMENTALES ............................................................................................................................48. 2.5.1. Descripción de la arquitectura de repositorios ....................................................................................49.

(8) 2.5.2. Arquitectura del repositorio de las fuentes de datos ...........................................................................49. 2.5.3. Arquitectura del repositorio de ETL .....................................................................................................50. 2.5.4. Arquitectura del Repositorio Documental Central ...............................................................................51. 2.6. FLUJOS DE TRABAJO ............................................................................................................................................52. 2.7. REGLAS DE CONTENIDOS ......................................................................................................................................55. 2.8. EXTENSIÓN DE LA HERRAMIENTA ALFRESCO .............................................................................................................59. 2.8.1. Diagrama de clases ..............................................................................................................................60. 2.8.2. Diagrama de paquetes.........................................................................................................................62. 2.8.3. Instalación del módulo AMP: ExecuteCommand .................................................................................62. CONCLUSIONES PARCIALES DEL CAPÍTULO..........................................................................................................................64 CAPÍTULO 3 CASO DE ESTUDIO “COORDINACIÓN NACIONAL DE CIENCIAS FORENSES” ....................................... 65 3.1. DESCRIPCIÓN DEL CASO DE ESTUDIO ......................................................................................................................65. 3.2. REGISTRO DE CADÁVERES.....................................................................................................................................67. 3.3. SISTEMA BÁSICO DE APOYO..................................................................................................................................70. 3.4. REQUISITOS.......................................................................................................................................................72. 3.4.1. Recepción de los documentos ..............................................................................................................72. 3.4.2. Calidad de los datos .............................................................................................................................73. 3.4.3. Revisión de la información ...................................................................................................................76. 3.4.4. Consolidación Estadística .....................................................................................................................76. 3.4.5. Resguardo de los documentos .............................................................................................................77. 3.4.6. Compartimentación y seguridad de la información .............................................................................77. 3.4.7. Áreas de Trabajo ..................................................................................................................................77. 3.4.8. Manejo de grandes volúmenes de documentos ..................................................................................78. 3.4.9. Disminución de los costos de las licencias............................................................................................78. 3.5. INSTANCIANDO LA ARQUITECTURA PROPUESTA ........................................................................................................78. 3.5.1. Roles.....................................................................................................................................................79. 3.5.2. Espacios de Trabajo .............................................................................................................................79. 3.5.3. Repositorios Documentales .................................................................................................................79. 3.5.4. Flujos de Trabajo ..................................................................................................................................80. 3.5.5. Reglas de Contenido ............................................................................................................................82. CONCLUSIONES PARCIALES DEL CAPÍTULO .........................................................................................................................84 CONCLUSIONES GENERALES ................................................................................................................................ 85 REFERENCIAS BIBLIOGRÁFICAS ............................................................................................................................ 87.

(9) ÍNDICE DE FIGURAS FIGURA 1 ARQUITECTURA DE ALFRESCO (SHARIFF, 2005) ........................................................................................................19 FIGURA 2 ARQUITECTURA TRADICIONAL DE INTELIGENCIA DE NEGOCIOS .....................................................................................24 FIGURA 3 ARQUITECTURA PARA LA TOMA DE DECISIONES BASADO EN DOCUMENTOS ......................................................................25 FIGURA 4 PASOS DEL PROCESO DE ETL..................................................................................................................................27 FIGURA 5 VISTA GENERAL DE UNA TABLA DE HECHOS CON DIMENSIONES Y MEDIDAS. .....................................................................35 FIGURA 6 ARQUITECTURA DE LA SOLUCIÓN ............................................................................................................................40 FIGURA 7 REPOSITORIO HISTÓRICO DOCUMENTAL. DIRECCIÓN DE FINANZAS ...............................................................................50 FIGURA 8 REPOSITORIO DE ETL CONCEPTOS FINANCIEROS........................................................................................................51 FIGURA 9 REPOSITORIO HISTÓRICO DOCUMENTAL. DI: CONSOLIDACIÓN FINANCIERA ....................................................................52 FIGURA 10 FLUJO DE TRABAJO ENTRE LAS FUENTES Y LOS RECEPTORES. .......................................................................................54 FIGURA 11 FLUJO DE TRABAJO PARA INTEGRAR LA INFORMACIÓN ...............................................................................................55 FIGURA 12 ASISTENTE PARA CREAR REGLAS. CONDICIONES ......................................................................................................56 FIGURA 13 ASISTENTE PARA CREAR REGLAS. ACCIONES. ..........................................................................................................57 FIGURA 14 ASISTENTE PARA CREAR REGLAS. TIPO DE REGLA.....................................................................................................58 FIGURA 15 ASISTENTE PARA CREAR REGLAS. RESUMEN. ..........................................................................................................58 FIGURA 16 FLUJO DE TRABAJO “REVISIÓN TÉCNICA DE LOS SBA” ..............................................................................................59 FIGURA 17 DIAGRAMA DE CLASES ........................................................................................................................................61 FIGURA 18 DIAGRAMA DE PAQUETES ...................................................................................................................................62 FIGURA 19 PROCESOS DEL FLUJO DE INFORMACIÓN CNCF ........................................................................................................69 FIGURA 20 SBA_CNCF_CADAVER CON ERRORES ................................................................................................................75 FIGURA 21 SBA_CNCF_CADAVER DIFERENTES FORMATOS (ELIMINACIÓN Y ADICIÓN DE COLUMNAS) ............................................75 FIGURA 22 FLUJO DE TRABAJO DE COLABORACIÓN ENTRE LA CNCF Y EL OVS ..............................................................................81 FIGURA 23 FLUJO DE TRABAJO DE REVISIÓN E INTEGRACIÓN EN EL OVS ......................................................................................81 FIGURA 24 DENOMINACIÓN DEL SBA_CADAVER.BAT ...........................................................................................................82 FIGURA 25 CONTENIDO DEL SBA_CADAVER.BAT .................................................................................................................82.

(10) INTRODUCCIÓN “La información es un conjunto organizado de datos, que constituye un mensaje sobre un cierto fenómeno o ente. La información permite resolver problemas y tomar decisiones, ya que su uso racional es la base del conocimiento”. (Definicion.de 2008) A lo largo de la historia, el almacenamiento y el acceso a la información ha sufrido cambios a medida que el ser humano ha ido evolucionando. En épocas anteriores la necesidad de transmitir información de generación en generación hizo de los manuscritos una forma viable de acceso a la misma, luego con el nacimiento de la imprenta y el papel, los libros tomaron un lugar importante que hasta los días de hoy no han dejado de tener dando lugar a las grandes bibliotecas. Luego en los años 1900, aparecieron los medios de comunicación masiva y las herramientas digitales que derivaron en el desarrollo de “Internet” y consecuentemente en el desarrollo de las Tecnologías de Información y Comunicaciones (TIC), donde la información es almacenada digitalmente. En la actualidad la riqueza de información de las organizaciones se encuentra fundamentalmente en datos no estructurados, como los documentos, páginas web o correo electrónico a diferencia de la información estructurada que comúnmente acostumbramos a ver en las bases de datos. El diccionario de la Real Academia de la Lengua Española plantea que: un documento es una “Instrucción en cualquier materia. Escritura o instrumento” (Aristos 1995), pero teniendo en cuenta un punto de vista informático, un documento es un instrumento que contiene datos no estructurados textuales o gráficos y que se pueden encontrar en diferentes formatos electrónicos como Word, Excel, Correos, etc y que son creados por los usarios en sus ordenadores. El uso intensivo de las TIC para la realización de las actividades dentro de las organizaciones, hace necesario contar con soluciones tecnológicas y metodológicas adecuadas para la gestión de sus procesos. Estas soluciones ya desarrolladas e implantadas, en muchos casos van convirtiéndose en soluciones no adaptadas a los continuos cambios y dejan de ser funcionales y son desechadas. Las empresas sustituyen frecuentemente estos “sistemas legados” y enfrentan costosos diseños y desarrollos. Pensar en estrategias de reutilización de lo que ya funciona, puede ser un punto provechoso (Pérez Viera, y otros, 2009) Ante la necesidad de una nueva gestión de algún proceso no concebido por las soluciones informáticas dentro de las organizaciones, lo común en casi un 100% de las ocasiones es crear un 1.

(11) nuevo documento de Office, ya sea Excel, Word o Power Point (u otro), que soporte este nuevo proceso. Por ejemplo: Imaginemos que se solicite “El listado de especialistas que deberán participar en un Evento”. A partir de la necesidad de organizar la tarea, deberá tenerse no solamente el “Listado de nombres de especialistas”, sino también el control del conjunto de trámites y condiciones que deben ir cumpliendo hasta terminar el proceso. Para ello el responsable creará un documento Excel y actualizará la “Lista de los nombres de los especialistas propuestos”, quizás desde otro sistema de gestión (o incluso otro documento Excel). A partir de aquí asociado a cada especialista adicionará nuevas columnas como por ejemplo “Sexo (SI\NO)”, “Chequeo Médico (SI\NO)”, “Rol (ROLES)”, “Necesita Transporte (SI\NO)”, “Estancia (TIEMPO)” (Cárdenas Tandrón, y otros, 2012). Desde ese momento, el nuevo documento Excel creado constituye el sistema de gestión para la actividad y posiblemente lo seguirá siendo en todas las ocasiones siguientes. Según Enrique Mazón Satrústegui, director de soluciones para Oracle Iberia “… los contenidos no estructurados representan más del 80% de la información de una empresa y tienen un alto valor estratégico, puesto que se utilizan en las operaciones cotidianas para tomar decisiones, trabajar de forma colaborativa y compartir el conocimiento. Además son la base de muchos procesos de negocio” (Satrústegui, 2008), por lo que analizar y procesar la información presente en los documentos constituye un reto para cualquier organización hoy en día. En la mayoría de las organizaciones la información documental queda atrapada en las estaciones de trabajo sin tener en cuenta que constituye una necesidad analizar y consolidar la misma a fin de que se optimicen los procesos de toma de decisiones a todos los niveles: el táctico operativo, los mandos medios y el nivel gerencial alto. Unido a esta problemática, la información documental, muchas veces volátil debido a la dinámica de cada organización, fluye y es gestionada de forma incompleta o poco confiable debido a errores humanos imposibilitando el correcto análisis de la misma, y propiciando informes que no reflejan la realidad de cada organización, por lo que se hace inevitable la búsqueda de alternativas que garanticen la calidad de la misma antes de su análisis. Un aspecto muy importante a tener en cuenta es la necesidad de revisar la calidad de la información en una misma versión de un documento, trabajo que es acometido por especialistas que se encuentran dispersos entre las organizaciones, en la mayoría de los casos este intercambio. 2.

(12) se establece por vías no seguras, pues es muy común encontrar el uso de correos con documentos adjuntos que no brindan ninguna seguridad y que dificultan el correcto flujo de información hacia una entidad rectora, además de que muchas veces los correos no son guardados correctamente y los documentos se encuentran dispersos en carpetas de computadoras personales diferentes propiciando muchas veces la duplicidad de los mismos. Ante dicha disyuntiva se define como problema científico de la investigación la siguiente interrogante: ¿Cómo facilitar la gestión e integración de información documental volátil, dispersa y no consolidada en ambientes colaborativos? Se define como objeto de estudio de este trabajo las técnicas y herramientas gestión documental, centrando su campo de acción en Extracción, Transformación y Carga de los datos contenidos en documentos. Con este trabajo se persigue como objetivo general: Brindar una solución integradora combinando técnicas y herramientas de Gestión Documental y Extracción, Transformación y Carga de datos, de forma tal que como parte de un flujo documental se extraigan los datos contenidos en documentos. Para el cumplimiento del objetivo general se plantean los siguientes objetivos específicos: 1. Caracterizar las técnicas y herramientas de Gestión Documental e Integración de Datos. 2. Concebir una arquitectura colaborativa de gestión documental como base para la integración de datos residentes en documentos. 3. Aplicar de la solución propuesta en el Caso de Estudio: Coordinación Nacional de Ciencias Forenses, a partir de la integración del documento Excel: “Registro de Cadáveres” como parte de un flujo de trabajo que permite la recepción, validación, almacenamiento, extracción, transformación y carga del contenido del documento El valor práctico consiste en la concepción de una arquitectura colaborativa de gestión documental como base para la extracción, transformación y carga de datos residentes en documentos. El valor teórico consiste en la adecuación de técnicas y herramientas de gestión documental e integración de datos como una práctica a implementar para el análisis de información documental, volátil, dispersa y no consolidada donde las fuentes de datos carecen de soluciones informáticas y la gestión de sus procesos está sobre la base de documentos. El documento está estructurado en tres capítulos que se describen a continuación:. 3.

(13) El Capítulo I “Técnicas y herramientas para el manejo de documentos y la integración de datos.” El autor identifica y describe las técnicas y herramientas de gestión documental e integración de datos. El autor brinda su valoración sobre las técnicas y herramientas a utilizar para dar solución al problema planteado. El Capítulo II “Arquitectura Colaborativa de Gestión Documental como base para la Extracción, Transformación y Carga de datos residentes en documentos” donde se describe la solución propuesta por el autor donde se relacionan un conjunto de validaciones a tener en cuenta para el trabajo con documentos. Se describe la extensión de la herramienta de gestión documental Alfresco permitiendo la integración con Pentaho Data Integration, como herramienta para la extracción de los datos y el análisis consecuente para la toma de decisiones. En el Capítulo III Caso de Estudio: “Coordinación Nacional de Ciencias Forenses”, se instancia la arquitectura colaborativa descrita tomando como ejemplo la integración del documento Excel: “Registro de Cadáveres” emitido por la Coordinación Nacional de Ciencias Forenses hacia el Observatorio de Seguridad Ciudadana de la República Bolivariana de Venezuela como parte de un flujo de trabajo que permite la recepción, validación, almacenamiento, extracción, transformación y carga automática del contenido del documento.. 4.

(14) CAPÍTULO 1 “Técnicas y herramientas de Gestión Documental e Integración de Datos” En el presente capítulo se identifican las técnicas y herramientas para el manejo de los documentos y la toma de decisiones a partir de los problemas y requerimientos descritos en el capítulo anterior para dar respuesta al problema en cuestión. El autor brinda una valoración entre las técnicas y herramientas a utilizar para dar solución al problema planteado. 1.1 Manejo de Documentos A lo largo de la historia, el almacenamiento y el acceso a la información ha sufrido cambios a medida que el ser humano ha ido evolucionando. En épocas anteriores la necesidad de transmitir información de generación en generación hizo de los manuscritos una forma viable de acceso a la misma, luego con el nacimiento de la imprenta y el papel, los libros tomaron un lugar importante que hasta los días de hoy no han dejado de tener dando lugar a las grandes bibliotecas. El diccionario de la Real Academia de la Lengua Española plantea que: un documento es una “Instrucción en cualquier materia. Escritura o instrumento” (Aristos, 1995), pero teniendo en cuenta un punto de vista informático, un documento es un instrumento que contiene datos no estructurados textuales o gráficos y que se pueden encontrar en diferentes formatos electrónicos y que son creados digitalmente por los usuarios con medios informáticos. Luego en los años 1900, aparecieron los medios de comunicación masiva y las herramientas digitales que derivaron en el desarrollo de “internet” y consecuentemente en el desarrollo de las Tecnologías de Información y Comunicaciones (TIC), donde la información es almacenada digitalmente. En la actualidad la riqueza de información de las organizaciones se encuentra fundamentalmente en datos no estructurados, como los documentos de facturas, ventas, compras, contratos, montos de ingresos, páginas web o correo electrónico a diferencia de la información estructurada que comúnmente acostumbramos a ver en las bases de datos (Cárdenas Tandrón, y otros, 2012). El uso intensivo de las TIC para la realización de las actividades dentro de las organizaciones, hace necesario contar con soluciones tecnológicas y metodológicas adecuadas para la correcta gestión de los grandes volúmenes de información documental que se generan diariamente. 1.2 Gestión documental. 5.

(15) La gestión documental, se puede definir como el conjunto de normas, técnicas y prácticas usadas para administrar el flujo de documentos de todo tipo en una organización. Permite la recuperación de información desde ellos, determina el tiempo que los documentos deben guardarse, eliminando los que ya no sirven y asegurando la conservación indefinida de los documentos más valiosos, de acuerdo a los principios de racionalización y economía.. Según la bibliografía una herramienta de gestión documental se puede definir como: un sistema informático que permite la automatización, la creación, el mantenimiento y la consulta de fuentes de información constituidas por documentos y, por lo tanto, sirve para explotar el conocimiento que contienen estos con el fin de ponerlo al alcance de los usuarios del sistema (Salinas Revelles, y otros, 2009). 1.2.1 Técnicas de Gestión Documental Las técnicas aplicadas a la gestión documental solucionan el conjunto de requisitos que se describe a continuación:  Almacenamiento: Permite identificar dónde guardaremos la información recopilada y que es el resultado de los trabajos de la organización.  Recuperación: Garantiza contar con opciones tecnológicas que brinden una facilidad a la hora de buscar la información y que sea en un tiempo real.  Clasificación: Requisito importante de la documentación a la hora de organizar nuestra empresa, y nos permite analizar todos los resultados que se obtienen del trabajo y la evolución de la misma de forma eficiente y productiva.  Seguridad: Garantiza la total integridad de los documentos donde se definen niveles de acceso a los mismos.  Autenticación: Garantiza todos los recursos legales para que aquella organización o persona que ha creado un documento tenga los derechos sobre él, cumpliendo con los estándares de originalidad.  Flujos de trabajo: Garantizan el registro automático de la documentación que entra y sale de un área de trabajo. 1.2.2 Reglas de Negocio Las reglas de negocio, proveen a los procesos donde intervienen los documentos, de una vía creativa para la administración y gestión de estos activos dentro de una organización. En su mayoría son. 6.

(16) ejecutadas a través de eventos que se definen en cada una de las herramientas informáticas para la gestión documental, en la mayoría de los casos suelen ejecutarse a petición del usuario cuando un documento “entra” o “sale” de un espacio de trabajo previamente definido, así como si el documento ha sufrido alguna actualización. Para definir una Regla de Negocio debemos tener en cuenta dos elementos importantes: las condiciones bajo las cuales se va a ejecutar esa regla y las acciones que voy a ejecutar en ellas.  Condiciones: Son las condiciones bajo las cuales las reglas de negocio pueden actuar. Teniendo en cuenta que las condiciones definen el alcance de la Regla de negocio se pueden definir algunos ejemplos como: -. Especificar el formato del documento (Excel, Word, Power Point).. -. Especificar una sección del nombre del documento.. -. Especificar la fecha de creación..  Acciones: Son las acciones contenidas dentro de una regla de negocio que asemejan los procesos de las organizaciones de manera automática. -. Agregar flujo de trabajo.. -. Copiar un documento a una carpeta específica.. -. Enviar una notificación vía e-mail.. -. Vincular un contenido a una categoría.. -. Copiar un documento en un formato dado, a una carpeta específica.. -. Transformar un documento a un formato específico.. -. Extraer los metadatos más comunes.. 1.2.3 Flujos de Trabajo Los flujos automatizados dentro de la gestión documental permiten crear dependencias entre documentos y procesos, especificar cada paso de un proceso de negocio, con sus actividades y dependencias relacionadas, así como los departamentos y roles de usuarios involucrados. Además podemos definir avisos automáticos que se activen dependiendo de actividades y eventos que se producen a lo largo del proceso. Su funcionalidad puede empezar por algo tan simple como el registro de documentación que entra y sale de un área de trabajo, hasta permitir un control de procesos tan sofisticados que cubran cada paso del ciclo de vida de un documento, incluyendo sus documentos relacionados, y llegan a. 7.

(17) automatizar al máximo procesos de negocio que atraviesan varios departamentos (Cárdenas Tandrón, y otros, 2013). Se puede reducir el tiempo empleado en la administración de las tareas, pues minimiza la probabilidad de olvidos y fallos en los procesos de gestión de los documentos. Otro punto importante es mirar hacia el final del ciclo de vida de un documento y poder definir qué "destino" toma cierta documentación y bajo qué criterios los podemos guardar o eliminar de nuestro sistema, manteniendo un estricto control de quién acomete estas acciones dentro del flujo, brindando la posibilidad de recuperar los documentos después de un tiempo determinado (Cárdenas Tandrón, y otros, 2013). 1.2.4 Versionado El control de versiones se realiza principalmente en la industria informática para controlar las distintas versiones del código fuente; sin embargo, los mismos conceptos son aplicables a otros ámbitos como documentos, imágenes, sitios web, pues cuando se trabaja con archivos digitales, a medida que se van modificando, suelen pasar por diferentes estados. Cuando varios autores colaboran en un espacio compartido pueden necesitar repetidamente editar y revisar documentos comunes. Llevar la cuenta de los cambios efectuados por los distintos autores significa un esfuerzo adicional que puede ser reducido poniendo estos documentos bajo el denominado control de versiones: el contenido de un documento que se halla bajo control de versiones no se reemplaza cuando el documento se modifica sino que, en su lugar, se crea una nueva versión del documento sin que desaparezca la anterior. Para que una herramienta de gestión documental gestione adecuadamente las versiones debe tener en cuenta lo siguiente:  Almacenamiento de los elemento versionados.  Posibilidad de realizar cambios sobre los elementos (ej. modificaciones parciales, añadir, borrar, renombrar o mover elementos).  Permitir la recuperación de un elemento desde su versión anterior o inicial.  Registro histórico de las acciones realizadas sobre cada elemento o conjunto de elementos. Aunque no es estrictamente necesario, suele ser muy útil la generación de informes con los cambios introducidos entre dos versiones, informes de estado, marcado con nombre identificativo de la versión de un conjunto de ficheros.. 8.

(18) 1.2.5 Colaboración Uno de los puntos importantes a tener en cuenta dentro de la Gestión de Documental es garantizar que el sistema implemente una arquitectura que propicie la colaboración entre las organizaciones, apoyando los flujos de información entre ellas, no solo los de recepción sino también la distribución de todos los documentos generados como parte de los procesos cotidianos de las mismas (Luna Pérez, y otros, 2012). La colaboración apoyada en flujos de trabajos automáticos de revisión documental, mejoran la productividad y eficiencia de las organizaciones, pues los especialistas no necesitan desplazarse, hacia otra entidad para que el nivel superior apruebe o revise un documento, tampoco es necesario hacer gastos de impresión, pues los documentos viajan digitalmente de una estación de trabajo a otra. Facilita el poder compartir conocimientos de las mejores prácticas, consejos, informes técnicos y casos de estudio. La posibilidad de que los especialistas de una organización puedan trabajar de forma colaborativa, a través de la implementación de foros de discusión sobre los documentos, garantizan una mayor calidad de la información que se analiza y que se procesa dentro de las organizaciones, contribuyendo a tomar mejores decisiones. Permiten conocer las mejores prácticas, participar en debates e intercambiar conocimientos con una amplia red de especialistas y expertos. Brindan la posibilidad de plantear problemas y recibir respuesta a preguntas cotidianas desde distintos puntos de vista (Luna Pérez, y otros, 2012). Al ofrecer colaboración e intercambio de conocimientos en tiempo real, ayuda a los especialistas a acelerar el valor de negocios a disminuir el costo de propiedad y resolver los problemas con mayor rapidez. Además es posible acceder a la información sobre ciertos temas de gran interés, noticias y eventos de conocimiento público dentro de las organizaciones así como informes de progreso o reportes estadísticos. A partir de la colaboración es posible unir los diferentes niveles de las organizaciones, dentro de un mismo sistema de gestión, a fin de que se optimicen los procesos de toma de decisiones a todos los niveles: el táctico operativo, los mandos medios y el nivel gerencial alto. 1.2.6 Gestión Documental Inteligente La Gestión Documental Inteligente (GDI) aplica tecnologías semánticas a la gestión de documentos y conocimientos, permitiendo la automatización de tareas administrativas relacionadas con la 9.

(19) clasificación y el procesamiento de la información generadas en las organizaciones. Este enfoque propone gestionar el contenido utilizando ontologías, las cuales organizan la información en dominios que son conceptualizados por taxonomías. La idea básica de la GDI, en forma general se enfoca en tener la información clasificada y relacionada para que su uso sea más efectivo y sea posible automatizar tareas administrativas complejas. 1.3 Herramientas de Gestión Documental Los SGD se utilizan en el seno de organizaciones públicas o privadas, con el objetivo de controlar e incrementar la eficiencia del flujo de documentos que soportan sus negocios o actividades haciendo posible, de una forma sencilla, el acceso instantáneo a toda la documentación necesaria para su actividad de negocio. 1.3.1 Objetivos generales de un Gestor Documental Los SGD se utilizan en el seno de organizaciones públicas o privadas, con el objetivo de controlar e incrementar la eficiencia del flujo de documentos que soportan sus negocios o actividades haciendo posible, de una forma sencilla, el acceso instantáneo a toda la documentación necesaria para su actividad de negocio. Además, se reducen drásticamente situaciones como la duplicidad de documentos archivados, fotocopias innecesarias, dobles grabaciones de datos; se obtiene un rápido acceso a la información dentro de la empresa u organización y su posterior distribución, sin necesidad de trasladar los documentos. 1.3.2 Características de un Gestor Documental El software de gestión documental se puede clasificar en función de su complejidad. Los administradores de archivos, como el explorador de Windows, son software de gestión documental, aunque muy rudimentarios que permiten las operaciones básicas como son el acceso al recurso y la capacidad de compartir la información. Sin embargo, no son capaces de relacionar la información ni de proveerla de un contexto. Los servicios de información y documentación accesibles a través de internet, más concretamente mediante servidores web, han ido aumentando de una forma exponencial. La lógica evolución del web desde hace más de 10 años ha ido produciendo la sustitución de páginas y documentos estáticos por documentos generados dinámicamente, al servicio de la interacción del usuario con la lógica de procesos y flujos de trabajo definida por los creadores del servicio y a la disponibilidad de cada vez 10.

(20) mayores repositorios de información. Evidentemente, se ha ido pasado progresivamente de un concepto de publicación de páginas web, bastante simple en su origen, a esquemas más complejos y diferenciados, fundamentados en procedimientos y técnicas basados en la gestión de información (Luna Pérez, y otros, 2012). Esta evolución, que se ha acelerado durante la primera mitad de la década de 2000, ha tenido un impacto no sólo en los métodos y técnicas de gestión de información, sino también en la propia tecnología y, en consecuencia, en el mercado de productos y servicios Si bien en la segunda mitad de la década de los 90 se podía diferenciar entre productos para gestión documental y recuperación de información; desde el año 2000 se ha producido una convergencia entre todas las plataformas, de forma que en la actualidad se pueden encontrar soluciones que pretenden ser globales y ofrecer soporte a todo el proceso de gestión de información en una organización. Según la bibliografía las herramientas para este trabajo han recibido la denominación de sistemas de gestión de contenidos (o Content Management Systems, CMS), y se han integrado con los sistemas de gestión documental y con los de recuperación de información. A ello hay que unir que, en la concepción actual de la gestión de información, el control de los procesos es un elemento fundamental, por lo que se acompañan de sistemas de flujos de trabajo. Los cada vez más complicados procesos de gestión de contenidos demandan la formalización de sistemas de metadatos que resultan necesarios tanto para los procesos de gestión como para las de las publicaciones o los de recuperación de información. Esta complejidad ha producido el desarrollo de dos especializaciones principales de la gestión de contenidos: Web Content Management (WCM), y Enterprise Content Management (ECM). La primera especialización se centra en el entorno web, y su objetivo principal y sus métodos se orientan a la producción de documentos e información digitales para la web, especialmente para portales y sitios corporativos. La segunda encuentra su fundamento en la idea de gestión total de la información en las organizaciones mediante la integración de toda la información necesaria para alcanzar los objetivos de la organización proveniente no sólo de sistemas de publicación, sino también de sistemas ERP1, gestión de documentos, datawarehouse, etc. La expresión más generalizada en el momento actual del ECM son las intranets y los portales internos de las organizaciones. 1. Del inglés “Enterprise Resources Planning” referente a Gestión integral de Recursos Empresariales. 11.

(21) Con todo ello se puede delinear un paisaje en el cual las herramientas de gestión documental han ido incorporando a sus prestaciones las capacidades necesarias para gestionar los procesos que crean, almacenan, tratan y presentan información, en entorno digital. Sin embargo, no por ello cabe afirmar que existe una igualdad directa entre los sistemas de gestión de contenidos y los sistemas de gestión documental. Se pueden encontrar en el mercado sistemas de gestión de contenidos que no ofrecen las prestaciones documentales que serían deseables, y viceversa. De la misma forma, no es posible igualar mediante una ecuación gestión de contenidos y gestión documental. Íntimamente relacionadas sí, pero iguales no. Sólo el estudio y la evaluación de las características y prestaciones presentes en las herramientas disponibles pueden determinar la adecuación de una solución en un contexto o problema dado (Cárdenas Tandrón, y otros, 2013). Hoy en día, el acceso a la información, a las nuevas tecnologías y a la cultura no puede estar destinado exclusivamente hacia los que más tienen, es una realidad que debe darse a conocer por igual a todos los sectores. Desde un punto de vista informático, el software libre como principal vanguardia en estos temas ayuda a la libre expansión y mejoramiento de las herramientas informáticas a través de los aportes de los propios usuarios, compartiendo el conocimiento y las experiencias en las llamadas comunidades de software libre, dejando de lado la imponencia y fuerte presión del mundo de Microsoft.. 1.3.3 Herramientas propietarias para la Gestión Documental a.. MS SharePoint. MS SharePoint es la plataforma web de trabajo colaborativo y gestión documental, que permite a las empresas, incrementar su productividad y administrar los contenidos a través de la conocida interfaz de Office. Según (Grinda, 2006) existen dos modalidades, SharePoint Portal Server 2003 (la siguiente versión se llama Microsoft Office SharePoint Server 2007) enfocada a proveer de un Portal Empresarial o una Intranet Corporativa. La otra modalidad es Windows SharePoint Services 2.0, nombrada Windows SharePoint Services 3.0 destinada a proveer la funcionalidad que da razón de ser a las ventajas que ofrece SharePoint, como administración de contenido, manejo de versiones, alertas, espacios de trabajo, y otras. En la versión del 2003, el producto se enfoca a proveer de las herramientas necesarias para poder construir de una forma muy sencilla y a la vez robusta, una Intranet Corporativa, la cual puede contar con distintas áreas que pueden ser las páginas de cada departamento, también el uso de. 12.

(22) audiencias (para mostrar cierto contenido a grupos de personas específicas), los sitios personales, una poderosa búsqueda a todo el nivel de Portal, incluyendo los sub-sitios y un directorio de los mismos. Esta versión implementó muchas mejoras a diferencia de la primera versión, la del 2001. Sin embargo, la versión del 2007, ha sido provista de mejoras más valiosas y notables para los usuarios, desarrolladores y administradores. Por decir algunos ejemplos, si el usuario elimina algún documento, podría ser recuperado de una papelera de reciclaje web en cuestión de minutos, sin tener que esperar a que el área de soporte recupere un respaldo del sitio. De igual forma, la posibilidad de manejar información de habilidades y capacidades de los sitios personales es más poderosa. Esto llega a tal nivel que es un apoyo real al área de recursos humanos, pues puede funcionar como un currículum vital interno, conteniendo no sólo la información de la persona sino incluso archivos relacionados con los proyectos en los que ha sido involucrado, o personas con las que trabaja. Otra de las versiones actuales es la del 2010, donde se proveen mejoras a la hora de implementar una búsqueda, permitiendo responder con rapidez frente a las cambiantes necesidades empresariales así como la gestión eficiente de la cantidad de información que maneja una empresa.. Los usuarios pueden responder de manera rápida a las necesidades de la empresa creando sus propias soluciones sin código en las instalaciones o en la red, a través de un rico conjunto de bloques de construcción, herramientas y capacidades de auto-servicio. (SharePoint, 2012) Las mejoras en SharePoint 2010 ayudan a aumentar la productividad de los profesionales de TI, ofreciendo una infraestructura unificada escalable y opciones de implementación flexibles. Para los desarrolladores, SharePoint 2010 proporciona una plataforma de desarrollo que permite crear soluciones rápidamente y responder a las necesidades de la empresa. La eficacia y la productividad de los desarrolladores queda asegurada con el uso de herramientas con las que están familiarizados como Microsoft Visual Studio y SharePoint Designer. b.. IBM FileNet. FileNet era una compañía independiente, actualmente fue asimilada por IBM, y se dedica a desarrollar software para ayudar a las empresas a realizar procesos de negocio y de manejo de contenido (Net, 2010). La versión P8, es un ambiente de trabajo para desarrollar sistemas empresariales personalizados, ofreciendo más funcionalidades en los procesos de negocios. Las principales ventajas del IBM FileNet Records Manager son organizar de manera segura los registros de entrada al sistema, reducir el riesgo corporativo por pérdida de datos críticos, asegurar el. 13.

(23) cumplimiento de regulaciones y armonía en la relación costo -beneficio. Cuenta con la tecnología FileNet ZeroClick, logrando que todo dato que se registre en los sistemas de la compañía sea destinado al repositorio correspondiente para ser catalogado y puesto a disposición del usuario autorizado. Puede ser integrado con el sistema FileNet Image Manager Active Edition, permitiendo organizar y almacenar la información procedente de diversas fuentes, así como acceder a ella. Realiza una gestión y un control distribuido de documentos, imágenes, diseños CAD, textos, fotografías, voz y vídeo. c.. ECM Documemtum. La clave principal de Documentum es su carácter de solución completa. La adecuación a los estándares abiertos de interfaz web proporciona a los usuarios la posibilidad de manejar el ciclo de vida de un documento a través de una plataforma unificada, robusta y segura. Las características principales que definen la plataforma de gestión documental de EMC Documentum son: (Documentum, 2010)  Global y distribuida: Para organizaciones que dispongan de clientes y delegaciones por todo el mundo, la atención a los usuarios y a los contenidos es independientemente de su ubicación física. Es posible almacenar el contenido y los metadatos en cualquier idioma en repositorios compartidos que conforman un gran repositorio virtual que va más allá de las barreras geográficas e idiomáticas.  Extensible: Puede ser extendido para cumplir necesidades de organización únicas incorporando reglas de negocio para objetos específicos. Personalizando los plug-ins se pueden desarrollar e implementar en áreas clave como la autenticación de los usuarios, manejo de ficheros, multimedia o archivado en áreas de almacenamiento..  Abierta: Como está basado en estándares, es muy sencillo de integrar con las infraestructuras de las tecnologías de la información existentes. Utiliza la arquitectura SOA9 para exponer sus servicios de gestión de contenido e integrarse con sistemas empresariales. La arquitectura es totalmente fiel al J2EE10 (para aplicaciones basadas en web) y soporta completamente el entorno Microsoft .NET y el proceso XML. Además, Documentum se integra con aplicaciones y sistemas empresariales como los servicios de directorio utilizando el estándar LDAP..  Escalable: Documentum maneja de forma eficiente el crecimiento constante de volúmenes de información, cargas de tráfico, aumento de los usuarios, procesos y flujo de trabajo 14.

(24) complejos, todo orientado a lograr el menor costo posible con el mayor rendimiento. Está diseñado para utilizar los recursos de red y dar salida a los problemas de gran escalabilidad a los que se enfrentan las organizaciones hoy en día. La arquitectura aprovecha todo el hardware existente para escalarse, aprovechando los sistemas multiprocesador así como los sistemas caché y clústeres (escalabilidad horizontal y vertical).  Seguro: Documentum proporciona niveles de seguridad apropiados para que las organizaciones tengan el contenido de su repositorio disponible para todos los usuarios y contribuidores. Las Listas de Control de Acceso definen usuarios, grupos y roles que pueden acceder al repositorio y a todos los objetos que lo conforman, además de definir qué tipo de operaciones pueden realizar. La información sensible almacenada en las áreas de almacenamiento se puede encriptar y utilizar comunicaciones seguras de red entre el servidor y los clientes mediante SSL.  Portable: Documentum soporta un gran número de bases de datos, sistemas operativos y servidores de aplicaciones y de portales. Los componentes del sistema pueden desplazarse con toda transparencia de una de las configuraciones soportadas a otra. Documentum está escrito en java, disponible en múltiples idiomas, es un software propietario y la última versión salió en mayo del 2010. Para indexar los documentos, acceder de forma segura a ellos a través de la interfaz de consulta de usuarios y lograr una sincronización en paralelo para la recuperación de información, Documentum cuenta con productos como ECM Documentum Content Server y Exalead CloudView que permiten, además maximizar la inversión aumentando el uso y respetando los distintos niveles de seguridad (CALSI, 2007). 1.4 Herramientas libres para la Gestión Documental El Software Libre ha evolucionado y se ha consolidado en muchas partes del mundo teniendo un gran respaldo por parte de académicos, organizaciones educativas, grandes corporaciones, empresas, desarrolladores y usuarios de software. El tema ha trascendido del aspecto técnico para llegar a ser un tema estratégico en muchas organizaciones y un tema político en algunos países. El Software Libre no es una moda, sino es, además de lo indicado, un modelo de negocio para una nueva industria de software basada en servicios, más que en productos (Ing. Ramón Paumier Samón, 2010).. 15.

(25) Tampoco se debe confundir software libre con "software de dominio público". Éste último es aquel software que no requiere de licencia, pues sus derechos de explotación son para toda la humanidad, porque pertenece a todos por igual. Cualquiera puede hacer uso de él, siempre con fines legales y consignando su autoría original. Este software sería aquel cuyo autor lo dona a la humanidad o cuyos derechos de autor han expirado, tras un plazo contado desde la muerte de este, habitualmente 70 años. Si un autor condiciona su uso bajo una licencia, por muy débil que sea, ya no es del dominio público. El software libre puede ser instalado las veces que se desee y en la cantidad de máquinas que se decida sin ningún tipo de restricción legal. A través de estas condiciones es evidente indicar que existe una independencia tecnológica; la libertad de emplearlo las veces que se desee es ilimitada. Más ventajas es que ayuda a fomentar la libre competencia pues los servicios y las licencias no están regidas por alguien en forma definitiva. También con el software libre se obtiene soporte y compatibilidad a largo plazo, es decir, si se tiene una nueva y actual versión de software del que se tiene, el por instalar encontrará en el instalado un soporte sirviendo de actualizador de versión y este proceso será posible a largo plazo con posibles versiones posteriores. Algunas de las herramientas de gestión documental de software libre son: d.. KnowledgeTree. Se trata de un software de código libre con el que se puede estructurar documentación en las empresas. Es el complemento perfecto para una solución basada en php, MySQL y Apache, accesible a través de un navegador web, ya sea en una intranet o una extranet facilitando la creación de documentos para trabajar de forma colaborativa independientemente de la plataforma que se esté utilizando (Knowledgetree, 2012). KnowledgeTree es la única solución en campo de la gestión documental de código libre, en tecnología php, el resto son en java. La edición online le añade flexibilidad, permitiendo editar documentos con formatos “.doc”, “.txt”, “.xls” y los formatos de “OpenOffice”. Con lo cual quedan cubiertos la mayoría de los formatos excepto algunos de MS Office pero si es utilizada la versión comercial, se necesita entonces un plugin para subir los documentos directamente desde Office.. 16.

(26) La edición se realiza de manera realmente sencilla e intuitiva y los documentos quedan almacenados según las categorías que sean definidas en KnowledgeTree, por lo que es muy sencillo mantener los documentos organizados. Permite que los documentos se encuentren en un único repositorio de información, el cual puede ser tratado tanto por el administrador de la herramienta como por los usuarios dentro de uno o varios documentos a la vez. Además, permite hacer búsquedas por nombre de archivo, propiedades y texto interno, con la posibilidad de acceder al documento mediante vista previa automática o de visualización en otras aplicaciones. Otra de sus funciones, es la capacidad de usar flujos de trabajo como parte automática del repositorio, permitiendo que la información fluya por toda la organización con aprobaciones, comentarios, revisiones, alertas, trazabilidad y control de versiones mediante la configuración de jerarquías que faciliten la gestión documental amoldada a la vida real. Knowledge Tree tarda de 1 a 8 horas en conseguir indexar las colecciones trabajadas, sin embargo y a favor se puede decir que al subir documentos, busca la jerarquía de carpetas ya existente en los documentos originales, facilitando la reubicación y gestión de los documentos de acuerdo a su orden original. Los formatos de archivo que pueden utilizarse en esta herramienta hasta lo explorado permitieron constatar que incluye documentos de Ms Office, Adobe Acrobat, y HTML, limitando la indexación de imágenes, música y videos. e.. Nuxeo. Nuxeo, es otra de las herramientas para la gestión documental de código abierto; según los usuarios más experimentados es muy fácil de utilizar, de instalar, y consigue mejoras espectaculares en la gestión de documentos electrónicos, incorporando aspectos como los flujos de trabajo, versionado de documentos, gestión de usuarios y permisos, alertas por eventos, ciclos de vida asociados a documentos, etcétera. Está desarrollado en el lenguaje de programación java, basado en estándares abiertos y de escala empresarial para Windows y sistemas operativos similares a Unix. Está diseñado para usuarios que requieren un alto grado de modularidad y rendimiento escalable. (Nuxeo, 2012) Es utilizado como software de gestión para documentos, páginas web, registros, imágenes y desarrollo colaborativo de contenido.. 17.

(27) Nuxeo basa la búsqueda en herramientas estándares y abiertas como Lucene y Open Search. Estos buscadores indexan la totalidad de los documentos en los formatos más habituales, y resuelven las búsquedas en menos de 1 segundo. Desde el punto de vista funcional Nuxeo presenta características similares de indexado, versionado, etiquetado, búsqueda de documentos o flujos de trabajo simples para el trabajo con los documentos. A estas características básicas de servidor de ficheros se pueden añadir otras más propias de gestor documental como la capacidad de definir modelos de contenidos con metadatos personalizados, extractores de metadatos o transformadores de documentos. f.. ECM Alfresco. Alfresco es un proyecto que se presenta al público en dos vertientes: una empresarial de código cerrado y con soporte de pago (Alfresco Enterprise); y otra libre, más limitada aunque con poco que envidiarle, y que se puede instalar gratuitamente para su uso (Alfresco Community). También existe una tercera alternativa, que básicamente es la versión de pago instalada en servidores de las empresas y que se ofrece en forma de servicio. Uno de los aspectos más interesantes de Alfresco es la gestión documental que incorpora, que permite tener organizados por carpetas y por categorías, miles de documentos. Las capacidades de búsqueda implementadas con los motores Lucene y Open Search que incluyen búsqueda dentro de los propios documentos, permitiendo un acceder y recuperar la información de una manera ágil y eficiente. Alfresco está enteramente desarrollado con tecnología JEE2 y la forma de acceso básica es a través de su cliente web, lo que convierte Alfresco en un software multiplataforma casi sin trabajo de desarrollo adicional. La estructuración por carpetas, hace que sea fácil la adaptación para cualquier persona sin conocimientos informáticos que haya usado una computadora con los sistemas operativos Windows, KDE, Gnome o MacOS (Alfresco, 2012). Alfresco clasifica los documentos por etiquetas y categorías facilitando la búsqueda incluso en aquellos documentos que no comparten la misma estructura de carpetas. Al estar orientado al entorno web, es muy fácil acceder desde cualquier sitio, potenciando la productividad por costos de movimiento.. 2. Del inglés “Java Enterprise Edition”. 18.

(28) Posee soporte para la integración con diferentes motores de bases de datos como, Oracle, My SQL, PostgreSQL, SQL Server y cualquier otro que posea el motor de persistencia de Hibernate. Alfresco, permite la extensión y modificación de sus propósitos y modelo de contenido de acuerdo a las necesidades de sus usuarios, en su versión Community está soportado por una gran comunidad de desarrolladores: http://forums.alfresco.com/es brindando información y ayuda en el caso de que los especialistas necesiten experimentar nuevas ideas por su cuenta, además de las experiencias expuestas de otros usuarios. Arquitectura de Alfresco La arquitectura de Alfresco está conformada por una capa cliente, un servidor de aplicaciones y la capa de almacenamiento como se muestra en la Figura 1.. Figura 1 Arquitectura de Alfresco (Shariff, 2005) El contenido es almacenado en una base de datos relacional y en un sistema de ficheros o repositorio de contenido. La razón para usar dos sistemas de almacenamiento es que los contenidos en Alfresco consta de dos elementos: el contenido y la información acerca de los contenidos (metadatos). Los metadatos son almacenados en la base de datos relacional e incluye la siguiente información:  Formato de los documentos.  Fecha de creación.  Lenguajes.  Aspectos de seguridad. 19.

(29) Conceptos básicos Para el trabajo con la herramienta es necesario conocer los conceptos básicos que se manejan en materia de usabilidad, algunos de ellos se listan a continuación: Espacios y sub-espacios: Estructuras jerárquicas de carpetas que asemejan los departamentos o aéreas dentro de una organización. Muy similar al directorio de carpetas de Windows. Contenidos Los modelos de contenido de Alfresco están construidos a partir de un conjunto de conceptos que se debe conocer: los Tipos, las Propiedades, los tipos de Propiedades, las Restricciones, las Asociaciones y los Aspectos. Tipos de Contenidos Los tipos de contenido presentan un gran parecido a las clases en el mundo de la programación orientada a objetos. Pueden usarse para representar objetos del modelo de negocio: Tienen propiedades y pueden heredar de un tipo base. -. Contenido (cm:content). -. Persona (cm:person). -. Carpeta (cm:folder). Los tipos personalizados están limitados únicamente por la imaginación y requerimientos del negocio. Propiedades Las propiedades son metadatos asociados con un tipo particular. Por ejemplo un Reporte Estadístico Forense podría incluir propiedades como Nombre del Fallecido, Fecha del Deceso, Ubicación Geográfica, No Expediente, Edad, Motivo de la Muerte y Causa de la Muerte. Asociaciones Existen dos tipos de Asociaciones: Asociaciones entre pares (Assotiations) y Asociaciones padrehijo (Child Assotiations). Las asociaciones entre pares definen la relación entre dos objetos en la que no existe subordinación entre uno y otro. Las asociaciones padre-hijo, por otro lado, se usan cuando el objetivo de la asociación (el hijo) no debe existir cuando se borra la fuente (el padre). Funciona como la eliminación en cascada en las bases de datos relacionales, si es eliminado el padre es eliminado también el hijo.. 20.

(30) Aspectos Los aspectos permiten añadir funcionalidades a los contenidos ya existentes. Pueden tener propiedades que se unen a las propiedades de los contenidos cuando se aplican a ellos. Alfresco Module Package (AMP) Los AMP son paquetes con una colección de código, archivos XML, imágenes, CSS, entre otras que de forma conjunta extienden la funcionalidad o datos provistos por el repositorio estándar de Alfresco. Puede contener plantillas personalizadas, nuevas categorías, modelos de contenido propios, o conjunto de funcionalidades nuevas. Como regla general, todo lo que se considere una extensión instalable al repositorio de Alfresco, debería estar incluido en un módulo e incluido en un fichero AMP. Los ficheros AMP pueden instalarse en el WAR de Alfresco usando la herramienta de gestión de módulos (Module Management Tool). Una vez se ha mapeado el contenido del fichero AMP en el WAR de Alfresco mediante la herramienta de gestión de módulos, el WAR puede desplegarse en el servidor de aplicaciones. Cuando el servidor de aplicaciones, en este caso, el servidor de aplicaciones de Alfresco es reiniciado, se detectarán los nuevos módulos instalados y el repositorio se inicializará incluyendo la nueva funcionalidad y los datos de los nuevos módulos que se han creado. Alfresco SDK Alfresco proporciona soporte para los desarrolladores que deseen ampliar o personalizar la herramienta sin costos adicionales y con un mínimo esfuerzo obteniendo resultados favorables en un corto espacio de tiempo. El Alfresco SDK (Software Development Kit) permite el desarrollo en tres escenarios:  Desarrollando el repositorio de Plug-ins como las: Acciones Personalizadas, Condiciones, Aspectos personalizados y nuevas transformaciones.  Desarrollo de nuevas aplicaciones utilizando los Web Services API de Alfresco.  Embebiendo la herramienta Alfresco en aplicaciones existentes utilizando estándares adecuados. Esta herramienta para los desarrolladores se puede utilizar por si misma sin necesidad de tener instalado Alfresco, pero ante la necesidad de percibir los resultados obtenidos detrás de una personalización y una extensión se recomienda a los desarrolladores utilizar un IDE de desarrollo que permita la importación del SDK, teniendo en cuenta que la versión de la Herramienta Alfresco que se personaliza es la misma versión del SDK a utilizar. 21.

(31) 1.5 Valoración del autor En el capítulo se han analizado poderosas herramientas que sin lugar a duda responderían a los requisitos demandados por los clientes, en el caso de Share Point por su capacidad de integrarse a los documentos de Office y sus ventajas a la hora de recuperar los documentos y el establecimiento de espacios de trabajo, IBM FileNet destacándose en la catalogación de los documentos y con un ambiente un poco más empresarial con posibilidades de integración con Microsoft SharePoint y Microsoft Office, lo cual brinda a sus clientes una mayor productividad. En el caso de Documentum, esta herramienta pudiera clasificarse como una de las más completas para la gestión documental, ya que explotando sus potencialidades antes descritas lograríamos sin dudas responder a los requisitos del cliente, brindando excelentes resultados en la solución del problema que supone el análisis de estadísticas forenses basadas en documentos. En el caso del uso de las herramientas propietarias existe un punto decisivo que no podemos dejar de tener en cuenta, que es el relativo a los elevados costos de licencia, instalación, explotación y soporte, que en las organizaciones de administración pública, nos hicieron descartar el uso de las herramientas propietarias anteriormente analizadas. Después de analizar las herramientas de software libre para la gestión documental haremos especial énfasis en Nuxeo y Alfresco, por encontrarse dentro de las herramientas de software libre líderes dentro de la gestión documental. Teniendo en cuenta el estudio realizado, podemos decir que ambas herramientas presentan características similares de indexado, versionado, etiquetado, búsqueda de documentos o flujos de trabajo simples para el trabajo con los documentos, sin embargo destacamos que: 1. Alfresco puede llegar a implementar complejos flujos de trabajo con la utilización de Reglas de Negocios asociadas a un contenido o a un espacio de trabajo determinado. 2. Alfresco permite definir modelos de contenidos con metadatos personalizados, extractores de metadatos o transformadores de documentos según las características y los requerimientos de los clientes. Una limitación importante de Nuxeo, es su sistema de permisos pues no maneja en esta versión el concepto de Rol, sin embargo Alfresco permite definir permisos y roles (conjunto de permisos), de. 22.

Figure

Figura 1 Arquitectura de Alfresco (Shariff, 2005)
Figura 2 Arquitectura Tradicional de Inteligencia de Negocios
Figura 3 Arquitectura para la toma de decisiones basado en documentos
Figura 4 Pasos del proceso de ETL  Entre las características que describen las tecnologías de ETL se tienen:
+7

Referencias

Documento similar

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

De hecho, este sometimiento periódico al voto, esta decisión periódica de los electores sobre la gestión ha sido uno de los componentes teóricos más interesantes de la

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

información que el individuo puede procesar por su sistema nervioso, y los factores relacionados van a influir en las habilidades y destrezas sociales, que pondrá al uso al

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..