5 RESUMEN DEL ESTADO DEL ARTE
6.1 TEMAS A SOLUCIONAR EN LA PROPUESTA DE CONSTRUIR UN ODS
6.1.1 Metadatos
Los Metadatos son datos acerca de los datos, los cuales permiten conocer ¾ Descripciones de Tablas y Columnas
¾ Definiciones de Tablas y Atributos ¾ Definiciones de Áreas de Sujetos ¾ Definiciones de entidades de negocios ¾ Programación del Refrescamiento de Datos ¾ Estructuras de índices
¾ Relaciones entre tablas
¾ Fecha de Actualización de datos en el ODS ( Inmon, 1999, p. 45)
Los metadatos permiten al usuario final entender cuáles son los datos disponibles para análisis. Adicionalmente, los metadatos del ODS permiten al usuario ver las diferencias entre los tipos de datos encontrados allí.
Toda esta información debe ser compartida tanto al administrador del ODS como también al usuario en cierto modo. Es posible que para el usuario final no sea necesaria toda la información de los metadatos, tal vez necesite cierta información como por ejemplo la última actualización del ODS. Así mismo es preferible guardar estos metadatos en la misma base de datos donde esta el ODS, con el fin de tener la información fácilmente accesible.
MISC-03-1-9
6.1.2 ¿Qué clase de ODS se va a Implementar?
Inmon (1999) en su libro indica que los ODS se pueden clasificar dependiendo de la forma en que son actualizados los datos en el ODS.
CLASE I
Actualización sincrónica, este tipo de ODS es usado en sistemas de alto desempeño, en ambientes dominados por las transacciones. Las actualizaciones se realizan cada 3 o 4 minutos, con el fin de tener la información lo mas actualizada posible.
CLASE II
Es cuando la actualización del ODS es manejada por medio de técnicas de almacenamiento y envío, Son actualizaciones realizadas aproximadamente cada cierto tiempo medido en horas. Existe una pequeña cantidad de integración y transformación.
CLASE III
Se realiza una actualización asíncrona, los datos son actualizados cada 24 horas. Generalmente se crea un registro integrado de diferentes aplicaciones. Se utiliza cuando la organización no requiere inmediatez en la integración de los registros.
CLASE IV
Proviene de datos analizados en la Bodega de Datos. El paso de la información del DW hacia el ODS no esta programado, no existe una periodicidad determinada.
Entonces ¿Qué clase de ODS se debe usar? Teniendo en cuenta que se busca la solución sobre una organización que necesita alta disponibilidad de la información, es apropiado usar una Clase II o Clase III. La razón de esto es que como se maneja un gran volumen de información, no es apropiado realizar una actualización cada 3 o 4 minutos ( Como sería el caso de un ODS Clase I) porque el costo e impacto sobre los sistemas orígenes es muy grande. Y entre la Clase II y Clase III, sería preferible tener una clase II. Ya que no tiene el problema de la Clase I y tampoco tiene una gran diferencia de tiempo de actualización como en la clase III. Pero, si se piensa que la información satisficiera un conjunto de áreas de usuarios que anteriormente no disponían de los medios o mecanismos para acceder a información en línea una Clase III sería de mucha ayuda.
MISC-03-1-9
6.1.3 ¿Cómo se deben capturar las modificaciones?
Inmon (1999) indica que existen distintas formas de atrapar las modificaciones, entre estas tenemos las siguientes:
• Directa, actualización inmediata Æ Costosa y muy ineficiente.
• Utilización de los archivos delta Æ Atrapan los cambios realizados en las Bases de Datos. Usualmente son escritos en las aplicaciones para auditar los sistemas. Por ejemplo: Tablas de modificaciones.
• Atrapar los cambios en el ámbito de la BD Æ El inconveniente es que puede generar mucho impacto en el desempeño porque se utilizan muchas entradas y salidas. Es una buena opción cuando el DBMS es muy tratable.
• Uso de log tapes de aplicación en línea Æ Una utilidad se encarga de seleccionar los datos del log tape y los prepara para llevarlos al ODS. La ventaja es que no se afecta las entradas y salidas ni tampoco el código del programa.
Mientras se tenga en las aplicaciones la posibilidad de identificar en el ámbito de bases de datos las modificaciones que han sufrido las entidades de la organización, pues será mucho más fácil encontrar estos cambios y realizar posteriormente el traslado de los datos hacia el ODS. Durante el desarrollo de esta tesis se asumen que estas modificaciones son registradas en tablas que permiten a los usuarios hacer auditorias a los sistemas. A partir de allí se buscaran los registros con estos cambios y posteriormente se transferirán al ODS.
6.1.4 ¿Cómo se cargaran los datos?
Al igual que ocurre en un DW la primera carga en el sistema ODS consiste en una copia total de los datos, teniendo en cuenta la operación de Transformación e Integración.
MISC-03-1-9
Posteriormente se deberán realizar cargas de datos periódicas, con el fin de refrescar los datos con las actualizaciones que se sufran en los sistemas de origen.
6.1.5 ¿Cómo se va definir el registro del sistema?
“El Registro del Sistema es la definición de exactamente que datos operacionales son necesarios para soportar el ambiente ODS” (Inmon, 1999, p. 66). Muchas veces lo que sucede es que se parte de un tipo de información que se carga al ODS, posteriormente este tipo de información se va cambiando a medida que las interacciones con los usuarios permita establecer los datos que verdaderamente son valiosos para la organización. El establecimiento del ODS es un proceso iterativo.
El proceso inicial de la selección del registro consiste en definir las entidades más importantes para las áreas usuarias mediante un consenso. Una forma de identificar esto es clasificando las consultas o reportes mas frecuentes en la organización. Posteriormente se elegirá de cada una de estas entidades los datos o columnas más significativos a guardar.
6.1.6 ¿Cómo se van a mover los datos al ambiente ODS?
Según Inmon (1999) existen cinco posibles maneras de hacerlo • Inserción simple de registros
• Inserción / reemplazo del registro
• Reemplazo de campo, es similar al reemplazo de registro sólo que la actualización se maneja en el ámbito de campo en lugar de todo el registro.
• Acumulación de campos, donde los campos de un registro sencillo son acumulados en el ODS.
• Conteo de campos, donde los campos de un registro sencillo son contados en el ODS.
MISC-03-1-9
Se propone como muy buena opción la Inserción / reemplazo de los registros. Esto porque permitirá cambiar solo aquellos registros que han cambiado y adicionar los nuevos. En algunas otras ocasiones se necesitará transferir datos resumidos mediante operaciones de conteo, sumas, etc.
6.1.7 ¿Qué sucede cuando no este activa una fuente de datos o el ODS?
Cuando una base de datos no este activa, la replicación de datos desde las fuentes orígenes hacia el ODS, no se realizará esto para evitar que establezcan problemas de diferencias en cuanto a registros que están en un sistema y no en otro. El usuario deberá ser informado mediante la interfaz con la cual se comunica con el ODS, la última fecha de actualización de los datos. Esto le permitirá a él conocer si los datos son lo suficientemente exactos, o si es preferible esperar hasta que se repliquen nuevamente los datos.
6.1.8 ¿ Costos de implementar un ODS?
Básicamente, implementar un ODS es crear una B.D. lo suficiente robusta para recibir la cantidad de datos detallados, así mismo debe estar comunicada con las B.D. Operacionales para poder extraer los datos, realizando con ellos un proceso de extracción y transformación.
Si se analiza el costo de implementar este sistema es mucho menor que el necesario para establecer un D.W. ya que el volumen de procesamiento no es tan grande como este, el D.W. necesita mucha mas capacidad de almacenamiento y procesamiento. Por el contrario las Multibases de datos poseen problemas con las comunicaciones y con la escalabilidad. Además cuando se habla de una empresa que presta servicios a una gran cantidad de usuarios, la cual siempre debe estar en la vanguardia de su sector, el costo de mantenimiento de un muy buen sistema de Almacén de Datos Operacionales será bajo comparado con el nivel de satisfacción de los usuarios de obtener información muy oportuna.
MISC-03-1-9
6.1.9 ¿ODS centralizado o distribuido?
Esto es básicamente el problema que existe entre B.D. Centralizada y B.D. Distribuida, debido a que el problema que se esta tratando de solucionar es la integración de la información operacional de las diferentes fuentes de datos, no seria conveniente crear una mayor complejidad en desarrollo y mantenimiento implementando un ODS distribuida, lo mejor es trabajar con un ODS centralizado, ya que con este existe un mejor control.
6.1.10 ¿Volumen de datos del ODS?
El volumen de datos que se almacenan en el ODS depende del tamaño de las entidades en los sistemas orígenes. Por ejemplo en una base de datos de una empresa de Telecomunicaciones, este número es seguramente superior de 100.000 registros para el caso de usuarios. Cuando se trata de servicios este número sería igual a la cantidad de abonados por los distintos servicios que tiene contratado cada usuario.
Según Inmon (1999) el tamaño del registro estimado para el ODS es determinado por medio de la siguiente fórmula:
Entidad X Número de ocurrencias de la entidad X Tamaño del registro de la entidad X Cantidad de Historia = tamaño estimado de los datos para el ODS.
6.2 ¿CÓMO SABER SI ES NECESARIO LA IMPLEMENTACIÓN DE UN ODS?
Para saber si lo que se requiere implementar es un ODS dentro de la empresa, se deben realizar una serie de cuestionamientos al interior de la organización. Los cuales permitirán una orientación de las necesidades y dar la mejor solución al problema. Entre este conjunto de preguntas tenemos las siguientes:
¿La empresa dispone de sistemas grandes?
¿Los usuarios requieren información periódica de estos sistemas?
MISC-03-1-9
¿Se desea tener información integrada y no es fácilmente obtenida? ¿Esta la empresa dedicada a la prestación de los servicios?
¿Depende en gran parte su imagen al área de servicio al cliente? ¿Existen restricciones de acceso de los usuarios a estos sistemas?
¿Existen quejas por parte de los usuarios referente a la no entrega oportuna de la información o reportes?
¿Existen quejas por ejecutar reportes sobre las bases de datos operacionales?
¿Se desea tomar una decisión organizacional dependiendo del comportamiento del negocio a la fecha y no se disponen de las herramientas para ello?
Si dentro de la organización existen muchas respuestas afirmativas a estas preguntas, la empresa se encuentra en un punto donde requiere integrar la información de las Bases de Datos Operacionales con el fin de presentarlo casi en línea. El ODS se presenta como una buena alternativa puesto que es relativamente económica en tiempo de desarrollo, soporte, escalamiento y porque al tener la restricción de los accesos a los sistemas, se requiere una forma de pasar la información a un repositorio. Las conexiones directas para consultas distribuidas seguramente no serán permitidas.