Centro de toma de decisiones en el sistema integral para la atencion primaria de la salud

(1)

FACULTAD 7

Trabajo de Diploma para optar por el Título de Ingeniero en Ciencias Informáticas

Centro de Toma de Decisiones en el Sistema Integral para la Atención Primaria de la Salud

Autores:

Alixandra González Naranjo Leonardo Expósito Rojas

Tutores:

Lic . Yamilka Gómez León Ing. Yovannys Sánchez Corales

Ciudad de La Habana, julio de 2010

“Año 52 de la Revolución”

(2)

Declaración de Autoría

Declaramos ser autores de la presente tesis y reconocemos a la Universidad de las Ciencias Informáticas los derechos patrimoniales de la misma, con carácter exclusivo.

Para que así conste firmamos la presente a los __2__ días del mes de julio del año 2010.

Alixandra González Naranjo Leonardo Expósito Rojas

Autora Autor

____________________________

Lic. Yamilka Gómez León Ing. Yovannys Sánchez Corales

Tutora Tutor

(3)

Datos de Contacto

Nombre: Lic. Yamilka Gómez León: Profesora Asistente, graduada de Licenciatura en Ciencias de la Computación en el curso 2003-2004 en la Universidad Central Martha Abreu de Las Villas. Actualmente pertenece a la Facultad 7 en la UCI, donde labora desde su graduación. Ha impartido las asignaturas Programación 2, Gestión de Software, Sistemas de Bases de Datos. Forma parte del proyecto Atención Primaria para la Salud.

Correo electrónico: [email protected]

Nombre: Ing. Yovannys Sánchez Corales: Profesor asistente graduado en el año 2005 de Ingeniero en Informática en la CUJAE. Pertenece al Centro de Desarrollo de Software para la Salud. Ha impartido las asignaturas de Inteligencia Artificial, Programación III y Práctica Profesional. Forma parte del proyecto de Atención Primaria de la Salud.

Correo electrónico: [email protected]

(4)

Resumen

En estos momentos Cuba se encuentra inmersa en la informatización de sectores que son el pilar fundamental de su economía y sociedad. La Salud es uno de los sectores de vital importancia para el país, pues en este recae una alta responsabilidad moral, política y social a nivel internacional. La Atención Primaria y Secundaria de la Salud pertenecientes a este sector, manipulan gran cantidad de información en sistemas operacionales que no poseen la capacidad lógica suficiente como para ayudar a los especialistas en la toma de decisiones importantes.

Este trabajo de diploma tiene como objetivo presentar una solución viable a este problema existente referente al manejo de la información perteneciente a la Atención Primaria y Secundaria, así como el establecimiento de un mecanismo inteligente que sirva de apoyo a los especialistas de la Salud en el proceso de toma de decisiones. Para ello se plantea la construcción de un Almacén de Datos utilizando como metodología a “HEFESTO” y se realiza un estudio mediante el que se da a conocer la tendencia actual al uso de este tipo de tecnología en el mundo, así como las herramientas más utilizadas para llevar a cabo su construcción. Aporta como beneficio la posibilidad de que puedan contar con información real basada en datos históricos almacenados siempre que la necesiten, facilitando la toma de decisiones estratégicas y tácticas.

Palabras Claves:

Almacén de Datos, almacenar información, datos históricos, mecanismo inteligente, toma de decisiones.

(5)

Tabla de Contenidos

Introducción ... 1

Capítulo 1. Fundamentación Teórica. ... 6

1.1 Inteligencia de Negocio ... 6

1.2 Almacén de Datos ... 6

1.3 Comparación entre el Almacén de Datos y el Sistema Operacional ... 10

1.4 Proceso de Extracción, Transformación y Carga ... 11

1.5 Procesamiento Analítico en Línea ... 13

1.6 Estado del Arte ... 13

1.7 Metodología para el diseño y la implementación ... 16

1.8 Tendencias y Tecnologías actuales ... 17

1.9 Otras herramientas a utilizar ... 22

Capítulo 2. Análisis y Diseño. ... 26

2.1 Análisis de Requerimientos... 26

2.2 Identificar indicadores y perspectivas ... 27

2.3 Modelo Conceptual ... 27

2.4 Análisis de las fuentes ... 28

2.5 Modelo lógico ... 38

2.6 Proceso de Extracción, Transformación y Carga. ... 43

Capítulo 3. Proceso de Consulta ... 61

3.1 Estructura de los cubos ... 61

3.2 Pentaho Mondrian ... 63

3.3 Despliegue de la solución ... 67

Conclusiones ... 69

Recomendaciones... 70

Referencias Bibliográficas ... 71

Bibliografía ... 72

Glosario de Términos ... 74

An

A

ne ex xo os s... 75

(6)

1

Introducción

En la actualidad, la mayoría de las empresas generan información de gran valor como producto de las actividades que realizan diariamente, la cual es almacenada y manipulada a través de sistemas de bases de datos operacionales o comunes para lograr un mayor rendimiento en el proceso de gestión de los datos durante cierto período de tiempo. En algunas ocasiones ante la presencia de grandes volúmenes de datos, estos sistemas comienzan a tornarse lentos e ineficientes, provocando demoras en la obtención de resultados importantes, o sencillamente no tienen la capacidad lógica necesaria y dejan escapar muchos indicadores valiosos que pudieran ser utilizados en la toma de decisiones administrativas de la entidad.

Para contrarrestar la situación mencionada se hace necesario un mecanismo que sea capaz de almacenar y procesar grandes flujos de datos, así como facilitar su análisis posterior. Es por ello que surge la Inteligencia de Negocio (IN), con el objetivo de perfeccionar la toma de decisiones, analizar eventos que ya ocurrieron (Estadística Descriptiva) o que están sucediendo y predecir eventos futuros (Estadística Predictiva), convirtiéndose así en una tecnología de gran importancia para los ejecutivos, quienes presentan la necesidad de comprender los procesos de negocios y estar a la altura de la competencia.

Las herramientas de inteligencia se basan en la utilización de un sistema de información o Almacén de Datos, con información relacionada con la empresa o sus ámbitos. Un Almacén de Datos es una estructura de almacenamiento, donde los datos están almacenados de una forma que facilita a los tomadores de decisiones un acceso amigable a la información correcta, en el momento preciso.

Con el triunfo de la Revolución Cubana, el gobierno se ha trazado como uno de sus objetivos la informatización y perfeccionamiento de los sectores fundamentales de la sociedad, un método sabio y justo dado el avance tecnológico existente en el mundo. Se reconoce a las Tecnologías de la Información y las Comunicaciones como el núcleo y el principal componente para dar cumplimiento a esta transformación, para lograr cada vez más eficacia y eficiencia en los procesos y por consiguiente, un aumento en la calidad de vida de los ciudadanos.

La salud en Cuba es uno de los sectores más priorizados dentro de la sociedad. Este sector tiene la característica de encontrarse al alcance de todos, ser gratuito y haber sido desarrollado a partir de un

(7)

2

concepto social que va más allá del diagnóstico de las enfermedades, pues pone en primer lugar la atención de las necesidades de la población dentro del propio medio en que esta se desarrolla.

El Ministerio de Salud Pública (MINSAP) es el Organismo rector del Sistema Nacional de Salud (SNS) en Cuba. Este es el encargado de dirigir, ejecutar y controlar la aplicación de la política del Estado y del Gobierno en cuanto a la Salud Pública, el desarrollo de las Ciencias Médicas y la Industria Médico Farmacéutica. Sus objetivos están centrados en lograr la excelencia y eficiencia de sus servicios, además de mejorar la atención al individuo a partir del uso racional de los recursos humanos, materiales y financieros con que se dispone.

La organización de los servicios de salud en Cuba dentro del SNS se expresa en su estructura, dividida en los siguientes niveles de atención:

Atención Primaria: Es la piedra angular del SNS de Cuba, el primer contacto que realiza la población con la atención médica. Enmarca una serie de acciones de diagnóstico, prevención, curación y rehabilitación, que deben realizarse desde un Nivel Primario en beneficio de la comunidad.

Atención Secundaria: Es el segundo escalón asistencial, comprende los servicios de los hospitales a la comunidad y está dirigido a los pacientes con problemas que no son solucionados en el Nivel Primario.

Atención Terciaria: Comprende los servicios médicos integrales y de alta calidad a enfermedades o padecimientos que requieren hospitalización con atención especializada y de alta tecnología. Pertenecen a este nivel los Hospitales Especializados e Institutos de Investigaciones.

El sector de la Salud en Cuba es uno de los más grandes y complejos si de gestionar y actualizar información se trata. El proceso de informatización del mismo se comenzó desde hace varios años, con la ayuda de las empresas productoras de software y universidades cubanas.

La Universidad de las Ciencias Informáticas (UCI) es uno de los centros educacionales cubanos que tiene dentro de sus funciones principales el desarrollo de software que, entre otros objetivos contribuyen a la informatización de la sociedad. Uno de los sectores en los que se trabaja es precisamente el sector de la salud, por lo que existen actualmente varios proyectos de desarrollo con el fin de crear sistemas y herramientas para esta esfera de la medicina.

La Atención Primaria y Secundaria de la Salud generan una inmensa cantidad de datos que son almacenados durante un período de tiempo determinado en sistemas operacionales tradicionales,

(8)

3

haciendo que la búsqueda para las operaciones diarias sea rápida y eficiente. Estos sistemas a su vez, presentan grandes problemas en el manejo de la información, los cuales se describen a continuación:

No se obtiene suficiente información estadística proveniente de los sistemas existentes vinculados con la Atención Primaria y Secundaria de la Salud.

Se dificulta la toma decisiones pues no existe un mecanismo que utilice e interprete la información almacenada en el repositorio de Historias Clínicas Electrónicas.

No existen datos históricos integrados a nivel de información.

Existe dependencia de reportes o informes programados de forma semiestática.

Falta de acceso y por consiguiente de análisis directamente con los indicadores de éxito.

La no predicción del comportamiento futuro con un alto porcentaje de certeza, basado en el entendimiento del pasado.

Los sistemas operacionales pertenecientes a estos niveles generan reportes que luego son analizados por las direcciones de salud a distintos niveles: municipales, provinciales y nacional, con el objetivo de obtener información relevante para la toma de decisiones. Cuando el volumen de datos a analizar es muy grande, los especialistas no poseen la capacidad para poder realizar un análisis rápido y efectivo, y de esta manera reunir información valiosa para la toma de decisiones. La realización de estas tareas implica un trabajo extenuante que puede demorar días y semanas para terminarse.

Teniendo en cuenta los elementos mencionados anteriormente se plantea como Problema a resolver:

¿Cómo facilitar la toma de decisiones en los procesos relacionados con la Atención Primaria y Secundaria de la Salud?

Para el desarrollo de la investigación se define como Objeto de Estudio el proceso relacionado con el diseño y la creación de los Almacenes de Datos. Se enmarca el Campo de Acción en los procesos relacionados con el diseño y creación de los Almacenes de Datos en el Sistema Nacional de Salud.

(9)

4

Para dar solución al problema planteado se define como Objetivo General: Implementar un Almacén de Datos que se alimente de un repositorio de Historias Clínicas permitiendo la disponibilidad de los indicadores relacionados con la Atención Primaria y Secundaria de la Salud.

Para lograr el objetivo propuesto se dará cumplimiento a las siguientes tareas:

 Realizar análisis valorativo del estado del arte de los sistemas para la toma de decisiones y desarrollo de almacenes de datos.

 Describir las herramientas y tecnologías propuestas para el desarrollo del Almacén de Datos.

 Identificar indicadores relacionados con la Atención Primaria y Secundaria de la Salud.

 Realizar la Extracción, Transformación y Carga desde el repositorio de Historias Clínicas Electrónicas teniendo en cuenta el levantamiento de requisitos realizados.

 Realizar el Procesamiento Analítico en Línea.

El aporte práctico que trae consigo este trabajo es la garantía de tener toda la información de la Atención Primaria y Secundaria de la Salud centralizada y recuperable ante cualquier situación o fallo de los sistemas operacionales. También permitirá acelerar el proceso de análisis de la información por parte de los especialistas y eliminar la necesidad de almacenar los reportes diarios, mensuales y anuales por largos períodos de tiempo dentro de sistemas no diseñados para enfrentar esta tarea. Una vez demostrada su aplicación y garantía de funcionamiento, este tipo de sistema puede ser extendido a t odas las esferas de la medicina; integrando, manejando y analizando toda la información médica de cualquier especialidad y cualquier nivel organizativo.

El documento está estructurado en tres capítulos que incluyen los siguientes elementos:

CAPÍTULO 1. Fundamentación Teórica: En este capítulo se incluye el estado del arte y algunos aspectos esenciales para entender el entorno del problema a resolver. Se mencionan los conceptos

(10)

5

fundamentales relacionados con los Almacenes de Datos, así como las herramientas y metodología propuesta.

CAPÍTULO 2. Análisis y Diseño: En este capítulo se realiza un análisis de los requerimientos e indicadores para desarrollar el Almacén de Datos siguiendo la metodología seleccionada. También se detalla todo el proceso de Extracción, Transformación y Carga.

CAPÍTULO 3. Proceso de Consulta: En este capítulo se describen los componentes fundamentales de la fase de Procesamiento Analítico en Línea.

(11)

6

Capítulo 1. Fundamentación Teórica

En este capítulo serán abordados los principales conceptos relacionados con la construcción de un Almacén de Datos y sus principales características. A su vez incluye una descripción de los procesos de Extracción, Transformación y Carga y el Procesamiento Analítico en Línea, así como las herramientas y metodología seleccionada para su construcción. Además, incluye un breve análisis de la tendencia en la utilización de estos almacenes en Cuba y el mundo para el manejo de la información empresarial y de mercado.

1.1 Inteligencia de Negocio

Se puede describir IN, concepto que integra por un lado el almacenamiento y por el otro el procesamiento de grandes cantidades de datos, con el principal objetivo de transformarlos en conocimiento y en decisiones en tiempo real, a través de un sencillo análisis y exploración. [1]

Este puede ser descrito mediante la siguiente fórmula: Datos + Análisis = Conocimiento.

La Inteligencia de Negocios comienza con una solicitud por parte del cliente, el cual es el disparador de un mecanismo de búsqueda que actúa sobre una base de datos multidimensional conocida como Almacén de Datos. Este incluye mecanismos propios para extraer, transformar y cargar los datos contenidos en los sistemas operacionales o fuentes de datos, siendo nombrados estos mecanismos como fase de Extracción, Transformación y Carga.

1.2 Almacén de Datos

Según W. H. Inmon, reconocido mundialmente como el padre de los Almacenes de Datos:

“Un Almacén de Datos es una colección de datos orientada al negocio, integrada, variante en el tiempo y no volátil para el soporte del proceso de toma de decisiones de la gerencia”.

(12)

7

El Almacén de Datos posibilita la extracción de datos de sistemas operacionales y fuentes externas, permite la integración y homogenización de los datos de toda la empresa, provee información que ha sido transformada y sumarizada, para que ayude en el proceso de toma de decisiones estratégicas y tácticas. [2]

En un almacén lo que se quiere es contener datos que son necesarios o útiles para una organización, es decir, que se utiliza como un repositorio de datos para posteriormente transformarlos en información útil para el usuario. Debe entregar la información correcta a la gente indicada en el momento óptimo y en el formato adecuado.

1.2.1 Características del Almacén de Datos

 Orientada al negocio

La primera característica, es que la información se clasifica en base a los aspectos que son de interés para la empresa. Esta clasificación afecta el diseño y la implementación de los datos encontrados en el almacén de datos, debido a que la estructura del mismo difiere considerablemente a la de los clásicos procesos operacionales orientados a las aplicaciones. [3]

 Integrada

La integración implica que todos los datos de diversas fuentes que son producidos por distintos departamentos, secciones y aplicaciones, tanto internas como externas, deben ser consolidados en una instancia antes de ser agregados al Almacén de Datos. A este proceso se lo conoce como Extracción, Transformación y Carga de Datos. [4]

 Variante en el tiempo

Debido al gran volumen de información que se manejará en el almacén, cuando se le realiza una consulta, los resultados deseados demorarán en originarse. Este espacio de tiempo que se produce desde la búsqueda de datos hasta su consecución es del todo normal en este ambiente y es, precisamente por ello, que la información que se encuentra dentro del depósito de datos se denomina de tiempo variable. [5]

 No volátil

(13)

8

La información es útil para el análisis y la toma de decisiones solo cuando es estable. Los datos operacionales varían momento a momento, en cambio, los datos una vez que entran al almacén no cambian, no sufren ninguna actualización, sólo son incrementados.

La actualización, o sea, insertar, eliminar y modificar, se hace de forma muy habitual en el ambiente operacional sobre una base, registro por registro; en cambio en el Almacén de Datos la manipulación básica de los datos es mucho más simple, debido a que solo existen dos tipos de operaciones: la carga de datos y el acceso a los mismos.

Por esta razón es que en el almacén de datos no se requieren mecanismos de control de la concurrencia y recuperación. [6]

1.2.2 Ventajas

Algunas de las ventajas más sobresalientes que trae aparejada la implementación de un Almacén de Datos y que ejemplifican de mejor modo sus características y cualidades son: [7]

 Transforma datos orientados a las aplicaciones en información orientada a la toma de decisiones.

 Integra y consolida diferentes fuentes de datos y departamentos empresariales, que anteriormente formaban islas, en una única plataforma sólida y centralizada.

 Provee la capacidad de analizar y explotar las diferentes áreas de trabajo y de realizar un análisis inmediato de las mismas.

 Permite reaccionar rápidamente a los cambios del mercado.

 Aumenta la competitividad en el mercado.

 Elimina la producción y el procesamiento de datos que no son utilizados ni necesarios, producto de aplicaciones mal diseñadas o ya no utilizadas.

 Mejora la entrega de información, es decir, información completa, correcta, consistente, oportuna y accesible. Información que los usuarios necesitan, en el momento adecuado y en el formato apropiado.

 Logra un impacto positivo sobre los procesos empresariales. Cuando los usuarios tienen acceso a una mejor calidad de información, la empresa puede lograr por sí misma: aprovechar el enorme valor potencial de sus recursos de información y transformarlo en valor verdadero; eliminar los

(14)

9

retardos de los procesos empresariales que resultan de información incorrecta, inconsistente y/o inexistente; integrar y optimizar procesos a través del uso compartido e integrado de las fuentes de información; permitir al usuario adquirir mayor confianza acerca de sus propias decisiones y de las del resto y lograr así, un mayor entendimiento de los impactos ocasionados.

 Aumento de la competitividad de los encargados de tomar decisiones.

 Los usuarios pueden acceder directamente a la información en línea, lo que contribuye a su capacidad para operar con mayor efectividad en las tareas rutinarias o no. Además, pueden tener a su disposición una gran cantidad de valiosa información multidimensional, presentada coherentemente como fuente única, confiable y disponible en sus estaciones de trabajo. Así mismo, los usuarios tienen la facilidad de contar con herramientas que les son familiares para manipular y evaluar la información obtenida en el almacén, tales como: hojas de cálculo, procesadores de texto, software de análisis de datos, software de análisis estadístico, reportes, etc.

 Permite la toma de decisiones estratégicas y tácticas.

1.2.3 Desventajas

Desventajas encontradas en la implementación de un Almacén de Datos: [8]

 Requiere una gran inversión, debido a que su correcta construcción no es tarea sencilla y consume muchos recursos, además, su misma implementación implica desde la adquisición de herramientas de consulta y análisis, hasta la capacitación de los usuarios.

 Existe resistencia al cambio por parte de los usuarios.

 Los beneficios del almacén de datos son apreciados en el mediano y largo plazo.

 Este punto deriva del anterior, y básicamente se refiere a que no todos los usuarios confiarán en el almacén en una primera instancia, pero sí lo harán una vez que comprueben su efectividad y ventajas. Además, su correcta utilización surge de la propia experiencia.

 Si se incluyen datos propios y confidenciales de clientes, proveedores, etc. el depósito de datos atentará contra la privacidad de los mismos, ya que cualquier usuario podrá tener acceso a ellos.

 Infravaloración de los recursos necesarios para la captura, carga y almacenamiento de los datos.

 Infravaloración del esfuerzo necesario para su diseño y creación.

(15)

10

 Incremento continuo de los requerimientos del usuario.

Con la implementación de un Almacén Datos en la Atención Primaria y Secundaria de la Salud, la información estará centralizada y orientada al negocio, sólo contendrá los datos necesarios para realizar un análisis rápido y efectivo. Las ventajas del Almacén de Datos serán aprovechadas por el especialista, pues podrá analizar la información contenida en el depósito de datos y podrá observar el comportamiento de los indicadores necesarios para una correcta toma de decisiones.

1.3 Comparación entre el Almacén de Datos y el Sistema Operacional

Los Sistemas Operacionales resuelven las necesidades de funcionamiento, dígase actualización y tiempo de respuesta de la información. Sin embargo, surge dentro de ellos un nuevo grupo de necesidades de información, es decir, obtener la información necesaria que sirva de base para la toma de decisiones tanto a escala estratégica como táctica. Estas se basan en el análisis de un gran volumen de datos y de consultas bastantes costosas en recursos. El análisis de los datos se ve insatisfecho por la limitada flexibilidad a la hora de navegar por la información y a su inconsistencia debido a la falta de una visión global en estos sistemas.

En los Sistemas Operacionales se procesa un gran número de transacciones pequeñas, el usuario tiene información del estado actual de la empresa. Un Almacén de Datos está orientado al análisis, la congruencia se mide en forma global, la información se refresca con menor periodicidad que en los entornos operacionales y los requerimientos en el nivel de servicio al usuario son más flexibles. El usuario tiene información de la evolución o del comportamiento de la empresa en el tiempo y desde los puntos de vista del negocio.

Los clientes mediante un entorno operacional pueden captar o eliminar pacientes, abrir y cerrar reportes;

generalmente tienen acceso a registros individuales. Mientras que los clientes de un Almacén de Datos pueden observar el comportamiento de los indicadores, saber la enferman de los pacientes, cantidad de pacientes ingresados con una enfermedad, están interesados en respuestas, cambian continuamente los tipos de preguntas y navegan rápidamente por el contenido del almacén.

(16)

11

1.4 Proceso de Extracción, Transformación y Carga

Con este proceso se pueden extraer los datos desde las fuentes, manipularlos, integrarlos y transformarlos, para luego cargar los resultados obtenidos al almacén. Tal y como su nombre lo indica, este mecanismo extrae los datos de las diversas fuentes que se requieran, los transforma para resolver posibles problemas de inconsistencias entre los mismos y finalmente, después de haberlos depurado se procede a su carga en el depósito de datos (ver figura 1).

Las funciones específicas son:

 Extracción.

 Transformación.

 Carga.

Figura 1. Proceso de Extracción, Transformación y Carga.

Extracción:

(17)

12

En esta fase se obtienen los datos de las fuentes de datos originales, teniendo como referencia los requisitos y necesidades del usuario final y se extrae toda la información relevante para resolver el problema en cuestión.

Una vez que los datos son seleccionados y extraídos, se guardan en un almacenamiento intermedio, lo cual permite, entre otras ventajas:

 Manipular los datos sin interrumpir ni paralizar las fuentes, ni tampoco el almacén.

 Almacenar y gestionar los metadatos que se generarán en el proceso.

 Facilitar la integración de las diversas fuentes internas y externas.

Transformación:

La transformación se refiere al hecho de limpiar la información incoherente o no válida en datos que aporten información lógica, adaptar los tipos de datos y los valores de los campos para poder cargarlo al Almacén de Datos, definiendo un estándar entre todos los atributos y lograr formato único.

Carga:

Mediante la carga se insertan los datos en el formato adecuado dentro del almacén, con la información que ha sido transformada y limpiada de antemano. Se debe tener en cuenta que los datos antes de moverse al Almacén de Datos, deben ser analizados con el propósito de asegurar su calidad, ya que este es un factor clave que no debe dejarse de lado.

Las operaciones que componen el proceso de Extracción, Transformación y Carga pueden ser de muchos tipos, algunas de ellas son:

 Seleccionar sólo ciertas columnas para su carga (o si lo prefiere, que las columnas con valores nulos no se carguen).

 Traducir códigos (Ej. Si la fuente almacena una "H" para Hombre y "M" para Mujer pero el destino tiene que guardar "1" para Hombre y "2" para Mujer).

 Codificar valores libres (ej. Mapear "Hombre", "H" y "Sr" en un "1").

(18)

13

 Unir datos de múltiples fuentes (ej. búsquedas, fusión, etc.).

 Sumarizar múltiples filas de datos (ej. total de pacientes enfermos por localidad).

 Generación de campos clave en el destino.

 Transponer o pivotar (girando múltiples columnas en filas y viceversa).

1.5 Procesamiento Analítico en Línea

El Procesamiento Analítico en Línea, es la componente más poderosa de los almacenes de datos, ya que es el motor de consultas especializado del Almacén de Datos. Su principal objetivo es el de brindar rápidas respuestas a complejas preguntas, para interpretar la situación del negocio y tomar decisiones.

Cabe destacar que lo que es realmente interesante, no es la ejecución de simples consultas tradicionales, sino la posibilidad de utilizar diferentes operadores, para explotar profundamente la información.

Con esta herramienta se puede analizar el negocio desde diferentes escenarios históricos y proyectar cómo se ha venido comportando y evolucionando en un ambiente multidimensional, o sea, mediante la combinación de diferentes perspectivas, temas de interés o dimensiones. Esto permite deducir tendencias, por medio del descubrimiento de relaciones entre las perspectivas que a simple vista no se podrían encontrar sencillamente. [9]

Entre las principales funciones se encuentra:

 Consulta y visualización de datos de acuerdo con el Modelo Multidimensional.

 Cálculo de respuestas en pocos segundos.

1.6 Estado del Arte

1.6.1 Ámbito internacional

Actualmente el panorama es alentador con respecto al desarrollo de aplicaciones que utilizan los Almacenes de Datos. A medida en que los negocios se mueven, las organizaciones aprovechan al máximo las herramientas para mejorar sus servicios. La información es la clave para prosperar en un mercado competitivo.

(19)

14

Existen múltiples empresas, entre las que se destaca Sinergia, Apple y el proyecto OpenPyme cuya principal fuerza impulsora es la aportación de productos y servicios de inteligencia de negocio, que supongan un complemento a los sistemas tradicionales de gestión empresarial.

El Grupo Leroy Merlín de Francia, una empresa centrada en la mejora del hogar y en dar soluciones a las necesidades del cliente, debido a la cantidad de información que maneja decidió integrar en un Almacén de Datos en el 2007 todos los sistemas dispares de procesamiento de información para combinar información sobre todos sus clientes, compras, ventas, inventario y números de referencia de los productos, ofreciendo a la empresa una ayuda eficiente para la toma de decisiones imprescindible dada la competitividad del sector.

El Hotel Wellington de Madrid eligió a Oracle Business Intelligence como proveedor tecnológico para mejorar sus procesos mediante la Inteligencia de Negocios, controlar de forma más rápida y eficiente su negocio, analizar la información y visualizar los indicadores por medio de una interfaz gráfica, ha obtenido como beneficio la mejora en la toma de decisiones al tener los datos centralizados y actualizados y tener una visión real de la actividad del hotel.

Los almacenes de datos son muy usados por empresas y compañías que manejan datos de ventas, precios o inventarios. El sector de la salud hasta el momento no ha utilizado las herramientas de Inteligencia de Negocio para almacenar y explotar la información que se genera.

1.6.2 Ámbito nacional

Cuba se ha caracterizado por la búsqueda de nuevas vías para mejorar el nivel de vida y desarrollo de la población y por explotar las funcionalidades que brindan las herramientas informáticas.

Con el objetivo de perfeccionar la toma de decisiones se desarrolló en el Centro de Gestión de la Información y Desarrollo de la Energía (CUBAENERGIA) un Almacén de Datos que ha permitido la asimilación de esta tecnología en el estado del arte para soportar la Gestión del Conocimiento en dicha organización y puede ser una propuesta para el Sistema Nacional de Información de la Energía en Cuba.

CIMEX es otra empresa que utiliza un Almacén de Datos para analizar y gestionar la información que reciben. Este sistema comercial de la Corporación CIMEX centra su atención en la actividad del comercio, principalmente en la gestión de inventario, permitiendo una gestión de compra–venta eficiente, con una

(20)

15

finalidad fundamental: “Disminuir los costos, sin afectar al cliente, permitiendo prestaciones eficientes y con la calidad requerida, aumentando las ganancias o utilidades de las empresas”.

El Sistema Nacional de Salud actualmente no se apoya de las ventajas de la utilización de los almacenes de datos para almacenar y analizar la información de los pacientes y para que los especialistas puedan realizar una correcta toma de decisiones.

1.6.3 Universidad de las Ciencias Informáticas (UCI)

Se implementó el proceso de migración de datos hacia un almacén para el módulo Análisis Químico del proyecto LIMS Control de Calidad en la Facultad 6, para facilitar el almacenamiento de la información y ayudar al funcionamiento del Centro de Ingeniería Genética y Biotecnología de La Habana utilizando procesos de Extracción, Transformación y Carga.

La Facultad 7 realizó un Almacén de Datos para el control de Recursos Humanos de la Salud con el objetivo de consolidar la información relacionada con los temas de Colaboración y Docencia y obtener una visión histórica de los datos de dicho personal.

El mundo actual está lleno de información valiosa para todas las empresas y organizaciones, lo cual demanda el uso de bases de datos que satisfagan el acceso rápido y en forma de la información, así como la interacción en tiempo real para tener resultados correctos en la toma de decisiones.

El sector de la Salud de Cuba es un organismo que realiza innumerables tareas y actividades, por lo que a su vez genera y maneja un gran volumen de datos como parte de la información de los millones de pacientes que atiende, entre niños, mujeres y hombres de todas las edades.

Actualmente la Atención Primaria y Secundaria de la Salud almacenan la información en Sistemas de Bases de Datos Operacionales, que no cuentan la capacidad suficiente para guardar estos datos por un largo período de tiempo, perdiéndose información importante que pudiera servir en un futuro para realizar investigaciones. El análisis de los datos no se realiza en tiempo y con la calidad requerida debido a que solamente se cuenta con reportes estáticos. La toma de decisiones se dificulta ya que no se cuenta con un software que facilite el análisis y maximice el valor de la información enriqueciendo las decisiones de los especialistas de estos niveles.

(21)

16

1.7 Metodología para el diseño y la implementación

HEFESTO es una metodología propia que permite la construcción de un Almacén de Datos de forma sencilla, ordenada e intuitiva, parte de la recolección de requerimientos y necesidades de información del usuario y concluye en la confección de un esquema lógico y sus respectivos procesos de Extracción, Transformación y Carga de datos (ver figura 2).

Figura 2. Metodología Hefesto.

1.7.1 Características de la Metodología Hefesto

Esta metodología cuenta con las siguientes características: [10]

 Los objetivos y resultados esperados en cada fase se distinguen fácilmente y son sencillos de comprender.

 Se basa en los requerimientos del usuario, por lo cual su estructura es capaz de adaptarse con facilidad y rapidez ante los cambios en el negocio.

 Reduce la resistencia al cambio, ya que involucra al usuario final en cada etapa para que tome decisiones respecto al comportamiento y funciones del almacén.

(22)

17

 Utiliza modelos conceptuales y lógicos, los cuales son sencillos de interpretar y analizar.

 Es independiente del tipo de ciclo de vida que se emplee para contener la metodología.

 Es independiente de las herramientas que se utilicen para su implementación.

 Es independiente de las estructuras físicas que contengan el almacén y de su respectiva distribución.

 Cuando se culmina con una fase, los resultados obtenidos se convierten en el punto de partida para llevar a cabo el paso siguiente.

 Se aplica tanto para Minería de Datos como para el almacén de datos.

1.8 Tendencias y Tecnologías actuales 1.8.1 Sistemas Gestores de Base de Datos

Los Sistemas Gestores de Bases de Datos (SGDB) tienen como objetivo servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan, con el propósito de manipular los datos que serán utilizados en una organización. Existen diferentes SGDB en el mercado entre los que se destaca PostgreSQL, ORACLE, Microsoft SQL Server y MySQL.

Postgres es un producto libre, orientado a objetos, manejado por una comunidad de programadores que trabajan en su desarrollo y que comprende diferentes características que lo hacen una herramienta altamente capacitada para la manipulación de los datos

Presenta mejoras de rendimiento que incluye: [11]

 Heap Organized Tuples (HOT), que eliminan hasta un 75% de la sobrecarga de mantenimiento en tablas frecuentemente actualizadas.

 Checkpoints extendidos y autoafinamiento del escritor en segundo plano, que reducen el impacto de los checkpoints en los tiempos de respuesta.

 Opción de confirmación (commit) asincrónico de transacciones, que permite tiempos de respuesta más breves para algunas transacciones.

(23)

18

Estos cambios, además, aceleran significativamente la tasa de procesamiento de transacciones, entre un 5 y un 30%, dependiendo de la carga de trabajo.

Presenta nuevas características para desarrolladores de aplicaciones, como: [12]

 Soporte SQL/XML de acuerdo al estándar ANSI, incluyendo exportación en formato XML.

 Búsqueda en texto: herramienta avanzada de búsqueda en texto.

 Soporte de autentificación GSSAPI y SSPI

 Nuevos tipos de datos: UUIDs, ENUMs y arreglos de tipos compuestos.

Oracle es un SGBD relacional desarrollado por Oracle Corporation que permite la partición y la compresión de los datos para ejecutar consultas más rápidas. Se destaca por su escalabilidad, estabilidad y soporte multiplataforma.

Oracle es básicamente una herramienta cliente/servidor para la gestión de Bases de Datos. Es un producto vendido a nivel mundial, aunque la gran potencia que tiene y su elevado precio hacen que sólo se vea en empresas muy grandes y multinacionales, por norma general. [13]

MySQL es una idea originaria de la empresa Open Source MySQL AB que funciona en diferentes plataformas. Su diseño multihilo le permite soportar una gran carga de forma muy eficiente y proporciona sistemas de almacenamientos transaccionales y no transaccionales además de realizar Joins muy rápidos usando un multi-join de un paso optimizado. Los clientes pueden conectar con el servidor MySQL usando TCP/IP en cualquier plataforma y contiene soporte para comandos SQL para chequear, optimizar, y reparar tablas.

Microsoft SQL Server desarrollada por Microsoft, soporta procedimientos almacenados, permite trabajar en un modo cliente-servidor, pone a disposición de los usuarios grandes cantidades de datos aunque no maneja la compresión de datos por tanto ocupa mucho espacio en disco y está atado a la plataforma de sistema operativo sobre la cual puede instalarse.

Las tecnologías XML son un estándar importante y ampliamente aceptado para distribuir datos entre diferentes aplicaciones sobre redes locales e Internet. Microsoft SQL Server 2005 soporta el almacenamiento nativo de documentos XML, especificación de consultas con XML y devolución de resultado de consultas como documentos XML. [14]

(24)

19

Se utilizará como Sistema Gestor de Bases de Datos a PostgreSQL, por su alta capacidad para almacenar gran volumen de información y por ser una herramienta libre, por lo que cumple con las políticas establecidas por el Centro de Informática Médica (CESIM).

1.8.2 Herramientas de Extracción, Transformación y Carga

Las herramientas y aplicaciones de Extracción, Transformación y Carga más populares del mercado son:

 IBM Websphere DataStage

Conocido antiguamente como Ardent DataStage es una herramienta de IBM que permite integrar y transformar altos volúmenes de datos, con estructuras que van de simples a complejas.

Sistemas Operativos y Plataformas de Hardware apropiadas:

Windows NT Windows 2000

Windows Server 2003 IBM AIX

IBM z/OS

HP Compaq Tru64 HP-UX

Sun Solaris

Red Hat Enterprise Linux AS SuSE Enterprise Linux

 Kettle ETL

Con Kettle se dispone de una herramienta que permite realizar la Extracción, Transformación y Carga de datos de forma gráfica, interconectando bloques que tienen diversas funciones. Es tremendamente versátil, ya que contiene bloques que permiten leer y escribir de cualquier base de datos, fichero Excel o CVS, Access y otros, permite operar con los campos renombrando, normalizando, calculando campos en función de otros, mapeando valores, realizando búsquedas auxiliares en bases de datos,

(25)

20

normalizando/desnormalizando los datos de distintas filas en una sola, etc. Las transformaciones que se hacen con el Kettle se guardan en un fichero ktr que luego puede ser ejecutado desde línea de comandos o un fichero batch. [15]

Kettle, es un proyecto belga de código abierto, ahora adoptado por Pentaho IN que incluye un conjunto de herramientas para realizar la Extracción, Transformación y Carga. Uno de sus objetivos es que el proceso sea fácil de generar, mantener y desplegar:

Se compone de 4 herramientas:

SPOON: permite diseñar de forma gráfica la transformación.

PAN: ejecuta un conjunto de transformaciones diseñadas con SPOON, conocidas como trabajos (jobs), creando dependencias entre dichas transformaciones.

CHEF: permite, mediante una interfaz gráfica, diseñar la carga de datos incluyendo un control de estado de los trabajos.

KITCHEN: permite ejecutar los trabajos batch diseñados con Chef.

Características principales: [16]

 Funciona en Windows, Unix y Linux.

 Tiene una interfaz visual con indicadores de las transformaciones.

 Es una aplicación escrita en Java con algunas características avanzadas escritas en JavaScript.

 Ofrece una licencia pública GPL.

 Basado en Metadatos.

 Como soporte se encuentran los foros de Pentaho y la comunidad Pentaho.

 Soporta Oracle, DB2, SQL Server y Sybase así como MySQL, Postgres, Hypersonic, FireBird SQL e Ingres.

 Con respecto a las escalabilidad, soporta la arquitectura de procesamiento en paralelo para distribuir las tareas de Extracción, Transformación y Carga a través de múltiples servidores.

(26)

21

 Oracle Warehouse Builder

Es una herramienta completa para todos los aspectos de administración de datos y metadatos. Tiene características para asegurar la calidad de los datos, que integran el modelado relacional y multidimensional y que permiten la administración de todo el ciclo de vida de datos y metadatos.

Soporta implementaciones de múltiples entornos típicos de los proyectos de un almacén de datos para empresas, permitiendo un mejor desempeño y escalabilidad de los procesos de Extracción, Transformación y Carga. Es fácil de instalar y usar y suele comercializarse en suites que agrupan diferentes herramientas bajo un criterio que puede favorecer o no. Puede ser utilizada en 10 plataformas, entre ellas Linux y Windows, por cualquier cliente con licencia.

 Informática PowerCenter

Ofrece un acceso prácticamente universal a todos los datos empresariales, y presenta mejoras en la escalabilidad y el rendimiento empresarial, así como nuevas e importantes capacidades.

Permite resolver los desafíos de integración de datos más complejos. Estos desafíos de integración de datos incluyen la construcción de un almacén de datos de multi-terabytes, la migración desde los sistemas heredados, la sincronización de los almacenes de datos operativos, la consolidación de aplicaciones y la obtención de una visión integral de todos los datos relevantes.

 Cognos Decisionstream

Es una herramienta desarrollada por la empresa Cognos que permite estudiar globalmente la información de negocio, diseñada para extraer datos rápidamente y canalizarlos hacia el motor de transformación y agrupación de DecisionStream.

Soporta diferentes plataformas incluyendo Microsoft Windows NT, HP/UX, IBM AIX, y Sun Microsystems Solaris. Está equipado con una interfaz SQL que le permite acceder a los datos, de este modo los usuarios disponen de un entorno intuitivo y fácil de usar, sin necesidad de crear complejos scripts.

(27)

22

 Microsoft SQL Server Integration Services (SSIS)

Es una aplicación que proporciona una plataforma de integración de datos a partir de tareas y transformaciones fáciles de realizar para los desarrolladores, proporciona una arquitectura flexible, rápida y escalable que permite una integración de datos efectiva en los entornos empresariales actuales.

La arquitectura de canalización de integración de datos permite consumir datos desde diversos orígenes simultáneos, realizar diversas transformaciones complejas y llevar los datos a diversos destinos simultáneos. Admite el origen de datos XML, incluso los datos de los archivos del disco y de las direcciones URL a través de HTTP.

La inclusión de SSIS en el producto SQL Server hace que el precio del producto sea razonable en comparación con otras herramientas de integración de datos superiores.

Para realizar el proceso de Extracción, Transformación y Carga se utilizará a Kettle en su versión 3.2.0, pues es una herramienta de código abierto y presenta las características necesarias para realizar el proceso.

1.9 Otras herramientas a utilizar

Elementos a tener en cuenta para seleccionar estas herramientas:

 Fácil de usar.

 Herramientas de software libre.

 Altamente capacitadas para resolver el problema.

 Versiones recientes.

 Requerimientos de hardware y software: analizar si se pueden cumplir los requerimientos de la herramienta en cuanto a hardware y software.

1.9.1 Embarcadero ERStudio 8.0

(28)

23

Embarcadero ER Studio es una herramienta que permite a los desarrolladores de Bases de Datos el modelado de datos relacional y multidimensional de forma visual. Permite el diseño y mantenimiento de Bases de Datos transaccionales, de soporte a la toma de decisiones y para aplicaciones Web. Presenta como principales funcionalidades:

 Creación del modelo físico a partir del modelo lógico.

 Capacidad fuerte en el diseño lógico.

 Repositorio para el modelado.

 Construcción automática de Bases de Datos.

 Analizar Bases de Datos existentes.

Soporta principalmente bases de datos relacionales SQL, Oracle, Microsoft SQL Server, IBM Universal Database y Open Systems.

1.9.2 JBoss Server 4.2.2

JBoss es un servidor de aplicaciones de código abierto implementado en Java puro. Al estar basado en Java, JBoss puede ser utilizado en cualquier sistema operativo que lo soporte.

Las características destacadas de JBoss incluyen:

 Producto de licencia de código abierto sin coste adicional.

 Cumple los estándares establecidos.

 Confiable a nivel de empresa.

 Incrustable, orientado a arquitectura de servicios.

 Flexibilidad consistente.

 Servicios del middleware para cualquier objeto de Java.

 Ayuda profesional 24x7 de la fuente.

 Soporte completo para

JMX.

(29)

24

JBoss emplea una arquitectura de carga de clase que facilita el intercambio de las clases a través de unidades de despliegue.

JBoss implementa JMX en su microkernel. El propio servidor dispone de un una consola JMX accesible por la URL. [17]

1.9.3 Pentaho Schema Workbench 3.0.3

El Schema Workbench de Mondrian es un diseñador de interfaces que permite crear y configurar un cubo OLAP. El motor de Mondrian procesa las consultas MDX utilizando ROLAP. Los esquemas con los que trabaja son simplemente ficheros XML con los metadatos, los cuales serán utilizados por Mondrian para formar la estructura del cubo. Los ficheros XML pueden ser considerados como estructuras semejantes a las creadas anteriormente durante el diseño de la tabla de Hechos y Dimensiones que conforman el almacén. Es importante conocer que no es necesario construir un cubo físico, solo basta con crear el modelo con los metadatos. [18]

1.9.4 Pentaho Mondrian 3.0.4

Mondrian 3.0.4 es una versión de corrección de errores de liberación de los principales motores de la fuente abierta del Procesamiento Analítico en Línea. Permite analizar grandes volúmenes de datos de forma interactiva.

Realiza consultas al almacén y presenta los resultados mediante un navegador de modo que el usuario pueda realizar las actividades típicas de navegación. Mondrian utiliza MDX como lenguaje de consulta, que fue un lenguaje propuesto por Microsoft. Funciona sobre las bases de datos estándar del mercado:

PostgreSQL, Oracle, DB2, SQL-Server, MySQL, etc., lo cual habilita y facilita el desarrollo de negocio basado en la plataforma Pentaho.

Mondrian es una de las aplicaciones más importantes de la plataforma Pentaho IN. Es un servidor OLAP Open Source que gestiona comunicación entre una aplicación (escrita en Java) y la base de datos con los datos fuente. [19]

(30)

25

Con el desarrollo de este capítulo se ha llegado a la conclusión de que la Inteligencia de Negocio está siendo aplicada actualmente por la mayoría de empresas del orbe para la gestión de información referente al mercado empresarial. La salud es un sector que trabaja con un gran volumen de datos, es por ello que se ha seleccionado la construcción de un Almacén de Datos para la Atención Primaria y Secundaria de la Salud de manera que permita a los especialistas analizar eficientemente la voluminosa información correspondiente a las mismas, así como efectuar estudios poblacionales.

Se han mencionado y analizado las características del sistema que se desea construir. Entre las herramientas seleccionadas se encuentra PostgreSQL, Kettle y Mondrian. Hefesto será la metodología que guiará la construcción del Almacén de Datos, de manera que se arriba a la conclusión que es posible desarrollar los objetivos propuestos de forma exitosa, utilizando el 100% de las herramientas necesarias bajo licencia GPL.

(31)

26

Capítulo 2. Análisis y Diseño

Una vez conocida la metodología a utilizar y siguiendo los pasos establecidos por la misma para la construcción del sistema, se hace necesaria la identificación de aquellos indicadores que aporten información relevante acerca del paciente y su estado de salud, los cuales son filtrados a través del proceso de Extracción, Transformación y Carga hacia el Almacén de Datos.

2.1 Análisis de Requerimientos

El análisis de los requerimientos es el punto de partida de esta metodología. Para la determinación de estos se utilizó el método de la entrevista a directivos de Salud quienes guiarían la investigación previa a realizar para reflejar claramente las expectativas del depósito de datos, en relación a sus funciones y cualidades.

Durante este proceso se identificaron las necesidades de información para poder realizar una eficiente toma de decisiones, las cuales se relacionan a continuación:

 Prevalencia de las enfermedades.

 Tratamientos aplicados a una enfermedad.

 Total de pacientes identificados con un antecedente padeciendo alguna enfermedad.

 Total de vacunas realizadas a los pacientes.

 Cantidad de pacientes con alguna cirugía aplicada.

 Total de ingresos por tipo de ingreso y por especialidad.

 Total de ingresos y consultas realizadas en un tiempo determinado.

(32)

27

2.2 Identificar indicadores y perspectivas

Una vez que se han establecido las preguntas claves y definido los requisitos, se debe proceder a su análisis para descubrir los indicadores y perspectivas que se utilizarán en el Almacén de Datos, de manera que se facilite la gestión de la información a los administrativos.

Los indicadores se corresponden con los requerimientos identificados y las perspectivas a utilizar para determinar los indicadores son:

 Datos personales del paciente

 Hábitos personales

 Antecedentes personales

 Vacunación

 Cirugía

 Problema de salud

 Ingreso

 Evoluciones médicas

 Descripciones

 Tratamientos

 Consultas

 Centro de salud

 Personal de salud

 Control del tiempo

2.3 Modelo Conceptual

El modelo conceptual se construye a partir de los indicadores y perspectivas obtenidas, con el objetivo de entender y observar con claridad el alcance del Almacén de Datos. Las perspectivas se ubican a la

(33)

28

izquierda, dirigidas a un óvalo central que representa la relación que existe entre ellas y el área de estudio elegida. A partir de esta relación salen flechas hacia los indicadores representados en la derecha, como se muestra en la figura 3.

Figura 3. Modelo conceptual.

2.4 Análisis de las fuentes

2.4.1 Establecer correspondencias con los requerimientos Datos del paciente

Vacunación Cirugía

Descripciones Tratamiento

Atención Primaria y Secundaria

Prevalencia de las enfermedades.

Total de pacientes identificados con un antecedente

Total de vacunas realizadas

Cantidad de pacientes con alguna cirugía aplicada Antecedentes

personales Hábitos personales

Problema de salud

Consultas Centro de salud

Ingreso Evolución médica

Personal de salud

Total de ingresos por tipo de ingreso y por especialidad Datos variables

Total de ingresos y consultas realizadas en un tiempo determinado.

Tratamientos aplicados a una enfermedad.

Control del tiempo

(34)

29

En este paso se analiza la fuente de datos y sus características, para poder identificar su correspondencia con el modelo conceptual. La figura 4 muestra la estructura del repositorio de historias clínicas, compuesto por una carpeta Metadata que almacena las hojas frontales de las historias clínicas, y una carpeta para cada historia clínica electrónica de paciente. Cada hospital u institución registran los documentos clínicos generados por el personal de salud que atiende al paciente. Los documentos son ficheros XML, conformados bajo el estándar CDA–HL7 y varían en la estructura del cuerpo en dependencia del tipo de documento que esta representa.

Figura 4. Estructura del Repositorio de Historias Clínicas.

El Repositorio de Historias Clínicas almacena 75 tipos de Documentos Clínicos diferentes, de ellos serán utilizados para el proceso de Extracción, Transformación y Carga los que se mencionan a continuación:

(35)

30

 Hoja Frontal: Contiene los datos demográficos del paciente.

 Hoja General de Consulta: Este documento almacena los datos de las consultas realizadas al paciente.

 Evolución Médica: Almacena los datos de la evolución médica del paciente desde los servicios de Hospitalización y Emergencia.

 Orden Médica: Este documento contiene la orden de los medicamentos del paciente.

 Informe Médico: Recoge el listado de los medicamentos indicados al paciente.

 Admisión: Contiene los datos del ingreso del paciente.

 Nota Operatoria: Este documento recoge los datos del paciente al realizarle una cirugía.

 Hoja de Interconsulta: Almacena la información de las interconsultas de los pacientes.

 Hojas de especialidades: Recogen datos de las especialidades de Dermatología, Gastroenterología, Obstetricia, Pediatría, Oftalmología, Neurología, Oncología y Ginecología.

 Fichas de Higiene y Epidemiología: Estos documentos contienen los datos epidemiológicos del paciente de las enfermedades de Sarampión Rubeola, Dengue, Rabia, Sireva, Poliomielitis, Difteria, Cólera y otras enfermedades.

Todos los Documentos Clínicos comienzan con el elemento raíz ClinicalDocument. En el encabezado de estos documentos se encuentran elementos de carácter obligatorio, teniendo como elemento padre a ClinicalDocument. El elemento id, distingue un documento de forma única, de todos los demás documentos y templateId es un identificador que referencia a la plantilla del Documento Clínico.

El elemento recordTarget contiene los datos de la persona a cuya Historia Clínica pertenece este documento como muestra la figura 5.

(36)

31

Figura 5. Elemento recordTarget.

2.4.2 Seleccionar los campos que integrarán cada perspectiva

Se relacionan los atributos de las perspectivas a utilizar en el Almacén de datos.

Perspectiva1: Datos personales

(37)

32

Nombre: datos_personales

Descripción: Recoge los datos personales del paciente.

Atributo: Tipo Descripción:

id_paciente integer Valor de autoincremento, llave primaria.

no_hc_paciente varchar Número de historia clínica individual del paciente.

nombre_paciente varchar Nombre del paciente

apellido1_paciente varchar Primer apellido del paciente apellido2_paciente varchar Segundo apellido del paciente

genero_paciente varchar Género del paciente

grupo_factor_sanguineo varchar Grupo factor sanguíneo del paciente fecha_nacimiento date Fecha de nacimiento del paciente

grupo_etnico varchar Grupo étnico del paciente

país_nacimiento varchar Nombre del país de nacimiento provincia_nacimiento varchar Nombre de la provincia de nacimiento ciudad_nacimiento varchar Nombre de la ciudad de nacimiento localidad_nacimiento varchar Nombre de la localidad de nacimiento

Perspectiva 2: Datos variables del paciente Nombre: datos_variables_paciente

Descripción: Recoge los datos del paciente que pueden sufrir cambios.

id_variable integer Valor de autoincremento, llave primaria.

estado_civil varchar Estado civil del paciente.

país_residencia varchar Nombre del país de residencia.

provincia_residencia varchar Provincia de residencia.

ciudad_residencia varchar Ciudad de residencia.

localidad_residencia varchar Localidad de residencia.

área_salud_residencia varchar

(38)

33

grupo_dispensarial varchar Grupo dispensarial del paciente

nivel_escolar varchar Nivel escolar del paciente

ocupación varchar Ocupación del paciente

profesión varchar Profesión

Perspectiva 3: Hábitos personales Nombre: habitos_personales

Descripción: Recoge los hábitos personales del paciente

id_habito integer Valor de autoincremento, llave primaria nombre_habito varchar Nombre del hábito del paciente

fecha_comienzo date Fecha del comienzo del hábito

frecuencia_habito varchar Frecuencia del hábito del paciente descripcion varchar Descripción del hábito del paciente Perspectiva 4: Antecedentes

Nombre: antecedentes

Descripción: Recoge los antecedentes personales del paciente

id_antecedente integer Valor de autoincremento, llave primaria

nombre varchar Nombre del antecedente del paciente

tipo_antecedente varchar Tipo de antecedente

parentesco_antecedente varchar Parentesco del antecedente

fecha_deteccion date Fecha en que se detectó el antecedente descripcion varchar Descripción del antecedente del paciente

Perspectiva 5: Vacunación Nombre: vacunación

Descripción: Recoge las vacunas realizadas al paciente

(39)

34

id_inmunizacion integer Valor de autoincremento, llave primaria

nombre_vacuna varchar Nombre de la vacuna

refuerzo varchar Condición de refuerzo

efectos adversos varchar Efectos adversos de la vacuna

lote_ampula varchar Número del lote del medicamento

primera_dosis date Fecha de la primera dosis

segunda_dosis date Fecha de la segunda dosis

tercera_dosis date Fecha de la tercera dosis

cuarta_dosis date Fecha de la cuarta dosis

Perspectiva 6: Cirugía Nombre: cirugía

Descripción: Recoge los datos de las cirugías realizadas al paciente

id_procedimiento integer Valor de autoincremento, llave primaria nombre_procedimiento varchar Nombre del procedimiento realizado al

paciente

hallazgos_procedimiento varchar Hallazgos encontrados durante la cirugía diagnostico_preoperatorio varchar Diagnóstico pre-operatorio

diagnostico_postoperatorio varchar Diagnóstico post-operatorio

secuelas varchar Secuelas de la cirugía

Perspectiva 7: Problema de Salud Nombre: problema_salud

Descripción: Recoge los problemas de salud detectados al paciente

id_problema_salud integer Valor de autoincremento, llave primaria

codigo_cie varchar Código de la enfermedad según el

codificador internacional de enfermedades

(40)

35

tipo_problema_salud varchar Tipo de problema

problema_salud varchar Nombre del problema

descripcion varchar Descripción del problema

Perspectiva 8: Ingreso Nombre: ingreso

Descripción: Recoge los datos del ingreso del paciente

id_ingreso integer Valor de autoincremento, llave primaria especialidad_ingreso varchar Especialidad

tipo_ingreso varchar Tipo de ingreso

edad_paciente varchar Edad del paciente

motivo_ingreso varchar Motivo del ingreso

observaciones varchar Observaciones

Perspectiva 9: Evoluciones médicas Nombre: evoluciones_medicas

Descripción: Recoge la información de las evoluciones médicas realizadas al paciente

id_evolucion integer Valor de autoincremento, llave primaria

fecha_evolucion date Fecha de la evolución

estado_paciente varchar Estado del paciente

Perspectiva 10: Descripciones Nombre: descripciones

Descripción: Recoge las descripciones del diagnóstico realizado al paciente

id_diagnostico integer Valor de autoincremento, llave primaria

(41)

36

conclusiones varchar Conclusiones

Perspectiva 11: Tratamientos Nombre: tratamientos

Descripción: Recoge los datos de los tratamientos realizados al paciente

id_tratamiento integer Valor de autoincremento, llave primaria nombre_medicamento varchar Nombre del medicamento

tipo_tratamiento varchar Tipo de tratamiento

dosis varchar Dosis del medicamento

via varchar Vía del medicamento

descripcion varchar Descripción del tratamiento

horario varchar Horario del medicamento

Perspectiva 12: Consultas

Nombre: características_consulta

Descripción: Recoge los datos de las consultas realizados al paciente

id_consulta integer Valor de autoincremento, llave primaria

tipo_consulta varchar Tipo de consulta

nivel_salud varchar Nivel de salud

especialidad varchar Especialidad de la consulta

edad_paciente varchar Edad del paciente

Perspectiva 13: Centro de Salud Nombre: centro_salud

Descripción: Recoge los datos del Centro de Salud que atiende al paciente

(42)

37

id_centro_salud integer Valor de autoincremento, llave primaria no_codigo_cs varchar Identificador del centro de salud

nombre_cs varchar Nombre del centro de salud

Perspectiva 14: Personal de Salud Nombre: personal_salud

Descripción: Recoge los datos del personal de salud que atiende al paciente

id_personal_salud integer Valor de autoincremento, llave primaria no_registro_medico varchar Número del registro médico

nombre_personal_salud varchar Nombre del personal de salud

apellido1_personal_salud varchar Primer apellido del personal de salud apellido2_personal_salud varchar Segundo apellido del personal de salud categoria_personal_salud varchar Categoría del personal de salud

Perspectiva 15: Control de tiempo Nombre: control_tiempo

Descripción:

id_tiempo integer Valor de autoincremento, llave primaria fecha_hecho_medico date Fecha en que se produce el hecho médico anno_hecho_medico varchar Se deriva de la fecha del hecho médico semestre_hecho_medico varchar Se deriva de la fecha del hecho médico trimestre_hecho_medico varchar Se deriva de la fecha del hecho médico mes_hecho_medico varchar Se deriva de la fecha del hecho médico dia_hecho_medico varchar Se deriva de la fecha del hecho médico

(43)

38

2.5 Modelo lógico

Se confecciona el modelo lógico con tablas de dimensiones y hechos teniendo como base el modelo conceptual creado, utilizando como esquema de Bases de Datos el Esquema de Constelación ya que se adapta mejor a las necesidades y requerimientos del negocio estudiado. El Esquema de Constelación es un modelo de datos que contiene múltiples tablas de hechos relacionadas con sus respectivas tablas de dimensiones. Cada perspectiva representa una dimensión en el modelo lógico. Se definen las tablas hechos que contendrán los indicadores de estudio.

Los hechos son datos instantáneos en el tiempo, que son filtrados, agrupados y explorados a través de condiciones definidas en las tablas de dimensiones.

El Modelo lógico se encuentra dividido en cuatro sub-almacenes como se muestra en las figuras 6, 7, 8, y 9, estos son: los datos del paciente (h_paciente), información de cirugía (h_cirugía), hospitalización (h_hospitalización) y lo referente a la consulta del paciente (h_consulta).

(44)

39

Figura 6. Modelo lógico sub-almacén Paciente.

(45)

40

Figura 7. Modelo lógico sub-almacén Cirugía.

(46)

41

Figura 8. Modelo lógico sub-almacén Hospitalización.

(47)

42

Figura 9. Modelo lógico sub-almacén Consulta.

Centro de toma de decisiones en el sistema integral para la atencion primaria de la salud

FACULTAD 7

Trabajo de Diploma para optar por el Título de Ingeniero en Ciencias Informáticas

Centro de Toma de Decisiones en el Sistema Integral para la Atención Primaria de la Salud

Autores:

Alixandra González Naranjo Leonardo Expósito Rojas

Tutores:

Lic . Yamilka Gómez León Ing. Yovannys Sánchez Corales

“Año 52 de la Revolución”

Declaración de Autoría

____________________________ ____________________________

____________________________

____________________________

Datos de Contacto

Resumen

Tabla de Contenidos

Introducción ... 1

Capítulo 1. Fundamentación Teórica. ... 6

1.1 Inteligencia de Negocio ... 6

1.2 Almacén de Datos ... 6

1.3 Comparación entre el Almacén de Datos y el Sistema Operacional ... 10

1.4 Proceso de Extracción, Transformación y Carga ... 11

1.5 Procesamiento Analítico en Línea ... 13

1.6 Estado del Arte ... 13

1.7 Metodología para el diseño y la implementación ... 16

1.8 Tendencias y Tecnologías actuales ... 17

1.9 Otras herramientas a utilizar ... 22

Capítulo 2. Análisis y Diseño. ... 26

2.1 Análisis de Requerimientos... 26

2.2 Identificar indicadores y perspectivas ... 27

2.3 Modelo Conceptual ... 27

2.4 Análisis de las fuentes ... 28

2.5 Modelo lógico ... 38

2.6 Proceso de Extracción, Transformación y Carga. ... 43

Capítulo 3. Proceso de Consulta ... 61

3.1 Estructura de los cubos ... 61

3.2 Pentaho Mondrian ... 63

3.3 Despliegue de la solución ... 67

Conclusiones ... 69

Recomendaciones... 70

Referencias Bibliográficas ... 71

Bibliografía ... 72

Glosario de Términos ... 74

An

ne ex xo os s... 75

1

Introducción

2

3

4

5

6

Capítulo 1. Fundamentación Teórica

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

JMX.

24

25

26

Capítulo 2. Análisis y Diseño

27

28

29

30

31