• No se han encontrado resultados

Modelo para la Definición de la Arquitectura de Datos de la Empresa-Edición Única

N/A
N/A
Protected

Academic year: 2017

Share "Modelo para la Definición de la Arquitectura de Datos de la Empresa-Edición Única"

Copied!
141
0
0

Texto completo

(1)

BIBLIOTECAS DEL TECNOLÓGICO DE MONTERREY

PUBLICACIÓN DE TRABAJOS DE GRADO

Las Bibliotecas del Sistema Tecnológico de Monterrey son depositarias de los trabajos recepcionales y de

grado que generan sus egresados. De esta manera, con el objeto de preservarlos y salvaguardarlos como

parte del acervo bibliográfico del Tecnológico de Monterrey se ha generado una copia de las tesis en

versión electrónica del tradicional formato impreso, con base en la Ley Federal del Derecho de Autor

(LFDA).

Es importante señalar que las tesis no se divulgan ni están a disposición pública con fines de

comercialización o lucro y que su control y organización únicamente se realiza en los Campus de origen.

Cabe mencionar, que la Colección de

Documentos Tec,

donde se encuentran las tesis, tesinas y

disertaciones doctorales, únicamente pueden ser consultables en pantalla por la comunidad del

Tecnológico de Monterrey a través de Biblioteca Digital, cuyo acceso requiere cuenta y clave de acceso,

para asegurar el uso restringido de dicha comunidad.

El Tecnológico de Monterrey informa a través de este medio a todos los egresados que tengan alguna

inconformidad o comentario por la publicación de su trabajo de grado en la sección Colección de

Documentos Tec

del Tecnológico de Monterrey deberán notificarlo por escrito a

(2)

Modelo para la Definición de la Arquitectura de Datos de la

Empresa-Edición Única

Title

Modelo para la Definición de la Arquitectura de Datos de

la Empresa-Edición Única

Authors

Silvia Ivette Aguilar Macías

Affiliation

Tecnológico de Monterrey, Universidad Virtual

Issue Date

1999-12-01

Item type

Tesis

Rights

Open Access

Downloaded

18-Jan-2017 20:01:13

(3)
(4)

MODELO PARA LA DEFINICIÓN DE

LA ARQUITECTURA DE DATOS DE LA

EMPRESA

Tesis presentada

por

SILVIA IVETTE AGUI LAR MACÍAS

Presentada ante la Dirección Académica de la

Universidad Virtual del

Instituto Tecnológico y de Estudios Superiores de

Monterrey

como requisito parcial para optar al título de

MAESTRO EN ADM INISTRACIÓN DE

TECNOLOGÍAS DE INFORM ACIÓN

Asesor: Dr.Edgar Emmanuel Vallejo Clemente

Sinodales Lic. Horacio Echeverría Cabrera

Dr. Guillermo Rodríguez Abitia

Jurado: Dr.Edgar Emmanuel Vallejo Clemente

Lic. Horacio Echeverría Cabrera

Dr. Guillermo Rodríguez Abitia

Diciembre de 1999

(5)

DEDICATORIA

Principalmente a mis padres, que me apoyaron a terminar una etapa más en mi vida. Gracias por estar ahí todas esas veces que conté con su incondicional apoyo.

(6)

AGRADECIMIENTOS

Deseo agradecer principalmente a mis padres por su apoyo incondicional y a mi hermano M C C . Héctor Aguilar Maclas su apoyo incondicional y porque constantemente me enseña las bases del éxito y la excelencia a seguir en la vida.

Al MTIA. Daniel Peñaloza Moreno por su incondicional y constante apoyo además de sus invaluables enseñanzas de las cuales aprendí tanto a lo largo de

la maestría y que a lo largo de mi vida tendré presentes.

Al Ing. Mauricio García Tiscareño, a la Lic. Marcela San Román Manterola, al

Ing. Jorge Eliel Zarate Vázquez y al Lie Marco Tulio Martínez González, por su importante apoyo y empuje profesional además del permitirme ilustrarme con sus

enseñanzas durante mis estudios de maestría.

Al Lic. José Antonio Delgado Selley por su apoyo profesional a lo largo del

desempeño de la maestría.

A mi asesor, Dr. Edgar Emmanuel Vallejo Clemente y a mis sinodales M.A.

Juan Norberto Torres Valencia, al Dr. Guillermo Rodríguez Abitia y al Lic. Horacio Echeverría Cabrera por su paciencia, constante apoyo y dirección en la elaboración de esta tesis.

Al Instituto Tecnológico y de Estudios Superiores de Monterrey por sus

(7)

RESUMEN

M O D E L O P A R A L A DEFINICIÓN D E L A

A R Q U I T E C T U R A D E D A T O S D E L A E M P R E S A

DICIEMBRE DE 1 9 9 9

SILVIA IVETTE AGUILAR MACÍAS

LICENCIADA EN SISTEMAS DE COMPUTACIÓN

ADMINISTRATIVA

INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE

MONTERREY

C A M P U S E S T A D O DE MÉXICO

MAESTRO EN ADMINISTRACIÓN DE TECNOLOGÍAS DE

INFORMACIÓN

INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE

MONTERREY

C A M P U S E S T A D O DE MÉXICO

Actualmente el contar con datos que conforman información cuando se necesita, donde se necesita y en un formato utilizable, es un factor crítico de éxito

para la competitividad de la empresa. El atender estos requerimientos, forma parte de la misión del departamento de Sistemas de Información. La calidad de datos

debe planearse y la arquitectura de datos es un producto de la planeación de los datos y como cumplimiento de la misión del área de Sistemas de Información. Es de crucial importancia que los datos posean una organización común que elimine

(8)

directriz al aspecto de los datos de un sistema en la etapa de diseño, se incrementa la producción de sistemas estables.

Debido a esto, resulta relevante realizar una investigación para desarrollar un

modelo de apoyo a los analistas y diseñadores de sistemas a definir la arquitectura de datos óptima, que permita dentro de la organización, flexibilidad

ante los cambios y necesidades de la misma, asegurando la integridad de los datos a través de la organización a un bajo costo.

Basándonos en la premisa de que los métodos tradicionales de planificación de sistemas para la definición de la arquitectura tecnológica en una empresa, no

cubren con oportunidad las necesidades de las organizaciones hoy en día, debido a que inician con la determinación de hardware, para continuar con las aplicaciones que pueden ejecutarse por dicha tecnología y finalizar con el aspecto

datos; incrementando costos tanto cuantitativos como cualitativos en la obtención de información intrínseca a la competitividad de la empresa.

El desarrollo de esta tesis, busca proporcionar a las empresas un modelo para

la determinación de su arquitectura de datos base como cimiento de la arquitectura tecnológica, que permita la optimización de la modelación de sus

datos, buscando integridad y calidad de estos, diferenciando la información necesaria para los tres niveles de la organización: estratégico, táctico y operativo, proporcionando a cada uno información que se requiere, en el momento que se

(9)

ÍNDICE

ÍNDICE DE CONTENIDO

DEDICATORIA XXXII AGRADECIMIENTOS XXXII

RESUMEN XXXII ÍNDICE DE CONTENIDO XXXII

ÍNDICE DE ILUSTRACIONES XXXII

INTRODUCCIÓN 32

Objetivo y Producto Final de la Tesis 32

Organización del Documento 32

Capítulo 1 Evolución del Manejo de Datos 32 Capítulo 2 Necesidad de una arquitectura de datos 32

Capítulo 3 Fundamentos de Modelación de Datos 32 Capítulo 4 Modelo Propuesto para la Definición de la Arquitectura de Datos 32

CAPÍTULO 1 32

EVOLUCIÓN DEL M A N E J O DE DATOS 32

Datos dentro de los programas 32

Datos fuera de los programas 32

Sistemas Manejadores de Bases de Datos 32

El surgimiento del Modelo Relacional 32

Integración de Información a través de Almacén de Datos (Data Warehousing) 32

Minería de Datos (Data Mining) 32

CAPÍTULO 2 32

NECESIDAD DE UNA ARQUITECTURA DE DATOS 3 2

¿Por qué contar con una Arquitectura de Datos? 32

El Posicionamiento y la Información 32

La Misión de los Sistemas de Información en la Organización 32

Calidad de Datos 32

Reingeniería 32 Downsizing 32 Outsourcing 32 Administración de la Calidad Total (TQM Total Quality Management) 32

Integración de Bases de Datos 32 Planeación estratégica de Datos e Ingeniería de Información 32

CAPÍTULO 3 32

FUDAMENTOS DE MODELACIÓN DE DATOS 3 2

Planeación Estratégica de Bases de Datos 32

La línea de trabajo de Zachman 32

El Metalenguaje como apoyo a la Arquitectura de Datos 32

Metalenguaje KIF 32

Nivel Carácter 32 Nivel Lexema 32 Nivel Expresiones 32

Metalenguaje CES 32

Reingeniería Automatizada de Programas y Datos a Nivel Empresa Xinotech 32

(10)

ÍNDICE

Extracción de Modelos a Nivel Empresa 32 Administración Automatizada del Proceso de Reingeniería 32

Transformación Automatizada de Programas y Datos 32

Resolución de Problemas 32 Typel y el Año 2000 32 Interfaz del Usuario 32

CAPÍTULO 4 32

MODELO P R O P U E S T O PARA LA DEFINICIÓN DE LA ARQUITECTURA DE DATOS 32

Modelo Propuesto 32

Fase Planeación 32 Fase Modelación del Negocio 32

Fase Análisis Sistemas y Tecnologías Actuales 32 Fase Definición de Arquitectura de datos 32

Fase Implantación 32

Investigación de Campo 32

Personal Entrevistado 32

Visión 32 Organización 32

Conclusiones 32

REFERENCIAS BIBLIOGRÁFICAS 32

(11)

ÍNDICE

[image:11.612.110.556.89.396.2]

ÍNDICE DE ILUSTRACIONES

FIGURA 1.1 DATOS COMPARTIDOS CON MÚLTIPLES SUBRUTINAS 3 2

FIGURA 1.2 DATOS LOCALES DENTRO DE SUBRUTINAS 3 2 FIGURA 1.3 U N P R O G R A M A ACCEDIENDO UN ARCHIVO 3 2 FIGURA 1.4 COMPARTIR DATOS EN UNA BASE DE DATOS 3 2 FIGURA 1.5 MODELO JERÁRQUICO DE B A S E S DE DATOS 3 2 FIGURA 1.6 MODELO RELACIONAL DE B A S E S DE DATOS 3 2 FIGURA 1.7 ALMACÉN DE DATOS (DATA WAREHOUSE) 3 2 FIGURA 1.8 ALMACÉN DE DATOS ENTRE DATOS PRE MINADOS Y MINADOS 3 2

FIGURA 1.9 L o s CUATRO ESPACIOS QUE FORMAN LA BASE DEL SOPORTE A DECISIONES 3 2 FIGURA 2.1 SISTEMAS INDEPENDIENTE CON DATOS DUPLICADOS E INCOMPATIBLES 3 2

FIGURA 2 . 2 . E L ÉNFASIS ORGANIZACIONAL ES CAMBIANTE 3 2 FIGURA 2 . 3 DATOS DEL ANÁLISIS DE LA SITUACIÓN 3 2 FIGURA 2.4 F A C T O R E S DE ÉXITO QUE CREAN LA MISIÓN DE SISTEMAS DE INFORMACIÓN 3 2

FIGURA 2 . 5 CALIDAD DE DATOS 3 2 FIGURA 2 . 6 PLANEACIÓN ESTRATÉGICA DE DATOS E INGENIERÍA DE INFORMACIÓN 3 2

FIGURA 3.1 ANALOGÍA DEL OBJETIVO DE LA PLANEACIÓN ESTRATÉGICA DE BASES DE DATOS 3 2

FIGURA 3 . 2 E J E M P L O DE MODELO DE DATOS GENÉRICO ORGANIZACIONAL 3 2 FIGURA 3 . 3 F A S E S DE LA PLANEACIÓN ESTRATÉGICA DE BASES DE DATOS 3 2

FIGURA 3.4 PUNTOS DE OPORTUNIDAD TECNOLÓGICA 3 2

FIGURA 3 . 5 LÍNEA DE TRABAJO DE ZACHMAN 3 2 FIGURA 3 . 6 E J E M P L O DE METALENGUAJE C E S EN BASES DE DATOS 3 2

FIGURA 4.1 L A DEFINICIÓN DE UNA ARQUITECTURA DE DATOS 3 2

FIGURA 4.2 NIVELES EN LA ORGANIZACIÓN 3 2 FIGURA 4.3 P R O C E S O S EJEMPLO EN CADA UNO DE LOS NIVELES DE LA ORGANIZACIÓN 3 2

(12)

INTRODUCCIÓN

INTRODUCCIÓN

Hoy en día el trabajo de todos, requiere de datos y el acceder a estos cada vez es más frecuente. Es común encontrar individuos que utilizan gran parte de su tiempo manipulando información, datos. Debido a esto, el tener la posibilidad de

obtener datos cuando se necesita, donde se necesita y en un formato utilizable, es crítico. Entendemos por formato utilizable, cuando los datos pueden ser

interpretados en información y no son datos irrelevantes. En pocas palabras, el acceder a datos es el requerimiento número uno para el logro de las metas del negocio.

Conforme una organización crece y se torna más compleja, la administración

demanda más de la función de Sistemas de Información. Requieren acceder rápidamente a los datos cuando y en donde sea necesario, en un formato

accesible, que pueda ser fácilmente interpretado, con datos correctos y consistentes, a través de cada departamento, maleables al cambio rápido y constante de las condiciones del negocio y compartidos en toda la organización.

Estos requerimientos forman parte de la misión del departamento de Sistemas de Información. Proveer datos de calidad a aquellos que lo necesitan. Sin embargo, la

calidad de los datos no emerge de la nada, tampoco resulta de enfocarse en la productividad en el desarrollo de aplicaciones. La calidad debe planearse. La arquitectura de datos es un producto de la planeación de la calidad de los datos y

(13)

INTRODUCCIÓN

Uno de los puntos primordiales, es la participación de la administración, ya que provee una perspectiva del negocio y credibilidad en el proceso de planeación. Esto es de suma importancia, ya que esta intervención es nivelada conforme se

maneja el negocio o los datos, debido a que:

• Un modelo estable (independiente de las fronteras organizacionales, sistemas y procedimientos) es el cimiento de la arquitectura.

• Los datos son definidos antes que las aplicaciones.

• La dependencia de los datos determina la secuencia de implantación de los sistemas aplicativos.

Para prosperar en una economía mundial, los negocios deben de tener la

posibilidad de ajustarse y adaptarse a los cambios rápidos. Los ejecutivos requieren de Sistemas de Información que soporten al negocio conforme este

cambia. En un ambiente dinámicamente cambiante, los usuarios no pueden permitirse el esperar seis meses, un año o más a que Sistemas de Información responda formalmente a sus peticiones. Las bases de datos deben de ser flexibles

y de fácil mantenimiento, para que rápidamente junto con las aplicaciones, permitan ajustarse a los cambios que afecten de manera directa o indirecta a la

empresa.

Actualmente los ejecutivos desean y esperan que los datos que reciben sean correctos y consistentes. Los datos deben mantener una integridad completa. No sólo deben de ser correctos dentro de una precisión aceptable, sino consistentes a

través de la organización. Para que los datos sean propiamente interpretados y combinados de distintas partes de la organización, es necesario un vocabulario

(14)

-INTRODUCCIÓN

común y una estandarización de datos. Las diferencias e inconsistencias de significados de datos en la empresa deben eliminarse. Los datos provistos, deben

de ser correctos y actualizados. Los ejecutivos reconocen que los datos deben ser compartidos a través de la organización en orden de alcanzar exitosamente las

metas de la misma. Los datos también deben compartirse entre los diferentes departamentos y las unidades de negocio, para que esto suceda, los datos deben

de existir, mantenerse, administrarse y coordinarse, en forma centralizada. Esto no implica una base de datos, aislada y no distribuida. En su lugar, es de crucial importancia que los datos posean una organización común que elimine la

redundancia y asegure la consistencia de los datos. Los ejecutivos buscan: el acceder a datos en formatos utilizables cuando y donde se requiera, la habilidad

de adaptarse a los cambios y necesidades del negocio, datos correctos y consistentes y compartir estos datos dentro de la organización, sin elevar los costos de los Sistemas de Información. Los presupuestos de varios dígitos, no son

tolerables por mucho tiempo. Los datos deben de ser provistos a un costo

accesible y razonable.

Objetivo y Producto Final de la Tesis

Por lo antes expuesto, resulta relevante realizar una investigación para

desarrollar un modelo de apoyo a los analistas y diseñadores de sistemas a definir la arquitectura de datos óptima, que permita dentro de la organización, flexibilidad ante los cambios y necesidades de la misma, asegurando la integridad de los

(15)

INTRODUCCIÓN

Organización del Documento

Capítulo 1 Evolución del Manejo de Datos

En el capítulo 1 encontraremos la evolución del manejo de datos Iniciando con el manejo de datos globales utilizados dentro de los programas en la

programación estructurada, para continuar con datos almacenados en archivos para ser utilizados fuera de los programas y tener un entendimiento del

surgimiento de los Sistemas Manejadores de Bases de Datos, contemplando el modelo jerárquico y el surgimiento del modelo relacional, con la integración de información a través de almacenes de datos., finalizando con la minería de datos

Capítulo 2 Necesidad de una arquitectura de datos.

En el capítulo 2 analizamos las razones de contar con una arquitectura de datos

en la organización, qué es lo que espera la organización de una arquitectura de datos y como cumple esta con los puntos de la misión del área de Sistemas de Información. Las estrategias que las organizaciones han considerado en los

últimos años con el objetivo de encontrar calidad de datos y que significa el obtener calidad de datos.

Capítulo 3 Fundamentos de Modelación de Datos.

En este capítulo analizamos la arquitectura de datos de la organización como

resultado objetivo de la planeación estratégica de datos y presentamos las fases

que comprende esta planeación, según William H. InmonzyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Data Architecture: The

(16)

-INTRODUCCIÓN

Information Paradigm, 1992]. Con el objetivo de entender los diferentes puntos de vista de la organización en el desarrollo de arquitecturas de información,

presentamos la línea de trabajo de Zachman [1987\. Por último, el metalenguaje como herramienta de estandarización para la definición de la arquitectura de datos

de la organización, analizando KIF, C E S y la tecnología Xinotech.

Capítulo 4 Modelo Propuesto para la Definición de la Arquitectura de Datos.

En este último capítulo presentamos las fases que integran el modelo propuesto resultado de la investigación de esta tesis, incluyendo una explicación de cada una

de las fases y que aspectos se deben cubrir para la obtención de los productos finales de cada fase, haciendo referencia a los capítulos anteriores. Por último se incluyen los resultados de la investigación de campo realizada con el objetivo de

(17)

EVOLUCIÓN DEL M A N E J O DE DATOS

CAPÍTULO 1

EVOLUCIÓN DEL MANEJO DE DATOS

La mayoría de los esfuerzos para mejorar el desarrollo de software, se han enfocado en la modularización de procedimientos. Pero existe otro aspecto en el software que mientras es menos obvio, no es menos importante. Este punto lo

conforman los datos, la colección de información operada por los procedimientos. Conforme las técnicas de programación modular han evolucionado a través de los

años, también se ha incrementado aparentemente que los datos también sean modulares.

Datos dentro de los programas.

Sí un programa requiere solo algunos datos para desempeñar sus tareas, estos

datos pueden permanecer de manera segura, disponibles para todas las diferentes subrutinas que constituyen el programa. Este orden es muy conveniente para los programadores, debido a que una colección de datos compartidos,

típicamente llamado datos globales, provee una tabla boletín comunal, de la cual las diferentes subrutinas pueden intercambiar información cuando necesiten

comunicarla.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Taylor]

Cuándo el número de datos se encuentra en el rango de cientos o miles, esta solución simple, usualmente lleva a errores misteriosos y a un comportamiento impredecible. El problema es qué, compartir datos es una violación a la

(18)

-EVOLUCIÓN DEL M A N E J O DE DATOS

programación modular, que requiere que los módulos sean tan independientes

como sea posible. Permitir que los módulos interactúen libremente a través de datos compartidos, provoca que las acciones de cualquier otro módulo dependan del comportamiento de todos los demás. En efecto, los datos globales se

convierten en grietas de la armonía que la programación estructurada a creado entre las subrutinas.

La solución a este problema es modularizar los datos a lo largo con los procedimientos. Esto se realiza típicamente, dando a cada subrutina su propio

almacenamiento de datos local, de manera que por sí solo logre leer o escribir. Esta estrategia de ocultar información, minimiza interacciones no deseadas entre

(19)
[image:19.612.98.487.114.270.2]

EVOLUCIÓN DEL M A N E J O DE DATOS

Figura 1.2 Datos

locales dentro de subrutinas

Datos fuera de los programas.

Los programas pequeños a menudo requieren solo de algunas entradas y

generan salidas que están hechas para ser consumidas inmediatamente. Por ejemplo, un programa para calcular las tablas de amortización, posiblemente

acepte un valor base y un periodo de amortización del teclado, para después imprimir una página de cálculos. Los programas de este tipo, no necesitan almacenar datos debido a que trabajan con información fresca cada vez que se

ejecutan.

Sin embargo, los programas más grandes, usualmente trabajan con la misma

información una y otra vez. Los programas para control de inventarios, sistemas de contabilidad y herramientas de diseño de ingeniería, no pueden funcionar sí no

cuentan con una manera de preservar la información de una sesión a la siguiente.

(20)

-EVOLUCIÓN DEL M A N E J O DE DATOS

La solución más simple a este problema de almacenar información, es contar

con un programa que almacene su información en un archivo externo. Cuando el programa finaliza su ejecución, envía los datos a un archivo externo. Cuando se configura el programa nuevamente, recupera la información de un archivo. El uso

de un archivo, también permite al programa trabajar con más información que internamente podría mantener, leyendo y escribiendo una pequeña porción del archivo en cualquier momento.

Los archivos externos de datos proveen una solución adecuada para almacenamiento de información, tan larga como los datos, sí sólo es accedida por

[image:20.612.195.421.413.602.2]

un usuario a la vez. Cuando los datos necesitan ser compartidos entre personas, programas o ambos, surgen nuevos problemas.

(21)

EVOLUCIÓN DEL M A N E J O DE DATOS

Sistemas Manejadores de Bases de Datos.

La mayoría de los sistemas basados en archivos no permiten que más de una persona acceda el archivo al mismo tiempo. Permitir el acceder a diferentes

personas simultáneamente, presenta la posibilidad de que una persona modifique la información que otros están actualmente utilizando. Prevenir estas confusiones resulta ser un problema técnico bastante difícil, que no fácilmente se soluciona

dentro de un sistema basado en archivos. A pesar de que algunos programas viejos continúen utilizando archivos para almacenar información compartida,

[image:21.612.84.559.384.612.2]

llamados sistemas manejadores de bases de datos (datábase management systems (DBMS's)), que son diseñados para manejar simultáneamente el acceder a datos compartidos.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Object Technology: A Manager's Guide]

Figura 1.4 Compartir datos en una base de datos.

(22)

-EVOLUCIÓN DEL M A N E J O DE DATOS

Los programas de los manejadores de bases de datos hacen más que sólo

controlar el acceder a datos almacenados en archivos, también almacenan las relaciones entre los diferentes elementos de datos. El entendimiento de cómo la generación de bases de datos va y viene en un ambiente corporativo, es crítico

debido a la manera en que se almacenan estas relaciones. Los primeros DBMS's adoptaron el acercamiento de almacenar referencias directas entre los elementos

de datos, permitiendo a los datos ser recuperados a través de un proceso llamado acceso de navegación. Este acercamiento soporta extremadamente rápida recuperación de información relacionada, debido a que cada pieza de información

almacenada incluye la localización de toda la información relacionada.

Las primeras formas de manejadores de bases de datos conocidas como modelos jerárquicos, representan elementos de datos, llamados registros, en estructuras de árbol. Por ejemplo, un departamento puede incluir registros de los

puestos que contiene y del equipo. Cada posición en turno, puede ser asociada con una lista de responsabilidades y una lista de empleados en el departamento

(23)
[image:23.612.115.499.124.303.2]

EVOLUCIÓN DEL MANEJÓ DE DATOS

Figura 1.5 Modelo Jerárquico de Bases de Datos.

Una extensión subsecuente de un modelo jerárquico, el modelo de red, permitiendo que los datos sean interconectados libremente, sin requerimiento de

que encajen en una simple estructura de árbol. En el ejemplo anterior, cada pieza de equipo puede ser asociada con ambos, un departamento y una lista de empleados que fueron autorizados a utilizarlo. Este tipo de asociaciones no sería

permitido en un modelo jerárquico.

El surgimiento del Modelo Relacional

Los modelos de bases de datos jerárquicos y de red permitieron facilidad para representar relaciones complejas entre elementos de datos y proveyeron el acceder rápido a los datos. Sin embargo existía un costo: Acceder a los datos de diferente manera a la ya soportada por las relaciones predefinidas, era muy lento e

(24)

-EVOLUCIÓN DEL M A N E J O DE DATOS

ineficiente. Peor aún, es muy difícil modificar las estructuras de datos. Cambiar estas estructuras, requerían de que los administradores del sistema dieran de baja la base de datos y la reconstruyeran, modificando todos los programas de

aplicación que utilizaran las nuevas estructuras y entonces, traer todos los componentes del sistema en línea, simultáneamente.

El tiempo fuera de servicio creado por estos cambios era intolerable para los

usuarios que tenían que continuar trabajando sin acceder a sus datos o la habilidad de almacenar sus transacciones de negocio. Más aún, estos cambios eran mucho más riesgosos para la empresa. Un error simple en cualquiera de los

pasos podría fácilmente corromper los datos corporativos de manera que su costo fuera de millones de dólares. El efecto combinado de estos problemas era que las

bases de datos jerárquicas y de red eran raramente modificadas una vez que eran desplegadas.

Una nueva forma de manejador de bases de datos, el modelo relacional,

direccionaba estos problemas removiendo la información acerca de las relaciones complejas en la base de datos. Todos los datos son almacenados en tablas simples, mediante relaciones sencillas entre artículos de los datos que se

expresan como referencias a valores en otras tablas. Por ejemplo: cada entrada en la tabla de equipo podía contener un valor indicando a que departamento

(25)

EVOLUCIÓN DEL M A N E J O DE DATOS

también hizo posible una nueva sintaxis, el lenguaje estructurado de consulta (Structured Query Language SQL), que permitía acceder a la información en un R D B M S mediante combinaciones posibles.

A pesar de que el modelo relacional es mucho más flexible que sus

predecesores, extrae un precio inclinado debido a esta flexibilidad. La información acerca de las relaciones complejas que fue removida de la base de datos, debe expresarse como procedimientos en cada programa que acceda la base de datos,

una violación clara de la independencia requerida por la modularidad del software. El cambio de acceder por navegación a asociativo, también extrae una penalidad

seria en cuanto a desempeño, debido a que toma más tiempo localizar información relacionada buscando por contenido en lugar de brincar a una dirección calculada.

(26)
[image:26.612.160.492.86.369.2]

-EVOLUCIÓN DEL M A N E J O DE DATOS

Figura 1.6 Modelo Relacional de Bases de Datos

Las comparaciones han demostrado que las estructuras complejas de datos

toman de 100 a 1,000 veces más tiempo para recuperar estructuras de datos de

bases de datos relaciónales que lo que toman las bases de datos de red.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Taylor]

No obstante estos inconvenientes, la flexibilidad de las bases de datos

relaciónales a ganado la industria. A pesar de que una vasta cantidad de datos continua siendo administrada por bases de datos jerárquicas, de red y archivos estructurados, estas son herencias de generaciones previas en lugar de

(27)

EVOLUCIÓN DEL M A N E J O DE DATOS

la tecnología D B M S dominante hoy en día y virtualmente todas las nuevas aplicaciones son construidas utilizando sistemas relaciónales.

Integración de Información a través de Almacén de Datos (Data

Warehousing).

El concepto principal de almacenaje de datos es que sea más efectivo el acceder a los datos almacenados para análisis de negocio, separándolos de los

datos contenidos en sistemas operacionales. Las razones para separar los datos operacionales de los datos de análisis no han cambiado significativamente con la

evolución de los sistemas de almacenaje de datos, excepto que ahora son considerados más formalmente durante el proceso de construcción de sistemas de almacenaje de datos. Los avances en la tecnología y los cambios en la naturaleza

del negocio, han permitido que el análisis de negocios sea más sofisticado y más complejo, adicionando la producción de reportes estándares. Hoy en día los

sistemas de almacenaje de datos soportan análisis sofisticados en línea,

incluyendo análisis de datos multidimensionales.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Object Technology: A Manager's Guide]

El mantener datos dispersados a través de varias generaciones de tecnologías DBMS, presenta su propio conjunto de problemas. Es muy difícil para aplicaciones

individuales, integrar datos a través de tecnologías tan radicalmente diferentes, lo que significa que obtener cualquier punto de vista administrativo es más difícil que nunca. El acercamiento actual para la resolución de este problema es el

almacenaje de datos, una base de datos relacional que se utiliza para tomar datos

(28)

-EVOLUCIÓN DEL M A N E J O DE DATOS

seleccionados juntos de diferentes localidades de almacenaje en un repositorio con un mecanismo de acceder común. El almacenaje de datos, por sí solo, no

soluciona el problema de integrar datos de fuentes divergentes, pero permite que el problema se solucione una sola vez, utilizando procedimientos habituales para

obtener los datos juntos. Una vez que esto se ha realizado, todos los datos combinados pueden ser accedidos de manera uniforme, utilizando S Q L y otras

herramientas estándar.

Los sistemas de almacenaje de datos son más exitosos cuando se combinan datos de más de un sistema operacional. Cuando los datos necesitan tomarse de

más de una fuente aplicativa, es natural que esta integración se dé en una aplicación separada, independiente de las aplicaciones fuente. Los sistemas de almacenaje de datos permiten de manera muy efectiva, la combinación de datos

de múltiples fuentes de aplicación, tales como ventas, mercadotecnia, finanzas y producción. Muchas arquitecturas grandes de almacenaje de datos, permiten que

las aplicaciones fuente sean integradas en almacenes de datos increméntales.

La razón primaria de combinar datos de múltiples aplicaciones fuente, es la habilidad de referencias cruzadas de datos de estas aplicaciones. Todos los datos

de un Almacén de datos típico, se crean en una dimensión de tiempo. El tiempo es el primer filtro criterio para un gran porcentaje de toda la actividad realizada en un

(29)

EVOLUCIÓN DEL M A N E J O DE DATOS

posible comparar ventas del primer cuarto del año, con ventas del primer cuarto de años anteriores. La dimensión de tiempo en un almacén de datos también sirve como atributo fundamental de referencia cruzada en un almacén de datos. Por

ejemplo un analista puede analizar el impacto de una nueva campaña de mercado

accediendo las ventas de ciertos meses durante un mismo periodo. La habilidad de establecer y entender la relación entre actividades de diferentes grupos organizacionales dentro de una empresa, es continuamente citado como la mejor

característica de los sistemas de almacenaje de datos.

Los sistemas de almacén de datos son útiles, no sólo como plataformas de

fusión de datos de múltiples aplicaciones, también es posible integrar múltiples versiones de la misma aplicación. Por ejemplo una organización puede haber migrado a una nueva aplicación estándar de negocio, reemplazando un sistema

basado en mainframe. Los sistemas de almacén de datos pueden servir como una plataforma muy poderosa, para combinar datos de viejas y nuevas aplicaciones.

Diseñada de manera propia, el almacén de datos puede permitir el análisis de año

por año a pesar de cambiar la aplicación operacional base.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [The data warehouse lifecycle toolkit: expert methods for designing, developing, and deploying

datawarehouses]

La razón más importante de separar los datos operacionales de los de negocio,

es la degradación del potencial de desempeño en los sistemas operacionales, que puede resultar de los procesos de análisis. El alto desempeño y una rápida respuesta son casi universalmente críticos para los sistemas operacionales. La

(30)

EVOLUCIÓN DEL MANEJÓ DE DATOS

pérdida de eficiencia y el costo incurrido con respuestas más lentas sobre las

transacciones predefinidas son usualmente fácil de calcular y medir. Por ejemplo, una pérdida de cinco segundos de tiempo de procesamiento es quizá insignificante por sí sola, pero mezcla considerablemente más tiempo y altos

costos, una vez que se observa el panorama completo de todas las operaciones juntas. Por otro lado los procesos de análisis de negocio en un almacén de datos

son difíciles de predefinir y rara vez necesitan una respuesta rígida en cuanto a requerimientos de tiempo.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [The data warehouse lifecycle toolkit: expert methods for designing, developing and deploying data warehouses]

El almacenaje de datos es un paso razonable hacia delante, pero es una

solución que introduce problemas de sí mismo que aparentemente se han tornado dolorosos. Un problema es que la rigidez de los datos de sistema se ha

incrementado, debido a que cualquier cambio en las bases de datos locales requiere modificar el sistema de almacenaje de datos. Otra preocupación es el

aspecto tiempo. La información de un almacén de datos siempre se retrasa detrás del tiempo real de operación de datos de la empresa y este retraso difiere cuando

las diferentes bases de datos son actualizadas en momentos diferentes. El resultado es que el punto de vista administrativo de la empresa está siempre

desactualizado en un cierto grado y puede ser inconsistente temporalmente.

(31)
[image:31.612.88.514.95.324.2]

EVOLUCIÓN DEL M A N E J O DE DATOS

Figura 1.7 Almacén de datos (Data Warehouse)

Minería de Datos (Data Mining)

En los primeros días del data warehousing, la minería de datos era visto como un subconjunto de las actividades asociadas con el almacén de datos.

Actualmente los caminos del data warehouse y el data mining se están separando. Mientras el almacén puede ser una buena fuente para los datos a ser minados, la

minería ha sido reconocido como una tarea independiente y no más como parte de la colonia del almacén de datos.

De hecho, la minería de datos no sólo ha ganado independencia, sino que está influenciando directa y significativamente el diseño e implantación de grandes

almacenes de datos. En los primeros el paradigma de "construya un almacén primero, después mine", parecía simple e intuitivo y en muchos casos se siguió

(32)

-EVOLUCIÓN DEL M A N E J O DE DATOS

por default. Este acercamiento de "construya primero, piense después", fue realmente un paradigma de recolectores de datos, debido a que en muchos casos conducía a la construcción de recolectores de datos cuyo contenido no era

[image:32.612.95.326.223.530.2]

fácilmente salvable. La mejor manera de resolver esto, es dejar el almacén de datos entre dos capas de minería, tal como se muestra en la figura 1.8

Figura 1.8 Almacén de datos entre

datos preminados y minados.

A pesar de que el almacenaje y la minería son sin duda actividades relacionadas, que pueden reforzarse una a otra. La minería de datos requiere de diferentes estructuras de datos, procesos computacionales y abastecedores a

(33)

EVOLUCIÓN DEL M A N E J O DE DATOS

cuidadosamente estos procesos y entender como difieren en orden de utilizarlos efectivamente.

El propósito de la mayoría de los almacenes de datos es unir grandes montos de datos históricos de diferentes fuentes y utilizarlas para soporte a decisiones.

Las actividades desempeñadas para grandes repositorios corporativos, son usualmente diversas, pero continuamente incluyen distintas tareas, tales como

consultas, reportes, análisis multidimensional y minería de datos. Estas tareas rompen naturalmente en grupos separados de usuarios, así como procesos computacionales distintos.

El acceder a datos y su análisis, trabajan en diferentes espacios computacionales, los cuales son "espacios derivados". El acceder a operaciones

de datos, tales como consultas y reportes, tratan con el espacio de datos, OLAP utiliza el espacio multidimensional y la minería de datos utiliza el espacio de influencia. Los cuatro espacios que forman la base del soporte a decisiones se

muestran en la figura 1.9. Estos son espacios de agregación, influencia y variación. Puede ser también utilizado un espacio basado en las relaciones

geográficas para cierto tipo de análisis.

Un almacén de datos es entonces, el espacio natural para almacenar el espacio

de datos, que es donde se almacena el nivel base de los elementos de datos que más tarde serán analizados para entregar información y justo cuando O L A P no es

(34)

-EVOLUCIÓN DEL M A N E J O DE DATOS

[image:34.612.57.544.138.420.2]

visto como un esfuerzo únicamente de almacenaje, la minería de datos es donde se desempeña el análisis que trata con el espacio de influencia.

Figura 1.9 Los cuatro espacios que forman la base del soporte a decisiones

Las preguntas planteadas a estos espacios, son inherentemente diferentes.

Algunas preguntas como ¿Qué influenció las ventas?, son casi imposibles de contestar directamente en el espacio de datos. Más aún, los espacios derivados son continuamente tan grandes que los factores de influencia no pueden ser

fácilmente procesados de antemano, dentro de bases de datos también grandes. Continuamente tenemos que confiar en preprocesamientos parciales de estos

espacios, con computaciones dinámicas, con computaciones más allá de las

(35)

EVOLUCIÓN DEL MANEJÓ DE DATOS

Los espacios de datos incluyen toda la información contenida en otros espacios, pero en forma con menor refinamiento. Esto forma las bases para la derivación de los otros espacios, pero de manera menos refinada.

En el proceso de análisis, el espacio de datos continuamente necesita ser enriquecido con semántica adicional, adicionando información acerca de

jerarquías y comportamiento periódico. Esta semántica adicional va un poco más allá del modelo relacional simple, pero continuamente ayuda al usuario. De hecho, mes, trimestre, año y ciudad, estado, municipio, forman jerarquías naturales que el

modelo relacional simple ignora. Adicionando dicha semántica al espacio OLAP se provee de beneficios adicionales al usuario.

Mientras el espacio OLAP, trata con valores numéricos computados, el espacio de influencia tiene una naturaleza lógica. Este trata con la influencia de grupos

específicos de elementos en los demás. Lo que hace más interesante a este espacio es que la información que provee es mucho más utilizable que los otros

espacios, debido a que dicha información es típicamente muy general y puede ser referida como conocimiento. Desde que la información uno de los artículos más valorados en el mundo y con la complejidad incremental de la sociedad de hoy en

día, la información obtenida por la minería de datos puede ser exponencialmente más valorada que cualquier otro activo.

(36)

EVOLUCIÓN DEL M A N E J O DE DATOS

• El almacén de datos, donde la montaña de datos corporativos son almacenados en un solo lugar. Aquí los volúmenes de datos son muy altos. Estos diseños son usualmente esquemas de estrella o estructuras altamente normalizadas.

• Los mercados de datos son donde los datos departamentales son almacenados y continuamente se añaden componentes de datos. Los volúmenes de tamaño de los almacenes van de un 15% a un 30%. Estas bases de datos se basan usualmente en diagramas de estrella o están normalizados. Deben encontrarse en el espacio de datos, pero algunas veces se realiza análisis multidimensional.

• La minería de datos es donde se organizan los datos para su análisis y la información es extraída de los datos. Los volúmenes de datos son los mismos que los mercados de datos, pero los datos son ricamente más estructurados y ya no son solo departamentales. Los datos aquí se refieren a objetivos específicos del negocio y son analizados con el propósito de extracción de información.

Mientras las estructuras de datos utilizadas dentro de los almacenes y mercados de datos, son similares, las de la minería de datos son

significativamente diferentes. La minería de datos difiere del almacén de datos no solo en el tamaño que maneja, sino también en la estructura de los datos. El contenido de los datos en la minería es a menudo diferente de los datos en el

almacén, debido a que es enriquecida frecuentemente con datos externos adicionales que no se encuentran en el almacén. La llave de la arquitectura de la

(37)

EVOLUCIÓN DEL M A N E J O DE DATOS

La minería de datos puede existir en tres formas básicas:

• Arriba del almacén de datos, como un conjunto de vistas conceptuales • Junto al almacén de datos como un repositorio separado.

• Dentro del almacén de datos, como un conjunto distinto de recursos.

En algunos casos existe la minería de datos autosuficiente, esto sucede cuando una unidad de negocio dentro de una organización necesita obtener resultados del próximo trimestre, no del próximo año. Cuando toma demasiado construir un almacén corporativo, algunas organizaciones no tienen opción más que tomar el

asunto en sus manos, a menudo con resultados excelentes.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [DataMines for Data Warehouses]

(38)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

CAPÍTULO 2

NECESIDAD DE UNA ARQUITECTURA DE DATOS

El mundo del desarrollo de sistemas ha cambiado tan rápido, como la

tecnología misma. Originalmente existía un análisis basado en requerimientos, donde dominaban los pensamientos de modelación de procesos. Fue entonces cuando iniciaron los análisis y diseños basados en datos.

Las organizaciones continuamente adquirían cierto número de computadoras y

era frecuentemente difícil transferir datos entre ellas. El tamaño y la naturaleza de los dispositivos de almacenaje disponibles, eran tal como hacer imposible el manejo de grandes bases de datos integradas. No era para sorprenderse, que el

software requerido para administrar dichas bases de datos no existía. Consecuentemente, la situación norma se presenta en la figura 2.1.

Con el desarrollo de nuevos sistemas de alto desempeño de procesamiento de transacciones en línea y el mantenimiento de sistemas viejos orientados al

procesamiento por lotes (batch), se hizo realidad el hecho de que el hacer énfasis en la automatización de un solo proceso, era incorrecta. Había mucho más en el

desarrollo del sistema, qué la especificación de código y de requerimientos. Un poco más allá, mientras los procesos tendían a cambiar con el tiempo, los datos requeridos para desempeñar esos procesos, tendían a permanecer relativamente

(39)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

sistema en la etapa de diseño, se incrementa la producción de sistemas estables.

A través de los días de análisis de procesos y análisis y diseño estructurado, el aspecto completo de los datos ha sido tratado como un pensamiento final. De hecho, en los primeros tiempos del desarrollo de sistemas, se contempla a los

[image:39.612.102.532.215.460.2]

datos como producto del procesamiento.

Figura 2.1 Sistemas Independiente con datos duplicados e incompatibles.

Las islas de datos existentes en muchas organizaciones, son parte de los sistemas legados que operan hoy día en la mayoría de las organizaciones que

implementaron sistemas hasta los años ochenta. De hecho a la fecha se continúa creando islas de datos. Existen numerosas consecuencias importantes de esta

herencia:

(40)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

Datos acerca de productos, clientes y otras entidades pueden mantenerse en más de un archivo.

Puede resultar extremadamente difícil, reconciliar la información producida por varios sistemas por razones tales como:

• El uso inconsciente de códigos.

• Diferenciación de cortes y procesamientos.

• La eficiencia y efectividad de las operaciones intra e inter organizacionales son forzadas debido a las barreras resultantes del flujo ligero de datos.

¿Por qué contar con una Arquitectura de Datos?

Los crecientes problemas ocasionados por los sistemas autosuficientes y las islas de datos asociadas, llegan a ser rigurosamente aparente, desde una

consideración tipo informe de la Figura 2.2, la cual muestra el cambiante énfasis organizacional. Históricamente el comando jerárquico y control de la organización fue un lugar común, tal como se indica en la organización vertical de la Figura 2.2.

Sin embargo, dichas organizaciones son relativamente sin responsiva e inflexibles. Ahora en muchos sectores se han establecido nuevos arreglos que son mucho

más flexibles y con más responsiva a las demandas de un mercado cambiante. La figura 2.2, utiliza el término horizontal para describir una forma de dichos arreglos

organizacionales. El término red debió ser de igual manera utilizado.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Data

(41)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

Un requerimiento llave de las organizaciones red, es que debe existir un flujo libre de datos a través de la organización y que a todo el personal de la organización se le debe presentar una vista consistente de la información que requieren para realizar su trabajo efectivamente. La calidad de la arquitectura de datos de la empresa y la efectividad de su implantación, determina que tan bien

[image:41.612.140.487.246.543.2]

pueden fluir los datos a través de la organización.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Architecture]

Figura 2.2. El énfasis organizacional es cambiante

De tal manera la estructura de datos puede tener una influencia significante en la habilidad de la organización de ser flexible y responsiva ante las demandas de un mercado cambiante. Una estructura de datos fuerte no es suficiente por sí

misma para asegurar que una organización es flexible y responsiva, pero una

(42)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

estructura de datos pobre, seguramente dará lugar constantemente a represiones serias en la habilidad de la organización de archivar estándares de desempeño

mundial, es parecido a hacer imposible el archivo de dichos estándares. Es por esto, que las arquitecturas de datos son importantes desde cierta perspectiva.

El paradigma de la información es la arquitectura de datos, que es el resultado de una evolución y de alguna manera, se explica así mismo, debido a que muchos

de sus componentes sobrevivientes o moldeados por la evolución, son familiares. Este resultado es una arquitectura, descrita en términos de datos, pero aplicable más allá de la narrativa de que solo los datos se ajustan a las necesidades de

información genérica y presupuestos de la empresa de manera eficiente y efectiva. Esta arquitectura de datos es el paradigma de los Sistemas de Información y la

tecnología para sistemas estables y efectivos.

El término de arquitectura de datos, se ha definido como el componente de la

línea de trabajo del recurso datos, que contiene todas las actividades y los productos de esas actividades relacionados con la identificación, nombre,

definición, estructuración, calidad y documentación del recurso datos para una empresa.

Una arquitectura de datos común, es una arquitectura de datos que provee un

(43)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

necesidades de información. Los Sistemas de Información que prosperan, son

aquellos que se encuentran en armonía con la arquitectura de datos.

El departamento de defensa de los Estados Unidos de Norte América, dice qué: "Una arquitectura es definida en IEEE 610.2 como la estructura de componentes,

sus relaciones, sus principios, las guías gobernantes de su diseño y evolución sobre el tiempo". La arquitectura de datos de una empresa contiene el

procesamiento de transacciones en línea y (OLTP On-Line Transaction Processing) el procesamiento analítico en línea (OLAP On-Line Analytical Processing). Los datos de OLTP soportan las operaciones y los datos de OLAP

producen inteligencia.

Los datos y la información son activos de extremo valor a la empresa. La

arquitectura de datos, define una infraestructura para proveer datos de alta calidad y consistentes, donde se necesita y cuando se necesita. Esta infraestructura asiste de manera complementaria a los requerimientos de datos, para hacerlos

fácilmente accesibles y entendibles por usuarios finales autorizados y por sistemas aplicativos.

Los resultados de un estudio realizado por la Sociedad de Administración de Información (The Society of Information Management SIM) y el Centro de

Investigación de Sistemas de Información gerencial de la Universidad de Minnesota (MIS Research Center at the University of Minnesota), publicados en

(44)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

Diciembre de 1991, muestran que los aspectos más importantes que enfrenta la administración de Sistemas de Información actualmente, son:

• El desarrollo de una arquitectura de información, hace efectivo el uso de datos como recurso.

• El mejoramiento de la planeación estratégica de los Sistemas de Información.

El proceso de arquitectura, inicia con un entendimiento de la empresa y de los datos que constituyen su infraestructura de información. A manera de ser más útil, los Sistemas de Información deben de derivarse de ésta base de conocimiento

acerca de la empresa.

Generalmente hablando, una arquitectura define qué es lo que se necesita, y un plan soporta cuando esta arquitectura será implementada. Las arquitecturas por si solas pueden proveer definiciones útiles y estándares, además de proveer ideas.

En cualquier compañía, negocio o industria, los ejecutivos enfrentan grandes retos para alcanzar sus metas. Sin discusión alguna, la información provee las

respuestas a las necesidades de éxito. La gente a todos niveles de la organización, necesita de información para llevar a cabo su trabajo de manera

correcta. Cuando se pregunta: Con respecto a la información,zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA ¿Qué es necesario para completar sus objetivos o realizar su trabajo? Presidentes, Vicepresidentes y

los niveles que reportan a estos, responden las siguientes cinco mismas

(45)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

1. Acceder a datos en un formato utilizable cuando y donde sea necesario.

Virtualmente, el trabajo de cualquier persona requiere datos y el acceder a

estos es la requisición más frecuente. Es común encontrar individuos que gastan más del 50% de su tiempo manejando información -buscando,

encontrando, ordenando, examinando, copiando, guardando, cambiando, completando, y enviando datos. Consecuentemente, el que sea posible acceder datos cuando sea necesario, donde sea necesario y en un formato

utilizable es crítico. El que se encuentre en un formato utilizable, significa que es posible leer los datos e interpretarlos en información y no convertirlos en

datos irrelevantes. Pura y simplemente, el acceder a datos es el requerimiento número uno para alcanzar las metas del negocio.

2. Habilidad para adaptarse a las necesidades cambiantes del negocio.

Para prosperar en una economía mundial, los negocios modernos deben ser capaces de ajustarse y adaptarse rápidamente a cambios. Los ejecutivos

requieren de Sistemas de Información que soporten al negocio conforme este cambia. En un ambiente dinámico de negocios, los usuarios no pueden

darse el lujo de esperar seis meses, un año, o más a que el área de Sistemas de Información atienda de manera formal sus requisiciones. Las bases de datos y las aplicaciones que se utilicen dentro de la organización,

deben ser flexibles y de fácil mantenimiento, de manera que rápidamente sea posible acoplarse a los cambios de nuevos productos, mercados, fusiones y

adquisiciones, tecnología, regulaciones gubernamentales y cambios competitivos.

(46)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

3. Datos Exactos y Consistentes

Los ejecutivos desean y esperan que los datos que reciben sean exactos y consistentes. Los datos deben tener una alta integridad, no solo deben ser

correctos dentro de una precisión aceptable también deben ser consistentes a través de la organización. Para datos que deben ser propiamente

interpretados y combinados en toda la organización, es necesario un vocabulario común o una estandarización de datos. Por ejemplo, suponga que el gerente divisional de una gran compañía necesita tomar una decisión

para asignar recursos de venta sobre la base de niveles de venta. El gerente podría preguntar a las cabezas de las áreas de ventas, mercadotecnia,

manufactura, distribución y finanzas,zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA ¿Cuáles son nuestras ventas? y recibiría cuatro diferentes respuestas significativas, aunque ninguna de estas

figuras de ventas sería incorrecta desde la perspectiva de la persona que

provee la información, cada uno determinó la información de manera diferente. Esto es, la palabra ventas puede tener cuatro diferentes

significados en la empresa. Estas diferencias e inconsistencias deben de ser eliminadas. Los datos provistos deben de ser exactos y sobretodo actualizados al día.

4. Compartir datos dentro de la organización.

Los ejecutivos reconocen que los datos deben de ser compartidos dentro

(47)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

y coordinados en su administración. Sin embargo, este enunciado no implica una base de datos centralizada. En su lugar es crucial que los datos posean una organización común que elimine la redundancia y asegure la consistencia de los datos, donde ésta deba estar.

5. Contener Costos

Los ejecutivos desean los cuatro puntos anteriores sin escalar los costos de los Sistemas de Información. Los presupuestos de varios dígitos reservados para Sistemas de Información, no son ampliamente aceptados.

Los datos deben proveerse a un costo razonable y accesible.

A los individuos con perfil en cómputo o con experiencia práctica extensa en la utilización de sistemas procesadores de transacciones en organizaciones medianas y grandes, les es más difícil adquirir estas ideas. Sin embargo, muchos

gerentes de nivel medio alto, no tienen experiencia. Actualmente no es posible considerar, que entiendan inmediatamente el significado de la calidad de la

estructura de datos en una organización para esa habilidad de competir en los mercados globales actuales, lo que demanda incrementalmente la demanda de clase mundial de estándares de desempeño.

Las razones por las que los gerentes de nivel medio alto podrían interesarse en este tópico incluyen:

• Mejorar la eficiencia y efectividad del negocio.

(48)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

• Habilitar una rápida respuesta a las necesidades cambiantes del negocio. • Preocuparse acerca del impacto que las estructuras de datos pobres

están teniendo en una organización y un interés en ¿cómo las oportunidades pueden maximizarse y minimizando los riesgos?

Desde la perspectiva de la administración de Sistemas de Información, las metas y los aspectos incluyen:

• Entender que información es estratégica y que información tiene un alto potencial, parecido a tornarse estratégica.

• Crear una estructura de datos estable e integra. • Mejorar la calidad de la información y los sistemas.

Estos dos conjuntos de razones para que los gerentes tomen interés en este

tópico son complementarios. Sin embargo, es muy importante para el personal de Sistemas de Información que considere el tópico desde la perspectiva generalmente de los gerentes de nivel medio alto y no lo considere desde la

perspectiva técnica.

Esto refuerza la noción implícita en otras ideas varias. La importancia crítica del trabajo en conjunto entre el personal de Sistemas de Información y los gerentes de

nivel medio alto, para identificar las oportunidades y acordar en cual es la mejor manera de asignar recursos de Sistemas de Información; En conjunto, la consideración de las estructuras de datos de una organización, siempre resultará

(49)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

arquitectura. Sin embargo, los pasos de la implantación serán determinados por las prioridades del negocio.

Muchas de las organizaciones tienen un gran monto de datos variables dentro de sus sistemas, que frecuentemente no están disponibles para obtener los

valores completos de los datos, debido a que los datos se encuentran pobremente estructurados. Sin embargo, es posible obtener adicionalmente, valor significante adicional, de los datos contenidos en sistemas existentes sin remplazar estos

sistemas.

El Posicionamiento y la Información

El establecimiento de la estrategia de mercado, parte integral del posicionamiento de una empresa en el mercado, se basa en la revisión corporativa

de sus mercados (por línea de producto) y de sus capacidades, fortalezas y debilidades para competir. Las oportunidades y las acciones necesarias para

eliminar las debilidades internas y capitalizar las de la competencia se analizan frente a la información básica de los modelos de posicionamiento, para determinar fuerza e impacto. Establecer una estrategia de mercado implica tomar decisiones

sustentadas en una base amplia con relación a las posiciones que la compañía y sus productos aspiran a alcanzar en el mercado. Cuando sea necesario, esta

estrategia incluirá también las decisiones relacionadas con el desarrollo de nuevos productos.

(50)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

En la actualidad, las decisiones corporativas para el posicionamiento en el mercado pueden tener un alcance novísimo más amplio debido a la globalización, tomando en cuenta factores como la competencia global. Las sociedades

internacionales y el desarrollo de activos internacionales. Para garantizar el

enfoque apropiado, todos los proyectos corporativos deben acceder de inmediato a la estrategia de mercado más actualizada de la compañía y a los planes individuales de mercado para cada producto y/o servicio, esto es a información. En

los niveles más bajos de los proyectos de cambio, este tipo de información debe incluirse con los detalles acerca de lo que la compañía expresa en su publicidad,

lo que está haciendo la competencia y de los cuales son las actitudes de sus clientes.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Reingeniería: Cómo Aplicarla con Éxito en los Negocios]

La etapa más sistemática del posicionamiento es la recopilación de datos. Las

clases de información reunidas por el posicionamiento y utilizadas en los proyectos de cambio, aparecen en la figura 2.1. Este es necesariamente un

proceso detallado que requiere tiempo, en especial cuando las operaciones son muy grandes y antiguas. Sin embargo, el tiempo y el esfuerzo pueden reducirse y el efecto de los datos puede aumentar mediante el empleo de tecnología.

Cualquier sistema computarizado de textos, como el procesador de palabras y los diagramas son mejores que utilizar sólo papel. Una vez que la recopilación de

(51)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

[image:51.612.84.551.119.578.2]

flexibilidad y apoyo con base en computadoras, Sistemas de Información, que permitan la explotación de datos.

Figura 2.3 Datos del Análisis de la Situación

La información incluida en la conformación de una arquitectura de datos, debe dirigirse a cada faceta de la operación. Deberá incluir modelos de flujo de trabajo,

(52)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

organigramas, enunciados de la misión corporativa, modelos de proceso de negocios, política de negocios y reglas establecidas, modelos de funciones (diagramas de relación) y planes corporativos. Esta información contiene las

respuestas a los interrogantes de quien, qué, dónde, cómo y porqué.

La Misión de los Sistemas de Información en la Organización

Desde una perspectiva de Sistemas de Información, la Figura 2.4 compara los factores de éxito mencionados anteriormente a la misión de Sistemas de

Información:

5 factores de éxito listados por los ejecutivos

Misión de Sistemas de Información

a Acceder datos cuando y donde sea a Acceder oportunamente a los datos necesario. necesarios.

Habilidad de adaptación a las

Sistemas flexibles y de fácil necesidades cambiantes del mantenimiento.

negocio.

Datos exactos y consistentes

Integridad y estandarización de datos.

a Compartir datos dentro de la

Integración Datos/Sistemas organización.

a Contener Costos. a Efectividad del costo

(53)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

Estos cinco factores forman la misión de Sistemas de Información en las organizaciones. La planificación de la arquitectura de datos de la empresa, es el primer paso en la vía de logro de esta misión, y es el único tipo de proceso de planeación que a largo plazo puede alcanzar la misma.

Calidad de Datos

Sí uno pudiera utilizar una palabra que describa estos cinco componentes, sería zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA calidad. En otras palabras, proveer calidad a aquellos que la necesitan es la

misión de los Sistemas de Información. Este concepto ha sido objeto de mucha

atención; W. Edwards Deming y otros, han expuesto la longitud en la calidad y productividad del negocio.

Sí aceptamos que la misión de Sistemas de Información es proveer calidad en los datos, entonces los 14 puntos para calidad de Deming, podrían ser utilizados.

La Figura 2.5 interpreta los 14 puntos de Deming, para lograr calidad en los datos.

Un principio importante a notar es que los autores como Deming, Juran y Conway quienes escribieron acerca de calidad, han declarado que la productividad

resulta del enfoque en la calidad, pero la calidad no ocurre a través de perseguir la productividad. Esto es un punto vital porque diversas metodologías de desarrollo

de sistemas y herramientas, tales como C A S E y los productos de AD/Cycle han sido explícitamente aclamados hacia mejorar la productividad del desarrollo de los sistemas. De acuerdo a las enseñanzas de Deming, enfocándonos en la

(54)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

productividad de los sistemas por si sola, no necesariamente resultan en la calidad de datos ni habilita la misión de Sistemas de Información

Los 14 puntos de calidad de 14 puntos de calidad de Datos

Deming

1 Crear una constancia de propósito hacia mejora (misión y plan)

Desarrollar una constancia para la administración de recursos de datos 2 Adoptar la nueva filosofía (no aceptar Administrar los datos como activo,

retrasos, defectos y errores) compromiso de compartir datos e integridad de datos.

3 Eliminar con la dependencia de inspecciones masivas (Requiere evidencia estadística)

4 Utilizar una fuente única

5 Constantemente mejorar la producción del sistema y servicio; encontrar problemas

6 Instituir métodos modernos basados en el entrenamiento del trabajo.

7 Instituir métodos modernos de supervisión.

8 Desaparecer el miedo.

Desarrollar medidas para calidad de datos.

Establecer una estrategia de

migración basada en la creación de datos (Sistemas de datos fuente) Entender el negocio (modelo funcional del negocio, planes del negocio)

Instituir programas de entrenamiento sobre Administración de datos como recurso.

Debe identificarse un líder para Administración de Datos como Recurso; promover el trabajo en equipo; eliminar los cálculos de desempeño a corto plazo.

(55)

NECESIDAD DE UNA ARQUITECTURA DE DATOS

9 Romper las barreras entre departamentos

Desarrollar modelos de negocio, arquitecturas y planes que crucen las fronteras de la organización

10 Eliminar las metas numéricas, Desarrollar estándares y forzar publicidad y axiomas para nuevos mecanismos que aseguren la calidad niveles de productividad sin métodos, de los datos.

11 Eliminar estándares de trabajo que prescriben citas.

12 Promover el orgullo de los trabajadores.

13 Instituir programas vigorosos de educación y entrenamiento.

14 Crear estructuras que empujen los 13 puntos antes mencionados.

Seguir con estándares a través del liderazgo y la responsabilidad para la calidad de los datos (proveer

incentivos de adaptación) Utilizar métodos, técnicas y herramientas para actualizar la posición de las responsabilidades. Equipo con la función o comité de aseguramiento de la calidad. La administración debe

comprometerse a estos principios de calidad de datos (establecer

administración del recurso de datos, reorganización, autorización)

Figura 2.5 Calidad de Datos

La calidad no sucede simplemente, esta debe de ser planeada y diseñada en

los productos de Sistemas de Información, de ahí que debe ser referida

propiamente como planificación para la calidad de datos.zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA [Enterprise Architecture Planning: Developing a Blueprint for data, Applications and Technology]]

Algunas de las ventajas obtenidas de establecer una arquitectura de datos a

nivel empresa son:

• El enfoque es en el uso estratégico de la tecnología para la administración de datos como un activo.

(56)

-NECESIDAD DE UNA ARQUITECTURA DE DATOS

• El uso de un vocabulario estándar, facilita la comunicación y reduce la inconsistencia y redundancia de datos.

• La documentación incrementa el entendimiento del negocio.

• Los modelos pueden ser utilizados para explicar el negocio y asegurar el impacto de los cambios del mismo.

• Las políticas de toma de decisiones pueden ser revisadas. • Considera la integración de sistemas actuales con los nuevos. • Permite un acercamiento comprensivo, objetivo e imparcial.

• En cuanto a costo - beneficio, una solución a largo plazo considera la tasa de retorno.

• Involucra una estrategia de migración factible con logros a corto plazo. • Facilita el asegurar los beneficios e impactos de nuevos sistemas y

software.

• Permite el fácil acoplamiento de cambios dinámicos del negocio, tales como: fusiones, adquisiciones, nuevos productos, líneas de negocio, etc. • La participación de la administración gerencial provee la perspectiva del

negocio, su credibilidad y confidencialidad, además de eliminar el mito del desarrollo de sistemas.

En lo que se refiere a los beneficios a obtener de una planificación de sistemas,

a continuación se presenta una lista de estos:

• Más responsabilidad hacia las necesidades de los clientes. • Reducción de los costos de entrada de datos.

• Incrementa la productividad del personal, que permite incrementar el nivel de negocio y mantiene los costos.

Figure

FIGURA 1.1 DATOS COMPARTIDOS CON MÚLTIPLES SUBRUTINAS
Figura 1.2 Datos
Figura 1.3 Un Programa accediendo un archivo
Figura 1.4 Compartir datos en una base de datos.
+7

Referencias

Documento similar

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)

Sanz (Universidad Carlos III-IUNE): "El papel de las fuentes de datos en los ranking nacionales de universidades".. Reuniones científicas 75 Los días 12 y 13 de noviembre

(Banco de España) Mancebo, Pascual (U. de Alicante) Marco, Mariluz (U. de València) Marhuenda, Francisco (U. de Alicante) Marhuenda, Joaquín (U. de Alicante) Marquerie,