“Tipos de Bases de
Datos”.
Integrantes:
Chambilla Calsinas, Mercedes C.
Yupanqui Pari, Willy Hernán
Tipos de Bases de Datos:
Bases de Datos Heterogéneas (BDH). 1.Introducción
2.Origen
3.Conceptos Básicos
4.Definición de una BDH
5. Definición de Sistemas Manejador de Bases de Datos Federada
7. Niveles de un SGBDF
8. Clasificación
9. Definición de Sistemas manejador de Bases de Datos Distribuidas Heterogéneas
9.1. Ventajas de la BDDH
9.2. Vista unificada de Datos
10. Procesamiento de consulta
11. Mediador del Sistema
12. Sistemas Distribuidos vs. Sistemas Federados
13. Arquitectura
14. Gestión de transacciones
1.Introducción:
Debido a las necesidades
que surgen en las grandes
compañías, diferentes BD
se han ido desarrollando
e implementando para estar
a la altura de las demandas
de los usuarios, éstas BD pueden ser
diseñadas independientemente de la
organización.
Como resultado, la Heterogeneidad de
las BD es inevitable cuando diferentes
tipos de BD coexisten en una organización
que trata de compartir datos entre éstas.
Por lo que muchos investigadores han
enfocado sus esfuerzos en la exploración
de un esquema global que trate de
resolver los problemas de la
Heterogeneidad, la definición de
Protocolos Interoperables y la integración
de las BD.
2.Origen:
En un principio se consideró a Herman Hollerith como el precursor de las Bases de Datos, ya que mecanizó el censo de los Estados Unidos, en 1.890, considerándose así la primera Base de datos significativa computarizada.
3. Conceptos Básicos:
a) Base de Datos Heterogéneas: son un conjunto de BD administradas por diferentes SMBD, la heterogeneidad de éstas se debe a que los datos son de diferentes tipos o formatos.
b) Bases de Datos Distribuidas Heterogéneas:
Se compone de un conjunto de localidades, cada una de las cuales mantiene un SBD local, éstas
pueden procesar transacciones locales (aquellas que se realizan sobre esa localidad).
c) Bases de Datos Federadas: Es una colección de SBD cooperativos, autónomos, y participan en la Federación, permitiendo así, compartir
datos de manera parcial y controlada.
Pero, de acuerdo a lo anterior, ¿Qué son las Federaciones?
Es una BD que se relaciona con todas sus BD componentes y éstas, a su vez, son
Ejemplo: Un ejemplo de la vida real, son los Estados Unidos.
4. Definición de una BDH
Se produce la Interoperabilidad entre las distintas bases de datos exitentes.
Según esto, ¿Qué es la Interoperabilidad entre las BD?, Es el acceso a varias BD con SMBD similares o diferentes.
Se puede accesar a la información por medio de una Interfaz única.
Permite la implementación y el acceso a
Sistemas de Manejo de Información Multiples, Autónomos y Distribuidos.
5. Definición de Sistema Manejador de Bases de Datos Federada:
Es un SBD que supone un nivel de transparencia al usuario.
Se percibe como una BD única.
Esta formada por BD Heterogéneas, llamados Componentes.
Cada BD que la forma, mantiene su autonomía.
En cuanto a las consultas, recibe una única consulta que descompone en consultas
El SGBDF no contiene datos, solo accesa a los datos almacenados en la BD componente.
Una BDF no es una BD única distribuida.
Pueden usar diferentes esquemas de software.
La diferencia en software es un problema mayor al momento de la transacción de procesamiento.
Las federaciones se forman y desaparecen.
No hay un esquema conceptual único.
Se dice que las SBD se federan para dar lugar a las SGBF.
6. Autonomía de una BD:
Diseño: modelo, lenguaje e implementación.
Comunicación: Como y Cuando se responde a otros sistemas.
Ejecución: Criterio a seguir para la toma de desiciones.
Asociación: decisión de Qué datos se comparten y a Quién.
7. Niveles de un SGBDF:
a) Nivel Componente: son las Bases de Datos preexistentes.
b) Nivel Federado: conjunto de BD que interoperan.
8. Clasificación: Se pueden clasificar en:
a) Débilmente Acoplados: los usuarios deben tratar expílcitamente con las BD, es decir,
cuando la responsabilidad de crear y mantener la Federación recae sobre el usuario y no hay control por parte del sistema Federado y sus administradores.
b) Fuertemente Acoplados: la Federación y sus administradores controlan el acceso y
mantienen el sistema, es decir, el administrador tiene la responsabilidad de crear y mantener la
Federación y el control de acceso de los sistemas de Bases de Datos Componentes. Se pueden clasificar , a su vez ,en:
1. Federación sencilla: permite crear y
manejar un sólo esquema federado. 2. Federación Múltiple: permite la creación y
9. Definición de Sistemas manejador de Bases de Datos Distribuidas Heterogéneas
Muchas aplicaciones de BD requieren datos desde una variedad de BD preexistentes
localizadas en una colección heterogénea de plataformas de hardware y software.
Los Modelos de datos pueden diferir(Modelo jerarquico, relacional, etc).
El control de concurrencia puede ser basado en varias técnicas, es decir el control del bloqueo de datos.
Se crea la ilusión de integración lógica de la BD sin una integración física de la misma.
Los detalles del nivel del sistema casi
ciertamente son totalmente incompatibles.
9.1. Ventajas de la BDDH:
Autonomía local y control administrativo.
Permite el uso de propósitos especiales de SGBD.
Preservación de la inversión en hardware y software y aplicaciones existentes.
9.2. Vista unificada de datos:
Acuerdo sobre un modelo de datos en común (típicamente el modelo Relacional).
Acuerdo sobre un modelo conceptual en
común(diferentes nombres para los mismos atributos).
Acuerdo con una simple representación de datos compartidos.
Acuerdo sobre unidades de medida (longitudes).
10. Procesamiento de consulta
Varios casos en el procesamiento de consultas.
Los Wrappers se deben encargar de traducir los datos de un esquema global a un esquema
local.
Capacidades limitadas de consultas, es decir, que solo se pueden consultar los datos que no se encuentran restringidos.
Movilizacion de información duplicada cuando los sitios se encuentran solapados de
información.
11. Mediador del Sistema:
Son sistemas que integran múltiples fuentes de datos heterogéneas para proveer una vista
global integrada y facilidades de consulta sobre dicha vista.
Anteriormente se mencionó el término de
Wrappers, los cuales tienen como función ser Mediadores del Sistema.
Éstos se encargan de traducir los datos que se encuentran en una BD que posee un
12.Sistemas Distribuidos vs. Sistemas Federados
a) Semejanzas:
Los datos están en diversas localizaciones.
Las instalaciones están interconectadas.
Ambos tienen dos niveles: global-local y federación-componente.
Reciben peticiones que se resuelven en una única consulta.
b) Diferencias: 1) Diseño:
SGBDD: se crea una única BD y se decide cómo distribuirla en las instalaciones (por framentación o replicación).
¿Qué es fragmentación?
Es la division de una relación en partes o en
fragmentos para propósitos de almacenamiento físico.
Ejemplo de Fragmentación:
N_Emp N_Dep Sueldo
E1 Dx 40 E2 Dy 45 E3 Dz 50 E4 Dw 63 E1 Dx 40 E2 Dy 45 E3 Dz 50 E4 Dw 63
¿Qué es replicación?
Un sistema maneja replicas de sus datos, si una relación dada, se puede representar en el nivel físico mediante varias copias o réplicas almacenadas en muchos sitios distintos.
SGBDF: las Bases de Datos Componentes ya existen y se negocian cómo se agrupan en
2) Niveles:
SGBDD: global y local.
SGBDF:federado y componente. 3) Autonomía:
SGBDD: los datos de cada instalación carecen de autonomía, cada SGBD local obedece al
SGBDF: cada SGBD componente desconoce al SGBDF, la administración es propia de cada
componente.
4) Transparencia:
SGBDD: todo usuario tiene imagen de BD única. No percibe como se ha distribuido.
SGBDF: ciertos usuarios perciben la BD como única, y otros continuan accesando a las BD componentes desconociendo la Federación.
13.Arquitectura:
Existe una arquitectura de software y una de esquema, ésta última debe superar las
heterogeneidades sintácticas y semánticas de las BD componentes.
¿Qué es Heterogeneidad Sintáctica?
Es la Heterogeneidad que se produce por la autonomía de los componentes de la BD y por laa diferencias en sus diseños.
¿Qué Heterogeneidad Semántica? Es la que se da por las diferentes concepciones que se tienen de los
elementos por parte de las diferentes BD.
Se distinguen tres dimensiones que debe cumplir un SGBDF:
1) Autonomía.
2) Heterogeneidad.
14. Gestión de transacciones:
Se distinguen dos tipos:
1) Los que realizan los usuarios de la Federación contra SGBDF.
2) Los que realizan los usuarios de las BD componentes.
Los problemas que surgen son:
1) Control de Concurrencia: el SGBDF no conoce la transacciones a nivel de componentes y los SGBD componentes no siempre pueden
distinguir entre las transacciones propias o externas.
2) Heterogeneidad: cada SGBD mantiene su autonomía de ejecución.
3) La Autonomía es incompatible con la
atomicidad (los agentes involucrados en la
transacción deben comprometerse al unísono o retroceder al unísono).
15. Aplicación de un SGBDF: IBM
Características de aportación IBM: 1) Transparencia:
a) Localización: procedencia de los datos. b) Invocación: lenguajes o interfaces de los
componentes.
c) Dialecto: si es SQL y cuál reconoce el componente.
d) Independencia Física: Cómo se almacenan los datos.
2) Heterogeneidad:
a) Distintos hardware y software en el que se
ejecutan los componentes, distintos protocolos de red.
b) Distintos lenguajes de consulta. c) Distintos errores.
3) Funcionabilidad:
a) Se ofrece al usuario lo mejor del conjunto de datos federados y de las funciones que cada uno tiene por separado.
b) Si una BD tiene un tipo de datos y otra BD contiene otro tipo, entonces el usuario puede
querer ordenar todos los datos y esta operación la realizará la BDF .
4) Escalabilidad:
a) Presencia de Wrappers(envoltura).
b) Una vez definido el Wrapper, sentencias
simples de un DDL permite la creacion de los datos.
c) ANSI SQL/MED define el protocolo
utilizadospor los servidores federados para conectar con origenes de datos externos.
d) Cualquier Wrapper escrito en SQL/MED puede ser utilizado por BDF de IBM.
5) Autonomía:
a) El empleo de los Wrappers no precisa la
instalación de software en la máquina de origen de los datos.
6) Optimización:
a) En un SGBDF el optimizador debe decidir si las
operaciones que implica una consulta las realiza él o las que ofrecen las SBD componentes.
b) Determina en que orden se relizarán las
operaciones y qué métodos se emplean en la partición de la consulta principal.
c) El optimizador debe conocer qué hacer con los
SBD componentes y el costo asociado a cada una de sus funciones.
d) El servidor Federado debe reconocer y aprovechar las ventajas que ofrece la ejecución de consultas en los componentes.
Gracias...
Preguntas?
Referencias Bibliográficas
Guillermo Álvarez Carrión; Integración de esquemas en bases de datos heterogéneas fuertemente acopladas,
http://catarina.udlap.mx/u_dl_a/tales/documentos/msp/alvarez_c_g/i ndice.html
Explotación de bases de datos heterogéneas mediante su integración parcial,
http://www.gelbukh.com/enc2006/Trabajos/15_Alejandro%20Botella .pdf
BDDH Bases de Datos Distribuidas Heterogeneaspdf.PDF,
http://mit.ocw.universia.net/15.565J/NR/rdonlyres/Sloan-School-of- Management/15-565JIntegrating-eSystems---Global-Information-