Tema 1:
Sistemas de Gesti´on de Bases de Datos Andr´es Cord´on Franco
Departamento de
Ciencias de la Computaci´on e Inteligencia Artificial UNIVERSIDAD DE SEVILLA
Bases de Datos Curso 2005–06
Contenido:
1.1 Definiciones: dato, informaci´on, Base de Datos(BD), Sistemas de Gesti´on de bases de Datos(SGBD)
1.2 Sistemas de ficheros versus Bases de Datos 1.3 Clasificaci´on y ventajas de las BD
1.4 (Breve) Historia de las BD y los SGBD 1.5 Modelos de datos: Jer´arquico, en Red y
Relacional
Problema b´asico:
Dise˜nar sistemas de recopilaci´on de datos que proporcionen a los usuarios informaci´on fidedigna sobre el dominio del mundo real que representan, con el objetivo de realizar acciones m´as per-tinentes que las que se realizar´ıan sin dicha informaci´on
• Datos: valores almacenados que represen-tan hechos o realidades del mundo real.
• Informaci´on: significado de los datos.
• Un sitema de informaci´on es una colecci´on de datos debidamente recopilados y estruc-turados, que proporcionan informaci´on so-bre una parcela de la realidad.
Sistemas de ficheros(I):
• Los sistemas de informaci´on existen desde las primeras civilizaciones (censo romano).
• Revoluci´on tecnol´ogica: Desarrollo de la Inform´atica.
• Primeros sistemas de informaci´on informa-tizados: sitemas de ficheros.
Sistemas de ficheros(SF): conjunto de programas inform´aticos que permiten al usuario almacenar, consultar y modificar datos. Dichos datos se almacenan en ficheros dise˜nados para una determinada aplicaci´on. Cada programa define y maneja sus propios datos.
Sistemas de ficheros(II): Inconvenientes de los SF:
• Separaci´on y aislamiento de datos.
• Duplicaci´on de datos (se desperdicia ca-pacidad de almacenamiento y se puede perder la coherencia de datos).
• Dependencia de los datos (la estructura f´ısica de los datos se encuentra codificada en cada programa de aplicaci´on, dificultad para realizar cambios en dicha estructura).
• Formatos de ficheros incompatibles (la es-tructura de cada fichero es completamente dependiente de cada aplicaci´on particular).
• Consultas fijas (los SF dependen del pro-gramador de las aplicaciones, poco ade-cuado para recuperar posteriormente la in-formaci´on seg´un criterios cambiantes).
Definiciones de BD y SGBD:
Base de Datos(BD): conjunto de datos que modelan hechos y objetos de una parcela de la realidad y sirven de soporte a una apli-caci´on inform´atica. Dichos datos deben estar almacenados f´ısicamente en forma de ficheros inform´aticos y deben estar relacionados me-diante una determinada estructura l´ogica.
Propiedad esencial: Independencia de datos (separaci´on entre los datos y las aplicaciones que los manejan).
Sistema de gesti´on de Bases de Datos (SGBD): aplicaci´on inform´atica que permite a los usuarios definir, crear, mantener y con-sultar una base de datos; as´ı como propor-ciona acceso controlado a la misma.
Ejemplos de SGBD: Access de Microsoft,
dBaseIV y Paradox de Borland, ORACLE de Oracle Corporation, DB2 de IBM, ...
Funciones de un SGBD:
• Crear una base de datos y especificar su estructura, usando para ello un lenguaje es-pecializado llamado lenguaje de definici´on de datos (DDL).
• Introducir, eliminar, consultar y modificar datos, usando un lenguaje especializado lla-mado lenguaje de manipulaci´on de datos (DML).
• Permitir el almacenamiento de grandes can-tidades de datos durante largos periodos de tiempo, manteni´endolos seguros de ac-cidentes o uso no autorizado.
• Controlar el acceso a los datos de muchos usuarios a la vez, impidiendo que el acceso simult´aneo introduzca incoherencias.
Ventajas de los SGBD(I):
(A) Ventajas por la independencia de datos.
• Control sobre la redundancia de datos: los SF almacenan varias copias de los mismos datos en ficheros distintos.
• Consistencia de datos: eliminando las re-dundancias de almacenamiento se reduce el riesgo de inconsistencias.
• Compartici´on de datos: En los SGDB la base de datos pertenece a la empresa y puede ser por tanto compartida por todos los usuarios autorizados.
• Mayor eficiencia en la recogida, validaci´on y entrada de datos: al no existir redundan-cias, los datos se recogen y se validan una s´ola vez.
• Facilidad para mantener los est´andares es-tablecidos.
Ventajas de los SGBD(II): (B) Ventajas por una interfaz com´un.
• Mejora en la seguridad: los SGBD estable-cen distintas claves para el personal auto-rizado y les restringe las operaciones que pueden realizar (administrador de la BD, usuario final,...).
• Mejora de accesibilidad de datos: los SGBD incorporan lenguajes est´andares de colsul-tas (el usuario realiza consultas sin necesi-dad de acudir al programador).
• Mejora en el mantenimiento de la aplicaci´on: los SGBD separan las descripci´on de los datos y las aplicaciones, lo que facilita el mantenimiento y las futuras modificaciones de las aplicaciones.
Historia de las BD y los SGBD(I): (A) Predecesores: Sistemas de ficheros (B) Primera Generaci´on (1960–70):
• Modelo de datos jer´arquico (basados en relaciones padre–hijos).
– (1968) Sistema IMS [=Information Man-agement System] de IBM (derivado del programa Apollo de la NASA).
– SGBD jer´arquicos todav´ıa se usan en hospitales e instituciones p´ublicas para gestionar la contabilidad (menos frecuen-tes tras el efecto 2000).
• Modelo de datos en red o CODASYL (basados en un grafo de relaciones entre los datos)
– Sistema propuesto por el grupo CODA-SYL (COnference on DAta SYstems Lan-guages).
Historia de las BD y los SGBD(II): (C) Segunda generaci´on (1970–80):
• Modelo de Datos Relacional (Edgar F. Codd, 1970). Datos organizados como tablas relacionadas.
• Dise˜no de BD: Modelo Entidad–Relaci´on (P. Chen, 1976).
• (1974)Ingress de la Universidad de Califor-nia en Berkeley.
• Dos grandes desarrollos:
– SQL(Structured Query Language) de IBM – ORACLE de Oracle Corporation.
• Sistemas relacionales para microordenadores: dBaseIV de Borland, Access de Microsoft. (D) Tercera generaci´on (1990-??):
• Modelo de datos orientado a objetos.
Ideas sobre BD relacionales(I):
Informalmente, una BD relacional es un con-junto de tablas que almacenen datos rela-cionadas entre s´ı. Las tablas se organizan en registros y campos.
Tabla AUTOR (3 registros de 4 campos)
DNI Nombre Direcci´on Fecha 44345789 Ana P´erez C/Sol, 17 19/5/1960 40876100 Jos´e Ru´ız C/Luna,1 1/1/1972 56123009 Luis G´omez C/Feria,2 5/5/1961 Registro: cada una de la filas de la tabla. Un registro recoge la informaci´on de un dato.
Campo: cada una de las partes en las que se desglosa la informaci´on de cada registro.
Ideas sobre BD relacionales(II):
Tablas planas: una ´unica tabla recoge todos los datos.
Tablas relacionales: datos organizados en dis-tintas tablas con campos con contenido com´un.
Tabla AUTOR (3 registros de 4 campos) DNI Nombre Direcci´on Fecha 44345789 Ana P´erez C/Sol, 17 19/5/1960 40876100 Jos´e Ru´ız C/Luna,1 1/1/1972 56123009 Luis G´omez C/Feria,2 5/5/1961
Tabla ESCRIBE (3 registros de 3 campos) ISBN Libro Autor A˜no
84-8088-004-9 44345789 2003 44-9876-123-7 44345789 1999 34-5678-321-5 56123009 1989
Nota: El campo Autor de la tabla ESCRIBE y el campo DNI de la tabla AUTOR permiten enlazar ambas tablas.
Bibliograf´ıa:
• Concepci´on y dise˜no de bases de datos, Adoraci´on de Miguel, Mario Piattini, RA– MA Editorial (1993)
• La disciplina de los Sistemas de Bases de Datos. Historia, Situaci´on Actual y Perspectivas, Jos´e Hern´andez Orallo, Universidad Polit´ecnica de Valencia (2002)
• Apuntes de Ficheros y Bases de Datos, Mercedes Marqu´es, Universidad Jaume I en Castell´on (2001)