• No se han encontrado resultados

BASE DE DATOS Introducción

N/A
N/A
Protected

Academic year: 2021

Share "BASE DE DATOS Introducción"

Copied!
48
0
0

Texto completo

(1)

B

ASE DE

D

ATOS

Introducción

(2)
(3)

¿D

ATO O

I

NFORMACIÓN

?

3 x$85

(4)

¿D

ATO O

I

NFORMACIÓN

?

Teniendo

en

cuenta

lo

visto

anteriormente

¿Cómo conviene pagar?

¿Compraremos

alguno

de

los

productos?

(5)

¿D

ATO O

I

NFORMACIÓN

?

DATO

 Es cualquier hecho que ocurre en el universo y que tiene

una representación almacenable.

 Es un elemento aislado, recabado para un cierto fin, pero

que no ha pasado por un proceso que lo interrelacione con otros de manera funcional para el fin previsto.

INFORMACION

 la interpretación de un conjunto de datos referentes a un

tema, también es considerada un bien valioso, y su importancia varía dependiendo de su uso, propósito y contexto.

 se trata del conjunto de datos, añadidos, procesados y

relacionados, de manera que pueden dar pauta a la correcta toma de decisiones según el fin previsto.

(6)

D

IFERENCIAS ENTRE

P

LANILLAS DE

C

ÁLCULO Y

B

ASES DE

D

ATOS

Propósito

La diferencia más importante es el propósito de cada software. En los programas de bases de datos se interrelacionan tablas y su contenido, mientras que las hojas de cálculos no.

Datos relacionados

Los gestores de bases de datos son multiusuario, al contrario de las planillas de cálculo. Además de poder manejar a la vez miles de registros vinculados a través de varias tablas.

Tipo de consultas

Los gestores de bases de datos están diseñados crear consultas calculadas, haciendo vínculos basados a través de un "asistente" o programado por el usuario. Las planillas de cálculo no tienen esa capacidad aunque pueden crear tablas, gráficos y tablas dinámicas.

Cálculos y Gráficos

Las planillas de cálculo son más intuitivas, y mejores para cálculos estadísticos o de carácter general. Además de generar gráficos con sencillez.

(7)

C

UANDO UTILIZAR

B

ASES DE DATOS

 Se necesite una base de datos relacional (varias tablas) para

almacenar los datos.

 Pueda necesitar agregar más tablas a un conjunto de datos

no relacional en el futuro.

 Almacene una gran cantidad de datos (miles de entradas).

 Por ejemplo, si trabaja en una compañía grande y necesita almacenar información de personal.

 Almacene datos que en su mayor parte son de tipo texto.

 Necesite mantener conectividad constante con una base de

datos externa de gran tamaño, como una creada mediante SQL Server.

 Desee ejecutar consultas complejas.

 Necesite que muchos usuarios trabajen en la base de datos a

(8)

C

UANDO UTILIZAR

P

LANILLAS DE

C

ÁLCULO

 Necesite una vista simple o no relacional de los datos (es

decir, cuando no necesite una base de datos relacional con varias tablas).

 Especialmente cuando los datos son en su mayoría

numéricos,

 por ejemplo si desea conservar un presupuesto de un año concreto.

 Desee ejecutar principalmente cálculos y comparaciones

estadísticas de los datos,

 por ejemplo si desea mostrar un análisis de costos y beneficios en el presupuesto de la compañía.

 Sepa que el conjunto de datos tiene un tamaño que permite

(9)

Las bases de datos están presentes en las acciones

que realizamos día a día

 Al sacar dinero del banco, pagar un café o ir al supermercado.

 Al comprar entradas para el cine, reservar un hotel o un vuelo.

 Al realizar una llamada o usar el Whatsapp.

 Al visualizar información en el teletexto.

 Al leer el marca, consultar una crítica de cine...

(10)

Los anteriores serían aplicaciones de bases de datos

tradicionales, almacenando información textual o numérica.

Otros sistemas almacenan muy diversos tipos de información

:

Bases de datos multimedia (fotos, vídeos, audios).

Sistemas de información geográfica (GIS)

Mapas,

información climática o de satélite.

Data warehouses y OLAP

Información de grandes

volúmenes

de

datos

para

toma

de

decisiones

empresariales.

Tiempo real y bases de datos activas, para control

industrial. Por ejemplo, sistemas SCADA en el CERN.

(11)

E

L PROBLEMA QUE SE NOS PLANTEA

ES

:

Diseñar sistemas para almacenar y gestionar datos

que proporcionen a los usuarios información de

interés

sobre

un

dominio

determinado,

cuyo

análisis posterior permita sacar conclusiones y

repercuta en una toma de decisiones mejor

informada.

(12)

D

EFINICIÓN

El término de bases de datos fue escuchado por

primera vez en 1963, en un simposio celebrado en

California, USA.

Una base de datos se puede definir como un

conjunto

de

información

relacionada

que

se

encuentra agrupada ó estructurada.

Desde el punto de vista informático, es un sistema

formado por un conjunto de datos almacenados en

discos que permiten el acceso directo a ellos y un

conjunto

de

programas

que

manipulen

ese

conjunto de datos.

(13)

G

ESTORES DE

B

ASES DE

D

ATOS

MySQL

Microsoft Access

Oracle

PostgreSQL

Paradox

DB2

(14)

P

ROPIEDADES

Están estructurados independientemente de las

aplicaciones y del soporte de almacenamiento que

los contiene.

Presentan la menor redundancia posible.

Son

compartidos

por

varios

usuarios

y/o

(15)

V

ENTAJAS DE SU

U

TILIZACIÓN

Facilidad de manejo de grandes volúmenes de

información.

Independencia

en

el

tratamiento

de

la

información.

Seguridad de la información.

No duplicidad de la información.

Mejora la metodología de trabajo en una

organización.

(16)

C

OMPONENTES DE UNA

B

ASE DE

D

ATOS

Tablas

es donde se guardan los datos recogidos por el

programa.

Su estructura general se asemeja a una Hoja de cálculo,

se representan gráficamente como una estructura

rectangular formada por filas y columnas.

(17)

C

OMPONENTES DE UNA

B

ASE DE

D

ATOS

Cada columna o atributo

almacena información sobre

una propiedad determinada de la tabla (nombre, DNI,

apellidos, edad).

Es una pieza única de información,

Cada una de las características que definen de los

objetos que componen la tabla

(18)

C

OMPONENTES DE UNA

B

ASE DE

D

ATOS

Cada fila o tupla

posee una

ocurrencia o registro

(ejemplar de la instancia o relación representada por

la Tabla),

Es un sistema completo de campos,

Sería un objeto de la tabla.

(19)

C

OMPONENTES DE UNA

B

ASE DE

D

ATOS

Claves

: son referencias que se utilizan para identificar los

objetos de forma única en todas las posibles filas de una

tabla.

clave candidata: Conjunto de atributos de una tabla que

identifican unívocamente cada tupla de la tabla.

clave primaria: Clave candidata que se escoge como

identificador de las tuplas.

clave alternativa: Cualquier clave candidata que no sea

primaria

clave externa o secundaria: Atributo de una tabla

relacionado con una clave de otra tabla.

(20)

C

OMPONENTES DE UNA

B

ASE DE

D

ATOS

Archivo

Es

una

colección

de

registros

almacenados

siguiendo una estructura homogénea.

(21)

C

OMPONENTES DE UNA

B

ASE DE

D

ATOS

Relaciones

Son

asociaciones

establecidas

entre

campos comunes de

dos tablas, con la

que

se

puede

combinar

la

información

de

varias tablas.

(22)

C

LASIFICACIÓN DE LAS

B

ASES DE

D

ATOS

Bases de datos Jerárquicas

 Los datos de un determinado registro se almacenan en diferentes

niveles.

Al diseñar esta estructura deben tenerse en cuenta los diferentes

accesos que van a necesitar los usuarios para consultar la información que contiene almacenada.

 Las estructuras jerárquicas fueron usadas extensamente en los

primeros sistemas de gestión de datos .

 Esta estructura permite un 1:N en una relación entre dos tipos de

datos.

En la relación Padre-hijo: El hijo solo puede tener un padre pero un padre puede tener múltiples hijos.

(23)

C

LASIFICACIÓN DE LAS

B

ASES DE

D

ATOS

Bases de datos Jerárquicas

Ventaja es la rapidez en las consultas de información ya que

la propia estructura piramidal de los datos permite un rápido

acceso a ella.

Desventajas:

Son muy complicadas las posteriores modificaciones, así

como el mantenimiento de la base de datos.

El acceso a la información también presenta problemas, ya

que sólo se ven los registros situados en los niveles

superiores.

Su

inhabilidad

de

representar

manera

eficiente

la

(24)

C

LASIFICACIÓN DE LAS

B

ASES DE

D

ATOS

Bases de datos en Red

Surgieron como un intento de solucionar las rigideces

que ocasionaban las bases de datos jerárquicas.

La información se almacena también en diferentes

niveles pero tiene la ventaja que se puede acceder a

datos situados en el mismo nivel.

(25)

C

LASIFICACIÓN DE LAS

B

ASES DE

D

ATOS

Bases de datos en Red

 Se organizan los en registros y conjuntos.

 Los registros contienen campos (que puede ser organizado

jerárquicamente, como en el lenguaje COBOL).

 Un registro puede ser un propietario en cualquier número de

conjuntos, y un miembro en cualquier número de conjuntos.

 El modelo de red es capaz de representar la redundancia en

datos de una manera más eficiente que en el modelo jerárquico.

Ventaja de este modelo es que los accesos a la información son

más flexibles en comparación con las bases de datos jerárquicas.

Desventajas la velocidad de acceso a la información es más

lenta y aumenta la complejidad de diseño de la estructura de información almacenada en la base de datos.

(26)

C

LASIFICACIÓN DE LAS

B

ASES DE

D

ATOS

Bases de datos Relacional

 Los datos se estructuran en una o varias tablas donde relacionan uno

o varios conjuntos de datos.

Las tablas se pueden modificar fácilmente, buscando la mejor manera

de obtener una integridad total de la información.

Las ventajas frente a las anteriores:

 La rapidez y facilidad con la que permite transformar el modelo de

datos,

La sencillez de la estructura físicaLa posibilidad de adaptación.

 Garantiza herramientas para evitar la duplicidad de registros, a través de campos claves o llaves.

 Garantiza la integridad referencial: Así al eliminar un registro elimina todos los registros relacionados dependientes.

(27)

C

LASIFICACIÓN DE LAS

B

ASES DE

D

ATOS

(28)

C

LASIFICACIÓN DE LAS

B

ASES DE

D

ATOS

Bases de datos Documentales

Almacenan información en forma de texto.

La estructura lógica es muy complicada de diseñar, puesto

que los diferentes documentos contenidos en la base de datos están almacenados en registros de longitud variable.

Los accesos a la información también presentan problemas

de diseño, puesto que los documentos han de tratarse como cadenas de caracteres, debiendo buscarse el término deseado a través de todo el texto almacenado.

 Para agilizar y mejorar el proceso de búsqueda a lo largo de los

diferentes textos que componen la base de datos se deben seguir diversas estrategias (índices, búsquedas complejas, etc.) que hacen más lenta la recuperación de la información deseada por los usuarios.

(29)

C

LASIFICACIÓN DE LAS

B

ASES DE

D

ATOS

Bases de datos Semánticas u Orientadas a Objetos

 No existe una caracterización universal aceptada del término

“orientación a objetos”, por lo que cualquier intento de definir el concepto es necesariamente una visión particular.

 Se considera que son tres las características esenciales que

identifican este concepto.

Tipo Abstracto de Dato (TAD).  Herencia.

(30)

G

ESTOR DE

B

ASE DE

D

ATOS

Es un software que permite introducir, organizar y recuperar la información de las bases de datos.

Es un conjunto de programas que se encargan de manejar la creación y todos los accesos a las bases de datos, es un software muy especifico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan.

(31)

G

ESTOR DE

B

ASE DE

D

ATOS

DDL (Data Definition language): Lenguaje de Definición de Datos.

 Identifica las descripciones de

los elementos de los esquemas y las almacena.

DML (Data Manipulation language): Lenguaje de Manipulación de Datos.

 Permite la manipulación de las

operaciones de Inserción, Eliminación y Modificación.

(32)

G

ESTOR DE

B

ASE DE

D

ATOS

Objetivos:

1) Evitar la redundancia. 2) Evitar la inconsistencia. 3) Datos Compartidos.

4) Normas para los datos. 5) Seguridad de datos.

6) Conservar la Integridad.

7) Evitar el aislamiento de los datos. 8) Anomalías del acceso concurrente. 9) Equilibrio de Requerimientos.

(33)

G

ESTOR DE

B

ASE DE

D

ATOS

Ventajas por la independencia de datos:

Control sobre la redundancia de datos: se almacenan una sola

copia de los datos.

 Ahorramos así espacio.

Coherencia de datos: eliminando las redundancias de

almacenamiento se reduce el riesgo de incoherencias.

Datos compartidos: la base de datos puede ser compartida por

todos los usuarios autorizados.

 Mayor eficacia en la recogida, validación y entrada de datos. Estos procesos se realizan en la base de datos, de manera uniforme entre diversas aplicaciones cliente que accedan a la base de datos.

 Al no existir redundancias, los datos se recogen y se validan una sola vez.

Facilidad para mantener los estándares establecidos, al tener

(34)

G

ESTOR DE

B

ASE DE

D

ATOS

Ventajas por una interfaz común:

Mejora en la seguridad: se establecen distintas claves para el

personal autorizado y les restringe las operaciones que pueden realizar (administrador de la BD, usuario avanzado, usuario final).

Mejora de accesibilidad de datos: se incorporan lenguajes

estándares de consultas (el usuario realiza consultas sin necesidad de acudir al programador).

Mejora en el mantenimiento de la aplicación: separan la

descripción de los datos y las aplicaciones, lo que facilita el mantenimiento y las futuras modificaciones de las aplicaciones.

(35)

G

ESTOR DE

B

ASE DE

D

ATOS

Inconvenientes:

Complejidad: Es preciso conocer muy bien su funcionalidad

para obtener un rendimiento óptimo.

Tamaño: Requieren de una gran cantidad de espacio en disco

y en memoria para trabajar de forma eficaz.

Coste económico: Varía dependiendo del entorno y de la

funcionalidad que ofrece (para computadoras personales o sistemas multiusuario).

 En el caso de grandes sistemas empresariales sí se trata de un coste sustancial, pero para bases de datos pequeñas y medianas se dispone de sistemas open source de gran nivel y funcionalidad (PostgreSQL, MySQL).

 También se dispone de servidores web, capaces de alojar bases de datos, a muy diferentes escalas.

(36)

G

ESTOR DE

B

ASE DE

D

ATOS

Funciones:

Integridad y seguridad de los

datos.

Gestión de la información.

Definición de vistas parciales

de los datos para distintos

usuarios.

Independencia

de

las

aplicaciones respecto a la

representación física de los

datos.

Descripción unificada de los

(37)

G

ESTOR DE

B

ASE DE

D

ATOS

(38)

G

ESTOR DE

B

ASE DE

D

ATOS

(39)

G

ESTOR DE

B

ASE DE

D

ATOS

(40)

G

ESTOR DE

B

ASE DE

D

ATOS

Características

:

Permitir crear y gestionar base de datos de forma fácil,

cómoda y rápida.

Ofrecer una gran flexibilidad.

Ofrecer un ambiente agradable dado por su interfaz gráfica.

Consistir, de cara al usuario, en un conjunto de tablas entre

las que se establecen relaciones.

Permitir el almacenamiento, manipulación y consulta de

datos de una base de datos organizada en varios archivos.

Permitir consultas complejas,

Almacenar los datos de forma eficiente aunque oculta para el

usuario.

Acceder al mismo tiempo múltiples usuarios, realizando

(41)

G

ESTOR DE

B

ASE DE

D

ATOS

Características

:

Abstracción de datos: Codificar en formato digital ciertos

(42)

G

ESTOR DE

B

ASE DE

D

ATOS

Niveles de abstracción de datos

Nivel físico:

describe cómo se almacenan realmente los

datos.

Nivel lógico:

describe qué datos se almacenan en la base de

datos y qué relaciones existen entre esos datos.

La base de datos completa se describe así en términos de un

número pequeño de estructuras relativamente simples.

Nivel de vistas:

describe sólo parte de la base de datos.

Debido a la variedad de información almacenada en una gran

base de datos.

Muchos

usuarios

del

sistema

no

necesitan

toda

esta

información. Para que su interacción con el sistema se

simplifique, se define la abstracción del nivel de vistas.

El sistema proporciona muchas vistas para la misma base de

datos, dependiendo de las necesidades del usuario.

(43)

P

OSTGRE

SQL

 Es un gestor de bases de datos de código abierto,

 Brinda un control de concurrencia multi-versión que permite

trabajar con grandes volúmenes de datos;

 Soporta gran parte de la sintaxis SQL y cuenta con un extenso

grupo de enlaces con lenguajes de programación.

 Posee una integridad referencial e interfaces nativas para

lenguajes como ODBC, JDBC, C, C++, PHP, PERL, TCL, ECPG; PYTHON y RUBY.

 Funciona en todos los sistemas operativos Linux, UNIX (AIX,

BSD, HP-UX, SGI IRIX, Mac OS X, Solaris, Tru64), y Windows.

 Cuenta con una serie de características, como son la

herencia de tablas (clases) y, un conjunto amplio de tipos de datos que incluyen arreglos, Binary Large Object Block (BLOB), tipos geométricos y direcciones de red.

 Incluye también, el procesamiento de transacciones,

(44)

POSTGIS. U

NA EXTENSIÓN

GEOESPACIAL PARA

POSTGRESQL

 Permite el almacenamiento y la manipulación de objetos

geométricos vectoriales en bases de datos; incluyendo además, el Sistema de Referencia Espacial; lo que la convierte en una base de datos espacial para su utilización en Sistema de Información Geográfica.

 Está publicado bajo licencia GNU/GPL y ha sido certificado,

en 2006 por el Open Geospatial Consortium (OGC), lo que garantiza la interoperabilidad con otros sistemas.

 La especificación OpenGis define dos formas estándares

de expresar los objetos espaciales;

 Formatos en Modo Texto (Well-Known Text -WKT)

 y en Modo Binario(Well-Known Binary-WKB).

 Ambos incluyen la información sobre el tipo de objeto y las

(45)

B

ASES DE DATOS GEOGRÁFICAS

Un sistema de información geográfica (SIG) es un “conjunto de

programas, equipamientos, metodologías, datos y personas (usuarios), perfectamente integrado, de manera que hace posible la recolección de datos, almacenamiento, procesamiento y análisis de datos georreferenciados, así como la producción de información derivada de su aplicación”.

 Cuando se habla de datos georreferenciados, se trata de datos

referidos a una posición con respecto a un sistema de coordenadas terrestres.

 La tecnología de los SIG busca articular las bases de datos gráficas

con las bases de datos alfanuméricas que representan los diferentes rasgos del territorio, tales como caminos, cursos de agua, asentamientos poblacionales, actividades económicas, etc.

 Los SIG modelan la realidad territorial para convertirla en datos

geográficos que son manipulados en un entorno informatizado. Para ello utilizan los modelos de representación raster y vectorial.

(46)

B

ASES DE DATOS GEOGRÁFICAS

 Los Sistemas de Información Geográfica, sobre todo los

vectoriales, basan su almacenamiento de datos en estructuras de bases de datos de tipo relacional.

Las bases de datos son las encargadas en los SIG de almacenar

los atributos de los objetos cartográficos representados y deben combinarse con las bases de datos que almacenan la topología y geometría de dichos objetos.

 Esta complejidad de almacenamiento de información es lo que

hace considerar a los SIG vectoriales más complejos y/o potentes.

 Actualmente cualquier SIG es capaz de utilizar varios formatos

de bases de datos y trabajar indistintamente con ellos, salvando en muchos casos las antiguas limitaciones de almacenamiento, conectividad, gestión, etc.

(47)
(48)

D

IFERENCIAS ENTRE

SIG

Y

CAD

La tecnología CAD (Computer-Aided Design) crea representaciones

gráficas de los objetos físicos en 2D o 3D,

 Consisten básicamente en aplicaciones para generar archivos de

dibujo.

Las aplicaciones SIG realizan operaciones espaciales integradas con

una base de datos alfanumérica.

 En los SIG los elementos gráficos llevan asociados datos

alfanuméricos (identificadores y atributos) almacenados en una tabla.

 Para un programa de CAD, un polígono representa una longitud de

perímetro y un área encerrada, pero si este polígono representa el contorno de un edificio, en el SIG, además llevará asociado cierta información temática (el número de policía, el número de plantas, etc.) en la correspondiente base de datos.

 Aunque el CAD resulta mucho más cómodo para la edición gráfica y

presenta mejores resultados en el renderizado, la gran cantidad de funciones que presenta la tecnología SIG no los hace comparables.

Referencias

Documento similar

Un sistema de bases de datos proporciona un lenguaje de definición de datos para especificar el esquema de la base de datos y un lenguaje de manipulación de datos

Básicamente no se diferencian demasiado de las bases de datos relacionales (una tabla en una base de datos multidimensional podría serlo también en una base de datos

Las bases de datos mantienen agrupados los datos en distintas tablas evitando que se duplique la información y manteniendo una estructura mas organizada, además,

Este trabajo analiza las posibilidades del Catastro urbano como fuente de información para la realización de estudios intraurbanos. Utilizaremos las bases de datos del sistema de

PostGIS convierte el Sistema Gestor de Bases de Datos PostgreSQL en una base de datos espacial añadiendo soporte para estas tres funcionalidades: tipos espaciales, índices espaciales

• Las bases de datos muestran qué información hay sobre un tema y los catálogos en qué biblioteca se encuentra dicha información.. • Estas herramientas proporcionan bien la

El modelo consta de dos secciones: una general, relacionada con el modelo conceptual de datos vectoriales, en la que se describen la estructura, características, convenciones, y

El proceso y la administración de una base de datos se llevan a cabo a través de un programa de cómputo denominado Sistema Gestor de Bases de Datos ( SGBD ), este sistema se