B
ASE DE
D
ATOS
Introducción
¿D
ATO O
I
NFORMACIÓN
?
3 x$85
¿D
ATO O
I
NFORMACIÓN
?
Teniendo
en
cuenta
lo
visto
anteriormente
¿Cómo conviene pagar?
¿Compraremos
alguno
de
los
productos?
¿D
ATO O
I
NFORMACIÓN
?
DATO Es cualquier hecho que ocurre en el universo y que tiene
una representación almacenable.
Es un elemento aislado, recabado para un cierto fin, pero
que no ha pasado por un proceso que lo interrelacione con otros de manera funcional para el fin previsto.
INFORMACION
la interpretación de un conjunto de datos referentes a un
tema, también es considerada un bien valioso, y su importancia varía dependiendo de su uso, propósito y contexto.
se trata del conjunto de datos, añadidos, procesados y
relacionados, de manera que pueden dar pauta a la correcta toma de decisiones según el fin previsto.
D
IFERENCIAS ENTRE
P
LANILLAS DE
C
ÁLCULO Y
B
ASES DE
D
ATOS
Propósito
La diferencia más importante es el propósito de cada software. En los programas de bases de datos se interrelacionan tablas y su contenido, mientras que las hojas de cálculos no.
Datos relacionados
Los gestores de bases de datos son multiusuario, al contrario de las planillas de cálculo. Además de poder manejar a la vez miles de registros vinculados a través de varias tablas.
Tipo de consultas
Los gestores de bases de datos están diseñados crear consultas calculadas, haciendo vínculos basados a través de un "asistente" o programado por el usuario. Las planillas de cálculo no tienen esa capacidad aunque pueden crear tablas, gráficos y tablas dinámicas.
Cálculos y Gráficos
Las planillas de cálculo son más intuitivas, y mejores para cálculos estadísticos o de carácter general. Además de generar gráficos con sencillez.
C
UANDO UTILIZAR
B
ASES DE DATOS
Se necesite una base de datos relacional (varias tablas) para
almacenar los datos.
Pueda necesitar agregar más tablas a un conjunto de datos
no relacional en el futuro.
Almacene una gran cantidad de datos (miles de entradas).
Por ejemplo, si trabaja en una compañía grande y necesita almacenar información de personal.
Almacene datos que en su mayor parte son de tipo texto.
Necesite mantener conectividad constante con una base de
datos externa de gran tamaño, como una creada mediante SQL Server.
Desee ejecutar consultas complejas.
Necesite que muchos usuarios trabajen en la base de datos a
C
UANDO UTILIZAR
P
LANILLAS DE
C
ÁLCULO
Necesite una vista simple o no relacional de los datos (es
decir, cuando no necesite una base de datos relacional con varias tablas).
Especialmente cuando los datos son en su mayoría
numéricos,
por ejemplo si desea conservar un presupuesto de un año concreto.
Desee ejecutar principalmente cálculos y comparaciones
estadísticas de los datos,
por ejemplo si desea mostrar un análisis de costos y beneficios en el presupuesto de la compañía.
Sepa que el conjunto de datos tiene un tamaño que permite
Las bases de datos están presentes en las acciones
que realizamos día a día
Al sacar dinero del banco, pagar un café o ir al supermercado.
Al comprar entradas para el cine, reservar un hotel o un vuelo.
Al realizar una llamada o usar el Whatsapp.
Al visualizar información en el teletexto.
Al leer el marca, consultar una crítica de cine...
Los anteriores serían aplicaciones de bases de datos
tradicionales, almacenando información textual o numérica.
Otros sistemas almacenan muy diversos tipos de información
:
Bases de datos multimedia (fotos, vídeos, audios).
Sistemas de información geográfica (GIS)
Mapas,
información climática o de satélite.
Data warehouses y OLAP
Información de grandes
volúmenes
de
datos
para
toma
de
decisiones
empresariales.
Tiempo real y bases de datos activas, para control
industrial. Por ejemplo, sistemas SCADA en el CERN.
E
L PROBLEMA QUE SE NOS PLANTEA
ES
:
Diseñar sistemas para almacenar y gestionar datos
que proporcionen a los usuarios información de
interés
sobre
un
dominio
determinado,
cuyo
análisis posterior permita sacar conclusiones y
repercuta en una toma de decisiones mejor
informada.
D
EFINICIÓN
El término de bases de datos fue escuchado por
primera vez en 1963, en un simposio celebrado en
California, USA.
Una base de datos se puede definir como un
conjunto
de
información
relacionada
que
se
encuentra agrupada ó estructurada.
Desde el punto de vista informático, es un sistema
formado por un conjunto de datos almacenados en
discos que permiten el acceso directo a ellos y un
conjunto
de
programas
que
manipulen
ese
conjunto de datos.
G
ESTORES DE
B
ASES DE
D
ATOS
MySQL
Microsoft Access
Oracle
PostgreSQL
Paradox
DB2
P
ROPIEDADES
Están estructurados independientemente de las
aplicaciones y del soporte de almacenamiento que
los contiene.
Presentan la menor redundancia posible.
Son
compartidos
por
varios
usuarios
y/o
V
ENTAJAS DE SU
U
TILIZACIÓN
Facilidad de manejo de grandes volúmenes de
información.
Independencia
en
el
tratamiento
de
la
información.
Seguridad de la información.
No duplicidad de la información.
Mejora la metodología de trabajo en una
organización.
C
OMPONENTES DE UNA
B
ASE DE
D
ATOS
Tablas
es donde se guardan los datos recogidos por el
programa.
Su estructura general se asemeja a una Hoja de cálculo,
se representan gráficamente como una estructura
rectangular formada por filas y columnas.
C
OMPONENTES DE UNA
B
ASE DE
D
ATOS
Cada columna o atributo
almacena información sobre
una propiedad determinada de la tabla (nombre, DNI,
apellidos, edad).
Es una pieza única de información,
Cada una de las características que definen de los
objetos que componen la tabla
C
OMPONENTES DE UNA
B
ASE DE
D
ATOS
Cada fila o tupla
posee una
ocurrencia o registro
(ejemplar de la instancia o relación representada por
la Tabla),
Es un sistema completo de campos,
Sería un objeto de la tabla.
C
OMPONENTES DE UNA
B
ASE DE
D
ATOS
Claves
: son referencias que se utilizan para identificar los
objetos de forma única en todas las posibles filas de una
tabla.
clave candidata: Conjunto de atributos de una tabla que
identifican unívocamente cada tupla de la tabla.
clave primaria: Clave candidata que se escoge como
identificador de las tuplas.
clave alternativa: Cualquier clave candidata que no sea
primaria
clave externa o secundaria: Atributo de una tabla
relacionado con una clave de otra tabla.
C
OMPONENTES DE UNA
B
ASE DE
D
ATOS
Archivo
Es
una
colección
de
registros
almacenados
siguiendo una estructura homogénea.
C
OMPONENTES DE UNA
B
ASE DE
D
ATOS
Relaciones
Son
asociaciones
establecidas
entre
campos comunes de
dos tablas, con la
que
se
puede
combinar
la
información
de
varias tablas.
C
LASIFICACIÓN DE LAS
B
ASES DE
D
ATOS
Bases de datos Jerárquicas
Los datos de un determinado registro se almacenan en diferentes
niveles.
Al diseñar esta estructura deben tenerse en cuenta los diferentes
accesos que van a necesitar los usuarios para consultar la información que contiene almacenada.
Las estructuras jerárquicas fueron usadas extensamente en los
primeros sistemas de gestión de datos .
Esta estructura permite un 1:N en una relación entre dos tipos de
datos.
En la relación Padre-hijo: El hijo solo puede tener un padre pero un padre puede tener múltiples hijos.
C
LASIFICACIÓN DE LAS
B
ASES DE
D
ATOS
Bases de datos Jerárquicas
Ventaja es la rapidez en las consultas de información ya que
la propia estructura piramidal de los datos permite un rápido
acceso a ella.
Desventajas:
Son muy complicadas las posteriores modificaciones, así
como el mantenimiento de la base de datos.
El acceso a la información también presenta problemas, ya
que sólo se ven los registros situados en los niveles
superiores.
Su
inhabilidad
de
representar
manera
eficiente
la
C
LASIFICACIÓN DE LAS
B
ASES DE
D
ATOS
Bases de datos en Red
Surgieron como un intento de solucionar las rigideces
que ocasionaban las bases de datos jerárquicas.
La información se almacena también en diferentes
niveles pero tiene la ventaja que se puede acceder a
datos situados en el mismo nivel.
C
LASIFICACIÓN DE LAS
B
ASES DE
D
ATOS
Bases de datos en Red
Se organizan los en registros y conjuntos.
Los registros contienen campos (que puede ser organizado
jerárquicamente, como en el lenguaje COBOL).
Un registro puede ser un propietario en cualquier número de
conjuntos, y un miembro en cualquier número de conjuntos.
El modelo de red es capaz de representar la redundancia en
datos de una manera más eficiente que en el modelo jerárquico.
Ventaja de este modelo es que los accesos a la información son
más flexibles en comparación con las bases de datos jerárquicas.
Desventajas la velocidad de acceso a la información es más
lenta y aumenta la complejidad de diseño de la estructura de información almacenada en la base de datos.
C
LASIFICACIÓN DE LAS
B
ASES DE
D
ATOS
Bases de datos Relacional
Los datos se estructuran en una o varias tablas donde relacionan uno
o varios conjuntos de datos.
Las tablas se pueden modificar fácilmente, buscando la mejor manera
de obtener una integridad total de la información.
Las ventajas frente a las anteriores:
La rapidez y facilidad con la que permite transformar el modelo de
datos,
La sencillez de la estructura física La posibilidad de adaptación.
Garantiza herramientas para evitar la duplicidad de registros, a través de campos claves o llaves.
Garantiza la integridad referencial: Así al eliminar un registro elimina todos los registros relacionados dependientes.
C
LASIFICACIÓN DE LAS
B
ASES DE
D
ATOS
C
LASIFICACIÓN DE LAS
B
ASES DE
D
ATOS
Bases de datos Documentales
Almacenan información en forma de texto.
La estructura lógica es muy complicada de diseñar, puesto
que los diferentes documentos contenidos en la base de datos están almacenados en registros de longitud variable.
Los accesos a la información también presentan problemas
de diseño, puesto que los documentos han de tratarse como cadenas de caracteres, debiendo buscarse el término deseado a través de todo el texto almacenado.
Para agilizar y mejorar el proceso de búsqueda a lo largo de los
diferentes textos que componen la base de datos se deben seguir diversas estrategias (índices, búsquedas complejas, etc.) que hacen más lenta la recuperación de la información deseada por los usuarios.
C
LASIFICACIÓN DE LAS
B
ASES DE
D
ATOS
Bases de datos Semánticas u Orientadas a Objetos
No existe una caracterización universal aceptada del término
“orientación a objetos”, por lo que cualquier intento de definir el concepto es necesariamente una visión particular.
Se considera que son tres las características esenciales que
identifican este concepto.
Tipo Abstracto de Dato (TAD). Herencia.
G
ESTOR DE
B
ASE DE
D
ATOS
Es un software que permite introducir, organizar y recuperar la información de las bases de datos.
Es un conjunto de programas que se encargan de manejar la creación y todos los accesos a las bases de datos, es un software muy especifico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan.
G
ESTOR DE
B
ASE DE
D
ATOS
DDL (Data Definition language): Lenguaje de Definición de Datos.
Identifica las descripciones de
los elementos de los esquemas y las almacena.
DML (Data Manipulation language): Lenguaje de Manipulación de Datos.
Permite la manipulación de las
operaciones de Inserción, Eliminación y Modificación.
G
ESTOR DE
B
ASE DE
D
ATOS
Objetivos:
1) Evitar la redundancia. 2) Evitar la inconsistencia. 3) Datos Compartidos.
4) Normas para los datos. 5) Seguridad de datos.
6) Conservar la Integridad.
7) Evitar el aislamiento de los datos. 8) Anomalías del acceso concurrente. 9) Equilibrio de Requerimientos.
G
ESTOR DE
B
ASE DE
D
ATOS
Ventajas por la independencia de datos:
Control sobre la redundancia de datos: se almacenan una sola
copia de los datos.
Ahorramos así espacio.
Coherencia de datos: eliminando las redundancias de
almacenamiento se reduce el riesgo de incoherencias.
Datos compartidos: la base de datos puede ser compartida por
todos los usuarios autorizados.
Mayor eficacia en la recogida, validación y entrada de datos. Estos procesos se realizan en la base de datos, de manera uniforme entre diversas aplicaciones cliente que accedan a la base de datos.
Al no existir redundancias, los datos se recogen y se validan una sola vez.
Facilidad para mantener los estándares establecidos, al tener
G
ESTOR DE
B
ASE DE
D
ATOS
Ventajas por una interfaz común:
Mejora en la seguridad: se establecen distintas claves para el
personal autorizado y les restringe las operaciones que pueden realizar (administrador de la BD, usuario avanzado, usuario final).
Mejora de accesibilidad de datos: se incorporan lenguajes
estándares de consultas (el usuario realiza consultas sin necesidad de acudir al programador).
Mejora en el mantenimiento de la aplicación: separan la
descripción de los datos y las aplicaciones, lo que facilita el mantenimiento y las futuras modificaciones de las aplicaciones.
G
ESTOR DE
B
ASE DE
D
ATOS
Inconvenientes:
Complejidad: Es preciso conocer muy bien su funcionalidad
para obtener un rendimiento óptimo.
Tamaño: Requieren de una gran cantidad de espacio en disco
y en memoria para trabajar de forma eficaz.
Coste económico: Varía dependiendo del entorno y de la
funcionalidad que ofrece (para computadoras personales o sistemas multiusuario).
En el caso de grandes sistemas empresariales sí se trata de un coste sustancial, pero para bases de datos pequeñas y medianas se dispone de sistemas open source de gran nivel y funcionalidad (PostgreSQL, MySQL).
También se dispone de servidores web, capaces de alojar bases de datos, a muy diferentes escalas.
G
ESTOR DE
B
ASE DE
D
ATOS
Funciones:
Integridad y seguridad de los
datos.
Gestión de la información.
Definición de vistas parciales
de los datos para distintos
usuarios.
Independencia
de
las
aplicaciones respecto a la
representación física de los
datos.
Descripción unificada de los
G
ESTOR DE
B
ASE DE
D
ATOS
G
ESTOR DE
B
ASE DE
D
ATOS
G
ESTOR DE
B
ASE DE
D
ATOS
G
ESTOR DE
B
ASE DE
D
ATOS
Características
:
Permitir crear y gestionar base de datos de forma fácil,
cómoda y rápida.
Ofrecer una gran flexibilidad.
Ofrecer un ambiente agradable dado por su interfaz gráfica.
Consistir, de cara al usuario, en un conjunto de tablas entre
las que se establecen relaciones.
Permitir el almacenamiento, manipulación y consulta de
datos de una base de datos organizada en varios archivos.
Permitir consultas complejas,
Almacenar los datos de forma eficiente aunque oculta para el
usuario.
Acceder al mismo tiempo múltiples usuarios, realizando
G
ESTOR DE
B
ASE DE
D
ATOS
Características
:
Abstracción de datos: Codificar en formato digital ciertos
G
ESTOR DE
B
ASE DE
D
ATOS
Niveles de abstracción de datos
Nivel físico:
describe cómo se almacenan realmente los
datos.
Nivel lógico:
describe qué datos se almacenan en la base de
datos y qué relaciones existen entre esos datos.
La base de datos completa se describe así en términos de un
número pequeño de estructuras relativamente simples.
Nivel de vistas:
describe sólo parte de la base de datos.
Debido a la variedad de información almacenada en una gran
base de datos.
Muchos
usuarios
del
sistema
no
necesitan
toda
esta
información. Para que su interacción con el sistema se
simplifique, se define la abstracción del nivel de vistas.
El sistema proporciona muchas vistas para la misma base de
datos, dependiendo de las necesidades del usuario.
P
OSTGRE
SQL
Es un gestor de bases de datos de código abierto,
Brinda un control de concurrencia multi-versión que permite
trabajar con grandes volúmenes de datos;
Soporta gran parte de la sintaxis SQL y cuenta con un extenso
grupo de enlaces con lenguajes de programación.
Posee una integridad referencial e interfaces nativas para
lenguajes como ODBC, JDBC, C, C++, PHP, PERL, TCL, ECPG; PYTHON y RUBY.
Funciona en todos los sistemas operativos Linux, UNIX (AIX,
BSD, HP-UX, SGI IRIX, Mac OS X, Solaris, Tru64), y Windows.
Cuenta con una serie de características, como son la
herencia de tablas (clases) y, un conjunto amplio de tipos de datos que incluyen arreglos, Binary Large Object Block (BLOB), tipos geométricos y direcciones de red.
Incluye también, el procesamiento de transacciones,
POSTGIS. U
NA EXTENSIÓN
GEOESPACIAL PARA
POSTGRESQL
Permite el almacenamiento y la manipulación de objetos
geométricos vectoriales en bases de datos; incluyendo además, el Sistema de Referencia Espacial; lo que la convierte en una base de datos espacial para su utilización en Sistema de Información Geográfica.
Está publicado bajo licencia GNU/GPL y ha sido certificado,
en 2006 por el Open Geospatial Consortium (OGC), lo que garantiza la interoperabilidad con otros sistemas.
La especificación OpenGis define dos formas estándares
de expresar los objetos espaciales;
Formatos en Modo Texto (Well-Known Text -WKT)
y en Modo Binario(Well-Known Binary-WKB).
Ambos incluyen la información sobre el tipo de objeto y las
B
ASES DE DATOS GEOGRÁFICAS
Un sistema de información geográfica (SIG) es un “conjunto de
programas, equipamientos, metodologías, datos y personas (usuarios), perfectamente integrado, de manera que hace posible la recolección de datos, almacenamiento, procesamiento y análisis de datos georreferenciados, así como la producción de información derivada de su aplicación”.
Cuando se habla de datos georreferenciados, se trata de datos
referidos a una posición con respecto a un sistema de coordenadas terrestres.
La tecnología de los SIG busca articular las bases de datos gráficas
con las bases de datos alfanuméricas que representan los diferentes rasgos del territorio, tales como caminos, cursos de agua, asentamientos poblacionales, actividades económicas, etc.
Los SIG modelan la realidad territorial para convertirla en datos
geográficos que son manipulados en un entorno informatizado. Para ello utilizan los modelos de representación raster y vectorial.
B
ASES DE DATOS GEOGRÁFICAS
Los Sistemas de Información Geográfica, sobre todo los
vectoriales, basan su almacenamiento de datos en estructuras de bases de datos de tipo relacional.
Las bases de datos son las encargadas en los SIG de almacenar
los atributos de los objetos cartográficos representados y deben combinarse con las bases de datos que almacenan la topología y geometría de dichos objetos.
Esta complejidad de almacenamiento de información es lo que
hace considerar a los SIG vectoriales más complejos y/o potentes.
Actualmente cualquier SIG es capaz de utilizar varios formatos
de bases de datos y trabajar indistintamente con ellos, salvando en muchos casos las antiguas limitaciones de almacenamiento, conectividad, gestión, etc.
D
IFERENCIAS ENTRE
SIG
Y
CAD
La tecnología CAD (Computer-Aided Design) crea representaciones
gráficas de los objetos físicos en 2D o 3D,
Consisten básicamente en aplicaciones para generar archivos de
dibujo.
Las aplicaciones SIG realizan operaciones espaciales integradas con
una base de datos alfanumérica.
En los SIG los elementos gráficos llevan asociados datos
alfanuméricos (identificadores y atributos) almacenados en una tabla.
Para un programa de CAD, un polígono representa una longitud de
perímetro y un área encerrada, pero si este polígono representa el contorno de un edificio, en el SIG, además llevará asociado cierta información temática (el número de policía, el número de plantas, etc.) en la correspondiente base de datos.
Aunque el CAD resulta mucho más cómodo para la edición gráfica y
presenta mejores resultados en el renderizado, la gran cantidad de funciones que presenta la tecnología SIG no los hace comparables.