Documento 894828

Anuncio
¿Qué es una base de datos?
Una base de datos es una colección de información organizada de forma que un
programa de ordenador pueda seleccionar rápidamente los fragmentos de datos que
necesite. Una base de datos es un sistema de archivos electrónico.
Las bases de datos tradicionales se organizan por campos, registros y archivos. Un
campo es una pieza única de información; un registro es un sistema completo de
campos; y un archivo es una colección de registros. Por ejemplo, una guía de teléfono es
análoga a un archivo. Contiene una lista de registros, cada uno de los cuales consiste en
tres campos: nombre, dirección, y número de teléfono.
Una base de datos (cuya abreviatura es BD) es una entidad en la cual se pueden
almacenar datos de manera estructurada, con la menor redundancia posible. Diferentes
programas y diferentes usuarios deben poder utilizar estos datos. Por lo tanto, el
concepto de base de datos generalmente está relacionado con el de red ya que se debe
poder compartir esta información. De allí el término base. "Sistema de información" es
el término general utilizado para la estructura global que incluye todos los mecanismos
para compartir datos que se han instalado.
¿Por qué utilizar una base de datos?
Una base de datos proporciona a los usuarios el acceso a datos, que pueden visualizar,
ingresar o actualizar, en concordancia con los derechos de acceso que se les hayan
otorgado. Se convierte más útil a medida que la cantidad de datos almacenados crece.
Una base de datos puede ser local, es decir que puede utilizarla sólo un usuario en un
equipo, o puede ser distribuida, es decir que la información se almacena en equipos
remotos y se puede acceder a ella a través de una red.
La principal ventaja de utilizar bases de datos es que múltiples usuarios pueden acceder
a ellas al mismo tiempo.
Administración de Bases de Datos
Rápidamente surgió la necesidad de contar con un sistema de administración para
controlar tanto los datos como los usuarios. La administración de bases de datos se
realiza con un sistema llamado DBMS (Database management system [Sistema de
administración de bases de datos]). El DBMS es un conjunto de servicios (aplicaciones
de software) para administrar bases de datos, que permite:

Un fácil acceso a los datos

El acceso a la información por parte de múltiples usuarios

La manipulación de los datos encontrados en la base de datos (insertar, eliminar,
editar)
El DBMS puede dividirse en tres subsistemas:



El sistema de administración de archivos:
para almacenar información en un medio físico
El DBMS interno:
para ubicar la información en orden
El DBMS externo:
representa la interfaz del usuario
NORMALIZACIÓN DE BASES DE DATOS
El proceso de normalización de bases de datos consiste en aplicar una serie de reglas a
las relaciones obtenidas tras el paso del modelo entidad-relación al modelo relacional.
Las bases de datos relacionales se normalizan para:
 Evitar la redundancia de los datos.
 Evitar problemas de actualización de los datos en las tablas.
 Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una relación, aunque para que una
tabla sea considerada como una relación tiene que cumplir con algunas restricciones:
 Cada tabla debe tener su nombre único.
 No puede haber dos filas iguales. No se permiten los duplicados.
 Todos los datos en una columna deben ser del mismo tipo.
FORMAS NORMALES
Las formas normales son aplicadas a las tablas de una base de datos. Decir que una base
de datos está en la forma normal N es decir que todas sus tablas están en la forma
normal N.
Diagrama de inclusión de todas las formas normales.
En general, las primeras tres formas normales son suficientes para cubrir las
necesidades de la mayoría de las bases de datos. El creador de estas 3 primeras formas
normales (o reglas) fue Edgar F. Codd.
PRIMERA FORMA NORMAL (1FN)
Una relación R se encuentra en 1FN si y solo sí por cada renglón columna contiene
valores atómicos.
Abreviada como 1FN, se considera que una relación se encuentra en la primera forma
normal cuando cumple lo siguiente:
1. Las celdas de las tablas poseen valores simples y no se permiten grupos ni
arreglos repetidos como valores, es decir, contienen un solo valor por cada
celda.
2. Todos los ingresos en cualquier columna (atributo) deben ser del mismo tipo.
3. Cada columna debe tener un nombre único, el orden de las columnas en la tabla
no es importante.
4. Dos filas o renglones de una misma tabla no deben ser idénticas, aunque el
orden de las filas no es importante.
Por lo general la mayoría de las relaciones cumplen con estas características, así que
podemos decir que la mayoría de las relaciones se encuentran en la primera forma
normal.
Para ejemplificar como se representan gráficamente las relaciones en primera forma
normal consideremos la relación alumno cursa materia cuyo diagrama E-R es el
siguiente:
Como esta relación maneja valores atómicos, es decir un solo valor por cada uno de los
campos que conforman a los atributos de las entidades, ya se encuentra en primera
forma normal, gráficamente así representamos a las relaciones en 1FN.
Una tabla no puede tener múltiples valores en cada columna. Los datos son atómicos.
(Si a cada valor de X le pertenece un valor de Y y viceversa). Esta forma normal
elimina los valores repetidos dentro de una BD.
SEGUNDA FORMA NORMAL (2FN)
La segunda forma normal (2NF) es una forma normal usada en normalización de bases
de datos. La 2NF fue definida originalmente por E.F. Codd1 en 1971. Una tabla que está
en la primera forma normal (1NF) debe satisfacer criterios adicionales para calificar
para la segunda forma normal. Específicamente: una tabla 1NF está en 2NF si y solo si,
dada una clave primaria y cualquier atributo que no sea un constituyente de la clave
primaria, el atributo no clave depende de toda la clave primaria en vez de solo una parte
de ella.
En términos levemente más formales: una tabla 1NF está en 2NF si y solo si ninguno de
sus atributos no-principales son funcionalmente dependientes en una parte (subconjunto
propio) de una clave primaria (Un atributo no-principal es uno que no pertenece a
ninguna clave primaria).
Observe que cuando una tabla 1NF no tiene ninguna clave candidata compuesta (claves
candidatas consistiendo en más de un atributo), la tabla está automáticamente en 2NF.
Para definir formalmente la segunda forma normal requerimos saber que es
una dependencia funcional: Consiste en edificar que atributos dependen de otro(s)
atributo(s).
Una relación se encuentra en segunda forma normal, cuando cumple con las reglas de
la primera forma normal y todos sus atributos que no son claves (llaves) dependen por
completo de la clave. De acuerdo con está definición, cada tabla que tiene un atributo
único como clave, esta en segunda forma normal.
La segunda forma normal se representa por dependencias funcionales como:
Nótese que las llaves primarias están representadas con doble cuadro, las flechas nos
indican que de estos atributos se puede referenciar a los otros atributos que dependen
funcionalmente de la llave primaria.
TERCERA FORMA NORMAL (3FN)
La tercera forma normal (3NF) es una forma normal usada en la normalización de bases
de datos. La 3NF fue definida originalmente por E.F. Codd en 1971. La definición de
Codd indica que una tabla está en 3NF si y solo si las dos condiciones siguientes se
mantienen:


La tabla está en la segunda forma normal (2NF)
Ningún atributo no-primario de la tabla es dependiente transitivamente de una clave
primaria
Un atributo no-primario es un atributo que no pertenece a ninguna clave candidata.
Una dependencia transitiva es una dependencia funcional X → Z en la cual Z no es
inmediatamente dependiente de X, pero sí de un tercer conjunto de atributos Y, que a su
vez depende de X. Es decir, X → Z por virtud de X → Y e Y → Z.
Una formulación alternativa de la definición de Codd, dada por Carlo Zaniolo en 1982,
es ésta: Una tabla está en 3NF si y solo si, para cada una de sus dependencias
funcionales X → A, por lo menos una de las condiciones siguientes se mantiene:



X contiene A, ó
X es una súper clave, ó
A es un atributo primario (es decir, A está contenido dentro de una clave candidata)
La definición de Zaniolo tiene la ventaja de dar un claro sentido de la diferencia entre la
3NF y la más rigurosa forma normal de Boyce-Codd (BCNF). La BCNF simplemente
elimina la tercera alternativa ("Aes un atributo primario").
Consiste en eliminar la dependencia transitiva que queda en una segunda forma normal,
en pocas palabras una relación esta en tercera forma normal si está en segunda forma
normal y no existen dependencias transitivas entre los atributos, nos referimos a
dependencias transitivas cuando existe más de una forma de llegar a referencias a un
atributo de una relación.
Por ejemplo, consideremos el siguiente caso:
Descargar