Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Módulo VII: Sistemas de Información Geográfica y Teledetección SISTEMAS DE GESTIÓN DE BASES DE DATOS AUTOR: LUIS QUINTAS RIPOLL ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Índice BASES DE DATOS Y SISTEMAS DE GESTIÓN DE BASES DE DATOS 3 BASES DE DATOS Bases de datos y sistemas de gestión de bases de datos (SGBD) Ventajas e inconvenientes de un SGBD Tipos de sistemas de gestión de bases de datos Bases de datos jerárquicas Bases de datos en red Bases de datos orientadas a objetos Bases de datos relacionales DISEÑO DE BASES DE DATOS RELACIONALES Definiciones y características Normalización de una base de datos relacional Integridad referencial Modelos Entidad – Relación (E-R) EL LENGUAJE CONCEPTUAL DE GESTIÓN DE BASES DE DATOS RELACIONALES SQL Características Instrucciones de manipulación de tablas SELECT DELETE, INSERT Y UPDATE Instrucciones de creación y administración de la base de datos SQL embebido en lenguajes de programación REFERENCIAS BIBLIOGRÁFICAS 3 3 5 5 6 6 7 7 7 7 9 12 12 13 13 14 14 16 16 18 21 Página 2 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 SISTEMAS GESTORES DE BASES SE DATOS BASES DE DATOS Y SISTEMAS DE GESTIÓN DE BASES DE DATOS BASES DE DATOS Se entiende por base de datos un conjunto de datos no redundantes, almacenados en un soporte informático, organizados de forma independiente de su utilización y accesibles simultáneamente por distintos usuarios y aplicaciones. Las bases de datos deben cumplir pues tres requisitos básicos: • • • No redundancia: Los datos se almacenan una sola vez, aunque se utilicen para varias aplicaciones. Independencia: Los datos se organizan de una manera estructurada independientemente de la aplicación que se vaya a utilizar para tratarlos. Concurrencia: varios usuarios pueden acceder simultáneamente a los datos sin interferirse. Bases de datos y sistemas de gestión de bases de datos (SGBD) Tradicionalmente, para manipular grandes cantidades de datos aparecieron en primer lugar las bases de datos o "bancos de datos", cumpliendo de manera aproximada con la definición presentada en el apartado anterior. Se trataba de almacenar ordenadamente datos en un juego de ficheros, y, mediante unas aplicaciones informáticas y un sistema de índices, gestionarlas adecuadamente (Figura 1). Al aumentar la complejidad de estos bancos de datos (elevado número de ficheros y usuarios, acceso múltiple y simultáneo a los ficheros, aumento del número de registros, etc.) se producen problemas cada vez más graves para asegurar la consistencia, la integridad y la accesibilidad de los datos, produciendo problemas de eficiencia en el tratamiento de los datos. Para resolver estos problemas aparecen en el mercado los Sistemas de Gestión de Bases de Datos (SGBD), que convierten el acceso a los datos y su gestión en una aplicación cerrada ("caja negra"), interponiéndose entre los usuarios y los ficheros, y haciéndose cargo de todos los problemas de explotación, mantenimiento y comprobación de los datos (Figura 2). De esta manera el usuario pierde de vista todos los detalles relativos al almacenamiento físico de los de los datos tratando con ellos sólo a través de un lenguaje conceptual sencillo. Página 3 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 APLICACION USUARIO APLICACION USUARIO APLICACION USUARIO FICHERO FICHERO Figura 1. SGBD FICHERO FICHERO Banco de datos USUARIO USUARIO USUARIO Figura 2. Sistemas de Gestión de Bases de Datos De acuerdo con los estudios de un grupo de trabajo de ANSI (TSICHRITZIS, Dennis & KLUG, Anthony C., 1978) los sistemas de gestión de bases de datos se organizan en tres niveles: • • • nivel interno: manipulación física de los datos. El usuario pierde de vista totalmente cómo y dónde se almacenan los datos, ocupándose el motor del sistema de gestión de todas estas tareas nivel externo: visión del usuario: manipulación lógica de los datos. El usuario maneja la base de datos a través de un entorno organizado mediante menús o aplicaciones informáticas que le guían sin necesidad de conocimientos de la estructura de la base de datos nivel intermedio: descripción de la base de datos mediante un lenguaje conceptual que permiten una visión abstracta del sistema. Se entiende por lenguaje conceptual un lenguaje formado por palabras (comandos) de fácil memorización que permiten efectuar todas las tareas de acceso y manipulación de los datos, así como las tareas de mantenimiento de todo el sistema de gestión. El lenguaje conceptual del sistema de gestión permite abordar de manera todas las tareas para el mantenimiento y explotación del sistema de gestión. Pueden agruparse en tres clases: • Funciones de definición: o o o o creación, modificación o eliminación de tablas, registros, campos, índices, etc. creación de relaciones, validación de campos, valores, etc. funciones de manipulación: Página 4 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 o • acceso a los datos mediante operaciones de búsqueda condicionada con uso de operadores lógicos ( = , <>, <, >, and, or, etc.) para la presentación, modificación o eliminación de registros. Funciones de administración: o o o o o o o figura del administrador de la base de datos, con privilegios para otorgar los permisos de acceso y uso. organización del sistema de permisos de acceso a las tablas, registros, campos ,etc. En los sistemas de gestión de bases de datos aparece la figura del “administrador” de la base de datos, usuario especial, propietario del sistema, que decide quién conecta a la base de datos, quién accede a las diferentes tablas y qué puede hacer en ellas (sólo leer, insertar, modificar o borrar registros, campos, índices, tablas, etc.). Esta figura es de una enorme importancia para la preservación de la integridad de los datos. realización de copias de seguridad y recuperación del sistema en caso de desastre. migración del sistema a nuevas versiones o incluso a diferentes sistemas de gestión. comunicación con otros sistemas de gestión externos (remotos o en la misma máquina). preprocesadores para la inclusión del lenguaje conceptual en el código fuente de programas de ordenador como FORTRAN, C, etc. para la programación de tareas sofisticadas. lenguaje de 4ª generación para la creación de interfaces gráficas de usuario (menús) Hoy en día hay una preponderancia del lenguaje SQL (Structured Query Language). (CHAMBERLAIN & BOICE, 1974), materialmente presente en todos los sistemas de gestión de gran difusión. La explicación de esta preponderancia se encuentra en la gran sencillez y potencia de este lenguaje, que se describirá más adelante. Ventajas e inconvenientes de un SGBD Las ventajas del uso de un SGBD cuando han de manipularse grandes cantidades de datos son enormes: • • • • • • Se eliminan las inconsistencias en los datos debido al fuerte control que se establece. Se comparten los datos entre diferentes aplicaciones sin complicaciones, permitiendo una rápida adaptación a nuevas aplicaciones. Se ahorra espacio de almacenamiento. Se accede a los datos con extraordinaria rapidez. Se asegura la protección de los datos frente a malos usos o desastres. Permiten la creación de entornos personalizados de alta disponibilidad. Tienen sin embargo algunas desventajas: • • La puesta en funcionamiento es larga, ya que se necesita una planificación muy detallada de la estructura de datos. Se necesita personal especializado para su administración y mantenimiento. Tipos de sistemas de gestión de bases de datos Existen fundamentalmente 4 tipos de sistemas de gestión, que se diferencian por la estructura de datos que ofrecen: SGBD jerárquicos, en red, relacionales y orientados a objetos. Página 5 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Bases de datos jerárquicas Las bases de datos jerárquicas organizan la información en forma de árbol. Los datos dependen todos de una entidad raíz, ‘padre’. Los datos dependientes del raíz son ‘hijos’ suyos. A su vez estos hijos tienen hijos y así sucesivamente (figura 3). La relación entre padre e hijos es siempre de uno a muchos, de manera que un hijo siempre tienen un solo padre, pero un padre puede tener varios hijos. Para acceder a una entidad, se parte siempre del raíz y se recorren los hijos según un orden preestablecido. Cuando se elimina un padre, se eliminan todos sus hijos también. Estas bases de datos son muy apropiadas para datos que se prestan bien a una estructura ramificada. Se utilizan en buscadores de INTERNET, donde son muy eficientes. Figura 3. Estructura de una base de datos jerárquica Bases de datos en red El gran problema de las bases de datos jerárquicas es cuando es necesario definir una relación entre entidades de muchos a muchos. Para casos de este tipo se crearon las base de datos en red o CODASYL, nombre de la agrupación que presentó las normas para su desarrollo. Es una extensión de la base de datos jerárquica, en que un hijo puede tener varios padres, denominándose estos ‘propietarios’ y aquellos ‘miembros’. Figura 4. Base de datos en red Página 6 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Bases de datos orientadas a objetos Las bases de datos orientadas a objetos son las más modernas y siguen hoy en día en desarrollo. La estructura de datos se basa en los conceptos de la orientación a objetos: objetos encapsulados pertenecientes a clases que heredan sus propiedades unas de otras. Bases de datos relacionales Por su sencillez y su potencia, son hoy en día las bases de datos más extendidas. Casi todos los sistemas de gestión de bases de datos comerciales de gran difusión tienen estructura relacional (ORACLE, INFORMIX, MSSQLSERVER, MSACCESS, etc.). Por ello se tratan a continuación con detalle. DISEÑO DE BASES DATOS RELACIONALES DE Definiciones y características La base de datos relacional supuso un gran avance frente a las base de datos jerárquicas y en red porque, así como en estas las relaciones están fijadas en la estructura de los datos, en el enfoque relacional las relaciones se establecen de una manera mucho más libre. El esquema relacional fue pensado por Codd a finales de los años sesenta a partir de la teoría de conjuntos. Los datos que han de almacenarse en una base de datos pueden agruparse en conjuntos de datos de la misma naturaleza. El conjunto de todos los datos de un mismo tipo se denomina ‘dominio’. Los dominios son conjuntos finitos de datos. Dado unos dominios D1, D2,....Dn, se define una ‘relación’ o ‘entidad’ como cualquier conjunto de datos d1, d2,....dn, tales que d1 ∈ D1, d2 ∈ D2, .... dn ∈ Dn. Este conjunto de datos se define como una ‘tupla’. Cada uno de los componentes de la relación pertenecientes a los dominios se denominan ‘atributos’ de la relación. Se define como ‘grado’ de la relación el número de atributos (n). La relación estará formada por un cierto número de tuplas, que se define como ‘cardinalidad’ de la relación. Este lenguaje teórico puede sustituirse por otro más matemático: Una relación o entidad es una tabla rectangular formada por filas y columnas, donde cada columna contiene un tipo de dato. Cada fila o registro es una tupla, y cada columna o campo es un atributo. El número de columnas es el grado y el número de registros es la cardinalidad (figura 5). Página 7 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 TABLA (ENTIDAD) REGISTRO (TUPLA) CAMPO (ATRIBUTO) Figura 5. Tablas de un sistema de gestión de base de datos relacional Para que una tabla pueda considerarse relación de una base de datos relacional tiene que cumplir una serie de requisitos: • • • • • • debe haber un único valor en cada elemento de las filas (intersección fila – columna) los valores de todos los elementos de una columna deben ser del mismo tipo (deben pertenecer al mismo dominio) no puede haber dos filas con todos los elementos iguales el nombre de cada columna (atributo) debe ser distinto dentro de la tabla el valor de los elementos dentro de cada columna debe ser independiente del orden de las columnas el valor de los elementos de las filas debe ser independiente del orden de las filas Como todas las filas de una tabla tienen que ser distintas, cualquiera de ellas puede identificarse siempre por el valor de uno o varios campos. A este conjunto de campos se le llama ‘clave primaria’, que puede ser simple, si la constituye un solo campo, o compuesta, si la constituyen varios . Ha de intentarse que este grupo sea mínimo por motivos de eficiencia. Los campos que no pertenecen a la clave primaria se llaman campos pertenecientes a clave ajena, o campos ‘no clave’. Obviamente una clave primaria nunca puede tener un valor nulo. Dentro de una relación o tabla se pueden hacer algunas operaciones básicas: • • • • • • Proyección. Se realiza una proyección cuando se extrae un cierto número de columnas de una tabla Selección. Se realiza una selección cuando se extrae un cierto número de filas de una tabla. Entre tablas, también se pueden efectuar operaciones algebráicas: Unión. Se pueden unir dos tablas con el mismo grado (número de columnas) y mismos atributos: el resultado es una tabla única con los registros de ambas. Diferencia. Se obtiene una tabla con los registros que no coinciden en ambas. Intersección. Se obtiene una tabla con los registros comunes. Producto. Se puede realizar con dos tablas con los mismos atributos Se obtiene una tabla con el producto cartesiano de los atributos. Se dice que dos campos A y B tienen dependencia funcional cuando el valor del campo A es determinado de manera única por el valor de B. Se dice que dos campos A y C tienen dependencia transitiva cuando el valor de B tiene dependencia funcional de A y C dependencia funcional de B. Página 8 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Una de las características más sobresalientes de las bases de datos relacionales es que se pueden establecer interrelaciones entre tablas. No se debe confundir el concepto de interrelación con el de relación (la confusión proviene de los términos ingleses relationship y relation). Para poder interrelacionar tablas basta con que compartan algún campo clave. La interrelación se produce siempre entre un campo clave en una tabla el mismo campo, pero no clave, en otra tabla (figura 6) TABLA DE ESTACIONES DE AFORO INDROEA LUGAR CDR1 03082 ORUSCO 03011809 TABLA DE RIOS CDR1 03011809 Figura 6. NOMBRE TAJUNA Interrelación entre tablas en un sistema relacional Esta propiedad permite obtener tablas virtuales, llamadas ‘vistas’, en las que se forma una nueva tabla con atributos de varias tablas interrelacionadas. Figura 7. Vista en una base de datos relacional Normalización de una base de datos relacional Para asegurar la perfecta coherencia de los datos, un sistema de gestión relacional debe estar “normalizado”. La normalización de una base de datos relacional (CODD, E. F., 1971) es fundamental para un buen diseño de una base de datos relacional. Las ventajas de la normalización son: • • • • se evitan las dependencias entre modificaciones en tablas distintas relacionadas entre sí se mejora la independencia de los datos entre sí, permitiendo un mejor crecimiento evita la aparición de restricciones artificiales en la estructura de los datos se evita la redundancia de los datos Página 9 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 La normalización se efectúa en tres fases, de manera que para normalizar una base de datos se ha pasar de una a otra completándose las anteriores. Según se completan estas fases de normalización se dice que el sistema cumple sucesivamente la Primera Forma Normal, la Segunda y finalmente la Tercera Forma Normal. Una relación o tabla cumple la Primera Forma Normal cuando “sus dominios no tienen elementos que a su vez sean conjuntos”. Esto quiere decir en esencia que no existen repeticiones en los campos de la tabla y que todos los atributos pertenecen a dominios distintos. El cumplimiento sólo de la Primera Forma Normal plantea problemas a la hora de insertar, modificar o borrar valores en los campos. Por ello se debe cumplir la Segunda Forma Normal. Para ello debe cumplirse la Primera Forma Normal y además que “todos los campos que no son clave dependen funcionalmente de la clave completa y no de parte”. Esto es aplicable sólo a tablas con claves compuestas (combinaciones de varios campos), de manera que una tabla con un campo clave único siempre cumple la Segunda Forma Normal. La Segunda Formal Normal resuelve gran parte de los problemas de la Primera. La Tercera Forma Normal es una extensión de la Segunda, eliminando las dependencias respecto a las claves parciales. Se dice que una tabla cumple la Tercera Forma Normal si, además de cumplir la Segunda Forma Normal, se cumple que “ninguno de sus campos que no son claves tiene dependencias transitivas”. Como se definió anteriormente, se entiende que dos campos A y C tienen dependencia transitiva cuando A depende de B y B depende de C. Para explicar mejor la normalización de una base de datos relacional, veamos un ejemplo sencillo: Supongamos que tenemos un negocio de material informático. En el almacén se dispone de una serie de productos informáticos suministrados por unos proveedores. De tiempo en tiempo hay que efectuar un pedido a los proveedores para pedir nuevas partidas de material. El formato de un pedido cualquiera es el siguiente: Se pretende informatizar todos los pedidos existentes, que son muy numerosos, en una base de datos. Para ello se han codificado, es decir, se les ha otorgado una clave numérica, los distintos elementos: los pedidos, los proveedores y los productos. Una persona sin experiencia carga todos los datos en una sola tabla: Página 10 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Nº PEDIDO FECHA 1 01/10/2005 2 20/10/2005 3 20/10/2005 Nº PROV NOMBRE PROV. Nº PROD 1 NOM PROD 1PRECIO 1 CANT 1TOT PROD 1Nº PROD 2 NOM PROD 2PRECIO 2CANT 2TOT PROD 2 TOTAL PEDIDO 3 IBM 1.200 10 12000 5 BASF 27 PC 5 DVD 1,5 200 300 5 BASF S.A. 5 CDROM 0,7 600 420 12000 7 CDROM 0.7 1000 700 1000 420 El campo clave es el número de pedido. ¿Cumple con las formas normales? La primera forma normal dice que no pueden existir conjuntos de dominios pertenecientes al mismo dominio (realmente la definición de relación indica que cada campo pertenece a un dominio distinto). En este caso, los campos ‘nº prod1’ y ‘nº prod2’ pertenecen al dominio de los números de producto. Igualmente ‘nom_prod1 y nom_prod2 pertenecen al dominio de los nombres de producto, etc. Deben eliminarse y colocarse en tabla aparte: De esta manera se elimina la restricción de que sólo se puedan informatizar pedidos con un máximo de dos pedidos (ahora no hay límite) y se obtiene una estructura más eficiente (no existen tantos campos vacíos, en los casos en que sólo hay un producto en el pedido). Esta nueva tabla tiene una clave compuesta por dos campos, el nº de pedido y el nº de producto. La segunda forma normal dice que se cumple si se cumple la primera y si todos los campos no clave dependen de la clave completa. Sólo se aplica a tablas con claves compuestas, como la que se acaba de crear. Si se revisa de qué dependen los campos no clave de esta tabla, se comprueba que el nombre del producto, así como su precio, sólo dependen del nº de producto, y no del pedido (no cambian para cada pedido del mismo producto), no así la cantidad y el coste total, que dependen del nº de producto y del pedido. Esta forma nos obliga a crear una tabla de productos. De esta manera se eliminan redundancias con los nombre de los pedidos y eliminamos la restricción de que para entrar un producto en la base de datos forzosamente tenía que haber un pedido suyo. Finalmente la tercera forma normal se cumple si se cumple la segunda y si ninguno de los campos no clave tienen dependencias transitivas. Si observamos la tabla de pedidos, vemos que el nombre del proveedor depende del nº de proveedor, que a su vez depende del nº de pedido. Se debe pues crea una tabla de proveedores: Página 11 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Con este esquema, todos los datos están informatizados, sin redundancias ni limitaciones. Integridad referencial Un concepto de una gran importancia es la integridad referencial de la base de datos. Una base de datos mantiene su integridad referencial cuando, si se modifica o elimina un valor de un campo clave, se modifican o eliminan todas las apariciones de ese valor en las otras tablas. Es decir, no puede aparecer un valor en una clave ajena de una tabla que no coincida con el mismo valor en una tabla como clave primaria. Modelos Entidad – Relación (E-R) Los modelos Entidad-Relación son una herramienta útil para el diseño de bases de datos relacionales. Permiten poner de manifiesto la estructura conceptual de la base de datos. Simplificando mucho, se puede decir que se utilizan sólo un reducido grupo de conceptos semánticos básicos: • • • Entidad: cualquier objeto distinguible relevante Propiedades: información que describe a las entidades de alguna manera. Si representa un campo clave, se subrraya Relación: relación entre entidades Para representar estos elementos se utilizan unos elementos gráficos dentro de un diagrama: • • • Entidad: rectángulo Propiedad: óvalo Relación: rombo El tipo de relación, que puede ser de uno a uno, de uno a muchos o de muchos a muchos, se representa con un 1 o una M. Cualquier estructura de base de datos relacionales puede representarse con un diagrama de este tipo (figura 8). La diferencia con un organigrama es que el diagrama E-R no tiene principio ni final, ya que representa un estado y no un proceso. Página 12 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Figura 8. Ejemplo de modelo E-R EL LENGUAJE CONCEPTUAL DE GESTIÓN DE BASES DE DATOS RELACIONALES SQL Características Hasta que no aparecieron los lenguajes conceptuales, para interrogar a una base de datos había que ser programador. En el año 1971 Codd define para IBM el lenguaje SQL (Structured Query Language) (CODD, 1971), llamado inicialmente SEQUEL (Structured English Query Language). En 1986 ANSI normaliza el lenguaje, de manera que actualmente es el universalmente utilizado e incorporado en todos los grandes sistemas de gestión de bases de datos relacionales: ORACLE, INFORMIX, SYBASE, MS-SQLSERVER, etc. SQL es un lenguaje conceptual, no procedural, de manera que indica qué se hace, pero no cómo se hace. El SQL se expresa con instrucciones en inglés simplificado para ser fácilmente memorizable. Se escribe indistintamente en mayúsculas o minúsculas y los blancos no son significativos. Dispone de instrucciones para manipular los registros y sus valores e instrucciones para construir y administrar la base de datos. Página 13 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Instrucciones de manipulación de tablas Las instrucciones para manipulación de los registros de las tablas y los valores de sus campos se reducen a cuatro: SELECT, DELETE, INSERT y UPDATE. SELECT Esta instrucción permite seleccionar los registros de una tabla con todos o parte de sus campos. La forma general es: SELECT * FROM tabla selecciona todos los campos de todos los registros de la tabla ‘tabla’ SELECT campo1, campo2, ..... FROM tabla selecciona los campos ‘campo1’ campo2’ ... de todos los registros de la tabla ‘tabla’ Pueden ponerse condiciones a la selección: SELECT campo1, campo2, ..... FROM tabla WHERE condición Selecciona los campos ‘campo1’ ‘campo2’ ... de la tabla ‘tabla’ que cumplan la condición ‘condición’. Las condiciones pueden ser muy variadas: WHERE campo1 = valor buscará aquellos registros en que campo1 = valor Se pueden utilizar todos los operadores matemáticos habituales: = igual < menor > mayor <= menor o igual >= mayor o igual <> distinto También se pueden utilizar los operadores lógicos: WHERE campo1 = valor1 AND campo2 = valor2 OR NOT Existe el operador BETWEEN (entre): WHERE campo1 BETWEEN valor1 AND valor2 NOT BETWEEN Página 14 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 También se puede comparar con una lista de valores: WHERE campo1 IN (valor1, valor2, ...valorn) O que no esté en la lista: WHERE campo1 NOT IN (valor1, valor2, ...valorn) Se puede exigir que sea el valor nulo o no nulo: WHERE campo1 IS NULL WHERE campo1 IS NOT NULL Si el campo es alfanumérico se pueden buscar subgrupos de caracteres: WHERE campo1 LIKE expresión% NOT LIKE Donde % significa cualquier cosa (comodín) Se pueden efectuar selecciones encadenadas: WHERE campo1 = ( SELECT campo2 FROM tabla2 WHERE condición) O seleccionar sólo si existe otra selección: WHERE EXISTS (SELECT campo2 FROM tabla2 WHERE condición) O seleccionar si está en otra selección: WHERE campo1 IN ( SELECT campo2 FROM tabla2 WHERE condición) NOT IN Se pueden seleccionar registros con campos con valore siempre distintos: SELECT DISTINCT campo FROM tabla WHERE condición Se pueden hacer selecciones compuestas de varias tablas: SELECT tabla1.campo1, tabla2.campo3 ... FROM tabla1, tabla2 WHERE tabla1.campo1 condición AND tabla2.campo3 condición Se pueden unir dos selecciones siempre que los campos unidos sean del mismo tipo: SELECT campo1 FROM tabla1 WHERE condición UNION SELECT campo3 FROM tabla2 WHERE condición También existen INTERSECT (busca sólo los comunes) y EXCEPT (se queda sólo con los no comunes). Existen una serie de funciones agregadas: o o COUNT(campo) número de registros con un campo SUM(campo) suma de los valores del campo Página 15 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 o o o MAX(campo) MIN(campo) AVG(campo) valor máximo de un campo valor mínimo de un campo valor medio de un campo Como es lógico debe definirse el criterio para agrupar los registros con los que se va a efectuar la operación: es la cláusula GROUP BY: SELECT SUM(campo1) FROM tabla WHERE condicion GROUP BY campo2 Todavía se le puede imponer condiciones a la selección con la cláusula HAVING: SELECT SUM(campo1) FROM tabla WHERE condicion GROUP BY campo1 HAVING campo1 condición DELETE, INSERT Y UPDATE • DELETE La cláusula DELETE permite borrar registros. La forma general es: DELETE FROM tabla WHERE condición donde condición incluye todas las posibilidades descritas para la cláusula SELECT Si no se pone condición, DELETE borra todos los registros de la tabla • INSERT La cláusula INSERT inserta registros nuevos en una tabla: INSERT INTO tabla (campo1, campo2 , ...campon) VALUES (valor1, valor2, . ..valorn) Para insertar un valor nulo se utiliza la palabra NULL • UPDATE Esta cláusula modifica valores de registros ya existentes: UPDATE tabla SET campo1 = valor1, campo2 = valor2, ...campon = valorn WHERE condición donde condición incluye todas las posibilidades descritas para la cláusula SELECT Instrucciones de creación y administración de la base de datos El SQL dispone de instrucciones específicas para construir la base de datos y para administrar su explotación. A continuación se exponen las más importantes: Página 16 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 • CREATE Permite crear tablas, índices y vistas CREATE TABLE tabla (campo1 tipo1 (NOT) NULL, campo2 tipo2 (NOT) NULL, ....campon tipon (NOT) NULL) Los tipos son: INTEGER entero SMALLINT entero corto FLOAT decimal corto DECIMAL p,q decimal con p dígitos y g decimales CHAR(n) alfanumérico de n caracteres VARCHAR(n) alfanumérico de hasta n caracteres DATE fecha TIME tiempo BLOB objetos binarios Para crear índices: CREATE (UNIQUE) INDEX índice ON tabla (campo1, campo2 ...) También se pueden crear tablas virtuales (vistas): CREATE VIEW vista AS selección Donde selección es una cláusula SELECT completa • DROP Permite borrar tablas, índices y vistas: Borra una tabla: DROP TABLE tabla Borra un índice: DROP INDEX índice Borra una vista: DROP VIEW vista • ALTER Modifica tablas: ALTER TABLE tabla ADD (campo1 tipo1 (NOT) NULL, ....) ALTER TABLE tabla DROP (campo1, campo2 ...) • GRANT Esta cláusula establece los permisos de acceso a todos los niveles de la base de datos: Página 17 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 Para permitir conectarse a la base de datos a un usuario: GRANT CONNECT ON base_datos TO usuario Otros permisos: GRANT SELECT ON tabla TO usuario DELETE INSERT UPDATE ALTER ALL Permite hacer selecciones, inserciones, borrados o modificaciones en la tabla a un usuario. Pueden especificarse campos: GRANT SELECT campo1,campo2, ... ON tabla TO usuario • REVOKE Elimina permisos concedidos : REVOKE CONNECT ON base_datos FROM usuario REVOKE SELECT ON tabla FROM usuario DELETE INSERT UPDATE ALTER ALL SQL embebido en lenguajes de programación Una interesantísima posibilidad es utilizar SQL ‘embebido’ en el código fuente de un lenguaje de programación. Para ello se necesita disponer del preprocesador correspondiente. A continuación se muestran dos listados correspondientes a extractos de programas con SQL embebido en FORTRAN y en lenguaje C. El paso de valores de campos de la base a variable se efectúa con variables precedidas de el símbolo “:”. • FORTRAN EXEC SQL BEGIN DECLARE SECTION CHARACTER*7 indctv CHARACTER*6 fecha DOUBLE PRECISION temed CHARACTER*120 SQLMessage EXEC SQL END DECLARE SECTION C (* End Host Variable Declarations *) n=0 do while (.true.) read(5,'(a7,a6,f6.1)',end=100)indctv,fecha,temed n=n+1 EXEC SQL UPDATE root.pluvio Página 18 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 1 2 SET temed = :temed WHERE indctv = :indctv AND fecha = :fecha IF (SQLCode .EQ. 100) THEN CALL Insert(indctv,fecha,temed) SQLCode = OK ENDIF IF (SQLCode .NE. OK) THEN CALL SQLStatusCheck CALL RollBackWork ELSE CALL CommitWork ENDIF end do 100 close(5) Modificar=.TRUE. RETURN END • LENGUAJE C #include <stdio.h> #define #define #define #define #define #define OK 0 Notfound 100 Multiple -10002 Deadlock -14024 True 1 False 0 EXEC SQL include sqlca; EXEC SQL BEGIN DECLARE SECTION; int indroea; short indroeaind; int fecha; int naa; short naaind; int tot_es, tot, tot_esc; int ano; short anoind; /* Indicativo estación */ /* Fecha */ /* No. años con precipitación */ /* Total estaciones */ EXEC SQL END DECLARE SECTION; main(argc,argv) int argc; char *argv[]; { int es1; int es2; int cont, i, j, n; /* Estación inicial: argv[2] */ /* Estación final: argv[3] */ /* Contador */ EXEC SQL CONNECT TO 'base'; if(sqlca.sqlcode != OK) error(); EXEC SQL BEGIN WORK; EXEC SQL DECLARE indicursor CURSOR FOR SELECT indroea INTO :indroea INDICATOR :indroeaind FROM estaf; Página 19 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 cont = 0; EXEC SQL OPEN indicursor; for(;;) { EXEC SQL FETCH indicursor; if(strncmp(SQLSTATE,"02",2) == 0) break; if(sqlca.sqlcode != OK && sqlca.sqlcode != Notfound) error(); naa = 0; EXEC SQL SELECT count(ano_hidr) INTO :naa INDICATOR :naaind FROM resum_a WHERE indroea = :indroea AND ano_hidr NOT BETWEEN 1931 and 1942; if(sqlca.sqlcode != OK && sqlca.sqlcode != Notfound) error(); printf("%d) estacion: %d naa = %d\n",cont,indroea,naa); EXEC SQL UPDATE estaf SET naa = :naa WHERE indroea = :indroea; cont++; } EXEC SQL CLOSE indicurdor; EXEC SQL FREE indicursor; fin(); } /********* Fin de lecturas en la base de datos ****/ fin() { EXEC SQL COMMIT WORK; EXEC SQL DISCONNECT CURRENT; } /*************** Función error SQL ***************************************/ error() { printf("\n%s %d\n","ERROR de INFORMIX SQL No. ",sqlca.sqlcode); exit(); } • BASIC (ASP) <html> <head> <base href="http:/HIDRO/estmt_coord.asp" fptype="TRUE"> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> <meta name="GENERATOR" content="Microsoft FrontPage 6.0"> <title>Estaciones meteorológicas por coordenadas</title> </head> Página 20 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI. Master en Ingeniería Medioambiental y Gestión del Agua 2007/2008 <body background="../backgrnd.gif"> <h1 align="CENTER">Base de datos HIDRO</h1> <p>&nbsp;</p> <h2><%@ LANGUAGE="VBScript" %><!--webbot bot="HTMLMarkup" StartSpan </div><%Set Connection = Server.CreateObject("ADODB.Connection") Connection.Open "DSN=hidro" SQLStmt = "SELECT estmt.indctv,estmt.nap,estmt.nat,estmt.nac, estmt.lugar, muni.munombre , cdr.corriente, estmt.xutm30, estmt.yutm30 " SQLStmt = SQLStmt & "FROM hidro:informix.cdr cdr, hidro:informix.muni muni, hidro: informix.estmt estmt " SQLStmt = SQLStmt & "WHERE estmt.muni_id=muni.muni_id AND estmt.num_cuenca=cdr. num_cuenca AND (estmt.xutm30 >= " & xmin & " and estmt.xutm30 <= " & xmax & " and estmt. yutm30 >= " & ymin & " and estmt.yutm30 <= " & ymax & " ) " SQLStmt = SQLStmt & "ORDER BY cdr.corriente, estmt.indctv " Set RS = Connection.Execute(SQLStmt) </body> </html REFERENCIAS BIBLIOGRÁFICAS • • • • CHAMBERLAIN, H & BOICE., 1974.” Language SEQUEL 2”. IBM. CODD E. F., 1971: “Normalized Data Structure: A Brief Tutorial”. IBM Research Report RJ 935. San José. California. 1971 CODASYL, 1971.” Informe CODASYL DBTG (Data Base Task Group)”. TSICHRITZIS, Dennis & KLUG, Anthony C., 1978. “The ANSI/X3/SPARC DBMS Framework Report of the Study Group on Dabatase Management Systems”. IS 3(3): 173-191 (1978). Univ. de Toronto. Canadá. Página 21 de 21 ©: Quedan reservados todos los derechos. (Ley de Propiedad Intelectual del 17 de noviembre de 1987 y Reales Decretos). Documentación elaborada por el autor/a para EOI. Prohibida la reproducción total o parcial sin autorización escrita de EOI.