Bases de datos - Amazon Web Services

Bases de datos Versión 1.1 Óscar Gómez Curso 2012-2013 Índice general 1. Introducción 1.1. Historia de las bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Historia del software libre GNU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3. Un repaso al resto del libro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 3 3 2. Diseño de bases de datos 2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Modelado de datos . . . . . . . . . . . . . . . . . . . . . 2.3. Modelos E/R . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . 2.5. Transformación de modelos E/R en modelos relacionales . 2.6. Normalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 . 5 . 6 . 6 . 11 . 22 . 24 3. Diseño físico 3.1. Introducción . . . . . . 3.2. BBDD en Access . . . . 3.3. Claves ajenas . . . . . . 3.4. MySQL . . . . . . . . . 3.5. Tablespaces y undo files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 27 31 31 37 . . . . . . . . 39 39 39 39 41 44 45 46 59 . . . . . . . . . . 4. Consultas SQL 4.1. Introducción . . . . . . . . 4.2. La sentencia SELECT . . . 4.3. Condiciones . . . . . . . . 4.4. Consultas con agregados . . 4.5. Consultas multitabla . . . . 4.6. Algunos ejercicios resueltos 4.7. Subconsultas . . . . . . . . 4.8. Actualización y borrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Programación 61 5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.2. Procedimientos almacenados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.3. Sentencias básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 I 5.4. 5.5. 5.6. Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Funciones MySQL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Solución al examen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 6. Administración 6.1. Introducción . . . . . . . . . . . . 6.2. Aspectos básicos de las contraseñas 6.3. El sistema de privilegios . . . . . . 6.4. El sistema de concesiones . . . . . 6.5. Usuarios con restricciones . . . . . 6.6. Vistas . . . . . . . . . . . . . . . . 6.7. Recuperando la clave de root . . . . 6.8. Copias de seguridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 79 79 80 82 82 83 85 85 7. Access 89 7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 7.2. El entorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 8. BBDD Objeto relacionales 8.1. Introducción . . . . . . . . . . . . . . 8.2. Instalación de PostgreSQL . . . . . . . 8.3. Uso de Postgres en una máquina virtual 8.4. Funcionamiento básico de Postgres . . 8.5. Comandos de Postgres . . . . . . . . . 8.6. Creación de tipos de datos . . . . . . . 8.7. Soporte documental . . . . . . . . . . 8.8. Sistemas de información geográfica . . 9. Índices y tablas II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 91 91 91 92 92 96 98 99 103 Bases de datos, Versión 1.1 Contents: Índice general 1 Bases de datos, Versión 1.1 2 Índice general CAPÍTULO 1 Introducción 1.1 Historia de las bases de datos 1.2 Historia del software libre GNU 1.3 Un repaso al resto del libro 3 Bases de datos, Versión 1.1 4 Capítulo 1. Introducción CAPÍTULO 2 Diseño de bases de datos 2.1 Introducción En general, la construcción de una casa se considera un proyecto de envergadura. Dado que no se puede permitir que cada uno de los participantes en el proyecto siga su propio ritmo o haga lo que crea conveniente, se asume que habrá un arquitecto que diseña una estructura y realiza los cálculos necesarios para que todo se construya correctamente. En las bases de datos ocurre lo mismo: determinados negocios necesitarán una infraestructura de información muy sofisticada por lo que puede ser conveniente disponer de unos “planos” que permitan la comunicación entre los distintos miembros que participan en un proyecto de desarrollo de un programa informático. Además, muy a menudo ocurre que transcurrido un tiempo, el usuario del programa desea hacer mejoras o ampliaciones pero por desgracia, la estructura de una base de datos o de un programa no son tan visibles como los muros de una casa. La existencia de los planos o diagramas que expliquen como se hizo una base de datos pueden ser de gran ayuda para tales mejoras. Es de esperar que un cliente con visión de futuro exija una cierta documentación de como se hizo un programa. Por otro lado, un problema habitual para los desarrolladores informáticos es la necesidad de conocer un poco el “dominio de conocimiento”. Es decir, si se necesita construir una base de datos que almacene información sobre impuestos, es muy probable que primero se necesite conocer un poco más como funciona ese mundo. El conocimiento que se obtenga junto a los requisitos que tenga el cliente deberían plasmarse de alguna forma en un documento. Al igual que la construcción de una casa requiere la elaboración de planos y cálculos el diseño de una estructura de almacenamiento de datos requiere que exista un mecanism Los diagramas como “planos” de una BBDD. Se utilizarán para que despues todo el mundo pueda entender qué hay dentro de la BBDD por si se necesita modificar algo. Un problema fundamental es el dominio de conocimiento. Como informáticos debemos intentar adquirir el conocimiento del cliente para reflejarlo en una BD. En esencia debemos intentar extraer la información RELEVANTE Otro problema de gran importancia es la ambigüedad. Se debe concretar al máximo el significado de cada palabra o término específico. En suma, un informático va a construir un modelo del conocimiento del cliente. La primera labor a la hora de construir una BD es modelar la información. 5 Bases de datos, Versión 1.1 Las reuniones, el proceso de desambigüación etc... deben plasmarse en una especificación de requisitos. Un ejemplo de especificación es el estándar IEEE 830, que ofrece una plantilla que podemos rellenar. Una vez hecha la especificación, se procederá a la realización del diseño, modelo, plano... 2.2 Modelado de datos Al hacer un modelo, plano o diagrama de datos, se hacen abstracciones • Hay que reseñar que no seremos expertos en el campo de aplicación. • Es muy importante utilizar un lenguaje estándar. • Los distintos SGBD (Sistemas Gestores de Bases de Datos) son muy distintos entre sí ◦ Por ejemplo, tenemos SGBD monolíticos: se caracterizan por utilizar un solo programa de uso y administración de los datos. ◦ También existen los SGBD basados en un modelo cliente/servidor. Los SGBD cliente/servidor hacen que los datos estén gestionados por un solo programa llamado servidor. A dichos datos pueden acceder montones de clientes. • Debido a estas diferencias el proceso de crear tablas necesita pasar por varias fases. ◦ Primero se debe hacer el llamado modelo conceptual. Este modelo consiste en hacer los diagramas que reflejan los requisitos. ◦ Despues haremos el llamado diseño lógico que consiste en crear una estructura de tablas y claves. ◦ Por último se debe hacer el diseño físico que consiste en pasar el diseño lógico a un lenguaje SQL de un SGBD. 2.3 Modelos E/R El modelo E/R se remonta al año 1970, cuando Peter Chen observó lo complejo que era diseñar una base de datos. Decidió crear un lenguaje común de símbolos que facilitara la comunicación. 2.3.1 Entidades Se denomina entidad a cualquier elemento sobre el cual se desea almacenar información. Aunque las entidades suelen corresponderse con los sustantivos, no todos los sustantivos merecen ser entidades que aparezcan en el modelo. Las entidades pueden ser fuertes o débiles: Una entidad fuerte es aquella que existe por sí sola. Una entidad débil es aquella que requiere que otra entidad exista antes que ella. Supongamos una situación como “empleado realiza viajes”. No se puede almacenar nada sobre un viaje si previamente no existe un empleado que lo realice. En la debilidad hay dos posibilidades: 6 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 Dependencia en existencia: una entidad es débil con dependencia en existencia si antes de poder “existir” o “almacenarse” requiere que otra entidad exista primero. Dependencia en identificación: la entidad débil no tiene clave propia sino que necesita la de otra entidad. 2.3.2 Ocurrencia de entidades En general una misma entidad puede ocurrir muchas veces, se dice que una entidad puede tener “varias instancias”. Una entidad “Coche” puede tener infinitas instancias como “Seat Ibiza CR-2785-X”, “Renault 21 8765-CWG”, ... 2.3.3 Interrelaciones Son asociaciones entre entidades. En general se corresponden con los verbos. Se representan por medio de un rombo con el nombre dentro. Las interrelaciones pueden ser entre distintos conjuntos de entidades Interrelación binaria: se da entre dos entidades. Interrelación ternaria: se da entre tres entidades que participan de forma simultánea en una asociación. Interrelación n-aria. Interrelaciones reflexivas: se dan entre una entidad y sí misma. El principal ejemplo se da en la sentencia “unos empleados son jefes de otros”. 2.3.4 Participación o “cardinalidad” En las bases de datos se debe reflejar el hecho de que las entidades puedan aparecer 0 veces, 1 vez, muchas veces. En el diagrama, se ponen las cardinalidades junto a la entidad y con el mínimo y el máximo. Para abreviar,a veces se ponen los máximos encima de la relación y tendremos entonces relaciones como esta: “Uno a uno” o 1:1 “Uno a muchos” o 1:n “Muchos a muchos” o m:n Ejercicios: hacer el diagrama E/R con entidades, debilidades, interrelaciones y cardinalidades de los siguientes supuestos. Hombre se casa con mujer en sociedad monógama Hombre se casa con mujer en sociedad polígama masculina Hombre se casa con mujer en sociedad polígama mixta Pescador pesca pez Arquitecto diseña casa 2.3. Modelos E/R 7 Bases de datos, Versión 1.1 Piezas forman producto • Téngase en cuenta que producto no es débil. Esto se debe a que podemos almacenar un producto en la base de datos indicando un hecho:”el producto P1 está hecho de los tornillos T1, T2 y T3”. Este hecho se puede almacenar aunque no tengamos físicamente los tornillos. A la hora de comprobar la “debilidad” de una entidad se debe ver si podemos almacenar los hechos o no, sin pensar en productos o piezas físicos. Turista visita hotel Jugador juega equipo Político gobierna país. Autor publica libro en una editorial • Podría verse la solución a esto como tres relaciones 1. Autor escribe libro 2. Libro es editado por editorial 3. Editorial publica libro • O como una relación ternaria: “Autor publica libro en editorial” • En resumen, ante las dudas debemos fabricar un diagrama que recoja las posibles asociaciones: supongamos que conocemos los siguientes hechos ◦ Cervantes escribe Quijote ◦ Cervantes escribe Novelas Ejemplares ◦ Iván López escribe Bases de datos ◦ M.J Castellanos escribe Bases de datos ◦ Ed. Anagrama publica Quijote ◦ Ed. Anagrama publica Novelas ejemplares ◦ Ed. Garceta publica Bases de datos ◦ Ed. Garceta publica Lazarillo • Si en las distintas asociaciones encontramos que hay asociaciones rígidas que no pueden cambiar, deberemos usar una interrelación ternaria: Cervantes escribe Quijote es un hecho que no puede variar. Es cierto que la otra asociación sí puede cambiar: por ejemplo, mañana Ed. Anagrama publica Bases de datos. Aunque esto es un hecho flexible la relación “AutorLibro” no puede cambiarse. 2.3.5 Atributos Se denomina atributos a propiedades de las entidades que tienen la importancia suficiente para almacenar datos sobre ellas y que por tanto aparecerán en el diagrama E/R. Los atributos suelen tener un dominio: es decir un conjunto de valores del cual toman su información. Un detalle sutil pero importante es que en ocasiones los atributos no son de las entidades, sino de las relaciones. Ej: pensemos en el diseño E/R de un enunciado como este: “un mecanico repara un coche en una cierta fecha del año”. La información de un conjunto cualquiera de mecánicos podría ser la siguiente 8 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 DNI 10 20 30 Nombre Juan Luis Angel Ap1 Sanz Sanz Diaz Ap2 Alcolea Ruiz Diaz Es evidente que no podemos poner la fecha de reparación en la entidad Mecánico: un mecánico solo podría reparar coches una vez en su vida, ya cada mecánico solo aparece una vez en la tabla. Por otro lado, supongamos la siguiente información sobre un conjunto de coches. Matric. 2211-ZW 4324-EE 5421-AA Marca Seat Renault VW Modelo Ibiza 21 Bora La fecha de reparación tampoco es de la entidad Coche: si lo hiciéramos así un coche solo podría repararse una vez en la vida (recordemos que cada coche solo aparece una vez en la tabla). A veces, hay atributos que se comportan de una forma especial y esto se recoge en el diseño E/R Atributos opcionales: pueden aparecer o no. Atributos monovaluados: solo toman un valor (o como mucho dos, por exclusión). Atributos compuestos: por ejemplo, el campo “Dirección”. Atributos derivados: son aquellos que pueden obtenerse o calcularse a partir de otros. Por ejemplo, el campo “Edad” puede obtenerse a partir de “Fecha de nacimiento”. 2.3.6 Entidades débiles Ya hemos dicho que hay entidades que muestran “debilidad” en base a dos características Dependencia en existencia: por ejemplo la entidad “Transacción” es débil con respecto a “Cuenta Corriente”. En este caso, la interrelación llevará una letra E, para indicar este tipo de dependencia. Dependencia de identificación: en este caso, la relación utiliza una I para señalar la dependencia. Ejercicio:¿Qué tipo de relación existe entre estas entidades? 1. Toro y Ganadería: Toro es débil (dependencia en identificación) con respecto a Ganadería. 2. Una empresa tiene un párking y desea almacenar qué empleados aparcan vehículos y los datos sobre los mismos. 2.3.7 Ejercicio de modelado Enunciado Analiza el siguiente enunciado y transfórmalo en DOS diagramas E/R. ¿Qué características reflejan uno u otro modelo?: Una serie de empresas con CIF, Nombre y Dirección desean ofrecer beneficios a sus clientes. Estos beneficios tienen un código, una descripción y una limitación. Para obtener dichos beneficios se emiten una serie de cupones que tienen un código y una fecha de vencimiento 2.3. Modelos E/R 9 Bases de datos, Versión 1.1 Solución No hay una solución correcta a partir de lo que nos dicen. Podemos pensar en dos posible situaciones 1. Las empresas son libres de ofrecer beneficios, modificarlos y hacer cambios cuando lo deseen. 2. Los beneficios solo los inserta un administrador y las empresas deben ceñirse a la lista de posibilidades que les ofrecemos Esto da lugar a que el ejemplo a) sea un modelo en el que se da libertad mientras que el modelo b) sea más rígido, lo que a su vez condiciona el modelo Podemos por tanto contemplar dos soluciones a partir de las tres entidades Empresa, Beneficio y Cupón 1. Dos relaciones binarias Relación “Empresa ofrece Beneficio” Relación “Beneficio Se Plasma En Cupón” 2. Una sola relación ternaria “Empresa con Beneficio con Cupón” Imaginemos las tres tablas, Empresa, Beneficio y Cupón. CIF E1 E2 Nombre ACME XYZ Sport Direccion C/ Guadiana C/ Rio Codigo B1 B2 Desc. 10 % desc. 5 % desc Codigo C1 C2 Fecha venc 31-12-2011 20-12-2011 Limit. Excepto rebajas LaJ A la hora de insertar en la tabla Beneficios puede que si damos libertad acaben apareciendo filas iguales Codigo B1 B2 B3 B4 B5 Desc. 10 % desc. 5 % desc 5 % desc 5 % desc 15 % desc. Limit. Excepto rebajas LaJ LaJ LaJ Solo S y D En este caso, B2, B3 y B4 corresponden a los beneficios que ofrecen distintas empresas, dando la casualidad de que sus descripciones son iguales. Hay quien considera eso un problema, pero no lo es, sino que es una consecuencia de la libertad que tienen las empresas para actuar. 2.3.8 Herencia En ocasiones hay objetos que comparten muchas propiedades y características. Supongamos el ejemplo de una base de datos para la DGT. Para cada coche puede haber un dueño, pero este dueño puede ser una persona física o jurídica. Si construyéramos dos entidades separadas “Persona” y “Empresa” descubriríamos que tienen cosas en común. Para ahorrar esfuerzos se puede poner una sola entidad general que “ofrece” los atributos, y dichos atributos son “heredados” por las entidades hija. 10 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 Cuando hay una herencia es posible que una instancia pueda ser de dos entidades a la vez. Por ejemplo, pensemos en las entidades “Personal Contratado” y las entidades “Estudiante” y “Trabajador”. ¿Puede una persona ser estudiante y trabajador a la vez? SÍ . Por lo tanto esta herencia no es disjunta, pero la de “Persona” y “Empresa” sí es disjunta. Las herencias disjuntas se marcan con una “d” en el triángulo. 2.3.9 Relaciones exclusivas A veces dos entidades pueden ir relacionadas por dos o más conexiones. En determinadas situaciones interesa restringir el número de conexiones posibles. Por ejemplo, cuando una entidad “Cliente” se conecta con una entidad “Piso” puede hacerlo por medio de varias relaciones como “Vende”, “Alquila”, “Hace leasing”. Si por ejemplo la ley obligase a que solo podamos tener un tipo de relación, se pondrá un arco en las relaciones. 2.4 Problemas 2.4.1 Problema 1: Comunidades de vecinos Una firma de abogados dedicada a la administración de fincas desea tener una base de datos para gestionar la información de sus clientes. La firma tiene varios abogados y cada uno de ellos ejerce de administrador de una o más comunidades de vecinos, por lo que cobra unos honorarios anuales. Una comunidad es gestionada por un único administrador (nombre, DNI y número de colegiado). Las funciones de un administrador consisten en llevar la contabilidad de la comunidad, gestionar los recibos y realizar los pagos a las distintas compañías (luz, agua...) De las empresas que cada comunidad tiene contratadas se guarda su nombre, dirección, teléfono y una persona de contacto. Además puede interesar tener agrupadas a las compañías por sectores (sector de seguridad, sector de suministros básicos). De cada comunidad se almacena un código, su nombre, calle, código postal y población. Cada comunidad consta de una serie de propiedades que pueden ser de tres tipos (vivienda particular, local y oficina). Cada propiedad se caracteriza por un número de portal, planta y letra, un nombre y apellidos del propietario, un porcentaje de participación en los gastos de la comunidad así como los datos de la cuenta bancaria en la que el propietario desea se le domicilie el pago de los recibos. Si el propietario no habita en su propiedad se necesitan sus datos (nombre, apellidos, dirección y teléfono) y los datos de su inquilino (nombre apellidos y teléfono). Si la vivienda es particular se guarda el número de habitaciones. Si es un local se almacena el tipo de local y el horario. Si es una oficina se guarda la actividad a la que se dedica. Cada comunidad tiene un presidente (nombre, apellidos y propiedad de la que son dueños) y varios vocales que tratan con el administrador los asuntos que hay que tratar. Cada comunidad tiene una cuenta en un banco y todo banco tiene un código y un nombre comercial. De las cuentas se almacena el código de cuenta (que consta de un código de sucursal, dos dígitos de control y un número de cuenta) y un saldo. Para identificar la cuenta hay que añadir el código del banco al código de cuenta. Se almacenan dos tipos de apuntes: 2.4. Problemas 11 Bases de datos, Versión 1.1 El banco emite los recibos, pero el administrador guarda información sobre dichos recibos como el número de recibo, fecha, importe y si se ha podido cobrar o no. Esta última información se necesitará para llevar un registro de impagados. En cuanto a los apuntes sobre gastos se tienen los importes que cobran las empresas contratadas por cada comunidad. Las compañías cobran sus recibos (número, fecha e importe) cargándolo en la cuenta de la comunidad 2.4.2 Solución al problema 1 0. Leer el enunciado completo 1. Leer otra vez examinando cuidadosamente los elementos siguientes 1.1. Sustantivos: entidades/atributos 1.1.1. Abogado/administrador 1.1.2. Finca/propiedad 1.1.2.1. Num de portal 1.1.2.2. Planta y letra 1.1.2.3. ¿Nombre y ap del propietario? Esta frase nos dice que el nombre y el apellido del propietario deben estar aqui. Sin embargo, si luego resulta que necesito una entidad Propietario, ya no podremos poner a esa entidad estos atributos. Si resulta que luego necesitamos esta entidad habremos descubierto que “Propiedad” es débil por identificación. 1.1.2.4. Porcentaje de particip. 1.1.2.5. Datos cuenta bancaria 1.1.3. Comunidad de vecinos 1.1.3.1. Nombre 1.1.3.2. Calle 1.1.3.3. CP 1.1.3.4. Población 1.1.4. Honorarios 1.1.5. Funciones 1.1.6. Pagos 1.1.7. Compañía 1.1.8. Empresa 1.1.8.1. Nombre 1.1.8.2. Dirección 1.1.8.3. Teléfono 1.1.8.4. Persona de contacto 12 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 1.1.9. Sector 1.1.10. Tipos 1.1.10.1. Viv. particular Num. habitaciones 1.1.10.2. Local Tipo Horario 1.1.10.3. Oficina Actividad 1.1.11. Propietario 1.1.1. Nombre 1.1.2. Apellidos 1.1.3. Dirección 1.1.4. Teléfono Al leer que un propietario tiene que aparecer como entidad, descubrimos que “Propiedad” va a ser débil, como supusimos. 1.1.12. Inquilino 1.1.12.1. Nombre 1.1.12.2. Apellidos 1.1.13. Presidente 1.1.13.1. Nombre 1.1.13.2. Apellidos 1.1.13.3. Propiedad que poseen 1.1.14. Vocales 1.1.15. Cuenta 1.1.15.1. Código de cuenta 1.1.15.2. DC 1.1.15.3. Número de cuenta 1.1.15.4. Código de banco Como nos dicen que se necesita el código del banco para poder “identificar” esta entidad, hemos descubierto que esta entidad es débil 1.1.16. Banco 1.1.16.1. Codigo de banco 1.1.16.2. Nombre comercial 2.4. Problemas 13 Bases de datos, Versión 1.1 1.1.17. Apunte 1.1.17.1. Recibo (cobramos a prop) Número de recibo Fecha Importe ¿Se pagó? 1.1.17.2. Pago (pagamos luz..) Número de recibo Importe Fecha 1.2. Verbos: relaciones 1.2.1 “Abogado” administra “Comunidad” 1.2.2 “Abogado” cobra “Honorarios” (¡¡MAL!!, los honorarios no llegarán a ser entidad) 1.2.3 “Comunidad” es gestionada por “Abogado” es lo mismo que “administra” 1.2.4 “Administrador” realiza funciones 1.2.5 “Comunidad” contrata “Empresa” 1.2.6 “Comunidad” consta de “Propiedades” 1.2.7 “Propiedad” paga a través de “Cuenta” 1.2.8 “Comunidad” tiene “Presidente” 1.2.9 “Comunidad” posee “Vocales” 1.2.10 “Comunidad” opera con “Cuenta” 1.2.11 “Banco” emite “Recibo” 2.4.3 Problema 2: Ajedrez La federación de ajedrez desea disponer de una base de datos de todas las partidas que se celebren bajo su auspicio. Toda partida viene caracterizada por una fecha de inicio, una duración en horas, los jugadores que se enfrentaron y si eligieron blancas o negras Dos jugadores pueden enfrentarse solo una vez por día, aunque pueden hacerlo muchas veces en días distintos. Se anota cada movimiento de la partida: número de movimiento, casilla de origen y casilla de destino. Si se borra una partida se deben borrar los movimientos Las partidas no pueden ser aplazadas De los jugadores se recogen sus nombres, apellidos, dirección postal y electrónica, la federación a la que pertenecen y el número de federado (que es único en cada federación) 14 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 Solo hay una federación por país con un nombre, país al que pertenece, telefono de contacto y fecha de fundación Una federación no se clausura hasta que no se reasignan sus jugadores a otra federación. Las partidas pueden darse o no dentro de un torneo. Los torneos tienen un nombre, periodicidad, fecha de creación y son organizados por una federación En cada edición de un torneo (número ordinal) se registran todos los enfrentamientos y el nombre del ganador. También se anotan la fecha de inicio, la cuantía del premio y el jugador que lo gana Si desaparece una federación, desaparecen los torneos y por ende, sus ediciones Aunque un jugador desaparezca, sus partidas no deben desaparecer 2.4.4 Solución al problema 2 (ajedrez) Entidades Federación • Atributo:nombre • Atributo:país Partida • Atributo:fecha de inicio • Atributo:duración • Atributo:¿blancas? Jugador • Atributo:nombre • Atributo:apellidos • Atributo:dirección postal • Atributo:dirección electrónica • Atributo:num de federado Movimiento • Atributo:número • Atributo:casilla origen • Atributo:casilla destino Torneo: es una entidad débil ya que nos dicen “Si desaparece una federación, desaparecen los torneos y por ende, sus ediciones”. Por tanto, no puede haber torneo en la BD sin que haya una federación que lo organice. • Atributo:nombre • Atributo:periodicidad • Atributo:fecha 2.4. Problemas 15 Bases de datos, Versión 1.1 • Atributo:ganador • Atributo:fecha inicio • Atributo:periodicidad • Atributo:cuantía del premio Relaciones Se necesita una relación para conectar los jugadores con partida: “Partida enfrenta jugadores”. El enfrentamiento tiene atributos • También podríamos considerar que hay una sola relación reflexiva “Jugador Se Enfrenta Con Jugador”. Esta relación tendría atributos como “fecha de inicio”, “duración”, etc... “Partida Consta De Movimiento”: aquí se descubre que Movimiento es débil, no puede almacenarse un movimiento sin que esté “dentro de una partida” “Jugador Pertenece A Federación”. Hay dos posibilidades de relación • “Federación organiza Torneo que Consta De Partidas”: relación ternaria • “Federación organiza Torneo y Torneo Consta De Partidas”: dos binarias • Dado que se permite que las partidas estén o no dentro de un torneo es más apropiados que el modelo permita cierta libertad para lo cual es más apropiado utilizar las dos binarias. 2.4.5 Problema 3: Formación El departamento de formación de una empresa desea construir una BD para planificar y gestionar la formación de sus empleados. Los supuestos semánticos que deben recogerse son los siguientes: La empresa organiza cursos internos de formación de los que se desea conocer el código de curso, el nombre, una descripción, el número de horas de duración y el coste del curso. Un curso puede tener como prerrequisito haber realizado otro(s) previamente, y, a su vez, la realización de un curso puede ser prerrequisito de otros. Un curso que es prerrequisito de otro puede serlo de forma obligatoria u opcional. Un mismo curso tiene diferentes ediciones, es decir, se imparte en distintos lugares,fechas y con diversos horarios (intensivo, mañana o tarde). En una misma fecha de inicio sólo puede impartirse una edición de un curso. Los cursos se imparten por personal de la propia empresa. Un curso puede tener varios docentes pero una edición sólo tiene un profesor. De los empleados se desea almacenar su código de empleado, nombre y apellidos,dirección, teléfono, NIF, fecha de nacimiento, nacionalidad, sexo, firma y salario,así como si está o no capacitado para impartir cursos. Un mismo empleado puede ser docente en una edición de un curso y alumno en otra edición, pero nunca puede ser ambas cosas a la vez (en una misma edición de un curso o lo imparte o lo recibe) 16 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 2.4.6 Solución al problema 3 (Formación) Entidades Curso • Código de curso (clave) • Nombre • Descripción • Duración (número de horas) • coste Edición (débil con respecto a curso) • Lugar • Fecha: clave • Horario Empleado • Nombre • Ap • Dirección • Tlf • Dni: clave • Nacionalidad • Firma • Sexo • Salario • Capacitado Relaciones “Curso Es Prerrequisito De Curso”: muchos a muchos “Curso Celebra Ediciones”: edición es débil con respecto a curso “Empleado Imparte Edición”. “Empleado Sigue Edición” Nos dicen que no se puede hacer las dos cosas a la vez en una edición, o una u otra. 2.4. Problemas 17 Bases de datos, Versión 1.1 2.4.7 Problema 4: viveros Se desea diseñar una Base de Datos para gestionar los empleados y productos a la venta de una cadena de viveros dedicados a la venta de diversos productos relacionados con la jardinería. Los supuestos que hay que recoger en la BD son los siguientes: La cadena de viveros dispone de varios viveros en la provincia de Madrid identificados por un código de tienda y de los que se almacenará un teléfono, una dirección y un responsable que será uno de los empleados que trabaja en el vivero (es necesario almacenar durante qué períodos de tiempo ha sido responsable cada empleado). Los productos que se venden tienen asignado un código de producto y nos interesa guardar el precio y el stock que hay de cada producto en cada uno de los viveros y pueden ser de tres tipos: plantas de las que se guardará su nombre, y una breve descripción de los cuidados que requiere; accesorios de jardinería y artículos de decoración. Estos productos se distribuyen en zonas dentro de cada vivero cada una de ellas identificadas por un nombre dentro de cada vivero (zona exterior regadío, interior climatizada, zona de caja, etc.). Se desea conocer el stock de cada producto de acuerdo a las zonas del vivero.Los empleados estarán asignados a una determinada zona en un vivero la cual podrá cambiar a lo largo del tiempo (se guardará histórico de ello) y además, los empleados puedenmo verse de un vivero a otro según las necesidades en distintos períodos de tiempo. De los empleados se quiere conocer su DNI, su nombre y un teléfono de contacto.En cuanto al proceso de venta de los distintos productos, sólo se almacenarán los pedidos que realizan los clientes pertenecientes al Club VIP que es una promoción especial que permite a los clientes obtener descuentos según las cuantías de sus compras. De estos clientes se almacena su DNI, su nombre, dirección, teléfono y la fecha de incorporación al club así como los datos de sus pedidos que incluyen un número de pedido, la fecha de realización, los productos adquiridos junto con las unidades y el descuento realizado; por último, también se incluye el precio de los portes en caso de que se hayan contratado. De cada cliente se almacenarán todos los pedidos que haya realizado hasta la fecha.En cuanto a estos pedidos de clientes pertenecientes al Club VIP interesa también guardar quién fue el empleado que lo gestionó y en qué vivero se realizó el pedido teniendo en cuenta que un pedido en un determinado vivero lo gestiona un único empleado Solución al problema 4 (Viveros) Entidades: Empleado • DNI • Nombre • Número de contacto Producto • Código • Precio • Stock (más tarde se descubre que stock NO ES UN ATRIBUTO DE PRODUCTO sino de una relación) Planta es una entidad hija de Producto 18 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 • Nombre • Cuidados Accesorio de jardinería (hija de producto) Artículo Viveros • Código • Teléfono • Dirección • ¿Responsable? No, esto es una relación Zona • Nombre (clave) Pedido • Número: clave • Fecha • Unidades, precio de portes y descuento son atributos de una relación cuyo nombre todavía no conocemos. Cliente: habrá “Normales” y “Club VIP” • DNI • Dirección • Teléfono • Fecha de incorporación (solamente para el club VIP) Relaciones: “Empleado es Responsable De Vivero” tiene unos atributos de fecha de inicio y fin. “Producto Se Distribuye en Zona”. Esto implica que hay un atributo en esta relacion llamado Stock. “Empleado Trabaja en Zona” A la hora de almacenar el hecho de que un pedido consta de varios productos vamos a descubrir que la relación ternaria no es la mejor opción ya que nos obligaría a que en un pedido solo apuntásemos un producto VIP1 VIP1 VIP1 Ped1 Ped1 Ped1 Rosas Tijeras Semillas Técnicamente, esta relación ternaria es capaz de guardar el hecho de que el cliente VIP1, en su pedido 1 compró “Rosas, Tijeras y Semillas”, sin embargo este modelo ternario nos está obligando a repetir datos. Como conclusión la relación “Cliente hace pedido que consta de Artículos” no es la mejor opción, sino que desglosaremos esto en dos binarias “Vip Realiza Pedido” (esto implica que Pedido es débil) 2.4. Problemas 19 Bases de datos, Versión 1.1 “Pedido consta de Productos”. Hay una relación a cuatro entre “Pedido” “Cliente VIP”, “Vivero” y “Empleado” Problema 2.4.8 Problema 5: Universidad El Departamento de Informática de la universidad necesita una base de datos para almacenar la información concerniente a los proyectos de investigación tanto actuales como pasados en los que trabajan los profesores y así poder llevar a cabo una gestiónmás eficiente. La información que se desea almacenar corresponde a los siguientes supuestossemánticos. En el departamento los profesores participan en proyectos de investigación caracterizados por un código de referencia único, por un nombre, un acrónimo, un presupuesto total, el programa de I+D que lo financia, una fecha de inicio y una fecha de finalización y una breve descripción de los objetivos del proyecto. En los proyectos trabajan profesores del departamento durante un período de tiempo, esdecir, una fecha de inicio y una fecha de fin, pudiendo ocurrir que un profesor trabaje en elmismo proyecto en varias épocas (f_ini, f_fin) diferentes. Un profesor se identifica por su nombre y apellidos y se caracteriza por su despacho y teléfono y puede trabajar en varios proyectos simultáneamente y en un proyecto de investigación trabajan varios profesores. De todos los profesores que trabajan en el proyecto hay uno que es el investigador principal deproyecto que interesa conocer. Es importante tener en cuenta que el profesor investigador del proyecto nunca varía a lo largo de la vida del proyecto de investigación. Los profesores pueden ser doctores o no doctores, de tal manera que un profesor nodoctor siempre tiene a un único profesor doctor como supervisor en un momento determinado,interesando almacenar los supervisores y períodos de tiempo de la supervisión que ha tenido undeterminado profesor no doctor. En relación con la participación de los profesores en proyectosde investigación, el investigador principal de un proyecto siempre tiene que ser un doctor.Por otro lado, los proyectos de investigación producen una serie de publicaciones sobrelas que también interesa guardar información. Una publicación se caracteriza por un número en secuencia dentro de cada proyecto de investigación y se guardará el título y los profesores que la han escrito; las publicaciones son de dos tipos, publicaciones en congresos y publicaciones en revista; de las primeras se almacenará el nombre del congreso, su tipo (nacional ointernacional), la fecha de inicio y de fin, el lugar de celebración, país y la editorial que hapublicado las actas del congreso (si es que se han publicado); de las publicaciones en revista interesa saber el nombre de la revista, la editorial, el volumen, el número y las páginas de inicio y fin. No solamente interesa conocer los profesores que han participado en las publicaciones de los proyectos de investigación sino también las líneas de publicación que cubren estas publicaciones. Una línea de investigación se identifica por un código, un nombre (por ejemplo,recuperación de información multilingüe, bases de datos espacio-temporales, etc.) y un conjunto de descriptores (por ejemplo, la línea de investigación bases de datos temporales puede tener como descriptores Bases de Datos, SGBD Relacional, Dimensión temporal). Los profesores tendrán asociados en la BD las líneas de investigación en las quetrabajan incluso podría ocurrir que hubiera profesores que no tuvieran ninguna línea asignada.Así, tanto los profesores doctores como los no doctores pueden escribir publicaciones sobre una o más líneas de investigación y nos interesa saber sobre qué línea de investigación ha escrito un determinado 20 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 profesor en una publicación, teniendo en cuenta que un profesor queparticipa en una publicación sólo escribe en el ámbito de una línea de investigación y que una determinada publicación puede cubrir varias líneas de investigación Solución: entidades Proyecto • código de referencia único • un nombre • un acrónimo • un presupuesto total • el programa de I+D que lo financia • una fecha de inicio y una fecha de finalización • y una breve descripción Profesor • Nombre y apellidos. • Despacho y teléfono. • ¿Investigador principal hijo de Profesor? Es mala idea porque usaríamos una entidad para algo que aparecerá una sola vez. • “Doctor” y “No doctor” sí pueden ser entidades hija. Publicación. • Número • Título • Profesores que lo escriben (esto será una relación) • “En congreso” y “En revista” serán entidades hija. ◦ En congreso tiene los atributos: Tipo, nombre, fecha de inicio, de fin, lugar de celebración, país y editorial. ◦ En revista tiene los atributos: nombre de revista, el volumen, editorial, páginas de inicio y fin. Línea • Código • Nombre Descriptores: • Nombre 2.4. Problemas 21 Bases de datos, Versión 1.1 Solución: relaciones “Profesor Participa en Proyecto” “Profesor dirige proyecto”, esta relación contiene el hecho de que un proyecto tiene 1 y solo 1 “investigador principal”. “Doctor supervisa a No Doctor” “Doctor dirige proyecto”, esta relación sustituye a la anterior “Profesor dirige proyecto”. “Proyecto produce publicación”. En realidad, más adelante descubriremos que el Profesor debe intervenir en esta relación dando lugar a una relación ternaria “Proyecto produce publicación en la que interviene profesor” 2.5 Transformación de modelos E/R en modelos relacionales Toda entidad se convierte en tabla. Toda entidad débil se convierte en tabla. La clave de esta tabla será la mezcla de la clave del débil más la clave del fuerte. En una herencia, la entidad padre se convierte de forma normal. Las hijas heredan la clave del padre (y en las hijas será además clave ajena). En las relaciones se trabaja de la siguiente forma • Si la relación es 1:1 ambas entidades se convierten a tablas Y UNA DE ELLAS TOMA LA CLAVE DE LA OTRA que actuará solo como clave ajena • Si la relación es 1:N el que tiene el N toma la clave del que tiene el 1, que actuará como parte de la clave primaria además de ser clave ajena. Si además la relación tuviera atributos, estos atributos van en el que tiene el N. • Si la relación es M:N LA RELACIÓN SE CONVIERTE EN TABLA. La clave de esa tabla es la mezcla de las claves de los participantes. Todas ellas actúan además como claves ajenas. Si la relación tiene atributos los ponemos en esta tabla. 2.5.1 Transformación del modelo “Universidad” Se muestran en negrita las claves primarias. Publicación (Número, Título) EnCongreso(Número, Título, Tipo, FechaInicio, FechaFin, Lugar, País, Editorial) • Clave ajena: La pareja (Número,Título) es clave ajena sobre Publicación(Número,título) EnRevista(Número, Título, Nombre, Volumen, Editorial, PaginaInicio, PaginaFin) • Clave ajena: La pareja (Número,Título) es clave ajena sobre Publicación(Número,título) Línea (CódigoLínea, Nombre) Descriptor (Nombre) EntraEn(CódigoLínea, NombreDescriptor) • Clave ajena: CódigoLínea es clave ajena sobre Línea(Código) 22 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 • Clave ajena: NombreDescriptor es clave ajena sobre Descriptor(Nombre) Cubre(Numero, Título, CodigoLinea) • Clave ajena: La pareja (Número,Título) es clave ajena sobre Publicación(Número,título) • Clave ajena: El atributo CodigoLinea es clave ajena sobre Linea(Codigo) Profesor (Nombre, apellidos, Despacho, Tlf) Doctor (Nombre, apellidos) NoDoctor (Nombre, apellidos, Nombre, apellidos) • Clave ajena: La segunda pareja (nombre,apellidos) es clave ajena sobre Doctor(Nombre, apellidos). Solo es clave ajena por ser una relación 1:n Produce (Nombre, apellidos, número, título, código) • Clave ajena: La pareja (nombre,apellidos) es clave ajena sobre Profesor(Nombre, apellidos). • Clave ajena: La pareja (número, título) es clave ajena sobre Publicación (número, título) • Clave ajena: El atributo Código es clave ajena sobre Línea(Código) Proyecto (CódigoProyecto, Nombre, Acrónimo, Presupuesto, programa, FechaInicio, Fechafin, Descripción, Nombre, apellidos) • Clave ajena: La pareja (nombre,apellidos) es clave ajena sobre Doctor(Nombre, apellidos). Solo es clave ajena por ser una relación 1:n. Por favor, téngase en cuenta que Doctor es la entidad que intervenía en la relación Y NO LA ENTIDAD PROFESOR. Participa (Nombre, apellidos, CodigoProyecto) • Clave ajena: La pareja (nombre,apellidos) es clave ajena sobre Profesor(Nombre, apellidos). • Clave ajena: El atributo CódigoProyecto es clave ajena sobre Proyecto(CodigoProyecto) 2.5.2 Transformación del modelo “Ajedrez” Partida (CódigoPartida, FechaInicio, Duración) Movimiento (CodigoPartida, Numero, CasillaOrigen, CasillaDestino) • Clave ajena: CodigoPartida es clave ajena sobre Partida(CodigoPartida) • Inciso: Según la regla de transformación 1:n, codigo partida debe ser ajena. Sin embargo una regla anterior nos ha dicho que debe formar parte de la clave primaria. Federacion(Nombre, Pais) Jugador (Nombre, apellidos, NumeroDeFederado, DireccionPostal, DireccionElectronica, NombreFederacion) • NombreFederacion es clave ajena sobre Federacion(Nombre) Enfrenta es una relación m:n. Se convierte en tabla. frenta(CodigoPartida,Nombre,Ap,Fecha,Vencedor, NombreBlancas, ApBlancas) En- • CodigoPartida es ajena sobre Partidas(CodigoPartida) • La pareja (Nombre, Apellidos) es clave ajena sobre Jugador(Nombre, Apellidos) • La pareja (NombreBlancas,ApellidoBlancas) es ajena sobre Jugador(Nombre,Apellidos) 2.5. Transformación de modelos E/R en modelos relacionales 23 Bases de datos, Versión 1.1 • A tener en cuenta: esta tabla ilustra que un diseño mejor habría sido tener dos relaciones como “Se enfrenta con blancas” y “Se enfrenta con negras”. Aún así, habría que programar Torneo (NombreTorneo, NombreFed, Periodicidad,Cuantia) • NombreFed es clave ajena sobre Federación(Nombre) Edición (Numero, NombreTorneo,NombreFed, Nombre,Apellidos) • La pareja (NombreTorneo,NombreFed) neo(NombreTorneo,NombreFed) es clave ajena sobre Tor- • La pareja (Nombre,Apellidos) es clave ajena sobre Jugador(Nombre,Apellidos) En este punto debemos reformar la tabla partida y dejarla así • Partida (CódigoPartida, FechaInicio, Duración, NumeroEdicion, NombreTorneo, NombreFederacion) ◦ El trío (NumEdicion, NombreTorneo, NombreFederacion) es clave ajena sobre Edicion(NumEdicion,NombreTorneo,NombreFederacion) 2.5.3 Transformación del modelo “Fincas” Resuelto en la pizarra 2.6 Normalización Cuando se elabora un diseño de tablas, puede ocurrir que aún siga existiendo mucha redundancia. Al diseñar tablas se debe examinar la redundancia que pueda existir en ellas. Estas redundancias suelen ser visibles a simple vista: Dado un CP se puede deducir la Población. Estas redundancias adoptan un nombre muy concreto: “Dependencias funcionales” o tambien “implicaciones”. A veces, las dependencias funcionales implican varios campos en conjunto. Supongamos una tabla como esta Jugador (Nombre,ap, país) Cuando en una dependencia hay varios atributos se le llama “dependencia funcional completa”. Para eliminar una dependencia crearemos una tabla separada de la tabla inicial. En la nueva tabla pondremos estos campos: el implicante y los implicados La clave de la nueva tabla es el implicante (o los implicantes, si hay varios) En la tabla vieja se borran todos los implicados y el implicante se convierte en clave ajena sobre la nueva tabla. Recordemos un par de conceptos Clave primaria: es un atributo (o pareja, o trío) que sabemos que no se va a repetir. Clave candidata: es un atributo (o pareja) que PODRÍA ACTUAR COMO PRIMARIA pero no lo hemos elegido. Transitividad: supone que si “A implica B” y “B implica C”, automáticamente sabremos que “A implica C”. 24 Capítulo 2. Diseño de bases de datos Bases de datos, Versión 1.1 2.6.1 Primera forma normal (1FN) Una tabla está en 1FN si en cada atributo se prohíbe insertar más de un valor. 2.6.2 Segunda forma normal (2FN) Una tabla está en segunda forma normal si todos los campos tienen dependencia completa respecto a la clave. Supongamos una base de datos con una tabla como esta Compras(CodigoProveedor, CodigoProducto, NombreProducto, Cantidad). En esta tabla es fácil observar que hay una dependencia funcional pero no completa con respecto a la clave (CodigoProveedorProducto) sino parcial, de la forma “CodigoProducto implica Nombre”. 2.6.3 Tercera forma normal Una tabla está en 3FN si está en 2FN y además no hay dependencias transitivas. 2.6. Normalización 25 Bases de datos, Versión 1.1 26 Capítulo 2. Diseño de bases de datos CAPÍTULO 3 Diseño físico 3.1 Introducción En general hemos seguido un proceso lógico en la creación de bases de datos. Tema 1: posibilidades Tema 2: Diseño • Análisis • Diseño E/R • Pasar a un diseño relacional • Normalización. 3.2 BBDD en Access 3.2.1 Interfaz “Vista de tabla” Access crea automáticamente un campo llamado ID que actuará como clave primaria. Este campo ID usará un tipo llamado “Autonumérico” Dicho campo es un número entero Se incrementa automáticamente cuando pasamos a otra fila. 3.2.2 Tipos de datos Access maneja los siguientes tipos de datos Texto Acepta letras, números y símbolos pero solo acepta conjuntos de longitud pequeña (255 símbolos máximo) 27 Bases de datos, Versión 1.1 Memo Acepta textos largos. Fecha Permite manejar datos relacionados con las fechas y con sus intervalos. Numéricos Se reservan para datos para los cuales se deseen hacer operaciones matemáticas. Los tipos numéricos pueden concretarse aún más: Byte: acepta números en el rango 0-255 Enteros cortos: números entre -32767 y 32768 Entero largo: a nivel interno usa 32 bits (-2^32 hasta 2^32) Decimal: acepta decimales al nivel que le indiquemos Simple: acepta negativos y decimales de precisión variable Doble: acepta negativos y decimales muchísimo más grandes y con mucha más precisión decimal En general la regla es: “cuanto más corto es el campo más rápido se procesa pero menos precisión nos ofrece” Sí/No Reservado para valores lógicos (True/False) 3.2.3 Formato de datos Se puede controlar la apariencia que tendrán los datos en pantalla, por ejemplo, una fecha puede mostrarse como 13-2-85 o 13/2/1985 Formato de la fecha En el formato de la fecha se deben usar tres símbolos básicos para manejar el día, el mes y el año,que son respectivamente d, m y a d-m-aa: Escribe algo como “1-3-81” d-m-aaaa: Escribe algo como “1-3-1981” d-mmm-aaaa: Escribe algo como “1-Mar-1981” dd-mmm-aaaa: Escribe la fecha “01-Mar-1981” dd-mm-aaaa: Escribe la fecha “01-03-1981” dd/mm/aaaa: Escribe la fecha “01/03/1981” dd/mmmm/aaaa: Escribe la fecha “01/Marzo/1981” 28 Capítulo 3. Diseño físico Bases de datos, Versión 1.1 hh:nn:ss dd/mmmm/aaaa: Escribe la fecha “01/Marzo/1981” Formato de cadenas El único símbolo de interés es @ @@-@@ Coge los dos primeros símbolos y los separa de los dos segundos por un guión. “Desde “@@” hacia “@@ Formato de números Para modificar la presentación de los números se utiliza el símbolo 0. 000,00: “Extraer un número de 3 cifras, si no lo hay se rellena con ceros, y despues extraer dos decimales. Mostrar eso en pantalla” 3.2.4 Máscaras de entrada Hemos dicho que el formato cambia la forma de mostrar las cosas en pantalla (pero no cambia como se almacenan por dentro). Sin embargo a veces es importante intentar evitar que se almacenen datos incorrectos. Para indicar a Access las máscaras de entrada, usaremos estos códigos 0: Es obligatorio insertar una cifra en esa posición L: Es obligatorio insertar una letra en esa posición 9: Es optativo insertar algo, pero si se hace que sea una cifra ?: Es optativo insertar algo, pero si se hace que sea una letra A: Es obligatorio insertar algo aquí y puede ser una letra o un número. a: Es optativo insertar algo aquí y puede ser una letra o un número. Ejercicio: ¿como sería la máscara que permite a la gente insertar su DNI con o sin letra? Solución: 90000000? Ejercicio: ¿como sería la máscara de entrada de un campo login que puede tener 3-4 letras seguidas de 4-5 números? Solución: la solución sería ?LLL00009 (se recomienda dejar los elementos optativos en las “esquinas”). Ejercicio: ¿como sería la máscara de entrada de un campo password, donde se obliga a que la clave tenga entre 8 y 12 símbolos que pueden ser letras o números? Solución: AAAAAAAAaaaa 3.2.5 Título El título es lo que se mostrará en los formularios. Se puede dejar en blanco. 3.2. BBDD en Access 29 Bases de datos, Versión 1.1 3.2.6 Valor predeterminado Es un valor que Access puede insertar automáticamente para casos de tablas donde la mayor parte de registros tienen el mismo valor. 3.2.7 Regla de validación Es más potente que una máscara de entrada, ya que permite indicar condiciones que los datos deben cumplir antes de ser insertados 3.2.8 Texto de validación Es el texto que aparecerá cuando la regla no se cumple. 3.2.9 Requerido Nos indica si es obligatorio que haya dentro del campo o si por el contrario puede estar vacío. 3.2.10 Indexado Indica si el campo deberá estar en un índice de la base de datos. Un índice es un archivo de la base de datos que el programa puede utilizar para hacer búsquedas más deprisa. No fabricaremos un índice para todos los campos ya que el proceso puede ser lento y ocupar mucho espacio. Puede ser la primera y mejor opción cuando los usuarios se quejan de que las búsquedas son lentas. 3.2.11 Compresión Unicode Permite seguir utilizando un solo byte por símbolo a pesar de que utilicemos Unicode (que utiliza de 2 a 4 bytes por símbolo) 3.2.12 Modo IME IME significa Input Method Editor, y especifica los diversos sistemas existentes para introducir símbolos. Es relevante solamente en casos como el uso de lenguajes asiáticos y similares. 3.2.13 Oraciones IME Permite controlar como Access va a procesar las frases en otros idiomas. 3.2.14 Etiquetas inteligentes Permite que Access procese de una forma especial diversos campos. Para ello debemos saber como funciona el vocabulario XML de Microsoft 30 Capítulo 3. Diseño físico Bases de datos, Versión 1.1 3.2.15 Alineación Controla como aparecerá el texto: alineado a la derecha, a la izquierda, distribuido (justificado). Los puntos del 11 al 15 no entran en examen. 3.3 Claves ajenas Access denomina a este concepto “Relaciones”. Para indicar que un campo es clave ajena sobre otro, se deberá acudir a este menú y arrastrar la clave ajena sobre la primaria. Se denomina integridad referencial a la capacidad del SGBD de obligar a que los datos de una tabla existan previamente en otra. Cuando se conectan campos y la clave ajena es autonumérica se está cometiendo un error, ya que Access intentaría cambiar los valores sin ceñirse a la clave primaria. Al crear una clave ajena se pueden hacer cumplir dos condiciones extrar 1. Actualización en cascada: si alguien cambia la clave primaria, el que se marcó como clave ajena cambiará automáticamente 2. Borrado en cascada: si alguien borra el registro de la clave primaria, los registros asociados en la clave ajena se borrarán también. No siempre es necesario hacer esto. 3.4 MySQL 3.4.1 Comandos básicos Mostrar las bases de datos en el servidor: show databases; Utilizar una BD a partir de un instante dado: use cdcol; Mostrar las tablas de una base de datos: show tables; Mostrar las descripciones detalladas de las tablas: desc user; 3.4.2 Creación de bases de datos y tablas El comando para crear una base de datos: create database <nombre>. Sin embargo la creación de una tabla es un proceso complejo. create table publicacion ( numero int, titulo char(60) ); create table <nombre> ( <campo1> <tipo de datos> , <campo2> <tipo de datos> , ... 3.3. Claves ajenas 31 Bases de datos, Versión 1.1 <campo20> <tipo de datos> ); 3.4.3 Tipos de datos en MySQL Los tipos pueden ser Numéricos: pueden ser unsigned o no • Enteros: no aceptan decimales ◦ TINYINT: -128,+127 O 0-255 ◦ SMALLINT: -32768,32767 O 0-65535 ◦ INT -2100 millones, 2100 millones o 0-4200 millones ◦ BIGINT: -2^63, 2^63 o 0-2^64 • Decimales: sí aceptan parte fraccionarios ◦ DECIMAL (c, d): la c indica el total de cifras, y la d indica cuantas de ellas serán decimales. Así, DECIMAL (10,2) nos da un número con 10 cifras en total y dos de ellas decimales, es decir, que tenemos 8 cifras para la parte entera. ◦ FLOAT: hasta 8 decimales ◦ DOUBLE: hasta 12 decimales Cadenas • CHAR(x): la x indica la longitud máxima de la cadena. Reserva el espacio aunque no se utilice. Son más rápidos de procesar pero gastan más espacio. • VARCHAR(x): la x indica un máximo que no se puede sobrepasar pero si no se usa ese máximo el resto del espacio está libre. Son más lentos de procesar pero ahorran espacio. Fechas • DATE: almacena fechas en formato ‘aaaa-mm-dd’ • TIME: almacena tiempos en formato ‘hh:mm:ss:fraccion’ • DATETIME: almacena fechas junto con las horas en formato predefinido ‘aa-mm-dd hh:mm:ss’ • TIMESTAMP: es una marca de tiempo gestionada por el SGBD y no se puede modificar directamente. BLOB: Binary Large OBjects. 3.4.4 Claves en MySQL En MySQL se pueden definir indicaciones de como se va a comportar un campo: Clave primaria: es un conjunto de campos cuyo valor no se puede repetir. Además, las claves primarias suponen crear automáticamente un índice. 32 Capítulo 3. Diseño físico Bases de datos, Versión 1.1 use ... ; drop table empleado; create table empleado ( dni char(10), nombre varchar(60), apellidos varchar(120), primary key (dni) ); insert into empleado values ( "5678123W", "Juan", "Ramirez Diaz" ); insert into empleado values ( "1234567Z", "Angel", "Sanchez Gomez" ); insert into empleado values ("5678123W", "Tomas", "Perez Perez"); select * from empleado; Una alternativa sería utilizar como clave primaria un conjunto de campos create table empleado ( dni char(10), nombre varchar(60), apellidos varchar(120), primary key (nombre, apellidos) ); insert into empleado values ( "10X", "Juan", "Gomez Gomez" ); insert into empleado values ( "10X", "Angel", "Gomez Gomez" ); insert into empleado values ( "20Z", "Juan", "Gomez Gomez" ); Clave ajena create table empleado ( dni char(10), 3.4. MySQL 33 Bases de datos, Versión 1.1 nombre varchar(60), apellidos varchar(120), primary key (nombre, apellidos) ); create table sueldos ( dni char(10), sueldo decimal(6,2), primary key (dni), foreign key (dni) references empleado (dni) ); insert into sueldos values ("99Q", 950.45); insert into sueldos values ("1234567Z", 950.45); insert into sueldos values ("5678123W", 1430.91); 3.4.5 Resolución del modelo de tablas “Universidad” create table publicacion ( titulo varchar(100), numero smallint, primary key (titulo, numero) ); create table encongreso ( titulo varchar(100), numero smallint, fechainicio date, fechafin date, primary key (titulo, numero), foreign key (titulo, numero) references publicacion (titulo,numero) ); create table enrevista( titulo varchar(100), numero smallint, nombre varchar(50), volumen smallint, editorial varchar(30), paginainicio smallint, paginafinal smallint, primary key (titulo,numero), foreign key (titulo,numero) references publicacion(titulo,numero) ); create table lineas ( codigolinea smallint unsigned, nombre varchar(200), 34 Capítulo 3. Diseño físico Bases de datos, Versión 1.1 primary key (codigolinea) ); create table descriptor ( nombre varchar(220), primary key (nombre) ); /* Ojo: esta definición estaría mal porque los tipos de datos no coinciden. -O codigolinea arriba es un int, o aqui lo cambiamos para que sea smallint unsigned -O nombre lo ponemos aqui como varchar(200) o arriba ponemos varchar(80)*/ create table entraen ( codigolinea int, nombredescriptor varchar(80), primary key (codigolinea, nombredescriptor), ); create table entraen ( codigolinea smallint unsigned, nombredescriptor varchar(220), primary key (codigolinea, nombredescriptor), foreign key(codigolinea) references lineas(codigolinea), foreign key (nombredescriptor) references descriptor(nombre) ); create table cubre ( numero smallint, titulo varchar(100), codigolinea smallint unsigned, primary key (numero, titulo, codigolinea), foreign key (titulo, numero) references publicacion(titulo, numero), foreign key (codigolinea) references lineas(codigolinea) ); create table profesor ( nombre varchar(80), apellidos varchar(140), despacho smallint unsigned, tlf varchar(25), primary key (nombre, apellidos) ); create table doctor 3.4. MySQL 35 Bases de datos, Versión 1.1 ( nombre varchar(80), apellidos varchar(140), primary key (nombre, apellidos), foreign key (nombre, apellidos) references profesor(nombre, apellidos) ); create table nodoctor ( nombre_nodoctor varchar(80), apellidos_nodoctor varchar(140), nombre_doctor varchar(80), apellidos_doctor varchar(140), primary key (nombre_nodoctor, apellidos_nodoctor), foreign key (nombre_nodoctor, apellidos_nodoctor) references profesor(nombre, apellidos), foreign key (nombre_doctor, apellidos_doctor) references doctor(nombre, apellidos) ); create table produce ( nombre varchar(80), apellidos varchar(140), titulo varchar(100), numero smallint, codigo smallint unsigned, primary key (nombre, apellidos, titulo, numero, codigo), foreign key (nombre, apellidos) references profesor(nombre, apellidos), foreign key (titulo, numero) references publicacion(titulo, numero), foreign key (codigo) references lineas(codigolinea) ); create table proyecto ( codigo int, nombre varchar(150), acronimo varchar(15), primary key (codigo) ); create table participa ( nombre varchar(80), apellidos varchar(140), codigoproyecto int, primary key (nombre,apellidos,codigoproyecto), foreign key (codigoproyecto) references proyecto(codigo), foreign key (nombre,apellidos) references profesor(nombre,apellidos) 36 Capítulo 3. Diseño físico Bases de datos, Versión 1.1 ); 3.4.6 Resolución del modelo “Ajedrez” create database ajedrez; use ajedrez; create table partida ( codigo int, fechainicio date, duracion_minutos smallint unsigned, primary key (codigo) ); create table movimiento ( codigopartida int, numero int, casillaorigen char(2), casilladestino char(2), primary key (codigopartida, numero), foreign key (codigopartida) references partida(codigo) ); create index ind_casilla_origen on movimiento(casillaorigen); create table federacion ( nombre varchar(120), pais varchar(80), primary key (nombre) ) tablespace ts_disco_lento; create table jugador ( nombre varchar(80), apellidos varchar(140), email varchar(120), dir_postal varchar(200), num_federado int, nombre_federacion varchar(120), primary key (nombre,apellidos), foreign key (nombre_federacion) references federacion(nombre) ) tablespace ts_disco_lento; 3.5 Tablespaces y undo files Los “undo files” son archivos utilizados por el SGBD para anotar los hechos que van teniendo lugar (por ejemplo, al sacar dinero de un cajero). Si algo va mal, el SGBD puede utilizar dichos ficheros para 3.5. Tablespaces y undo files 37 Bases de datos, Versión 1.1 deshacer operaciones por completo. Para crear un log en la base de datos que se almacene en un archivo “logs” en un directorio cualquiera podemos hacer lo siguiente. Además, es obligatorio elegir un sistema interno a utilizar al almacenar los datos. Hoy en día, el “engine” InnoDB es el más actual. create logfile group logs_ajedrez add undofile "D:\oscar\logs" engine=innodb; create tablespace ts_disco_lento add datafile "d:\oscar\lento" use logfile group logs_ajedrez engine=InnoDB; 38 Capítulo 3. Diseño físico CAPÍTULO 4 Consultas SQL 4.1 Introducción Las consultas, las sentencias SELECT se apoyan sobre dos conceptos matemáticos denominados Algebra relacional Cálculo relacional 4.2 La sentencia SELECT La sentencia SELECT permite extraer datos de las tablas en base a condiciones muy diversas. La operación más básica que podemos hacer es extraer todo lo que hay en una tabla. select select select select * * * * from from from from proveedores; partes; proyectos; suministra; 4.3 Condiciones Muy a menudo no necesitaremos mostrar todos los datos de la tabla, sino solo algunos que se especificarán mediante condiciones. Si por ejemplo, deseáramos mostrar solo los proveedores cuya ciudad sede está en París haríamos algo como esto. select * from proveedores where ciudad="Paris"; Otra posible consulta sería “mostrar todos los proveedores cuyo estado tiene el codigo 10” select * from proveedores where estado=10; 39 Bases de datos, Versión 1.1 Las condiciones pueden ser muy complejas, y se pueden construir utilizando los operadores AND y OR. Por ejemplo, “mostrar todos los proveedores cuya ciudad es Londres y su estado es 10”. select * from proveedores where ciudad="Londres" and estado=10; Mostrar las partes cuyo peso es mayor de 15. select * from partes where peso>19; No es obligatorio mostrar todos los campos, se pueden mostrar solamente algunos de ellos indicando su nombre. Por ejemplo, “mostrar el nombre de proveedor y la ciudad de los proveedores cuyo estado sea 20”. select nombreprov, ciudad from proveedores where estado=20; ¿Qué mostrará la siguiente consulta? select nombreprov from proveedores where estado<=10 and estado>=20; La respuesta es que no se muestra nada. La condición está mal escrita ya que no puede haber un número que sea menor de 10 y a la vez mayor de 20. Mostrar los nombres de proveedores cuyo estado sea 10 y su ciudad Paris o Londres. Un primer intento sería este .. code-block:: mysql select nombreprov from proveedores where estado=10 and (ciudad=”Paris” or ciudad=”Londres”); Sin embargo, no funciona correctamente. La propia pregunta es ambigua Una posibilidad es que la pregunta fuera así “Mostrar los nombres de proveedores cuyo estado sea 10 y (su ciudad Paris o Londres).” La otra posibilidad es que la pregunta fuera así “Mostrar los nombres de proveedores cuyo (estado sea 10 y su ciudad Paris) o Londres.” Es importante recordar que cuando en una condición hay tres o más elementos de comparación puede que sea necesario utilizar paréntesis. Mostrar las partes rojas o verdes que pesen 17 o más. Esta pregunta debe aclararse antes de resolverse. Mostrar las partes siempre que pesen 17 o más y que luego cumplan una de estas dos: tener color rojo o tener color verde. “Mostrar las partes (rojas o verdes) que pesen 17 o más.” Mostrar las partes que siendo verdes pesen 17 o más o si no que simplemente sean rojas. 40 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 “Mostrar las partes rojas o (verdes que pesen 17 o más).” Normalmente, se suele asumir la primera pregunta, que se resuelve así select * from partes where peso>=17 and (color="Rojo" or color="Verde"); select * from partes where (color="Rojo" or color="Verde") and peso>=17; 4.4 Consultas con agregados Se denomina agregado a alguna función de tipo estadístico aplicada a un subconjunto de los datos de una tabla. 4.4.1 Recuento La función COUNT nos dice cuantas filas cumplen una cierta condición. No es obligatorio poner dicha condición. select count(*) from partes; Si deseáramos una condición como por ejemplo “hacer el recuento de partes cuyo color sea Azul” select count(*) from partes where color="Azul"; ¿Cuantas partes hay que no sean rojas? select count(*) from partes where color<>"Rojo"; ¿Cuantos proveedores hay cuya ciudad sea Londres? select count(*) from proveedores where ciudad="Londres"; ¿Cuantas partes hay que sean rojas y pesen más de 16? select count(*) from partes where peso>16 and color="Rojo"; ¿Cuantos proyectos hay en Madrid? select count(*) from proyectos where ciudad="Madrid"; 4.4. Consultas con agregados 41 Bases de datos, Versión 1.1 4.4.2 Promedio Esta función calcula la media aritmética de las filas que cumplan una cierta condición. Tampoco es obligatorio poner la condición. La función promedio en SQL es AVG(*) ¿Cual es el peso medio de las partes? select avg(peso) from partes; ¿Cual es la media de peso de la partes azules? select avg(peso) from partes where color="Azul"; 4.4.3 Máximos y mínimos Son operaciones que nos devuelven el valor más grande o más pequeño de entre los que cumplan una condición. Estas funciones en SQL son MAX(campo-numérico) MIN(campo-numérico) ¿Cual es peso más grande de alguna parte? select max(peso) from partes; ¿Cual es el peso más pequeño de alguna parte? 4.4.4 Sumas La operación SUM(campo-numérico) efectúa la suma de ese campo para las filas que cumplan una cierta condición. ¿Cuantas partes en total ha suministrado el proveedor v1? select sum(cantidad) from suministra where numprov="v1"; ¿Cuantas partes ha recibido el proyecto y1? select sum(cantidad) from suministra where numproyecto="y1"; ¿Cuantas partes p2 ha suministrado el proveedor v2? select sum(cantidad) from suministra where numparte="p2" and numprov="v2"; 42 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 4.4.5 Múltiples agregados A veces no se hará una sola operación matemática sino muchas. En ese caso es muy importante indicar a SQL en base a qué debe hacer los resultados, o lo que es lo mismo como agrupar antes de hacer las operaciones. En SQL se indicarán los grupos sobre los cuales se va a hacer cada operación mediante la cláusula GROUP BY (campo). Además, al hacer un “group by” es obligatorio también seleccionar el campo por el que se hacen los grupos. La respuesta a una pregunta como:”¿Cual es la media de peso de las partes por color?” select avg(peso), color from partes group by (color); ¿Cual es la media de los pesos en función del nombre de parte? select avg(peso), nombreparte from partes group by (nombreparte); ¿Cuantos proveedores hay en cada ciudad? select count(*), ciudad from proveedores group by (ciudad); ¿Cual es la media de suministros por cada proveedor? select avg(cantidad), numprov from suministra group by (numprov); ¿Cual es la media de pesos de las piezas rojas o verdes? select avg(peso), color from partes where color="Rojo" or color="Verde" group by (color); 4.4.6 Condiciones de los agregados Los agregados pueden llevar sus propias condiciones: NO VAN CON EL WHERE Van por separado utilizando HAVING El HAVING debe ir despues del GROUP BY “Mostrar cuantos proveedores hay por ciudad, pero solo cuando haya dos o más” La primera parte de este ejercicio es igual que el anterior. Sacamos cuantos proveedores hay por ciudad select count(*), ciudad from proveedores group by (ciudad); 4.4. Consultas con agregados 43 Bases de datos, Versión 1.1 Si ahora deseamos mostrar solo aquellos cuyo recuento sea mayor o igual que 2 debemos añadir una cláusula HAVING como esta select count(*), ciudad from proveedores group by (ciudad) having count(*)>=2; El WHERE es una condición que se aplica antes de hacer los cálculos. Sin embargo, si una vez hechos los cálculos no deseamos mostrarlos todos deberemos utilizar el HAVING. “Mostrar cuantos tornillos hay en total” Al hacer esta consulta se pueden cometer varios errores, como por ejemplo este, que muestra todas las partes select count(*), nombreparte from partes group by nombreparte; Esto no es exactamente un error, sino más bien una trampa: se hizo el recuento a mano y se hizo trampa Error: En este caso se ha confundido el where con el having select count(*), nombreparte from partes group by nombreparte having nombreparte="Tornillo"; Pregunta: ¿Podríamos quitar el group by? Respuesta: aunque en este caso sí podríamos no se debe hacer. Cuando nos pidan una operación matemática por grupos, debemos poner group by select count(*), nombreparte from partes where nombreparte="Tornillo" group by nombreparte 4.5 Consultas multitabla En ocasiones la información que nos pidan puede que esté dispersa por distintas tablas. SQL ofrece un mecanismo para “conectar” tablas y así poder hacer las comparaciones que nos pidan. Por ejemplo, si nos piden el nombre de las partes suministradas en una cantidad >=500 descubriremos que El nombreparte está en la tabla partes La cantidad esta en la tabla suministra Las tablas partes y suministra tienen un campo en común, el campo numparte Utilizando una cláusula denominada “inner join” SQL puede establecer las correspondencias correctas entre dos o más tablas. Cruce de datos entre las tablas partes y suministra basándonos en que el campo numparte de suministra debe ser igual que el numparte de suministra De aqui sacamos solamente los campos que nos piden 44 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 4.6 Algunos ejercicios resueltos 1. Deseamos saber los numeros de proveedor que realizan suministros select numprov from suministra; 2. Deseamos saber los numeros de proveedor que realizan suministros pero sin que se muestren repetidos select distinct numprov from suministra; 3. Sumar las cantidades que se han suministrado (¿cuantas piezas se han suministrado?) select sum(cantidad) from suministra; 4. Se desea ver la suma de las distintas cantidades de partes suministradas select sum(cantidad),numparte from suministra group by numparte; 5. Se desea saber las cantidades totales que ha suministrado cada proveedor select sum(cantidad),numprov from suministra group by numprov; 6. Cantidades totales suministradas por v1 y v4 select sum(cantidad), numprov from suministra where numprov=’v1’ or numprov=’v4’ group by (numprov); 7. Mostrar los numeros de parte suministrados en una cantidad total mayor o igual que 1000 select sum(cantidad), numparte from suministra group by (numparte) having sum(cantidad)>=1000; 8. Mostrar la suma de las partes suministradas por v1, v2, o v3 en una cantidad mayor de 550 select sum(cantidad),numparte from suministra where numprov=’v1’ or numprov=’v2’ or numprov=’v3’ group by (numparte) having sum(cantidad)>550; 9. Mostrar cuantos proveedores hay en Londres select count(*) from proveedores where ciudad=’Londres’; 10. ¿Cuantas partes rojas hay? select count(*) from partes where color="Rojo"; 11. ¿Qué colores están repetidos en las partes? 4.6. Algunos ejercicios resueltos 45 Bases de datos, Versión 1.1 select count(*),color from partes group by color having count(*)>=2; 4.7 Subconsultas Al hacer consultas hemos observado que hay cláusulas que permiten establecer condiciones. Al hacer las condiciones es posible que necesitemos hacer una “subpregunta” y que la sentencia SELECT quede algo así select .... from ... where campo>(select max(cantidad) from suministra) Supongamos una pregunta como la siguiente: “¿Cuales son los nombres de parte que pesan lo mismo que la parte más pesada?” Podemos sacar el peso maximo con esta consulta select max(peso) from partes; select nombreparte from partes where peso>=(select max(peso) from partes); ¿Qué nombres de parte pesan más que la media? Se saca la media select avg(peso) from partes; select * from partes where peso>=(select avg(peso) from partes); Dentro de las subconsultas, aparte de las comparaciones típicas como >, >=, <>, <=, <, etc... existen otros elementos para hacer comparaciones EXISTS: nos dará las filas donde exista alguna fila que cumpla la condición ALL: la condición deben cumplirla todas las filas 12. ¿Qué nombres de parte corresponden a una pieza azul o almacenada en París? select nombreparte from partes where color="Azul" or ciudad="Paris" 13. ¿Qué colores tienen las distintas partes que no sean tornillos? select * from partes where nombreparte<>"Tornillo"; 14. ¿Cuantos proveedores hay que no tengan su almacén en Atenas? select count(*) from proveedores where ciudad<>"Atenas"; 15. ¿Qué nombres de parte se suministran en una cantidad mayor o igual de 400? 46 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 select nombreparte,cantidad from partes inner join suministra on partes.numparte=suministra.numparte where cantidad>=400; 16. ¿Qué proveedores suministran partes en una cantidad <300? Por un lado, el nombre de proveedor está en la tabla proveedores, que podemos ver haciendo esta consulta select * from proveedores; numprov v1 v2 v3 v4 v5 nombreprov Smith Jones Blake Clarke Adams estado 20 10 30 20 30 ciudad Londres Paris Paris Londres Atenas Sin embargo, las cantidades de suministro están en la tabla suministra que podemos ver ejecutando esta consulta select * from suministra; numprov v1 v1 v2 v2 v2 v2 v2 v2 v2 v2 v3 v3 v4 v4 v5 v5 v5 v5 v5 v5 v5 v5 v5 numparte p1 p1 p3 p3 p3 p3 p3 p3 p3 p5 p3 p4 p6 p6 p1 p2 p2 p3 p4 p5 p5 p6 p6 numproyecto y1 y4 y1 y2 y3 y4 y5 y6 y7 y2 y1 y2 y3 y7 y4 y2 y4 y4 y4 y4 y5 y2 y4 cantidad 200 700 400 200 300 500 600 400 600 100 200 500 300 300 100 200 100 200 800 400 500 200 500 Como la información está dispersada, necesitamos cruzar las tablas con un inner join teniendo en cuenta que tienen un campo igual, en este caso el campo numprov. Podemos “hacer el cruce” haciendo un inner join con esta consulta select * from proveedores inner join suministra on proveedores.numprov=suministra.numprov; 4.7. Subconsultas 47 Bases de datos, Versión 1.1 Cuyo resultado es que se cruzan los datos correctamente y se obtiene una tabla como esta numprov v1 v1 v2 v2 v2 v2 v2 v2 v2 v2 v3 v3 v4 v4 v5 v5 v5 v5 v5 v5 v5 v5 v5 numparte p1 p1 p3 p3 p3 p3 p3 p3 p3 p5 p3 p4 p6 p6 p1 p2 p2 p3 p4 p5 p5 p6 p6 numproyecto y1 y4 y1 y2 y3 y4 y5 y6 y7 y2 y1 y2 y3 y7 y4 y2 y4 y4 y4 y4 y5 y2 y4 cantidad 200 700 400 200 300 500 600 400 600 100 200 500 300 300 100 200 100 200 800 400 500 200 500 numprov v1 v1 v2 v2 v2 v2 v2 v2 v2 v2 v3 v3 v4 v4 v5 v5 v5 v5 v5 v5 v5 v5 v5 nombreprov Smith Smith Jones Jones Jones Jones Jones Jones Jones Jones Blake Blake Clarke Clarke Adams Adams Adams Adams Adams Adams Adams Adams Adams estado 20 20 10 10 10 10 10 10 10 10 30 30 20 20 30 30 30 30 30 30 30 30 30 Si ponemos la condición que nos falta el ejercicio se resuelve correctamente select nombreprov,cantidad from proveedores inner join suministra on proveedores.numprov=suministra.numprov where cantidad<300 order by nombreprov desc; 17. ¿Cuantos proveedores suministran partes en una cantidad <300? Para orientarnos, extraemos las filas en las que la cantidad es menor de 300 select numprov from suministra where cantidad<300; Si hacemos el recuento, observaremos que hay 9 filas, pero proveedores reales solo están v1, v2, v3 y v5. select count(numprov) from suministra where cantidad<300; Si ponemos distinct, no nos repetirá los proveedores select distinct numprov from suministra where cantidad<300; Por tanto la solución pasa por hacer el recuento 48 Capítulo 4. Consultas SQL ciudad Londres Londres Paris Paris Paris Paris Paris Paris Paris Paris Paris Paris Londres Londres Atenas Atenas Atenas Atenas Atenas Atenas Atenas Atenas Atenas Bases de datos, Versión 1.1 de los distintos numprov select count(distinct numprov) from suministra where cantidad<300; 18. ¿Qué nombre tienen las partes suministradas en una cantidad total de 550 o más? select sum(cantidad), partes.numparte,nombreparte from suministra inner join partes on suministra.numparte=partes.numparte group by (partes.numparte) having sum(cantidad)>=550; 19. ¿Qué nombres de parte suministran los distintos proveedores? select nombreprov, nombreparte from proveedores inner join suministra on suministra.numprov=proveedores.numprov inner join partes on partes.numparte=suministra.numparte; 20. Queremos saber los proveedores que están ubicados en el mismo sitio que alguna parte. Examinemos la tabla partes numparte p1 p2 p3 p4 p5 p6 nombreparte Tuerca Perno Tornillo Tornillo Leva Engranaje color Rojo Verde Azul Rojo Azul Rojo peso 12 17 17 14 12 19 ciudad Londres Paris Roma Londres Paris Londres Examinemos la tabla proveedores numprov v1 v2 v3 v4 v5 nombreprov Smith Jones Blake Clarke Adams estado 20 10 30 20 30 ciudad Londres Paris Paris Londres Atenas Se puede comprobar que no nos piden para nada datos de la tabla suministra. Lo único que se necesita es emparejar las filas donde las ciudades sean iguales. select nombreprov,nombreparte,partes.ciudad from partes inner join proveedores on partes.ciudad=proveedores.ciudad; 21. ¿Como se llaman las piezas que se suministran en la cantidad máxima? select nombreparte,max(cantidad) from suministra inner join partes on suministra.numparte=partes.numparte where cantidad=(select max(cantidad) from suministra); 4.7. Subconsultas 49 Bases de datos, Versión 1.1 22. ¿Que numeros de proveedores suministran por encima de la media de suministros? select numprov, cantidad from suministra where cantidad > ( select avg(cantidad) from suministra ); Cuidado: si nos dijeran "suministran una cantidad total que esté por encima de la media", deberíamos sumar las cantidades por proveedor y compararlas con la media. select sum(cantidad), numprov from suministra group by numprov having sum(cantidad)> ( select avg(cantidad) from suministra ); 23. Números de parte suministradas en una cantidad media mayor de 450 select avg(cantidad),numparte from suministra group by numparte having avg(cantidad)>450; 24. ¿Cual es el peso medio de las partes? select avg(peso) from partes; 25. Obtener el nombre de los provedores, el nombre de parte que suministran y la cantidad en que suministran select nombreprov, nombreparte,cantidad from proveedores inner join suministra on suministra.numprov=proveedores.numprov inner join partes on suministra.numparte=partes.numparte 26. Obtener las parejas de proveedores que NO están en la misma ciudad select prov1.numprov, prov1.ciudad, prov2.numprov, prov2.ciudad from proveedores as prov1 inner join proveedores as prov2 where prov1.ciudad<>prov2.ciudad; 27. Mostrar suministros donde el proveedor y la parte hayan resultado ser de una ciudad distinta select suministra.numprov, suministra.numparte, proveedores.ciudad, partes.ciudad from suministra inner join proveedores 50 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 on proveedores.numprov=suministra.numprov inner join partes on partes.numparte=suministra.numparte where proveedores.ciudad<>partes.ciudad; 28. ¿Cuantos proveedores suministran partes rojas o que pesen 12 gramos o más? Trozo 1: partes rojas select numparte from partes where color="Rojo" Trozo 2: partes que pesan 12 o mas select numparte from partes where peso>12; Partes que cumplen alguna de las dos cosas Los proveedores que hacen suministros están en el campo numprov de la tabla suministra select numprov from suministra; 29. ¿Cuantas piezas se han suministrado de cada ciudad de piezas? select sum(cantidad),ciudad from partes inner join suministra on suministra.numparte=partes.numparte group by (ciudad); 30. ¿De qué ciudad de proveedor ha salido la cantidad más grande de suministros?. Esta pregunta podría entenderse de dos formas “Obtener la cantidad más grande suministrada y la ciudad del proveedor correspondiente” En primer lugar necesitamos cruzar “proveedores” y suministra 4.7. Subconsultas 51 Bases de datos, Versión 1.1 v1 v1 v2 v2 v2 v2 v2 v2 v2 v2 v3 v3 v4 v4 v5 v5 v5 v5 v5 v5 v5 v5 v5 p1 p1 p3 p3 p3 p3 p3 p3 p3 p5 p3 p4 p6 p6 p1 p2 p2 p3 p4 p5 p5 p6 p6 y1 y4 y1 y2 y3 y4 y5 y6 y7 y2 y1 y2 y3 y7 y4 y2 y4 y4 y4 y4 y5 y2 y4 200 700 400 200 300 500 600 400 600 100 200 500 300 300 100 200 100 200 800 400 500 200 500 v1 v1 v2 v2 v2 v2 v2 v2 v2 v2 v3 v3 v4 v4 v5 v5 v5 v5 v5 v5 v5 v5 v5 Smith Smith Jones Jones Jones Jones Jones Jones Jones Jones Blake Blake Clarke Clarke Adams Adams Adams Adams Adams Adams Adams Adams Adams 20 20 10 10 10 10 10 10 10 10 30 30 20 20 30 30 30 30 30 30 30 30 30 Londres Londres Paris Paris Paris Paris Paris Paris Paris Paris Paris Paris Londres Londres Atenas Atenas Atenas Atenas Atenas Atenas Atenas Atenas Atenas Una primera aproximación sería esta consulta select max(cantidad),ciudad from suministra inner join proveedores on suministra.numprov=proveedores.numprov; Sin embargo esto no funciona porque cualquier operación de agregado no involucra a ninguna fila. De hecho esa consulta nos devuelve un máximo correcto pero no nos devuelve la ciudad asociada, sino la primera que encuentra. Hay que encontrar otra forma de expresar esta consulta select ciudad from proveedores inner join suministra on suministra.numprov=proveedores.numprov where cantidad= ( select max(cantidad) from suministra ); La otra forma de entender la pregunta sería “Sumar las cantidades por proveedor y decir la ciudad del proveedor con la cantidad máxima” Una primera aproximación sería esta select ciudad from suministra inner join proveedores on suministra.numprov=proveedores.numprov group by (proveedores.numprov) 52 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 having sum(cantidad)>= ALL ( select sum(cantidad) from suministra group by (numprov) ) ; 31. ¿Qué ciudad de parte tiene la mayor media de suministros? Cruzamos suministra y partes select * from suministra inner join partes on suministra.numparte=partes.numparte Por otra lado, sacamos la media por partes de la tabla suministra select avg(cantidad) from suministra group by numparte; Si mezclamos la primera parte con la segunda select ciudad from suministra inner join partes on suministra.numparte=partes.numparte group by partes.numparte having avg(cantidad)>= ALL ( select avg(cantidad) from suministra group by numparte ); 32.Obtener todos los detalles de todos los proyectos select nombreprov, nombreparte,nombreproyecto,cantidad from suministra inner join proyectos on suministra.numproyecto=proyectos.numproyecto inner join partes on suministra.numparte=partes.numparte inner join proveedores on suministra.numprov=proveedores.numprov ; 33. Obtener todos los detalles de todos los proyectos ubicados en Londres. select nombreprov, nombreparte,nombreproyecto,cantidad from suministra inner join proyectos on suministra.numproyecto=proyectos.numproyecto 4.7. Subconsultas 53 Bases de datos, Versión 1.1 inner join partes on suministra.numparte=partes.numparte inner join proveedores on suministra.numprov=proveedores.numprov where proyectos.ciudad="Londres" ; 34. Obtener los códigos de proveedor que suministran al proyecto Y1. select numprov from suministra where numproyecto=’y1’; 35. Obtener los datos de los proyectos que usan partes en cantidades comprendidas entre 300 y 750. select distinct proyectos.* from suministra inner join proyectos on suministra.numproyecto=proyectos.numproyecto where ( cantidad>=300 ) and ( cantidad<=750 ) order by proyectos.numproyecto ; 36. Obtener las combinaciones posibles parte-color Este ejercicio requiere tener dos copias de la misma tabla. Será necesario utilizar los alias para combinar la tabla partes consigo misma. select distinct p1.nombreparte, p2.color from partes as p1 inner join partes as p2; 37. Obtener los colores de las partes que se han suministrado por V1. select partes.color from suministra inner join partes on partes.numparte=suministra.numparte where numprov=’v1’; 38. Obtener la cantidad total de partes P1 usadas por parte de V1. Datos del proveedor v1 select * from suministra where numprov=’v1’; Suma de todas las partes de v1 select sum(cantidad) from suministra where numprov=’v1’ and numparte=’p1’; 54 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 39. Obtener las parejas de nombres de ciudad tales que un proveedor ubicado en la primera ciudad suministra a algún proyecto ubicado en la segunda ciudad. select proveedores.ciudad, proyectos.ciudad from suministra inner join proveedores on suministra.numprov=proveedores.numprov inner join proyectos on suministra.numproyecto=proyectos.numproyecto; 40. Obtener los códigos de parte suministrados a los proyectos ubicados en la misma ciudad del proveedor. select suministra.numparte from suministra inner join proyectos on suministra.numproyecto=proyectos.numproyecto inner join proveedores on suministra.numprov=proveedores.numprov where proveedores.ciudad=proyectos.ciudad; 41. Obtener los códigos de proyecto a los que suministra un proveedor que no está en la misma ciudad. select suministra.numproyecto from suministra inner join proveedores on proveedores.numprov=suministra.numprov inner join proyectos on proyectos.numproyecto=suministra.numproyecto where proyectos.ciudad<>proveedores.ciudad; 42. Obtener las parejas de partes suministradas por el mismo proveedor. select distinct s1.numparte,s2.numparte from suministra as s1 inner join suministra as s2 on s1.numprov=s2.numprov; 43. Obtener los códigos de parte suministrados a cualquier proyecto que esté ubicado en Londres select numparte from suministra inner join proyectos on suministra.numproyecto=proyectos.numproyecto where proyectos.ciudad="Londres"; 44. Obtener los códigos de proyecto que usan al menos una parte suministrada por el proveedor V1 4.7. Subconsultas 55 Bases de datos, Versión 1.1 En primer lugar seleccionamos las partes suministradas por v1 select numparte from suministra where numprov=’v1’; En segundo lugar queremos saber los proyectos cuyas partes sean alguna de las que hemos extraído antes. select numproyecto from suministra where numparte in ( select numparte from suministra where numprov=’v1’ ); 45. Obtener los códigos de proveedor que suministran al menos una parte roja. Seleccionamos las partes cuyo color es rojo select numparte from partes where color="Rojo"; Ahora, en la tabla suministra sacamos las filas donde la parte sea alguna de las extraídas antes select numprov from suministra where numparte in ( select numparte from partes where color="Rojo" ); Una solución distinta select numprov from suministra inner join partes on suministra.numparte=partes.numparte where partes.color="Rojo"; 46. Obtener los códigos de proyecto cuya ciudad es la primera en la lista de ciudades. Seleccionamos la ciudad más pequeña select min(ciudad) from proyectos; select * from proyectos where ciudad in ( select min(ciudad) from proyectos ); Otra forma de hacerlo con inner join’s sería la siguiente select p1.numproyecto,p1.ciudad from proyectos as p1 inner join proyectos as p2 on p1.numproyecto=p2.numproyecto where p1.ciudad= ( select min(ciudad) from proyectos ); 56 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 47. Obtener los códigos de proyecto a los que se suministra la parte P1 en una cantidad promedio igual o superior a la cantidad más grande que se suministra al proyecto Y1. Extraemos la cantidad más grande del proyecto “y1” select max(cantidad) from suministra where numproyecto="y1"; Al haber una condición para el promedio deberemos poner algo como esto select numproyecto,avg(cantidad) from suministra where numparte=’p1’ group by numproyecto having avg(cantidad)>= ( select max(cantidad) from suministra where numproyecto="y1" ); 48. Obtener los códigos de proveedor de los que suministran la parte P1 a algún proyecto en una cantidad superior a la cantidad promedio de la parte P1 para ese proyecto. Podemos empezar intentando sacar la media de partes p1 para cada proyecto select numproyecto, avg(cantidad) from suministra where numparte=’p1’ group by numproyecto; Extraemos las filas de la tabla suministra donde la parte sea p1 select numprov from suministra as s1 where numparte=’p1’ and cantidad > ( select avg(cantidad) from suministra as s2 where numparte=’p1’ and s2.numproyecto=s1.numproyecto group by numproyecto ); 49. Obtener los códigos de proyecto a los que ningún proveedor de Londres suministra una parte roja. Primero averiguamos los proveedores de Londres que suministran partes rojas. select suministra.numprov from suministra inner join partes on partes.numparte=suministra.numparte inner join proveedores on proveedores.numprov=suministra.numprov where proveedores.ciudad="Londres" and partes.color="Rojo"; Ahora examinamos la tabla suministra y comprobamos que el proveedor no esté en el conjunto devuelto por la consulta anterior 4.7. Subconsultas 57 Bases de datos, Versión 1.1 select * from suministra where numprov not in ( select suministra.numprov from suministra inner join partes on partes.numparte=suministra.numparte inner join proveedores on proveedores.numprov=suministra.numprov where proveedores.ciudad="Londres" and partes.color="Rojo" ); 50. ¿Hay algún proveedor que suministre la misma parte a TODOS los proyectos? Para conseguir la solución a este problema se deben utilizar algunas características de los cuantificadores. Replanteamos la pregunta “se desea saber los proveedores donde para todos los proyectos existe una misma parte suministrada” o más desarrollado “proveedores (de la tabla suministra) donde para todo proyecto (de la tabla proyectos) existe un suministro donde el codigo de proveedor es dicho proveedor y la parte es la misma parte que mirábamos en suministra” select numprov from suministra as s1 where not exists ( select numproyecto from proyectos where numproyecto not in ( select numproyecto from suministra as s2 where s1.numparte=s2.numparte and s1.numprov=s2.numprov ) ); 51. Obtener los códigos de proyecto que usan todas las partes suministradas por el proveedor v1 “Obtener los códigos de proyecto donde para toda parte de la tabla suministra existe una parte suministrada por v1” Obtener el conjunto de parte suministradas por v1. select numparte from suministra where numprov=’v1’; Las filas de la tabla suministra donde para toda parte de v1 existe alguna fila asociada 58 Capítulo 4. Consultas SQL Bases de datos, Versión 1.1 select numprov from suministra as s1 where not exists ( select numparte from suministra as s2 where numprov=’v1’ and not exists ( select numparte,numproyecto from suministra as s3 where s2.numparte=s3.numparte and s1.numproyecto=s3.numproyecto ) ); 52. (Para nota) Obtener los pares de proveedores V1 y V2 que suministren EXACTAMENTE el mismo conjunto de partes. La pregunta podría replantearse como “obtener parejas de proveedores donde para toda parte de un proveedor de la primera tabla existe otro proveedor distinto tal que la parte es la misma que la parte del primero”. 4.8 Actualización y borrado Una vez que se han insertado datos, estos no son inmutables. Pueden cambiarse valores de las filas o incluso pueden borrarse las filas. Estas operaciones se hacen con las sentencias UPDATE y DELETE. Para cambiar valores se hace lo siguiente UPDATE <TABLA> SET <CAMPO>=VALOR WHERE <CONDICION> Por ejemplo, si quisiéramos hacer que en la tabla partes se cambiara la ciudad Londres por Madrid haríamos algo como esto UPDATE partes SET ciudad="Madrid" WHERE ciudad="Londres"; Poner en la tabla partes el peso a 30 en todas las partes cuyo peso sea mayor que 16; update partes set peso=30 where peso>16; Poner a “Amarillo” el color de las partes de Paris update partes set color="Amarillo" where ciudad="Paris"; Para borrar datos DELETE FROM <TABLA> WHERE <CONDICION> Borrar todas las partes cuyo peso es 12 delete from partes where peso=12; 4.8. Actualización y borrado 59 Bases de datos, Versión 1.1 60 Capítulo 4. Consultas SQL CAPÍTULO 5 Programación 5.1 Introducción Los elementos de los lenguajes de programación son muy similares entre sí y el cambio de lenguaje solamente supone la modificación de ciertos hábitos. En el entorno de las bases de datos se pueden encontrar programas que actúen mediante dos mecanismos distintos. Estos dos mecanismos se definen como Procedimientos almacenados: residen en el propio servidor de bases de datos. Programas externos: utilizando algún mecanismo los programas externos se comunican con el servidor para intercambiar datos mediante un lenguaje de programación cualquiera. Entre los mecanismos de comunicación más utilizados encontramos ODBC (Open DataBases Communication). Este estándar especifica claramente a servidores y cliente como tienen que dar o pedir datos. Una versión modificada de ODBC es JDBC que ha modernizado el estándar pero solo sirve para programas Java. 5.2 Procedimientos almacenados 5.2.1 Carga de programas Para cargar código almacenado en un fichero SQL externo se utiliza lo siguiente \. d:\oscar\t5\prueba1.sql 5.2.2 Variables Una variable es una posición de memoria con nombre. Normalmente las variables conllevan un tipo que restringe lo que podemos almacenar en ella. En MySQL las variables se declaran con la palabra clave DECLARE. Los tipos utilizables con las variables son los mismos que tiene MySQL. 61 Bases de datos, Versión 1.1 5.2.3 Declaración de procedimientos Los procedimientos en MySQL actúan igual que las funciones en Java con las diferencias en la sintaxis. El primer problema que aparece en los procedimientos MySQL viene dado por el hecho de que los procedimientos a veces interfieren con el delimitador ”;”. Para evitarlo, debemos avisar a MySQL de que durante un tiempo cambiaremos de delimitador, para ello se usa la siguiente sentencia Dentro de “código” podrán ir sentencias que terminarán de forma normal, con el punto y coma ”;” El problema viene dado porque el intérprete de MySQL intenta procesar todo lo que haya hasta llegar a un punto y coma. Si no cambiásemos el delimitador, se ejecutaría la definición del procedimiento sin haber encontrado un “end” y todo fallaría. Ejercicio: crear un procedimiento que acepte una cantidad c y que seleccione todos los suministros cuyo campo cantidad sea mayor que c delimiter // create procedure mayores (cant int) begin select * from suministra where cantidad>cant; end // delimiter ; Ejercicio: crear un programa que acepte un color co y una ciudad ci y que busque todas las partes cuyo color sea ese co pasado y la ciudad ese ci pasado. Co y ci son parámetros y NO LLEVAN COMILLAS delimiter // create procedure Color_parte (color_pasado varchar(20), ciudad_pasada varchar(20) ) begin select * from partes where color=color_pasado and ciudad=ciudad_pasada; end // delimiter ; Ejercicio: crear un procedimiento que permita sumar la cantidad de partes suministradas cuyo color sea el mismo que un cierto color pasado drop procedure suministradas_color; delimiter // create procedure suministradas_color ( color_pasado varchar(20) ) begin select sum(cantidad) 62 Capítulo 5. Programación Bases de datos, Versión 1.1 from suministra inner join partes on suministra.numparte=partes.numparte where color=color_pasado; end // delimiter ; call suministradas_color("Rojo"); call suministradas_color("Gris"); Ejercicio: crear un procedimiento que reciba dos cosas Color_pasado Nombre_prov_pasado El procedimiento deberá decirnos cuantas partes de ese color suministra ese nombre de proveedor. Ejercicio: crear un procedimiento que reciba dos cosas Nombre_parte_pasada Cantidad_pasada El procedimiento deberá decirnos cuantas partes con ese nombre han sido suministradas en una cantidad mayor o igual que la cantidad pasada drop procedure mayores_que; delimiter // create procedure mayores_que( nombre_parte_pasada varchar(11), cantidad_pasada int) begin select * from suministra inner join partes on suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad>cantidad_pasada; end // delimiter ; 5.3 Sentencias básicas 5.3.1 Decisiones con IF La sintaxis de un IF es prácticamente igual a la de Java 5.3. Sentencias básicas 63 Bases de datos, Versión 1.1 IF (<comparacion>) THEN BEGIN <sentencias> END ELSE BEGIN END END IF; Ejemplo: crear un procedimiento que extraiga las filas de la tabla suministra que cumplan cierta condicion sobre la cantidad. Si el usuario pasa un simbolo “>” el procedimiento nos devuelve las filas mayores que cierta cantidad. Si no pasa un “<” nos devuelve las filas con una cantidad menor que la pasada drop procedure selector_v2; delimiter // create procedure selector_v2 ( operacion char(1), cantidad_pasada int) begin if (operacion="<") then begin select * from suministra where cantidad<cantidad_pasada; end; else begin select * from suministra where cantidad>cantidad_pasada; end; end if; end; // delimiter ; Ejercicio:crear un procedimiento que dados los parámetros siguientes compruebe cuantas partes con un cierto nombre tienen una cantidad menor o mayor que una cierta cantidad pasada nombre_parte_pasado cantidad_pasada operacion drop procedure selector_v3; delimiter // create procedure selector_v3 ( nombre_parte_pasada varchar(11), cantidad_pasada int, operacion varchar(1) ) begin if (operacion=">") then begin select * from suministra inner join partes on 64 Capítulo 5. Programación Bases de datos, Versión 1.1 suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad>cantidad_pasada; end; else begin select * from suministra inner join partes on suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad<cantidad_pasada; end; end if; end; // delimiter ; Ejercicio: ampliar el programa anterior para que soporte búsquedas utilizando los comparadores “<”, “>”, “>=”, “<=”, “=” y “<>”. 5.3.2 5.3.2 Decisiones múltiples con CASE..WHEN El programa anterior puede resolverse utilizando sentencias if-then-else anidadas, sin embargo es poco práctico y difícil de ampliar. La sintaxis de la sentencia case es la siguiente CASE <variable> WHEN ">" THEN BEGIN END; WHEN ">=" THEN BEGIN END; WHEN "<" THEN BEGIN END; ... ELSE BEGIN END; END CASE; Basándonos en esta sintaxis, una posible solución al problema anterior sería esta drop procedure selector_v4; delimiter // create procedure selector_v4 ( nombre_parte_pasada varchar(11), cantidad_pasada int, operacion varchar(1) ) 5.3. Sentencias básicas 65 Bases de datos, Versión 1.1 begin case operacion when ">" then begin select * from suministra inner join partes on suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad>cantidad_pasada; end; when ">=" then begin select * from suministra inner join partes on suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad>=cantidad_pasada; end; when "<>" then begin select * from suministra inner join partes on suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad<>cantidad_pasada; end; when "<" then begin select * from suministra inner join partes on suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad<cantidad_pasada; end; when "<=" then begin select * from suministra inner join partes on suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad<=cantidad_pasada; end; when "=" then begin select * from suministra inner join partes on 66 Capítulo 5. Programación Bases de datos, Versión 1.1 suministra.numparte=partes.numparte where nombreparte=nombre_parte_pasada and cantidad=cantidad_pasada; end; else begin select ("Operacion no reconocida"); end; end case; end; // delimiter ; Ejercicio: crear un programa que acepte un nombre de parte,luego dos ciudades C1 y C2 y luego un comparador que puede ser “AND” o “OR”. El programa debe decirnos las partes que pertenecen a las dos ciudades o a una de ellas. drop procedure comparador; delimiter // create procedure comparador ( nombre_parte_pasada varchar(11), c1_pasada varchar(15), c2_pasada varchar(15), operador varchar(3) ) begin case operador when "AND" then begin select * from partes as p1, partes as p2 where p1.nombreparte=nombre_parte_pasada and p2.nombreparte=nombre_parte_pasada and (p1.ciudad=c1_pasada and p2.ciudad=c2_pasada); end; when "OR" then begin select * from partes as p1, partes as p2 where p1.nombreparte=nombre_parte_pasada and p2.nombreparte=nombre_parte_pasada and (p1.ciudad=c1_pasada or p2.ciudad=c2_pasada); end; else begin select ("Escriba OR o AND (mayúsculas)"); end; end case; end // delimiter ; 5.3. Sentencias básicas 67 Bases de datos, Versión 1.1 5.3.3 Bucles con WHILE Utilizando la sentencia WHILE podemos repetir una tarea que se repita un cierto número de veces por medio de una variable. La sintaxis de WHILE es la siguiente set variable_control=0; WHILE (<condicion>) DO ... <sentencias> .. set variable_control=variable_control+1; END WHILE; Ejercicio resuelto: hacer un programa MySQL que imprima los 10 primeros números pares. drop procedure pares; delimiter // create procedure pares() begin declare contador int; set contador=0; while (contador<=20) do select (contador); set contador=contador+2; end while; end; // delimiter ; 5.3.4 Cursores Un cursor es un puntero que apunta a la primera fila del resultado de una consulta. Podemos ir haciendo avanzar el puntero y procesar cada fila por separado. Podemos dejar de procesar filas cuando lo deseemos, sin que sea obligatorio examinar todos los resultados. No se puede declarar variables nuevas despues de un cursor. Es decir, esto no es válido declare un_cursor cursor for... declare contador int; Esto sí es válido declare contador int; declare un_cursor cursor for... Un ejemplo de cursor sería el siguiente DECLARE nombre_cursor CURSOR FOR SELECT * FROM .... ; Para empezar a visitar la primera fila se debe hacer lo siguiente. No debemos olvidar CERRAR el cursor 68 Capítulo 5. Programación Bases de datos, Versión 1.1 CLOSE nombre_cursor; Ejercicio: extraer los proveedores que han recibido las 5 cantidades más grandes de suministros. drop procedure mejores_clientes; delimiter // create procedure mejores_clientes() begin declare contador int; declare num_prov_sacado varchar(5); declare cantidad_sacada int; declare cur1 cursor for select numprov, cantidad from suministra order by cantidad desc; open cur1; set contador=0; while (contador<5) do fetch cur1 into num_prov_sacado, cantidad_sacada; select (num_prov_sacado); select (cantidad_sacada); set contador=contador+1; end while; close cur1; end; // delimiter ; Ejercicio: hacer un programa que saque las 2 partes de más peso de la tabla partes. La consulta para este ejercicio sería: select * from partes order by peso desc; Y el procedimiento sería drop procedure mayores_pesos; delimiter // create procedure mayores_pesos() begin declare contador int; declare peso_extraido int; declare ciudad_extraida varchar(15); declare cur1 cursor for select ciudad,peso from partes order by peso desc; open cur1; set contador=0; while (contador<2) do begin fetch cur1 into ciudad_extraida, select (ciudad_extraida),(peso_extraido); set contador=contador+1; end; end while; close cur1; 5.3. Sentencias básicas 69 Bases de datos, Versión 1.1 end; // delimiter ; Ejercicio: sumar las cinco cantidades más bajas de la tabla suministra. La consulta sería ésta: select * from suministra order by cantidad; Y la solución sería drop procedure suma_filas; delimiter // create procedure suma_filas() begin declare contador int; declare suma int; declare cantidad_extraida int; declare cur1 cursor for select cantidad from suministra order by cantidad asc; open cur1; set suma=0; set contador=0; while contador<5 do fetch cur1 into cantidad_extraida; set suma=suma+cantidad_extraida; set contador=contador+1; end while; close cur1; select suma; end; // delimiter ; 5.3.5 Parámetros de salida Si un procedimiento tiene que devolver cosas puede hacerlo utilizando parámetros en la cabecera que hayan sido etiquetados como “out”. drop procedure suma_filas; delimiter // create procedure suma_filas(out suma_devuelta int) begin declare contador int; declare suma int; declare cantidad_extraida int; declare cur1 cursor for select cantidad from suministra order by cantidad asc; open cur1; set suma=0; set contador=0; while contador<5 do fetch cur1 into cantidad_extraida; 70 Capítulo 5. Programación Bases de datos, Versión 1.1 set suma=suma+cantidad_extraida; set contador=contador+1; end while; close cur1; set suma_devuelta=suma; end; // delimiter ; Ejercicio: realizar un procedimiento que devuelva en una variable la ciudad del proveedor con una cantidad total (sumar) de suministros mayor. La consulta sería algo así select sum(cantidad),suministra.numprov, ciudad from suministra inner join proveedores on suministra.numprov=proveedores.numprov group by numprov having sum(cantidad)>=ALL ( select sum(cantidad) from suministra group by numprov ); El procedimiento sería así: drop procedure mayor_suministro; delimiter // create procedure mayor_suministro (out ciudad_devuelta varchar(11) ) begin declare c_devuelta varchar(11); declare suma int; declare num_proveedor varchar(2); declare cur1 cursor for select sum(cantidad),suministra.numprov, ciudad from suministra inner join proveedores on suministra.numprov=proveedores.numprov group by numprov having sum(cantidad)>=ALL ( select sum(cantidad) from suministra group by numprov ); open cur1; fetch cur1 into suma, num_proveedor,c_devuelta; set ciudad_devuelta=c_devuelta; close cur1; end; // 5.3. Sentencias básicas 71 Bases de datos, Versión 1.1 delimiter ; 5.4 Funciones La sintaxis de una función es la siguiente delimiter // create function <nombre> (parametros) returns string begin end; // delimiter ; Ejercicio: construir una función que devuelva la suma total de cantidades de la tabla suministra La consulta sería así: select sum(cantidad) from suministra; Y la función drop function suma_suministra; delimiter // create function suma_suministra() returns int begin declare suma int; declare cur1 cursor for select sum(cantidad) from suministra; open cur1; fetch cur1 into suma; close cur1; return suma; end; // delimiter ; set @s=suma_suministra(); 5.5 Funciones MySQL La primera función de utilidad es la función CONCAT. Este trozo de código une dos cadenas en una sola set @cadena1=CONCAT(apellido, nombre); Hacer una función que devuelva el nombre de la pieza y el color en una sola cadena. Se debe devolver la pieza con un peso mayor. 72 Capítulo 5. Programación Bases de datos, Versión 1.1 La solución sería: delimiter // create function pieza_mayor_peso() returns varchar(25) begin declare declare declare declare cadena varchar(25); nombre_pieza varchar(10); color_pieza varchar(10); cur1 cursor for select nombreparte, color from partes where peso=( select max(peso) from partes ); open cur1; fetch cur1 into nombre_pieza, color_pieza; set cadena=CONCAT(nombre_pieza, ":", color_pieza); return cadena; close cur1; end; // delimiter ; Hay una pareja de funciones llamadas LEFT y RIGHT, que nos permiten extraer trozos de las cadenas. Por ejemplo, la función LEFT(peso, 1) nos devuelve la primera letra del campo peso. Ejercicio: construir una función que nos devuelva la pieza de mayor peso con la letra inicial del color entre paréntesis (es decir, se debe devolver algo como “Engranaje (R)”) Para resolver este ejercicio era necesario utilizar la función LEFT (cadena, longitud). Esta función nos devuelve un trozo de la cadena que mide lo que diga el parámetro longitud. Existe una variante que extrae trozos desde el lado derecho y que se llama RIGHT (cadena, longitud). drop procedure pieza_pesada_inicial; delimiter // create procedure pieza_pesada_inicial() begin declare parte_extraida varchar(15); declare color_extraido varchar(15); declare cadena varchar(30); declare inicial varchar(1); declare cur1 cursor for select nombreparte, color from partes where peso=( select max(peso) from partes open cur1; ); fetch cur1 into parte_extraida, color_extraido; set inicial=LEFT(color_extraido, 1); set cadena=CONCAT(parte_extraida, " (", inicial, ")" ); select (cadena); close cur1; end; 5.5. Funciones MySQL 73 Bases de datos, Versión 1.1 // delimiter ; Ejercicio: construir una función que nos devuelva el codigo de proyecto con una cantidad de suministros menor. Por problemas de integración con otra base de datos necesitamos que se devuelva todo en mayúsculas. Para resolver esto existe una función que convierte una cadena a su equivalente en mayúsculas. drop function proveedor_minimo; delimiter // create function proveedor_minimo () returns varchar(3) begin declare num_prov_extraido varchar(3); declare cur1 cursor for select numprov from suministra where cantidad=( select min(cantidad) from suministra ); open cur1; fetch cur1 into num_prov_extraido; set num_prov_extraido=UPPER(num_prov_extraido); close cur1; return num_prov_extraido; end; // delimiter ; Ejercicio: crear un procedimiento que acepte una cadena como parámetro. El procedimiento deberá mostrar todas las partes de la tabla partes cuyo nombre contenga la subcadena pasada como parámetro. Es decir, podemos hacer algo como ésto CALL buscar("To"); En general, la búsqueda de secuencias, cadenas o patrones es algo muy común pero muy sencillo de resolver con algunas funciones. La función INSTR() permite comprobar si una cierta subcadena está dentro de una cadena. Existe un operador llamado LIKE que permite hacer búsquedas “difusas”. Por ejemplo, se puede hacer una búsqueda como esta select * from partes where nombreparte LIKE "uer%"; El programa resuelto quedaría así drop procedure buscar; delimiter // create procedure buscar (subcadena varchar(15) ) begin declare patron varchar(17); 74 Capítulo 5. Programación Bases de datos, Versión 1.1 set patron=CONCAT("%", subcadena, "%"); select * from partes where nombreparte like patron; end; // delimiter ; Ejercicio: se desea crear un procedimiento que permita marcar como obsoletas ciertas partes de la tabla partes. Para ello, el usuario ejecutará un procedimiento como este call marcar_obsoleta("To"); Este procedimiento CAMBIARÁ los nombres de parte de la tabla partes poniéndoles un asterisco al principio. Para resolverlo será necesario manejar correctamente la condición de NOT FOUND para un cursor. Además, necesitamos un procedimiento principal que construya el patrón y que luego llame al procedimiento auxiliar que actualiza las filas. drop procedure marcar_obsoletas; drop procedure actualizar; delimiter // create procedure actualizar (patron varchar(15) ) begin declare terminar int; declare nombre_extraido varchar(35); declare nuevo_nombre varchar(38); declare cur1 cursor for select nombreparte from partes where nombreparte like patron; declare continue handler for not found set terminar=true; open cur1; set terminar=FALSE; while (terminar!=TRUE) do fetch cur1 into nombre_extraido; select (nombre_extraido); set nuevo_nombre=CONCAT("* ", nombre_extraido); update partes set nombreparte=nuevo_nombre where nombreparte=nombre_extraido; end while; close cur1; end; #Este procedimiento fabrica el patron y despues #llama a actualizar create procedure marcar_obsoletas(subcadena varchar(15)) begin declare patron varchar(17); set patron=concat("%", subcadena, "%"); call actualizar(patron); 5.5. Funciones MySQL 75 Bases de datos, Versión 1.1 end; // delimiter ; Ejercicio: crear un procedimiento que indique la desviación media de los pesos de las partes. drop procedure desviaciones_medias; delimiter // create procedure desviaciones_medias() begin declare terminado boolean; declare media decimal(8,2); declare peso_extraido decimal(8,2); declare desv decimal(8,2); declare cur1 cursor for select avg(peso) from partes; declare cur2 cursor for select peso from partes; declare continue handler for not found set terminado=true; open cur1; open cur2; fetch cur1 into media; fetch cur2 into peso_extraido; set terminado=false; while not terminado do # Se calcula la desviacion set desv= abs ( peso_extraido-media ); select desv; fetch cur2 into peso_extraido; end while; close cur1; close cur2; end; // delimiter ; Aparte de la función ABS, que calcula el valor absoluto se pueden encontrar otras funciones de utilidad como las siguientes: CEIL (valor): Redondear el valor hacia arriba. FLOOR (valor): Redondea hacia abajo. ROUND (valor, decimales): si hacemos ROUND (3.6576, 2) nos devolvería el valor 3.66 5.6 Solución al examen Cálculo de la mediana de un conjunto de valores 76 Capítulo 5. Programación Bases de datos, Versión 1.1 drop procedure mediana; delimiter // create procedure mediana (out mediana int) begin declare cuantos int; declare peso_extraido int; declare contador int; declare cur1 cursor for select count(*) from partes; declare cur2 cursor for select peso from partes order by peso asc; open cur1; fetch cur1 into cuantos; close cur1; open cur2; set cuantos=ceil(cuantos/2); set contador=0; while (contador<cuantos) do fetch cur2 into peso_extraido; set contador=contador+1; end while; set mediana=peso_extraido; close cur2; end; // delimiter ; Crear una función que nos devuelva “sí” si hay la misma cantidad de partes rojas que de proyectos de Atenas. Si no es así debe devolver “no”. drop function cuantos; delimiter // create function cuantos() returns varchar(2) begin declare cuantos_rojos, cuantos_atenas int; declare cur1 cursor for select count(*) from partes where color="Rojo"; declare cur2 cursor for select count(*) from proyectos where ciudad="Atenas"; open cur1; open cur2; fetch cur1 into cuantos_rojos; fetch cur2 into cuantos_atenas; if (cuantos_rojos=cuantos_atenas) then return "SI"; 5.6. Solución al examen 77 Bases de datos, Versión 1.1 else return "NO"; end if; close cur1; close cur2; end; // delimiter ; drop procedure insertar_madrid; 1 2 delimiter // 3 4 create procedure insertar_madrid( codigo_proyecto varchar(11), nombre_proyecto varchar(11) ) 5 6 7 8 begin 9 insert into proyectos values (codigo_proyecto,nombre_proyecto,"Madrid"); 10 11 end; 12 13 // 14 15 delimiter ; 16 78 Capítulo 5. Programación CAPÍTULO 6 Administración 6.1 Introducción La administración de un SGBD suele referirse a un SGBD corporativo. El administrador de bases de datos o DBA es el responsable de todo lo concerniente a los datos. Puede haber muchas personas que trabajen con los datos: programadores SQL, programadores Java, programadores web, etc... Los SGBD corporativos, como MySQL ofrecen muchas posibilidades, casi tantas como un sistema operativo. Un problema fundamental en la administración de un SGBD pasa es asegurar el uso correcto de los permisos: en líneas generales, los permisos deberían restringirse al mínimo. Además, para obtener la máxima seguridad deberíamos hacer otras tareas como las siguientes: Se debe comprobar también la seguridad del resto del equipo: seguridad física, seguridad del sistema operativo, etc... No compartir la clave de root. Dar solamente los permisos mínimos necesarios, aunque sea más trabajoso. No se debe trabajar con claves sin cifrar. Se deben utilizar cortafuegos. 6.2 Aspectos básicos de las contraseñas 6.2.1 La clave de root Cuando nos conectamos a un servidor hacemos esto mysql -u root -p lo que es potencialmente inseguro, ya que es posible capturar tramas en redes y obtener contraseñas. Si se desea acceder a otro host distinto (tal vez un remoto) se debe hacer lo siguiente: 79 Bases de datos, Versión 1.1 mysql -u root -p -h 10.9.0.91 6.2.2 Las claves de usuarios no root Es posible conectar con un servidor MySQL de varias formas mysql -u pepito --password=1234 mysql -u pepito -p La segunda es preferible, aunque más incómoda. 6.2.3 Hashes Un hash es un cálculo que se hace sobre una secuencia de datos que se utiliza para asegurar la integridad de la secuencia de datos. 6.2.4 Cambios entre versiones En MySQL 4.1 se cambió el sistema. Los nuevos hashes se almacenan con un asterisco delante. 6.2.5 Asegurando contra atacantes En sistemas UNIX MySQL no debe ejecutarse con el usuario root. Al crear usuarios debe tenerse mucho cuidado al usar comodines. No debe permitirse a los usuarios crear ficheros. No debe haber usuarios sin clave. 6.3 El sistema de privilegios MySQL tiene un sistema interno que controla quien puede hacer qué. Se debe tener en cuenta que MySQL tiene dos barreras 1. La primera barrera se da en la conexión: se debe disponer de un usuario y de una clave. 2. La segunda barrera se comprueba cada vez que el usuario escribe una sentencia. Se debe tener cuidado porque a veces los cambios en los permisos no se ejecutan inmediatamente. Si observamos que esto está ocurriendo podemos lanzar el comando siguiente: FLUSH PRIVILEGES; Para ver los permisos concedidos al usuario que utilizamos podemos lanzar este comando show grants; A partir de ahora debemos recordar que un usuario no es solamente un login, sino también un sitio desde el que se conecta. Estos dos usuario NO SON IGUALES 80 Capítulo 6. Administración Bases de datos, Versión 1.1 ’pepito’@’localhost’ ’pepito’@’10.9.0.0/255.255.0.0’; ’pepito’@’sede-a.empresaacme.com’; Los permisos pueden ser de tres tipos: Administrativos: controlan la forma en que MySQL se comporta. De base de datos: afectan a todas las tablas de una BD. De tabla: controlan los accesos a solo una de las tablas de una BD. Los permisos de MySQL están controlados por medio de una BD especial llamada “mysql”. La tabla user almacena los privilegios asociados a los usuarios select user, host,password from user; Se puede observar que hay dos usuarios llamados root@localhost y [email protected]. Son usuarios distintos y ambos tienen la clave vacía. No deben tenerse SGBD con la clave de root vacía. Además la instalación por defecto también crea un usuario vacío y sin contraseña que permite conectarse sin clave. Para borrar un usuario se usa el comando DROP USER DROP USER ’’@’localhost’; Si un cambio no tiene lugar es posible que los cambios no se hayan volcado en el sistema de MySQL. Podemos forzar a que los cambios tengan efecto usando este comando FLUSH PRIVILEGES; Se debe tener en cuenta que para poder conectar a una base de datos remota debemos disponer del usuario con el host correspondiente. ¿Qué ocurre si aparentemente podemos entrar como dos posible usuarios distintos?. Supongamos que nos conectamos desde la IP 10.9.0.200 con el usuario root y en MySQL hay dos usuarios (el % significa “cualquier cosa”). usuario root root host 10.9.0.200 % password sesamo 12341234 La regla es que cuando un usuario se conecta y se le pueden aplicar dos o más reglas se utiliza siempre la más restrictiva. Para crear un usuario debemos especificar su login y su host. El host podría ser ‘ %’. create user ’dam1’@’10.9.0.0/255.255.0.0’ identified by ’sesamo’; create user ’dam1’@’10.9.0.254’ identified by ’12341234’; create user ’dam1’@’ %’ identified by ’6789’; En ocasiones un usuario puede haber olvidado su clave o simplemente se desea renovar la misma por una política de seguridad. 6.3. El sistema de privilegios 81 Bases de datos, Versión 1.1 set password for ’dam1’@’10.9.0.0/255.255.0.0’ = PASSWORD(’12345678’); ESTO ES UN ERROR set password for ’dam1’@’10.9.0.0/255.255.0.0’ = ’12345678’; 6.4 El sistema de concesiones Para permitir a un usuario lanzar comandos se debe utilizar el comando siguiente GRANT <PERMISOS> ON <BASE_DE_DATOS>.<COLUMNA1>, <BASE_DE_DATOS>.<COLUMNA2>, .. <BASE_DE_DATOS>.<COLUMNAN>, proyectos.* *.* TO ’dam1’@’10.9.0.0/255.255.0.0’; Un ejemplo sería este grant insert,select on proyectos.partes to ’dam1’@’10.9.0.0/255.255.0.0’; flush privileges; revoke insert,select on proyectos.partes from ’dam1’@’10.9.0.0/255.255.0.0’; flush privileges; Aparte de los permisos SELECT, INSERT, UPDATE Y DELETE, CREATE, CREATE INDEX, CREATE VIEW Ejercicio: diseñar un esquema de seguridad para dar respuesta a las siguientes necesidades de acceso a datos. Se necesita dar acceso a dos usuarios que puedan seleccionar datos de cualquier tabla que exista en la base de datos proyectos. De uno de los usuarios sabemos su IP (preguntar al compañero). El otro usuario puede provenir de cualquier punto de la red 10.9.xxx.xxx. Existe un usuario admin que puede provenir de cualquier punto de la red 10.9 y que puede hacerlo todo con cualquier tabla de la base de datos proyectos. Extra: se desea que el usuario admin tenga a su vez permisos para conceder permisos. 6.5 Usuarios con restricciones Al crear un usuario puede ser interesante limitar la cantidad de actividad que dicho usuario ejecuta por hora. Al crear los usuarios con CREATE USER se pueden indicar algunas limitaciones como las siguientes 82 Capítulo 6. Administración Bases de datos, Versión 1.1 create user ’admin’@’10.9.0.0/255.255.0.0’ identified by ’1234’ grant select on proyectos.* to ’admin’@’10.9.0.0/255.255.0.0’ with max_queries_per_hour 8 with max_connections_per_hour 3 with max_updates_per_hour 2 ; El parámetro max_queries_per_hour se refiere a máximo de comandos generales, mientras que max_update_per_hour se refiere específicamente a consultas que involucren cambios. 6.6 Vistas Una vista es un trozo extraído de una tabla en base a una consulta. Las vistas pueden utilizarse para restringir aún más la cantidad de información que pueden ver los usuarios. Antes de crear una vista se debe tener muy clara la consulta que se va a aplicar. Por ejemplo, si deseamos tener por separado los datos de Paris sin incluir el estado podríamos crear una vista como esta: CREATE VIEW PROV_PARIS AS SELECT NUMPROV,NOMBREPROV,CIUDAD FROM PROVEEDORES WHERE CIUDAD="Paris"; CREATE USER ’usu_paris’@’10.9.0.0/255.255.0.0’ IDENTIFIED BY ’paris’; CREATE USER ’usu_paris’@’localhost’ IDENTIFIED BY ’paris’; GRANT SELECT ON PROYECTOS.PROV_PARIS TO ’usu_paris’@’10.9.0.0/255.255.0.0’; GRANT SELECT ON PROYECTOS.PROV_PARIS TO ’usu_paris’@’localhost’; Ejercicio: los administradores de la base de datos de proyectos necesitan establecer una configuración de seguridad de acuerdo a las siguientes caracteristicas Existe un usuario admin que puede conectarse desde cualquier punto de la red 10.9 que puede hacer lo siguiente • Insertar, seleccionar, actualizar y borrar datos de cualquier tabla • Puede crear también vistas nuevas Existe un usuario jefe_londres que puede hacer cualquier cosa con los datos de cualquier tabla donde la ciudad sea Londres. Puede conectarse desde cualquier sitio. Existe un usuario usu_continental que puede insertar y seleccionar datos en tablas donde la ciudad sea Atenas o Paris. Puede conectarse desde cualquier sitio. Existe un usuario pruebas que puede hacer consultas a cualquier tabla. Solo puede hacerlo el que tenga cierta IP (la del compañero de al lado) Solución: 6.6. Vistas 83 Bases de datos, Versión 1.1 drop user ’admin’@’10.9.0.0/255.255.0.0’; create user ’admin’@’10.9.0.0/255.255.0.0’ identified by ’1234’; grant insert,select,update,delete, create view on proyectos.* to ’admin’@’10.9.0.0/255.255.0.0’; Para el segundo apartado hay que permitir a ‘jefe_londres’ que manipule las tablas donde la ciudad sea Londres. Las tablas que cumplen este requisito son proveedores, partes y proyectos. Este requisito obliga a crear tres vistas separadas para cada una de las tres tablas. create view partes_londres as select * from partes where ciudad=’Londres’; create view proveedores_londres as select * from proveedores where ciudad=’Londres’; create view proyectos_londres as select * from proyectos where ciudad=’Londres’; create user ’jefe_londres’@’ %’ identified by ’londres’; grant all privileges on proyectos.partes_londres, proyectos.proveedores_londres, proyectos.proyectos_londres to ’jefe_londres’@’ %’; Para el tercer apartado create user ’jefe_continental’@’ %’ identified by ’continental’; create view partes_continentales as select * from partes where ciudad=’Atenas’ or ciudad=’Paris’; create view proveedores_continentales as select * from proveedores where ciudad=’Atenas’ or ciudad=’Paris’; create view proyectos_continentales as select * from proyectos where ciudad=’Atenas’ or ciudad=’Paris’; grant insert,select on proyectos.proyectos_continentales, proyectos.partes_continentales, proyectos.proveedores.continentales to ’jefe_continental’@’ %’; create user ’pruebas’@’10.9.0.99’ 84 Capítulo 6. Administración Bases de datos, Versión 1.1 identified by ’prueba’; grant select on proyectos.* to ’pruebas’@’10.9.0.99’ 6.7 Recuperando la clave de root Para recuperar la clave de root de MySQL se necesitará la clave de “Administrador” de Windows o la clave de “root” de Linux. Puede ser necesario manejar varias consolas, al menos dos. En el modo especial que vamos a utilizar NO SE PUEDEN USAR LOS COMANDOS SET PASSWORD. Sin embargo la sentencia UPDATE sigue funcionando, por lo que podremos usarla para restaurar a una nueva clave conocida. El proceso tiene varios pasos 1. Arrancar una consola e ir al directorio de MySQL. Se debe re-arrancar el mysqld con una opción especial para no utilizar los permisos. Para parar el proceso puede ser necesario parar el proceso “mysqld.exe” mysqld --skip-grant-tables Con esto el servidor de bases de datos arranca, ignorará todas las claves y permisos y se quedará en segundo plano. 2. En otra consola, volvemos a conectar con mysql, pero ahora no hará falta poner clave a root. mysql -u root mysql> use mysql; mysql> select user,host,password from user; mysql> update user set password=PASSWORD("1234") where user=’root’ and host=’localhost’; 3. Una vez hecho el update, podemos parar el proceso mysqld y volver a arrancarlo normalmente disponiendo de la clave de root recuperada. 6.8 Copias de seguridad 6.8.1 Introducción Las copias de seguridad permiten a un administrador recuperar los datos en casos de desastre informático. En líneas generales cualquier desastre conllevará cierta pérdida de datos. Existen diversos tipos de copia de seguridad: Físicas: copiar los directorios de la base de datos. La ventaja es que es muy fácil de hacer. El inconveniente es que MySQL no reconoce directorios que no estén gestionados por él. Lógicas: son copias procesadas y generadas por el propio SGBD. Son un poco más difíciles de hacer (hay que aprender comandos) pero son muy fáciles de restaurar. Si hay muchos datos en muchas tablas, las lógicas pueden llegar a ser muy lentas. 6.7. Recuperando la clave de root 85 Bases de datos, Versión 1.1 Otra posibilidad es distinguir las copias de seguridad que se hacen “en caliente” o “en frío”. “En frío”: el servidor SE PARA y nadie puede registrar datos nuevos o borrar datos viejos. “En caliente”: el servidor no se para, aún a riesgo de que haya datos que no entren en esta copia de seguridad y se queden para la siguiente. 6.8.2 El comando mysqldump El comando mysqldump es el más utilizado para hacer copias de seguridad lógicas en caliente. Este comando se conectará al servidor de bases de datos y volcará los datos que pidamos a un fichero SQL. Las opciones que maneja el programa son las siguientes –single-transaction: con este parámetro hacemos que nuestra copia se procese como un único gran conjunto de operaciones de lectura de datos. Esto permite asegurar que no hay solapamientos en operaciones de cambios en los valores de los datos. -u root -p: No siempre hace falta ser el administrador. Si existe un usuario ‘dam1’@‘10.9.0.0/255.255.0.0‘ y dicho usuario tiene permisos de lectura en una base de datos también los tendrá para hacer la copia de seguridad. mysqldump -u root -p --single-transaction proyectos > copia1.sql Es posible hacer copias de seguridad solo de ciertas tablas. Esto permite ahorrar tiempo en la copia y además perturbar menos la carga de trabajo del SGBD. Si por ejemplo, deseásemos copiar solo la tabla partes, basta con indicar su nombre detrás del nombre de la base de datos mysqldump -u root -p --single-transaction proyectos partes > copia2.sql 6.8.3 Los “outfiles” Los outfiles son archivos donde se pueden dejar los resultados de consultas. Proporcionan mucha versatilidad y flexibilidad, pero se deben tener los permisos correspondientes por parte del administrador del sistema operativo. Por ejemplo, para hacer una copia de seguridad de los proveedores de Londres haríamos esto mysql -u root -p mysql> use proyectos; mysql> select * into outfile ’prov_londres.txt" from proveedores where ciudad=’Londres’; Se podría poner una ruta como ‘C:prov_londres.txt’. Si no lo ponemos el archivo se crear en mysqldataproyectos Supongamos que se pierden los datos de los proveedores de Londres mysql> delete from proveedores where ciudad=’Londres’; Para recargar datos guardados en un outfile se usaría algo como esto mysql> load data infile ’prov_londres.txt’ into table proveedores; 86 Capítulo 6. Administración Bases de datos, Versión 1.1 6.8.4 Copias de seguridad incrementales Las copias de seguridad completas son muy fáciles de restaurar. Sin embargo, si una BD es grande será muy lenta de hacer, interrumpirá el trabajo del SGBD y el espacio en disco se agotará rápidamente. Las copias de seguridad incrementales permiten almacenar solamente los cambios hechos desde un cierto momento. Por ejemplo, se podría hacer una copia completa el día 1 de cada mes y luego al final de cada día, una incremental. Si hubiera un fallo, por ejemplo, el día 17, se necesitarán aplicar las copias en orden empezando por la completa seguida de los 16 incrementos. Esto significa que la restauración de copias incrementales es más pesada de hacer que las completas. Para poder hacer copias incrementales, MySQL debe haber sido arrancado con la opción correcta. mysqld --log-bin mysql -u root -p mysql> update... #Esto obliga a volcar los nuevos logs que #se hayan podido generar mysqladmin -u root -p flush-logs Usando los comandos mysqlbinlog podemos volcar cualquier archivo de log en un fichero mysql. 6.8. Copias de seguridad 87 Bases de datos, Versión 1.1 88 Capítulo 6. Administración CAPÍTULO 7 Access 7.1 Introducción Access es un SGBD “ofimático”. Una característica fundamental de su uso es que es monousuario. Si se desea un SGBD multiusuario de MS, se necesitará utilizar SQL Server (Express) Access ofrece un entorno de desarrollo integrado, lo que supone una ventaja en cuanto a la comparación con otros productos. Como curiosidad histórica, Access proviene de un conjunto de bibliotecas llamados JetDB. Access respeta el estándar ODBC que permite “compartir” bases de datos para que sean consultadas por programas que se conecten desde un sitio remoto. 7.2 El entorno Al arrancar Access se ofrecen un conjunto de plantillas que contienen BD “prefabricadas” con tablas ya creadas junto con las claves y las relaciones entre dichas tablas. Esto permite acelerar el tiempo de desarrollo en ciertos casos, sin embargo en otros se deberá asumir el control y crear las tablas, claves y relaciones desde cero. Al crear una base de datos en blanco, Access ofrece un diseño inicial de la tabla en la que ya hay un campo llamado “Id” de tipo “autonumérico”. Un tipo autonumérico es un número que se incremente en uno de forma automática. Se pueden quitar y poner columnas desde este entorno inicial así como indicar los tipos de los datos de forma sencilla. Se pueden marcar varios campos como “único”, es decir sus valores no se pueden repetir. Si un campo tiene la marca “se requiere” es que es obligatorio rellenarlo con algo. Cuando un número se manipula para que muestre más o menos decimales no se va a modificar el número almacenado. Access permite indicar que una columna se va a utilizar a menudo para hacer búsquedas. Si algunos valores se usan mucho la inserción será más cómoda. El botón “Relaciones” permite establecer relaciones de clave ajena entre las tablas de una base de datos. 89 Bases de datos, Versión 1.1 7.2.1 Ejercicio Utilizando el entorno de Access, crear la estructura de proveedores, partes y proyectos utilizada en el tema 4, en el archivo SQL “BD Proveedores, partes y proyectos”. 90 Capítulo 7. Access CAPÍTULO 8 BBDD Objeto relacionales 8.1 Introducción Un objeto es una representación de una entidad física que consta de atributos y métodos. La herencia es la capacidad de compartir automáticamente atributos y/o métodos. En BBDD una relación es lo mismo que una tabla. El nombre “relación” proviene del concepto matemático de relación. Las bases de datos objeto-relacionales son aquellas capaces de manipular relaciones utilizando conceptos relacionados con la programación orientada a objetos. Aparte de todo esto, las bases de datos objeto-relacionales suelen tener otras capacidades interesantes, como la manipulación de datos espaciales, textuales e incluso representaciones en XML. XML es un formato de intercambio de datos basado en marcas. En este tema veremos como utilizar PostgreSQL, que es un sistema de BBDD objeto-relacional que ofrece las capacidades que hemos comentado. 8.2 Instalación de PostgreSQL Durante la instalación de Postgres podremos elegir los directorios de instalación del programa y de datos. Se puede obtener una pequeña mejora en la eficiencia almacenando los datos en un disco duro distinto. Por otro lado, en la instalación se nos pedirá la clave de administración del usuario principal (llamado postgres). 8.3 Uso de Postgres en una máquina virtual Las máquinas virtuales tienen diversos modos de funcionamiento que condicionan lo que tenemos que hacer para que alguien pueda acceder a nuestro Postgres (o MySQL) dentro de Virtual BOX NAT: El anfitrión actúa de “router” Red Interna: la comunicación solo se da entre VM 91 Bases de datos, Versión 1.1 Puente: El SO virtualizado es una máquina más. Solo host: la comunicación solo se da entre anfitrión y virtualizado. 8.3.1 Acceso a Postgres con VM en modo puente Como la máquina virtual es una más de la red, bastará con configurar el SO virtualizado para que alguien pueda acceder a la IP del SO virtualizado y conectar con el puerto 5432 que es el de Postgres. 8.3.2 Acceso a Postgres con VM en modo NAT Este modo ofrece una mayor seguridad, ya que VirtualBox actúa como un router con su propio cortafuegos. Para configurar el acceso a Postgres dentro de VirtualBox hay que configurar correctamente el envío de puertos. El objetivo final es que cuando alguien conecte con la IP de nuestro SO virtualizado, VirtualBox autorice esa entrada de tráfico. El proceso es el mismo que se conoce como “abrir puertos”. Se debe autorizar el tráfico para el puerto TCP 5432 y reenviarlo a la IP del SO virtualizado sin poner nada en la IP del SO anfitrión (lo que indica que nos da igual la IP de origen que inicia la conexión). 8.3.3 Acceso a Postgres en modo “Solo host” En este caso, se debe configurar el SO anfitrión para que reenvíe el tráfico hacia el SO virtualizado. Es decir, el SO anfitrión debe tener capacidades de enrutamiento. 8.3.4 Acceso a Postgres en modo red interna No funcionará si alguien se conecta desde otra máquina física distinta. El modo red interna es para hacer experimentos y el tráfico generado nunca sale de la máquina. 8.4 Funcionamiento básico de Postgres El funcionamiento es muy similar a MySQL. Hay un programa servidor que espera peticiones y nos conectamos a él con un programa cliente. Un cliente puede ser gráfico o textual. En cualquiera de los dos casos, las operaciones que se pueden hacer son las mismas. Al usar el interfaz gráfico podemos hacer distintas operaciones de creación con el botón derecho del ratón mientras que en el interfaz textual deberemos lanzar comandos. 8.5 Comandos de Postgres Postgres respeta el estándar ANSI SQL, al igual que MySQL, por lo que los comandos son iguales. 92 Capítulo 8. BBDD Objeto relacionales Bases de datos, Versión 1.1 8.5.1 Creación de tablas CREATE TABLE <nombre> ( <nombre_de_campo> <nombre_de_campo> <nombre_de_campo> <nombre_de_campo> ); <tipo>, <tipo>, <tipo>, <tipo> Ejemplo: CREATE TABLE partes ( id nombre color peso ciudad ); integer primary key, varchar(20), varchar(8), numeric(3,1), varchar(15) Se pueden poner también claves ajenas, de la misma forma que se podía en MySQL. CREATE TABLE propietarios ( id integer primary key, nombre varchar(20), id_parte integer, foreign key (id_parte) references partes(id) ); Al tener las tablas vacías, si intentásemos insertar este valor, veremos que no se puede. Si el propietario con el código 3, llamado Juan posee la parte 1, deberíamos escribir lo siguiente: INSERT INTO propietarios VALUES (3, ’Juan’, 1 ); Para que esto funcione, primero deberíamos hacer algo como esto INSERT INTO partes VALUES (1,’Tornillo’, ’Rojo’, 12.3, ’Londres’ ); Para ver las tablas que hay se puede usar el pseudocomando d. Para ver la descripción de una tabla concreta se puede usar d <nombre_de_tabla> Herencia La herencia permite que una tabla herede automáticamente los campos y restricciones de otra tabla a la que se llama tabla padre. Por ejemplo, supongamos que en una empresa hay empleados con id y sueldo, pero despues hay varios tipos de empleado, como investigador, becario y administrativo. Creación de la tabla padre: CREATE TABLE empleados ( id integer primary key, 8.5. Comandos de Postgres 93 Bases de datos, Versión 1.1 nombre sueldo varchar(50), numeric(6,2) ); Creación de la tabla hija investigadores CREATE TABLE investigadores ( nombre_proyecto varchar(30) ) INHERITS (empleados); Ejercicio: insertar el investigador con id 5, con nombre ‘Tomas’, sueldo 3500 y nombre_proyecto ‘Consola’. Respuesta: El código SQL es el siguiente: INSERT INTO investigadores VALUES (5,’Tomas’, 3500, ’Consola’); Si ahora consultamos las dos tablas veremos que el valor SE INSERTA EN LAS DOS TABLAS Podemos repetir la inserción de valores, las veces que deseemos, y siempre se propagarán los valores INSERT INTO investigadores VALUES ( 7,’Julian’, 5100, ’Antena’ ); INSERT INTO investigadores VALUES ( 42, ’Andres’, 2400, ’Disco’ ); Ejercicio: Construir las tablas Becarios y Administrativos que heredan de Empleados. La tabla Becarios tiene los campos duracion_contrato (integer) y la Administrativos tiene los campos categoria varchar(10) y titulacion varchar(15). Insertar valores en las dos tablas. CREATE TABLE becarios ( duracion_contrato integer ) inherits (empleados); INSERT INTO becarios VALUES ( 4, ’Luis’, 1900, 9 ); CREATE TABLE administrativos ( categoria varchar(10), titulacion varchar(15) ) INHERITS (empleados); INSERT INTO administrativos VALUES ( 13, ’Angel’, 2450, ’B1’, ’Tec. Sup. DAM’ ); Ejercicio: Borrar el empleado cuyo código es el número 7. Examinar las tablas investigadores y empleados para ver qué ha ocurrido. delete from empleados where id=7; Ejercicio: Borrar el investigador cuyo código es el número 42. Examinar las tablas investigadores y empleados para ver qué ha ocurrido. 94 Capítulo 8. BBDD Objeto relacionales Bases de datos, Versión 1.1 delete from investigadores where id=42; Ejercicio: La empresa en la que trabajamos ha decidido crear dos categorías adicionales de empleados. Los becarios repartidores y los becarios auxiliares. La tabla Repartidores tiene un solo campo llamado km y que es de tipo numeric (6,1). La tabla auxiliares tiene dos campos denominados horas_extra, de tipo integer, y el campo tipo_acceso, que es un varchar(30). Insertar valores en Repartidores y Auxiliares y comprobar qué ocurre en las diversas tablas. CREATE TABLE repartidores ( km numeric(6,1) ) INHERITS (becarios); CREATE TABLE auxiliares ( horas_extra integer, tipo_acceso varchar(30) ) INHERITS (becarios); Un repartidor tiene un id (22), un nombre (Ramon), un sueldo (870), una duración de contrato (6 meses), y un kilometraje 1450. INSERT INTO repartidores VALUES ( 22, ’Ramon’, 870, 6, 1450 ); Un auxiliar tiene un id (33), un nombre (Ricardo), un sueldo (760),una duración de contrato (18 meses), unas horas extra (85), y un tipo de acceso (Convenio) INSERT INTO auxiliares VALUES ( 33, ’Ricardo’, 760, 18, 85, ’Convenio’ ); Conclusión: la herencia funciona como un árbol de tablas, en las cuales el SGBD propaga correctamente todos los datos hacia las tablas padre. Además, al construir las tablas no es necesario construir ninguna clave ajena ni especificar borrados o actualizaciones en cascada. Tipos de herencia En Postgres, la herencia no es absoluta. Es decir, en nuestro ejemplo de empleados, becarios y administrativos, podemos tener datos que aparezcan en una tabla, pero no en las tablas hija. En el ejemplo que hemos visto, la pregunta sería ¿puede haber alguien que esté simplemente en la tabla empleados, sin estar en ninguna de las hijas?. SÍ Probemos por ejemplo este SQL. INSERT INTO empleados VALUES ( 8.5. Comandos de Postgres 95 Bases de datos, Versión 1.1 5, ’Alicia’, 1950 ); Cuando en una tabla hay datos suyos y datos de otras tablas que heredan, la selección de datos puede requerir comandos especiales. ¿Cómo se pueden recuperar simplemente las personas que son empleados normales, sin tener en cuenta becarios o investigadores?. Para recuperar tales datos se debe hacer lo siguiente select * from only empleados; En resumen: si se desea recuperar los datos de una tabla sin incluir los datos de sus posibles tablas hija, se debe hacer un select * from only <nombre_de_la_tabla> 8.6 Creación de tipos de datos Los lenguajes de programación ofrecen soporte para crear nuestros propios tipos de datos (en Java, se llaman “clases”). PostgreSQL ofrece soporte para crear nuestros propios tipos o clases. Una vez creado un tipo, podemos crear tablas cuyos campos sean del tipo que hemos creado. Para crear un tipo de datos, se debe hacer lo siguiente CREATE TYPE Rectangulo AS ( la_base int, altura int ); Y para usar ese tipo en un campo, se usa de la misma forma que cualquier otro tipo. CREATE TABLE rectangulos ( id int primary key, r Rectangulo ); ¿Como se insertan datos en estas tablas?. La inserción de tipos creados por nosotros requiere usar ‘( <datos> )’. INSERT INTO rectangulos VALUES ( 1, ’(2, 12)’ ); INSERT INTO rectangulos VALUES ( 2, ’(6, 2)’ ); INSERT INTO rectangulos VALUES ( 3, ’(2, 12)’ ); 96 Capítulo 8. BBDD Objeto relacionales Bases de datos, Versión 1.1 Ejercicio: crear una tabla que pueda almacenar el tipo de datos Punto3D. Un punto en 3D tiene tres coordenadas x, y, z que pueden ser números con hasta 2 decimales. Insertar algunos valores en la tabla. CREATE TYPE Punto3D AS ( x decimal(8,2), y decimal(8,2), z decimal(8,2) ); CREATE TABLE puntos ( id integer primary key, punto Punto3D ); insert into puntos values ( 1, ’(2.25, 6.57, 8.96 ); )’ insert into puntos values ( 2, ’(12.25, 9.7, 5.6 )’ ); insert into puntos values ( 3, ’(9.65, 8.7, 3.6 )’ ); Un detalle importante es que cuando los valores sean cadenas NO SE DEBEN DEJAR ESPACIOS ENTRE LAS COMAS. Ejercicio: crear un tipo de datos Linea que tenga un campo m (que es la pendiente de la recta) de tipo decimal(8,2), un campo k que es la constante a sumar, de tipo decimal(8,2) y un campo orientacion que es varchar(5). Crear una tabla que permita almacenar valores e insertar 3. CREATE TYPE Linea AS ( m decimal(8,2), k decimal(8,2), orientacion varchar(5) ); CREATE TABLE lineas ( id integer primary key, l Linea ); Cuidado: al insertar información de los varchar, se deben evitar los espacios entre comas. INSERT INTO lineas VALUES ( 1, ’(3,2,N-S)’ 8.6. Creación de tipos de datos 97 Bases de datos, Versión 1.1 ); INSERT INTO lineas VALUES ( 2, ’(2.41,-7.22,SE-NO)’ ); INSERT INTO lineas VALUES ( 3, ’(-4.46,-12.33,NE-SO)’ ); 8.7 Soporte documental El procesamiento de documentos involucra resolver una serie de problemas Stop words: artículos, preposiciones. En general, palabras que no aportan (casi) nada al discurso. Relevancia: es una medida de como de bueno es un documento en relación a una búsqueda. Rendimiento: es la capacidad de un programa para ser eficiente en las búsquedas de texto. Postgres ofrece soporte documental permitiendo almacenar campos de tipo text. Para poder hacer búsquedas hay que conocer algunas funciones de Postgres. La función to_tsvector coge un campo y lo procesa de forma eficiente para poder buscar en él. La función to_tsquery coge una cadena y la procesa como si fuera una búsqueda. El operador que intenta asociar una búsqueda con un texto es el @@. Una prueba muy simple select to_tsvector( ’Postgresql es un sistema gestor de base de datos’) @@ to_tsquery (’mysql’); select to_tsvector( ’Postgresql es un sistema gestor de base de datos’) @@ to_tsquery (’mysql & postgresql’); select to_tsvector( ’Postgresql es un sistema gestor de base de datos’) @@ to_tsquery (’mysql | postgresql’); ¿Qué capítulo es el que habla de algo virtual? ¿y de VirtualBox? select id from capitulos where to_tsvector(texto) @@ 98 Capítulo 8. BBDD Objeto relacionales Bases de datos, Versión 1.1 to_tsquery(’virtual’); select id from capitulos where to_tsvector(texto) @@ to_tsquery(’VirtualBox | (Virtual & Box)’); Ejercicio: ¿Qué número de capítulo es el que habla de algún cliente de Postgres? select id from capitulos where to_tsvector(texto) @@ to_tsquery(’cliente’); Ejecuta estas dos consultas y comprueba el resultado select to_tsvector(’Postgres es un cliente de BD orientado a objetos con una gran capaci select to_tsvector(’spanish’, ’Postgres es un cliente de BD orientado a objetos con una Si indicamos el idioma del texto, Postgres utilizará una base de datos interna para eliminar las stop-words adecuadas para ese idioma. ¿Qué ocurre si una misma palabra buscada aparece en dos o más documentos?. 8.8 Sistemas de información geográfica Son programas especializados en el procesamiento de información geográfica. Esta información puede procesarse en dos formas 2 Dimensiones: es un mecanismo más rápido pero más impreciso 3 Dimensiones: se obtiene más precisión pero suele requerir más operaciones, lo que lo hace más lento. Los SIG ofrecen (a veces) soporte para el cálculo de rutas, lo que es un problema de difícil solución cuando hay muchos pueblos/ciudades y muchas rutas. 8.8.1 Uso de PostGIS Distintos usuarios pueden haber utilizado distintos sistemas de referencia. Si se proporciona al GIS las diferencias entre los dos puntos (0,0) el GIS puede calcular automáticamente los movimiento entre dos mapas que hayan usado distintos Sistemas de Referencia. En un SIG tenemos tres elementos principales para almacenar información geográfica Puntos Líneas Polígonos Para crear una base de datos, podemos hacer lo siguiente desde la línea de comandos o desde el pgAdmin. 8.8. Sistemas de información geográfica 99 Bases de datos, Versión 1.1 create database espanya; Esto indica que queremos que nuestra BD actúe como una extensión PostGIS, es decir como una base de datos SIG create extension postgis; Creamos una tabla de puntos create table puntos ( id integer primary key, punto geometry(POINT) ); E insertamos algunos valores insert into puntos values ( 1, ST_GeomFromText(’POINT(5 4)’) ); insert into puntos values ( 2, ST_GeomFromText(’POINT(6 5.2)’) ); insert into puntos values ( 3, ST_GeomFromText(’POINT(9 7)’) ); Creamos ahora una tabla de líneas create table lineas ( id integer primary key, linea geometry(LINESTRING) ); Insertamos algunos valores insert into lineas values ( 10, ST_GeomFromText ( ’LINESTRING(5 4, 7 5, 9 7)’ ) ); insert into lineas values ( 20, ST_GeomFromText 100 Capítulo 8. BBDD Objeto relacionales Bases de datos, Versión 1.1 ( ’LINESTRING(4 1, 4 4,5 7)’ ) ); insert into lineas values ( 30, ST_GeomFromText ( ’LINESTRING(6 2, 6 5, 4 7)’ ) ); Se puede calcular la longitud de una ruta utilizando la función ST_Length. Ejercicio: crear una consulta select que nos dé la carretera de mayor longitud. select id, ST_Length(linea) from lineas where ST_Length(linea) = ( select max(ST_Length(linea)) from lineas ); Aparte de calcular longitudes, es posible comprobar otras cuestiones de interés geográfico. ¿Está una cierta ciudad en una cierta ruta?. Para averiguar esto, tenemos la función ST_Within. Esta función devuelve ‘f’ si no se cumple o ‘t’ en el caso de que sí se cumpla. Ejercicio: listar los codigos de punto que están dentro de alguna ruta de la tabla lineas. PostGIS (que es como se llama la extensión que hemos instalado, también soporta la definición de áreas). Para ello, hay que crear tablas que almacenen tipos POLYGON. create table parcelas ( id integer primary key, parcela geometry(POLYGON) ); insert into parcelas values ( 1, ST_GeomFromText ( ’POLYGON (( 0 0, 0 1000, 100 1000, 100 0, 0 0 ))’ ) ); 8.8. Sistemas de información geográfica 101 Bases de datos, Versión 1.1 insert into parcelas values ( 2, ST_GeomFromText ( ’POLYGON (( 100.1 0, 100.1 1000, 200 1000, 200 0, 100.1 0 ))’ ) ); select id, ST_AsText(parcela) from parcelas; insert into parcelas values ( 3, ST_GeomFromText ( ’POLYGON (( 199.5 1000, 300 1000, 300 0, 199.5 0, 199.5 1000 )) ’ ) ); Ejercicio: Utilizando la función ST_Intersects averiguar qué parcelas tienen intersecciones con otras parcelas. select p1.id, p2.id from parcelas as p1, parcelas as p2 where ST_Intersects ( p1.parcela, p2.parcela )=’t’ and p1.id<>p2.id; Se puede calcular el area de un polígono cualquiera por irregular que sea o independientemente de los huecos son ST_Area select id, ST_Area(parcela) from parcelas; 102 Capítulo 8. BBDD Objeto relacionales CAPÍTULO 9 Índices y tablas genindex modindex search 103

Bases de datos - Amazon Web Services

Documentos relacionados

Productos

Apoyo

Bases de datos - Amazon Web Services

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib