Tema 3: El Modelo Relacional Estructura de bases de datos relacionales Conversión de diseños E-A a relaciones Integridad de dominio y referencial Álgebra relacional Operaciones del álgebra relacional extendida Modificaciones de la base de datos Vistas Cálculo relacional de tuplas Cálculo relacional de dominios Bases de datos 1 Ejemplo de una relación Bases de datos numero-cuenta nombre-sucursal saldo A-101 Vigo 500 A-102 Pontevedra 400 A-201 Ourense 900 A-215 Santiago 700 A-217 Ourense 750 A-222 Lugo 700 A-305 Ferrol 350 2 Estructura básica Formalmente, dados los conjuntos D1, D2, …. Dn una relación r es un subconjunto de D1 x D 2 x … x Dn Es decir, una relación es un conjunto de n-tuplas (a1, a2, …, an) donde cada ai ∈ Di Ejemplo: Si nombre-cliente = {López, Veiga, Suárez, Diéguez} calle-cliente = {Príncipe, Norte, Diagonal} ciudad-cliente = {Madrid, Vigo, Barcelona} Entonces r = { (López, Príncipe, Madrid), (Veiga, Norte, Vigo), (Suárez, Norte, Vigo), (Diéguez, Diagonal, Barcelona)} es una relación sobre nombre-cliente x calle-cliente x ciudad-cliente Bases de datos 3 Tipos de atributo Cada atributo de una relación tiene un nombre El conjunto de valores permitidos para cada atributo se denomina dominio del atributo Los valores de los atributos deben ser (normalmente) atómicos, es decir, indivisibles + P.e. atributos con valores multivaluados no son atómicos + P.e. atributos con valores compuestos no son atómicos El valor especial null pertenece a cualquier dominio El valor nulo complica la definición de algunos operadores Bases de datos 4 Esquema de una relación A1, A2, …, An son atributos R = (A1, A2, …, An ) es un esquema de relación P.e. Esquema-cliente = (nombre-cliente, calle-cliente, ciudad-cliente) r(R) es una relación sobre el esquema de relación R P.e. cliente (Esquema-cliente) Bases de datos 5 Instancia de una relación Los valores actuales (instancia) de una relación se especifican mediante una tabla Un elemento t de r es una tupla, y está representado por una columna en una tabla atributos (o columnas) nombre-cliente calle-cliente ciudad-cliente López Veiga Suárez Diéguez Príncipe Norte Norte Diagonal Madrid Vigo Vigo Barcelona tuplas (o filas) cliente Bases de datos 6 Las relaciones no tienen orden El orden de las tuplas no es relevante (las tuplas se pueden almacenar en un orden arbitrario) P.e. la relación cuentas con tuplas no ordenadas numero-cuenta nombre-sucursal saldo A-101 Vigo 500 A-215 Santiago 700 A-102 Pontevedra 400 A-305 Ferrol 350 A-201 Ourense 900 A-222 Lugo 700 A-217 Ourense 750 Bases de datos 7 Base de datos Una base de datos está formada por un conjunto de relaciones La información sobre una organización se divide en partes y cada relación almacena una parte de la información P.e.: cuenta: almacena información sobre cuentas depositante: almacena información sobre que cliente tiene asignada que cuenta cliente: almacena información sobre clientes Almacenar toda la información en una sola relación: banco(numero-cuenta, saldo, nombre-cliente, ..) da lugar a + información repetida (p.e. dos clientes tienen una misma cuenta) + necesidad de valores nulos (p.e. información sobre un cliente sin cuenta) La teoría de la normalización se encarga de como diseñar esquemas relacionales correctos Bases de datos 8 Claves Dado K ⊆ R K es una superclave de R si los valores de K son suficientes para identificar cada una de las tuplas de cada relación posible r(R) + por “posible r” indicamos una relación r que pueda existir en la organización que estamos modelando. + Ejemplo: {nombre-cliente, calle-cliente} y {nombre-cliente} son ambas superclaves de Cliente, si consideramos que dos clientes no pueden tener el mismo nombre. K es una clave candidata si K es mínima Ejemplo: {nombre-cliente} es una clave candidata para Cliente, dado que es una superclave (asumiendo que dos clientes no pueden tener el mismo nombre), y ningún subconjunto es una superclave. Bases de datos 9 Determinación de claves a partir de conjuntos E-A Conjunto entidad fuerte. La clave primaria del conjunto entidad pasa a ser la clave primaria de la relación. Conjunto entidad débil. La clave primaria de la relación está formada por la unión de la clave primaria del conjunto entidad fuerte y el discriminador del conjunto entidad débil. Conjunto asociación. La unión de las claves primarias de los conjuntos entidad participantes es una superclave de la relación. + Para conjuntos asociación varios-a-uno, la clave primaria del conjunto entidad “varios” pasa a ser la clave primaria de la relación. + Para conjuntos asociación uno-a-uno, la clave primaria de la relación puede ser la de cualquiera de los conjuntos entidad. + Para conjuntos asociación varios-a-varios, la unión de las claves primarias pasa a ser la clave primaria de las relación. Bases de datos 10 Conversión de esquemas E-A a relaciones Las claves primarias permiten representar tanto los conjuntos entidad como los conjuntos asociación como relaciones que representan los contenidos de la base de datos. Una base de datos que sigue el esquema E-A se puede representar mediante un conjunto de relaciones. Para cada conjunto entidad y cada conjunto asociación existe una única relación a la que se le asigna el nombre del conjunto entidad o conjunto asociación correspondiente. Cada relación tiene columnas (normalmente una por atributo), que tienen nombres únicos. Convertir un diagrama E-A a relaciones es la base para conseguir un diseño relacional a partir de ese diseño E-A Bases de datos 11 Representación de conjuntos entidad como relaciones Un conjunto entidad fuerte se transforma en una relación con los mismos atributos. Id-cliente 192-83-7465 nombre-cliente calle-cliente ciudad-cliente Sánchez Alma Santiago 019-28-3746 Rodríguez Norte Vigo 677-89-9011 Gómez Príncipe Madrid 182-73-6091 Fernández Alcalá Madrid 321-12-3123 Veiga Príncipe Madrid 336-66-9999 López Diagonal Barcelona 019-28-3746 Rodríguez Norte Vigo Bases de datos 12 Atributos compuestos y multivalorados Los atributos compuestos se eliminan creando un nuevo atributo para cada uno de los campos componentes + P.e. dado el conjunto entidad cliente con atributo compuesto nombre con atributos componentes nombre-comun y primer-apellido, la relación correspondiente al conjunto entidad tendrá dos columnas nombre.nombre-comun y nombre.primer-apellido Un atributo multivalorado M de una entidad E se representa mediante una nueva relación EM + La relación EM tendrá como columnas la clave primaria de E y un atributo que se corresponderá con el atributo multivalorado M + P.e. El atributo multivalorado telefonos de empleado se representa mediante la relación empleado-telefonos ( id-empleado, numerot) + Cada valor de un atributo multivalorado se corresponde con una fila diferente de la relación EM P.e., una entidad empleado con clave primaria “Pérez” y teléfonos “123456” y “234567” se corresponde con dos filas: (Pérez, 123456) and (Pérez, 234567) Bases de datos 13 Representación de conjuntos entidad débiles Un conjunto entidad débil se transforma en una relación a la que se le añade una columna para la clave primaria del conjunto entidad fuerte identificador numero-cuenta numero-pago fecha-pago cantidad-pago L-11 53 7-junio-2001 125 L-14 69 28-mayo-2001 500 L-15 22 23-mayo-2001 300 L-16 58 18-junio 2001 135 L-17 5 10-mayo-2001 50 L-17 6 7-junio-2001 50 L-17 7 17-junio-2001 100 L-23 11 17-mayo-2001 75 L-93 103 3-junio-2001 900 L-93 104 13-junio-2001 200 Bases de datos 14 Representación de conjuntos asociación como relaciones Un conjunto asociación varios a varios se representa con una relación con columnas para las claves primarias de los dos conjuntos entidad participantes, y también para los atributos descriptivos del conjunto asociación. P.e.: relación para el conjunto asociación prestatario Id-cliente numero-prestamo 019-28-3746 L-11 019-28-3746 L-23 244-66-8800 L-93 321-12-3123 L-17 335-57-7991 L-16 555-55-5555 L-14 677-89-9011 L-15 963-96-3963 L-17 Bases de datos 15 Redundancia de relaciones Los conjuntos asociación varios-a-uno y uno-a-varios se pueden representar añadiendo un atributo extra a la parte de “varios”, conteniendo la clave primaria de la parte de “uno” Para resolver problemas de inconsistencia se utiliza el concepto de clave foránea que definiremos al hablar de integridad referencial P.e.: En vez de crear una relación para la asociación cuentasucursal, añadimos un atributo sucursal al conjunto entidad cuenta ciudad-sucursal saldo numero-cuenta cuenta Bases de datos nombre-sucursal cuenta-sucursal activo sucursal 16 Redundancia de relaciones (Cont.) Para conjuntos asociación una-a-uno, cualquiera de las participaciones se puede seleccionar para actuar como “varios” + Es decir, se puede añadir un atributo extra a cualquiera de las relaciones correspondientes a los dos conjuntos entidad Si la participación es parcial en la parte de varios, el reemplazar una relación por un atributo extra en la relación correspondiente a la parte de “varios” puede dar lugar a valores nulos (null) La relación correspondiente al conjunto asociación que enlaza un conjunto entidad débil con su conjunto entidad fuerte identificador es redundante. + P.e. La relación pago ya contiene la información que debería aparecer en la tabla prestamo-pago (las columnas numeroprestamo y numero-pago). Bases de datos 17 Representación de especializaciones con relaciones Método 1: + Crear una relación para la entidad de nivel alto + Crear una relación para cada conjunto entidad de nivel bajo, que incluirá la clave primaria del conjunto entidad de nivel alto y los atributos locales tabla persona cliente empleado atributos nombre, calle, ciudad nombre, tipo nombre, salario + Problema: obtener información sobre, por ejemplo, empleados requiere acceder a dos relaciones Bases de datos 18 Representación de especializaciones con relaciones (Cont.) Método 2: + Crear una relación para cada conjunto entidad con todos los atributos locales y heredados tabla atributos persona nombre, calle, ciudad cliente nombre, calle, ciudad, tipo empleado nombre, calle, ciudad, salario + Si la especialización es total, la relación para la entidad generalizada (persona) no tiene que almacenar información Se puede definir como una relación “vista” que contenga la unión de las relaciones de especializaicón Pero aún puede ser necesaria una relación para restricciones de tipo clave foránea + Problema: la información sobre calle y ciudad puede almacenarse de manera redundante para personas que son a la vez clientes y empleados Bases de datos 19 Relaciones correspondientes a agregaciones Para representar una agregación, se crea una relación conteniendo la clave primaria de la asociación agregada, La clave primaria del conjunto entidad asociado Cualquier atributo descriptivo Bases de datos 20 Relaciones correspondientes a agregaciones (Cont.) P.e. para representar la asociación dirige entre la asociación trabaja-en y el conjunto entidad director, creamos una relación dirige (id-empleado, nombre-sucursal, id-puesto, nombre-director) La relación trabaja-en es redundante siempre que permitamos almacenar valores nulos en el atributo nombre-director en la relación dirige puesto empleado oficina trabaja-en dirige director Bases de datos 21 Diagrama E-A para la entidad bancaria ciudad-sucursal numero-cuenta nombre-sucursal saldo cuenta sucursal cuenta-sucursal prestamo -sucursal depositante cliente nombre-cliente activos prestatario prestamo ciudad-cliente numero-prestamo cantidad calle-cliente Bases de datos 22 La relación cliente nombre-cliente calle-cliente ciudad-cliente Suárez Príncipe Vigo Vázquez Diagonal Barcelona Veiga Norte Santiago Rodríguez Real Ourense Fernández Parque Lugo Sánchez Independencia Ponferrada Gómez Colón Madrid Díaz Norte Santiago Pazo Pazos Ferrol González Navas Granada Rial Reina Lugo García Ensanche Barcelona Bases de datos 23 La relación depositante Bases de datos nombre-cliente numero-cuenta Suárez A-102 Vázquez A-101 Veiga A-201 Veiga A-217 Rodríguez A-222 Fernández A-215 Gómez A-305 24 Diagrama del esquema para la entidad bancaria sucursal cuenta depositante cliente nombre-sucursal numero-cuenta nombre-cliente nombre-cliente ciudad-sucursal nombre-sucursal numero-cuenta calle-cliente activos saldo ciudad-cliente prestamo prestatario numero-prestamo nombre-cliente nombre-sucursal numero-prestamo cantidad Bases de datos 25 Restricciones de dominio Las restricciones de integridad nos protegen ante daños accidentales en la base de datos, asegurando que los cambios autorizados en la base de datos no van a producir una pérdida de consistencia en los datos Las restricciones de dominios son la forma más elemental de restricciones de integridad. Comprueban los valores insertados en la base de datos, y comprueban las consultas para asegurar que las comparaciones tienen sentido. Se pueden crear nuevos dominios a partir de los tipos de datos existentes P.e. create domain Euros numeric(12, 2) create domain Libras numeric(12,2) No se puede asignar o comparar un valor de tipo Euros con un valor de tipo Libras. + No obstante, se pueden convertir tipos: (cast r.A as Libras) (Se debería también multiplicar por la conversión euro-a-libra) Bases de datos 26 Integridad referencial Asegura que un valor que aparece en una relación para un conjunto de atributos determinado también aparece en un conjunto de atributos de otra relación. + Ejemplo: Si “Vigo” es un nombre de sucursal que aparece en una de las tuplas de la relación cuentas, entonces existe una tupla en la relación sucursales para la sucursal “Vigo”. Definición formal + Dadas las relaciones r1(R1) y r2(R2) con claves primarias K1 y K2 respectivamente. + El subconjunto α de R2 es una clave foránea referenciando K1 en la relación r1, si para cada t2 en r2 debe haber una tupla t1 en r1 tal que t1[K1] = t2[α]. + Las restricciones de integridad referencial también se denominan dependencias de subconjunto ya que se pueden expresar como ∏α (r2) ⊆ ∏K1 (r1) Bases de datos 27 Integridad referencial en el modelo E-A Consideremos el conjunto asociación R entre los conjuntos entidad E1 y E2. El esquema relacional de R incluye las claves primarias K1 de E1 y K2 de E2. Entonces K1 y K2 son claves foráneas sobre los esquemas relacionales de E1 y E2 respectivamente. E1 R E2 Los conjuntos entidad débiles también dan lugar a restricciones de integridad referencial. + El esquema de relación de un conjunto entidad débil debe incluir los atributos que forman la clave primaria del conjunto entidad del que depende Bases de datos 28 Comprobación de integridad referencial durante una modificación Se deben realizar las siguientes comprobaciones con el fin de preservar la siguiente restricción de integridad referencial: ∏α (r2) ⊆ ∏K (r1) Insertar. Si una tupla t2 se inserta en r2, el sistema se debe asegurar de que hay una tupla t1 en r1 tal que t1[K] = t2[α]. Es decir t2 [α] ∈ ∏K (r1) Eliminar. Si se elimina una tupla t1 de r1, el sistema debe hallar el conjunto de tuplas de r2 que referencian t1: σα = t1[K] (r2) Si el conjunto no es vacío + o bien se rechaza el comando como un error, + o bien se deben eliminar las tuplas que referencian a t1 (se permiten eliminaciones en cascada) Bases de datos 29 Modificaciones de la base de datos (Cont.) Actualizaciones. Hay dos casos: + Si se actualiza una tupla t2 en la relación r2 y la actualización modifica los valores de la clave foránea α,entonces se debe hacer un test similar al caso de inserción: Si t2’ denota el nuevo valor de la tupla t2, el sistema se debe asegurar de que t2’[α] ∈ ∏K(r1) + Si se actualiza una tupla t1 en r1, y la actualización modifica el valor de la clave primaria (K), entonces se debe realizar un test similar a la del caso de eliminación: 1. El sistema debe calcular σα = t1[K] (r2) utilizando el valor anterior de t1 (el valor antes de hacer la actualización). 2. Si el conjunto no es vacío 1. la actualización se puede rechazar como un error, o 2. La actualización se puede hacer en cascada sobre las tuplas del conjunto, o 3. Las tuplas del conjunto se pueden eliminar. Bases de datos 30 Lenguajes de consulta Lenguajes con los que el usuario obtiene información almacenada en la base de datos. Tipos de lenguajes + procedimentales + No procedimentales Lenguajes “puros”: + Álgebra relacional + Cálculo relacional de tuplas + Cálculo relacional de dominios Los lenguajes puros son la base de los lenguajes que se utilizan habitualmente Bases de datos 31 Álgebra relacional Lenguaje procedimental Seis operadores básicos + selección + proyección + unión + diferencia de conjuntos + producto cartesiano + renombrar Los operadores se aplican sobre dos o más relaciones y dan como resultado una nueva relación. Bases de datos 32 Operación de selección Notación: σ p(r) p se denomina predicado de la selección Se define como: σp(r) = {t | t ∈ r y p(t)} donde p es una fórmula en calculo proposicional formada por términos unidos por : ∧ (y), ∨ (o), ¬ (no) Cada término tiene la forma: <atributo> op <atributo> o <constante> donde op es: =, ≠, >, ≥. <. ≤ Ejemplo de selección: σ nombre-sucursal=“Vigo”(cuenta) Bases de datos 33 Operación de selección – Ejemplo • Relación r • σA=B ^ D > 5 (r) Bases de datos A B C D α α 1 7 α β 5 7 β β 12 3 β β 23 10 A B C D α α 1 7 β β 23 10 34 Operación de proyección Notación: ∏A1, A2, …, Ak (r) donde A1, A2 son nombres de atributos y r en un nombre de relación. El resultado es la relación de k columnas que se obtiene eliminando las columnas no listadas Las filas duplicadas del resultado se eliminan, ya que las relaciones son conjuntos P.e. Eliminar el atributo nombre-sucursal de cuentas ∏numero-cuenta, saldo (cuenta) Bases de datos 35 Operación de proyección – Ejemplo Relación r: ∏A,C (r) Bases de datos A B C α 10 1 α 20 1 β 30 1 β 40 2 A C A C α 1 α 1 α 1 β 1 β 1 β 2 β 2 = 36 Operación de unión Notación: r ∪ s Se define como: r ∪ s = {t | t ∈ r o t ∈ s} Para que r ∪ s sea válida. 1. r, s deben tener el mismo número de atributos 2. Los dominios de los atributos deben ser compatibles (p.e., la 2ª columna de r contiene el mismo tipo de valores que la segunda columna de s) P.e. encontrar todos los clientes con cuentas o préstamos ∏nombre-cliente (depositante) ∪ ∏nombre-cliente (prestatario) Bases de datos 37 Operación de unión – Ejemplo Relaciones r, s: A B A B α 1 α 2 α 2 β 3 β 1 s r r ∪ s: Bases de datos A B α 1 α 2 β 1 β 3 38 Operación diferencia de conjuntos Notación r – s Se define como: r – s = {t | t ∈ r y t ∉ s} La diferencia de conjuntos se debe realizar entre relaciones compatibles. + r y s deben tener el mismo número de atributos + Los dominios de los atributos de r y s deben ser compatibles Bases de datos 39 Operación diferencia de conjuntos – Ejemplo Relaciones r, s: A B A B α 1 α 2 α 2 β 3 β 1 s r r – s: Bases de datos A B α 1 β 1 40 Operación producto cartesiano Notación r x s Se define como: r x s = {t q | t ∈ r y q ∈ s} Se asume que los atributos de r(R) y s(S) son disjuntos. (Es decir, R ∩ S = ∅). Si los atributos de r(R) y s(S) no son disjuntos, se debe utilizar la operación de renombrar. Bases de datos 41 Operación producto cartesiano - Ejemplo Relaciones r, s: A B C D E α 1 β 2 α β β γ 10 10 20 10 a a b b r s r x s: Bases de datos A B C D E α α α α β β β β 1 1 1 1 2 2 2 2 α β β γ α β β γ 10 10 20 10 10 10 20 10 a a b b a a b b 42 Combinación de operaciones Se pueden construir expresiones utilizando varias operaciones Ejemplo: σA=C(r x s) rxs σA=C(r x s) Bases de datos A B C D E α α α α β β β β 1 1 1 1 2 2 2 2 α β β γ α β β γ 10 10 20 10 10 10 20 10 a a b b a a b b A B C D E α β β 1 2 2 α 10 β 20 β 20 a a b 43 Operación de renombrado Permite nombrar, y por tanto referirnos a, los resultados de las expresiones de álgebra relacional. Permite referirse a una relación con más de un nombre. Ejemplo: ρ x (E) devuelve la expresión E con el nombre X Si la expresión E en álgebra relacional tiene un orden n, entonces ρx (A1, A2, …, An) (E) devuelve la expresión E con el nombre X, y con los atributos renombrados a A1, A2, …., An. Bases de datos 44 Ejemplo de banco sucursal (nombre-sucursal, ciudad-sucursal, activos) cliente (nombre-cliente, calle-cliente, ciudad-cliente) cuenta (numero-cuenta, nombre-sucursal, saldo) prestamo (numero-prestamo, nombre-sucursal, cantidad) depositante (nombre-cliente, numero-cuenta) prestatario (nombre-cliente, numero-prestamo) Bases de datos 45 Ejemplo de consultas Encontrar todos los préstamos de más de 1200 € σcantidad > 1200 (prestamo) Encontrar el número de préstamos para cada préstamo de una cantidad mayor de 1200 € ∏numero-prestamo (σcantidad > 1200 (prestamo)) Bases de datos 46 Ejemplo de consultas Encontrar los nombres de todos los clientes que tengan una cuenta, un préstamo, o ambas cosas en el banco. ∏nombre-cliente (prestatario) ∪ ∏nombre-cliente (depositante) Encontrar los nombres de todos los clientes que tienen una cuenta y un préstamos en el banco. ∏nombre-cliente (prestatario) ∩ ∏nombre-cliente (depositante) Bases de datos 47 Ejemplo de consultas Encontrar los nombres de todos los clientes que tengan un préstamo en la sucursal de Vigo. ∏nombre-cliente (σnombre-sucursal=“Vigo” (σprestatario.numero-prestamo = prestamo.numero-prestamo(prestatario x prestamo))) Encontrar los nombres de todos los clientes que tengan un préstamo en la sucursal de Vigo pero no tengan una cuenta en ninguna sucursal del banco. ∏nombre-cliente (σnombre-sucursal = “Vigo” (σprestatario.numero-prestamo = prestamo.numero-prestamo(prestatario x prestamo))) - ∏nombre-cliente(depositante) Bases de datos 48 Ejemplo de consultas Encontrar los nombres de todos los clientes que tengan un préstamo en la sucursal de Vigo. −Consulta 1 ∏nombre-cliente(σnombre-sucursal = “Vigo” ( σprestatario.numero-prestamo = prestamo.numero-prestamo(prestatario x prestamo))) − Consulta 2 ∏nombre-cliente(σprestamo.numero-prestamo = prestatario.numero-prestamo( (σnombre-sucursal = “Vigo”(prestamo)) x prestatario)) Bases de datos 49 Ejemplo de consultas Encontrar la cuenta con el mayor saldo Renombramos la relación cuenta como d Consulta: ∏saldo(cuenta) - ∏cuenta.saldo (σcuenta.saldo < d.saldo (cuenta x ρd (cuenta))) Bases de datos 50 Definición formal Una expresión básica en álgebra relacional puede ser: + Una relación de la base de datos + Una relación constante Dadas dos expresiones en álgebra relacional E1 y E2 también son expresiones en álgebra relacional: + E1 ∪ E2 + E1 - E2 + E1 x E2 + σp (E1), P es un predicado sobre los atributos de E1 + ∏s(E1), S es una lista que contiene algunos atributos de E1 + ρ x (E1), x es el nuevo nombre del resultado de E1 Bases de datos 51 Otras operaciones Podemos definir más operaciones que no proporcionan nueva funcionalidad al álgebra relacional pero que simplifican consultas habituales. Intersección de conjuntos Reunión (join) natural División Asignación Bases de datos 52 Operación intersección de conjuntos Notación: r ∩ s Se define como: r ∩ s ={ t | t ∈ r and t ∈ s } Asumiendo: + r, s tienen el mismo número de atributos + Los atributos de r y s con compatibles Nota: r ∩ s = r - (r - s) Bases de datos 53 Operación intersección de conjuntos Ejemplo Relaciones r, s: A B α α β 1 2 1 r r∩s Bases de datos A B α 2 A B α β 2 3 s 54 Operación join natural Notación: r s Dadas dos relaciones r y s sobre los esquemas R y S respectivamente. Entonces, r s es una relación sobre el esquema R ∪ S que se obtiene de la siguiente manera: + Se considera cada par de tuplas tr de r y ts de s. + Si tr y ts tienen el mismo valor para cada uno de los atributos en R ∩ S, se añade una tupla t al resultado, donde t tiene el mismo valor que t sobre r r t tiene el mismo valor que t Ejemplo: s sobre s R = (A, B, C, D) S = (E, B, D) + Esquema de relación = (A, B, C, D, E) + r s se define como: ∏ Bases de datos r.A, r.B, r.C, r.D, s.E (σr.B = s.B ∧ r.D = s.D (r x s)) 55 Operación join natural - Ejemplo Relaciones r, s: A B C D B D E α β γ α δ 1 2 4 1 2 α γ β γ β a a b a b 1 3 1 2 3 a a a b b α β γ δ ∈ r r s Bases de datos s A B C D E α α α α δ 1 1 1 1 2 α α γ γ β a a a a b α γ α γ δ 56 Operación división r÷s Adecuada para consultas que incluyan la expresión “para todos”. Dadas las relaciones r y s sobre los esquemas R y S respectivamente, donde + R = (A1, …, Am, B1, …, Bn) + S = (B1, …, Bn) El resultado de r ÷ s es una relación sobre el esquema R – S = (A1, …, Am) r ÷ s = { t | t ∈ ∏ R-S(r) ∧ ∀ u ∈ s ( tu ∈ r ) } Bases de datos 57 Operación división - Ejemplo Relaciones r, s: r ÷ s: A A B B α α α β γ δ δ δ ∈ ∈ β 1 2 3 1 1 1 3 4 6 1 2 1 2 s r α β Bases de datos 58 Otro ejemplo de división Relaciones r, s: A B C D E D E α α α β β γ γ γ a a a a a a a a α γ γ γ γ γ γ β a a b a b a b b 1 1 1 1 3 1 1 1 a b 1 1 s r r ÷ s: A B C α γ a a γ γ Bases de datos 59 Operación asignación La operación asignación (←) facilita un modo conveniente de expresar consultas complejas. + Escribir consultas como un programa secuencial consistente en un conjunto de asignaciones Seguido por una expresión cuyo valor se muestre como el resultado de la consulta. + La asignación siempre se debe realizar a una variable relación temporal. Ejemplo: r ÷ s se puede expresar como temp1 ← ∏R-S (r) temp2 ← ∏R-S ((temp1 x s) – ∏R-S,S (r)) result = temp1 – temp2 + El resultado de la expresión a la derecha de ← se asigna a la variable relación de la izquierda de ←. + La variable se puede utilizar en las expresiones que vienen a continuación. Bases de datos 60 Ejemplo de consultas Encontrar todos los clientes que tengan una cuenta al menos en las sucursales de “Vigo” y “Pontevedra”. Consulta 1 ∏NC(σNS=“Vigo”(depositante cuenta)) ∩ ∏NC(σNS=“Pontevedra”(depositante cuenta)) donde NC representa nombre-cliente y NS nombre-sucursal. Consulta 2 ∏nombre-cliente, nombre-sucursal (depositante cuenta) ÷ ρtemp(nombre-sucursal) ({(“Vigo”), (“Pontevedra”)}) Bases de datos 61 Ejemplo de consultas Encontrar todos los clientes que tengan una cuenta en todas las sucursales de Madrid. ∏nombre-cliente, nombre-sucursal (depositante cuenta) ÷ ∏nombre-sucursal (σciudad-sucursal = “Madrid” (sucursal)) Bases de datos 62 Operaciones del Álgebra Relacional Extendida Proyección generalizada Reunión (join) externa Funciones agregadas Bases de datos 63 Proyección generalizada Extiende la operación de proyección permitiendo funciones aritméticas en la lista de proyección. ∏ F1, F2, …, Fn(E) E es cualquier expresión en álgebra relacional F1, F2, …, Fn son expresiones aritméticas que incluyen constantes y atributos del esquema de E. P.e. Dada la relación info-credito(nombre-cliente, limite, saldo- credito), encontrar cuanto puede gastar cada persona: ∏nombre-cliente, limite – saldo-credito (info-credito) Bases de datos 64 Funciones y operaciones agregadas Las funciones de agregación toman como argumentos un conjunto de valores y devuelven un valor simple como resultado. avg: valor medio min: valor mínimo max: valor máximo sum: suma de valores count: número de valores Operación agregada en álgebra relacional G1, G2, …, Gn g F1( A1), F2( A2),…, Fn( An) (E) + E es cualquier expresión en álgebra relacional + G1, G2 …, Gn es una lista de atributos sobre los que agrupar (puede estar vacía) + Cada Fi es una función agregada + Cada Ai es un nombre de atributo Bases de datos 65 Operación agregada - Ejemplo Relación r: g sum(c) (r) Bases de datos A B C α α β β α β β β 7 7 3 10 sum-C 27 66 Operación agregada - Ejemplo Relación cuenta agrupada por nombre-sucursal: nombre-sucursal numero-cuenta Vigo Vigo Madrid Madrid Pontevedra nombre-sucursal saldo A-102 A-201 A-217 A-215 A-222 400 900 750 750 700 g sum(saldo) (cuenta) Bases de datos nombre-sucursal saldo Vigo Madrid Pontevedra 1300 1500 700 67 Funciones agregadas (Cont.) El resultado de la agregación no tiene nombre + Se puede utilizar la operación de renombrado para darle un nombre + Por conveniencia, se permite el renombrado como parte de la operación de agregación Nombre-sucursal Bases de datos g sum(saldo) as sum-saldo (cuenta) 68 Join externo Es una extensión de la operación de join que evita la pérdida de información. Calcula el join y después añade las tuplas de una relación que no coinciden con las tuplas de la otra relación al resultado del join. Utiliza valores null: + null significa que el valor es desconocido o no existe + Todas la comparaciones en las que participa un valor null son falsas por definición. Bases de datos 69 Join externo – Ejemplo Relación prestamo numero-prestamo nombre-sucursal Vigo Ourense Madrid L-170 L-230 L-260 cantidad 3000 4000 1700 Relación prestatario nombre-cliente López Vázquez García Bases de datos numero-prestamo L-170 L-230 L-155 70 Join externo – Ejemplo Join interno prestamo prestatario numero-prestamo nombre-sucursal L-170 L-230 cantidad Vigo Ourense nombre-cliente 3000 4000 López Vázquez Join externo izquierdo prestamo prestatario numero-prestamo nombre-sucursal L-170 L-230 L-260 Vigo Ourense Madrid cantidad 3000 4000 1700 nombre-cliente López Vázquez null Bases de datos 71 Join externo – Ejemplo Join externo derecho prestamo prestatario numero-prestamo nombre-sucursal L-170 L-230 L-155 Vigo Ourense null cantidad 3000 4000 null nombre-cliente López Vázquez García Join externo total prestamo prestatario numero-prestamo nombre-sucursal L-170 L-230 L-260 L-155 Bases de datos Vigo Ourense Madrid null cantidad 3000 4000 1700 null nombre-cliente López Vázquez null García 72 Valores nulos Las tuplas pueden contener valores nulos, denotados por null, en algunos de sus atributos null significa valor desconocido o que el valor no existe. El resultado de cualquier expresión aritmética en la que participe null es null. Las funciones agregadas ignoran los valores null + Es una decisión arbitraria. Alternativamente se podría haber devuelto como resultado null. + Seguimos la semántica de SQL respecto al manejo de valores nulos Para eliminación de duplicados y agrupamientos, null recibe el mismo tratamiento que cualquier otro valor, y se asume que dos nulos son iguales + Alternativa: asumir que cada nulo es distinto de los demás + Ambas son decisiones arbitrarias. Nosotros seguimos SQL Bases de datos 73 Valores nulos Las comparaciones con valores null devuelven un valor especial de verdad denominado desconocido + Si se usa falso en vez de desconocido, entonces no sería equivalente a A >= 5 not (A < 5) Lógica trivalorada utilizando el valor de verdad desconocido: + OR: (desconocido or verdad) = verdad, (desconocido or falso) = desconocido, (desconocido or desconocido) = desconocido + AND: (verdad and desconocido) = desconocido, (falso and desconocido) = falso, (desconocido and desconocido) = desconocido + NOT: (not desconocido) = desconocido + En SQL “P es desconocido” se evalúa a verdad si el predicado P se evalúa a desconocido El resultado de un predicado de selección se trata como falso si se evalúa como desconocido Bases de datos 74 Modificación de la base de datos El contenido de la base de datos se puede modificar utilizando las siguientes operaciones: + Borrado + Inserción + Actualización Todas estas operaciones se expresan mediante el operador de asignación. Bases de datos 75 Borrado Una petición de borrado se expresa de manera similar a una consulta, excepto que, en vez de mostrar las tuplas al usuario, las tuplas seleccionadas se eliminan de la base de datos. Sólo se pueden eliminar tuplas completas; no se pueden eliminar solo determinados atributos Un borrado se expresa en álgebra relacional como: r←r–E donde r es una relación y E es una consulta en álgebra relacional. Bases de datos 76 Ejemplos de borrado Borrar todas las cuentas de la sucursal de Vigo. cuentas ← cuentas – σ nombre-sucursal = “Vigo” (cuenta) Borrar todos los préstamos con cantidades entre 0 y 50 prestamo ← prestamo – σ cantidad ≥ 0 and cantidad ≤ 50 (prestamo) Borrar todas las cuentas de sucursales de Madrid. r1 ← σ ciudad-sucursal = “Madrid” (cuenta sucursal) r2 ← ∏ciudad-sucursal, numero-cuenta, saldo (r1) r3 ← ∏ nombre-cliente, numero-cuenta (r2 depositante) cuenta ← cuenta – r2 depositante ← depositante – r3 Bases de datos 77 Inserción Para insertar datos en una relación podemos: + o bien especificar la tupla a insertar + O bien escribir una consulta cuyo resultado esté formado por las tuplas a insertar En álgebra relacional, una inserción se expresa: r← r ∪ E donde r es una relación y E es una expresión en álgebra relacional. La inserción de una sola tupla se realiza cuando E es una relación constante que contiene una tupla. Bases de datos 78 Ejemplos de inserción Insertar información en la base de datos especificando que López tiene 1200€ en la cuenta A-973 en la sucursal de Vigo. cuenta ← cuenta ∪ {(“Vigo”, A-973, 1200)} depositante ← depositante ∪ {(“López”, A-973)} Dar un premio a todos los préstamos de la sucursal de Vigo una cuenta de ahorro con 200€. El número de préstamo se utilizará como numero de cuenta de ahorro. r1 ← (σnombre-sucursal = “Vigo” (prestatario prestamo)) cuenta ← cuenta ∪ ∏nombre-sucursal, numero-cuenta,200 (r1) depositante ← depositante ∪ ∏nombre-cliente, numeor-prestamo(r1) Bases de datos 79 Actualización Permite cambiar el valor de una tupla sin cambiar todos los valores de la tupla Para ello se utiliza la operación de proyección generalizada r ← ∏ F1, F2, …, FI, (r) Cada Fi es + el atributo i de r, si el atributo i no se quiere actualizar, o, + si se va a actualizar el atributo i, Fi es una expresión en la que intervienen solamente constantes y los atributos de r, que proporciona el nuevo valor del atributo Bases de datos 80 Ejemplos de actualización Pagar intereses aumentando un 5% todos los saldos. cuenta ← ∏ NC, NS, SAL * 1.05 (cuenta) donde NC, NS y SAL significan numero-cuenta, nombre-sucursal y saldo, respectivamente. Pagar a todas las cuentas con saldos de más de 10.000€ un 6% de interés y un 5% al resto cuenta ← ∏ NC, NS, SAL * 1.06 (σ SAL > 10000 (cuenta)) ∪ ∏NC, NC, SAL * 1.05 (σSAL ≤ 10000 (cuenta)) Bases de datos 81 Vistas En algunos casos no es deseable que todos los usuarios vean el modelo lógico completo (es decir, todas las relaciones almacenadas en la base de datos) Consideremos una persona que necesita saber un número de préstamo de un cliente pero no necesita ver la cantidad prestada. Esta persona debería ver la siguiente relación descrita en álgebra relacional ∏nombre-cliente, numero-prestamo (prestatario prestamo) Cualquier relación que no existe en el modelo conceptual pero se necesita proporcionar a un usuario como una “relación virtual” se denomina vista. Bases de datos 82 Definición de vistas Una vista se define utilizando una sentencia create view que tiene la siguiente forma create view v as <consulta> donde <consulta> es cualquier consulta válida en álgebra relacional. El nombre de la vista es v. Una vez definida una vista, el nombre de la vista se utiliza para referirse a la relación virtual que genera la vista. Definir una vista no es lo mismo que crear una nueva relación evaluando la consulta + La definición de una vista hace que se guarde una expresión de una consulta; la expresión se substituye en las consultas que utilicen la vista. Bases de datos 83 Ejemplos de vistas Definir una vista (denominada todos-los-clientes) formada por sucursales y sus clientes. create view todos-los-clientes as ∏nombre-sucursal, nombre-cliente (depositante cuenta) ∪ ∏nombre-sucursal, nombre-cliente (prestatario prestamo) Podemos encontrar todos los clientes de la sucursal de Vigo con: ∏nombre-sucursal (σnombre-sucursal = “Vigo” (todos-los clientes)) Bases de datos 84 Modificaciones a través de vistas Las modificaciones de la base de datos que se expresan mediante vistas se deben traducir a modificaciones de las relaciones de la base de datos. Consideremos la persona que necesita ver todos los datos de préstamos en la relación prestamo excepto cantidad. La vista que le demos a esa persona, sucursal-prestamo, se define como: create view sucursal-prestamo as ∏nombre-sucursal, numero-prestamo (prestamo) Dado que permitimos utilizar un nombre de vista en cualquier lugar donde pueda aparecer un nombre de relación, el usuario podría escribir: sucursal-prestamo ← sucursal-prestamo ∪ {(“Vigo”, L-37)} Bases de datos 85 Modificaciones a través de vistas (Cont.) La inserción anterior se debe representar mediante una inserción en la relación prestamo a partir de la cual se construyó la vista sucursal-prestamo. Una inserción en prestamo requiere un valor para cantidad. El tratamiento de la inserción puede ser + Rechazar la inserción y devolver un mensaje de error al usuario. + Insertar una tupla (“L-37”, “Vigo”, null) en la relación prestamo Algunas actualizaciones a través de vistas son imposibles de transformar en actualizaciones de relaciones en la base de datos + create view v as (σnombre-sucursal = “Vigo” (cuenta)) v ← v ∪ (L-99, Ourense, 23) Otras no se pueden transformar de manera única + todos-los-clientes ← todos-los-clientes ∪ {(“Vigo”, “López”)} ¡Tenemos que elegir préstamo o cuenta y crear un nuevo número de cuenta/préstamo! Bases de datos 86 Vistas definidas utilizando otras vistas Una vista se puede utilizar en la expresión que define otra vista Una relación vista v1 se dice que depende directamente de una relación vista v2 si v2 se utiliza en la relación que define v1 Una relación vista v1 se dice que depende de una relación vista v2 si, o bien v1 depende directamente de v2, o bien hay un camino de dependencias desde v1 a v2 Una relación vista v se dice que es recursiva si depende de si misma. Bases de datos 87 Cálculo relacional de tuplas Es un lenguaje de consulta no procedimental, en el que cada consulta tiene la forma {t | P (t) } Es el conjunto de todas las tuplas t tales que el predicado P es verdadero para t t es una variable tupla, t[A] denota el valor de la tupla t en el atributo A t ∈ r denota que la t está en la relación r P es una fórmula similar a las del cálculo de predicados Bases de datos 88 Fórmulas en el cálculo de predicados 1. Conjunto de atributos y constantes 2. Conjunto de operadores de comparación: (p.e., <, ≤, =, ≠, >, ≥) 3. Conjunto de conectivas: y (∧), o (v)‚ no (¬) 4. Implicación (⇒): x ⇒ y, si x es verdad, entonces y es verdad x ⇒ y ≡ ¬x v y 5. Conjunto de cuantificadores: y ∃ t ∈ r (Q(t)) ≡ ”existe” una tupla t en la relación r tal que el predicado Q(t) es verdad y ∀t ∈ r (Q(t)) ≡ Q es verdad “para todas” las tuplas t en la relación r Bases de datos 89 Ejemplo de consultas Encontrar el numero-prestamo, nombre-sucursal, y cantidad de los préstamos de más de 1200€ {t | t ∈ prestamo ∧ t [cantidad] > 1200} Encontrar el número de préstamo de cada préstamo de más de 1200€ {t | ∃ s ∈ prestamo (t[numero-prestamo] = s[numero-prestamo] ∧ s [cantidad] > 1200)} Notar que la consulta define implícitamente una relación sobre el esquema [numero-prestamo] Bases de datos 90 Ejemplo de consultas Encontrar los nombres de todos los clientes que tienen un préstamo, una cuenta o ambas cosas en el banco {t | ∃s ∈ prestatario( t[nombre-cliente] = s[nombre-cliente]) ∨ ∃u ∈ depositante( t[nombre-cliente] = u[nombre-cliente]) Encontrar los nombres de todos los clientes que tienen un préstamo y una cuenta en el banco {t | ∃s ∈ prestatario( t[nombre-cliente] = s[nombre-cliente]) ∧ ∃u ∈ depositante( t[nombre-cliente] = u[nombre-cliente]) Bases de datos 91 Ejemplo de consultas Encontrar los nombres de todos los clientes que tengan un préstamo en la sucursal de Vigo {t | ∃s ∈ prestatario(t[nombre-cliente] = s[nombre-cliente] ∧ ∃u ∈ prestamo(u[nombre-sucursal] = “Vigo” ∧ u[numero-prestamo] = s[numero-prestamo]))} Encontrar los nombres de todos los clientes que tengan un préstamo en la sucursal de Vigo, pero no tengan una cuenta en ninguna sucursal del banco {t | ∃s ∈ prestatario( t[nombre-cliente] = s[nombre-cliente] ∧ ∃u ∈ prestamo(u[nombe-sucursal] = “Vigo” ∧ u[numero-prestamo] = s[numero-prestamo])) ∧ not ∃v ∈ depositante (v[nombre-cliente] =t[nombre-cliente]) } Bases de datos 92 Ejemplo de consultas Encontrar los nombres de todos los clientes que tengan un préstamo en la sucursal de Vigo , y las ciudades donde viven {t | ∃s ∈ prestamo(s[nombre-sucursal] = “Vigo” ∧ ∃u ∈ prestatario (u[numero-prestamo] = s[numero-prestamo] ∧ t [nombre-cliente] = u[nombre-cliente]) ∧ ∃ v ∈ cliente (u[nombre-cliente] = v[nombre-cliente] ∧ t[ciudad-cliente] = v[ciudad-cliente])))} Encontrar los nombres de todos los clientes que tengan una cuenta en todas las sucursales de Madrid: {t | ∃ c ∈ cliente (t[nombre-cliente] = c[nombre-cliente]) ∧ Bases de datos ∀ s ∈ sucursal(s[ciudad-sucursal] = “Madrid” ⇒ ∃ u ∈ cuenta ( s[nombre-sucursal] = u[nombre-sucursal] ∧ ∃ s ∈ depositante ( t[nombre-cliente] = s[nombre-cliente] ∧ s[numero-cuenta] = u[numero-cuenta] )) )} 93 Seguridad de las expresiones En cálculo de tuplas es posible escribir expresiones que generen infinitas relaciones. Por ejemplo, {t | ¬ t ∈ r} da lugar a una relación infinita si el dominio de algún atributo de la relación r es infinito Para prevenir este problema, se restringe el conjunto de expresiones permitidas a expresiones seguras. Una expresión {t | P(t)} en el cálculo relacional de tuplas es segura si cada componente de t aparece en una de las relaciones, tuplas, o constantes que aparecen en P + NOTA: esto es más que una simple condición de sintaxis. ∨ true } no es segura --- define un conjunto infinito con valores de atributo que no aparecen en ninguna relación, tupla o constante en P. P.e. { t | t[A]=5 Bases de datos 94 Cálculo relacional de dominios Es un lenguaje de consulta no procedimental equivalente en capacidad expresiva al cálculo relacional de tuplas Cada consulta es una expresión de la siguiente forma: { < x1, x2, …, xn > | P(x1, x2, …, xn)} + x1, x2, …, xn representan variables de dominio + P representa una formula similar a las del cálculo de predicados Bases de datos 95 Ejemplo de consultas Encontrar el numero-prestamo, nombre-sucursal, y cantidad para préstamos de más de 1200€ {< l, b, a > | < l, b, a > ∈ prestamo ∧ a > 1200} Nombre los clientes que tienen un préstamo de más de 1200€ {< c > | ∃ l, b, a (< c, l > ∈ prestatario ∧ < l, b, a > ∈ prestamo ∧ a > 1200)} Encontrar los nombres de todos los clientes que tienen un préstamo en la sucursal de Vigo y la cantidad del préstamo: {< c, a > | ∃ l (< c, l > ∈ prestatario ∧ ∃b(< l, b, a > ∈ prestamo ∧ b = “Vigo”))} o {< c, a > | ∃ l (< c, l > ∈ prestatario ∧ < l, “Vigo”, a > ∈ prestamo)} Bases de datos 96 Ejemplo de consultas Encontrar los nombres de todos los clientes que tengan una cuenta, un préstamo o ambas cosas en la sucursal de Vigo: {< c > | ∃ l ({< c, l > ∈ prestatario ∧ ∃ b,a(< l, b, a > ∈ prestamo ∧ b = “Vigo”)) ∨ ∃ a(< c, a > ∈ prestatario ∧ ∃ b,n(< a, b, n > ∈ cuenta ∧ b = “Vigo”))} Encontrar los nombres de todos los clientes que tienen una cuenta en todas las sucursales de Madrid: {< c > | ∃ s, n (< c, s, n > ∈ cliente) ∧ ∀ x,y,z(< x, y, z > ∈ sucursal ∧ y = “Vigo”) ⇒ ∃ a,b(< x, y, z > ∈ cuenta ∧ < c,a > ∈ depositante)} Bases de datos 97 Fin del tema 3 Bases de datos Manuel Ramos Cabrer 98