Depto. de Informática y Computación BASES DE DATOS Unidad N° 1 Introducción a los Sistemas de Gestión de Bases de Datos Docente: Orlando Cavieres P. ocavieres@utem.cl ocaviere@gmail.com Sem. Primavera 2024 En Ingeniería: ENTRADA PROCESO SALIDA PROCESO INFORMACIÓN En Informática: DATOS ¿Qué es Información? ………… Y… ¿Qué es Dato? ….Dato ABSTRACTO Sistemas de Información ➔ Software, Conjunto de Programas. Programa ➔ Conjunto de Instrucciones en algún lenguaje computacional. Programas “editables” desde almacenamiento y “ejecutables” desde el procesador del computador. Lenguaje Computacional: Interfaz Hombre/Máquina Necesitan ejecutarse ➔ Entregan Información dirigida para la Toma de Decisiones. O Sistemas de Información ➔ Entregan Información dirigida para la Toma de Decisiones por niveles: Estratégico Táctico Operacional Largo Plazo [años] Mediano Plazo [meses] Corto Plazo [días] Para poder entregar información, se requieren 3 componentes: Hardware, Software y Comunicaciones Computadora – Instrucciones – medios de transmisión CPU ALU RAM ROM BIOS Dispositivos de Input/Output Almacenamiento (Memorias ) Sistemas de Información S.I. de S.I. de Finanzas Personal --- S.I. de Ventas ARCHIVOS Personal Clientes Caja Personal Turnos Asistencia Otros Clientes Personal Vendedores Productos Otros Otros Problemas: Redundancia e inconsistencia, Accesibilidad, Aislamiento, Integridad, Acceso Concurrente, Seguridad…… Por ejemplo, suponga que usted tiene datos de empleados: cédula, nombre, dirección, teléfono y de proyectos: nombre, valor, fecha de inicio. Además, un empleado puede estar asignado a varios proyectos y en un proyecto pueden trabajar varios empleados. ¿Cómo guardaría usted estos datos? ¿En varios archivos? ¿En uno solo? En clase se discuten algunos aspectos sobre este ejemplo. Note que un diseño físico (distribución de los datos en uno o varios archivos) será posiblemente beneficioso para ciertas aplicaciones (por ejemplo, para ciertas consultas) y será posiblemente desventajoso para otras… Sistemas de BD: – Surgieron para solucionar los problemas de los sistemas de archivos – Capacidades: • Manejo de persistencia • Soporte por lo menos de un modelo de datos • Soporte de un lenguaje de alto nivel que permita manipular y definir la estructura de los datos en forma eficiente → SQL Definir usuarios, roles, permisos… • Control de acceso → Seguridad • Evitar inconsistencias al compartir los datos Un Sistema de Bases de Datos es un conjunto de datos, interrelacionados, y un conjunto de programas que permiten a los usuarios tener acceso a esos datos y modificarlos. Este sistema permite a los usuarios tener una visión mucho más sencilla de la complejidad que significa almacenar y mantener los datos. Para ello los sistemas de bases de datos ocultan la complejidad a los usuarios mediante niveles de abstracción para simplificar la interacción de los usuarios con el sistema. Definiciones O Base de Datos (BD): Conjunto de datos (con su respectivo esquema) almacenados en algún medio (por ej. un disco) y usados con diversos propósitos por múltiples usuarios O Esquema de la BD: Describe la estructura de los datos requeridos por la organización. Esta estructura suele permanecer estática durante un gran período O Instancia de la BD: Son los datos que en un determinado instante posee la BD. Estos datos suelen cambiar (ingresos, borrados, actualizaciones) constantemente Definiciones O Usuario final: El que interactúa con la BD, usualmente a través de aplicaciones e interfaces O Usuario especialista: El que diseña y programa aplicaciones para los usuarios finales O DBA (DataBase Administrator): El que administra la BD → ¿Funciones? En una base de datos se definen tres niveles de abstracción: Nivel Físico, Nivel Lógico y Nivel de Vistas al usuario O Nivel Físico: Nivel más bajo de abstracción, describe cómo se almacenan realmente los datos, describe en detalles las estructuras de datos complejas de bajo nivel. O Nivel Lógico: Describe qué datos se almacenan en la BdD y qué relaciones existen entre ellos. Describe toda la BdD en términos de un número pequeño de estructuras relativamente simples. Este nivel está dirigido a los Administradores de BdD. O Nivel de Vistas: Describe sólo una parte de la BdD, orientado a los usuarios de BdD que no necesariamente tengan conocimientos de informática. Los usuarios, en general, no necesitan toda la información que puede entregar la BdD, sólo necesitan tener acceso a una parte de la BdD. El Sistema puede proporcionar muchas vistas para la misma BdD. Sistema de Gestión de Bases de Datos *DBMS: Data Base Management System Sistema computarizado que permite la gestión de las BD O Es un conjunto de programas O Sirve de interfaz entre los usuarios, los datos y programas de la BD O Interactúa con el sistema operativo O Ejemplos: Oracle, SQL Server, DB2, PostgreSQL. SGBD O Soporta DDL (Data Definition Language): Lenguaje para la creación del esquema. Ej.: Create Clientes O Soporta DML (Data Manipulation Language): Lenguaje para la inserción, actualización, borrado y consulta de datos Ej.: Select * from Clientes O Soporta DCL (Data Control Language): Lenguaje para la gestión de usuarios, roles, permisos, entre otros. SGBD O Gestión de transacciones: una transacción es una unidad de trabajo que suele incluir varias operaciones sobre la BD (consultas, actualizaciones, borrados, …) O Recuperación ante fallas y para deshacer (rollback) transacciones: Bitácora (log de transacciones) O Manejo de respaldos (backups) O Independencia de los datos (se explica posteriormente) O Otros servicios SGBD Un SGBD debe garantizar las propiedades ACID para las transacciones: – Atomicity (Atomicidad) – Consistency (Consistencia) – Isolation (Aislamiento) – Durability (Durabilidad) SGBD Propiedades ACID • Atomicidad: Todos los cambios en los datos se realizan como si fueran una sola operación. Es decir, se realizan todos los cambios, o ninguno. • Consistencia: Los datos permanecen en un estado consistente de un estado a otro, lo que refuerza la integridad de los datos. • Aislamiento: El estado intermedio de una transacción no es visible para otras transacciones y, como resultado, las transacciones que se ejecutan simultáneamente parecen estar serializadas. • Durabilidad: Después de completar con éxito una transacción, los cambios en los datos persisten y no se deshacen, incluso en caso de falla del sistema. SGBD La BD en estado consistente Inicio de una transacción La BD podría estar en un estado inconsistente durante la ejecución de la transacción Ejecución de la transacción La BD en estado consistente Fin de la transacción: Commit o Rollback SGBD O Bloqueos: compartido (s) y exclusivo (x). Matriz de bloqueos Transacción 1 tiene: Transacción 2 solicita: x s x No No s No Sí Cuando una transacción termina (ya sea con commit o rollback) se liberan sus bloqueos 20 Permisos sobre el esquema Compilador DCL Consultas y/o programas de usuario Esquema de la BD Compilador DML y optimizador Compilador DDL Arquitectura de un SGBD Tablas de autorización (DD) Tablas de acceso concurrente (DD) Manejador de transacciones Tablas de descripción de la B.D (DD) Manejador de almacenamiento DD = Diccionario de Datos Base de Datos física y DD 21 O Diccionario de Datos (DD): Contiene datos sobre el esquema de la BD, los usuarios, los permisos de acceso, etc. Almacena los datos que permiten la traducción entre los tres niveles* de la arquitectura ANSI-SPARC (American National Standards Institute, Standards Planning And Requirements Committee). Es un catálogo autodescriptivo, datos sobre los objetos existentes en el sistema → Datos sobre los datos (Metadatos). O Optimizador de consultas: Define el plan de ejecución de las operaciones solicitadas por los usuarios, de tal manera que se ejecuten de manera eficiente. O Manejador de transacciones: concurrencia de operaciones. Controla el acceso y la Ventajas de un SGBD O Reuso de datos y programas O Control de redundancia O Estandarización ¿en qué sentido? O Concurrencia O Es posible equilibrar las cargas de los requisitos (establecer prioridades) Ventajas de un SGBD O Integridad (Se cumplen las reglas establecidas → ¿Qué tipo de reglas?¿Establecidas por quién?) O Seguridad O Rapidez de desarrollo O Mantenimiento y reingeniería: cambios en en el esquema sin cambiar los programas que los usan (hasta cierto punto) Desventajas de un SGBD O Tamaño O Susceptibilidad a fallas (Discutible) O Complejidad en la recuperación a fallas (Discutible) O Lentitud debido a la cantidad de verificaciones que debe hacer BD especializadas BD para la toma de decisiones (Data Warehouse). BD distribuidas, paralelas, blockchain. BD deductivas, temporales, multimediales (imágenes, audio, videos) → consultas sobre estos tipos de datos. BD orientadas a dispositivos móviles. BD geográficas: Sistemas de Información Geográficos (SIG), trayectorias. BD nativas para XML, JSON. Big Data: BD NoSQL (Not only SQL) → No necesariamente garantizan ACID. Tipos de Bases de Datos Bases de Datos Estáticas, Bases de Datos Dinámicas Diferencia entre base de datos estáticas y dinámicas. La principal diferencia entre ambas es que, mientras las bases de datos estáticas son de solo lectura y no permite modificar o añadir datos, las bases de datos dinámicas son mucho más flexibles y sí permiten editar, actualizar o borrar datos. Bases de Datos Relacionales Una base de datos relacional es un conjunto de una o más tablas estructuradas en registros (líneas) y campos (columnas), que se vinculan entre sí por un campo en común, en ambos casos posee las mismas características como por ejemplo el nombre de campo, tipo y longitud; a este campo generalmente se le denomina ID, identificador o clave. A esta manera de construir bases de datos se le denomina modelo relacional. Las bases de datos relacionales pasan por un proceso al que se le conoce como normalización de una base de datos, el cual es entendido como el proceso necesario para que una base de datos sea utilizada de manera óptima. Existen básicamente tres niveles de normalización: Primera Forma Normal (1NF), Segunda Forma Normal (2NF) y Tercera Forma Normal (3NF). Cada una de estas formas tiene sus propias reglas. Cuando una base de datos se conforma a un nivel, se considera normalizada a esa forma de normalización. Los analistas utilizan consultas SQL para combinar diferentes puntos de datos y resumir el rendimiento empresarial, lo que permite a las organizaciones obtener insights (perspectivas), optimizar los flujos de trabajo e identificar nuevas oportunidades. Por ejemplo, imagine que su empresa mantiene una tabla de base de datos con información de clientes, que contiene datos de la empresa a nivel de cuenta. También puede haber una tabla diferente, que describe todas las transacciones individuales que se alinean con esa cuenta. Juntas, estas tablas pueden proporcionar información acerca de las diferentes industrias que compran un producto de software específico. Las columnas (o campos) de la tabla de clientes pueden ser ID de cliente, Nombre de la empresa, Dirección de la empresa, Industria, etc. Las columnas de una tabla de transacciones pueden ser Fecha de transacción, ID de cliente, Cantidad de la transacción, Método de pago, etc. Las tablas se pueden unir con el campo ID de cliente común. Por lo tanto, puede consultar la tabla para producir informes valiosos, como informes de ventas por industria o empresa, que pueden informar mensajes a clientes potenciales. Otras Base de Datos. (Orientadas a Objetos…Documentales…) Con la proliferación de la nube y el análisis de Big Data, la base de datos orientada a objetos está ahora bien posicionada para dirigirse a estas necesidades. La industria del software se caracteriza por sufrir constantemente rápidos cambios, donde nuevas tecnologías se introducen cada poco tiempo. También se caracteriza por las tecnologías que cambian y se presentan como una nueva forma de hacer las cosas. Este es el caso de una base de datos orientada a objetos. Bibliografía - Silberschatz/Korth/Sudarshan. “Fundamentos de Bases de Datos”. 5ta. Edición. 2006 - Introducción a los Sistemas de Bases de Datos. Francisco Moreno. Universidad Nacional. Medellín. https://www.medellin.unal.edu.co/~fjmoreno/bd1/Pres02BDI.ppt - https://www.ibm.com/mx-es/topics/relational-databases