TEMA 15 : INTRODUCCIÓN A LAS BASES DE DATOS DE ATRIBUTO, DISEÑO Y CREACIÓN OBJETIVOS DEL TEMA • Conocimiento teórico del concepto de Base de Datos 1.- CONCEPTO DE BASE DE DATOS Un Sistema de Bases de Datos es un conjunto de registros, datos y relaciones que refleja las necesidades de información de una organización. Estos registros datos y relaciones se agrupan en unidades independientes que satisfacen los requerimientos de información de la organización. Cada una de estas unidades es una base de datos. Todos los datos pertenecientes a una misma Base de Datos están interrelacionados: De manera directa, por relaciones establecidas durante el diseño. De manera indirecta, por el uso que se les dé mediante aplicaciones básicas, así llamadas si el uso de estos datos es primordial en ellas. Está claro que una organización puede necesitar una o más Bases de Datos según la clase de información que requiera. Por ejemplo, una Base de Datos es necesaria para todos los procedimientos de administración de personal, y otra distinta para todos los procedimientos de inventario. Una de las principales ventajas de implantar un Sistema de Bases de Datos es que hace posible un Sistema de Información Gerencial (SIGe), que necesita una gran integración de datos y de sistemas. Esta integración sólo es posible si cada Base de Datos en todo el Sistema está diseñada de tal manera que no entre en conflicto con los demás. Tradicionalmente, se ha seguido en las organizaciones la práctica de diseñar Bases de Datos según aplicaciones particulares. Esto se ha hecho por diferentes razones: costos, falta de organización, falta de conocimiento, proyectos grandes, etc. Como resultado, los diseños de Bases de Datos han estado ligados a los Sistemas desde su concepción inicial, lo que obviamente atenta contra la independencia de datos. Es por esta razón que integrar Bases de Datos así diseñados resulta ser una labor titánica para el Administrador de la Base de Datos (ABD), pues muchas veces los problemas no se presentarán por requerimientos conflictivos de índices alternos o de almacenamiento físico sino debido a la estructura con que fueron concebidas las diferentes Bases de Datos. Por todo esto es necesario hacer un estudio integral de datos en toda la organización antes de comenzar a implantar sistemas. Solo así podrá garantizarse una plena integración: no solamente se asegura el éxito de cada proyecto individual, sino que también el del proyecto de implantación de Bases de Datos como un todo. Lo anterior justifica un nuevo enfoque en el diseño de Sistemas de Información, que considere primero la definición de las necesidades de información (Diseño de la Base de Datos) y luego las soluciones prácticas que satisfacen esas necesidades (Implantación de los Sistemas). Lo dicho se aplica tanto a organizaciones pequeñas y medianas como a organizaciones de gran envergadura. Además, el enfoque es también válido para sistemas y programas de aplicación. Por supuesto lo anterior queda sujeto a que exista un método que permita hacer un estudio integral con un costo mínimo, y a que la Administración Superior apoye el proyecto de diseño de la Base de Datos. Si estas condiciones no se dan es casi seguro que todo el proyecto fracasará. Qué es una base de datos? Existen distintas definiciones de lo que es una base de datos, entre las que hay, nos quedamos con las siguientes: Conjunto de datos relacionados que tienen un fin común. Estructura que permite la manipulación de datos. Colección de independientes, piezas de información almacenadas juntas interrelacionadas sin necesidad o de redundancia. Colección de datos relacionados cuya finalidad es compartir la información. 2.- DISEÑO DE BASES DE DATOS Una Base de Datos (BD) contempla dos tipos de diseño: el lógico y el físico. El diseño físico depende de los dispositivos al almacenar la Base de Datos, así como el Sistema Administrador de Base de Datos (SABD) que se use. En suma, comprende el hardware y el software motor de la BD. En el diseño lógico, llamado también diseño conceptual o esquema, deben describirse todos los elementos que forman la BD. Más aún, el diseño lógico debe condicionar al diseño físico. Algunos sistemas comerciales (como los que siguen la convención Codasyl (1)) llaman diseño lógico a una definición global que debe hacerse para el Sistema Administrador de la Base de Datos (SABD), y diseño físico a la forma en que la Base de Datos es almacenada dentro del computador. Estos dos diseños se encuentran generalmente ligados a la arquitectura del SABD y especifican muchos detalles de implementación. Esta mezcla de parámetros lógicos y físicos hace que se pierda independencia de datos. Una mejor alternativa sería describir, a un nivel adecuado, la estructura y organización que deben tener los datos sin especificar exactamente parámetros que pueden definirse cuando se implante la BD. Dada esta mezcla de parámetros lógicos y físicos deben distinguirse tres tipos de diseño de Bases de Datos: Diseño Lógico Global de la Base de Datos (DLGBD) Diseño Lógico-Físico Diseño Físico El Diseño Lógico Global de la Base de Datos es el más importante. Debe reflejar las necesidades de información y la organización estructural de los datos de la organización. El DLGBD debe ser un modelo de datos en el que se reflejen los datos y su estructura. El diseño lógico-físico, sirve para ajustar el DLGBD a las facilidades y restricciones que el SABD brinda para implantar el diseño lógico. Por ejemplo, si el SABD es enteramente jerárquico será necesario implantar con redundancia, aquellas relaciones que así lo requieran. El tercer tipo de diseño, el diseño físico, deberá especificar los dispositivos y métodos de acceso usados para almacenar cada registro de la Base de Datos. No debe confundirse el DLGBD con el diseño lógico-físico, ni éste último con el diseño físico. Esta confusión a veces se da debido a la arquitectura del SABD o debido a la ausencia tanto del diseño lógico como del diseño físico. Debe destacarse que producir los diseños lógico-físico y físico a partir del diseño lógico es una tarea relativamente fácil, pues sólo es necesario conocer los detalles del SABD que hay que usar. El diseño Lógico Global de la Base de Datos (DLGBD) surge de manera natural de la necesidad de integración de información en la organización. Este diseño debe producirse antes de tomar cualquier decisión de implantación de sistemas, pues si no se procede de esta forma, es muy probable que luego no puedan integrarse las Bases de Datos diseñadas. Además, dado que los sistemas deben ser eficaces, es necesario que el sistema de Bases de Datos refleje y atienda las necesidades de información y los requerimientos de la organización. El diseño de las Bases de Datos debe ser un reflejo de la realidad de la misma. Debe ser lo suficientemente completo como para almacenar toda la información necesaria y como para reflejar también la estructura de los archivos de la organización, pues la Base de Datos debe permitir acceso a los datos no sólo su almacenamiento. El DLGBD debe ser un reflejo de la realidad de la organización porque debe ser producto de un estudio integral de la misma. Aunque puede objetarse la realización de un DLGBD por ser elevado el consumo de recursos en su producción, se debe destacar que no es frecuente que en una organización haya cambios drásticos y repetidos en la estructura de sus archivos. De hecho, lo que generalmente sucede es que se cambian los procedimientos sin modificar los archivos, y cuando se modifican archivos, generalmente lo que se hace es añadir información nueva o desechar información existente. Por esta razón es altamente rentable hacer el estudio integral de datos, pues el diseño continuará vigente durante un largo plazo aunque se produzcan pequeños cambios en ese lapso de tiempo. Además, un diseño integral de la Base de Datos permitirá escoger con mejor criterio tanto los sistemas que han de mecanizarse, como la parte global de la Base de Datos que se implantará. Este diseño puede verse como un mapa o plano en el que están definidas claramente todas las necesidades de información operacional. Con este marco de referencia, la organización puede planear su desarrollo computacional. El DLGBD puede usarse para decidir qué nuevos sistemas se implementarán, permitiendo, además, predecir el impacto del nuevo sistema en el conjunto de los sistemas ya implantados. Contar con un DLGBD reduce la labor del implantador de sistemas, pues le evita considerar las partes de la Base de Datos innecesarias para su sistema, ya sea por costo relativo o simplemente por ser intrascendentes. Esto le permitirá concentrarse únicamente en la parte de la Base de Datos que utilizará. De hecho en el DLGBD debe describirse tanto la BD como cada uno de los elementos que forman el recurso de datos de la organización. Este documento es de gran valor para el implantador de sistemas, pues ahí él puede encontrar definidas todas las necesidades de información de la organización y, en particular, las necesidades de información del sistema a su cargo. El Administrador de la BD puede beneficiarse también enormemente con el DLGBD, pues éste le permite conocer las necesidades de información de toda la organización y no solo las de los usuarios de los sistemas actualmente mecanizados. Esto permite al Administrador de la BD administrar mejor el recurso de datos de la organización. Por otro lado, conocer la organización de todos los datos, organización que se describe en el diseño lógico de la BD, permite planear con mayor eficacia y eficiencia toda la gestión administrativa de la organización. Si el DLGBD no estuviera hecho, cada implantador de sistemas tendría que diseñar, junto con el Administrador de la BD, su propia Base de Datos. Esta pequeña Base de Datos podría dejar fuera requerimientos de información de otros sistemas a implantar en el futuro, y hacer necesario grandes ajustes cuando se implanten esos nuevos sistemas. Es mucho más fácil no considerar lo que no interesa que construir sólo lo que interesa. El DLGBD debe estar compuesto por los registros, datos y relaciones que forman la BD. La descripción de estos tres componentes debe ser suficientemente completa como para que no haya ambigüedades en el diseño pero no tan detallada como para que condicione demasiado la implantación de la BD. Por esta razón, en el diseño lógico deben describirse los objetivos y las razones de ser de los datos, los registros y las relaciones, sin describir detalles de implantación. Estos detalles deben describirse en el diseño lógico-físico o en el diseño físico de la Base de Datos. Los rangos y ciertos valores para los datos deben dejarse para el diseño lógico-físico o para el diseño físico. Nótese que los objetivos y las razones de ser de los datos es lo que se describe usualmente en un Diccionario de Datos, de donde puede concluirse que uno de los subproductos del DLGBD es esta importante documentación. Puede incluirse en el DLGBD la descripción de las restricciones necesarias para mantener la integridad, seguridad y privacidad del Sistema de Bases de Datos. Aunque no obligatorio, es de suma importancia pues evita datos inconsistentes por una mala utilización de la BD. Es conveniente que en el DLGBD se incluya un diagrama que describa los registros y relaciones que forman la Base de Datos. Este tipo de diagrama es muy útil para obtener una visión global de la Base de Datos, pues de un solo vistazo pueden observarse los registros y las relaciones que la forman. Este diagrama debe corresponder al modelo de datos escogidos antes de hacer el diseño. Como se mencionó, uno de los subproductos obtenidos al hacer el DLGBD es el Diccionario de Datos, herramienta de conocida utilidad y necesidad para la administración de la Base de Datos. Si se desea hacer una estimación del tamaño de la Base de Datos, deberá recogerse información sobre el volumen de los datos y sobre los registros de la organización. De esta manera la estimación podrá hacerse fácilmente y con toda la exactitud que se quiera. Aunque el DLGBD puede orientarse a la arquitectura de un SABD específico es mejor no hacerlo así, porque puede falsearse o diluirse la organización de los datos que debe reflejar el diseño sobre las facilidades y restricciones del SABD. Además, no es conveniente tomar decisiones prematuras sobre el tipo de Base de Datos o respecto de la implantación de la misma, pues esto puede generar ineficiencias o complicaciones en el desarrollo del futuro sistema. Por último, es necesario destacar que los tres tipos de diseño deben ser hechos o coordinados por el Administrador de la BD, de tal forma que se asegure la compatibilidad de todas las Bases de Datos. Si cada analista hace su parte del DLGBD, es muy probable que las Bases de Datos resultantes no puedan integrarse después. En resumen, el proceso de creación y gestión de una base de datos lleva parejo los siguientes pasos: A.- Diseño Lógico Global de la Base de Datos A.1.- Estudio integral de la organización A.2.- Necesidades y requerimientos totales de la información A.3.- Reflejo de la estructura de la organización y organización de datos. Archivos de ésta, sin incluir consideración de parámetros físicos. A.4.- Elaboración del diccionario general de datos. B.- Diseño Datos. B.1.- Estudio de facilidades y restricciones del sistema administrador de la Base de Datos. B.2.- Elección de la parte del Sistema de Bases de Datos por implantar. B.3.- Predicción del impacto en toda la organización. B.4.- Actualización y ajustes al diccionario general de Datos. B.5.- Diseño lógico para el Sistema Administrador. C.- Diseño Físico de la Base de Datos. C.1.- Estudio de los requerimientos de dispositivos y medios de almacenamiento. C.2.- Elección de los métodos de acceso. C.3.- Diseño físico para el Sistema Administrador. 3.- CREACIÓN DE BASES DE DATOS Definida la BD a nivel lógico y físico, el siguiente paso es la creación de ésta. Para ello se utilizan diversas herramientas de desarrollo. El proceso de creación se verá más adelante. RESUMEN DEL TEMA 15 En esta lección se ha visto que una Base de Datos es: Conjunto de datos relacionados que tienen un fin común. Estructura que permite la manipulación de datos. Colección de piezas de información interrelacionadas o independientes, almacenadas juntas sin necesidad de redundancia. Colección de datos relacionados cuya finalidad es compartir la información. Y es importante distinguir en las Fases de diseño y creación de las Bases de Datos que existen 3 pasos: A.- Diseño Lógico Global de la Base de Datos A.1.- Estudio integral de la organización A.2.- Necesidades y requerimientos totales de la información A.3.- Reflejo de la estructura de la organización y organización de datos. Archivos de ésta, sin incluir consideración de parámetros físicos. A.4.- Elaboración del diccionario general de datos. B.- Diseño Datos. B.1.- Estudio de facilidades y restricciones del sistema administrador de la Base de Datos. B.2.- Elección de la parte del Sistema de Bases de Datos por implantar. B.3.- Predicción del impacto en toda la organización. B.4.- Actualización y ajustes al diccionario general de Datos. B.5.- Diseño lógico para el Sistema Administrador. C.- Diseño Físico de la Base de Datos. C.1.- Estudio de los requerimientos de dispositivos y medios de almacenamiento. C.2.- Elección de los métodos de acceso. C.3.- Diseño físico para el Sistema Administrador. De los cuales al que mayor atención hay que prestar porque condiciona al resto es el primero .