Universidad del Zulia Costa Oriental del Lago UNIDAD IV Funcionamiento de la Base de Datos Sistemas Jerárquicos. Sistemas de Red. Sistemas Relacionales. Sistemas de bases de datos para microcomputadoras. Aplicación de sistemas de bases de datos IMS (Sistemas de Manejo de Información). Métodos de acceso del modelo interno y externo para IMS. Nivel conceptual DBD (Descripción de Base de Datos). CODASYL (Organización para la estandarización del lenguaje COBOL y los DBMS COFASYL) DBTG (Grupo de Trabajo de Base de Datos (CODASYL)). Universidad del Zulia Unidad IV. Funcionamiento de la Base de Datos. Sistemas Jerárquicos. Los primeros Sistemas de Base de Datos introducidos a mediados de los 60, estaban basados en el modelo jerárquico que resume que: todas las interrelaciones entre los datos pueden estructurarse como jerarquías. Con esto, los datos se representan mediante una estructura en árbol. En un sistema jerárquico de Base de Datos los archivos se conectan entre sí mediante punteros físicos o campos de datos añadidos a los registros individuales. Un puntero (apuntador) es una dirección física que identifica dónde puede encontrarse un registro sobre el disco. En una jerarquía, un hijo (un registro "subordinado" en una interrelación jerárquica) puede solamente tener un padre (un registro "propietario" en una interrelación jerárquica), pero un padre puede tener varios hijos. A este tipo de relación se le llama relación uno a muchos. Sistema de red. Una red es una interrelación de datos en la cual un registro puede estar subordinado a registros de más de un archivo. A causa de la necesidad obvia de manipular tales interrelaciones, a finales de los años 60 se desarrollaron los sistemas de red. Al igual que los sistemas de bases de datos jerárquicos, los sistemas de bases de datos de red emplearon punteros físicos para enlazar entre sí los registros de diferentes archivos. Para manejar aplicaciones tales como el procesamiento de pedidos, se desarrolló un nuevo modelo de datos de red. El modelo de datos de red extendía el modelo jerárquico permitiendo que un registro participara en múltiples relaciones padre/hijo, reduciendo o eliminando de este modo las redundancias. Estas relaciones eran conocidas como conjuntos en el 2 Universidad del Zulia modelo de red. Entre mediados de los años 60 y principios de los 70 se desarrollaron y se comercializaron exitosamente varios SGBD en redes por lo que, en 1971, este modelo de datos se normalizó, es decir, se publicó un estándar oficial para bases de datos de red que se conoció como el modelo CODASYL. Sistemas Relacionales. Es una base de datos en donde todos los datos visibles al usuario están organizados estrictamente como tablas de valores, y en donde todas las operaciones de la base de datos operan sobre estas tablas. Estas bases de datos son percibidas por los usuarios como una colección de relaciones normalizadas de diversos grados que varían con el tiempo. El modelo relacional representa un sistema de bases de datos en un nivel de abstracción un tanto alejado de los detalles de la máquina subyacente, de la misma manera como, por ejemplo, un lenguaje del tipo de PL/1 representa un sistema de programación con un nivel de abstracción un tanto alejado de los detalles de la máquina subyacente. De hecho, el modelo relacional puede considerarse como un lenguaje de programación más bien abstracto, orientado de manera específica hacia las aplicaciones de bases de datos. (Date, 1993) Sistemas de bases de datos para microcomputadoras. Cuando empezaron a salir las primeras microcomputadoras, a principios de los ochenta, apenas si existía software para manejar base de datos. Sin embargo, desde entonces no dejan de aparecer nuevos productos que se pueden ejecutar tanto en PC AT como XT bajo los distintos sistemas operativos PC-DOS, MS-DOS, CP/M, UNIX, XENIX, etc. 3 Universidad del Zulia La característica fundamental de los sistemas de gestión de base de datos para microcomputadoras es su sencillez. Los sistemas de gestión de base de datos para microcomputadoras se pueden clasificar en: Sistemas de manejo de archivos: permiten recuperar registros de un archivo a partir de cualquier campo del registro. Tienen la limitación de que sólo pueden procesar un archivo a la vez. Sistemas de gestión de base de datos monousuario: permite procesar consultas de varios archivos al mismo tiempo y crear nuevos archivos uniendo dos o más archivos existentes. Sistemas de gestión de base de datos multiusuario: permite a diversos usuarios un acceso simultáneo a la base de datos por medio de un servidor de archivos, para lo cual necesitan una red local (LAN). Enlace con la unidad central: un enlace de comunicación entre el sistema de gestión de base de datos de un computador y una unidad central permite a los usuarios a acceder a las base de datos de la unidad central desde sus computadores para su procesamiento local. Algunos paquetes toleran la creación de archivos en la microcomputadora y luego transferir éstos a la unidad central o viceversa. Sistema integrado multifunción: además del manejo de base de datos incorpora otras funciones, como la hoja de cálculo, tratamiento de textos, graficas, agenda, análisis estadístico, etc. Aplicación de sistemas de bases de datos: IMS. (Sistema de Manejo de Información). Uno de los sistemas de gestión de base de datos jerárquica más populares es el Information Management System (IMS) de IBM, introducido en 1968. Las ventajas del IMS y su modelo jerárquico son las siguientes: 4 Universidad del Zulia • Estructura simple: la organización de una base de datos IMS era fácil de entender. La jerarquía de la base de datos se asemejaba al diagrama de organización de una empresa o un árbol familiar. • Organización padre/hijo: una base de datos IMS era excelente para representar relaciones padre/hijo, tales como “A es pieza de B” o “A es propiedad de B”. • Rendimiento: IMS almacenaba las relaciones padre/hijo como punteros físicos de un registro de datos a otro, de modo que el movimiento a través de la base de datos era rápido. Y dado que la estructura era sencilla, IMS podía colocar los registros padre e hijo cercanos unos a otros en el disco, minimizando la entrada/salida de disco. El IMS, es el principal sistema de gestión de bases de datos jerárquicos y de transacción, es el mejor producto para aplicaciones y datos operativos importantes en línea, en las que los factores clave son que admitan una disponibilidad, un rendimiento, una capacidad y una integridad altos, manteniendo el bajo coste. Métodos de acceso del Modelo interno y externo para IMS. Nivel interno: es la vista externa de un usuario se ha definido como un conjunto de bases lógicas y una base lógica como un subconjunto de una única base de datos física. Nivel externo: los métodos de acceso IMS están en función de los métodos de acceso utilizados por IBM, que son los siguientes: SAM (Método de Acceso Secuencial): incluye a QSAM y BSAM. ISAM (Método de Acceso Secuencial Indexado): de OS/VS. VSAM (Método de Acceso de Almacenamiento Virtual): de OS/VS. OSAM (Método de Acceso Secuencial de Desbordamiento): es un IMS especial. Un archivo OSAM es parecido a un archivo secuencial; no obstante permite el acceso directo al archivo. 5 Universidad del Zulia Nivel conceptual DBD (Descripción de Base de Datos). CODASYL (Organización para la estandarización del lenguaje COBOL y los DBMS COFASYL) DBTG (Grupo de Trabajo de Base de Datos (CODASYL)). DBD (Descripción de Base de Datos): el procedimiento empleado para generar la descripción de la base de datos se denomina (DBDGEN). Las proposiciones fuentes de control para la DBD se escriben usando macros especiales en lenguaje ensamblador IBM, que constituyen el DDL (lenguaje de descripción de datos) conceptual para IMS. CODASYL (Organización para la estandarización del lenguaje COBOL y los DBMS COFASYL) y DBTG (Grupo de Trabajo de Base de Datos (CODASYL)). CODASYL (Conference on Data System Languages) es el nombre de una conferencia a finales de los años 60 en la que participaron organismos privados y públicos del gobierno de Estados Unidos con la finalidad de definir estándares (CODASYL definió el lenguaje COBOL) para la informática de gestión. De ahí salió DBTG (Data Base Task Group), (grupo de tareas para bases de datos) grupo que definió el modelo en red de bases de datos que desde entonces se llama CODASYL o DBTG y que fue aceptado por la ANSI. Atendiendo la terminología CODASYL DBTG (Conference on Data Description Lenguaje Data Base tTsk Group) de 1971, para describir los datos desde el punto de vista del programador, éstos se pueden enumerar en: Bit: o digito binario, es simplemente un interruptor en dos sentidos; solo puede tomar los valores 0 y 1. Byte: es el grupo de bits más pequeño con dirección propia. Está formado por ocho bits. En algunas computadoras, grupos de 16, 32 o 64 bits, se combinan para formar palabras. Campo: es la unidad más pequeña a la cual se puede referir en un programa. Puede estar formado por cualquier cantidad de bits. Agregado de datos: es una colección de campos a los que se denomina como un todo. 6 Universidad del Zulia Registro lógico: es un conjunto de campos o de agregados de datos relacionados. Registro físico: es la unidad de transferencia de datos entre el dispositivo de almacenamiento de datos y la memoria principal. Característica. CODASYL es una organización constituida por representantes voluntarios de fabricantes y usuarios de computadoras en la industria y en los Gobiernos de Canada y Estados Unidos. Dicho informe contenía propuestas para tres lenguajes diferentes para la descripción de: 1. Esquema DDL (lenguaje de descripción de datos), cuyo propósito era describir una base de datos tipo red. 2. Subesquemas DDL, para definir la vista externa. 3. Un lenguaje de descripción de almacenamiento de datos (DSDL). 7