LECCIÓN 15 : Introducción a las bases de datos de atributo, diseño

Anuncio
TEMA 15 : INTRODUCCIÓN A LAS BASES DE DATOS DE ATRIBUTO,
DISEÑO Y CREACIÓN
OBJETIVOS DEL TEMA
•
Conocimiento teórico del concepto de Base de Datos
1.- CONCEPTO DE BASE DE DATOS
Un Sistema de Bases de Datos es un conjunto de registros, datos y
relaciones que refleja las necesidades de información de una organización.
Estos registros datos y relaciones se agrupan en unidades independientes que
satisfacen los requerimientos de información de la organización. Cada una de
estas unidades es una base de datos.
Todos los datos pertenecientes a una misma Base de Datos están
interrelacionados:
™ De manera directa, por relaciones establecidas durante el diseño.
™ De manera indirecta, por el uso que se les dé mediante aplicaciones
básicas, así llamadas si el uso de estos datos es primordial en ellas.
Está claro que una organización puede necesitar una o más Bases de
Datos según la clase de información que requiera. Por ejemplo, una Base de
Datos es necesaria para todos los procedimientos de administración de
personal, y otra distinta para todos los procedimientos de inventario.
Una de las principales ventajas de implantar un Sistema de Bases de
Datos es que hace posible un Sistema de Información Gerencial (SIGe), que
necesita una gran integración de datos y de sistemas. Esta integración sólo es
posible si cada Base de Datos en todo el Sistema está diseñada de tal manera
que no entre en conflicto con los demás.
Tradicionalmente, se ha seguido en las organizaciones la práctica de
diseñar Bases de Datos según aplicaciones particulares. Esto se ha hecho por
diferentes razones: costos, falta de organización, falta de conocimiento,
proyectos grandes, etc. Como resultado, los diseños de Bases de Datos han
estado ligados a los Sistemas desde su concepción inicial, lo que obviamente
atenta contra la independencia de datos. Es por esta razón que integrar Bases
de Datos así diseñados resulta ser una labor titánica para el Administrador de
la Base de Datos (ABD), pues muchas veces los problemas no se presentarán
por requerimientos conflictivos de índices alternos o de almacenamiento físico
sino debido a la estructura con que fueron concebidas las diferentes Bases de
Datos.
Por todo esto es necesario hacer un estudio integral de datos en toda la
organización antes de comenzar a implantar sistemas. Solo así podrá
garantizarse una plena integración: no solamente se asegura el éxito de cada
proyecto individual, sino que también el del proyecto de implantación de Bases
de Datos como un todo. Lo anterior justifica un nuevo enfoque en el diseño de
Sistemas de Información, que considere primero la definición de las
necesidades de información (Diseño de la Base de Datos) y luego las
soluciones prácticas que satisfacen esas necesidades (Implantación de los
Sistemas). Lo dicho se aplica tanto a organizaciones pequeñas y medianas
como a organizaciones de gran envergadura.
Además, el enfoque es también válido para sistemas y programas de
aplicación.
Por supuesto lo anterior queda sujeto a que exista un método que
permita hacer un estudio integral con un costo mínimo, y a que la
Administración Superior apoye el proyecto de diseño de la Base de Datos. Si
estas condiciones no se dan es casi seguro que todo el proyecto fracasará.
Qué es una base de datos?
Existen distintas definiciones de lo que es una base de datos, entre las
que hay, nos quedamos con las siguientes:
™ Conjunto de datos relacionados que tienen un fin común.
™ Estructura que permite la manipulación de datos.
™ Colección
de
independientes,
piezas
de
información
almacenadas
juntas
interrelacionadas
sin
necesidad
o
de
redundancia.
™ Colección de datos relacionados cuya finalidad es compartir la
información.
2.- DISEÑO DE BASES DE DATOS
Una Base de Datos (BD) contempla dos tipos de diseño: el lógico y el
físico.
El diseño físico depende de los dispositivos al almacenar la Base de
Datos, así como el Sistema Administrador de Base de Datos (SABD) que se
use. En suma, comprende el hardware y el software motor de la BD.
En el diseño lógico, llamado también diseño conceptual o esquema,
deben describirse todos los elementos que forman la BD. Más aún, el diseño
lógico debe condicionar al diseño físico. Algunos sistemas comerciales (como
los que siguen la convención Codasyl (1)) llaman diseño lógico a una definición
global que debe hacerse para el Sistema Administrador de la Base de Datos
(SABD), y diseño físico a la forma en que la Base de Datos es almacenada
dentro del computador.
Estos dos diseños se encuentran generalmente ligados a la arquitectura
del SABD y especifican muchos detalles de implementación. Esta mezcla de
parámetros lógicos y físicos hace que se pierda independencia de datos.
Una mejor alternativa sería describir, a un nivel adecuado, la estructura y
organización que deben tener los datos sin especificar exactamente
parámetros que pueden definirse cuando se implante la BD.
Dada esta mezcla de parámetros lógicos y físicos deben distinguirse tres
tipos de diseño de Bases de Datos:
™ Diseño Lógico Global de la Base de Datos (DLGBD)
™ Diseño Lógico-Físico
™ Diseño Físico
El Diseño Lógico Global de la Base de Datos es el más importante.
Debe reflejar las necesidades de información y la organización estructural de
los datos de la organización. El DLGBD debe ser un modelo de datos en el que
se reflejen los datos y su estructura.
El diseño lógico-físico, sirve para ajustar el DLGBD a las facilidades y
restricciones que el SABD brinda para implantar el diseño lógico. Por ejemplo,
si el SABD es enteramente jerárquico será necesario implantar con
redundancia, aquellas relaciones que así lo requieran.
El tercer tipo de diseño, el diseño físico, deberá especificar los
dispositivos y métodos de acceso usados para almacenar cada registro de la
Base de Datos.
No debe confundirse el DLGBD con el diseño lógico-físico, ni éste último
con el diseño físico. Esta confusión a veces se da debido a la arquitectura del
SABD o debido a la ausencia tanto del diseño lógico como del diseño físico.
Debe destacarse que producir los diseños lógico-físico y físico a partir
del diseño lógico es una tarea relativamente fácil, pues sólo es necesario
conocer los detalles del SABD que hay que usar.
El diseño Lógico Global de la Base de Datos (DLGBD) surge de manera
natural de la necesidad de integración de información en la organización. Este
diseño debe producirse antes de tomar cualquier decisión de implantación de
sistemas, pues si no se procede de esta forma, es muy probable que luego no
puedan integrarse las Bases de Datos diseñadas. Además, dado que los
sistemas deben ser eficaces, es necesario que el sistema de Bases de Datos
refleje y atienda las necesidades de información y los requerimientos de la
organización. El diseño de las Bases de Datos debe ser un reflejo de la
realidad de la misma. Debe ser lo suficientemente completo como para
almacenar toda la información necesaria y como para reflejar también la
estructura de los archivos de la organización, pues la Base de Datos debe
permitir acceso a los datos no sólo su almacenamiento. El DLGBD debe ser un
reflejo de la realidad de la organización porque debe ser producto de un estudio
integral de la misma.
Aunque puede objetarse la realización de un DLGBD por ser elevado el
consumo de recursos en su producción, se debe destacar que no es frecuente
que en una organización haya cambios drásticos y repetidos en la estructura de
sus archivos. De hecho, lo que generalmente sucede es que se cambian los
procedimientos sin modificar los archivos, y cuando se modifican archivos,
generalmente lo que se hace es añadir información nueva o desechar
información existente. Por esta razón es altamente rentable hacer el estudio
integral de datos, pues el diseño continuará vigente durante un largo plazo
aunque se produzcan pequeños cambios en ese lapso de tiempo.
Además, un diseño integral de la Base de Datos permitirá escoger con
mejor criterio tanto los sistemas que han de mecanizarse, como la parte global
de la Base de Datos que se implantará.
Este diseño puede verse como un mapa o plano en el que están
definidas claramente todas las necesidades de información operacional. Con
este marco de referencia, la organización puede planear su desarrollo
computacional.
El DLGBD puede usarse para decidir qué nuevos sistemas se
implementarán, permitiendo, además, predecir el impacto del nuevo sistema en
el conjunto de los sistemas ya implantados. Contar con un DLGBD reduce la
labor del implantador de sistemas, pues le evita considerar las partes de la
Base de Datos innecesarias para su sistema, ya sea por costo relativo o
simplemente
por
ser
intrascendentes.
Esto
le
permitirá
concentrarse
únicamente en la parte de la Base de Datos que utilizará.
De hecho en el DLGBD debe describirse tanto la BD como cada uno de
los elementos que forman el recurso de datos de la organización. Este
documento es de gran valor para el implantador de sistemas, pues ahí él puede
encontrar definidas todas las necesidades de información de la organización y,
en particular, las necesidades de información del sistema a su cargo. El
Administrador de la BD puede beneficiarse también enormemente con el
DLGBD, pues éste le permite conocer las necesidades de información de toda
la organización y no solo las de los usuarios de los sistemas actualmente
mecanizados. Esto permite al Administrador de la BD administrar mejor el
recurso de datos de la organización.
Por otro lado, conocer la organización de todos los datos, organización
que se describe en el diseño lógico de la BD, permite planear con mayor
eficacia y eficiencia toda la gestión administrativa de la organización.
Si el DLGBD no estuviera hecho, cada implantador de sistemas tendría
que diseñar, junto con el Administrador de la BD, su propia Base de Datos.
Esta pequeña Base de Datos podría dejar fuera requerimientos de información
de otros sistemas a implantar en el futuro, y hacer necesario grandes ajustes
cuando se implanten esos nuevos sistemas.
Es mucho más fácil no considerar lo que no interesa que construir sólo lo
que interesa.
El DLGBD debe estar compuesto por los registros, datos y relaciones
que forman la BD. La descripción de estos tres componentes debe ser
suficientemente completa como para que no haya ambigüedades en el diseño
pero no tan detallada como para que condicione demasiado la implantación de
la BD. Por esta razón, en el diseño lógico deben describirse los objetivos y las
razones de ser de los datos, los registros y las relaciones, sin describir detalles
de implantación. Estos detalles deben describirse en el diseño lógico-físico o en
el diseño físico de la Base de Datos. Los rangos y ciertos valores para los
datos deben dejarse para el diseño lógico-físico o para el diseño físico.
Nótese que los objetivos y las razones de ser de los datos es lo que se
describe usualmente en un Diccionario de Datos, de donde puede concluirse
que uno de los subproductos del DLGBD es esta importante documentación.
Puede incluirse en el DLGBD la descripción de las restricciones
necesarias para mantener la integridad, seguridad y privacidad del Sistema de
Bases de Datos. Aunque no obligatorio, es de suma importancia pues evita
datos inconsistentes por una mala utilización de la BD.
Es conveniente que en el DLGBD se incluya un diagrama que describa
los registros y relaciones que forman la Base de Datos. Este tipo de diagrama
es muy útil para obtener una visión global de la Base de Datos, pues de un solo
vistazo pueden observarse los registros y las relaciones que la forman. Este
diagrama debe corresponder al modelo de datos escogidos antes de hacer el
diseño. Como se mencionó, uno de los subproductos obtenidos al hacer el
DLGBD es el Diccionario de Datos, herramienta de conocida utilidad y
necesidad para la administración de la Base de Datos.
Si se desea hacer una estimación del tamaño de la Base de Datos,
deberá recogerse información sobre el volumen de los datos y sobre los
registros de la organización. De esta manera la estimación podrá hacerse
fácilmente y con toda la exactitud que se quiera.
Aunque el DLGBD puede orientarse a la arquitectura de un SABD
específico es mejor no hacerlo así, porque puede falsearse o diluirse la
organización de los datos que debe reflejar el diseño sobre las facilidades y
restricciones del SABD. Además, no es conveniente tomar decisiones
prematuras sobre el tipo de Base de Datos o respecto de la implantación de la
misma, pues esto puede generar ineficiencias o complicaciones en el desarrollo
del futuro sistema.
Por último, es necesario destacar que los tres tipos de diseño deben ser
hechos o coordinados por el Administrador de la BD, de tal forma que se
asegure la compatibilidad de todas las Bases de Datos. Si cada analista hace
su parte del DLGBD, es muy probable que las Bases de Datos resultantes no
puedan integrarse después.
En resumen, el proceso de creación y gestión de una base de datos
lleva parejo los siguientes pasos:
A.- Diseño Lógico Global de la Base de Datos
A.1.- Estudio integral de la organización
A.2.- Necesidades y requerimientos totales de la información
A.3.- Reflejo de la estructura de la organización y organización de
datos. Archivos de ésta, sin incluir consideración de parámetros
físicos.
A.4.- Elaboración del diccionario general de datos.
B.- Diseño Datos.
B.1.-
Estudio
de
facilidades
y
restricciones
del
sistema
administrador de la Base de Datos.
B.2.- Elección de la parte del Sistema de Bases de Datos por
implantar.
B.3.- Predicción del impacto en toda la organización.
B.4.- Actualización y ajustes al diccionario general de Datos.
B.5.- Diseño lógico para el Sistema Administrador.
C.- Diseño Físico de la Base de Datos.
C.1.- Estudio de los requerimientos de dispositivos y medios de
almacenamiento.
C.2.- Elección de los métodos de acceso.
C.3.- Diseño físico para el Sistema Administrador.
3.- CREACIÓN DE BASES DE DATOS
Definida la BD a nivel lógico y físico, el siguiente paso es la creación de
ésta. Para ello se utilizan diversas herramientas de desarrollo. El proceso de
creación se verá más adelante.
RESUMEN DEL TEMA 15
En esta lección se ha visto que una Base de Datos es:
™ Conjunto de datos relacionados que tienen un fin común.
™ Estructura que permite la manipulación de datos.
™ Colección de piezas de información interrelacionadas o independientes,
almacenadas juntas sin necesidad de redundancia.
™ Colección de datos relacionados cuya finalidad es compartir la
información.
Y es importante distinguir en las Fases de diseño y creación de las
Bases de Datos que existen 3 pasos:
A.- Diseño Lógico Global de la Base de Datos
A.1.- Estudio integral de la organización
A.2.- Necesidades y requerimientos totales de la información
A.3.- Reflejo de la estructura de la organización y organización de
datos. Archivos de ésta, sin incluir consideración de parámetros
físicos.
A.4.- Elaboración del diccionario general de datos.
B.- Diseño Datos.
B.1.-
Estudio
de
facilidades
y
restricciones
del
sistema
administrador de la Base de Datos.
B.2.- Elección de la parte del Sistema de Bases de Datos por
implantar.
B.3.- Predicción del impacto en toda la organización.
B.4.- Actualización y ajustes al diccionario general de Datos.
B.5.- Diseño lógico para el Sistema Administrador.
C.- Diseño Físico de la Base de Datos.
C.1.- Estudio de los requerimientos de dispositivos y medios de
almacenamiento.
C.2.- Elección de los métodos de acceso.
C.3.- Diseño físico para el Sistema Administrador.
De los cuales al que mayor atención hay que prestar porque condiciona al resto
es el primero .
Descargar