Visión Gerencial: Administración de bases de datos

Anuncio
Ctdor. Leonardo F. Gargiulo
Visión Gerencial: Administración de bases de datos *
Administración de bases de datos: Administración de recursos de datos
Introducción
La mayoría de las organizaciones no podrían sobrevivir o tener éxito sin datos de calidad
sobre sus operaciones internas y entorno externo.
Por esto, las organizaciones y sus gerentes necesitan practicar la administración de
recursos de datos, una actividad gerencial que aplica tecnologías de sistemas de
información como administración de bases de datos, con el fin de satisfacer las necesidades
de información de sus usuarios empresariales.
Conceptos de datos básicos
Carácter: el elemento de dato lógico más básico es el carácter, que se compone de un solo
símbolo alfabético, numérico u otro símbolo.
Campo: el siguiente nivel de datos más alto es el campo, o elemento de datos. Un campo
se compone de una agrupación de caracteres. Por ejemplo, la agrupación de caracteres
alfabéticos en el nombre de una persona conforma el campo del nombre, y la agrupación
de números en un monto de ventas forma el campo del monto de ventas.
Específicamente, un campo de datos representa un atributo (una característica o calidad)
de alguna entidad (objeto, persona, lugar o evento).
Registro: los campos relacionados de datos se agrupan para formar un registro. Por
tanto, un registro representa un conjunto de atributos que describen una entidad.
Los registros de longitud fija contienen un número fijo de campos de datos de longitud fija.
En cambio, los registros de longitud variable contienen un número variable de campos y
longitudes de campo.
Archivo: un grupo de registros relacionados es un archivo de datos, o tabla.
Los archivos se clasifican según la aplicación para la cual se utilizan principalmente,
como un archivo de nómina o un archivo de inventario, o el tipo de datos que éstos
incluyen, como un archivo de documentos o un archivo de imágenes gráficas. Los archivos
también se clasifican por su permanencia, por ejemplo, archivo maestro versus archivo de
transacciones. Un archivo de transacciones incluiría registros de todas las transacciones
que ocurren durante un período y podría utilizarse periódicamente para actualizar los
registros permanentes que se incluyen en un archivo maestro. Un archivo histórico es un
archivo maestro o de transacciones obsoleto que se conserva con el propósito de respaldo
o para almacenamiento histórico a largo plazo, que recibe el nombre de almacenamiento
de archivos.
Página 1 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
Base de datos: una base de datos es un conjunto integrado de registros u objetos
relacionados en forma lógica. Un objeto se compone de valores de datos que describen los
atributos de una entidad, además de las operaciones que pueden ejecutarse en los datos.
El enfoque de administración de bases de datos
El enfoque de administración de bases de datos consolida los registros de datos y objetos en
bases de datos que pueden accederse a través de diferentes programas de aplicación. Un
paquete de software importante denominado sistema de administración de bases de datos
(DBMS –Database Management System) actúa como interfaz de software entre usuarios y
bases de datos. Esto les permite a los usuarios acceder fácilmente a los registros en una
base de datos. De esta forma, la administración de bases de datos comprende el uso de
software de administración de bases de datos, con el fin de controlar la creación, la consulta
y el mantenimiento de las bases de datos para proporcionar la información que necesitan los
usuarios finales y sus organizaciones.
El enfoque de bases de datos comprende tres actividades básicas:
1. Actualización y mantenimiento de bases de datos comunes para reflejar nuevas
transacciones empresariales y otros eventos que requieren cambios con respecto
a los registros de una organización.
2. Suministro de la información necesaria para la aplicación de c/usuario final
utilizando programas de aplicación que comparten los datos en bases de datos
comunes.
3. Suministro de una capacidad de consulta / respuesta y de elaboración de
informes a través de un paquete DBMS, de manera que los usuarios finales
puedan consultar fácilmente bases de datos, generar informes y recibir
respuestas rápidas a sus solicitudes ad hoc de información.
Usar software de administración de bases de datos
Un sistema de administración de bases de datos (DBMS –Database Management
System-) es un conjunto de programas computacionales que controla la creación, el
mantenimiento y el uso de las bases de datos de una organización y sus usuarios finales.
Desarrollo de bases de datos
Los paquetes de administración de bases de datos como Microsoft Access o Lotus
Approach permiten que los usuarios finales desarrollen con facilidad las bases de datos que
requieren. Sin embargo, las grandes organizaciones con sistemas cliente / servidor o
basados en mainframes generalmente ponen el control del desarrollo de sus bases de datos
en el ámbito empresarial en manos de administradores de bases de datos (DBA, Database
Administrators) y otros especialistas en bases de datos.
Página 2 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
El diccionario de datos: constituye la herramienta de administración de bases de datos.
Un diccionario de datos es un catálogo o directorio computacional que contiene metadatos,
es decir, datos sobre datos.
Los diccionarios de datos pueden ser consultados por el administrador de bases de datos
para informar sobre el estado de cualquier aspecto de los metadatos de una empresa.
Posteriormente, el administrador puede realizar cambios a las definiciones de los elementos
de datos seleccionados.
Consulta de bases de datos
La capacidad de consulta de bases de datos es un beneficio importante de un sistema de
administración de bases de datos. Los usuarios finales pueden utilizar un DBMS al
solicitar información de una base de datos utilizando un lenguaje de consulta o un
generador de informes. La característica de lenguaje de consulta permite obtener con
facilidad respuestas inmediatas a solicitudes de datos ad hoc. La característica de
generador de informes permite especificar con rapidez un formato de informes para la
información que usted desea que se presente como tal.
Mantenimiento de bases de datos
Las bases de datos de una organización requieren actualizarse continuamente para reflejar
las nuevas transacciones comerciales y demás eventos. También deben realizarse otros
cambios para garantizar la exactitud de los datos en las bases de datos. Este proceso de
mantenimiento de bases de datos se logra mediante programas de procesamiento de
transacciones y otros paquetes de aplicaciones para usuarios finales, con el soporte del
DBMS.
Tipos de bases de datos
 Bases de datos operacionales: almacenan datos detallados que se requieren para
respaldar las operaciones de toda la organización. También se denominan bases de
datos de áreas supeditadas (SADB –Subject Area Databases), bases de datos de
transacciones y bases de datos de producción. Algunos ejemplos son una base de
datos de clientes, de personal, de inventario y otras bases de datos que contienen
datos generados por operaciones empresariales.
 Bases de datos analíticas (o gerenciales
o de información o
multidimensionales): almacenan datos e información que se extrae de bases de
datos operacionales y externas seleccionadas. Éstas se componen de los datos y la
información resumida que más necesitan los gerentes de una organización y otros
usuarios finales.
 Bodegas de datos: almacena datos del año en curso y de años anteriores, que han
sido extraídos de las diversas bases de datos operacionales de una organización.
Ésta es una fuente central de datos que ha sido seleccionada, editada, estandarizada
e integrada, de manera que los gerentes y otros profesionales que son usuarios
Página 3 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
finales puedan utilizarla para una variedad de formas de análisis empresarial,
investigación de mercado y respaldo a las decisiones. Las bodegas de datos pueden
subdividirse en plazas de datos, que contienen subconjuntos específicos de datos
provenientes de la bodega de datos. Un uso importante, es la extracción de datos,
que consiste en que los datos de una bodega de datos se procesan con el fin de
identificar factores y tendencias claves en patrones históricos de la actividad
empresarial. Esto puede utilizarse para ayudar a los gerentes en la toma de
decisiones sobre cambios estratégicos en operaciones empresariales para obtener
ventajas competitivas en el mercado.
 Bases de datos distribuidas: muchas organizaciones reproducen y distribuyen
copias o partes de bases de datos a servidores de red localizados en una variedad de
sitios. Estas bases de datos distribuidas pueden residir en servidores de red en la
World Wide Web, en intranets o extranets corporativas o en otras redes de la
empresa. Las bases de datos distribuidas pueden ser copias de bases de datos
operaciones o analíticas, bases de datos hipermedia o de discusión o cualquier otro
tipo de base de datos. La reproducción y distribución de bases de datos se realiza
con el fin de mejorar el desempeño y la seguridad de la base de datos. Garantizar
que todos los datos en las bases de datos distribuidas de una organización se
actualicen constantemente y al mismo tiempo constituyen un desafío importante de
la administración de bases de datos distruibuidas.
 Bases de datos de usuarios finales: Estas bases de datos se componen de una
variedad de archivos de datos desarrollados por usuarios finales en sus estaciones de
trabajo. Por ejemplo, los usuarios pueden contar con sus propias copias electrónicas
de documentos que bajan de la World Wide Web, que generan con paquetes de
procesamiento de palabras o que reciben por correo electrónico. O pueden tener sus
propios archivos de datos que se generan a partir del uso de paquetes DBMS o de
hojas de cálculo.
 Bases de datos externas: El acceso a una abundante información en bases de datos
externas está disponible en los servicios comerciales en línea mediante el pago de
una cuota de ingreso, y también con o sin costo en las muchas fuentes en Internet,
especialmente la World Wide Web. Los sitios web proporcionan una variedad
infinita de páginas hiperenlazadas de documentos multimedia en bases de datos
hipermedia para que el usuario pueda accederlas. Los datos se encuentran
disponibles en la forma de estadísticas sobre actividad económica y demográfica de
los bancos de datos estadísticos. O se puede visualizar o bajar resúmenes o copias
completas de cientos de periódicos, revistas, boletines o cualquier otro material
publicado, y otras publicaciones periódicas de bases de datos bibliográficas y de
texto completo.
Bases de datos hipermedia en la web
Página 4 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
Debido a que gran parte de la información que pasa a través de Internet es multimedia, las
empresas necesitan bases de datos que puedan almacenar, recuperar y manejar otros tipos
de datos, particularmente documentos, video y sonido.
Un sitio web almacena esta información en una base de datos hipermedia que se compone
de una home page y otras páginas hiperenlazadas de multimedia o medios combinados
(texto, imágenes gráficas y fotografías, etc). Es decir, desde el punto de vista de la
administración de bases de datos, el conjunto de páginas multimedia interconectadas en un
sitio web constituye una base de datos de páginas hipermedia interrelacionadas, en vez de
registros de datos interrelacionados.
Consideraciones generales para la administración de recursos de datos
Los usuarios finales gerenciales deberían considerar los datos como un recurso importante
que deben aprender a manejar en forma apropiada, con el fin de garantizar el éxito y la
supervivencia de sus organizaciones.
La administración de bases de datos es una aplicación importante de la tecnología de
sistemas de información para la administración de los recursos de datos de una empresa.
Sin embargo, se requieren otros esfuerzos principales de administración de recursos de
datos, con el fin de compensar algunos de los problemas que pueden resultar del uso de un
enfoque de administración de bases de datos. Éstos son:
1) Manejo de bases de datos: incluye responsabilidad por el desarrollo y
mantenimiento del diccionario de datos de la organización, diseño y supervisión
del desempeño de las bases de datos y el cumplimiento de estándares para uso y
seguridad de la base de datos.
2) Planeación de datos: incluye la responsabilidad por el desarrollo de una
arquitectura global de datos para los recursos de datos de la empresa, que
concuerda con la misión y los planes estratégicos de la empresa y los objetivos y
procesos de sus unidades de negocios. La planeación de datos se lleva a acabo
por las organizaciones que han realizado un compromiso formal con la
planeación a largo plazo para el uso y la administración estratégica de los
recursos de datos.
3) Manejo de datos: comprende el establecimiento y el cumplimiento de políticas y
procedimientos para manejar los datos como un recurso corporativo estratégico.
Esto implica el manejo de la recolección, el almacenamiento y la diseminación
de todos los tipos de datos en una forma tal que éstos se conviertan en un
recurso estandarizado a disposición de todos los usuarios finales en la
organización. El punto central del manejo de datos es el control de datos en
apoyo de las funciones empresariales y de los objetivos empresariales
estratégicos de una organización. El manejo de datos también puede incluir
responsabilidad por el desarrollo de políticas y la fijación de estándares para el
diseño, procesamiento y medidas de seguridad de las bases de datos
Página 5 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
corporativas, y por la selección de software de diccionario de datos y de
administración de bases de datos.
Beneficios y limitaciones de la administración de bases de datos
Beneficios
 Reduce la duplicación de datos y los integra de manera que puedan ser
accedidos por múltiples programas y usuarios.
 Los programas no dependen del formato de los datos y del tipo de hardware
de almacenamiento secundario que se esté utilizando.
 A los usuarios se les proporciona una capacidad de consulta / respuesta y
de elaboración de informes que les permiten obtener con facilidad la
información que requieren, sin tener que escribir programas
computacionales.
 La programación computacional se simplifica.
 La integridad y seguridad de los datos almacenados en bases de datos
pueden incrementarse, ya que el acceso a los mismos y la modificación de la
base de datos se controlan mediante el software de sistemas de
administración de bases de datos, un diccionario de datos y una función de
administrador de bases de datos
Limitaciones (se originan por el incremento de su complejidad tecnológica)
 El desarrollo de grandes bases de datos de tipos complejos de datos y la
instalación de un DBMS pueden ser difíciles y costosos.
 Se requiere más capacidad de hardware, ya que los requerimientos de
almacenamiento de datos, de datos de control superior y de programas
DBMS de la organización son mayores.
 Los tiempos de procesamiento más largos pueden ser el resultado de
aplicaciones de procesamiento de transacciones de alto volumen, ya que
existe una capa adicional de software (el DBMS) entro los programas de
aplicación y el sistema operativo.
 Si una organización depende de bases de datos centralizadas, se incrementa
su vulnerabilidad a errores, fraude y fallas.
 Problemas de inconsistencia de datos si se utiliza un enfoque de base de
datos distribuida.
Página 6 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
Estructuras de Bases de datos
Las relaciones entre los muchos registros individuales almacenados en bases de datos se
basan en varias estructuras lógicas de datos, o modelos.
Las cinco estructuras de bases de datos fundamentales son:
1) Estructura jerárquica: en la cual las relaciones entre registros forman una
jerarquía con una estructura similar a un árbol. En el modelo jerárquico tradicional
todos los registros dependen y se ordenan en estructuras de múltiples niveles, que se
componen de un registro raíz y cualquier número de niveles subordinados. Así,
todas las relaciones entre registros son del tipo uno a muchos, ya que cada elemento
de datos se relaciona sólo con un elemento que se encuentra por encima de éste. El
elemento de datos o registro que está en el nivel más alto de la jerarquía recibe el
nombre de elemento raíz. Cualquier elemento de datos puede accederse al moverse
progresivamente hacia abajo desde una raíz y a lo largo de las ramas del árbol hasta
localiza el registro deseado.
2) Estructura de red: Esta estructura permite relaciones del tipo muchos a muchos
entre registros, es decir, el modelo de red puede acceder a un elemento de datos
siguiendo una de varias trayectorias, ya que cualquier elemento o registro de datos
puede relacionarse con cualquier número de otros elementos de datos.
3) Estructura relacional: (es la forma más popular) en este modelo se considera que
todos los elementos datos dentro de la base de datos están almacenados en forma de
tablas simples. Los paquetes de sistemas de administración de bases de datos que se
basan en el modelo relacional pueden enlazar elementos de datos de diversas tablas
para proporcionar información a los usuarios.
4) Estructura multidimensional: es una variación del modelo relacional, que utiliza
estructuras multidimensionales para organizar datos y expresar las relaciones entre
datos. Se puede visualizar este tipo de estructuras como cubos de datos y cubos
dentro de cubos de datos. Cada cara del cubo se considera una dimensión de los
datos.
Un beneficio importante de las bases de datos multidimensionales es que
constituyen una manera compacta y fácil de comprender, para visualizar y
manipular elementos de datos que tiene muchas interrelaciones. Por tanto, las bases
de datos multidimensionales se han convertido en la estructura de base de datos más
popular para las bases de datos analíticas.
5) Estructura orientada a objetos: Un objeto se compone de valores de datos que
describen los atributos de una entidad, más las operaciones que pueden ejecutarse
en los datos. Esta capacidad de encapsulamiento permite al modelo orientado a
objetos manejar en mejor forma tipos más complejos de datos (voz, gráficos, texto,
etc.), en relación con otras estructuras de bases de datos. El modelo orientado a
objetos también respalda la herencia; es decir, pueden crearse objetos
Página 7 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
automáticamente al duplicar algunas o todas las características de uno o más objetos
principales.
Evaluación de estructuras de Bases de datos
Una estructura de datos en red es más flexible que la estructura jerárquica en el respaldo de
bases de datos para muchos tipos de operaciones empresariales. Sin embargo, al igual que
la estructura jerárquica, debido a que sus relaciones deben especificarse con anterioridad, el
modelo de red no puede manejar con facilidad solicitudes ad hoc de información.
Las bases de datos relacionales permiten a un usuario final recibir fácilmente información
en respuesta a solicitudes ad hoc.
La principal limitación del modelo relacional consiste en que los sistemas de
administración de bases de datos que se basan en éste no pueden procesar grandes
cantidades de transacciones empresariales en forma tan rápida y eficiente como aquellos
que se basan en los modelos jerárquicos y de red, en los cuales se especifican con
anterioridad todas las relaciones de datos.
Acceso a Bases de Datos
Campo Clave
Todos los registros de datos usualmente contienen uno o más campos de identificación, o
claves, que identifican el registro de manera que pueda localizarse.
URL
Los archivos y las bases de datos en Internet y en las Intranets y Extranets corporativas
utilizan URL (Uniform Resource Locator, Localizador uniforme de recursos) para el acceso
a datos.
Acceso Secuencial
Este método utiliza una organización secuencial, en la cual los registros se almacenan
físicamente en un orden especificado de acuerdo con un campo clave en cada registro. El
acceso secuencial es rápido y eficiente cuando se trata de grandes volúmenes de datos que
requieren procesarse en forma periódica. Sin embargo, este tipo de acceso requiere que
todas las transacciones nuevas se clasifiquen en la secuencia apropiada para procesamiento
de acceso secuencial.
Este método es demasiado lento para manejar aplicaciones que requieren actualización o
respuestas inmediatas.
Página 8 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
Acceso Directo
En esta metodología, los registros no tienen que organizarse en una determinada secuencia
en los medios de almacenamiento. Sin embargo, el computador debe realizar un
seguimiento de la ubicación de almacenamiento de cada registro utilizando una variedad de
métodos de organización directa de manera que los datos puedan obtenerse cuando se
requieran. Los datos de nuevas transacciones no tienen que clasificarse, y el procesamiento
que requiere respuestas o actualización inmediatas se maneja con facilidad.
En el método de acceso secuencial indexado, los registros se almacenan en un orden
secuencial en un disco magnético u otro dispositivo de almacenamiento de acceso directo.
Además, cada base de datos contiene un índice que hace referencia a uno o más campos
claves de cada registro de datos con respecto a su dirección de ubicación de
almacenamiento. Así, un registro individual puede localizarse directamente utilizando sus
campos clave para buscar y localizar su dirección en el índice de la base de datos, tal como
pueden localizarse temas claves en el libro, buscando en el índice.
Desarrollo de bases de datos
El desarrollo de bases de datos puede comenzar con un proceso de planificación de datos
de arriba hacia abajo. Donde en primer lugar se definen los procesos empresariales básicos
de la organización. Luego se definen las necesidades de información de los usuarios finales
en un proceso empresarial, como el proceso de compra / recepción que tienen todas las
empresas.
A continuación, los usuarios finales deben identificar los elementos de datos clave que se
requieren para realizar sus actividades empresariales específicas. Con frecuencia, esto
comprende el desarrollo de diagramas de relación de entidades que diseñan las relaciones
entre las muchas entidades involucradas en los procesos empresariales.
Los datos aportados por los usuarios finales constituyen una parte importante de un proceso
de modelación de datos donde se identifican las relaciones entre elementos de datos. Cada
modelo de datos define las relaciones lógicas entre los elementos de datos que se requieren
para respaldar un proceso empresarial básico.
Estos modelos de datos actúan como estructuras lógicas (denominadas esquemas y
subesquemas) en las cuales se fundamenta el diseño físico de las bases de datos y el
desarrollo de programas de aplicaciones para respaldar los procesos empresariales de la
organización. Un esquema es una vista global lógica de las relaciones entre los elementos
de datos de una base de datos, mientras que el subesquema es una vista lógica de las
relaciones de datos que se requieren para respaldar programas de aplicaciones específicos
de usuarios finales que accederán esta base de datos.
Página 9 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Ctdor. Leonardo F. Gargiulo
El diseño físico de bases de datos adopta una vista física de los datos (que también recibe el
nombre de vista interna) que describe la manera como los datos se almacenarán físicamente
y se accederán en los dispositivos de almacenamiento de un sistema computacional.
Página 10 de 10
* Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)
Descargar