Ctdor. Leonardo F. Gargiulo Visión Gerencial: Administración de bases de datos * Administración de bases de datos: Administración de recursos de datos Introducción La mayoría de las organizaciones no podrían sobrevivir o tener éxito sin datos de calidad sobre sus operaciones internas y entorno externo. Por esto, las organizaciones y sus gerentes necesitan practicar la administración de recursos de datos, una actividad gerencial que aplica tecnologías de sistemas de información como administración de bases de datos, con el fin de satisfacer las necesidades de información de sus usuarios empresariales. Conceptos de datos básicos Carácter: el elemento de dato lógico más básico es el carácter, que se compone de un solo símbolo alfabético, numérico u otro símbolo. Campo: el siguiente nivel de datos más alto es el campo, o elemento de datos. Un campo se compone de una agrupación de caracteres. Por ejemplo, la agrupación de caracteres alfabéticos en el nombre de una persona conforma el campo del nombre, y la agrupación de números en un monto de ventas forma el campo del monto de ventas. Específicamente, un campo de datos representa un atributo (una característica o calidad) de alguna entidad (objeto, persona, lugar o evento). Registro: los campos relacionados de datos se agrupan para formar un registro. Por tanto, un registro representa un conjunto de atributos que describen una entidad. Los registros de longitud fija contienen un número fijo de campos de datos de longitud fija. En cambio, los registros de longitud variable contienen un número variable de campos y longitudes de campo. Archivo: un grupo de registros relacionados es un archivo de datos, o tabla. Los archivos se clasifican según la aplicación para la cual se utilizan principalmente, como un archivo de nómina o un archivo de inventario, o el tipo de datos que éstos incluyen, como un archivo de documentos o un archivo de imágenes gráficas. Los archivos también se clasifican por su permanencia, por ejemplo, archivo maestro versus archivo de transacciones. Un archivo de transacciones incluiría registros de todas las transacciones que ocurren durante un período y podría utilizarse periódicamente para actualizar los registros permanentes que se incluyen en un archivo maestro. Un archivo histórico es un archivo maestro o de transacciones obsoleto que se conserva con el propósito de respaldo o para almacenamiento histórico a largo plazo, que recibe el nombre de almacenamiento de archivos. Página 1 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo Base de datos: una base de datos es un conjunto integrado de registros u objetos relacionados en forma lógica. Un objeto se compone de valores de datos que describen los atributos de una entidad, además de las operaciones que pueden ejecutarse en los datos. El enfoque de administración de bases de datos El enfoque de administración de bases de datos consolida los registros de datos y objetos en bases de datos que pueden accederse a través de diferentes programas de aplicación. Un paquete de software importante denominado sistema de administración de bases de datos (DBMS –Database Management System) actúa como interfaz de software entre usuarios y bases de datos. Esto les permite a los usuarios acceder fácilmente a los registros en una base de datos. De esta forma, la administración de bases de datos comprende el uso de software de administración de bases de datos, con el fin de controlar la creación, la consulta y el mantenimiento de las bases de datos para proporcionar la información que necesitan los usuarios finales y sus organizaciones. El enfoque de bases de datos comprende tres actividades básicas: 1. Actualización y mantenimiento de bases de datos comunes para reflejar nuevas transacciones empresariales y otros eventos que requieren cambios con respecto a los registros de una organización. 2. Suministro de la información necesaria para la aplicación de c/usuario final utilizando programas de aplicación que comparten los datos en bases de datos comunes. 3. Suministro de una capacidad de consulta / respuesta y de elaboración de informes a través de un paquete DBMS, de manera que los usuarios finales puedan consultar fácilmente bases de datos, generar informes y recibir respuestas rápidas a sus solicitudes ad hoc de información. Usar software de administración de bases de datos Un sistema de administración de bases de datos (DBMS –Database Management System-) es un conjunto de programas computacionales que controla la creación, el mantenimiento y el uso de las bases de datos de una organización y sus usuarios finales. Desarrollo de bases de datos Los paquetes de administración de bases de datos como Microsoft Access o Lotus Approach permiten que los usuarios finales desarrollen con facilidad las bases de datos que requieren. Sin embargo, las grandes organizaciones con sistemas cliente / servidor o basados en mainframes generalmente ponen el control del desarrollo de sus bases de datos en el ámbito empresarial en manos de administradores de bases de datos (DBA, Database Administrators) y otros especialistas en bases de datos. Página 2 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo El diccionario de datos: constituye la herramienta de administración de bases de datos. Un diccionario de datos es un catálogo o directorio computacional que contiene metadatos, es decir, datos sobre datos. Los diccionarios de datos pueden ser consultados por el administrador de bases de datos para informar sobre el estado de cualquier aspecto de los metadatos de una empresa. Posteriormente, el administrador puede realizar cambios a las definiciones de los elementos de datos seleccionados. Consulta de bases de datos La capacidad de consulta de bases de datos es un beneficio importante de un sistema de administración de bases de datos. Los usuarios finales pueden utilizar un DBMS al solicitar información de una base de datos utilizando un lenguaje de consulta o un generador de informes. La característica de lenguaje de consulta permite obtener con facilidad respuestas inmediatas a solicitudes de datos ad hoc. La característica de generador de informes permite especificar con rapidez un formato de informes para la información que usted desea que se presente como tal. Mantenimiento de bases de datos Las bases de datos de una organización requieren actualizarse continuamente para reflejar las nuevas transacciones comerciales y demás eventos. También deben realizarse otros cambios para garantizar la exactitud de los datos en las bases de datos. Este proceso de mantenimiento de bases de datos se logra mediante programas de procesamiento de transacciones y otros paquetes de aplicaciones para usuarios finales, con el soporte del DBMS. Tipos de bases de datos Bases de datos operacionales: almacenan datos detallados que se requieren para respaldar las operaciones de toda la organización. También se denominan bases de datos de áreas supeditadas (SADB –Subject Area Databases), bases de datos de transacciones y bases de datos de producción. Algunos ejemplos son una base de datos de clientes, de personal, de inventario y otras bases de datos que contienen datos generados por operaciones empresariales. Bases de datos analíticas (o gerenciales o de información o multidimensionales): almacenan datos e información que se extrae de bases de datos operacionales y externas seleccionadas. Éstas se componen de los datos y la información resumida que más necesitan los gerentes de una organización y otros usuarios finales. Bodegas de datos: almacena datos del año en curso y de años anteriores, que han sido extraídos de las diversas bases de datos operacionales de una organización. Ésta es una fuente central de datos que ha sido seleccionada, editada, estandarizada e integrada, de manera que los gerentes y otros profesionales que son usuarios Página 3 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo finales puedan utilizarla para una variedad de formas de análisis empresarial, investigación de mercado y respaldo a las decisiones. Las bodegas de datos pueden subdividirse en plazas de datos, que contienen subconjuntos específicos de datos provenientes de la bodega de datos. Un uso importante, es la extracción de datos, que consiste en que los datos de una bodega de datos se procesan con el fin de identificar factores y tendencias claves en patrones históricos de la actividad empresarial. Esto puede utilizarse para ayudar a los gerentes en la toma de decisiones sobre cambios estratégicos en operaciones empresariales para obtener ventajas competitivas en el mercado. Bases de datos distribuidas: muchas organizaciones reproducen y distribuyen copias o partes de bases de datos a servidores de red localizados en una variedad de sitios. Estas bases de datos distribuidas pueden residir en servidores de red en la World Wide Web, en intranets o extranets corporativas o en otras redes de la empresa. Las bases de datos distribuidas pueden ser copias de bases de datos operaciones o analíticas, bases de datos hipermedia o de discusión o cualquier otro tipo de base de datos. La reproducción y distribución de bases de datos se realiza con el fin de mejorar el desempeño y la seguridad de la base de datos. Garantizar que todos los datos en las bases de datos distribuidas de una organización se actualicen constantemente y al mismo tiempo constituyen un desafío importante de la administración de bases de datos distruibuidas. Bases de datos de usuarios finales: Estas bases de datos se componen de una variedad de archivos de datos desarrollados por usuarios finales en sus estaciones de trabajo. Por ejemplo, los usuarios pueden contar con sus propias copias electrónicas de documentos que bajan de la World Wide Web, que generan con paquetes de procesamiento de palabras o que reciben por correo electrónico. O pueden tener sus propios archivos de datos que se generan a partir del uso de paquetes DBMS o de hojas de cálculo. Bases de datos externas: El acceso a una abundante información en bases de datos externas está disponible en los servicios comerciales en línea mediante el pago de una cuota de ingreso, y también con o sin costo en las muchas fuentes en Internet, especialmente la World Wide Web. Los sitios web proporcionan una variedad infinita de páginas hiperenlazadas de documentos multimedia en bases de datos hipermedia para que el usuario pueda accederlas. Los datos se encuentran disponibles en la forma de estadísticas sobre actividad económica y demográfica de los bancos de datos estadísticos. O se puede visualizar o bajar resúmenes o copias completas de cientos de periódicos, revistas, boletines o cualquier otro material publicado, y otras publicaciones periódicas de bases de datos bibliográficas y de texto completo. Bases de datos hipermedia en la web Página 4 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo Debido a que gran parte de la información que pasa a través de Internet es multimedia, las empresas necesitan bases de datos que puedan almacenar, recuperar y manejar otros tipos de datos, particularmente documentos, video y sonido. Un sitio web almacena esta información en una base de datos hipermedia que se compone de una home page y otras páginas hiperenlazadas de multimedia o medios combinados (texto, imágenes gráficas y fotografías, etc). Es decir, desde el punto de vista de la administración de bases de datos, el conjunto de páginas multimedia interconectadas en un sitio web constituye una base de datos de páginas hipermedia interrelacionadas, en vez de registros de datos interrelacionados. Consideraciones generales para la administración de recursos de datos Los usuarios finales gerenciales deberían considerar los datos como un recurso importante que deben aprender a manejar en forma apropiada, con el fin de garantizar el éxito y la supervivencia de sus organizaciones. La administración de bases de datos es una aplicación importante de la tecnología de sistemas de información para la administración de los recursos de datos de una empresa. Sin embargo, se requieren otros esfuerzos principales de administración de recursos de datos, con el fin de compensar algunos de los problemas que pueden resultar del uso de un enfoque de administración de bases de datos. Éstos son: 1) Manejo de bases de datos: incluye responsabilidad por el desarrollo y mantenimiento del diccionario de datos de la organización, diseño y supervisión del desempeño de las bases de datos y el cumplimiento de estándares para uso y seguridad de la base de datos. 2) Planeación de datos: incluye la responsabilidad por el desarrollo de una arquitectura global de datos para los recursos de datos de la empresa, que concuerda con la misión y los planes estratégicos de la empresa y los objetivos y procesos de sus unidades de negocios. La planeación de datos se lleva a acabo por las organizaciones que han realizado un compromiso formal con la planeación a largo plazo para el uso y la administración estratégica de los recursos de datos. 3) Manejo de datos: comprende el establecimiento y el cumplimiento de políticas y procedimientos para manejar los datos como un recurso corporativo estratégico. Esto implica el manejo de la recolección, el almacenamiento y la diseminación de todos los tipos de datos en una forma tal que éstos se conviertan en un recurso estandarizado a disposición de todos los usuarios finales en la organización. El punto central del manejo de datos es el control de datos en apoyo de las funciones empresariales y de los objetivos empresariales estratégicos de una organización. El manejo de datos también puede incluir responsabilidad por el desarrollo de políticas y la fijación de estándares para el diseño, procesamiento y medidas de seguridad de las bases de datos Página 5 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo corporativas, y por la selección de software de diccionario de datos y de administración de bases de datos. Beneficios y limitaciones de la administración de bases de datos Beneficios Reduce la duplicación de datos y los integra de manera que puedan ser accedidos por múltiples programas y usuarios. Los programas no dependen del formato de los datos y del tipo de hardware de almacenamiento secundario que se esté utilizando. A los usuarios se les proporciona una capacidad de consulta / respuesta y de elaboración de informes que les permiten obtener con facilidad la información que requieren, sin tener que escribir programas computacionales. La programación computacional se simplifica. La integridad y seguridad de los datos almacenados en bases de datos pueden incrementarse, ya que el acceso a los mismos y la modificación de la base de datos se controlan mediante el software de sistemas de administración de bases de datos, un diccionario de datos y una función de administrador de bases de datos Limitaciones (se originan por el incremento de su complejidad tecnológica) El desarrollo de grandes bases de datos de tipos complejos de datos y la instalación de un DBMS pueden ser difíciles y costosos. Se requiere más capacidad de hardware, ya que los requerimientos de almacenamiento de datos, de datos de control superior y de programas DBMS de la organización son mayores. Los tiempos de procesamiento más largos pueden ser el resultado de aplicaciones de procesamiento de transacciones de alto volumen, ya que existe una capa adicional de software (el DBMS) entro los programas de aplicación y el sistema operativo. Si una organización depende de bases de datos centralizadas, se incrementa su vulnerabilidad a errores, fraude y fallas. Problemas de inconsistencia de datos si se utiliza un enfoque de base de datos distribuida. Página 6 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo Estructuras de Bases de datos Las relaciones entre los muchos registros individuales almacenados en bases de datos se basan en varias estructuras lógicas de datos, o modelos. Las cinco estructuras de bases de datos fundamentales son: 1) Estructura jerárquica: en la cual las relaciones entre registros forman una jerarquía con una estructura similar a un árbol. En el modelo jerárquico tradicional todos los registros dependen y se ordenan en estructuras de múltiples niveles, que se componen de un registro raíz y cualquier número de niveles subordinados. Así, todas las relaciones entre registros son del tipo uno a muchos, ya que cada elemento de datos se relaciona sólo con un elemento que se encuentra por encima de éste. El elemento de datos o registro que está en el nivel más alto de la jerarquía recibe el nombre de elemento raíz. Cualquier elemento de datos puede accederse al moverse progresivamente hacia abajo desde una raíz y a lo largo de las ramas del árbol hasta localiza el registro deseado. 2) Estructura de red: Esta estructura permite relaciones del tipo muchos a muchos entre registros, es decir, el modelo de red puede acceder a un elemento de datos siguiendo una de varias trayectorias, ya que cualquier elemento o registro de datos puede relacionarse con cualquier número de otros elementos de datos. 3) Estructura relacional: (es la forma más popular) en este modelo se considera que todos los elementos datos dentro de la base de datos están almacenados en forma de tablas simples. Los paquetes de sistemas de administración de bases de datos que se basan en el modelo relacional pueden enlazar elementos de datos de diversas tablas para proporcionar información a los usuarios. 4) Estructura multidimensional: es una variación del modelo relacional, que utiliza estructuras multidimensionales para organizar datos y expresar las relaciones entre datos. Se puede visualizar este tipo de estructuras como cubos de datos y cubos dentro de cubos de datos. Cada cara del cubo se considera una dimensión de los datos. Un beneficio importante de las bases de datos multidimensionales es que constituyen una manera compacta y fácil de comprender, para visualizar y manipular elementos de datos que tiene muchas interrelaciones. Por tanto, las bases de datos multidimensionales se han convertido en la estructura de base de datos más popular para las bases de datos analíticas. 5) Estructura orientada a objetos: Un objeto se compone de valores de datos que describen los atributos de una entidad, más las operaciones que pueden ejecutarse en los datos. Esta capacidad de encapsulamiento permite al modelo orientado a objetos manejar en mejor forma tipos más complejos de datos (voz, gráficos, texto, etc.), en relación con otras estructuras de bases de datos. El modelo orientado a objetos también respalda la herencia; es decir, pueden crearse objetos Página 7 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo automáticamente al duplicar algunas o todas las características de uno o más objetos principales. Evaluación de estructuras de Bases de datos Una estructura de datos en red es más flexible que la estructura jerárquica en el respaldo de bases de datos para muchos tipos de operaciones empresariales. Sin embargo, al igual que la estructura jerárquica, debido a que sus relaciones deben especificarse con anterioridad, el modelo de red no puede manejar con facilidad solicitudes ad hoc de información. Las bases de datos relacionales permiten a un usuario final recibir fácilmente información en respuesta a solicitudes ad hoc. La principal limitación del modelo relacional consiste en que los sistemas de administración de bases de datos que se basan en éste no pueden procesar grandes cantidades de transacciones empresariales en forma tan rápida y eficiente como aquellos que se basan en los modelos jerárquicos y de red, en los cuales se especifican con anterioridad todas las relaciones de datos. Acceso a Bases de Datos Campo Clave Todos los registros de datos usualmente contienen uno o más campos de identificación, o claves, que identifican el registro de manera que pueda localizarse. URL Los archivos y las bases de datos en Internet y en las Intranets y Extranets corporativas utilizan URL (Uniform Resource Locator, Localizador uniforme de recursos) para el acceso a datos. Acceso Secuencial Este método utiliza una organización secuencial, en la cual los registros se almacenan físicamente en un orden especificado de acuerdo con un campo clave en cada registro. El acceso secuencial es rápido y eficiente cuando se trata de grandes volúmenes de datos que requieren procesarse en forma periódica. Sin embargo, este tipo de acceso requiere que todas las transacciones nuevas se clasifiquen en la secuencia apropiada para procesamiento de acceso secuencial. Este método es demasiado lento para manejar aplicaciones que requieren actualización o respuestas inmediatas. Página 8 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo Acceso Directo En esta metodología, los registros no tienen que organizarse en una determinada secuencia en los medios de almacenamiento. Sin embargo, el computador debe realizar un seguimiento de la ubicación de almacenamiento de cada registro utilizando una variedad de métodos de organización directa de manera que los datos puedan obtenerse cuando se requieran. Los datos de nuevas transacciones no tienen que clasificarse, y el procesamiento que requiere respuestas o actualización inmediatas se maneja con facilidad. En el método de acceso secuencial indexado, los registros se almacenan en un orden secuencial en un disco magnético u otro dispositivo de almacenamiento de acceso directo. Además, cada base de datos contiene un índice que hace referencia a uno o más campos claves de cada registro de datos con respecto a su dirección de ubicación de almacenamiento. Así, un registro individual puede localizarse directamente utilizando sus campos clave para buscar y localizar su dirección en el índice de la base de datos, tal como pueden localizarse temas claves en el libro, buscando en el índice. Desarrollo de bases de datos El desarrollo de bases de datos puede comenzar con un proceso de planificación de datos de arriba hacia abajo. Donde en primer lugar se definen los procesos empresariales básicos de la organización. Luego se definen las necesidades de información de los usuarios finales en un proceso empresarial, como el proceso de compra / recepción que tienen todas las empresas. A continuación, los usuarios finales deben identificar los elementos de datos clave que se requieren para realizar sus actividades empresariales específicas. Con frecuencia, esto comprende el desarrollo de diagramas de relación de entidades que diseñan las relaciones entre las muchas entidades involucradas en los procesos empresariales. Los datos aportados por los usuarios finales constituyen una parte importante de un proceso de modelación de datos donde se identifican las relaciones entre elementos de datos. Cada modelo de datos define las relaciones lógicas entre los elementos de datos que se requieren para respaldar un proceso empresarial básico. Estos modelos de datos actúan como estructuras lógicas (denominadas esquemas y subesquemas) en las cuales se fundamenta el diseño físico de las bases de datos y el desarrollo de programas de aplicaciones para respaldar los procesos empresariales de la organización. Un esquema es una vista global lógica de las relaciones entre los elementos de datos de una base de datos, mientras que el subesquema es una vista lógica de las relaciones de datos que se requieren para respaldar programas de aplicaciones específicos de usuarios finales que accederán esta base de datos. Página 9 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001) Ctdor. Leonardo F. Gargiulo El diseño físico de bases de datos adopta una vista física de los datos (que también recibe el nombre de vista interna) que describe la manera como los datos se almacenarán físicamente y se accederán en los dispositivos de almacenamiento de un sistema computacional. Página 10 de 10 * Resumen del Libro “Sistemas de Información Gerencial” de James O´Brien, Ed. Mc Graw Hill (2001)