UNIDAD IV – ARCHIVOS Y BASES DE DATOS UNIDAD IV ARCHIVOS Y BASES DE DATOS INTRODUCCION ....................................................................................2 CONCEPTOS UTILIZADOS .........................................................2 OBJETIVOS DE DISEÑO .............................................................3 ARCHIVOS CONVENCIONALES Y BASES DE DATOS ......................4 PRIMER ENFOQUE .....................................................................4 SEGUNDO ENFOQUE .................................................................5 ARCHIVOS CONVENCIONALES ..........................................................6 CONCEPTO ..................................................................................6 CARACTERISTICAS ................................................................... 6 TIPOS ...........................................................................................6 FORMAS DE ORGANIZACION ...................................................7 BASES DE DATOS ................................................................................9 CONCEPTO ..................................................................................9 OBJETIVOS .................................................................................9 CARACTERISTICAS ...................................................................9 VENTAJAS ..................................................................................10 DESVENTAJAS ...........................................................................10 VISION LOGICA Y FISICA DE LA BASE DE DATOS ................10 ESTRUCTURA DE LA BASE DE DATOS ...................................11 TIPOS DE CONSULTAS A UNA BASE DE DATOS ...................14 BASE DE DATOS RELACIONALES PARA UN SISTEMA DE ADMINISTRACION DE RECURSOS HUMANOS .................................16 SISTEMA DE ADMINISTRACION DE BASE DE DATOS ( DBMS ) ....17 CONCEPTO .................................................................................17 OBJETIVOS .................................................................................17 CATEGORIAS ..............................................................................17 COMPONENTES ..........................................................................18 LA BASE DE DATOS Y LA EMPRESA .................................................19 CENTRALIZACION ......................................................................19 DESCENTRALIZACION ..............................................................20 LOS SISTEMAS DE INFORMACION ( SI ) LAS BASES DE DATOS ..21 EL CONCEPTO DE BASE DE DATOS SIGNIFICA CENTRALIZACION ? ..................................................................22 DESCENTRALIZACION A PARTIR DE LA BASE DE DATOS .........................................................................................22 SEGURIDAD Y PROTECCION ..............................................................24 ESTRATEGIAS DE PROTECCION .......................................................25 UNIDAD IV – ARCHIVOS Y BASES DE DATOS ARCHIVOS Y BASES DE DATOS INTRODUCCION: El almacenamiento y manejo de grandes cantidades de datos se hace necesario en cualquier empresa para el logro de sus objetivos. Por ejemplo se necesitan los datos de los empleados, de los clientes, de los productos almacenados. Normalmente la gestión de estos datos se ha venido realizando en forma manual, se organizaban en forma de fichas, informes o expedientes, colocándolos en carpetas y almacenando estas en un archivador. Por ejemplo si se tiene un archivo de clientes en el que cada ficha contiene todos los datos correspondientes a un cliente concreto será preciso realizar toda la operación manualmente. La utilización de las computadoras en la administración de las empresas ha supuesto una revolución respecto al almacenamiento y gestión de sus datos, dando lugar al uso de los denominados archivos informáticos y bases de datos. CONCEPTOS UTILIZADOS Antes de considerar el uso de los archivos o el enfoque de la base de datos es importante definir algunos conceptos tales como: Entidades : Una entidad es cualquier objeto o evento, acerca del cual se relevan datos. Una entidad puede ser una persona, un lugar, un objeto, un evento o una entidad de tiempo, por ejemplo un vendedor, una ciudad, un producto, la descompostura de una maquina, una venta, un mes o un año, un alumno de facultad. Relaciones : Son asociaciones entre entidades y pueden ser de diferentes tipos: El primer tipo de relación es uno a uno ( 1: 1) Por ejemplo para el empleado existe una oficina. 1:1 1:M Empleado 1 Se le asigna 1 Oficina Empleado 1 Pertene ce a M Departamento M:N Estudiante M Toma N Cursos El segundo tipo de relación es una asociación de uno a muchos ( 1: M) Por ejemplo a un médico le asignamos un paciente. Finalmente la relación de muchos a muchos (M : N) describe la posibilidad de que las entidades puedan tener numerosas asociaciones en cualquier dirección. Ejemplo: un estudiante puede tener muchos cursos, mientras que al mismo tiempo un curso puede tener muchos estudiantes. 2 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Atributos : Un atributo es una característica de una entidad y pueden haber muchos atributos para cada entidad. Por ejemplo: un paciente (entidad) puede tener numerosos atributos, tales como el apellido, nombre, dirección ciudad, estado, etc. Los datos pueden tener un valor, estos valores pueden ser de longitud fija o variable, pueden ser alfabéticos o numéricos o alfanuméricos. Registros Atributos Apellido Inicial Dirección Cuidad Estado Tarjeta Crédito Atributos Llave Registros : Un registro es una colección de datos elementales que tienen algo en común con la entidad descripta. Por ejemplo el registro de un estudiante (entidad) que contiene sus datos tales como LU, apellido, nombre, DNI, dirección, etc. Por ejemplo: el registro que vemos en el ejemplo anterior muestra un pedido colocado para una empresa de ventas por correspondencia. Son atributos el Nº de Orden, Apellido, Nombre, Dirección, Ciudad, estado, y Tarjeta de crédito. Llaves : Una llave es un dato elemental en un registro que se utiliza como criterio de identificación para este. Cuando una llave identifica de manera exclusiva a un registro se le denomina llave primaria (o criterio primario), por ejemplo el numero de L.U. de un estudiante. Una llave puede denominarse llave secundaria (o criterio secundario) si no identifica de manera exclusiva a un registro, si no que se utiliza para seleccionar a un grupo de registros que pertenecen a un conjunto. Por ejemplo apellidos de estudiantes que comienzan con la letra ¨C¨. Y cuando no es posible identificar de manera exclusiva a un registro utilizando uno de los elementos dato presentes en el registro, la llave puede construirse mediante la elección de dos o más elementos dato combinándolos entre sí; a este criterio se le denomina llave concatenada, por ejemplo buscar a un alumno del cual no se sabe su numero de libreta por el nombre y apellido. Metadatos : Los metadatos son datos acerca de los datos presentes en el archivo o en la base de datos, los metadatos describen la longitud y la composición de cada uno de los registros, por ejemplo el campo del numero de la libreta universitaria (LU) solo podrá contener números y su longitud será de 5 espacios. OBJETIVOS DE DISEÑO Cinco objetivos en el diseño del almacenamiento de datos: Disponibilidad de Datos Integración de Datos Actualización Recuperación Eficientes Almacenamiento Eficiente de Datos Recuperación Dirigida de la Información 3 UNIDAD IV – ARCHIVOS Y BASES DE DATOS ARCHIVOS CONVENCIONALES Y BASE DE DATOS En un sistema de información basado en computadoras se cuentan con 2 enfoques para el almacenamiento de datos. Primer Enfoque: consiste en almacenar los datos en archivos individuales exclusivos para una aplicación particular. Por ejemplo: una organización con diversos sistemas de información que utilizan archivos convencionales independientes: “Archivo de Ventas” que contiene información de datos históricos, “Actividades-Actuales” que se actualizan con frecuencia y “Archivo-Personal” que contiene las direcciones, los títulos y datos similares. ARCHIVO-VENTAS Num. Nombre 92 93 94 ACTIVIDAD-ACTUAL Num. Nombre Área 94 ARCHIVO- PERSONAL Nombre. Departamento. Nombre Dirección Teléfono Cont Salario Titulo Permanecen como una manera práctica de almacenar los datos, estos archivos se pueden diseñar y elaborar de manera rápida reduciendo los problemas de disponibilidad de datos y de seguridad. Cuando el diseño de los archivos se realiza de manera cuidadosa, todo la información necesaria queda incluida y se reduce el riesgo de omitir datos de manera accidental. Ventajas : • • Velocidad de Procesamiento para el uso de archivos. Existe posibilidad de elegir una técnica óptima para el procesamiento de los archivos de una sencilla aplicación. Desventajas: • • • • Falta de potencial para evolucionar. Su rediseño implica que los programas a los que accesan debe redactarse nuevamente. Implica un incremento del tiempo de programación para el archivo, para el desarrollo y mantenimiento del programa. La integración de los datos llega a convertirse en una causa de preocupación. 4 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Segundo Enfoque: involucra la elaboración de una Base de Datos. La figura siguiente muestra como los diferentes usuarios de diferentes departamentos dentro de una organización compartan la misma Base de Datos, teniendo acceso a diferentes grupos de datos. Grupo de datos 1 Base de datos Grupo de datos 2 Grupo de datos 3 Es una fuente central de datos significativos, compartidos por numerosos usuarios para diversas aplicaciones. La esencial de una Base de Datos es el sistema Administrador de la Base de Datos (DBMS) el cual permite la creación, modificación y actualización de la base de datos, la recuperación de datos y la emisión de reportes. El encargado de asegurar que la base de datos satisfaga los objetivos programados se denomina Administrador de Base de Datos. Objetivos : 1) Asegurar que los datos puedan ser compartidos por los usuarios para una variedad de aplicaciones 2) Que el mantenimiento de los datos sea precisa y consistente 3) Asegurar que todos los datos que se requieran para aplicaciones presentes y futuras estén siempre disponibles 4) Permitir que los usuarios desarrollen su propia visión de los datos. 5) Permitir que la base de datos evolucione y se adapte a las necesidades de los usuarios Ventajas : • • • • • Compartir los datos Apoya a que se mantenga la integridad de los datos Debe anticiparse a las necesidades. Diseño más flexible que los archivos separados Permite a los usuarios que expongan su punto de vista sobre los datos Desventajas: • Datos vulnerables • Acceso y actualización limitada • Intento de satisfacer objetivos de eficacia: • Costo de almacenamiento razonable • Reducción del tiempo. 5 UNIDAD IV – ARCHIVOS Y BASES DE DATOS ARCHIVOS CONVENCIONALES Concepto: Un archivo es una estructura de datos que reside en memoria secundaria, consistente en un conjunto de informaciones estructuradas en unidades de acceso denominadas registro, todos del mismo tipo y en un numero indeterminado. Los archivos tienen un uso muy amplio y existieron antes del desarrollo de las estructuras de base de datos. Características : Algunas de las principales características de esta estructura de datos son: • Residencia en soportes de información externos también denominados memorias secundarias o auxiliares como las cintas y discos. • Independencia respecto de los programas significa que la vida del archivo no esta limitada por la vida del programa que lo creo y también que en diferentes momentos pueden utilizar el mismo archivo diferentes programas. • Permanencia de las informaciones almacenadas es decir toda la información almacenada en la memoria central desaparece cuando se termina la ejecución del programa que la maneja, pero para hacer desaparecer un archivo será necesario realizar explícitamente una operación de borrado. Tipos de Archivos: Los archivos pueden utilizarse para almacenar datos por un periodo indefinido de tiempo o bien pueden utilizarse como almacenes temporales para un propósito particular, de allí que tenemos cinco tipos de archivos: Archivo Maestro Archivo de Tablas Archivo de Transacción Archivo de Trabajo Archivo de Impresión Archivo Maestro: Los archivos maestros contienen registros para un grupo de entidades, los atributos pueden actualizarse frecuentemente pero los registros en si, se mantienen permanentes. Por ejemplo en el caso de un sistema de aplicación que maneje la información de una universidad tendríamos como archivo maestro al que contiene la información de los alumnos, otro seria el de las carreras con sus respectivas materias y el de profesores y personal que trabaja en dicha institución. Archivos de Tablas: Un archivo de tabla contiene datos que se utilizan para calcular otros datos o parámetros de desempeño. Por ejemplo utilizando el caso citado anteriormente tendríamos como tabla las materias por año que puede cursar un alumno o el régimen de correlatividades. Archivo de transacción o de movimiento: En ellos se almacena la información que se utilizara para actualizar los archivos maestros y una vez realizado el proceso de actualización, estos pierden su validez y podemos deshacernos de ellos. Por ejemplo sin en el archivo de alumnos se necesitara agregar datos que antes este archivo no contenía entonces utilizaremos un archivo de transacción para volcar la información del archivo original en el de transacción y agregarle el nuevo dato requerido. Archivos de Trabajo: En ocasiones un programa resulta más eficiente si utiliza un archivo de trabajo. Por ejemplo si se desea una lista alfabética de los nombres de los estudiantes inscriptos en la cátedra X esto se hará por medio de un archivo de trabajo en el que se almacenara esa información a partir del archivo de estudiantes inscriptos (archivo maestro). Una vez realizado el trabajo este archivo podrá eliminarse. Archivo de Impresión: Cuando es necesario correr un programa pero se carece de una impresora en línea (o la impresora se encuentra ocupada imprimiendo otros reportes) se utiliza un archivo de impresión. El envío de la salida a un archivo en lugar de una impresora se llama SPOOLING, luego cuando el periférico se encuentra disponible, el documento puede imprimirse. Los archivos de impresión son muy útiles 6 UNIDAD IV – ARCHIVOS Y BASES DE DATOS porque los usuarios pueden tomarlos para llevarlos a otros sistemas de computo e imprimirlos en dispositivos especiales, tales como graficadores, impresoras, hacer unidades de microfilmación, etc. Formas de Organización: Al diseñar un archivo se pueden elegir entre diferentes maneras de organizar sus registros, ello nos va a permitir guardar información de una manera determinada y poder acceder a ella de manera más eficiente. Las principales formas de organización son: Organización Secuencial Organización Directa o Aleatoria Organización Secuencial Indexada Organización Secuencial: Cuando los registros se encuentran ordenados físicamente en un archivo, se dice que tal archivo es un archivo secuencial. Cuando se actualiza un archivo de este tipo es necesario accederlo de manera completa, ya que los registros no pueden insertarse en la parte intermedia del archivo, es decir, para actualizarlos es preciso crear nuevos archivos donde se copian los registros que vayan a permanecer, modificados o no, junto con los nuevos. Los archivos secuenciales se utilizan cuando lo requiere el hardware (por ejemplo una cinta magnética es un archivo secuencial) o cuando el acceso normal requiere que se acceda a la mayoría de los registros, en otras palabras cuando necesitemos leer o actualizar solo unos cuantos registros, será ineficiente utilizar un archivo secuencial, pero cuando se necesiten leer o modificar numerosos registros tendría mayor sentido una organización secuencial. Características: • • Los registros ocupan posiciones consecutivas de memoria. Solo se puede acceder a ellos de uno en uno a partir del primero. Desventajas: • • • Hay que agrupar las transacciones por lotes y ordenarlas en la misma secuencia que el archivo. Las altas y las bajas requieren volver a grabar el archivo. No se pueden hacer operaciones de escritura cuando se esta leyendo, ni operaciones de lectura cuando se esta escribiendo. • • • Empleo eficiente del almacenamiento. Es fácil programar el acceso a los registros. Es independiente del dispositivo. Ventajas: Ejemplo: Podría ser el caso del archivo de alumnos el cual se encontrara ordenado por numero de libreta universitaria. La cual será asignada de manera secuencial a cada alumno al momento de inscripción. Organización de Acceso Directo, Directa o Aleatoria: En un archivo con esta organización, también denominada relativa, las informaciones se colocan y se acceden aleatoriamente mediante su posición, es decir, indicando el lugar relativo que ocupan dentro del conjunto de posiciones posibles. Características: • • Los registros no quedan forzosamente en orden secuencial, sino que se distribuyen a todo lo largo del área de almacenamiento. Esta organización sólo permite dispositivos de acceso directo. 7 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Ventajas: • • • Se pueden leer y escribir registros, en cualquier orden y en cualquier lugar. Rapidez de acceso a un registro cualquiera, ya que para ello no es preciso pasar por los anteriores. Puede manejar con eficiencia grandes cantidades de transacciones desordenadas. Desventajas: • • Puede desaprovecharse parte del espacio destinado al archivo, ya que pueden quedar huecos libres entre unos registros y otros. La eficiencia del almacenamiento queda reducida. Ejemplo: Podría ser el caso del archivo donde se encuentran almacenada las materias que cursa cada alumno de la facultad esta información no esta ordenada secuencialmente sino que depende de cómo se realizo la inscripción de los alumnos a las materias que cursaran. Organización Secuencial Indexada: Un archivo con esta organización consta de tres áreas: • • • Un área de índices Un área de primaria o área de datos Un área de excedentes o overflow El área primaria contendrá los registros de datos clasificados en orden ascendente por su campo clave. El área de índices es un archivo secuencial creado por el sistema, en el que cada registro establece una división (segmento) en el área primaria y contiene la dirección de comienzo del segmento y la clave mas alta del mismo, de esta manera el sistema accede de forma directa a un segmento del área primaria a partir del área de índices, de forma similar a la búsqueda de un capitulo de un libro a partir de su índice. Por ultimo se reserva un espacio llamado área de excedente, para añadir nuevos registros que no pueden ser colocados en el área primaria cuando se produce una actualización del archivo. Características: • • Los registros se almacenan secuencialmente pero el archivo además tiene un índice. Esta organización sólo admite dispositivos de acceso directo. Ventajas: • • Rápido acceso por medio de la clave de registro Se pueden procesar normalmente transacciones ordenadas y desordenadas. • El sistema se encarga de relacionar la posición de cada registro con su contenido por medio del área de índices. Desventajas: • Necesidad de espacio adicional para el área de índices y el desaprovechamiento de espacio que resultan de quedar huecos intermedios libres después de sucesivas actualizaciones. Las transacciones desordenadas tienden a reducir la eficiencia del proceso. Ejemplo: Si al archivo de las materias que cursa cada alumno le agregáramos un índice que permita ordenarlo por numero de libreta universitaria y otro que permita ordenarlo por materia, entonces podríamos buscar información referente a que materia cursa cada alumno y que cantidad de alumnos cursa cada materia. 8 UNIDAD IV – ARCHIVOS Y BASES DE DATOS BASE DE DATOS Concepto: Las bases de datos no son meramente una colección de archivos. Mas bien, una base de datos es una fuente central de datos significativos, los cuales son compartidos por numerosos usuarios para diversas aplicaciones. Es un gran archivo donde se enlazan, interrelacionan y controlan todos los datos por medio de un producto de software especial encargado de su administración. La parte medular de la base de datos es el sistema de manejo o administrador que permite la creación, modificación, actualización, recuperación y la generación de reportes. En un ambiente de bases de datos los sistemas de aplicación (programas del usuario) delegan a programas independientes, incluidos dentro del producto DBMS ( o sea fuera del control del programador ) la tarea de administrar el manejo de datos y su historial. Objetivos : • • • • • Asegurar que los datos puedan ser compartidos por los usuarios, para una variedad de aplicaciones. Que el mantenimiento de los datos sea preciso y consistente. Asegurar que los datos requeridos para las aplicaciones presentes y futuras se encuentren siempre disponibles. Permitir que la base de datos evolucione y se adapte a las necesidades crecientes de los usuarios. Permitir que los usuarios desarrollen su propia visión de los datos, sin preocuparse por la manera en que los datos se encuentren almacenados físicamente. Características: NO REPETICION DE DATOS: La base de datos debe estar compuesta por elementos que no sean redundantes. Constituye así una colección de información interrelacionada, sin repeticiones, lo que permite la consistencia de la información. PRIVACIDAD Y SEGURIDAD: Los administradores de la base de datos normalmente vienen provistos de programas especiales para brindar seguridad respecto al acceso a los datos, o sea mantener la privacidad de la información. También proveen seguridad en el servicio, es decir que los datos están protegidos contra las fallas de equipos y programas que procesan los datos. INDEPENDENCIA DE LOS DATOS: La administración de los datos es independiente de los programas que los utilizan, de modo que se los puede modificar sin cambiar los programas existentes para manejarlos. ORDENAMIENTO Y BUSQUEDA DE DATOS: Dentro de las bases de datos existe un criterio de ordenamiento para los datos que la componen. De esta forma se organiza la administración de la información y se facilita el acceso a cualquier dato especifico. De los objetivos se advierten las ventajas y desventajas de la base de datos: Ventajas: • • Al compartir los datos, significa que estos deben almacenarse por los menos una sola vez. Esto a su vez apoya que se mantenga la integridad de los datos, ya que el cambio de los mismos se realizara de manera más sencilla y confiable si estos aparecen una vez y no en varios archivos. Los datos tendrán mayor probabilidad de encontrarse disponibles en una base de datos mas que un sistema de archivos convencionales. 9 UNIDAD IV – ARCHIVOS Y BASES DE DATOS • • Una base de datos llega a ser más flexible que dos archivos separados, esto significa que una base de datos llega a evolucionar conforme se modifican las necesidades de los usuarios y de sus aplicaciones. Permite que los usuarios expongan sus puntos de vista sobre los datos, sin necesidad de preocuparse de la estructura presente de la base de datos o de su ubicación física. Desventajas: • • • • Todos los datos se almacenan en un solo lugar por lo cual son más vulnerables a accidentes y requieren de un respaldo completo. Existe el riesgo de que quien administra la base de datos se convierta en el único privilegiado o habilitado para estar cerca de los datos. Una base de datos no puede optimizar la recuperación de los datos para una aplicación en especial ya que debe compartirse con numerosos usuarios y con varias aplicaciones. Puede significar un alto costo pues se puede llegar a requerir de cierto software adicional para el administrador de base de datos, ocasionalmente también se necesitara una computadora de mayor capacidad. VISIÓN LÓGICA Y FÍSICA DE LOS DATOS Una base de datos, a diferencia de un archivo, está hecha para que sea compartida por muchos usuarios. Es claro que cada usuario ve los datos en forma diferente. Nos referimos a la forma en que un usuario concibe y describe los datos desde una presentación de usuario. Sin embargo el problema es que usuarios diferentes tienen enfoques diferentes. Estas presentaciones se examinan en el modelo lógico global de la base de datos, que eventualmente deberá desarrollarse. Finalmente, el modelo lógico de la base de datos debe transformarse en el correspondiente diseño físico de la base de datos. El diseño físico considera la forma del almacenamiento de los datos y de sus interrelaciones, así como la mecánica del acceso. En el siguiente ejemplo se muestran como se relacionan el reporte del usuario y la presentación del usuario a un modelo lógico (esquema conceptual) y a un diseño físico (esquema interno). Reporte del Usuario (salida tabular, gráficas,etc Presentación del usuario o esquema del usuario (descripción de las necesidades de ) Esquema conceptual (modelo de diseño lógico de la base de datos) 10 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Estructuras de las Bases de Datos: El modelo de la base de batos hace referencia a la estructura que se utiliza para expresar las relaciones existentes entre las diferentes unidades de datos que la constituyen. De entre las varias posibilidades útiles para ello son tres las estructuras que se han afianzado y están actualmente en uso. ESTRUCTURA JERARQUICA ESTRUCTURA EN RED ESTRUCTURA RELACIONAL Estructura Jerárquica: En este tipo de estructura los registros de datos se organizan en escalones o niveles. Si deseamos obtener por ejemplo el tercer escalón, primero habrá que identificar el correspondiente registro padre o propietario en el segundo escalón, el cual a su vez será identificado por la elección de determinado apuntador a partir del escalón primero. Las estructuras jerárquicas en ocasiones se denominan árboles porque los subordinados conectados a las entidades a las cuales pertenecen se asemejan a las ramas de un árbol, pero dibujadas al revés. Implican que una entidad no puede tener más de una entidad propia. Esto es, una estructura hecha de varias asociaciones 1:M o 1:1, otras asociaciones tales como M:1 o M:N no se permiten. Las estructuras jerárquicas en ocasiones se denominan árboles porque los subordinados conectados a las entidades a las cuales pertenecen semejan las ramas de un árbol, aunque curiosamente dibujadas hacia abajo. La recuperación de datos en una estructura jerárquica se realiza con base en las ramificaciones Ejemplo: Si consideramos el ejemplo utilizado en el desarrollo de los archivos y lo aplicamos a la base de datos, tendríamos una estructura jerárquica definida de la siguiente manera, cada Curso tiene como subordinado a las materias que se dictan en el mismo, de la misma manera cada materia tendrá como subordinado a los alumnos que cursan dicha materia. El problema de este tipo de estructura es el subordinamiento que existe entre cada entidad, ya que al estar subordinada a otra, para modificarla hay que modificar la que encuentra en el nivel superior. Lo mismo ocurre con las consultas. Cursos Materias Alumnos ENTIDAD ENTIDAD ENTIDAD ENTIDAD ENTIDAD ENTIDAD ENTIDAD ENTIDAD ENTIDAD 11 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Estructura en Red: Una estructura en reticular permite que cualquier entidad cuente con cualquier numero de subordinados o superiores. Las entidades se conectan mediante el uso de enlaces de red los cuales son datos comunes a ambas entidades conectadas. Es una variante de la jerárquica. Alivia un poco los problemas de la estructura jerárquica pero no los soluciona completamente. Ejemplo: utilizando el ejemplo anterior si la estructura fuera en red, utilizaremos el curso como enlace, que permite conectar a los Alumnos con las materias. Esto permitirá realizar modificaciones, consultas en cualquier entidad sin tener que recurrir a la entidad superior. Además la entidad aparece una sola vez. Estructura Relacional: Esta estructura relaciona distintas tablas. Esta estructura es mucho más flexible que las anteriores. En lugar de tener una sola tabla con muchos datos tengo muchas tablas relacionadas con pocos datos en cada una de ellas y una ventaja que puede brindar esto es que los datos que poseen dos tablas pueden obtener otra información distinta combinándolas. Esta estructura es más eficiente que las anteriores. Una estructura relacional consiste en una o más tablas bidimensionales, las cuales se refieren como relaciones. Los renglones de las tablas representan los registros y las columnas contienen los atributos. Es bastante simple el mantenimiento de las tablas de una estructura al compararlo con el mantenimiento de una jerárquica o de red. Una de las ventajas principales es que las consultas específicas se manejan de una manera muy eficiente Ejemplo: En este caso no tendríamos una sola tabla sino tres, una que contenga los datos de los alumnos y otra que contenga las materias que se dictan en cada año y por ultimo una tabla que contenga datos referidos a que materia esta cursando cada alumno y en que año (curso) se encuentra. Este tipo de estructura permite un fácil mantenimiento de las tablas en comparación con las anteriores. Las consultas especificas se manejan de manera más eficiente. Base de Datos Relacional En el caso de una estructura de base de dato relacional, los usuarios pueden tomar archivos, seleccionar en ellos los campos y crear un archivo, que podrán almacenar entonces. Pueden hacer esas asociaciones fácilmente sin ser abrumados por la programación. En esencia, los datos son presentados en tablas bidimensionales. La decisión de recurrir a una base de datos relacional es elegir entre el poder de la computadora o el del ser humano. Naturaleza de una “relación” Las características de la relación deben cumplir con ciertas condiciones para que la computadora efectué las operaciones sobre ella. Dado que los matemáticos fueron quienes establecieron dichas condiciones, se ha acuñado una jerga profesional para definir una relación. Nosotros describiremos su naturaleza en un lenguaje más común, pero a riesgo de omitir algunos aspectos o elementos. El desarrollo de una relación comienza con el punto de vista del usuario. Dicha perspectiva es una representación lógica de los datos que se requieren para tomar una decisión o contestar una pregunta del usuario. Por ejemplo, hay que establecer una relación de datos de pago, si queremos calcular los cheques de la nómina semanal o evaluar el empleo de las horas extras. Formación de nuevas relaciones La base de datos relacional (RDB) se ajusta a condiciones matemáticas muy precisas. El usuario no se limita simplemente a buscar las relaciones iniciales guardadas en ellas. Pueden construir fácilmente nuevas relaciones al seleccionar las de un menú desplegado en el monitor, después puede escoger en el menú algunas operaciones realizadas en ellas. Sólo se necesita tres operaciones en el método relacional algebraico; 12 UNIDAD IV – ARCHIVOS Y BASES DE DATOS • • • La operación de “unir” se limita a combinar dos relaciones para formar otra. Únicamente dos relaciones pueden combinarse a la vez, apareando los atributos seleccionados en cada una de las relaciones. La operación “proyección” nos permite seleccionar cualquier conjunto de atributos, a partir de una relación establecida. La operación “seleccionar” nos permite escoger un registro individual entre los que integran una relación. Pasos para la recuperación y presentación de datos 1) Elección de una relación a partir de la base de datos: una manera adecuada para realizarlo es contar con un directorio de las presentaciones de los usuarios como una ayuda a la memoria. 2) Unión de dos relaciones: ésta operación tiene como propósito tomar dos relaciones y unificarlas en una relación más amplia. Para enlazar dos relaciones éstas deben compartir por lo menos un atributo. 3) Proyección de columnas a partir de la relación: es el proceso de elaboración de pequeñas relaciones, eligiendo solo los atributos relevantes de una relación existente, es decir la proyección es la extracción de ciertas columnas a partir de una tabla relacional. 4) Selección de renglones de la relación: es similar a la proyección, pero en lugar de extraer columnas se extraen renglones. La selección crea una nueva relación (más pequeña) al extraer registros que contienen un atributo que satisface cierta condición. 5) Generación de nuevos atributos: implica un manejo de los datos existentes junto con ciertos parámetros relacionales para derivar nuevos datos. Para ésta relación se crean nuevas columnas. 6) Indexación u ordenación de renglones: para poder localizar de una manera rápida los elementos de una lista, o poder agrupar y obtener subtotales de una manera más sencilla, se requieren los datos en cierto orden. Las dos opciones disponibles para ordenar los datos son: indexar (es la ordenación de manera lógica de los renglones de una relación con base en un determinado criterio) y ordenar (es el arreglo secuencial de una relación). 7) Cálculo de totales y otros parámetros: una vez que el subconjunto apropiado de datos a quedado definido se ordenan de la manera requerida los renglones de la elación, se pueden calcular los totales u otros parámetros del desempeño. 8) Presentación de los datos: es el paso final en la recuperación de los datos. La presentación de los datos obtenidos de la base de datos puede tomar numerosas formas. En ocasiones, los datos pueden presentarse en una forma tabular, a veces en gráficas y en otras, con una respuesta en pantalla por medio de una palabra sencilla. 13 UNIDAD IV – ARCHIVOS Y BASES DE DATOS TIPOS DE CONSULTAS A UNA BASE DE DATOS Las consultas son las preguntas que se plantean con referencia a la Base de Datos. Consulta de Tipo 1: En el primer tipo de consulta se proporciona la entidad y uno de sus atributos. El propósito de la consulta es encontrar el valor correspondiente. Por ejemplo: ¿Qué ingresos tuvo el empleado número102 en el año 1992? Nº Empleado Nombre- Empl. Departamento 100 101 102 103 Vargas Flores Cazón Lopez Año 90 Finanzas 54100 Ventas 44700 Compras 48040 Administración 21380 Respuesta: 54200 Año 91 Año 92 78000 24910 36200 25500 52900 42300 54200 49200 Consulta de tipo 2: encuentra las entidades que satisfacen un valor específico para un atributo particular. Qué empleado(s ) obtuvo ingresos superiores a $ 50000 en el año 1992? Nº Empleado Nombre- Empl. Departamento Año 90 Año 91 Año 92 100 101 102 103 Vargas Flores Cazón Lopez 54100 44700 48040 21380 78000 24910 36200 25500 52900 42300 54200 49200 Finanzas Ventas Compras Administración Respuesta: 100, 102 Consulta de tipo 3: localiza los atributos cuando se proporciona la entidad y el valor. Esta consulta es útil cuando se tienen numerosos atributos similares que cuentan con una misma propiedad. ¿En que año el empleado número 103 obtuvo ingresos superiores a $ 50000? Nº Empleado Nombre- Empl. Departamento Año 90 Año 91 Año 92 100 101 102 103 Vargas Flores Cazón Lopez 54100 44700 48040 21380 78000 24910 36200 25500 52900 42300 54200 49200 Finanzas Ventas Compras Administración Respuesta: Año92 Consulta de tipo 4: Es similar a la consulta 1. La diferencia está en que se desean valores de todos los atributos. Por ejemplo: Enumere todo el detalle para el empleado 102 14 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Nº Empleado Nombre- Empl. Departamento Año 90 Año 91 Año 92 100 101 102 103 Vargas Flores Cazón Lopez 54100 44700 48040 21380 78000 24910 36200 25500 52900 42300 54200 49200 Finanzas Ventas Compras Administración Respuesta: Cazón , Compras , 48040, 36200, 54200 Consulta de tipo 5: Es una consulta global, pero tiene una forma similar a la consulta de tipo 2. Enlista todas las entidades que satisfacen un valor para todos los atributos descritos. Enliste todos los empleados cuyos ingresos excedieron los $50000 en cualquiera de los años Nº Empleado Nombre- Empl. Departamento Año 90 Año 91 Año 92 100 101 102 103 Vargas Flores Cazón Lopez 54100 44700 48040 21380 78000 24910 36200 25500 52900 42300 54200 49200 Finanzas Ventas Compras Administración Respuesta: 101, 102 Consulta de tipo 6: Similar a la consulta de tipo 3. La diferencia está en que este tipo de consulta solicita una lista de atributos para todas las entidades, en lugar de una entidad en particular. Por ejemplo: Enliste todos los años, en los cuales los ingresos de todos los empleados superan los $30000 Nº Empleado Nombre- Empl. Departamento Año 90 Año 91 Año 92 100 101 102 103 Vargas Flores Cazón Lopez 54100 44700 48040 21380 78000 24910 36200 25500 52900 42300 54200 49200 Finanzas Ventas Compras Administración Respuesta: Año 91, Año 92 15 UNIDAD IV – ARCHIVOS Y BASES DE DATOS BASE DE DATOS RELACIONAL PARA UN SISTEMA DE ADMINISTRACIÓN DE RECURSOS HUMANOS Una de las tareas más difíciles al crear una base de datos relacional es que la gerencia identifique las relaciones. Cada relación deberá componerse de un grupo reducido de atributos afines, de manera que sea esencialmente independiente de las otras en la base de datos. Por otra parte, hay que incorporar los atributos a la relación para que se junten las relaciones deseadas. La construcción de un conjunto de relaciones requiere un conocimiento cabal de las técnicas de diseño de la base de datos. La gerencia debe establecer primero la información que requiere la compañía. Una vez preparada una lista completa de puntos, entran en acción los especialistas en la base de datos. Deciden qué información debe conservarse y la que debe obtener a partir de aquélla. • • • • • • • • • • • • • • • • • • • • • • • Sueldo anteriores Experiencia laboral Habilidades del empleado Habilidades del puesto Supervisor del trabajo Datos de promoción Datos de separación Escolaridad Antecedentes educacionales en la compañía Antecedentes profesionales Promocionabilidad del rendimiento del empleado Número de retraso y de falta Aportaciones voluntarias del empleado Interés preferente del empleado Pertenencia al sindicato Datos de localización del empleado Datos de paro laboral Datos de terminación del empleo Datos de seguridad laboral y de accidentes Puesto Puestos abiertos Datos de reclutamiento Datos de historia del reclutamiento Con una completa base de datos relacional, los gerentes pueden elaborar nuevos tipos de informes como los que indican a continuación; Escolaridad promedio de los compañeros de trabajo Número de oportunidad de trabajo en el componente Porcentaje de empleados que terminan su empleo Frecuencia de accidentes y tasas de gravedad para el puesto Frecuencia relativa de cambios de trabajo en el componente Años de experiencia del supervisor o gerente Selección o aceptación del empleado por el gerente actual Frecuencia relativa de acción disciplina por parte del gerente o supervisor Tendencia del gerente o supervisor a hacer una evaluación rigurosa, o condescendiente de los empleados Cantidad de horas extras trabajadas en el componente Porcentaje de empleado insatisfecho con el trabajo, el sueldo, el supervisor y otro aspecto del componente. 16 UNIDAD IV – ARCHIVOS Y BASES DE DATOS SISTEMA DE ADMINISTRACION DE BASES DE DATOS (DBMS) Concepto: Un sistema de administración de la base de datos (DBMS) es cualquier sistema basado en la computadora que defina, cree, recupere, actualice, revise y mantenga la integridad de los mismos – Dr. Gordon C. Everest (Universidad de Minnesota) El sistema de administración de la base de datos es un paquete de software que ayuda al usuario en la gestión de una base de datos computarizada – Compañías que venden software y hardware. Utilizaremos una definición más amplia, en ella el sistema consta de siete COMPONENTES BASICOS (Dr. Everest ) : • • • • • • • El administrador de la base de datos quien es responsable del esquema de la base de datos. El esquema, que describe la naturaleza de las relaciones lógicas y físicas existentes entre los registros de la base de datos. El programa de administrador de datos, que crea todos los registros físicos en la base de datos y que controla todas las actividades posteriores de entrada y salida de ella. Los programas de consulta - lenguaje que permiten a los gerentes formular preguntas y recibir respuestas al consultar la base de datos en el lenguaje ordinario. La base de datos, que contiene los registros físicos. El programador, que sirve de interfaz con el usuario para el sistema de la base de datos. Los programas de la base de datos, de los cuales se sirve el programador para obtener información de los datos contenidos en ella. • Se trata de ¨ programas de aplicación ¨ dirigidos a la base de datos. Objetivos Los objetivos esenciales del sistema son: • • • • • • • Dar acceso inmediato a las ultimas transacciones relacionadas con el sistema de información Eliminar la redundancia al estructurar datos adecuados a todas las aplicaciones. Permitir múltiples actualizaciones y recuperaciones de carácter concurrentes. Crear un sistema que ofrezca un crecimiento progresivo al agregar datos y programas. Ofrecer una descripción de la base de datos no vinculada a ningún lenguaje en particular. Reducir el mantenimiento de los programas de aplicación y suministrar un mantenimiento en línea de la base de datos. Brindar protección en contra del uso no autorizado y la violación de la confidencialidad de los archivos especificados. Categorías de los DBMS • • • para grandes servidores de datos para pequeños servidores de datos para bases de datos personales Por las funciones Administradores de la estructura : manejan donde y como se guardan los datos Ms Works Excel 17 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Disponibilidad de herramientas para acceder y manipular los datos, proveen lenguajes de programación para acceder a los datos. Dbase - Paradox Foxpro - Access Clipper Disponibilidad de herramientas para administrar la integridad de los datos, aseguran la consistencia de la información, evitan la repetición, resguardan reglas semánticas de la base de datos. oracle Sybase Informix ibm db2 Progress Componentes: Programa administrador de los datos: Las interacciones de entrada - salida en un ambiente de bases de datos son demasiados complejas para que el individuo las controle o por lo menos llegue a controlarlas. Así, otro constituyente fundamental del sistema de administración de la base de datos es el PROGRAMA ADMINISTRADOR DE DATOS. Este controlara el acceso a la base de datos y la salida de ella. Por lo regular, constituye el núcleo del sistema de la base de datos y es proporcionado, por el fabricante o un distribuidor de software como parte del sistema total. Administrador de la base de datos: Una parte importantísima del sistema total de administración de la base de datos es una persona (grupo) y no el software. A esa persona se le llama Administrador de la base de datos, desempeña un papel muy semejante al del contador. Es decir, especifica las relaciones exactas entre los registros, clasificando y colocando los tipos de registros conforme a reglas previamente fijadas. Por la misma naturaleza de las relaciones entre registros, el administrador puede lograr que el sistema de la base de datos se ajuste lo más posible a las exigencias de la empresa. Por formar parte del sistema global, el administrador de la base de datos debe estandarizar, organizar, resolver y estar al tanto de los conflictos entre los usuarios. A continuación se enumeran las FUNCIONES que realiza: Funciones: • • • • • • • • Colaborar con el gerente del sistema de información administrativa para seleccionar los datos que deben guardarse en la base de datos. Determinar los excedentes que existen en el intercambio entre datos y programas. Publica un directorio de las propuestas de estructura de datos para analizarlos con los posibles usuarios. Publica diccionarios de datos que contienen información básica sobre la información guardada en la base datos (definición de campos, formato, reglas de edición, consideraciones de seguridad, etc.) Establece con los usuarios las variaciones especificas de la base de datos. Determina metidos generales para la recuperación y una biblioteca de programas de acceso a la base de datos. Mantiene la base de datos, su integridad y totalidad. Obtiene y asigna llaves individuales, tomando medidas de seguridad y vigilando por si se presentan infracciones. La alianza entre el administrador de la base de datos y el contador es decisiva en las futuras actividades de la empresa. Sus funciones en ella están totalmente interrelacionadas y se parecen muchísimo por lo que respecta a funciones y responsabilidades. En virtud de sus papeles en la organización de los datos, ambos constituyen una importante fuente de información que ayuda a los gerentes en la toma de decisiones. 18 UNIDAD IV – ARCHIVOS Y BASES DE DATOS LA BASE DE DATOS Y LA EMPRESA Antes con los sistemas manuales, los datos se guardaban en diversos tipos de archivos físicos como los archiveros. En esos archivos había una enorme duplicación de datos. Dicha redundancia se vio reducida con la aparición del software y hardware. La base de datos puede considerarse hoy conceptualmente como una colección prescindiendo de la dispersión o configuración física del equipo, es decir, el sistema informático podría poner casi instantáneamente a disposición de los gerentes cualquier información de la base de datos. A la gerencia le interesa el rendimiento y la economía en el desarrollo de una base de datos. Debe comprobar las respuestas, en función de los costos, a preguntas como las siguientes: ¿Cuáles y cuantos datos deben almacenarse? ¿Cuánto tiempo deben permanecer en la base de datos? ¿Qué rapidez se desea que tenga la recuperación de los datos y en que forma debe realizarse? ¿Qué equipo software deben seleccionarse? ¿Cómo debe la compañía organizar la administración de los recursos de datos? ¿Cómo debe la información sacarse de la base de datos guardada en maquinas? A su vez, existen tres razones por las cuales una empresa puede considerar beneficiosa a la base de datos. Por la disciplina que implica en el proceso de definición de las colecciones de datos. Porque permite una visión global única del conjunto de datos de una empresa. Porque facilita la estructuración del Sistema de información. Es importante notar el papel central que juega la base de datos dentro de una empresa porque se supone que cualquier referencia a datos, responsabilidad del Sistema de información, pasa por ella, ya sea para almacenarlos la primera vez o para consultarlos, modificarlos o anularlos posteriormente. En consecuencia, también es importante que los responsables directos de las distintas funciones y procesos de negocios de la empresa se involucren activamente en el diseño de la base de datos. Si no lo hacen una vez construida la base de datos puede ocurrir como de hecho sucede a menudo, que determinados accesos a datos no puedan llevarse a cabo tan fácilmente como seria de desear. Centralización: Si existe cierto grado de centralización en la concepción de los Sistemas de Información la base de datos se convierte en un grado central y neurálgico de los mismos: Hay quienes consideran a esto negativo por que implica la centralización del Sistema de Información y esta no puede ser la organización mas adecuada para el mismo en el contexto de infraestructura de la empresa. En cambio otros opinan que una estructura centralizada del Sistema de Información es no solo poco nociva, sino incluso recomendada ya que contribuye a visualizar el conjunto de datos como un todo perteneciente a la empresa, no a determinados departamentos, y que debe, por lo tanto, diseñarse, administrarse y usarse desde un punto de vista global. En no pocas empresas el diseño de la estructura de la base de datos permitió que los distintos responsables de funciones y procesos de negocios se den cuenta que los datos que precisaban para sus actividades de gestión, y aparentemente no estaban disponibles en la empresa, eran hechos utilizados rutinariamente por otros responsables vecinos a quienes nunca se les había ocurrido que sus datos pudieran ser relevantes para sus colegas. En definitiva, podemos decir que el aire centralizador que introduce el concepto de base de datos no es pernicioso (dañoso o perjudicial) sino más bien todo lo contrario. 19 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Descentralización: La aplicación de los ordenadores personales y de herramientas basadas en los mismos ha traído consigo la posibilidad de que algunos usuarios de Sistema de Información en empresas empezaran a desarrollar sus propias soluciones basadas en la informática, algunos de ellos fueron mas allá de la simple utilización de esas herramientas y desarrollaron de hecho las suyas propias. Se trata entonces de una innovación en el terreno de los Sistemas de Información. Y en consecuencia de una cierta descentralización del sistema de información hecha posible por un nuevo paso evolutivo en el desarrollo de las Tecnologías informáticas para descentralizar el Sistema de Información debe juzgarse desde la perspectiva del Sistema de información, es decir, no solo porque la tecnología lo permite debe considerarse adecuado. La construcción de herramientas personales es lógica y contribuye eficazmente a resolver problemas en actividades de toma de decisiones, pero también existen decisiones que precisan utilizar datos contenidos en la base de datos central en sus propios procesos de calculo y análisis, por ello la propia estructura física y de funcionamiento de los componentes de la Tecnología Informática, permite que un servidor (un ordenador) de servicio a una serie de clientes (otros ordenadores) conectados con aquel, facilitándoles sobre todo acceso a los datos comunes y ocupándose de dicho acceso sea eficiente y se produzca sin errores. Así, simple mente conectando herramientas personales a la base de datos central, algo técnicamente resuelto, pueden dar solución a este tipo necesidades de descentralización, sin renunciar a la perspectiva global que proporciona el concepto de base de datos. El papel de la base de datos como puerta de entrada de las soluciones de tipo personal al Sistema de Información básico es evidente. Ello no impide, además que cada usuario tenga su propia colección de datos local independiente de la base de datos si lo cree conveniente. 20 UNIDAD IV – ARCHIVOS Y BASES DE DATOS LOS SISTEMAS DE INFORMACION Y LAS BASES DE DATOS Una de las aportaciones mas positivas que para los SI ha traído la informática es el concepto de Base de Datos (BD), por lo que supone de disciplina en la organización de los datos de una empresa, y también por lo que supone conceptual- mente como conjunto organizado según las necesidades de cada caso. Llegar al actual concepto de BD no ha sido fácil ni rápido, y los detalles del mismo caen fuera del contexto de este libro. Resumiendo mucho, el concepto BD lleva la idea de: • • • • Agrupar todos los datos relevantes para el SI de una empresa en un único lugar – la BD. Evitando redundancias – es decir, evitando tener el mismo dato registrado mas de una vez, lo que a la larga provoca siempre inconsistencias. Estructurándolos de una única manera – que debe reflejar su estructura «natural», es decir, la que interesa ver desde la perspectiva de SI – incluso a lo largo del tiempo, y Proporcionando acceso a los mismos a través de lenguajes lo más «naturales» posible y basados en la estructura anterior – es decir, que para acceder a un dato baste con saber cosas del propio dato, no otras como donde esta archivado en un momento determinado. Este concepto de BD ha sido beneficioso para los SI al menos por tres razones: • • • Ha exigido disciplina en el proceso de definición de las colecciones de datos necesarias en la operación del Sl, lo cual resulta casi siempre en una depuración importante de los datos que se manejan; Ha incorporado una visión global única del conjunto de datos de una empresa, en cuyo diseño los distintos departamentos de la empresa deben alcanzar consenso, y Como consecuencia de lo anterior ha facilitado la estructuración del SI alrededor precisamente de la BD, lo cual tiene mucho sentido desde la perspectiva de SI. Incorporando el concepto de BD, el esquema queda como se representa en la Figura de abajo. 21 UNIDAD IV – ARCHIVOS Y BASES DE DATOS Es importante notar el papel central que juega la BD en el nuevo esquema, donde se supone que cualquier referencia a datos responsabilidad del SI pasa por ella, ya sea para almacenarlos la primera vez o para consultarlos, modificarlos o anularlos posteriormente. La implicación más importante de la Figura de la página anterior, desde un punto de vista conceptual, es que el diseño de la BD. – su estructura sobre todo – es de importancia capital en el diseño de un SI. En consecuencia, es importante que los responsables directos de las distintas funciones y procesos de negocio de la empresa se involucren activamente en el diseño de la BD. Si no lo hacen, una vez construida la BD puede ocurrir, como de hecho sucede a menudo, que determinados accesos a datos no puedan llevarse a cabo tan fácilmente como seria de desear. EL CONCEPTO DE BASE DE DATOS SIGNIFICA CENTRALIZACION ? Otra consecuencia es un cierto grado de centralización en la concepción de los Sl, ya que la BD se convierte en un grado central y neurálgico de los mismos. Hay quien considera esto negativo porque implica la centralización del SI, siendo así que esta puede no ser la organización mas adecuada para el mismo en el contexto de infraestructura de la empresa. Aunque cierto aire de centralización es innegable en la nombrada Figura, en nuestra opinión el mismo hace referencia a aspectos donde una estructura centralizada del SI es no sólo poco nociva, sino incluso recomendable. En efecto, dicha estructura contribuye a visualizar el conjunto de datos como un todo perteneciente a la empresa – no a determinados departamentos –, que debe, por tanto, diseñarse, administrarse y usarse desde un punto de vista global. En no pocas empresas el diseño de la estructura de la BD ha desencadenado un proceso en el que distintos responsables de funciones y procesos de negocio se han dado cuenta que datos que precisaban para sus actividades de gestión y que aparentemente no estaban disponibles en la empresa eran de hecho utilizados rutinariamente por otros responsables vecinos a quienes nunca se les había ocurrido que “sus” datos pudieran ser relevantes para sus colegas. En definitiva, pensamos que el aire centralizador que introduce el concepto de BD no es pernicioso, sino más bien todo lo contrario. Además, como veremos enseguida, si se desea descentralizar determinados aspectos del SI básico puede hacerse precisamente con la ayuda del concepto de BO. DESCENTRALIZACION A PARTIR DE LA BD La aparición de los ordenadores personales (PCs) y de herramientas basadas en los mismos (en particular hojas de calculo y pequeños sistemas de BD) ha traído consigo la posibilidad de que algunos usuarios de SI en empresas empezaran a desarrollar «sus propias soluciones basadas en la informática», algunos de ellos incluso yendo mas allá de la simple utilización de esas herramientas, construyéndose de hecho las suyas propias. Se trata, pues, de una innovación en el terreno de los SI (una cierta «descentralización del Sl») hecha posible por un nuevo paso evolutivo en el desarrollo de las TI (la aparición de los PCs y herramientas afines). Como siempre, la conveniencia de utilizar las TI para descentralizar el SI debe juzgarse desde la perspectiva del SI; es decir, no solo porque la tecnología 1o permite debe juzgarse adecuado. Con todo, como veremos mas adelante, la construcción de «herramientas personales» es lógica y contribuye eficazmente a resolver problemas en actividades de toma de decisiones. Con frecuencia, además, la utilización de herramientas de este tipo requiere el acceso a datos pertenecientes a la BD de la empresa en el sentido del apartado anterior. Pensemos, por ejemplo, en datos históricos de ventas que pueden ser útiles para confeccionar previsiones, o para analizar el comportamiento de determinados productos en respuesta a ciertas acciones comerciales, etc. Es decir, 22 UNIDAD IV – ARCHIVOS Y BASES DE DATOS existen decisiones que precisan utilizar datos contenidos en la BD «central» en sus propios procesos de calculo y análisis. Desarrollos tecnológicos relativamente recientes, sobre todo los relaciona- dos con la denominada «arquitectura cliente-servidor» han venido conveniente- mente a facilitar la implantación de este tipo de soluciones. En efecto, dichos desarrollos permiten llevar a cabo, de manera eficiente, la implantación de es- quemas de funcionamiento muy en línea con lo sugerido en el párrafo anterior. De hecho, la propia estructura física y de funcionamiento de los componentes de TI utilizados en tal «arquitectura clienteservidor» reproduce el modelo esbozado en el párrafo anterior: un «servidor» (un ordenador) da servicio a una serie de «clientes» (otros ordenadores) conectados con aquel, facilitándoles sobre todo acceso a los datos comunes y ocupándose de que dicho acceso sea eficiente y se produzca sin errores. De este modo, una solución técnica ha venido a dar respuesta a una necesidad de SI que el concepto de base de datos había inicial- mente facilitado. Así, simplemente conectando herramientas personales a la BD central, algo técnicamente resuelto como acaba uno de ver, puede darse solución a este tipo de necesidades de descentralización, sin renunciar a la perspectiva global que proporciona el concepto de BD. EL papel de la BD como puerta de entrada de las soluciones de tipo personal al SI básico es evidente. Ello no impide, además, que cada usuario tenga su propia colección de datos local independiente de la BD central si lo cree conveniente. En este caso, sin embargo, las colecciones de datos deben considerarse circunscritas al ámbito de cada usuario, y no verlas como partes de la BD del SI básico; es decir, no es conveniente basar tratamientos de alcance para toda la empresa en dichas colecciones, ya que ello Serra fuente casi segura de inconsistencias. Finalmente es interesante notar que utilizando tecnología de telecomunicaciones los «usuarios descentralizados» pueden ser también remotos. Así, pues, de la mano de la informática y las telecomunicaciones puede llegarse al esquema de funcionamiento, que de manera natural expande el esquema inicial. La gestión de archivos se ha mostrado insuficiente para cubrir todas las necesidades de almacenamiento y proceso de datos en la actualidad. Los sistemas de información de las empresas son cada vez más grandes y complejos, y su gestión mediante el uso de archivos presenta algunos inconvenientes, como el hecho de que los datos estén repartidos por distintos departamentos de la empresa, lo que supone tener que desplazarse o solicitarlos cada vez que se necesiten en un lugar diferente de donde se generan, además pueden estar repetidos varias veces, con el inconveniente de que su actualización dará lugar a inconsistencias si no se realiza en todos los lugares en que se ubican. Los sistemas de bases de datos pretenden dar solución a los problemas expuestos mediante la integración de los archivos, de su estructura y de las aplicaciones que los manejan. 23 UNIDAD IV – ARCHIVOS Y BASES DE DATOS SEGURIDAD Y PROTECCION La información almacenada puede llegar a tener una gran importancia y la perdida o destrucción de la misma podría suponer un desastre para sus propietarios. Por ello, será preciso establecer determinadas medidas de seguridad y control que minimicen o anulen ese riesgo. Asimismo, habrá que determinar otras protecciones que garanticen la privacidad y confidencialidad de los datos, con el fin de que estos no puedan ser utilizados con otros propósitos diferentes de los usos correctos para los que se han creado. Definiciones de seguridad y protección: La seguridad de la información significa proteger los datos en contra de: • • • Destrucción accidental o modificación por fuerzas de la naturaleza (como inundaciones, incendio o relámpagos) y del hombre. Destrucción intencional o por modificación de personas sin autorización Divulgación accidental o intencional a personas no autorizadas. La privacidad significa que las organizaciones o personas tienen el derecho a limitar la difusión de información relativas a ellas. Riesgo de Sistema: La seguridad de la base de datos esta expuesta a numerosos riesgos. Riesgo Accidentales: Algunos usuarios, empleados o extraños accidentalmente encuentran una abertura que hace accesible el sistema o su base de datos. En ocasiones a esas aberturas se les da el nombre de trampas. Una falla imprevista viene a anular una medida de seguridad que protege el sistema contra cualquier intromisión. Un error en la aplicación del sistema de comunicación divulga información indebidamente. Una falla imprevista revela la presencia de mecanismo decisivos de protección (conocimiento del sistema de protección) Riesgos Pasivos: Captación electromagnética de las radiaciones del sistema, por ejemplo la que ocurre en la transmisión de microondas. Interceptación del subsistema de comunicación de transmisión mediante alambre o cable coaxial (interceptación de comunicaciones) Exposición de datos decisivos del sistema a personas no autorizadas. Amenazas Activas: Los empleados, usuarios y operadores de computadoras pueden curiosear en archivos de los sistemas y descubrir datos no autorizados. Consiguiendo códigos de acceso un empleado o extraño finge ser un usuario autorizado Ejemplo: un desconocido experto en sistema llama al centro de computación y pide que se use un código de entrada. Mas tarde utiliza ese código como identificación. (existen varias formas de conseguir un código) • • • • • Entrada entre líneas: un intruso utiliza el sistema cuando el usuario se encuentra en el sistema pero inactivo. Personal experto en computación que se corrompe. Búsqueda activa de entradas a través de trampas. Datos adquiridos desde la memoria: Ejemplo cuando después de una corrida de programa, puede quedar información en la memoria (a menos que la elimine un programa especial). Esa información puede ser confidencial y estar al alcance de cualquier usuario. En manos de un programador hábil el sistema puede servir para descubrir sus propias debilidades. 24 UNIDAD IV – ARCHIVOS Y BASES DE DATOS ESTRATEGIAS DE PROTECCION Clark WEISSMAN, ha logrado identificar cuatro estrategias eficaces de protección que se emplean en el mundo moderno: AISLAR: La protección se logra aislando el objeto valioso y controlando el acceso a él. Ejemplos bancos, bóvedas, fortalezas, etc. CONFUNDIR: La protección se consigue mediante el aislamiento (pero sin controlar el acceso), basado en la ofuscación. Los objetos de valor se ocultan al quitarlos de la vista o por camuflaje para dificultar la búsqueda. El mejor ejemplo es la criptografía. DISUADIR: La disuasión protege al hacer poco rentable el hurto. Es fundamental la ecuación utilidad perdida (ganancia / riesgo). Cuando la ganancia es alta y el riesgo es escaso, la disuasión no da resultado y se alienta al robo. Para disuadir al transgresor, el riesgo o castigo han de ser grande y siempre deben de ser visibles. Esta estrategia la aplican las normas de seguridad del departamento de defensa, así como las leyes contra espionaje militar e industrial. COMPRAR SEGUROS: La protección asume la forma de un seguro. Por ser escaso la probabilidad de perder, es una buena inversión protegerse contra la perdida conjeturando que la perdida si se producirá, si acierta el dueño gana la apuesta que generalmente es suficiente para compensar los objetos de valor que se perdieran. Si la perdida no ocurre nunca, lo cual suele ser lo más probable, los premios pequeños cuestan menos que otras clases de protección o sustitución. DELEGAR: La protección se logra delegando la responsabilidad de la misma a otra persona o grupo, como los fideicomisos bancarios y las agencias que reciben objetos en custodia. 25