algunos conceptos - Facultad de Ciencias Económicas

Anuncio
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
UNIDAD IV
ARCHIVOS Y BASES DE DATOS
INTRODUCCION ....................................................................................2
CONCEPTOS UTILIZADOS .........................................................2
OBJETIVOS DE DISEÑO .............................................................3
ARCHIVOS CONVENCIONALES Y BASES DE DATOS ......................4
PRIMER ENFOQUE .....................................................................4
SEGUNDO ENFOQUE .................................................................5
ARCHIVOS CONVENCIONALES ..........................................................6
CONCEPTO ..................................................................................6
CARACTERISTICAS ................................................................... 6
TIPOS ...........................................................................................6
FORMAS DE ORGANIZACION ...................................................7
BASES DE DATOS ................................................................................9
CONCEPTO ..................................................................................9
OBJETIVOS .................................................................................9
CARACTERISTICAS ...................................................................9
VENTAJAS ..................................................................................10
DESVENTAJAS ...........................................................................10
VISION LOGICA Y FISICA DE LA BASE DE DATOS ................10
ESTRUCTURA DE LA BASE DE DATOS ...................................11
TIPOS DE CONSULTAS A UNA BASE DE DATOS ...................14
BASE DE DATOS RELACIONALES PARA UN SISTEMA DE
ADMINISTRACION DE RECURSOS HUMANOS .................................16
SISTEMA DE ADMINISTRACION DE BASE DE DATOS ( DBMS ) ....17
CONCEPTO .................................................................................17
OBJETIVOS .................................................................................17
CATEGORIAS ..............................................................................17
COMPONENTES ..........................................................................18
LA BASE DE DATOS Y LA EMPRESA .................................................19
CENTRALIZACION ......................................................................19
DESCENTRALIZACION ..............................................................20
LOS SISTEMAS DE INFORMACION ( SI ) LAS BASES DE DATOS ..21
EL CONCEPTO DE BASE DE DATOS SIGNIFICA
CENTRALIZACION ? ..................................................................22
DESCENTRALIZACION A PARTIR DE LA BASE DE
DATOS .........................................................................................22
SEGURIDAD Y PROTECCION ..............................................................24
ESTRATEGIAS DE PROTECCION .......................................................25
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
ARCHIVOS Y BASES DE DATOS
INTRODUCCION:
El almacenamiento y manejo de grandes cantidades de datos se hace necesario en
cualquier empresa para el logro de sus objetivos. Por ejemplo se necesitan los datos
de los empleados, de los clientes, de los productos almacenados.
Normalmente la gestión de estos datos se ha venido realizando en forma manual, se
organizaban en forma de fichas, informes o expedientes, colocándolos en carpetas y
almacenando estas en un archivador. Por ejemplo si se tiene un archivo de clientes en
el que cada ficha contiene todos los datos correspondientes a un cliente concreto será
preciso realizar toda la operación manualmente.
La utilización de las computadoras en la administración de las empresas ha supuesto
una revolución respecto al almacenamiento y gestión de sus datos, dando lugar al uso
de los denominados archivos informáticos y bases de datos.
CONCEPTOS UTILIZADOS
Antes de considerar el uso de los archivos o el enfoque de la base de datos es
importante definir algunos conceptos tales como:
Entidades : Una entidad es cualquier objeto o evento, acerca del cual se relevan
datos. Una entidad puede ser una persona, un lugar, un objeto, un evento o una
entidad de tiempo, por ejemplo un vendedor, una ciudad, un producto, la
descompostura de una maquina, una venta, un mes o un año, un alumno de facultad.
Relaciones : Son asociaciones entre entidades y pueden ser de diferentes tipos:
El primer tipo de relación es uno a uno ( 1: 1) Por ejemplo para el empleado existe una
oficina.
1:1
1:M
Empleado
1
Se le
asigna
1
Oficina
Empleado
1
Pertene
ce a
M
Departamento
M:N
Estudiante
M
Toma
N
Cursos
El segundo tipo de relación es una asociación de uno a muchos ( 1: M) Por ejemplo a
un médico le asignamos un paciente.
Finalmente la relación de muchos a muchos (M : N) describe la posibilidad de que las
entidades puedan tener numerosas asociaciones en cualquier dirección. Ejemplo: un
estudiante puede tener muchos cursos, mientras que al mismo tiempo un curso puede
tener muchos estudiantes.
2
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Atributos : Un atributo es una característica de una entidad y pueden haber muchos
atributos para cada entidad. Por ejemplo: un paciente (entidad) puede tener
numerosos atributos, tales como el apellido, nombre, dirección ciudad, estado, etc.
Los datos pueden tener un valor, estos valores pueden ser de longitud fija o variable,
pueden ser alfabéticos o numéricos o alfanuméricos.
Registros
Atributos Apellido
Inicial
Dirección
Cuidad
Estado
Tarjeta Crédito
Atributos
Llave
Registros : Un registro es una colección de datos elementales que tienen algo en
común con la entidad descripta. Por ejemplo el registro de un estudiante (entidad) que
contiene sus datos tales como LU, apellido, nombre, DNI, dirección, etc.
Por ejemplo: el registro que vemos en el ejemplo anterior muestra un pedido colocado
para una empresa de ventas por correspondencia. Son atributos el Nº de Orden,
Apellido, Nombre, Dirección, Ciudad, estado, y Tarjeta de crédito.
Llaves : Una llave es un dato elemental en un registro que se utiliza como criterio de
identificación para este. Cuando una llave identifica de manera exclusiva a un registro
se le denomina llave primaria (o criterio primario), por ejemplo el numero de L.U. de un
estudiante. Una llave puede denominarse llave secundaria (o criterio secundario) si no
identifica de manera exclusiva a un registro, si no que se utiliza para seleccionar a un
grupo de registros que pertenecen a un conjunto. Por ejemplo apellidos de estudiantes
que comienzan con la letra ¨C¨.
Y cuando no es posible identificar de manera exclusiva a un registro utilizando uno de
los elementos dato presentes en el registro, la llave puede construirse mediante la
elección de dos o más elementos dato combinándolos entre sí; a este criterio se le
denomina llave concatenada, por ejemplo buscar a un alumno del cual no se sabe su
numero de libreta por el nombre y apellido.
Metadatos : Los metadatos son datos acerca de los datos presentes en el archivo o
en la base de datos, los metadatos describen la longitud y la composición de cada uno
de los registros, por ejemplo el campo del numero de la libreta universitaria (LU) solo
podrá contener números y su longitud será de 5 espacios.
OBJETIVOS DE DISEÑO
Cinco objetivos en el diseño del almacenamiento de datos:
Disponibilidad
de Datos
Integración
de Datos
Actualización
Recuperación
Eficientes
Almacenamiento
Eficiente de
Datos
Recuperación
Dirigida de la
Información
3
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
ARCHIVOS CONVENCIONALES Y BASE DE DATOS
En un sistema de información basado en computadoras se cuentan con 2 enfoques
para el almacenamiento de datos.
Primer Enfoque: consiste en almacenar los datos en archivos individuales exclusivos
para una aplicación particular. Por ejemplo: una organización con diversos sistemas de
información que utilizan archivos convencionales independientes: “Archivo de Ventas”
que contiene información de datos históricos, “Actividades-Actuales” que se actualizan
con frecuencia y “Archivo-Personal” que contiene las direcciones, los títulos y datos
similares.
ARCHIVO-VENTAS
Num. Nombre 92 93 94
ACTIVIDAD-ACTUAL
Num. Nombre Área 94
ARCHIVO- PERSONAL
Nombre. Departamento. Nombre Dirección Teléfono Cont Salario Titulo
Permanecen como una manera práctica de almacenar los datos, estos
archivos se pueden diseñar y elaborar de manera rápida reduciendo los problemas de
disponibilidad de datos y de seguridad. Cuando el diseño de los archivos se realiza de
manera cuidadosa, todo la información necesaria queda incluida y se reduce el riesgo
de omitir datos de manera accidental.
Ventajas :
•
•
Velocidad de Procesamiento para el uso de archivos.
Existe posibilidad de elegir una técnica óptima para el procesamiento de
los archivos de una sencilla aplicación.
Desventajas:
•
•
•
•
Falta de potencial para evolucionar.
Su rediseño implica que los programas a los que accesan debe redactarse
nuevamente.
Implica un incremento del tiempo de programación para el archivo, para el
desarrollo y mantenimiento del programa.
La integración de los datos llega a convertirse en una causa de
preocupación.
4
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Segundo Enfoque: involucra la elaboración de una Base de Datos. La figura siguiente
muestra como los diferentes usuarios de diferentes departamentos dentro de una
organización compartan la misma Base de Datos, teniendo acceso a diferentes
grupos de datos.
Grupo de datos 1
Base de datos
Grupo de datos 2
Grupo de datos 3
Es una fuente central de datos significativos, compartidos por numerosos usuarios
para diversas aplicaciones.
La esencial de una Base de Datos es el sistema Administrador de la Base de Datos
(DBMS) el cual permite la creación, modificación y actualización de la base de datos,
la recuperación de datos y la emisión de reportes.
El encargado de asegurar que la base de datos satisfaga los objetivos programados se
denomina Administrador de Base de Datos.
Objetivos :
1) Asegurar que los datos puedan ser compartidos por los usuarios para una
variedad de aplicaciones
2) Que el mantenimiento de los datos sea precisa y consistente
3) Asegurar que todos los datos que se requieran para aplicaciones presentes y
futuras estén siempre disponibles
4) Permitir que los usuarios desarrollen su propia visión de los datos.
5) Permitir que la base de datos evolucione y se adapte a las necesidades de los
usuarios
Ventajas :
•
•
•
•
•
Compartir los datos
Apoya a que se mantenga la integridad de los datos
Debe anticiparse a las necesidades.
Diseño más flexible que los archivos separados
Permite a los usuarios que expongan su punto de vista sobre los datos
Desventajas:
• Datos vulnerables
• Acceso y actualización limitada
• Intento de satisfacer objetivos de eficacia:
• Costo de almacenamiento razonable
• Reducción del tiempo.
5
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
ARCHIVOS CONVENCIONALES
Concepto: Un archivo es una estructura de datos que reside en memoria secundaria,
consistente en un conjunto de informaciones estructuradas en unidades de acceso
denominadas registro, todos del mismo tipo y en un numero indeterminado.
Los archivos tienen un uso muy amplio y existieron antes del desarrollo de las
estructuras de base de datos.
Características : Algunas de las principales características de esta estructura de
datos son:
• Residencia en soportes de información externos también denominados
memorias secundarias o auxiliares como las cintas y discos.
• Independencia respecto de los programas significa que la vida del
archivo no esta limitada por la vida del programa que lo creo y también
que en diferentes momentos pueden utilizar el mismo archivo diferentes
programas.
• Permanencia de las informaciones almacenadas es decir toda la
información almacenada en la memoria central desaparece cuando se
termina la ejecución del programa que la maneja, pero para hacer
desaparecer un archivo será necesario realizar explícitamente una
operación de borrado.
Tipos de Archivos: Los archivos pueden utilizarse para almacenar datos por un
periodo indefinido de tiempo o bien pueden utilizarse como almacenes temporales
para un propósito particular, de allí que tenemos cinco tipos de archivos:
Archivo Maestro
Archivo de Tablas
Archivo de Transacción
Archivo de Trabajo
Archivo de Impresión
Archivo Maestro: Los archivos maestros contienen registros para un grupo de
entidades, los atributos pueden actualizarse frecuentemente pero los registros en si, se
mantienen permanentes. Por ejemplo en el caso de un sistema de aplicación que
maneje la información de una universidad tendríamos como archivo maestro al que
contiene la información de los alumnos, otro seria el de las carreras con sus
respectivas materias y el de profesores y personal que trabaja en dicha institución.
Archivos de Tablas: Un archivo de tabla contiene datos que se utilizan para calcular
otros datos o parámetros de desempeño. Por ejemplo utilizando el caso citado
anteriormente tendríamos como tabla las materias por año que puede cursar un
alumno o el régimen de correlatividades.
Archivo de transacción o de movimiento: En ellos se almacena la información que
se utilizara para actualizar los archivos maestros y una vez realizado el proceso de
actualización, estos pierden su validez y podemos deshacernos de ellos. Por ejemplo
sin en el archivo de alumnos se necesitara agregar datos que antes este archivo no
contenía entonces utilizaremos un archivo de transacción para volcar la información
del archivo original en el de transacción y agregarle el nuevo dato requerido.
Archivos de Trabajo: En ocasiones un programa resulta más eficiente si utiliza un
archivo de trabajo. Por ejemplo si se desea una lista alfabética de los nombres de los
estudiantes inscriptos en la cátedra X esto se hará por medio de un archivo de trabajo
en el que se almacenara esa información a partir del archivo de estudiantes inscriptos
(archivo maestro). Una vez realizado el trabajo este archivo podrá eliminarse.
Archivo de Impresión: Cuando es necesario correr un programa pero se carece de
una impresora en línea (o la impresora se encuentra ocupada imprimiendo otros
reportes) se utiliza un archivo de impresión. El envío de la salida a un archivo en lugar
de una impresora se llama SPOOLING, luego cuando el periférico se encuentra
disponible, el documento puede imprimirse. Los archivos de impresión son muy útiles
6
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
porque los usuarios pueden tomarlos para llevarlos a otros sistemas de computo e
imprimirlos en dispositivos especiales, tales como graficadores, impresoras, hacer
unidades de microfilmación, etc.
Formas de Organización:
Al diseñar un archivo se pueden elegir entre diferentes maneras de organizar sus
registros, ello nos va a permitir guardar información de una manera determinada y
poder acceder a ella de manera más eficiente.
Las principales formas de organización son:
Organización Secuencial
Organización Directa o Aleatoria
Organización Secuencial Indexada
Organización Secuencial: Cuando los registros se encuentran ordenados físicamente
en un archivo, se dice que tal archivo es un archivo secuencial.
Cuando se actualiza un archivo de este tipo es necesario accederlo de manera
completa, ya que los registros no pueden insertarse en la parte intermedia del archivo,
es decir, para actualizarlos es preciso crear nuevos archivos donde se copian los
registros que vayan a permanecer, modificados o no, junto con los nuevos.
Los archivos secuenciales se utilizan cuando lo requiere el hardware (por ejemplo una
cinta magnética es un archivo secuencial) o cuando el acceso normal requiere que se
acceda a la mayoría de los registros, en otras palabras cuando necesitemos leer o
actualizar solo unos cuantos registros, será ineficiente utilizar un archivo secuencial,
pero cuando se necesiten leer o modificar numerosos registros tendría mayor sentido
una organización secuencial.
Características:
•
•
Los registros ocupan posiciones consecutivas de memoria.
Solo se puede acceder a ellos de uno en uno a partir del primero.
Desventajas:
•
•
•
Hay que agrupar las transacciones por lotes y ordenarlas en la misma
secuencia que el archivo.
Las altas y las bajas requieren volver a grabar el archivo.
No se pueden hacer operaciones de escritura cuando se esta leyendo, ni
operaciones de lectura cuando se esta escribiendo.
•
•
•
Empleo eficiente del almacenamiento.
Es fácil programar el acceso a los registros.
Es independiente del dispositivo.
Ventajas:
Ejemplo: Podría ser el caso del archivo de alumnos el cual se encontrara ordenado por
numero de libreta universitaria. La cual será asignada de manera secuencial a cada
alumno al momento de inscripción.
Organización de Acceso Directo, Directa o Aleatoria: En un archivo con esta
organización, también denominada relativa, las informaciones se colocan y se acceden
aleatoriamente mediante su posición, es decir, indicando el lugar relativo que ocupan
dentro del conjunto de posiciones posibles.
Características:
•
•
Los registros no quedan forzosamente en orden secuencial, sino que se
distribuyen a todo lo largo del área de almacenamiento.
Esta organización sólo permite dispositivos de acceso directo.
7
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Ventajas:
•
•
•
Se pueden leer y escribir registros, en cualquier orden y en cualquier
lugar.
Rapidez de acceso a un registro cualquiera, ya que para ello no es
preciso pasar por los anteriores.
Puede manejar con eficiencia grandes cantidades de transacciones
desordenadas.
Desventajas:
•
•
Puede desaprovecharse parte del espacio destinado al archivo, ya que
pueden quedar huecos libres entre unos registros y otros.
La eficiencia del almacenamiento queda reducida.
Ejemplo: Podría ser el caso del archivo donde se encuentran almacenada las materias
que cursa
cada alumno de la facultad esta información no esta ordenada
secuencialmente sino que depende de cómo se realizo la inscripción de los alumnos a
las materias que cursaran.
Organización Secuencial Indexada: Un archivo con esta organización consta de tres
áreas:
•
•
•
Un área de índices
Un área de primaria o área de datos
Un área de excedentes o overflow
El área primaria contendrá los registros de datos clasificados en orden ascendente por
su campo clave.
El área de índices es un archivo secuencial creado por el sistema, en el que cada
registro establece una división (segmento) en el área primaria y contiene la dirección
de comienzo del segmento y la clave mas alta del mismo, de esta manera el sistema
accede de forma directa a un segmento del área primaria a partir del área de índices,
de forma similar a la búsqueda de un capitulo de un libro a partir de su índice.
Por ultimo se reserva un espacio llamado área de excedente, para añadir nuevos
registros que no pueden ser colocados en el área primaria cuando se produce una
actualización del archivo.
Características:
•
•
Los registros se almacenan secuencialmente pero el archivo además
tiene un índice.
Esta organización sólo admite dispositivos de acceso directo.
Ventajas:
•
•
Rápido acceso por medio de la clave de registro
Se pueden procesar normalmente transacciones ordenadas y
desordenadas.
• El sistema se encarga de relacionar la posición de cada registro con su
contenido por medio del área de índices.
Desventajas:
•
Necesidad de espacio adicional para el área de índices y el
desaprovechamiento de espacio que resultan de quedar huecos
intermedios libres después de sucesivas actualizaciones. Las
transacciones desordenadas tienden a reducir la eficiencia del proceso.
Ejemplo: Si al archivo de las materias que cursa cada alumno le agregáramos un
índice que permita ordenarlo por numero de libreta universitaria y otro que permita
ordenarlo por materia, entonces podríamos buscar información referente a que materia
cursa cada alumno y que cantidad de alumnos cursa cada materia.
8
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
BASE DE DATOS
Concepto: Las bases de datos no son meramente una colección de archivos. Mas
bien, una base de datos es una fuente central de datos significativos, los cuales son
compartidos por numerosos usuarios para diversas aplicaciones.
Es un gran archivo donde se enlazan, interrelacionan y controlan todos los
datos por medio de un producto de software especial encargado de su
administración.
La parte medular de la base de datos es el sistema de manejo o administrador que
permite la creación, modificación, actualización, recuperación y la generación de
reportes.
En un ambiente de bases de datos los sistemas de aplicación (programas del usuario)
delegan a programas independientes, incluidos dentro del producto DBMS ( o sea
fuera del control del programador ) la tarea de administrar el manejo de datos y su
historial.
Objetivos :
•
•
•
•
•
Asegurar que los datos puedan ser compartidos por los usuarios, para una
variedad de aplicaciones.
Que el mantenimiento de los datos sea preciso y consistente.
Asegurar que los datos requeridos para las aplicaciones presentes y futuras se
encuentren siempre disponibles.
Permitir que la base de datos evolucione y se adapte a las necesidades
crecientes de los usuarios.
Permitir que los usuarios desarrollen su propia visión de los datos, sin
preocuparse por la manera en que los datos se encuentren almacenados
físicamente.
Características:
NO REPETICION DE DATOS: La base de datos debe estar compuesta por elementos
que no sean redundantes. Constituye así una colección de información
interrelacionada, sin repeticiones, lo que permite la consistencia de la información.
PRIVACIDAD Y SEGURIDAD: Los administradores de la base de datos normalmente
vienen provistos de programas especiales para brindar seguridad respecto al acceso a
los datos, o sea mantener la privacidad de la información. También proveen seguridad
en el servicio, es decir que los datos están protegidos contra las fallas de equipos y
programas que procesan los datos.
INDEPENDENCIA DE LOS DATOS: La administración de los datos es independiente
de los programas que los utilizan, de modo que se los puede modificar sin cambiar los
programas existentes para manejarlos.
ORDENAMIENTO Y BUSQUEDA DE DATOS: Dentro de las bases de datos existe un
criterio de ordenamiento para los datos que la componen. De esta forma se organiza la
administración de la información y se facilita el acceso a cualquier dato especifico.
De los objetivos se advierten las ventajas y desventajas de la base de datos:
Ventajas:
•
•
Al compartir los datos, significa que estos deben almacenarse por los menos
una sola vez. Esto a su vez apoya que se mantenga la integridad de los datos,
ya que el cambio de los mismos se realizara de manera más sencilla y confiable
si estos aparecen una vez y no en varios archivos.
Los datos tendrán mayor probabilidad de encontrarse disponibles en una base
de datos mas que un sistema de archivos convencionales.
9
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
•
•
Una base de datos llega a ser más flexible que dos archivos separados, esto
significa que una base de datos llega a evolucionar conforme se modifican las
necesidades de los usuarios y de sus aplicaciones.
Permite que los usuarios expongan sus puntos de vista sobre los datos, sin
necesidad de preocuparse de la estructura presente de la base de datos o de su
ubicación física.
Desventajas:
•
•
•
•
Todos los datos se almacenan en un solo lugar por lo cual son más vulnerables
a accidentes y requieren de un respaldo completo.
Existe el riesgo de que quien administra la base de datos se convierta en el
único privilegiado o habilitado para estar cerca de los datos.
Una base de datos no puede optimizar la recuperación de los datos para una
aplicación en especial ya que debe compartirse con numerosos usuarios y con
varias aplicaciones.
Puede significar un alto costo pues se puede llegar a requerir de cierto software
adicional para el administrador de base de datos, ocasionalmente también se
necesitara una computadora de mayor capacidad.
VISIÓN LÓGICA Y FÍSICA DE LOS DATOS
Una base de datos, a diferencia de un archivo, está hecha para que sea compartida
por muchos usuarios. Es claro que cada usuario ve los datos en forma diferente. Nos
referimos a la forma en que un usuario concibe y describe los datos desde una
presentación de usuario. Sin embargo el problema es que usuarios diferentes tienen
enfoques diferentes. Estas presentaciones se examinan en el modelo lógico global de
la base de datos, que eventualmente deberá desarrollarse. Finalmente, el modelo
lógico de la base de datos debe transformarse en el correspondiente diseño físico de
la base de datos. El diseño físico considera la forma del almacenamiento de los datos
y de sus interrelaciones, así como la mecánica del acceso. En el siguiente ejemplo se
muestran como se relacionan el reporte del usuario y la presentación del usuario a un
modelo lógico (esquema conceptual) y a un diseño físico (esquema interno).
Reporte del Usuario (salida tabular, gráficas,etc
Presentación del usuario o esquema del
usuario (descripción de las necesidades de
)
Esquema conceptual
(modelo de diseño lógico de la base de datos)
10
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Estructuras de las Bases de Datos:
El modelo de la base de batos hace referencia a la estructura que se utiliza para
expresar las relaciones existentes entre las diferentes unidades de datos que la
constituyen. De entre las varias posibilidades útiles para ello son tres las estructuras
que se han afianzado y están actualmente en uso.
ESTRUCTURA JERARQUICA
ESTRUCTURA EN RED
ESTRUCTURA RELACIONAL
Estructura Jerárquica: En este tipo de estructura los registros de datos se organizan
en escalones o niveles. Si deseamos obtener por ejemplo el tercer escalón, primero
habrá que identificar el correspondiente registro padre o propietario en el segundo
escalón, el cual a su vez será identificado por la elección de determinado apuntador a
partir del escalón primero. Las estructuras jerárquicas en ocasiones se denominan
árboles porque los subordinados conectados a las entidades a las cuales pertenecen
se asemejan a las ramas de un árbol, pero dibujadas al revés.
Implican que una entidad no puede tener más de una entidad propia. Esto es, una
estructura hecha de varias asociaciones 1:M o 1:1, otras asociaciones tales como M:1
o M:N no se permiten.
Las estructuras jerárquicas en ocasiones se denominan árboles porque los
subordinados conectados a las entidades a las cuales pertenecen semejan las ramas
de un árbol, aunque curiosamente dibujadas hacia abajo.
La recuperación de datos en una estructura jerárquica se realiza con base en las
ramificaciones
Ejemplo: Si consideramos el ejemplo utilizado en el desarrollo de los archivos y lo
aplicamos a la base de datos, tendríamos una estructura jerárquica definida de la
siguiente manera, cada Curso tiene como subordinado a las materias que se dictan en
el mismo, de la misma manera cada materia tendrá como subordinado a los alumnos
que cursan dicha materia. El problema de este tipo de estructura es el
subordinamiento que existe entre cada entidad, ya que al estar subordinada a otra,
para modificarla hay que modificar la que encuentra en el nivel superior. Lo mismo
ocurre con las consultas.
Cursos
Materias
Alumnos
ENTIDAD
ENTIDAD
ENTIDAD
ENTIDAD
ENTIDAD
ENTIDAD
ENTIDAD
ENTIDAD
ENTIDAD
11
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Estructura en Red: Una estructura en reticular permite que cualquier entidad cuente
con cualquier numero de subordinados o superiores. Las entidades se conectan
mediante el uso de enlaces de red los cuales son datos comunes a ambas entidades
conectadas. Es una variante de la jerárquica. Alivia un poco los problemas de la
estructura jerárquica pero no los soluciona completamente.
Ejemplo: utilizando el ejemplo anterior si la estructura fuera en red, utilizaremos el
curso como enlace, que permite conectar a los Alumnos con las materias. Esto
permitirá realizar modificaciones, consultas en cualquier entidad sin tener que recurrir
a la entidad superior. Además la entidad aparece una sola vez.
Estructura Relacional: Esta estructura relaciona distintas tablas. Esta estructura es
mucho más flexible que las anteriores. En lugar de tener una sola tabla con muchos
datos tengo muchas tablas relacionadas con pocos datos en cada una de ellas y una
ventaja que puede brindar esto es que los datos que poseen dos tablas pueden
obtener otra información distinta combinándolas. Esta estructura es más eficiente que
las anteriores.
Una estructura relacional consiste en una o más tablas bidimensionales, las cuales se
refieren como relaciones. Los renglones de las tablas representan los registros y las
columnas contienen los atributos.
Es bastante simple el mantenimiento de las tablas de una estructura al compararlo con
el mantenimiento de una jerárquica o de red. Una de las ventajas principales es que
las consultas específicas se manejan de una manera muy eficiente
Ejemplo: En este caso no tendríamos una sola tabla sino tres, una que contenga los
datos de los alumnos y otra que contenga las materias que se dictan en cada año y
por ultimo una tabla que contenga datos referidos a que materia esta cursando cada
alumno y en que año (curso) se encuentra.
Este tipo de estructura permite un fácil mantenimiento de las tablas en comparación
con las anteriores. Las consultas especificas se manejan de manera más eficiente.
Base de Datos Relacional
En el caso de una estructura de base de dato relacional, los usuarios pueden tomar
archivos, seleccionar en ellos los campos y crear un archivo, que podrán almacenar
entonces. Pueden hacer esas asociaciones fácilmente sin ser abrumados por la
programación. En esencia, los datos son presentados en tablas bidimensionales. La
decisión de recurrir a una base de datos relacional es elegir entre el poder de la
computadora o el del ser humano.
Naturaleza de una “relación”
Las características de la relación deben cumplir con ciertas condiciones para que la
computadora efectué las operaciones sobre ella. Dado que los matemáticos fueron
quienes establecieron dichas condiciones, se ha acuñado una jerga profesional para
definir una relación. Nosotros describiremos su naturaleza en un lenguaje más común,
pero a riesgo de omitir algunos aspectos o elementos.
El desarrollo de una relación comienza con el punto de vista del usuario.
Dicha perspectiva es una representación lógica de los datos que se requieren para
tomar una decisión o contestar una pregunta del usuario. Por ejemplo, hay que
establecer una relación de datos de pago, si queremos calcular los cheques de la
nómina semanal o evaluar el empleo de las horas extras.
Formación de nuevas relaciones
La base de datos relacional (RDB) se ajusta a condiciones matemáticas muy precisas.
El usuario no se limita simplemente a buscar las relaciones iniciales guardadas en
ellas. Pueden construir fácilmente nuevas relaciones al seleccionar las de un menú
desplegado en el monitor, después puede escoger en el menú algunas operaciones
realizadas en ellas. Sólo se necesita tres operaciones en el método relacional
algebraico;
12
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
•
•
•
La operación de “unir” se limita a combinar dos relaciones para formar otra.
Únicamente dos relaciones pueden combinarse a la vez, apareando los
atributos seleccionados en cada una de las relaciones.
La operación “proyección” nos permite seleccionar cualquier conjunto de
atributos, a partir de una relación establecida.
La operación “seleccionar” nos permite escoger un registro individual entre los
que integran una relación.
Pasos para la recuperación y presentación de datos
1) Elección de una relación a partir de la base de datos: una manera adecuada
para realizarlo es contar con un directorio de las presentaciones de los usuarios
como una ayuda a la memoria.
2) Unión de dos relaciones: ésta operación tiene como propósito tomar dos
relaciones y unificarlas en una relación más amplia. Para enlazar dos relaciones
éstas deben compartir por lo menos un atributo.
3) Proyección de columnas a partir de la relación: es el proceso de elaboración
de pequeñas relaciones, eligiendo solo los atributos relevantes de una relación
existente, es decir la proyección es la extracción de ciertas columnas a partir de
una tabla relacional.
4) Selección de renglones de la relación: es similar a la proyección, pero en
lugar de extraer columnas se extraen renglones. La selección crea una nueva
relación (más pequeña) al extraer registros que contienen un atributo que
satisface cierta condición.
5) Generación de nuevos atributos: implica un manejo de los datos existentes
junto con ciertos parámetros relacionales para derivar nuevos datos. Para ésta
relación se crean nuevas columnas.
6) Indexación u ordenación de renglones: para poder localizar de una manera
rápida los elementos de una lista, o poder agrupar y obtener subtotales de una
manera más sencilla, se requieren los datos en cierto orden. Las dos opciones
disponibles para ordenar los datos son: indexar (es la ordenación de manera
lógica de los renglones de una relación con base en un determinado criterio) y
ordenar (es el arreglo secuencial de una relación).
7) Cálculo de totales y otros parámetros: una vez que el subconjunto apropiado
de datos a quedado definido se ordenan de la manera requerida los renglones
de la elación, se pueden calcular los totales u otros parámetros del desempeño.
8) Presentación de los datos: es el paso final en la recuperación de los datos. La
presentación de los datos obtenidos de la base de datos puede tomar
numerosas formas. En ocasiones, los datos pueden presentarse en una forma
tabular, a veces en gráficas y en otras, con una respuesta en pantalla por medio
de una palabra sencilla.
13
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
TIPOS DE CONSULTAS A UNA BASE DE DATOS
Las consultas son las preguntas que se plantean con referencia a la Base de
Datos.
Consulta de Tipo 1: En el primer tipo de consulta se proporciona la entidad y uno de
sus atributos. El propósito de la consulta es encontrar el valor correspondiente. Por
ejemplo:
¿Qué ingresos tuvo el empleado número102 en el año 1992?
Nº
Empleado
Nombre- Empl. Departamento
100
101
102
103
Vargas
Flores
Cazón
Lopez
Año 90
Finanzas
54100
Ventas
44700
Compras
48040
Administración 21380
Respuesta: 54200
Año 91
Año 92
78000
24910
36200
25500
52900
42300
54200
49200
Consulta de tipo 2: encuentra las entidades que satisfacen un valor específico para
un atributo particular.
Qué empleado(s ) obtuvo ingresos superiores a $ 50000 en el año 1992?
Nº
Empleado
Nombre- Empl. Departamento
Año 90
Año 91
Año 92
100
101
102
103
Vargas
Flores
Cazón
Lopez
54100
44700
48040
21380
78000
24910
36200
25500
52900
42300
54200
49200
Finanzas
Ventas
Compras
Administración
Respuesta: 100, 102
Consulta de tipo 3: localiza los atributos cuando se proporciona la entidad y el valor.
Esta consulta es útil cuando se tienen numerosos atributos similares que cuentan con
una misma propiedad.
¿En que año el empleado número 103 obtuvo ingresos superiores a $ 50000?
Nº
Empleado
Nombre- Empl. Departamento
Año 90
Año 91
Año 92
100
101
102
103
Vargas
Flores
Cazón
Lopez
54100
44700
48040
21380
78000
24910
36200
25500
52900
42300
54200
49200
Finanzas
Ventas
Compras
Administración
Respuesta: Año92
Consulta de tipo 4: Es similar a la consulta 1. La diferencia está en que se desean
valores de todos los atributos. Por ejemplo:
Enumere todo el detalle para el empleado 102
14
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Nº
Empleado
Nombre- Empl. Departamento
Año 90
Año 91
Año 92
100
101
102
103
Vargas
Flores
Cazón
Lopez
54100
44700
48040
21380
78000
24910
36200
25500
52900
42300
54200
49200
Finanzas
Ventas
Compras
Administración
Respuesta: Cazón , Compras , 48040, 36200, 54200
Consulta de tipo 5: Es una consulta global, pero tiene una forma similar a la consulta
de tipo 2. Enlista todas las entidades que satisfacen un valor para todos los atributos
descritos.
Enliste todos los empleados cuyos ingresos excedieron los $50000 en cualquiera de
los años
Nº
Empleado
Nombre- Empl. Departamento
Año 90
Año 91
Año 92
100
101
102
103
Vargas
Flores
Cazón
Lopez
54100
44700
48040
21380
78000
24910
36200
25500
52900
42300
54200
49200
Finanzas
Ventas
Compras
Administración
Respuesta: 101, 102
Consulta de tipo 6: Similar a la consulta de tipo 3. La diferencia está en que este tipo
de consulta solicita una lista de atributos para todas las entidades, en lugar de una
entidad en particular. Por ejemplo:
Enliste todos los años, en los cuales los ingresos de todos los empleados superan los
$30000
Nº
Empleado
Nombre- Empl. Departamento
Año 90
Año 91
Año 92
100
101
102
103
Vargas
Flores
Cazón
Lopez
54100
44700
48040
21380
78000
24910
36200
25500
52900
42300
54200
49200
Finanzas
Ventas
Compras
Administración
Respuesta: Año 91, Año 92
15
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
BASE DE DATOS RELACIONAL PARA UN SISTEMA DE ADMINISTRACIÓN DE
RECURSOS HUMANOS
Una de las tareas más difíciles al crear una base de datos relacional es que la
gerencia identifique las relaciones. Cada relación deberá componerse de un grupo
reducido de atributos afines, de manera que sea esencialmente independiente de
las otras en la base de datos. Por otra parte, hay que incorporar los atributos a la
relación para que se junten las relaciones deseadas.
La construcción de un conjunto de relaciones requiere un conocimiento cabal de las
técnicas de diseño de la base de datos. La gerencia debe establecer primero la
información que requiere la compañía. Una vez preparada una lista completa de
puntos, entran en acción los especialistas en la base de datos. Deciden qué
información debe conservarse y la que debe obtener a partir de aquélla.
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Sueldo anteriores
Experiencia laboral
Habilidades del empleado
Habilidades del puesto
Supervisor del trabajo
Datos de promoción
Datos de separación
Escolaridad
Antecedentes educacionales en la compañía
Antecedentes profesionales
Promocionabilidad del rendimiento del empleado
Número de retraso y de falta
Aportaciones voluntarias del empleado
Interés preferente del empleado
Pertenencia al sindicato
Datos de localización del empleado
Datos de paro laboral
Datos de terminación del empleo
Datos de seguridad laboral y de accidentes
Puesto
Puestos abiertos
Datos de reclutamiento
Datos de historia del reclutamiento
Con una completa base de datos relacional, los gerentes pueden elaborar
nuevos tipos de informes como los que indican a continuación;
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
Escolaridad promedio de los compañeros de trabajo
Número de oportunidad de trabajo en el componente
Porcentaje de empleados que terminan su empleo
Frecuencia de accidentes y tasas de gravedad para el puesto
Frecuencia relativa de cambios de trabajo en el componente
Años de experiencia del supervisor o gerente
Selección o aceptación del empleado por el gerente actual
Frecuencia relativa de acción disciplina por parte del gerente o
supervisor
Tendencia del gerente o supervisor a hacer una evaluación rigurosa,
o condescendiente de los empleados
Cantidad de horas extras trabajadas en el componente
Porcentaje de empleado insatisfecho con el trabajo, el sueldo, el
supervisor y otro aspecto del componente.
16
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
SISTEMA DE ADMINISTRACION DE BASES DE DATOS (DBMS)
Concepto:
Un sistema de administración de la base de datos (DBMS) es cualquier sistema
basado en la computadora que defina, cree, recupere, actualice, revise y mantenga la
integridad de los mismos – Dr. Gordon C. Everest (Universidad de Minnesota)
El sistema de administración de la base de datos es un paquete de software que
ayuda al usuario en la gestión de una base de datos computarizada – Compañías que
venden software y hardware.
Utilizaremos una definición más amplia, en ella el sistema consta de siete
COMPONENTES BASICOS (Dr. Everest ) :
•
•
•
•
•
•
•
El administrador de la base de datos quien es responsable del esquema de la
base de datos.
El esquema, que describe la naturaleza de las relaciones lógicas y físicas
existentes entre los registros de la base de datos.
El programa de administrador de datos, que crea todos los registros físicos en la
base de datos y que controla todas las actividades posteriores de entrada y
salida de ella.
Los programas de consulta - lenguaje que permiten a los gerentes formular
preguntas y recibir respuestas al consultar la base de datos en el lenguaje
ordinario.
La base de datos, que contiene los registros físicos.
El programador, que sirve de interfaz con el usuario para el sistema de la base
de datos.
Los programas de la base de datos, de los cuales se sirve el programador para
obtener información de los datos contenidos en ella.
•
Se trata de ¨ programas de aplicación ¨ dirigidos a la base de datos.
Objetivos
Los objetivos esenciales del sistema son:
•
•
•
•
•
•
•
Dar acceso inmediato a las ultimas transacciones relacionadas con el sistema
de información
Eliminar la redundancia al estructurar datos adecuados a todas las aplicaciones.
Permitir múltiples actualizaciones y recuperaciones de carácter concurrentes.
Crear un sistema que ofrezca un crecimiento progresivo al agregar datos y
programas.
Ofrecer una descripción de la base de datos no vinculada a ningún lenguaje en
particular.
Reducir el mantenimiento de los programas de aplicación y suministrar un
mantenimiento en línea de la base de datos.
Brindar protección en contra del uso no autorizado y la violación de la
confidencialidad de los archivos especificados.
Categorías de los DBMS
•
•
•
para grandes servidores de datos
para pequeños servidores de datos
para bases de datos personales
Por las funciones
Administradores de la estructura : manejan donde y como se guardan los datos
Ms Works
Excel
17
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Disponibilidad de herramientas para acceder y manipular los datos, proveen
lenguajes de programación para acceder a los datos.
Dbase - Paradox
Foxpro - Access
Clipper
Disponibilidad de herramientas para administrar la integridad de los datos,
aseguran la consistencia de la información, evitan la repetición, resguardan reglas
semánticas de la base de datos.
oracle
Sybase
Informix
ibm db2
Progress
Componentes:
Programa administrador de los datos: Las interacciones de entrada - salida en un
ambiente de bases de datos son demasiados complejas para que el individuo las
controle o por lo menos llegue a controlarlas. Así, otro constituyente fundamental del
sistema de administración de la base de datos es el PROGRAMA ADMINISTRADOR
DE DATOS. Este controlara el acceso a la base de datos y la salida de ella. Por lo
regular, constituye el núcleo del sistema de la base de datos y es proporcionado, por el
fabricante o un distribuidor de software como parte del sistema total.
Administrador de la base de datos: Una parte importantísima del sistema total de
administración de la base de datos es una persona (grupo) y no el software. A esa
persona se le llama Administrador de la base de datos, desempeña un papel muy
semejante al del contador. Es decir, especifica las relaciones exactas entre los
registros, clasificando y colocando los tipos de registros conforme a reglas
previamente fijadas. Por la misma naturaleza de las relaciones entre registros, el
administrador puede lograr que el sistema de la base de datos se ajuste lo más posible
a las exigencias de la empresa.
Por formar parte del sistema global, el administrador de la base de datos debe
estandarizar, organizar, resolver y estar al tanto de los conflictos entre los usuarios. A
continuación se enumeran las FUNCIONES que realiza:
Funciones:
•
•
•
•
•
•
•
•
Colaborar con el gerente del sistema de información administrativa para
seleccionar los datos que deben guardarse en la base de datos.
Determinar los excedentes que existen en el intercambio entre datos y
programas.
Publica un directorio de las propuestas de estructura de datos para analizarlos
con los posibles usuarios.
Publica diccionarios de datos que contienen información básica sobre la
información guardada en la base datos (definición de campos, formato, reglas
de edición, consideraciones de seguridad, etc.)
Establece con los usuarios las variaciones especificas de la base de datos.
Determina metidos generales para la recuperación y una biblioteca de
programas de acceso a la base de datos.
Mantiene la base de datos, su integridad y totalidad.
Obtiene y asigna llaves individuales, tomando medidas de seguridad y vigilando
por si se presentan infracciones.
La alianza entre el administrador de la base de datos y el contador es decisiva en las
futuras actividades de la empresa. Sus funciones en ella están totalmente
interrelacionadas y se parecen muchísimo por lo que respecta a funciones y
responsabilidades. En virtud de sus papeles en la organización de los datos, ambos
constituyen una importante fuente de información que ayuda a los gerentes en la toma
de decisiones.
18
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
LA BASE DE DATOS Y LA EMPRESA
Antes con los sistemas manuales, los datos se guardaban en diversos tipos de
archivos físicos como los archiveros. En esos archivos había una enorme duplicación
de datos. Dicha redundancia se vio reducida con la aparición del software y hardware.
La base de datos puede considerarse hoy conceptualmente como una colección
prescindiendo de la dispersión o configuración física del equipo, es decir, el sistema
informático podría poner casi instantáneamente a disposición de los gerentes cualquier
información de la base de datos.
A la gerencia le interesa el rendimiento y la economía en el desarrollo de una base de
datos. Debe comprobar las respuestas, en función de los costos, a preguntas como las
siguientes:
¿Cuáles y cuantos datos deben almacenarse?
¿Cuánto tiempo deben permanecer en la base de datos?
¿Qué rapidez se desea que tenga la recuperación de los datos y en que forma debe
realizarse?
¿Qué equipo software deben seleccionarse?
¿Cómo debe la compañía organizar la administración de los recursos de datos?
¿Cómo debe la información sacarse de la base de datos guardada en maquinas?
A su vez, existen tres razones por las cuales una empresa puede considerar
beneficiosa a la base de datos.
Por la disciplina que implica en el proceso de definición de las colecciones de datos.
Porque permite una visión global única del conjunto de datos de una empresa.
Porque facilita la estructuración del Sistema de información.
Es importante notar el papel central que juega la base de datos dentro de una empresa
porque se supone que cualquier referencia a datos, responsabilidad del Sistema de
información, pasa por ella, ya sea para almacenarlos la primera vez o para
consultarlos, modificarlos o anularlos posteriormente.
En consecuencia, también es importante que los responsables directos de las distintas
funciones y procesos de negocios de la empresa se involucren activamente en el
diseño de la base de datos. Si no lo hacen una vez construida la base de datos puede
ocurrir como de hecho sucede a menudo, que determinados accesos a datos no
puedan llevarse a cabo tan fácilmente como seria de desear.
Centralización:
Si existe cierto grado de centralización en la concepción de los Sistemas de
Información la base de datos se convierte en un grado central y neurálgico de los
mismos:
Hay quienes consideran a esto negativo por que implica la centralización del Sistema
de Información y esta no puede ser la organización mas adecuada para el mismo en el
contexto de infraestructura de la empresa.
En cambio otros opinan que una estructura centralizada del Sistema de Información es
no solo poco nociva, sino incluso recomendada ya que contribuye a visualizar el
conjunto de datos como un todo perteneciente a la empresa, no a determinados
departamentos, y que debe, por lo tanto, diseñarse, administrarse y usarse desde un
punto de vista global. En no pocas empresas el diseño de la estructura de la base de
datos permitió que los distintos responsables de funciones y procesos de negocios se
den cuenta que los datos que precisaban para sus actividades de gestión, y
aparentemente no estaban disponibles en la empresa, eran hechos utilizados
rutinariamente por otros responsables vecinos a quienes nunca se les había ocurrido
que sus datos pudieran ser relevantes para sus colegas. En definitiva, podemos decir
que el aire centralizador que introduce el concepto de base de datos no es pernicioso
(dañoso o perjudicial) sino más bien todo lo contrario.
19
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Descentralización:
La aplicación de los ordenadores personales y de herramientas basadas en los
mismos ha traído consigo la posibilidad de que algunos usuarios de Sistema de
Información en empresas empezaran a desarrollar sus propias soluciones basadas en
la informática, algunos de ellos fueron mas allá de la simple utilización de esas
herramientas y desarrollaron de hecho las suyas propias. Se trata entonces de una
innovación en el terreno de los Sistemas de Información.
Y en consecuencia de una cierta descentralización del sistema de información hecha
posible por un nuevo paso evolutivo en el desarrollo de las Tecnologías informáticas
para descentralizar el Sistema de Información debe juzgarse desde la perspectiva del
Sistema de información, es decir, no solo porque la tecnología lo permite debe
considerarse adecuado.
La construcción de herramientas personales es lógica y contribuye eficazmente a
resolver problemas en actividades de toma de decisiones, pero también existen
decisiones que precisan utilizar datos contenidos en la base de datos central en sus
propios procesos de calculo y análisis, por ello la propia estructura física y de
funcionamiento de los componentes de la Tecnología Informática, permite que un
servidor (un ordenador) de servicio a una serie de clientes (otros ordenadores)
conectados con aquel, facilitándoles sobre todo acceso a los datos comunes y
ocupándose de dicho acceso sea eficiente y se produzca sin errores.
Así, simple mente conectando herramientas personales a la base de datos central,
algo técnicamente resuelto, pueden dar solución a este tipo necesidades de
descentralización, sin renunciar a la perspectiva global que proporciona el concepto de
base de datos.
El papel de la base de datos como puerta de entrada de las soluciones de tipo
personal al Sistema de Información básico es evidente. Ello no impide, además que
cada usuario tenga su propia colección de datos local independiente de la base de
datos si lo cree conveniente.
20
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
LOS SISTEMAS DE INFORMACION Y LAS BASES DE DATOS
Una de las aportaciones mas positivas que para los SI ha traído la informática es el
concepto de Base de Datos (BD), por lo que supone de disciplina en la organización
de los datos de una empresa, y también por lo que supone conceptual- mente como
conjunto organizado según las necesidades de cada caso. Llegar al actual concepto
de BD no ha sido fácil ni rápido, y los detalles del mismo caen fuera del contexto de
este libro. Resumiendo mucho, el concepto BD lleva la idea de:
•
•
•
•
Agrupar todos los datos relevantes para el SI de una empresa en un único lugar
– la BD.
Evitando redundancias – es decir, evitando tener el mismo dato registrado mas
de una vez, lo que a la larga provoca siempre inconsistencias.
Estructurándolos de una única manera – que debe reflejar su estructura
«natural», es decir, la que interesa ver desde la perspectiva de SI – incluso a lo
largo del tiempo, y
Proporcionando acceso a los mismos a través de lenguajes lo más «naturales»
posible y basados en la estructura anterior – es decir, que para acceder a un
dato baste con saber cosas del propio dato, no otras como donde esta
archivado en un momento determinado.
Este concepto de BD ha sido beneficioso para los SI al menos por tres razones:
•
•
•
Ha exigido disciplina en el proceso de definición de las colecciones de datos
necesarias en la operación del Sl, lo cual resulta casi siempre en una
depuración importante de los datos que se manejan;
Ha incorporado una visión global única del conjunto de datos de una empresa,
en cuyo diseño los distintos departamentos de la empresa deben alcanzar
consenso, y
Como consecuencia de lo anterior ha facilitado la estructuración del SI
alrededor precisamente de la BD, lo cual tiene mucho sentido desde la
perspectiva de SI.
Incorporando el concepto de BD, el esquema queda como se representa en la Figura
de abajo.
21
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
Es importante notar el papel central
que juega la BD en el nuevo
esquema, donde se supone que
cualquier
referencia
a
datos
responsabilidad del SI pasa por ella,
ya sea para almacenarlos la primera
vez o para consultarlos, modificarlos
o anularlos posteriormente.
La implicación más importante de la
Figura de la página anterior, desde un
punto de vista conceptual, es que el
diseño de la BD. – su estructura
sobre todo – es de importancia capital
en el diseño de un SI. En
consecuencia, es importante que los responsables directos de las distintas funciones y
procesos de negocio de la empresa se involucren activamente en el diseño de la BD.
Si no lo hacen, una vez construida la BD puede ocurrir, como de hecho sucede a
menudo, que determinados accesos a datos no puedan llevarse a cabo tan fácilmente
como seria de desear.
EL CONCEPTO DE BASE DE DATOS SIGNIFICA CENTRALIZACION ?
Otra consecuencia es un cierto grado de centralización en la concepción de los Sl, ya
que la BD se convierte en un grado central y neurálgico de los mismos. Hay quien
considera esto negativo porque implica la centralización del SI, siendo así que esta
puede no ser la organización mas adecuada para el mismo en el contexto de
infraestructura de la empresa. Aunque cierto aire de centralización es innegable en la
nombrada Figura, en nuestra opinión el mismo hace referencia a aspectos donde una
estructura centralizada del SI es no sólo poco nociva, sino incluso recomendable. En
efecto, dicha estructura contribuye a visualizar el conjunto de datos como un todo
perteneciente a la empresa – no a determinados departamentos –, que debe, por
tanto, diseñarse, administrarse y usarse desde un punto de vista global. En no pocas
empresas el diseño de la estructura de la BD ha desencadenado un proceso en el que
distintos responsables de funciones y procesos de negocio se han dado cuenta que
datos que precisaban para sus actividades de gestión y que aparentemente no
estaban disponibles en la empresa eran de hecho utilizados rutinariamente por otros
responsables vecinos a quienes nunca se les había ocurrido que “sus” datos pudieran
ser relevantes para sus colegas. En definitiva, pensamos que el aire centralizador que
introduce el concepto de BD no es pernicioso, sino más bien todo lo contrario.
Además, como veremos enseguida, si se desea descentralizar determinados aspectos
del SI básico puede hacerse precisamente con la ayuda del concepto de BO.
DESCENTRALIZACION A PARTIR DE LA BD
La aparición de los ordenadores personales (PCs) y de herramientas basadas en los
mismos (en particular hojas de calculo y pequeños sistemas de BD) ha traído consigo
la posibilidad de que algunos usuarios de SI en empresas empezaran a desarrollar
«sus propias soluciones basadas en la informática», algunos de ellos incluso yendo
mas allá de la simple utilización de esas herramientas, construyéndose de hecho las
suyas propias. Se trata, pues, de una innovación en el terreno de los SI (una cierta
«descentralización del Sl») hecha posible por un nuevo paso evolutivo en el desarrollo
de las TI (la aparición de los PCs y herramientas afines). Como siempre, la
conveniencia de utilizar las TI para descentralizar el SI debe juzgarse desde la
perspectiva del SI; es decir, no solo porque la tecnología 1o permite debe juzgarse
adecuado. Con todo, como veremos mas adelante, la construcción de «herramientas
personales» es lógica y contribuye eficazmente a resolver problemas en actividades de
toma de decisiones. Con frecuencia, además, la utilización de herramientas de este
tipo requiere el acceso a datos pertenecientes a la BD de la empresa en el sentido del
apartado anterior. Pensemos, por ejemplo, en datos históricos de ventas que pueden
ser útiles para confeccionar previsiones, o para analizar el comportamiento de
determinados productos en respuesta a ciertas acciones comerciales, etc. Es decir,
22
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
existen
decisiones
que
precisan
utilizar
datos
contenidos
en
la
BD
«central»
en
sus
propios procesos de
calculo
y
análisis.
Desarrollos
tecnológicos relativamente recientes, sobre todo los relaciona- dos con la denominada
«arquitectura cliente-servidor» han venido conveniente- mente a facilitar la
implantación de este tipo de soluciones. En efecto, dichos desarrollos permiten llevar a
cabo, de manera eficiente, la implantación de es- quemas de funcionamiento muy en
línea con lo sugerido en el párrafo anterior. De hecho, la propia estructura física y de
funcionamiento de los componentes de TI utilizados en tal «arquitectura clienteservidor» reproduce el modelo esbozado en el párrafo anterior: un «servidor» (un
ordenador) da servicio a una serie de «clientes» (otros ordenadores) conectados con
aquel, facilitándoles sobre todo acceso a los datos comunes y ocupándose de que
dicho acceso sea eficiente y se produzca sin errores. De este modo, una solución
técnica ha venido a dar respuesta a una necesidad de SI que el concepto de base de
datos había inicial- mente facilitado. Así, simplemente conectando herramientas
personales a la BD central, algo técnicamente resuelto como acaba uno de ver, puede
darse solución a este tipo de necesidades de descentralización, sin renunciar a la
perspectiva global que proporciona el concepto de BD. EL papel de la BD como puerta
de entrada de las soluciones de tipo personal al SI básico es evidente. Ello no impide,
además, que cada usuario tenga su propia colección de datos local independiente de
la BD central si lo cree conveniente. En este caso, sin embargo, las colecciones de
datos deben considerarse circunscritas al ámbito de cada usuario, y no verlas como
partes de la BD del SI básico; es decir, no es conveniente basar tratamientos de
alcance para toda la empresa en dichas colecciones, ya que ello Serra fuente casi
segura de inconsistencias.
Finalmente es interesante notar que utilizando tecnología de telecomunicaciones los
«usuarios descentralizados» pueden ser también remotos. Así, pues, de la mano de la
informática y las telecomunicaciones puede llegarse al esquema de funcionamiento,
que de manera natural expande el esquema inicial.
La gestión de archivos se ha mostrado insuficiente para cubrir todas las necesidades
de almacenamiento y proceso de datos en la actualidad. Los sistemas de información
de las empresas son cada vez más grandes y complejos, y su gestión mediante el uso
de archivos presenta algunos inconvenientes, como el hecho de que los datos estén
repartidos por distintos departamentos de la empresa, lo que supone tener que
desplazarse o solicitarlos cada vez que se necesiten en un lugar diferente de donde se
generan, además pueden estar repetidos varias veces, con el inconveniente de que su
actualización dará lugar a inconsistencias si no se realiza en todos los lugares en que
se ubican.
Los sistemas de bases de datos pretenden dar solución a los problemas expuestos
mediante la integración de los archivos, de su estructura y de las aplicaciones que los
manejan.
23
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
SEGURIDAD Y PROTECCION
La información almacenada puede llegar a tener una gran importancia y la perdida o
destrucción de la misma podría suponer un desastre para sus propietarios. Por ello,
será preciso establecer determinadas medidas de seguridad y control que minimicen o
anulen ese riesgo.
Asimismo, habrá que determinar otras protecciones que garanticen la privacidad y
confidencialidad de los datos, con el fin de que estos no puedan ser utilizados con
otros propósitos diferentes de los usos correctos para los que se han creado.
Definiciones de seguridad y protección:
La seguridad de la información significa proteger los datos en contra de:
•
•
•
Destrucción accidental o modificación por fuerzas de la naturaleza (como
inundaciones, incendio o relámpagos) y del hombre.
Destrucción intencional o por modificación de personas sin autorización
Divulgación accidental o intencional a personas no autorizadas.
La privacidad significa que las organizaciones o personas tienen el derecho a limitar la
difusión de información relativas a ellas.
Riesgo de Sistema:
La seguridad de la base de datos esta expuesta a numerosos riesgos.
Riesgo Accidentales:
Algunos usuarios, empleados o extraños accidentalmente encuentran una abertura
que hace accesible el sistema o su base de datos. En ocasiones a esas aberturas se
les da el nombre de trampas.
Una falla imprevista viene a anular una medida de seguridad que protege el sistema
contra cualquier intromisión.
Un error en la aplicación del sistema de comunicación divulga información
indebidamente.
Una falla imprevista revela la presencia de mecanismo decisivos de protección
(conocimiento del sistema de protección)
Riesgos Pasivos:
Captación electromagnética de las radiaciones del sistema, por ejemplo la que ocurre
en la transmisión de microondas.
Interceptación del subsistema de comunicación de transmisión mediante alambre o
cable coaxial (interceptación de comunicaciones)
Exposición de datos decisivos del sistema a personas no autorizadas.
Amenazas Activas:
Los empleados, usuarios y operadores de computadoras pueden curiosear en archivos
de los sistemas y descubrir datos no autorizados.
Consiguiendo códigos de acceso un empleado o extraño finge ser un usuario
autorizado Ejemplo: un desconocido experto en sistema llama al centro de
computación y pide que se use un código de entrada. Mas tarde utiliza ese código
como identificación. (existen varias formas de conseguir un código)
•
•
•
•
•
Entrada entre líneas: un intruso utiliza el sistema cuando el usuario se
encuentra en el sistema pero inactivo.
Personal experto en computación que se corrompe.
Búsqueda activa de entradas a través de trampas.
Datos adquiridos desde la memoria: Ejemplo cuando después de una corrida
de programa, puede quedar información en la memoria (a menos que la elimine
un programa especial). Esa información puede ser confidencial y estar al
alcance de cualquier usuario.
En manos de un programador hábil el sistema puede servir para descubrir
sus propias debilidades.
24
UNIDAD IV – ARCHIVOS Y BASES DE DATOS
ESTRATEGIAS DE PROTECCION
Clark WEISSMAN, ha logrado identificar cuatro estrategias eficaces de protección que
se emplean en el mundo moderno:
AISLAR: La protección se logra aislando el objeto valioso y controlando el acceso a él.
Ejemplos bancos, bóvedas, fortalezas, etc.
CONFUNDIR: La protección se consigue mediante el aislamiento (pero sin controlar el
acceso), basado en la ofuscación. Los objetos de valor se ocultan al quitarlos de la
vista o por camuflaje para dificultar la búsqueda. El mejor ejemplo es la criptografía.
DISUADIR: La disuasión protege al hacer poco rentable el hurto. Es fundamental la
ecuación utilidad perdida (ganancia / riesgo). Cuando la ganancia es alta y el riesgo es
escaso, la disuasión no da resultado y se alienta al robo. Para disuadir al transgresor,
el riesgo o castigo han de ser grande y siempre deben de ser visibles. Esta estrategia
la aplican las normas de seguridad del departamento de defensa, así como las leyes
contra espionaje militar e industrial.
COMPRAR SEGUROS: La protección asume la forma de un seguro. Por ser escaso la
probabilidad de perder, es una buena inversión protegerse contra la perdida
conjeturando que la perdida si se producirá, si acierta el dueño gana la apuesta que
generalmente es suficiente para compensar los objetos de valor que se perdieran. Si la
perdida no ocurre nunca, lo cual suele ser lo más probable, los premios pequeños
cuestan menos que otras clases de protección o sustitución.
DELEGAR: La protección se logra delegando la responsabilidad de la misma a otra
persona o grupo, como los fideicomisos bancarios y las agencias que reciben objetos
en custodia.
25
Descargar