MANAGEMENT INFORMATION SYSTEMS Ing. Joseph Ballon Alvarez NORMALIZACIÓN DE DATOS Page 2 Agenda 1 Conceptos de normalización 2 Formas normales Page 3 Agenda 1 Conceptos de normalización 2 Formas normales Page 4 1. Conceptos de normalización 1.1Concepto La normalización es un proceso que pretende conseguir tablas con una estructura óptima y eficaz. El proceso de normalización está basado en lograr la independencia de los datos respecto a las aplicaciones que los usan. Evita la redundancia de datos. 1. Conceptos de normalización 1.2 Normalización Valida y mejora el diseño lógico que satisface ciertas restricciones, la cual evita la duplicación innecesaria de datos. Proceso de descomposición de relaciones con anomalías para producir relaciones bien estructuradas y más pequeñas. No siempre provoca el mejor rendimiento en los RDBMS. 1. Conceptos de normalización 1.3 Relaciones bien estructuradas Contiene mínima redundancia y permite que los usuarios añadan, eliminen y actualicen registros (filas) sin causar inconsistencias. La meta es evitar anomalías Anomalías de inserción: la adición de nuevas filas obliga a los usuarios a crear datos duplicados. Anomalías de eliminación: puede causar la pérdida de datos que deben ser requeridos para otras filas futuras. Anomalías de modificación: los datos cambiados obligan a cambiar otros causados por la duplicación. 1. Conceptos de normalización 1. Conceptos de normalización 1.4 Claves y dependencia funcional El valor de un atributo A (determinante) determina el valor de otro atributo B AB Clave Candidata: Unico identificador. Una de las claves que llega ha convertirse en la clave primaria. Ej. Tanto el codigo de empleado como DNI ambas son claves candidatas de la entidad Empleado. Cada campo no clave es funcionalmente dependiente de cada clave candidata. 1. Conceptos de normalización 1.5 Referencia documentaria RUC___________ Razón Social_______ Dirección_________________Teléfono____ RUC 30001 Nro 1240001 Cod Artículo Descripción Artículo Cant Prec.Unit Total Factura Fecha / / Prec.Tot. 1. Conceptos de normalización 1.6 Atributos de la Entidad Nro Factura RUC Cliente Razón Social Cod Artículo Descripción Artículo Cant Dirección Total Prec.Unit Fecha Prec.Tot. Agenda 1 Conceptos de normalización 2 Formas normales Page 12 2. Formas normales 2.1 Primera forma Normal 1FN. Eliminar atributos multivaluados (grupos repetitivos). Cada atributo debe ser atómico. 2. Formas normales 2.1 Primera forma Normal 1FN. Grupos Repetitivos y valores atómicos RUC 30001 Nro 1240001 RUC: 0000125 Razón Social: LIBRERIA PAZ Dirección: Arica 325. Lince Telefono: 553432 Cod Artículo Descripción Artículo Cant 010 100 753 Lapicero Azul punta fina Cuaderno rayado A4 Fecha 20/08/2007 200 Prec.Unit 2.50 10.00 Total Factura Prec.Tot. 250.00 2000.00 2250.00 Documento Factura visto en una única Tabla Nro_Factura RUC_Cliente Razón_Social 1240001 0000125 LIBRERIA PAZ 1240001 0000125 LIBRERIA PAZ Direccion_Cliente Total Fecha Cod_Articulo Desc_Articulo Cant Prec_Unitario Prec_Total Arica 325. Lince 2250 20/08/2007 010 Lapicero Azul punta fina 100 2.5 250 Arica 325. Lince 2250 20/08/2007 753 Cuaderno rayado A4 200 10 2000 2. Formas normales 2.1 Primera Forma Normal 1FN. Resultados de la Primera Forma Normal Grupo No Repetitivo Nro Factura RUC Cliente Razón Social Nro_Factura RUC_Cliente Razón Social 1240001 0000125 LIBRERIA PAZ Dirección Total Fecha Direccion_Cliente Total Fecha Arica 325. Lince 2250 20/08/2007 Grupo Repetitivo Nro Factura Cod Artículo Descripción Artículo Cant Prec.Unit Prec.Tot. Nro_Factura Cod_Articulo Desc_Articulo Cant Prec_Unitario Prec_Total 1240001 010 Lapicero Azul punta fina 100 2.5 250 1240001 753 Cuaderno rayado A4 200 10 2000 2. Formas normales 2.2 Segunda Forma Normal 2FN Dependencias Funcionales Cada atributo no clave debe estar determinado por toda la clave y no parte de esta. Separar dependencias funcionales parciales. 2. Formas normales 2.2 Segunda Forma Normal 2FN Dependencias Funcionales Grupo No Repetitivo Nro Factura RUC Cliente Razón Social Dirección Total Fecha Dependencias Parciales Grupo Repetitivo Nro Factura Cod Artículo Descripción Artículo Dependencias Totales Cant Prec.Unit Prec.Tot. 2. Formas normales 2.2 Segunda Forma Normal 2FN Resultados de la Segunda Forma Normal Nro Factura RUC Cliente Razón Social Nro_Factura RUC_Cliente Razón Social 1240001 0000125 LIBRERIA PAZ Nro Factura Cod Artículo Cant Dirección Total Direccion_Cliente Total Fecha Arica 325. Lince 2250 20/08/2007 Prec.Tot. Nro_Factura Cod_Articulo Cant Prec_Total 1240001 010 100 250 1240001 753 200 2000 Cod Artículo Descripción Artículo Cod_Articulo Desc_Articulo 010 Lapicero Azul punta fina 753 Cuaderno rayado A4 Fecha Prec.Unit Prec_Unitario 2.5 10 2. Formas normales 2.3 Tercera Forma Normal 3FN Dependencias Transitivas Un atributo no clave determina funcionalmente un segundo, el cual determina a un tercero. 2. Formas normales 2.3 Tercera Forma Normal 3FN Dependencias Transitivas Dependencias Transitivas Nro Factura RUC Cliente Nro Factura Cod Artículo Cant Razón Social Cod Artículo Descripción Artículo Dirección Prec.Tot. Prec.Unit Total Fecha 2. Formas normales 2.3 Tercera Forma Normal 3FN Resultados de la Tercera Forma Normal CLIENTE RUC Cliente FACTURA Razón Social RUC_Cliente Razón Social 0000125 LIBRERIA PAZ Dirección Direccion_Cliente Arica 325. Lince Nro Factura RUC Cliente Total Fecha Nro_Factura RUC_Cliente Total Fecha 1240001 0000125 2250 20/08/2007 DETALLE_FACTURA Nro Factura Cod Artículo Cant Prec.Tot. Nro_Factura Cod_Articulo Cant Prec_Total 1240001 010 100 250 1240001 753 200 2000 ARTICULO Cod Artículo Descripción Artículo Cod_Articulo Desc_Articulo 010 Lapicero Azul punta fina 753 Cuaderno rayado A4 Prec.Unit Prec_Unitario 2.5 10 2. Formas normales Diagrama Entidad Relación 2. Formas normales 2.4 Forma Normal Boyce-Codd Una relación esta en la Forma Normal Boyce-Codd si y solo si cada atributo determinante en una relación es una llave candidata. 2. Formas normales 2.4 Forma Normal Boyce-Codd Supuesto: Cada Producto tiene un único Vendedor Vendedor Cliente Cliente_Producto Cod Cliente Cod Vendedor Cod Producto Ultimo Precio Venta Producto 2. Formas normales 2.4 Forma Normal Boyce-Codd Cod Producto y el Ultimo Precio Venta son dependientes de la llave primaria. Existe una segunda dependencia del Cod Producto al Cod Vendedor, derivada de la exclusividad que tiene cada Vendedor sobre el Producto. Por lo tanto el Cod Producto es un atributo determinante capaz de ser parte de la llave primaria, pero ponerlo conjuntamente con el Cod de Vendedor seria redundante. Cod Cliente Cod Vendedor Cod Producto Ultimo Precio Venta 2. Formas normales 2.4 Forma Normal Boyce-Codd Propuesta de solución Intercambiar los atributos Cod Vendedor por Cod Producto, quedando la relación pendiente de pasar por la Segunda Forma Normal. Cod Cliente Cod Producto Cod Vendedor Ultimo Precio Venta Dependencia Parcial 2. Formas normales 2.4 Forma Normal Boyce-Codd Aplicando la Segunda Forma Normal se obtiene Cod Cliente Cod Producto Cod Producto Cod Vendedor Ultimo Precio Venta 2. Formas normales 2.5 Cuarta Forma Normal 4FN Se aplica a partir de la Forma Normal de Boyce-Codd y no contiene dependencias multivaluadas. 2. Formas normales 2.5 Cuarta Forma Normal 4FN Dependencias Multivaluadas son: Dependencias que existen cuando hay por lo menos 3 atributos A, B, C B -> A, C -> A, pero B es independiente de C. 2. Formas normales 2.5 Cuarta Forma Normal 4FN Curso (A) Profesor (B) García Administración Arce Pérez Finanzas Méndez Texto (C) Drucker Peters Jones Chang 2. Formas normales 2.5 Cuarta Forma Normal 4FN Desarrollo Curso (A) Profesor (B) Administración García Administración García Administración Arce Administración Arce Administración Pérez Administración Pérez Finanzas Méndez Méndez Finanzas Texto (C) Drucker Peters Drucker Peters Drucker Peters Jones Chang 2. Formas normales 2.5 Cuarta Forma Normal 4FN Profesor Curso (A) Profesor (B) Administración García Administración Arce Administración Pérez Finanzas Méndez Texto Curso (A) Texto (C) Administración Drucker Administración Peters Finanzas Jones Finanzas Chang 2. Formas normales 2.5 Quinta Forma Normal 5FN Una Tabla esta en Quinta Forma Normal (5FN) o Forma Normal de Proyección-Unión si está en 4FN y las únicas dependencias que existen son las dependencias de unión de una Tabla con sus proyecciones relacionándose entre las distintas proyecciones mediante la clave primaria o cualquier clave alterna. La 5FN se emplea cuando en una misma Tabla tenemos mucha información redundante, con pocos atributos o cuando una Tabla posee una gran cantidad de atributos y se hace por ello inmanejable. ¿Preguntas? Page 34