UNIVERSIDAD NACIONAL ABIERTA CENTRO LOCAL SUCRE COORDINACIÓN DE INGENIERIA “DISEÑO CON ARQUITECTURA DATA WAREHOUSING DE UN SISTEMA DE SOPORTE PARA EL MANEJO DE LA TOMA DE DECISIONES RELACIONADO CON TRANSFORMADORES ELÉCTRICOS DE LA EMPRESA ELEORIENTE, C.A.” Realizado por: Lesbia J. Ramírez de Glem Trabajo de Grado presentado como requisito parcial para optar al título de “Ingeniero de Sistemas” Cumaná, Septiembre de 2004. UNIVERSIDAD NACIONAL ABIERTA CENTRO LOCAL SUCRE COORDINACIÓN DE INGENIERIA “DISEÑO CON ARQUITECTURA DATA WAREHOUSING DE UN SISTEMA DE SOPORTE PARA EL MANEJO DE LA TOMA DE DECISIONES RELACIONADO CON TRANSFORMADORES ELÉCTRICOS DE LA EMPRESA ELEORIENTE, C.A.” Cumaná, Septiembre de 2004. INDICE Resumen........................................................................................ Dedicatoria...................................................... ............................... Índice General............................................................................... Índice de Tablas............................................................................ Índice de Figuras........................................................................... Índice de Gráficas......................................................................... PÁGINA iii iv v ix x xi 1 INTRODUCCIÓN............................................................................ CAPÍTULO I - EL PROBLEMA Planteamiento del Problema............................................................ 5 Descripción....................................................................................... 5 Problemas existentes en el Sistema de Estudio.............................. 7 Objetivos.......................................................................................... 8 Objetivo General.............................................................................. 8 Objetivos Específicos....................................................................... 8 Alcance............................................................................................. 8 Justificación del proyecto................................................................. 10 Limitaciones..................................................................................... 12 CAPÍTULO II – MARCO REFERENCIAL Organización de la Empresa en Estudio.......................................... 13 Misión de la Dirección de Operaciones........................................... 14 Misión de la Gerencia de Distribución ........................................... 15 Misión de la Coordinación de Distribución Local.............................. 17 De los Distritos Técnicos.................................................................. 18 Bases Teóricas................................................................................. 20 Minería de Datos.............................................................................. 22 Técnicas de Minerías de Datos........................................................ 24 Clasificación de los Algoritmos de Minerías de Datos...................... 25 Aplicación de la Minería de Datos en la medición del Software....... 26 Data WareHousing........................................................................... 27 OLTP v/s OLAP – Dos Mundos Diferentes...................................... 29 Arquitectura Data WareHousing....................................................... 31 Tecnologías Aplicadas al Data WareHousing.................................. 31 Glosario de Términos....................................................................... 34 CAPÍTULO III – MARCO METODOLÓGICO Tipo de Investigación....................................................................... 44 Nivel de la Investigación................................................................... 44 Alcance de la Investigación.............................................................. 44 Fuentes de Información.................................................................... 45 Técnicas de Investigación para la Búsqueda de Información.......... 45 Método de la Investigación............................................................... 46 Fase I ) Análisis del Estado Actual del Sistema............................... 47 Fase II-a ) Planeación del DWH, Diagrama de Sachman............... 48 Fase II-b ) Detectar Necesidades del Negocio................................. 49 Fase III ) Análisis y Diseño Lógico del DWH.................................... 53 CAPITULO IV - EL SISTEMA ACTUAL Fase I - Análisis del Estado Actual del Sistema............................... 72 Modelo Conceptual de Procesos...................................................... 73 Diagrama de Flujo de Datos Lógicos – Procesos Diarios................ 76 Diagrama de Flujo de Datos Lógicos – Procesos Mensuales.......... 82 Diagrama de Flujo de Datos Lógicos – Procesos Anuales.............. 85 Procesos Mensuales, Anuales y Prototipo DWH............................. 86 CAPITULO V – PLANEACIÓN Y REQUERIMIENTOS Fase II - Aspectos de la Planeación del DWH.................................. 88 Detectar las Necesidades del Negocio (Sachman).......................... 89 Perspectivas de los Requerimientos................................................ 90 CAPITULO VI – ANALISIS Y DISEÑO DWH Fase III - Análisis de las Necesidades Empresariales...................... 92 Visión de Arriba hacia Abajo (TopDown).......................................... 93 Visión y Modelaje de Fuentes de Datos........................................... 93 Visión y Modelaje de DWH............................................................... 100 Visión y Modelaje de la Consulta Empresarial................................. 102 CAPITULO VII – ANÁLISIS TECNICO-ECONOMICO Evaluación Tecnológica de la Empresa ELEORIENTE 107 Análisis Técnico – Económico 110 CONCLUSIONES Y RECOMENDACIONES Conclusiones 116 Recomendaciones 117 BIBLIOGRAF0IA 118 ENTREVISTAS 120 APÉNDICES 124 ANEXOS 164 INDICE DE TABLAS Tabla N° Página 1 Clasificación de las Técnicas de Minería de 25 2 Datos......................... 52 3 Matriz Diagrama de Sachman.......................................................... 67 4 Relación-Modelo de Datos Base de Datos Relacional y DWH........ 19 5 Categoría de Distritos Técnicos....................................................... 78 6 Base de Datos Call Center............................................................... 80 7 Base de Datos Sistema de Interrupción, Atención y Reclamos........ 81 8 Base de Datos GESCI....................................................................... 82 9 Base de Datos SAAR......................................................................... 90 10 Diagrama de Sachman....................................................................... 95 11 Estructura Tabla SIAR...................................................................... 95 12 Estructura Tabla SAAR..................................................................... 96 13 Inventario Fuentes de Datos herencia SAAR................................... 97 14 Datos Internos de Oficina................................................................. 99 15 Modelo de Datos Tema..................................................................... 107 16 Inventario Fuentes de Datos ELEORIENTE........................................ 108 17 Inventario Hardware ELEORIENTE.................................................... 111 18 Modelo Económico.............................................................................. 114 Rubros para Análisis Técnico Económico........................................... INDICE DE FIGURAS Figura N° Página 1 Etapa del Ciclo de Desarrollo del 48 2 DWH.................................................. 51 3 Amplio Rango de Técnicas para el DWH................................................ 55 4 Panorama de la Arquitectura de Referencia del DWH............................ 56 5 Componentes -Bloque Arquitectónico de Fuentes de Datos.................. 58 6 Componentes -Bloque Arquitectónico Construcción del DWH-.............. 59 7 Componentes -Bloque Arquitectónico Const. Mercado de Datos DWH- 60 8 Componentes -Bloque Arquitectónico Acceso y Uso- ........................... 61 9 Capas del DWH...................................................................................... 63 10 Interrelaciones Entre las Tres Visiones................................................... 68 11 Modelo Estrella....................................................................................... 70 12 Molde de Consulta Para Consulta Empresarial de Interrupciones......... 15 13 Organigrama Estructural ELEORIENTE ............................................... 16 14 Organigrama Estructural ELEORIENTE Dirección Operaciones........... 20 15 Organigrama Estructural ELEORIENTE Distrito Técnico...................... 74 16 DFD a Nivel de Contexto-Manejo de TED.............................................. 75 17 Modelo Conceptual de Procesos ELEORIENTE................................... 76 18 DFD a Nivel de Contexto Procesos Diarios............................................ 84 19 Diagrama de Flujo de Datos Procesos Mensuales.............................. 87 20 Diagrama de Flujo de Datos Procesos Anuales................................... 92 21 Transporte Empresarial......................................................................... 93 22 Interrelación entre las tres Visiones........................................................ 94 23 Componente del Bloque arquitectonico de fuentes de datos.................. 101 24 Bloque Arquitectónico DWH.................................................................... 101 25 Modelado Estrella DWH.......................................................................... 102 26 Molde de Consulta para una Consulta Empresarial de Interrupciones... 103 27 Componente Bloque Arquitectonico Acceso y Uso................................. 108 28 Conexiones Cableados Zonas de Eleoriente.......................................... 109 Esquema Red LAN-ELEORIENTE......................................................... INDICE DE GRÁFICAS Gráfica N° Página 1 TED quemados por Año.......................................................................... 104 2 Tiempo Total Interrupción (TTI) por Subestación................................... 105 3 TED quemados por Subestación............................................................ 105 4 TED quemados por Distrito y Año........................................................... 106 5 TED quemados por Tipo de Servicio...................................................... 106 RESUMEN El Sistema Eléctrico de la Ciudad de Cumaná presenta continuas interrupciones ocasionadas por fallas atribuibles a transformadores eléctricos de distribución; estas fallas disminuyen la facturación y afecta la rentabilidad e imagen de la empresa, lo que indujo a plantear la idea de un “Diseño con Arquitectura Data WareHousing de un Sistema de Soporte para el Manejo de la Toma de Decisiones relacionado con Transformadores Eléctricos de Distribución” y usar la metodología de “Ciclo de Desarrollo de los Sistemas de Información” (Harjinder S. Gill, Prakash C. Rao), que permita ayudar a Usuarios Finales en la Empresa ELEORIENTE. Al observar los resultados, desde varias dimensiones, muestran las variaciones en el tiempo donde se determinan las causas que afectan los eventos ocurridos, luego, se reduce la cantidad de transformadores quemados e incrementa notablemente: el desenvolvimiento de la gestión de ELEORIENTE como empresa, la facturación en el producto que se comercializa (Kilovatio-hora) y la rentabilidad del negocio para una mejor calidad del servicio. CAPITULO I EL PROBLEMA I.- Planteamiento del Problema.I.1.- Descripción La electricidad constituye uno de los eslabones de mayor importancia en la infraestructura de un país para impulsar el desarrollo económico, social y cultural; sirve de elemento básico en actividades fundamentales como las comunicaciones en sus distintos niveles. El Sector Eléctrico del país tiene como finalidad principal la satisfacción de los requerimientos de energía eléctrica que demanda tanto la colectividad como todas aquellas actividades orientadas al desarrollo económico y social del país. Para cumplir con dicho objetivo las empresas de este sector realizan todas o algunas etapas, propias de la actividad, como son: Generación, Transmisión, Distribución y Comercialización del Servicio Eléctrico. Un sistema eléctrico ideal sería aquel que generando y/o recibiendo determinada cantidad de energía logre facturar y vender la totalidad sin pérdida alguna. Entre las empresas que tienen la responsabilidad de ejecutar la administración y suministro de energía eléctrica, se encuentra la C.A. de Administración y Fomento Eléctrico CADAFE, empresa propiedad del estado venezolano. Se constituye el 27 de Octubre de 1958 con la finalidad de Operar, Administrar, Planificar, Coordinar y Controlar los Planes de Electrificación Nacional y asi contribuir al desarrollo económico del país y al bienestar de la población. Sus Empresas Filiales de Distribución y Comercialización: ELECENTRO, ELEORIENTE, ELEOCCIDENTE, CADELA y SEMDA tienen como propósito fundamental brindar una atención directa, eficiente y adecuada a cada una de las regiones del País. Con la entrada en vigencia, a partir del 17/09/00, del nuevo marco legal que regirá el servicio eléctrico en sus distintas áreas de generación, transmisión, y distribución, se establece la penalización a las empresas de comercialización de electricidad y el pago de los daños ocasionados a los usuarios por mala calidad del servicio, lo cual obliga a las empresas a llevar a cabo un plan de mejoras que tengan como metas la disminución de las pérdidas técnicas, optimizar el uso de las redes y suministrar a los clientes un servicio de buena calidad definido por la continuidad, niveles de tensión aceptables, flexibilidad del sistema eléctrico y tiempo de respuesta mínimo de atención de reclamos de los suscriptores. Las continuas interrupciones ocasionadas por fallas, atribuibles a transformadores de distribuciones, afecta notablemente el desenvolvimiento de la gestión de ELEORIENTE como empresa. Las ventas del producto que se comercializa, en este caso el Kilovatio-hora, disminuye la facturación lo que afecta no solo la rentabilidad del negocio sino la imagen de ELEORIENTE, como empresa generadora de riqueza, y la calidad de su producto, ya que toda empresa depende de sus transacciones comerciales. Esto se traduce en un serio problema de supervivencia ante la fuerte competencia que el sector promete con la aprobación de la ley donde se regula el sector eléctrico. Es por ello que los suscriptores pueden ahora negociar directamente con las empresas nuevas que se establezcan en el sector. Otro problema en la gestión lo representa la compra de transformadores la cual no se realiza bajo un buen criterio, sino que se adquieren equipos en ocasiones de una potencia diferente a la requerida y se presenta entonces un problema de subutilidad, lo que implica la colocación en el sistema de una capacidad instalada ociosa que se traduce en un capital instalado que no produce dividendos. Si esto lo hacemos extensibles a la gran cantidad de transformadores que se encuentran en servicio significa que estamos instalando un gran capital que no se utiliza. De acuerdo a la rentabilidad y competitividad, se hace necesario que la empresa maneje con eficiencia y eficacia sus recursos. Entendiendo por eficiencia el alcance de los objetivos y resultados en igualdad de condiciones con costos mínimos. Se infiere entonces, que la información predictiva del comportamiento de los equipos y sus fallas es clave para la toma de decisiones, lo que hace necesario establecer los factores de solución de la organización para definir la información veraz. Un gerente debe obtenerla, solucionarla y transmitirla a través de los canales formales de comunicación de la estructura de la organización. La empresa ELEORIENTE está formada por tres Gerencias de Zonas: Anzoátegui, Bolívar y Sucre que inspeccionan las demandas, fallas y mantenimientos de los transformadores Eléctricos, esta información se encuentra dispersa en las unidades competentes para el uso, incorporación y desincorporación de los transformadores. I.1.1.- Problemas Existentes en el Sistema de Estudio Dispersión de los Datos en la Empresa, referentes a los transformadores eléctricos, que conlleva a: ♦ Alta incidencia de fallas en los transformadores de diferentes marcas y capacidades. Por escaso mantenimiento preventivo. Pérdidas en bolívares de 3 Mil Millones de Bolívares anuales (cifra obtenida de la Gerencia de Distribución). ♦ Procesos administrativos no coordinados referentes a fallas, reparación y adquisición de transformadores. ♦ La toma de decisiones gerenciales no ajustadas a la realidad, tanto técnicas como operativas. ♦ Decisiones no confiables de adquisición de equipos a nivel del área corporativa. Todas éstas situaciones inciden en la inestabilidad del sistema; disminución de la calidad del servicio eléctrico y la paralización de nuevos desarrollos del Estado Sucre. I.2.- Objetivos I.2.1.- Objetivo General Diseñar con arquitectura de DWH un sistema de soporte para el manejo de la toma de decisiones relacionada con los transformadores eléctricos. I.2.2.- Objetivos Específicos I.- Analizar el estado actual del manejo de la toma de decisiones relacionadas con los transformadores eléctricos. II.- Aplicar la arquitectura de referencia del DWH en el diseño de un sistema de soporte para el manejo y toma de decisiones relacionados con transformadores eléctricos. III.- Diseñar la DWH. IV.- Preparar la documentación respectiva. V.- Realizar Estudio Técnico-Económico de la arquitectura propuesta. I.3.- Alcance Este trabajo está enmarcado dentro de los lineamientos de la empresa CADAFE dada la existencia de un proyecto denominada Seguimiento y Control de Gestión “STRATEGOS WEB”, orientando el diseño a una arquitectura DWH, que busca integrar en un solo sistema de información de la Filial ELEORIENTE las áreas Comercial, Operativa y Técnica para una mejor toma de decisión a nivel corporativo. A futuro podría integrarse la DWH, referida al manejo de transformadores eléctricos de éste trabajo, a la arquitectura “STRATEGOS WEB” de la empresa ELEORIENTE, ya que la arquitectura de este trabajo lo permite y el objetivo de la administración de ELEORIENTE está basado en el desarrollo de las estrategias y planes exitosos para aumentar las utilidades, mantener a los clientes satisfechos con el servicio e incrementar su participación en el mercado. La implementación de un DWH requiere de decisiones corporativas de la empresa asociadas con la compra de hardware y software, todo ello fuera del alcance de este trabajo. Para la construcción de la DWH, se requiere del apoyo corporativo para decidir acerca del software de soporte y software de aplicaciones. Ya que está implementado el sistema “STRATEGOS WEB”, el uso de la tecnología SAS sería muy apropiado como soporte de desarrollo y funcionamiento, pero esa decisión también está fuera del alcance de éste trabajo. Por otro lado, el costo del software de soporte de esa calidad se encuentra fuera del alcance financiero del trabajo. Todo ello lo limita al diseño de la DWH y, si se quiere avanzar un paso más, la construcción, tendría que limitarse a usar software de soporte de alcance limitado, pero fácilmente disponible, como es el Access y Excel. En futuros trabajos se migraría al SAS u otro software equivalente de acuerdo a los criterios de la Empresa. El desarrollo completo de la Data Warehouse requiere de tiempo y recursos mucho mayores que los destinados al proyecto así como de decisiones a nivel gerencial que podrían tomarse después de conocer las ventajas, costos y beneficios de esta solución empresarial; basados en un prototipo a implementar en este proyecto. Se suministra la información de carácter preventivo y predictivo concernientes al comportamiento del Sistema de Distribución ubicado en los Distritos Carúpano y Cumaná con una muestra desde 1998-2002. I.4.- Justificación del Proyecto La necesidad de la Empresa de mejorar la calidad de servicio justifica la creación de un sistema de información apropiado para el cumplimiento de sus objetivos. El uso de una arquitectura de DWH se justifica pues ella permite salvar los obstáculos encontrados al estudiar la situación actual del manejo de información y la toma de decisiones respecto a los transformadores eléctricos: La DWH toma en consideración los siguientes aspectos: ♦ Dispersión de la información soportada por diversas tecnologías de base de datos; ♦ Necesidad de disponer de herramientas de análisis ajustadas a los requerimientos de quienes toman decisiones; ♦ Diversidad de usuarios a diferentes niveles de la Empresa; ♦ Capacidad de crecer y de acoplarse a sistemas de información que se están diseñando para la Empresa. La arquitectura de DWH no es un simple sistema de datos; requiere de la integración óptima de varias tecnologías de información: tecnología de datos, de aplicaciones, de comunicación y de soporte para el incremento de la productividad y la calidad de servicio de la empresa. Existe, además, una metodología específica para el diseño, construcción e implementación de una DWH, temas que no son tratados dentro del plan de estudios de la carrera. La DWH no es solo un almacén de datos o una base de datos que se alimenta de otras; es todo eso y mucho más: adquiere información de las diferentes bases de datos de la Empresa, la preprocesa para almacenarla de manera uniforme y le da valor agregado para operarla y responder a usuarios gerenciales. Dentro de las actividades de la Empresa ELEORIENTE que sustentan el Sistema de Información DWH se encuentran: la optimización de los servicios para controlar las fallas de sus equipos; la colocación de los equipos apropiados; el análisis del impacto ambiental de sus planes de mercado; el análisis de las frustraciones de los clientes por deficiencia del servicio; la administración de los costos de los activos corporativos. Desde una perspectiva técnica, la literatura en tecnología de la información opera diferentes visiones de una DWH: “El DWH es un proceso, no un lugar”- META Group; la dispersión de los datos y la variedad de usuarios, desde el área operativa hasta el nivel corporativo, implica un proceso complejo que se ajusta a la arquitectura del DWH. “Un DWH es una arquitectura, no un producto” – Gartner Group; El problema enfrentado con éste trabajo no necesita de un simple sistema de Base de datos sino una solución integral desarrollada alrededor de una arquitectura bien definida. “No se puede comprar un DWH; hay que construirlo” – ComputerWord, 6 de febrero de 1995; el DWH y su construcción requiere de un estudio amplio sustentado por las necesidades generales y la disponibilidad de software y hardware de la Empresa ELEORIENTE. Las consideraciones anteriores conforman un requisito para el desarrollo de un sistema de información que utilice una metodología de integración de la información para la mejor toma de decisiones. Por lo tanto en este trabajo se va a desarrollar y diseñar un Sistema de Información con las estrategias y arquitectura de Data Warehousing. I.5.- Limitaciones Entre las limitaciones encontradas para llevar a cabo este proyecto de investigación se pueden mencionar: o Dificultad al realizar las entrevistas al personal en horas laborables. o Diversidad de personas que manejan la misma información tanto en forma manual como computarizada. o Debilidad y desorganización de los sistemas de información del área operativa. o Ubicación geográfica extensa que dificulta una información histórica efectiva. CAPITULO II MARCO REFERENCIAL II.1.- Organización de la Empresa en Estudio En este capítulo se estudia la información que alimenta los procesos del área operativa en la Zona Sucre de la Empresa ELEORIENTE. La electricidad constituye uno de los eslabones de mayor importancia en la infraestructura de un país para impulsar el desarrollo económico social y cultural; sirve de elemento básico en actividades fundamentales como las comunicaciones en sus distintos niveles. El Sector Eléctrico del país tiene como finalidad principal la satisfacción de los requerimientos de energía eléctrica que demanda tanto la colectividad como todas aquellas actividades orientadas al desarrollo económico y social del país. Para cumplir dicho objetivo las empresas de este sector realizan todas o algunas etapas, propias de la actividad, como son: Generación, Transmisión, Distribución y Comercialización del Servicio Eléctrico. Entre las empresas que tienen la responsabilidad de ejecutar la administración y suministro de energía eléctrica, se encuentra la C.A. de Administración y Fomento Eléctrico CADAFE, empresa propiedad del estado venezolano. Se constituye el 27 de Octubre de 1958 con la finalidad de Operar, Administrar, Planificar, Coordinar y Controlar los Planes de Electrificación Nacional con el fin de contribuir al desarrollo económico del país y al bienestar de la población. En el año 1990 se inicia el proceso de descentralización y reestructuración de Cadafe, bajo la filosofía de holding eléctrico, integrado por: a) la Casa Matriz – sede en Caracas, cuya función es emitir las políticas y lineamientos generales y evaluar el cumplimiento de las mismas. b) DESURCA – Desarrollo Uribante Caparo, Empresa de Generación y Transmisión. C) Las Empresas Filiales de Distribución y Comercialización que tiene como propósito fundamental brindar una atención directa, eficiente y adecuada a cada una de las regiones son: ELECENTRO, ELEORIENTE, ELEOCCIDENTE, CADELA y SEMDA. En el año 1999 se reestructura el área de operaciones de CADAFE y sus Empresas Filiales al formarse con nivel de dirección el área de operaciones. Así mismo se forman las gerencias de Generación, Transmisión y Distribución y tiene como objetivo coordinar las operaciones y mantenimiento del Sistema Eléctrico. Se separan las funciones y responsabilidades de transmisión y distribución. Las Coordinación de Transmisión está encargada de la operación y mantenimiento de las subestaciones y líneas de transmisión 115 kV, dependen estructuralmente de la gerencia de transmisión de la filial con la variante de que los mismos tendrán un enlace de coordinación de Distribución y Comercialización para mantener informados en los aspectos que se consideren convenientes. II.1.1.- Misión de la Dirección de Operaciones Garantizar la óptima calidad técnica y continuidad del servicio eléctrico al coordinar de manera integral y eficiente las labores de generación, transmisión y distribución y contar con un recurso humano calificado y tecnología actualizada, ver Figura N° 12. Las Funciones son: 1) Formular y hacer cumplir las políticas que en materia de generación, transmisión y distribución se dicten para mejorar la calidad del servicio eléctrico. 2) Planificar, dirigir y controlar la realización de los procesos referidos a generación, transmisión y distribución. 3) Evaluar integralmente el comportamiento del sistema eléctrico al detectar sus debilidades y fortalezas. 4) Evaluar la ejecución de las metas programadas por las Gerencias de Generación, Transmisión y Distribución. 5) Aprobar y/o proponer a las instancias superiores la compra de equipos y materiales requeridos para la cooperación y mantenimiento del sistema eléctrico. P R E S ID E N C IA D E E L E O R IE N T E D IR E C C IÓ N D E O P E R A C IO N E S G E R E N C IA D E D IS T R IB U C IÓ N OTRAS U N ID A D E S OTRAS U N ID A D E S C O O R D IN A C IÓ N DE D IS T R IB U C IÓ N L O C A L FUENTE: Manual de Dirección de Figura N° 12 Operaciones – Febrero 1999 Organigrama Estructural – ELEORIENTE II.1.2.- Misión de la Gerencia de Distribución Coordinar la implantación, supervisión y control de programas integrales de operación y mantenimiento en las Zonas de Distribución (Zona Sucre), Funciones: 1) Consolidar y analizar las estadísticas e indicadores referentes al comportamiento del sistema de distribución y suministrar la información ante las instancias competentes 2) Supervisar la gestión de operación y mantenimiento del sistema de distribución, a fin de constatar el logro de sus metas. 3) Velar por la administración de los recursos de mantenimiento centralizados, a objeto de garantizar su correcto y oportuno uso por parte de cada una de las Coordinaciones de Distribución. 4) Consolidar y analizar las estadísticas referidas al comportamiento de equipos y realizar las propuestas de mantenimiento a que hubiere lugar. 5) Discutir y establecer con las Coordinaciones de Distribución las metas propuestas. 6) Evaluar los nuevos desarrollos tecnológicos del área y determinar su factibilidad de aplicación. 7) Analizar el sistema de distribución y proponer las modificaciones a que hubiere lugar. 8) Coordinar, evaluar y validar la actualización de los manuales de operación. 9) Realizar estudios para la optimización de costos de operación. 10) Mantener interacción con la red troncal de transmisión y el Despacho de Carga. 11) Detectar las necesidades de adiestramiento y sugerir programas al respecto. 12) Coordinar la recuperación de materiales (Ver Figura N° 13). PRESIDENCIA DE ELEORIENTE DIRECCIÓN DE OPERACIONES OTRAS UNIDADES GERENCIA DE DISTRIBUCIÓN COORDINACIÓN DE DISTRIBUCIÓN TELECOMUNICACIONES DISTRITOS TÉCNICOS GRUPO DE MANTENIMIENTO MANTENIMIENTO ESPECIALIZADO CENTRO DE OPERACION DE DISTRIBUCIÓN GRUPO DE OPERACIONES FUENTE: Manual de Dirección de Figura N° 13-Organigrama Estructural – ELEORIENTE Operaciones – Febrero 1999 Dirección de Operaciones. II.1.3.- Misión de la Coordinación de Distribución Local Garantizar la continuidad y calidad de servicio prestado a los clientes al dirigir, programar, coordinar y controlar las intervenciones en el sistema eléctrico de distribución; cumplir con las políticas y lineamientos corporativos, y utilizar un recurso humano altamente calificado con la tecnología más adecuada. Sus funciones son: 1) Cumplir y hacer cumplir las políticas que en materia de operación y mantenimiento, planificación y obras se dicten para mejorar la calidad del servicio eléctrico. 2) Supervisar los programas y estrategias de mantenimiento ejecutados por los distritos técnicos, Mantenimiento Especializado y Telecomunicaciones a fin de garantizar su cumplimiento en el tiempo previsto. 3) Evaluar la ejecución de las metas programadas por cada una de sus unidades organizativas. 4) Supervisar el cumplimiento de normas y los procedimientos a seguir para maniobrar y operar de manera confiable y segura el sistema eléctrico de distribución. 5) Velar por la correcta administración de los contratos de obras, conforme, conforme a lo establecido en las cláusulas contractuales. 6) Coordinar con los despachos de cargas la ejecución de las maniobras que involucren manejo de grandes bloques de energía requerida por el sistema eléctrico 7) Evaluar los planes de servicio requeridos por los usuarios actuales y potenciales. 8) Supervisar controlar y avalar todos los gastos que deben realizarse para garantizar la operación confiable y el mantenimiento del sistema. 9) Suministrar de manera oportuna y confiable la información sobre operación y mantenimiento requerida por las unidades de la Filial. 10) Prestar asistencia técnica a las otras unidades de la empresa que para el desempeño de sus funciones así lo requiera. 11) Coordinar con la Gerencia de Planificación y Desarrollo los requerimientos de expansión o modificaciones del sistema eléctrico de distribución. 12) Cumplir o hacer cumplir los programas de seguridad integral, según las políticas y lineamientos que dicten la Coordinación de Seguridad Industrial y la Gerencia de Seguridad y Prevención. II.1.4.- De los Distritos Técnicos En lo que respecta a los Distritos Técnicos, su importancia obedece a que deben mantener el buen funcionamiento de las instalaciones que conforman el sistema eléctrico de distribución en su área de cobertura y por estar desagregados en diferentes poblaciones y ciudades de importancia para la zona a la cual pertenecen. La categorización de los Distritos se realizó con las siguientes variables: • Variable Principal: kVA instalados por kilómetros de líneas. • Variables Secundarias: • KVA instalados respecto al total de kVA de la zona. • Kms de línea de alta tensión respecto al total Kms. De línea de alta tensión de la zona. • Total de puntos de alumbrado público de la zona. • Total de bancos de transformadores del distrito respecto al total de bancos de transformadores de la zona. • Importancia de la ciudad sede del distrito con relación a las Fuerzas Vivas. • Contribución de la facturación con respecto a la facturación total de la zona. Esto implica que un Distrito puede desplazarse de una categoría menos compleja a otra más compleja dependiendo de cómo se comporten las variables que lo tipifican (Ver Tabla N° 4). CATEGORÍA FILIAL ZONA DISTRITO ELEORIENTE Sucre Cumaná X Carúpano X Anzoátegui I Pto. La Cruz X Barcelona X El Tigre X Anaco X Clarines Bolívar II Puerto Ordaz III IV X X San Félix Upata El Callao FUENTE: Manual de Dirección de Tabla N° 4 - Categorización de los Distritos Técnicos Por Filial y Zonas de Distribución. Operaciones – Febrero 1999 II.1.5.- Del Distrito Técnico El estudio se realizará con los datos a obtener en éste distrito como: número de transformadores instalados por líneas, fallas ocasionadas en sitio, fecha de ocurrencia de la falla, marca y serial del transformador. ( Ver Figura N° 14). DISTRITO TECNICO II GRUPO MANTENIMIENTO SECCIÓN DE LINEAS GRUPO DE OPERACIONES SECCIÓN DE LÍNEAS FUENTE: Manual de Dirección de Figura N° 14-Organigrama Estructural – Eleoriente Operaciones – Febrero 1999 Distrito Técnico II.2.- Bases Teóricas Un importante factor de competencia de nuestra época en las empresas, es el buen uso de información transformándola en un activo que incrementa sus ventajas competitiva. Para ello, muchas empresas instalan herramientas que les permiten almacenar, recuperar, acceder, analizar y distribuir información a través de distintas plataformas y aplicaciones con la finalidad de proporcionar información procesada para el objetivo deseado en el lugar y momentos precisos. Esto conlleva a adaptar nuevas herramientas informáticas para asistir en la toma de decisiones, automatización de procesos y gestión del flujo de trabajo. En la actualidad; si combinamos las diferentes aplicaciones de gestión de la información como por ejemplo: recopilación de la información sobre “Puntos de Ventas”, almacenamiento de datos (Datawarehousing) y la extracción de datos (Datamining); permite analizar diariamente las ventas del comercio y mejorar sus márgenes en varios puntos porcentuales al poder preveer los hábitos de compra. Otros ejemplos de aplicaciones orientados a la información para aumentar la competitividad incluyen: • Servicio al Cliente • Operación en efectivo • Visión Global de la Gestión • Internet e Intranet Data Warehousing y Data Mining: El mundo de los Sistemas de Soportes de Decisiones (SSD) ha creado varias arquitecturas de información. La más notable de las estructuras SSD es el Data Warehouse (DWH) que contiene datos históricos comunes en toda la organización, la información puede estar sumarizada y/o detallada. Los datos que alimentan los sistemas de Data warehouse los proporcionan los sistemas operacionales, también denominados sistemas de ejecución de procesos de negocios. Incorporado en un DWH existe potencial para la explotación de los datos (Data Mining) puede hacerse crecer de manera apropiada los datos y son recolectados y guardados en un almacén o depósito de datos (Data warehousing), que a su vez sea un sistema de gestión de base de datos relacional diseñado específicamente para ofrecer las necesidades de los sistemas de análisis de información. Para optimizar la operacionalidad de la DWH, los sistemas de análisis responden a los requerimientos de los usuarios de esa información. Se trata de una nueva técnica que posibilita la extracción de datos de los sistemas operacionales, facilita la integración y homogeneización de los datos de toda la empresa. En otras palabras el almacén de datos los provee ya transformados y sumarizados, por lo tanto crea el entorno apropiado para un uso más eficiente de las herramientas de Sistema de Soporte de Decisiones (SSD) y Sistema de Información Ejecutiva (SIE). Las empresas actuales poseen grandes bases de datos en las que almacenan cantidades de datos importantes. Ahora bien, dado el considerable tamaño de estas bases de datos, la mayor parte de esta información resulta inaccesible. Para poder aprovechar esta importante fuente de información, se están desarrollando nuevas técnicas de minería o prospección de datos con objeto de transformarlos en información práctica. Cada día se hace más exclusiva la necesidad de obtener datos objetivos que permitan evaluar, predecir y mejorar la calidad del software así como el tiempo y costo del desarrollo del mismo. II.2.1.- Minería de Datos Según Elena Irina Neaga (1999), la minería o prospección de datos es una técnica que permite la consulta de grandes bases de datos para buscar patrones y tendencias ocultas que, de otra forma, pasarían desapercibidos entre la inmensa cantidad de datos almacenados. Estas tendencias pueden contener información vital sobre una multitud de temas. Para Neaga (1999), el proceso consta de tres etapas: exploración donde se preparan los datos almacenados en la base de datos, esto es, limpia, transforma los datos y los fracciona en grupos para que la información sea más manejable. La segunda etapa implica la construcción de un modelo que permita predecir los resultados contenidos en la base de datos y explicar las variaciones que se producen en los resultados. En la fase de verificación de esta segunda etapa, se prueba el modelo con distintas muestras para garantizar que proporciona resultados coherentes. La etapa final, la de utilización, aplica el modelo a datos nuevos para realizar predicciones. La técnica resulta especialmente útil para elaborar planes estratégicos a largo plazo a partir de la información existente sobre la producción. Actualmente, además de continuar el desarrollo de esta terminología de minería de datos, se exploran métodos que permite mejorar sus modelos. Otras áreas de trabajo son las denominadas "mining databases" o bases de datos de prospección; éstas contienen historiales de funcionamiento y rendimiento de las industrias. Las bases de datos de prospección aprovechan la minería de datos para determinar las necesidades, tendencias y objetivos en el diseño de nuevos sistemas de fabricación y el desarrollo de nuevas aplicaciones para el diseño de sistemas de fabricación. Los nuevos métodos de minería de datos permitirán a las industrias manufactureras aprovechar sus propias bases de datos, obtener un valioso registro de sus historiales comerciales y cumplir los objetivos a largo plazo. Cit. Irina Neaga (1999). La construcción de modelos sobre diferentes aspectos del software requiere la recolección de numerosos datos procedentes de observaciones empíricas. Los avances tecnológicos actuales posibilitan la rápida obtención de grandes cantidades de datos de fuentes muy diversas, así como el almacenamiento eficiente de los mismos. Dichos datos encierran información muy valiosas que puede tratarse mediante los métodos tradicionales de análisis de datos, sin embargo estos métodos no son capaces de encontrar toda la información útil latente en la gran masa de datos que se maneja. En ese contexto, las técnicas de minería de datos surgen como las mejores herramientas para realizar exploraciones más profundas y extraer información nueva, útil y no trivial que se encuentra oculta en grandes volúmenes de datos. La minería de datos es un arma esencial en el arsenal del soporte de decisiones del analista, auxilia a los usuarios empresariales en el procesamiento de vastas reservas de datos para descubrir “relaciones insospechadas”, por ejemplo entre productos y clientes. La meta es descubrir “revelaciones estratégicas competitivas” para controlar la participación en el mercado y las utilidades. Los seres humanos tienen agudeza para percibir excepciones y anormalidades pero no tienen la potencia y la capacidad para inferir relaciones en grandes volúmenes de datos. Sin embargo una vez extraídas las relaciones y presentadas a los analistas empresariales, éstos las examinan y seleccionan las más interesantes y útiles. Cit. Por Harjinder S. Gill y Prakash C. Rao. II.2.2.- Técnicas de Minería de Datos La minería de datos ha dado lugar a una paulatina sustitución del análisis de datos dirigido a la verificación, por un enfoque de análisis estadístico orientado hacia el descubrimiento del conocimiento (descubrir información sin necesidad de formular previamente una hipótesis). La aplicación automatizada de algoritmos de minería de datos permite detectar fácilmente patrones en los datos, razón por la cual ésta técnica es mucho más eficiente que el análisis dirigido a verificación cuando se intenta explorar datos procedentes de repositorios de gran tamaño y elevada complejidad. Las técnicas de minería de datos se encuentran en continua evolución como resultado de la colaboración entre campos de investigación tales como: bases de datos, reconocimiento de patrones (análisis de fractal), inteligencia artificial, sistemas expertos, estadística, visualización, recuperación de información y computación de altas prestaciones, herramientas de propietario. El Análisis Estadístico, se usa para detectar patrones no usuales de datos que se explican mediante modelos estadísticos y matemáticos como el análisis de regresión continua y logística, el análisis de varianza y multivariado, y el análisis de series históricas. Las herramientas de análisis estadístico existen desde hace tiempo y son las más desarrolladas que se tienen para minería de datos. Han servido para reducir el tiempo de análisis, al liberar los recursos limitados para otras actividades de análisis, lo que a su vez conduce a una mejor toma de decisiones. II.2.3.- Clasificación de los Algoritmos de Minería de Datos a).- Supervisados o Predictivos: Predicen el valor de un atributo (etiqueta) de un conjunto de datos. A partir de datos cuya etiqueta se conoce, se induce una relación entre dicha etiqueta y otra serie de atributos. Esas relaciones sirven para realizar la predicción en datos cuya etiqueta es desconocida. Esta forma de trabajar se conoce como aprendizaje supervisado en dos fases: entrenamiento, es decir, construcción de un modelo al usar un subconjunto de datos con etiqueta conocida y prueba del modelo sobre el resto de los datos. b).- No Supervisados o de Descubrimiento del Conocimiento: Cuando una aplicación no es lo suficientemente madura no tiene el potencial necesario para una solución predictiva, por lo que se descubren patrones y tendencias en los datos actuales (no utilizan datos históricos). El descubrimiento de esa información sirve para llevar a cabo acciones y obtener un beneficio (científico o de negocio) de ellas. Ver Tabla N° 1, para algunos ejemplo de esos algotitmos. Supervisados No Supervisados Árboles de Decisión Detección de desviaciones Inducción neuronal Segmentación Regresión Agrupamiento (“clustering”) Series Temporales Reglas de asociación Patrones secuenciales FUENTE: María Moreno, Quintales, Francisco García Luis Tabla N° 1 Clasificación de las Técnicas de Minería de Datos La aplicación de los algoritmos de minería de datos requiere la realización de una serie de actividades previas encaminadas a preparar los datos de entrada debido a que, en muchas ocasiones dichos datos proceden de fuentes heterogéneas, no tienen el formato adecuado o contienen ruido. Por otra parte, es necesario interpretar y evaluar los resultados obtenidos. El proceso completo consta de las siguientes etapas [Cabena et al., 1998]: 1) Determinación de Objetivos 2) Preparación de Datos - Selección: Identificación de las fuentes de información externas e internas y selección del subconjunto de datos necesario. - Preprocesamiento: Estudio de la calidad de los datos y determinación de las operaciones de minería que se pueden realizar. 3) Transformación de Datos: conversión de datos en un modelo analítico. 4) Minería de Datos: tratamiento automatizado de los datos seleccionados con una combinación apropiada de algoritmos. 5) Análisis de resultados: interpretación de los resultados obtenidos en la etapa anterior, generalmente con la ayuda de una técnica de visualización. 6) Asimilación de conocimiento: aplicación del conocimiento descubierto. Aunque los pasos anteriores se realizan en el orden en que aparecen, el proceso es altamente iterativo, estableciéndose retroalimentación entre los mismos. Además, no todos los pasos requieren el mismo esfuerzo, generalmente la etapa de preprocesamiento es la más costosa ya que representa aproximadamente el 60 % del esfuerzo total, mientras que la etapa de minería sólo representa el 10%. II.2.4.- Aplicación de la Minería de Datos en la Medición del Software Las técnicas de minería de datos se utilizan desde hace varios años para obtener patrones en los datos y para extraer información valiosa en el campo de la Ingeniería del Software. Entre estas aplicaciones podemos citar la utilización de árboles de decisión en la construcción de modelos de clasificación de diferentes características del desarrollo de software [Khoshgoftaar y Allen, 1999] [Porter y Selby, 1990] [Tian y Palma, 1998], la aplicación de técnicas de “clustering” en la planificación del mantenimiento [Krohn y Boldyreff, 1999] y en la estimación de la fiabilidad del software [Podgurski et al., 1999] o el uso de redes neuronales en la predicción de riesgos de mantenimiento en módulos de programa [Khoshgoftaar y Lanning, 1995]. La mayor parte de los trabajos realizados están dirigidos a la obtención de modelos de estimación de esfuerzo de desarrollo [Srinivasan y Fisher, 1995] y modelos de predicción de diferentes aspectos de la calidad del software [Khoshgoftaar et al., 1997]. En ambos casos, las métricas tanto de productos como de procesos juegan un papel importante, constituyendo la base para la construcción de los modelos y posterior validación de los mismos. En publicaciones recientes aparece la introducción de algoritmos de minería en la realización de validaciones de modelos obtenidos mediante otras técnicas. En estos trabajos se comprueba la validez de modelos de estimación mediante: métodos de regresión, redes neuronales, algoritmos genéticos, etc. [Dolado, 2000], se validan métricas, e incluso “frameworks” de medición, [Mendonça y Basili, 2000]. II.3.- Datawarehousing La definición más conocida fue propuesta en 1992 por Inmon [MicroSt96], considerado el padre de las Bases de Datos: “Un DWH es una colección de datos orientados a temas, integrados, no-volátiles y variante en el tiempo, organizados para soportar necesidades empresariales”. Dicho de otra manera, “Un DWH es un conjunto de datos integrados orientados a una materia, que varían con el tiempo y que no son transitorios, los cuales soportan el proceso de toma de decisiones de una administración.”. En 1993, Susan Osterfeldt [MicroSt96] publica una definición de DWH: “Yo considero al DWH como algo que provee dos beneficios empresariales reales: Integración y Acceso de datos. La DWH elimina una gran cantidad de datos inútiles y no deseados, como también el procesamiento desde el ambiente operacional clásico”. El objetivo del DWH será el de satisfacer los requerimientos de información interna de la empresa para una mejor gestión. El contenido de los datos, la organización y estructura son dirigidos a satisfacer las necesidades de información de los analistas. El DWH es el lugar donde la gente puede accesar los datos. Los términos DataWarehouse, Datawarehousing, DWH serán utilizados en forma indistinta. El DW convierte los datos operacionales de una organización en una herramienta competitiva, por hacerlos disponibles a los empleados que lo necesiten para los análisis y toma de decisiones. La última definición refleja claramente el principal beneficio que el datawarehouse aporta a la empresa; eliminar aquellos datos que obstaculizan la labor de análisis de información y entregar la información que se requiere en la forma más apropiada, facilitando así el proceso de gestión. Puede considerarse que el modelo relacional en el cual se basa, OLTP (Procesamiento Transaccional en Línea), tiene como objetivo guardar la integridad de la información necesaria para operar un negocio de la manera más eficiente. Sin embargo, este modelo no corresponde a la forma como el usuario percibe la operación de un negocio. De hecho Codd, quien fue uno de los desarrolladores originales del concepto relacional, dijo: "Aunque los RDMBMS han sido tan beneficiosos para los usuarios, nunca han sido diseñados para proporcionar funciones potentes de síntesis, análisis y consolidación de los datos" [Corey93]. DWH se sustenta en un procesamiento distinto al utilizado por los sistemas operacionales, OLAP (Procesamiento Analítico En Línea), el cual surge como un proceso para ser usado en el análisis de negocios y otras aplicaciones que requieren una visión flexible del negocio. Para Jesús Ibarra, define el Data Ware House bajo dos aspectos fundamentales: LO QUE ES: • Arquitectura para análisis de información. • Un repositorio estructurado estratégico de la empresa, de todos los tipos de datos, para la toma de decisiones en todos los niveles y áreas de negocios de la empresa. • Almacena datos históricos (variables en el tiempo y no volátiles) atómicos y sumarizados. OBJETIVOS FUNDAMENTALES • Conocer más el negocio • Ordenar lo que ya se conoce • Efectuar un análisis de datos • Detectar a que área de negocio se quiere llegar. • Obtener datos integrados. II.3.1.- OLTP v/s OLAP: Dos Mundos Diferentes Conocer las diferencias entre estos dos tipos de sistemas es muy importante en especial para diseñadores, ya que ellos necesitan ver estas diferencias para poder llevar a cabo de mejor manera un proyecto de esta naturaleza. Las diferencias entre ambos procesamientos se establecen en distintos ámbitos; el siguiente es un paralelo entre ambas filosofías: a) En el OLTP se carga la información para un tiempo determinado; en OLAP se pueden hacer consultas en la base de datos sin que halla cambios en ella durante el proceso; b) En OLTP los datos se reúnen y almacenan para operación y control, sin embargo en OLAP se depositan datos para consultas, análisis y divulgación; c) El OLAP es una tecnología de procesamiento análitico que crea nueva información empresarial a partir de los datos existentes, por medio de un conjunto de transformaciones empresariales y cálculos numéricos. (DWH=OLAP). Otras definiciones de OLAP: a) Presenta una vision multidimensional lógica de los datos en el DWH. La visión es independiente de cómo se almacen los datos; b) Comprende siempre la consulta interactiva y el análisis de los datos; c) Ofrece opciones de modelado analítico; d) Crea resúmenes y adiciones, incluyendo grandes cálculos para obtener proporciones y desviaciones, comprende mediciones de datos numéricos a través de muchas dimensiones; e) Crea resúmenes y adiciones como consolidaciones, jerarquías y cuestiona todos los niveles de adición y resúmenes en cada intercepción de las dimensiones; f) Maneja modelos funcionales de pronósticos, análisis de tendencias y análisis estadísticos; g) Recupera y exhibe datos tabulares en dos o tres dimensiones, cuadros y gráficas, con un pivoteo fácil de los ejes; h) Responde con rapidez a las consultas, de modo que el proceso de análisis no se interrumpe y la información no se desactualiza; i) Tiene un depósito de datos multidimensionales que almacena los datos en arreglos, los cuales son una representacion lógica de las dimensiones empresariales; j) Es mucho más habitual encontrar separado el DWH del OLTP, debido a factores bien específicos y de considerable relevancia para su desempeño. Los argumentos que favorecen el tener en máquinas separadas el OLTP del DWH son: El DWH tiene una significante y altamente variable demanda de recursos, por lo tanto puede entorpecer considerablemente el desempeño del OLTP. Los sistemas en cuestión son configurados muy diferentemente. A veces los datos del DW son integrados de múltiples sistemas OLTP remotos, y por lo tanto el DW puede verse como un conjunto de recursos centralizados. Es obvio entonces que estén físicamente separados ambos sistemas. La razón para tenerlos en la misma máquina está en el hecho de que al ser la estructura básica del DWH distinta a la del OLTP, el dato tiene que ser copiado y reestructurado por el DWH. Para ahorrar envíos de datos entre máquinas, es mejor realizar este proceso dentro de una sola. II.3.2.- Arquitectura DataWarehouse Componentes y Estructuras: Antes de describir la arquitectura Datawarehouse vamos a señalar la siguiente consideración ya generalizada, presente en la literatura: el término Datawarehouse se utiliza indistintamente para hablar de la arquitectura en sí como también para uno de los componentes que la conforman, específicamente el que tiene relación con el almacenamiento físico de los datos. Ahora, con el propósito de facilitar el entendimiento por parte del lector, haremos especial énfasis en esta parte del capítulo sobre el contexto del cual se estará hablando al hacer referencia al término Datawarehouse. La estructura básica de la arquitectura DWH incluye: • Datos operacionales: un origen de datos para el componente de almacenamiento físico DW. • Extracción de Datos: selección sistemática de datos operacionales usados para poblar el componente de almacenamiento físico DW. • Transformación de datos: Procesos para sumarizar y realizar otros cambios en los datos operacionales para reunir los objetivos de orientación a temas e integración principalmente. • Carga de Datos: inserción sistemática de datos en el componente de almacenamiento físico DW. II.3.3.- Tecnologías Aplicadas al Datawarehouse a) SAS Bodegas de Datos: La tecnología SAS Data Warehousing permite extraer los datos directamente de su sistema operacional coorporativo y transformar dichos datos en un almacén de datos optimizado para sus necesidades específicas. Es un almacén de datos diseñado para soporte de decisiones, y no para proceso transaccional. SAS lidera las ventas de software de acceso a data warehouse [03-11-2003]. La plataforma de integración SAS ETLQ permite recuperar información desde cualquier fuente, tales como aplicaciones empresariales y diferentes bases de datos. Según el informe realizado por IDC, "Worldwide Data Warehousing Tools orecast and Analysis, 2003-2007", SAS continúa siendo el ejemplo a seguir en el mercado de las herramientas de acceso al data warehouse. Así, Dan Vesset, director de investigación para la consultora, señala que "la amplitud de las herramientas y soluciones proporcionadas por SAS permiten a las organizaciones reducir la complejidad de la integración del software y los costos de mantenimiento". La estrategia de integración de datos de SAS implica convertir dichos datos en un recurso disponible y generalizado, sin importar la fuente o plataforma en donde residan. De acuerdo con esto, SAS ETLQ (Extracción, Transformación y Carga integrada con Calidad de Datos) es la plataforma de integración que permite a los usuarios recuperar datos desde cualquier fuente, incluyendo aplicaciones empresariales tales como Oracle, Peoplesoft, Siebel y SAP, así como una variedad de bases de datos relacionales, no-relacionales y otras fuentes. Además, la tecnología de acceso de SAS incluye herramientas de explotación de metadatos y los nuevos SAS Data Surveyors, que permiten a los usuarios entender las complejas estructuras de datos de las aplicaciones empresariales y cargar de información los data warehouse más rápidamente. Como resultado, Tho Nguyen, director de estrategias de integración en SAS, afirma que "ayudamos a nuestros usuarios a proteger y explotar sus activos corporativos; es más, la tecnología SAS permite que los datos sean extraídos desde cualquier localización: aplicaciones empresariales, bases de datos relacionales o preexistentes. Los usuarios de SAS saben que sus datos pueden ser de rápido acceso y transformación para la toma de decisión cuando ellos lo necesiten". b) Tecnología SPECTRUM Data Warehouse Es una arquitectura abierta basada en SQL que soporta las bases de datos Oracle, Sybase y Microsoft SQL Service. Lo que permite a los clientes mejorar su destreza actual en bases de datos. Por su arquitectura abierta, aplicaciones compatibles con ODBC, como reportes de Excel Access y Cristal, pueden ejecutarse a través del Warehouse para visualizar, reportar y otros propósitos. El objeto es ayudar a las organizaciones a facilitar la toma de decisiones de negocios, mediante la asistencia al personal de informática para la rápida implementación de un DWH totalmente funcional. Esta es una labor que poco se entiende por el largo proceso de instalación y la fuerte inversión de capital requerido, aunque las grandes empresas han empezado a considerar al DWH como básico para las compañías. Según PCMagazine aumentará las metodologías y las herramientas de Data Warehouse, los Data Warehouse (DWH) son muy importantes para la mayor parte de las grandes empresas, debido a que ayudan a resolver varios problemas que, por varios años padecieron las organizaciones de Tecnologías de la Información (TI) y los usuarios finales. En realidad, las personas que toman las decisiones en las compañías requieren información que les ayude a elegir las mejores y más rápidas. Además, en los ambientes competitivos globales de hoy, el rápido acceso a la información adecuada es una ventaja que ayuda a las compañías a reducir costos y a colocar más pronto sus productos en el mercado. c) Otros Fabricantes: • IBM-Data Warehousing Plus! • Oracle-Warehouse Technology Iniciative (WTI) • Hewlett Packard-OpenWarehouse • Sybase-Warehouse WORKS • Informix-Data Warehouse Framework • Pyramid Technology-Smart Warehouse • AT&T GIS-Enterprise Information Factory • Prism Software-Data Warehouse Framework • Platinum Technology-Data Warehousing Iniciative II-4 Glosario de Términos Análisis de Costo beneficio: Es una técnica utilizada en el análisis de sistemas que tiene como objetivo fundamental proporcionar una medida de los costos en que se incurren en la realización de un proyecto informático y, a su vez, comparar dichos costos previstos con los beneficios esperados en la realización de dicho proyecto. Análisis de Sistemas: Es el proceso mediante el cual se estudian e interpretan los hechos del sistema actual, con el fin de especificar los requerimientos y especificaciones funcionales del nuevo sistema a desarrollar. Análisis Multidimensional de Datos: Análisis simultáneo de múltiples dimensiones de datos. Arquitectos: Son los responsables de establecer las bases del DWH. Son los responsables de interpretar los requerimientos del inversionista y diseñar la arquitectura del DWH que los cumpla. Les interesa la duración, la modulación, la facilidad de implementación y el grado de compatibilidad con sus tecnologías y sistemas existentes. Baja Tensión: Nivel de tensión menor o igual de 1 kV. CASE (Computer-Aided Software Engineering): Herramienta de Ingeniería Asistida por Computadoras. Permite automatizar los aspectos clave de todo el proceso de desarrollo de un sistema. Proporciona un conjunto de herramientas semiautomatizadas y automatizadas que están desarrollando una cultura de ingeniería nueva para muchas empresas. Confiabilidad del Sistema: Se define que un sistema es confiable cuando posee los controles y las seguridades del caso, permitiendo que sus resultados sean exactos y que su operación sea estable y segura. Constructores: Profesionales de la tecnologías de información que realmente construirán el DWH. Son responsables del tiempo, la calidad, el desempeño y la satisfacción de las personas que realmente emplearán el DWH cada día. Consumo de Energía: Energía eléctrica consumida y requerida por un sistema , equipo, instalación o suscriptores durante un período determinado. Su unidad básica de medida es KWh. Capacidad Instalada.- Valor del Kilovatio – amperios de la capacidad del transformador o transformadores instalados para dar servicio al suscriptor, consisten en la suma de las capacidades de cada transformador. El conjunto de varios transformadores se denomina banco de transformación. Circuito: Son todos aquellos circuitos que conforman una subestación especifica del sistema de red de distribución. Clustering: Integra la capacidad de procesamiento y memoria de varias PCs para lograr equiparar la capacidad de procesamiento de grandes servidores. Básicamente la idea es hacer trabajar muchas computadoras pequeñas y económicas en conjunto, para lograr la capacidad de procesamiento de costosos servidores. Esto se denomina Cluster de Procesamiento o Cálculo, una de las ramas en donde se ve mayor presencia de este tipo de tecnología es en laboratorios físicos, químicos y bioquímicos. Control de Gestión: Herramienta que facilita el seguimiento evaluación y control de las actividades en una organización. Su objetivo es de ayudar a los niveles gerenciales a mantener la orientación hacia el logro de metas acordadas. Demanda: Es la potencia activa requerida por un equipo, instalación o sistema en un determinado período de tiempo. Se mide y se expresa, generalmente en Kilovatios. Demanda Insatisfecha: Estimación de lña demanda adicional que se había registrado durante un período de tiempo, en el supuesto de que la empresa hubiese tenido una suficiente capacidad para atender este requerimiento. Se expresa generalmente en KW. Demanda Máxima: Punto máxomo de la potencia registrada durante un cierto período de tiempo, para atender los requisitos del sistema. Se expresa en KW. Disponibilidad de Alta Tensión: Equivale a la suma de la energía neta generada más la energía comprada. Distribución: es el sistema de línea y los equipamientos de subestación en tensiones menores de 69 KV que conduce y provee de energía eléctrica desde un punto de recepción a los consumidores finales. Densidad de Carga: Capacidad de KVA en transformadores de Distribución por Km2 del área de concesión. DWH: También denominado Data Warehouse o DataWarehousing. Distrito: La red de distribución de la zona Sucre de ELEORIENTE, comprende dos distritos principales Cumaná y Carúpano. Subestación: Campo que identifica a la subestación. Datos e Información: En general los términos datos e información se usan indistintamente, aunque se refieren a dos conceptos diferentes , ésta ambigüedad en el uso de la terminología a menudo da lugar a una comunicación deficiente. Datos: Son Hechos aislados y en Bruto. Diseño Estructurado: Es una técnica utilizada en el diseño de sistemas, para obtener la estructura modular y los detalles de proceso del sistema, partiendo solamente de la información obtenida en la fase de análisis de sistemas en ésta se define como debe estructurarse el sistema utilizando herramientas gráficas. Diagrama de Estructura de Cuadros: Es una técnica utilizada en el diseño de sistemas para modelar el sistema computarizado, visualizando modularmente el sistema, la conexión y comunicación entre los mismos, dando una visión integral de la arquitectura del sistema. Diagrama de Estructura de Datos (DED): Es una técnica utilizada en el análisis de sistemas para la modelización de datos, la cual representa un conjunto de datos relacionados entre sí y describen en forma colectiva un componente del sistema. Diagrama de Flujo de Datos (DFD): Proporciona una representación del sistema en el ámbito lógico y conceptual, describiendo el movimiento de los datos en el sistema, ya sea manual o automático, incluyendo procesos y lugares para almacenar datos. Diseño de Pruebas: Es una técnica utilizada en el diseño de sistemas que consiste en definir un programa de pruebas, para asegurar la confiabilidad del diseño y de que no existen errores en los programas que se especifiquen. Diseño de Sistemas: Es el proceso de definición de la arquitectura de software: componentes, módulos, interfaces, procedimientos de pruebas y datos de un sistema que se crean para satisfacer unos requerimientos específicos. DBMS (Data Base Manager System). Distribuidos: Son productos de software que soportan la computación distribuida a través de una red. Mínimo dos procesadores remotos separados dividen el trabajo para una transacción y uno de los dos procesadores soporta el procesamiento del DBMS. Con el surgimiento del SQL como estándar, los proveedores de DBMS, han comenzado a agregarle a sus productos funciones distribuidas o de computación cliente servidor, así como soporte para enfoques orientados al objeto, semántica de base de datos y funcionalidad. DSS: Decisión Suport System. Sistema de soporte de decisiones. Sistemas automatizados de aplicación que ayudan a la organización a tomar decisiones relacionadas con el negocio. EIS: Executive Information Systems. Un término común que usan los sistemas de consulta y generación de reportes que ejecutan adiciones y resúmenes directamente en los datos operacionales, algunas veces guardando datos resumidos y agregados en forma privada, y proporcionando capacidad de consulta y generación de reportes a quienes toman decisiones (ejecutivos). Estructura de Sachman: Una estructura para analizar y entender los sistemas de la arquitectura de la información, formulados por primera vez por John Sachman. Extracción de Datos: Modalidad de descubrimiento del análisis de datos, o analizar datos de detalles para revelar relaciones, patrones y asociaciones insospechadas o desconocidas. Ejecutivos y los administradores (inversionistas): Invierten en la tecnología del DWH y pagan el encargo de la solución del DWH. Son responsables de aprobar el presupuesto y valorar si la retribución del DWH conviene a su inversión. Le interesa la permanencia de su inversión y su retribución continua. Extracción de Datos: Modalidad del descubrimiento del análisis de datos, o analizar datos de detalle para revelar relaciones, patrones y asociaciones insospechados o desconocidos. Frame Relay: Es un protocolo de transmisión de paquetes de datos en ráfagas de alta velocidad a través de una red digital fragmentados en unidades de transmisión llamadas frame. Es una tecnología de paquete-rápido ya que el chequeo de errores no ocurre en ningún nodo de la transmisión. Los extremos son los responsables del chequeo de errores. (Sin embargo los errores en redes digitales son extremadamente menos frecuentes en comparación con las redes analógicas). Una conexión virtual permanente es exclusiva al par origen-destino y puede transmitir por encima de 1.544 Mbps, dependiendo de las capacidades del par origen-destino. Frameworks: Lista de librerías de claves para aplicaciones Web. Historia de Vida de la Entidad: Es una técnica utilizada en el análisis de sistemas que permite describir la evolución de las entidades de datos del sistema. Esta técnica utiliza las entidades de datos identificados y descritas en los diagramas de estructura de datos (DED) y en las transacciones o eventos del sistema identificado en el diagrama de flujo de datos (DFD), también constituye un poderoso instrumento para verificar la exactitud de los dos modelos antes mencionados y garantizar la coherencia entre las tres versiones del sistema. Holding: Cada operador económico debe actuar con autonomía de gestión en relación con los otros operadores, aún cuando pertenezcan a un mismo grupo empresarial. En consecuencia, la integración vertical mediante la fórmula del holding es posible, siempre y cuando cada empresa filial actúe de manera independiente. Debe existir, por tanto, unidades de gestión separadas, con contabilidad igualmente separada. La independencia de las empresas filiales se obtiene a través de recursos propios del Derecho Privado. Información: Es la adición o procesamiento de los datos que puede proporcionar un conocimiento o bien el entendimiento de dichos factores. Implantación de Sistemas: Es el proceso por el cual se instala un sistema, se crean los archivos maestros, se capacita al personal involucrado, se procesa un período de información, se efectúan ajustes al sistema y se inicia la producción del sistema. Integración de Sistemas: Es el proceso por el cual se analiza, diseña y programa las interfases entre diferentes aplicaciones, sub-sistemas y sistemas, de tal forma que no se desarrollen sistemas aislados, sino más bien interconectados que compartan archivo y base de datos comunes y se transfieran información entre ellos. Integridad de la Información: Consiste en que los valores de los datos se mantengan tal como fueron puestos intencionalmente en el sistema. las técnicas de integridad sirven para prevenir que existan valores errados en los datos provocados por el software de la base de datos o por fallas de programas o del sistema. El concepto de integridad abarca la precisión y la fiabilidad de los datos, así como la discreción que se debe tener con ellos. Integridad del Sistema: Es una característica que deben poseer los sistemas computarizados. Consiste en que se deben tener las seguridades de que el software no puede ser alterado ni la información producida puede ser accesada por personas no autorizadas, para lo cual deben existir los controles y seguridades del caso. Indicador: Elemento que permite medir prácticamente el comportamiento de las variables. Media Tensión: Nivel de tensión mayor que 1 kV y menor que 69 kV. Modelo de Métricas: Mide la calidad de los productos intermedios generados en un proyecto de software. El modelo define cuatro atributos genéricos de propiedades de calidad: consistencia, correctitud, completitud y complejidad, que tienen un significado concreto de acuerdo al tipo de artefacto software y al nivel de abstracción que éste describe. Modelización de Datos: Es una técnica utilizada en el análisis de sistemas para conseguir estructuras de datos no redundantes, sin inconsistencias, seguras e íntegras, utilizando representaciones gráficas. Middleware: El término común que se aplica al software que intercambia información en forma transparente entre aplicaciones y bases de datos. Ofrece un mecanismo de conexión abstracta entre el software de aplicación y bases de datos, y oculta al programador de aplicaciones los elementos específicos que dependen de la implementación. Optimización del Diseño Físico: Es una técnica utilizada en el diseño de sistemas para optimizar el modelo de datos elaborado en la fase de análisis de sistemas, permitiendo obtener la estructura física del sistema, así como la representación óptima de la información. OLAP: Procesamiento Analítico en Línea (On-Line Analitycal Procesing). OLTP: Procesamiento de Transacción en Línea (On-Line Transaction Procesing). Plataforma de Hardware: Es el conjunto de equipos que se utiliza para desarrollar y operar un sistema o todos los sistemas de una organización, comprendiendo el computador central, las estaciones de trabajo tales como terminales, equipos de microcomputación, impresoras, así como equipos de comunicación local en red o remotas. Plataforma de Software: Es el conjunto de software de base y aplicativos de uso general que se utiliza para un sistema determinado o para toda la organización, consistente de los sistemas operativos, sistemas de bases de datos, sistemas de redes, sistemas de comunicaciones y sistemas generales de automatización de oficinas. Prototipeo: Es una técnica utilizada en el análisis de sistemas y diseño de sistemas, que permite desarrollar con rapidez un sistema de trabajo computarizado, para posibilitar probar el diseño ante el usuario en un software provisional que permite analizar en forma física el ingreso de los datos, el procesamiento y la emisión de resultados, y poder efectuar los ajustes necesarios para el diseño definitivo. Pruebas de Integración: Son las que deben realizarse para probar la integración entre los componentes del sistema y asegurarse que encajen correctamente. Pruebas del Sistema: Son las que deben realizarse para probar el sistema globalmente. Pruebas Unitarias: Son las que deben realizarse para probar todos los componentes del sistema que se desarrollan individualmente. Pérdida de Energía: Es la medida que permite conocer el porcentaje de KWH que se pierden en la red. Este porcentaje incluye las pérdidas por causas técnicas, por sustracción de energía y por energía dejada de facturar en un período dado. Pérdida en Alta tensión: es la diferencia entre la disponibilidad en alta tensión y la energía entregada a las subestaciones de distribución y medida en el lado de baja tensión. Se expresa generalmente en KWh. Pérdida en Baja Tensión: Es la diferencia entre la disponibilidad en baja tensión y la venta en baja tensión, menos el consumo interno. Se expresa en KWh. SAS: Tecnología que permite extraer los datos del sistema operacional corporativo y transformarlos en un almacén de datos optimizado para sus necesidades específicas. Es un almacén de datos diseñado específicamente para soporte de decisiones y no para proceso transaccional. Subestación: Conjunto de Equipos e instalaciones eléctricas incluyendo las obras civiles, necesarias para la conversión, transformación, medición y/o control de la energía eléctrica. Es decir elevar o reducir la tensión y/o maniobrar los circuitos de un sistema eléctrico. Transformador: Máquina estática que por medio de inducción electromagnética, transfiere la energía eléctrica de un circuito de corriente alterna a otro, sin variar la frecuencia. Esta transferencia va acompañada generalmente, de un cambio de nivel de tensión. Usuarios del DWH: Son los profesionales de la empresa y su personal de apoyo que accederán y utilizarán el DWH como una herramienta de soporte de decisiones en su trabajo cotidiano. Usuario del Servicio: Persona natural o Jurídica que se beneficia con la prestación del servicio eléctrico, bien como titular de un contrato de servicio o como receptor directo del mismo, sujeta a los derechos y obligaciones que establece la Ley Orgánica del Servicio Eléctrico. CAPITULO III MARCO METODOLÓGICO III.1.- Tipo de Investigación Este tipo de investigación se conoce como de Proyectos Especiales y conduce nosolo a colectar información sino a crear un prototipo tangible cuyo aporte obedece al desarrollo Científico-Tecnológico del área a investigar. III.2.- Nivel de la Investigación Es descriptiva dada la necesidad de conocer el área en estudio, realizar o formular las preguntas acordes y precisas para así acercarse aún más al problema planteado. Más que descriptiva llega a ser productiva y creativa por los resultados que se logran obtener. III.3.- Alcance de la Investigación Es el paso inicial para incorporar a la empresa a un sistema de información que ayuda considerablemente a tomar decisiones en el ámbito de la gerencia regional. El área de estudio corresponde a la Empresa Filial ELEORIENTE y una de sus tres zonas denominada Zona Sucre, donde se encuentran ubicadas: la Presidencia, Direcciones y Gerencias, entre ellas la Gerencia de Zona en estudio. La muestra es de intención por ser la Zona Sucre donde la problemática de los transformadores es mayor y los datos se encuentran dispersos en el área operativa relacionada con el sistema. Como muestra se escogió la información referente a las interrupciones ocurridas en los distritos Cumaná y Carúpano, los cuales son manejados en las respectivas oficinas. Los Distritos dependen de la organización de la jefatura del COD y éstos de la Coordinación del Distribución que suministra toda la información a la Gerencia de la Zona Sucre. III.4.- Fuentes de Información La información fue obtenida mediante fuentes de investigación primarias y secundarias. 4.1) Fuentes primarias compuestas por: 4.1.1) Directores, Gerentes y Jefes de Grupo de las unidades operativas con el objeto de conocer las debilidades y fortalezas de la data para su gestión. 4.1.2) Personal administrativo que opera la información referente a entradas y salidas de transformadores en la Coordinación de Almacén. 4.1.3) Personal adscrito a la Coordinación de Distribución Local y el Centro de Operaciones de Distribución. 4.2) Fuentes Secundarias: Las principales fuentes secundarias corresponden a libros, revistas, textos, manuales del área operativa de ELEORIENTE y CADAFE, normas establecidas por la empresa CADAFE, Normas COVENIN, Ley del servicio eléctrico, Internet. III.5.- Técnicas de Investigación para la Búsqueda de Información Las técnicas de investigación están basadas en: 5.1) Encuestas por entrevistas, donde obtenemos la información mediante la presencia del entrevistador considerando los factores de neutralidad (lo que interesa es la opinión del informante) sin influir, inducir, calificar ni opinar con relación a la respuesta. 5.2) Encuestas por cuestionarios. 5.3) Observación participativa directa en la situación que se detecta de forma individual y en el medio natural donde se desarrolla. 5.4) Observación e investigación del software y hardware instalados en la Empresa ELEORIENTE. III.6.- Método de la Investigación A los efectos de diseñar, para la Empresa ELEORIENTE, un sistema de soporte para el manejo de la toma de decisiones relacionada con los transformadores eléctricos, con base en un nuevo modelo tecnológico de sistema denominado “Arquitectura de Integración de Datos DWH”, se delimita el presente estudio al análisis y diseño de un prototipo de sistema de información de transformadores eléctricos en las unidades comprendidas dentro del área operativa con respuestas hacia las gerencias, direcciones y Presidencia de la empresa. El abordaje y el estudio se hará al precisar momentos que se tomarán como fases del estudio; a saber: Fase I) Análisis del Estado Actual del Sistema. Fase II) Planeación del DWH, Detectar Necesidades del Negocio: Diagrama de Sachman 1 . Fase III) Análisis y Diseño del DWH. - Análisis de las Necesidades Empresariales (Visión y Modelaje). - Preparar y Ajustar la Arquitectura de Referencia del DWH en función a las necesidades empresariales. - Construcción y Despliegue del Prototipo de la Arquitectura de Datos DWH. III.6.1.- Detalle Conceptual de las Fases Mencionadas Fase I) Análisis del Estado Actual del Sistema Se realizó el análisis actual del sistema sobre el manejo y toma de decisiones con los transformadores eléctricos. Esta fase incluye: detectar las necesidades del negocio a través de entrevistas abiertas y semiestructuradas bajo una guía de preguntas, a los usuarios finales (directores, gerentes, coordinadores, supervisores y operarios). Con las herramientas de los modelos conceptuales de procesos, diagramas de flujo de datos en el ámbito de contexto, diagramas de flujo de datos lógicos y físicos, se establecen los diseños de acuerdo al análisis previo del sistema de información. Se analiza los modelos antes mencionados, los cuales muestran integralmente las unidades involucradas que interactúan con el sistema de transformadores eléctricos. Diagrama de Sachman: Matriz representada por la perspectiva de arriba hacia abajo, conducida por el negocio, o del dueño, al igual que el punto de vista de abajo hacia arriba, conducido por la construcción o del implementador, de un sistema de información. 1 Se revisan y validan los diseños lógicos y físicos; interfase de los usuarios; documentación; sistemas fuente; infraestructura tecnológica (hardware, software); comunicaciones, volúmenes de datos; consultas y reportes. Fase II-a) Planeación del DWH En ésta fase se contempla, el ciclo clásico de desarrollo de software, ver Figura N° 1, para ello se describe cada una de las etapas del ciclo. D espliegue o P rueb a E x pansión o D esarrollo P laneación R equerim ien to s C onstrucción A n álisis D iseñ o FUENTE: Harjinder S. Gill y Prakash Figura N 1 C. Rao,1996 Etapa del Ciclo de Desarrollo del DWH La Planeación es una etapa importante del DWH en el ciclo de desarrollo. Las decisiones tienen un impacto significativo en el ámbito de la implementación. Las decisiones clave de planeación incluyen: • La selección de un enfoque o visión de arriba hacia abajo (de lo general a lo particular). En esta visión se identifica los requerimientos o necesidades empresariales que debe cubrir el DWH propuesto. Estos son grandes conductores de la implementación del DWH. • La selección de la metodología de desarrollo en espiral, es más rápido, más fácil de redirigir un sistema desplegado con base en nuevos requerimientos que construir una solución completa basada en requerimientos inadecuados y no disponibles. • Selección de un ámbito de implementación que produzca beneficios inmediatos a un grupo de usuarios. • Selección de una arquitectura del DWH y Mercado de Datos de acuerdo a las necesidades operativas y gerenciales de la zona; actúa como un recopilador y distribuidor de información a partir de fuentes de datos por toda la organización; • Desarrolla un programa y un presupuesto para planes del proyecto; • Elabora el escenario de uso empresarial que ayuda a definir las expectativas del usuario final con respecto al DWH. • Identifica la cantidad de información necesaria, identificaciones de las dimensiones de interés de los usuarios finales e identificación de la necesidad de mercado de datos/DWH; • Recopilación de los metadatos para la definición de los datos, estos son el ingredientes de anteproyecto que se utiliza para construir el DWH. Fase II-b) Detectar Necesidades del Negocio a) Requerimientos de la Empresa: Son las especificaciones precisas de las funciones que se obtendrá del DWH. Describen con claridad el ambiente operativo en el que se entregará el DWH. Es una transición de la visión de Propietario del marco de referencia de Sachman a la visión de arquitectura. Se definen los requerimientos del propietario, del arquitecto, del desarrollador (tecnología, despliegue, de disposición para la producción de DWH) y de los usuarios finales (flujo de trabajo, de consulta, de reportes). Con el análisis del estado actual del sistema y los requerimientos obtenidos bajo un conjunto de especificaciones técnicas que serán señaladas a continuación, se logran los resultados para formular, desarrollar, implementar, desplegar y explotar el diseño del DWH (ver Figura N° 2). ♦ Técnicas Empresariales: se trata de comprender el significado de los datos que contiene el DWH, se determinan los requerimientos corporativos para traducirlos a consultas y reportes que satisfagan el DWH. El gran valor de ésta técnica está en formular estrategias que mejoren el negocio y proporcionen una ventaja competitiva. ♦ Técnicas de Análisis de Datos: se trata de entender la información cuantitativa y derivar conclusiones basadas en eventos a partir de la información histórica. Incluye la habilidad para incorporar patrones y tendencias, para extrapolar las tendencias basadas en antecedentes a fin de entender e identificar las anomalías y presentar recomendaciones de administración coherentes, relacionadas con el análisis de la información del DWH. Una parte de ésta técnica tiene como fuente las matemáticas, estadística, sicología y la intuición o la experiencia. El DWH guarda información histórica de manera organizada, permite consultas especializadas y recuperación de datos con facilidad. ♦ Técnicas de Comunicación: proporcionan a la organización interfaces gráficas para el usuario final. Uso apropiado de técnicas gráficas como la graficación, despliegues en forma de árbol, despliegues en red, curvas de tendencias y análisis multidimensionales. Esta técnica permite presentar valores numéricos y separados que conserva y organiza el DWH. Se utilizan despliegues intuitivos e informativos para que se perciban las tendencias y los puntos de análisis. Técnicas del negocio (Empresarial) DWH Técnicas del manejo del programa (Comunicación) Técnicas relacionadas con la tecnología (Análisis de Datos) FUENTE: Harjinder S. Gill y Prakash C. Figura N° 2: Amplio Rango de Técnicas para Rao,1996 el Desarrollo del DWH b) Generar Diagrama de Sachman: se establecen las pautas que el sistema debe satisfacer. Con el diagrama de ajuste descompone la complejidad en componentes manejables, se establecen los fundamentos para el análisis. Permite que diferentes personas conciban, construyan y desplieguen un DWH para clasificar las inversiones, el esfuerzo, el riesgo y las tecnologías en compartimientos bien entendidos; ayuda a pasar de los conceptos a la ejecución; apoya la idea de varios puntos de vista. Se plantea las perspectivas de requerimientos al detectar las necesidades empresariales que cumple la arquitectura. Estas necesidades son diferentes para el inversionista/dueño, el arquitecto, el constructor y el usuario. Ver Tabla N° 2. VISION DEL SISTEMA FILAS o PERSPECTIVAS COLUMNAS o PUNTOS DE VISTA Datos Función Red de ¿Que? ¿Cómo? Trabajo ¿Quien? ¿Cuando? ¿Porqué? ¿Donde? Inversionista/Dueño Arquitecto/Constructor Usuarios FUENTE: Harjinder S. Gill y Prakash Tabla N° 2 - Matriz Diagrama de Sachman C. Rao,1996 A continuación se explican las filas o perspectivas de requerimientos del Diagrama del Sistema de Información: a) Caso inversionista/dueño: el apoyo que aporta la arquitectura es un diagrama para realizar las actividades de planeación y coordinación, predecir costos e ingresos y el manejo de riesgos. Personal técnico necesario, impacto en el ambiente empresarial existente y la gente, impacto en las inversiones tecnológicas. b) Caso usuario empresarial: es la persona que usa a diario el DWH. Usa la información para conocer los objetivos de su negocio y mejorar la productividad y la eficiencia del personal y la organización. La arquitectura debe de ubicar los componentes que despliega el usuario empresarial para análisis, así como los mecanismos necesarios para transportar y entregar la información a un usuario empresarial. C) Caso diseñadores y constructores del sistema: la organización que aporta la tecnología de información (TI), se responsabiliza del desarrollo, instalación y despliegue del DWH. Se mide de acuerdo a lo siguiente: - Calidad (precisión y exactitud) de la información en DWH. - Capacidad de respuesta con los datos que reciben los usuarios empresariales. - Facilidad de uso de usuarios empresariales. - Exactitud de los formatos y contenido de los datos según la perspectiva de usuarios empresariales. - Tiempo de implementación de acuerdo con el presupuesto del proyecto. Fase III) Análisis y Diseño Lógico del DWH En el análisis se convierten los requerimientos de la etapa anterior en un conjunto de especificaciones que sirvan para el diseño. El proceso de análisis consiste en derivar modelos físicos y lógicos de datos para el DWH, los mercados de datos y definir los procesos necesarios para conectar las fuentes de datos y las herramientas de acceso de usuario final. Para el Diseño de la arquitectura de aplicación está comprendido de manera amplia en los siguientes procesos: • Procesos que son internos a las fuentes de datos y se relacionan con depuraciones o extracciones parciales de información; procesos que conectan las fuentes de datos con el DWH (o los mercados de datos sino necesitan procesamiento intermedio). • Procesos que son internos al DWH y se usan para fines de manejo interno. • Proceso que conectan al DWH con los mercados de datos (si se usan). • Procesos que son internos a los mercados de datos (si se usan) y se emplean para fines de manejo interno. • Procesos que conectan al DWH (o a los mercados de datos) con herramientas de usuario final. • Procesos que son internos al DWH y a los mercados de datos para iniciar herramientas de análisis. • Procesos que sustentan tareas de manejo, administración y prácticas internas para el DWH como sistema. a) Preparar y Ajustar la Arquitectura de Referencia del DWH. La arquitectura de referencia es un diagrama común que integra los diferentes tipos de información necesarios para construir un DWH. Divide los componentes en bloques como fuentes de datos, mercado de datos, DWH, acceso y usos (usuarios); y capas como administración de datos, administración de metadatos, transporte e infraestructura. Como se muestra en la Figura N° 3, los bloques 1, 2 y 3 se interrelacionan con la funcionalidad específica para formar la infraestructura del DWH. Las capas representan el ambiente necesario para implementar los bloques. Herramientas, tecnologías, funciones Infraestructura Transporte Administración de Metadatos Actividades de Extracción, carga y actualización para administración y mercado de datos. Administración de Datos Fuentes Fuentes dedatos datos de Constr. Constr. DWH DWH Const. Const. Mercado Mercado dedatos datos de Acceso Acceso Uso yyUso DWH DWH ADMINISTRACIONDE DEDATOS DATOS ADMINISTRACION ADMINISTRACIONDE DEMETADATOS METADATOS ADMINISTRACION TRANSPORTE TRANSPORTE INFRAESTRUCTURA INFRAESTRUCTURA FUENTE: Harjinder S. Gill y Prakash Figura N° 3 Panorama de la arquitectura de referencia del DWH. C. Rao,1996 Bloque 1 ó de fuentes de Información (ver Figura N° 4), que pueden clasificarse en: a) Datos de Producción: base de datos operacionales relacionales, no relacionales o basadas en archivos. b) Datos de Herencia: están fuera de línea, en archivos perdidos porque ya no son necesarios para apoyar aplicaciones operacionales actuales, sin embargo tienen gran valor histórico para analizar tendencias y deben introducirse en un DWH imprimiendo correctamente la fecha. c) Sistemas Internos de Oficina: como formas no electrónicas (no estructurados), reportes, hojas de cálculos, documentos de procesadores de palabras, reportes anuales, archivos secuenciales. d) Sistemas Externos: como análisis competitivos del mercado, reportes competitivos de consultores, información técnica de los proveedores. e) Metadatos para Fuentes: se refiere a la información de la definición acerca de los datos de las fuentes, incluye nombre del dato capturado y extraído de las fuentes de información, definición del contenido de los datos (campo, la fecha en que fueron creados y la fuente u origen de los datos). Fuentes de Datos Datosde de Datos Producción Producción Datosde de Datos Herencia Herencia Sistemasinterno interno Sistemas deoficina oficina de Fuentesexternas externas Fuentes Metadatospara para Metadatos fuentes fuentes FUENTE: Harjinder S. Gill y Prakash C. Figura N° 4 Componente del bloque arquitectónico de fuentes de datos. Rao,1996 Bloque 2 ó de construcción del DWH, importante bloque de la arquitectura que consiste en los siguientes componentes (ver Figura N° 5): a) Componente de Refinamiento: responsable de estandarizar, limpiar y sacudir, filtrar y confrontar, e imprimir la fecha de origen de la información extraída de las fuentes de datos seleccionadas. Se ubican los metadatos para nombre y datos estándar, se crean y capturan metadatos adicionales para imprimir la fecha en los datos extraídos, fuentes de datos extraídos y para los campos faltantes que se hayan agregado. b) Componente de Reingeniería: es el responsable de preparar los datos para que sean congruentes con las necesidades de análisis del usuario empresarial. c) Modelo de Datos del DWH: proviene del modelo de datos de la Empresa. Entre los aspectos de diseño de la base de datos están la fragmentación de los datos, áreas tema, y la granulidad que es “la cuestión de diseño más importante del DWH”. La administración de datos reduce grandes volúmenes de datos (previamente almacenados y por incluir), se usan técnicas de adición y resumen. El componente es capaz de crear datos muy resumidos a partir de una información poco condensada. Los metadatos guían al usuario en un contexto apropiado para la visualización y navegación de los metadatos para mejorar el DWH. Se reduce y condensa la información antigua y detallada. Se capturan las reglas del DWH para filtrar y ajustar, conciliar y validar, agregar y condensar como parte de los metadatos totales. Refinamiento Reingeniería DWH Estandarizar Estandarizar Integraryyseparar separar Integrar Modelar Modelar Filtraryyajustar ajustar Filtrar Condensar yy Condensar agregar agregar Condensar Condensar Limpiaryypulir pulir Limpiar Hacerun uncálculo cálculo Hacer previoyyderivar derivar previo Agregar Agregar Imprimirlalafecha fecha Imprimir delala de fuentede dedatos datos fuente Traduciryy Traducir formatear formatear Verificarlala Verificar calidadde delos los calidad datos datos Transformar Transformar yy reubicar reubicar Desarrollar Desarrollar consultascon conbase base consultas enlalaarquitectura arquitectura en Crearyyextraer extraer Crear losmetadatos metadatos los Crearmetadatos metadatos Crear CrearGlosario Glosario Crear Conciliaryy Conciliar Validar Validar Examinar Examinar navegarpor por yynavegar losmetadatos metadatos los FUENTE: Harjinder S. Gill y Prakash Figura N° 5-Componentes del bloque arquitectónico C. Rao,1996 de construcción del DWH. Bloque 3 ó de Construcción del Mercado de Datos, segundo en importancia de la arquitectura. En éste bloque se crea un mercado de datos a partir del contenido del DWH. Los componentes del mercado de datos se aplican a diferentes conjuntos de pasos de refinamiento y reingeniería para los objetivos empresariales de usuario final (ver Figura N° 6). Refinamiento y Reingeniería Filtraryyajustar ajustar Filtrar Integraryy Integrar fragmentar fragmentar Creacíón del mercado de datos Modelar Modelar Condensar Condensar Condensaryy Condensar agregar agregar Agregar Agregar Hacerun uncálculo cálculo Hacer previoyyderivar derivar previo Conciliaryy Conciliar Validar Validar Imprimirlalafecha fecha Imprimir delalafuente fuente de dedatos datos de Crearyyextraer extraer Crear losmetadatos metadatos los Desarrollar Desarrollar consultas consultas sobrelalaarquitectura arquitectura sobre CrearGlosario Glosario Crear Examinar Examinar navegarpor por yynavegar losmetadatos metadatos los FUENTE: Harjinder S. Gill y Prakash Figura N° 6 C. Rao,1996 Componentes del bloque de construcción del mercado de datos del DWH. Bloque 4 ó de acceso y uso del DWH (ver Figura N° 7), tercero en importancia, tiene dos componentes: acceso y recuperación, análisis y reporte. Este es el bloque que aporta la retribución y de valor de toda la implementación de DWH. Este componente proporciona un acceso directo al DWH sin accesar directamente el mercado de datos. También es responsable de transformar los datos recuperados en vistas multidimensionales o de almacenarlos en una base de datos multidimensional para un análisis posterior. Administrar Administrar metadatos metadatos delDWH DWH del Acceso y Recuperación Análisis y Reporte AccesoyyUso Uso Acceso delDWH DWH del Herramientasde de Herramientas reporte reporte Accesoalal Acceso mercadode dedatos datos mercado Herramientas Herramientas SSD SSD Reingeniería Reingeniería Herramientas Herramientas demodelado modelado de Empresarial Empresarial Transformaraa Transformar estructura estructura multidimensional multidimensional Herramientas Herramientas paramineria mineriade de para datos datos Creardepósito depósito Crear local local Aplicaciones Aplicaciones denueva nueva de producción producción Crearyyextraer extraer Crear losmetadatos metadatos los Reporteyy Reporte administración administración demetadatos metadatos de OLAP OLAP FUENTE: Harjinder S. Gill y Prakash Figura N° 7 C. Rao,1996 Componentes del bloque arquitectónico de acceso y uso. a.2) Definición de las Capas de la Arquitectura de Referencia a) la capa de administración de datos: sustenta las tareas de extraer, cargar, actualizar, reforzar la seguridad, archivar y restaurar el DWH. b) la capa de administración de metadatos: es responsable de la administración de los metadatos que usa el DWH, tales como la descripción completa de los datos almacenados en el DWH. c) la tarea de la capa de transporte: es transportar los datos entre los distintos bloques de la arquitectura, utiliza tecnología de actualización y duplicación, red para transferencia y entrega de datos, componentes de middleware. También aporta la seguridad y autentificación para las solicitudes de transporte. Esta capa resuelve los puentes de comunicación necesarios entre las plataformas de hardware/software que están separadas debido a la segmentación de plataformas de los diversos bloques de la arquitectura de referencia. d) la capa de infraestructura: que está compuesta por los componentes de administración del sistema, administración de flujo de trabajo, sistemas de almacenamiento y sistemas de procesamiento (ver Figura N° 8). Capa de administración de datos Extracciónyydatos datosnuevos/administración nuevos/administración Extracción desolicitudes solicitudesde deconsulta consulta de Cargar,almacenar, almacenar,actualizar actualizarsistemas sistemas Cargar, Seguridadyyautorización autorizaciónde desistemas sistemas Seguridad Archivar,restaurar restauraryypurgar purgarsistemas sistemas Archivar, Capa de administración de metadatos Admon.de deDWH, DWH,del delesquema esquemadel del Admon. mercadode dedatos datosyydel delglosario glosario mercado Admon.deextracción, extracción,creación, creación,depósito depósito Admon.de actualizaciónde delos losmetadatos metadatos yyactualización Admon.de delas lasconsultas consultaspredefinidas, predefinidas, Admon. reportes,los losíndices índicesyylos losperfiles perfiles reportes, Admon.de delalaactualización actualizaciónyylaladuplicación duplicación Admon. Admon.de deconexiones, conexiones,generación generaciónde de Admon. archivos,restauración restauraciónyypurga purga archivos, Capa de transporte Redpara paratransferencia transferenciayyentrega entregade dedatos datos Red Herramientasde demiddleware middlewareyy Herramientas agentescliente/servidor cliente/servidor agentes Sistemade deduplicación duplicación Sistema Sistemasde deseguridad seguridadyyautentificación autentificación Sistemas Capa de infraestructura Administraciónde desistemas sistemas Administración Administraciónde deflujo flujode detrabajo trabajo Administración Sistemasde dealmacenamiento almacenamiento Sistemas Sistemade deprocesamiento procesamiento Sistema FUENTE: Harjinder S. Gill y Prakash C. Figura N° 8 - Capas en DWH. Rao,1996 b) Análisis de las Necesidades Empresariales (Visiones y Modelado) El análisis más importante es el de la propia naturaleza empresarial, sus relaciones con la información y las responsabilidades de los diversos usuarios en la perspectiva empresarial, para ello se mencionan a continuación los métodos que se aplican para analizarlas a fin de modelarlas y representarlas de manera adecuada dentro del DWH: b.1) Visión de arriba hacia abajo (top-down): es donde la información se clasifica en categorías que permiten establecer prioridades en forma amplia (de lo general a lo particular). Gracias a esta visión se complementan las herramientas de generación de informes y consulta de datos de las operaciones. Es flexible y ayuda a quienes toman las decisiones a planificar y gestionar la productividad de la empresa, mediante la evaluación y análisis de los datos desde el punto de vista de las dimensiones naturales de la misma, tales como ventas por regiones, sectores de mercado, transformadores quemados por circuitos, períodos de tiempo. La Figura N° 9 muestra como se relacionan éstas visiones con los diversos componentes del DWH. Visión de Arriba hacia abajo (Permite la selección de la información CORRECTA para el DWH) Visión de Fuentes de datos Tablas De Fuente de Datos 1 Tablas De Fuente de Datos 2 Visión de DWH Visión de Consulta Empresarial Usuario Final 1 Tablas Integradas De Fuente de Datos Tablas De hechos Usuario Final 2 Tablas De Dimensión Tablas De Fuente de Datos 3 Fuentes de Datos Tablas Locales De Usuario Final Usuario Final 3 DWH y Mercado de Datos Usuarios Finales FUENTE: Harjinder S. Gill y Prakash C. Figura N° 9 - Interrelaciones entre las tres visiones. Rao,1996 b.2) Visión y Modelado de Fuentes de Datos b.2.1) Visión de Fuentes de Datos: se debe observar la información disponible y que pueda usar el DWH. Esta información es capturada, almacenada y manejada por sistemas operacionales y se les podría documentar a diferentes niveles de detalle y precisión. Las fuentes de datos se caracterizan por los aspectos siguientes: a) Tecnologías de almacenamientos múltiples bases de datos relacionales o no relacionales (IMS, DB2, Oracle, Informix, VSAM; los estándares de transmisión de datos (EBCDIC o ASCII) y los retos de conectividad (SNC, TCP/IP). b) Definiciones múltiples de datos: sinónimos y homónimos, cuando los elementos de datos tienen la misma información pero diferentes nombres o dos elementos de datos con el mismo nombre pero contiene diferentes tipos de datos. c) Campos nulos. Las aplicaciones que se construyeron no requerían la definición de dichos campos diferentes nombre. d) Diferencias de formato (tipo de datos y longitud) entre campos similares entre dos base de datos distintas, se presentan diferencias de formatos debido a que las bases de datos definieron los datos desde la estrecha perspectiva de la aplicación que sustentaban, en vez de hacerlo a partir de la necesidad de aplicar estándares organizacionales a las definiciones de datos. e) Diferencias de la codificación. Diferentes fuentes de datos emplean distintos esquemas de codificación de datos. f) Duplicidades se producen cuando dos fuentes de datos aisladas capturan información idéntica sin darse cuenta de que otro sistema captura también la misma información. Cuando la información no era parte de un campo llave y no se editó para ser única. Cuando se crean elementos largos de datos para hacerlos corresponder con elementos de datos más cortos de otra fuente de datos. Cada fuente de datos puede considerarse como una tubería que suministra datos al DWH. El reto que enfrentan los analistas del DWH es la tarea de mezclar juiciosamente el contenido de tantas tuberías, al tiempo que se conserva organizado el contenido. Por lo tanto, la tarea por realizar consiste en: - Modelar o representar las fuentes de datos de herencia mediante los términos y definiciones de elementos de datos que usan actualmente (representación tal cual). Este es el “inventario” de las fuentes de datos. - Transformar estos modelos en una forma común de representación. Las fuentes de datos que no sean relacionales (v.g. jerárquicas), se modelan igual que las fuentes relacionales. - Depurar los nombres de los elementos de datos para lograr un grado de denominación común. Esto incluye la identificación de sinónimos y homónimos. - Seleccionar los subconjuntos de elementos de datos que se requieran para el DWH. No es necesario que todos los elementos alimenten al DWH. De debe trabajar con ejecutivos y analistas empresariales para determinar qué porción de esta información es valiosa en el DWH. - Integrar las fuentes de datos en modelos de datos tema. - Integrar fuentes de datos similares en un modelo de fuente consolidada. - Transformar el modelo de fuente consolidada en un modelo de DWH mediante la incorporación de registros de fecha y hora, identificación del origen, segmentación, elementos derivados y proporcionando ampliaciones al modelo para almacenar agregados precalculados, valores del resumen y de codificación. Se debe trabajar con analistas empresariales que proporcionen reportes administrativos a los ejecutivos empresariales para determinar el nivel de adición requerido, la frecuencia de carga de datos y la cantidad de ciclos (mensual, trimestral o anual) a mantener dentro del DWH. Es importante recordar que los pasos anteriores los emplea el analista para determinar qué fuentes de datos y qué elementos de ellas debe suministrar al DWH. Una vez ubicado el modelo de DWH y construidos los extractores de datos, se puede llevar a cabo una actualización continua sin necesidad de un análisis intermedio. El análisis sigue siendo necesario a fin de construir ampliaciones para el DWH o ampliar el ámbito de datos que se debe manejar. Otro uso importante del análisis consiste en ayudar en el rastreo cuando es cuestionable la calidad de los datos del DWH. Para el rastreo, una ruta completa de los datos, desde la fuente hasta el DWH, es tan importante como la forma como se presenta al usuario como una consulta. b.2.2) Modelado de Fuentes de Datos: Las fuentes de datos se modelan utilizando las técnicas tradicionales de modelado de datos. Es común emplear herramientas CASE en la construcción de modelos Entidad-Relación. Después de que se modelan las fuentes de datos y de haber definido las áreas tema con base en la consulta empresarial a las que debe responder el DWH debe hacerse una tabulación de los elementos de datos y las áreas tema. b.3) Visión y Modelado del DWH b.3.1) Visión del DWH: la información que contiene el DWH se debe organizar de un modo diferente al que tiene en la fuentes de datos. Se almacenan totales precalculados y cuentas (resúmenes y adiciones) en el DWH. Es frecuente que se incorporen a la información que ingresa datos adicionales como la fuente, la fecha y la hora de origen, para proporcionar un contexto histórico. A continuación se visualiza una tabla comparativa entre el modelo de DWH y las bases de datos operacionales, ver Tabla N° 3. Modelo de Datos Base de Datos Operacionales DWH Se concentra en eliminar la redundancia, Se orientan a manejar un amplio rango de coordinar las actualizaciones y soportar consultas y recuperación de información en transacciones que realizan el mismo tipo de forma periódica. El Usuario realiza muy pocas operaciones muchas veces al día sobre los actualizaciones. mismos datos. Contienen muchas normas para manejar Tienen muy pocas normas, para proporcionar actualizaciones consistentes y mantener acceso instantáneo sin necesidad de tener integridad referencial. que realizar una gran cantidad de uniones. Es solo el producto de la base de datos y los Los usuarios finales deben entender el desarrolladores de aplicaciones. Es complejo modelo de datos, pues su función es la visibilidad y el acceso a los datos fácil y y grande. conveniente. Los datos son solo lo que se necesitan para Los datos son tanto operacionales como las operaciones actuales. Los datos históricos. Los volúmenes de datos que innecesarios se archivan con rapidez para contienen se ubican entre los cientos de evitar una degradación en el desempeño de megabytes a los cientos de Gigabytes. los sistemas operacionales. Almacenan muy pocos datos derivados. Los Almacena grandes cantidades de datos datos se derivan siempre que se requieran derivados para ahorrar el esfuerzo de cálculos sobre la marcha. repetitivos de las derivaciones. Las derivaciones se hacen no solo con los cálculos operacionales sino también con los datos históricos. Contiene todos los datos que requiere una Solo contiene datos que tienen valor a través empresa para sustentar sus operaciones. del tiempo Están ligeramente resumidos, a menudo con Precalcula y almacena datos muy resumidos. fines de reporte. FUENTE: El Autor,2003 Tabla N° 3-Relación entre Modelos de Datos de Base de Datos Relacional y DWH. La meta del diseño del modelo de DWH es facilitar el uso y hacerlo comprensible para los (a veces muy inexpertos) usuarios finales. b.3.2) Modelado del DWH: Se han desarrollado muchas técnicas para el modelado de DWH en este caso escogemos el modelo estrella (ver Figura N° 10), pues representa una perspectiva empresarial especifica sobre la información del DWH. Como el nombre sugiere, el esquema estrella tiene un solo objeto en medio conectado con varios objetos de manera radial. Refleja la visión del usuario final de una consulta empresarial: eventos tales como ventas_dolares, ventas_unitarias, ventas_yens se califican por una o más dimensiones (por tiempo, tienda, producto, ubicación). El objeto es el centro de la estrella y se denomina tabla de eventos y los objetos conectados a ella se denomina tabla de dimensiones. Tabla de Dimensión Año Muchos atributos de tiempo Llave tiempo Tabla de Dimensión Distrito Tabla de DimensiónSub DimensiónSub-Estación Llave circuito Muchos atributos de Distrito Muchos atributos de Sub-Est Llave Sub-Est Llave mercado Listas de apuntadores TED Año TTI por Sub-Est EVENTOS TED por Sub-Est TED Dist-Año TED Tipo Serv FUENTE: El Autor Figura N° 10-Modelo Estrella Tabla de Dimensión Circuito Muchos atributos de Circuito b.4) Visión y modelado de la Consulta Empresarial b.4.1) Visión de la Consulta Empresarial: Es la perspectiva de los datos del DWH desde el punto de vista del usuario. Una de las razones de la popularidad del modelado de datos estrella multidimensional es que es un reflejo cercano de la forma en que un analista empresarial visualiza una consulta. De hecho una tabla multidimensional es una representación exacta de una consulta multidimensional. Para el analista proponer una consulta es lo mismo que consultar directamente una tabla multidimensional. De ahí que una consulta empresarial sea una solicitud de eventos, a veces llamados mediciones a través de varias dimensiones. Un esquema estrella lógico sencillo consta de una tabla de eventos y varias tablas de dimensión. Los esquemas estrella complejos tienen cientos de tablas de eventos y de dimensión. Una tabla de eventos contiene las mediciones básicas de los negocios y consta de millones de hileras. Las tablas de dimensión contienen atributos de negocios que se emplean como criterios de búsqueda, y son relativamente pequeñas. Técnicas que mejoran el desempeño de las consultas en el esquema estrella (debido a uniones con grandes tablas): - Definir adiciones en tablas de eventos existentes o nuevas tablas de adición. Por ejemplo, pueden existir ventas tanto de detalles como regionales en la misma tabla de eventos, con una columna indicador de adición para diferenciar las hileras. O bien, se puede crear una tabla de adición regional de ventas. - Segmentar la tabla de eventos de modo que la mayoría de las consultas solo accedan un segmento o partición. - Crear tablas de eventos separadas. - Crear índices numéricos únicos u otras técnicas para mejorar el desempeño de uniones. b.4.2) Modelado de la Consulta Empresarial: La técnica de modelado para entender, modelar y analizar consultas empresariales consiste en construir moldes de consultas. La Figura N° 11 muestra un modelo típico de molde de consulta. Se aísla de sus dimensiones el área tema de la consulta. Esto permite buscar candidatos potenciales de tablas de eventos y dimensión para el modelo del DWH. Una vez identificados los moldes de consulta para cada consulta empresarial, las consultas y sus moldes se consolidan. Dimensión Año Año Dimensión Mes Por SubEstación SubEstación Por TTI Área Tema Interrupciones Año TED Fallados Por Distrito Dimensión Distrito Por Tipo de Servicio Por Circuito Dimensión Circuito FUENTE: El Autor Figura N° 11-Molde de Consulta para una consulta empresarial de interrupciones. El diagrama consolidado resultante para cada área tema se denomina modelo STARNET (Red estrella). La Figura 11 es la representación combinada de todas las consultas empresariales. El área tema se asocia con varias dimensiones. El modelo STARNET forma la base de desarrollo del modelo de DWH utilizando cualquiera de las técnicas de modelado descritas anteriormente. El modelo STARNET también se usa para identificar los requerimientos de profundizaciones. El molde de la consulta empresarial es un polígono que une los puntos apropiados del modelo STARNET. La profundización es el polígono definido por el desplazamiento de un punto más cercano al centro, a lo largo del modelo STARNET. c) Construcción y Despliegue del Prototipo de la Arquitectura de Datos DWH En ésta fase se comercializa la información, comprende la capacidad de hacer énfasis en la disponibilidad, los beneficios y la presentación para hacerla atractiva al usuario final. CAPÍTULO IV EL SISTEMA ACTUAL IV.- Análisis del Estado Actual del Sistema (Fase I) Esta fase se desarrolla al describir paso a paso el recorrido de la data relacionada con TED en la Coordinación de Operaciones de la Zona Sucre Filial ELEORIENTE. Ver apéndice O. Los datos de entrada a la Coordinación de Distribución provienen de las necesidades tanto diarias/eventuales de los clientes como de las originadas por las juntas de vecinos, alcaldías y gobernaciones; lineamientos de la Casa Matriz CADAFE, Normas Calidad de Servicio de Distribución de Electricidad–CADAFE; los datos estadísticos de la economía nacional: Cámara Venezolana de la Industria Eléctrica (CAVEINEL), Instituto Nacional de Estadística (INE); la Ley y reglamento del Servicio Eléctrico (Gaceta Oficial del 25-11-2003 N° 37825). Ver Figura N° 15. Los usuarios manifiestan su necesidad del servicio bien por: a) Interrupciones ocasionadas diarias o eventuales que originan la comunicación de manera telefónica o presencial con el Centro de Operaciones y Distribución (COD) de la Coordinación de Distribución. b) Ampliación del (los) sectores cuyas limitaciones del servicio eléctrico afectan a las comunidades. c) Realización de nuevas obras en los sitios geográficos dependientes de la zona Sucre. El operador del COD 1 dispone del formulario diario/eventual “Reporte de Fallas Transformadores de Distribución” ver anexos, que permite llevar el control de los transformadores fallados, datos de identificación y características técnicas del transformador. Así mismo, la ejecución de las obras realizadas generan datos de TED instalados en diferentes sectores de la zona los cuales provienen de la Coordinación de Distribución. La información de los TED recuperados provienen de la unidad de almacén. Ver anexos. Las unidades del COD, Distrito y Mantenimiento Especializado, dependientes de la Coordinación de Distribución, reciben, consolidan y suministran la información para mantener continuidad de los procesos operativos diarios, mensuales y anuales. Por considerar el alto volumen de información en el sistema de estudio actual del COD, éste trabajo se limita a un Prototipo de arquitectura DWH relacionado con las interrupciones que afecten directamente a los TED, el cual permita suministrar un buen soporte a los usuarios finales de la DWH: Gerencia de Zona Sucre, Gerencia de Distribución Filial, Dirección de Operaciones, Presidencia de ELEORIENTE y CADAFE. IV.1.- Modelo Conceptual de Procesos Este modelo permite difundir el nivel cero (0) del diagrama de flujo de datos a nivel de contexto de la Figura N° 15, la expansión en forma de árbol muestra lo siguiente: 1.1Procesos Diarios, 1.2-Procesos Mensuales y 1.3-Procesos Anuales, todos relacionados con el nivel 1 del modelo (Ver Figura 16). 1 COD: Centro de Operaciones de Distribución Información Interrupción Necesidades diarias/eventuales de los Clientes/Usuarios Fecha, hora, .referencia Necesidades Juntas de Vecinos, Alcaldías y Gobernaciones Norma Calidad de Servicio De Distribución de Electricidad Información Interrupción Fecha, hora, .referencia Consumo de Energía y Demanda Manejo de Capacidades Transformadores De Reportes/Consultas Indicadores de gestión para la Toma de Decisiones Filial ELEORIENTE Gerencias de Zonas, Coord. De Distribución Dirección de Operaciones Dirección Técnica Presidencia ELEORIENTE CADAFE Distribución Estadísticas CAVEINEL Indices INE BCV Datos Estadísticos Externos,internos Tasa de interés pasiva promedio Ley del Servicio Eléctrico (reglamento) FUENTE: 0 Calidad del servicio TTI, TR, Frecuencia, variación voltaje) El Noviembre 2003 Autor, Figura N° 15 – DFD a Nivel de Contexto, Manejo de Transformadores Eléctricos de Distribución-ELEORIENTE Manejo TED 0 Area Operativa Procesos Diarios Area Operativa Procesos Mensuales 1.1 1.2 1.1.1 Consultar CALL CENTER Area Operativa Procesos Anuales 1.3 1.3.1 Calcular Interrupciones Ocurridas 1.2.1 Calcular Interrupciones Ocurridas 1.1.2 Consultar/Actualizar en SIAR Interrupción por TED fallados 1.1.3 Actualizar por el sistema SIAR TED Recuperados 1.2.2 Calcular TED fallados y recuperados 1.3.2 Consolidar TED fallados y recuperados 1.3.3 Calcular N° total de Interrupciones Por Distrito 1.2.3 Calcular N° total de Interrupciones Por Distrito 1.3.4 Calcular Tendencias fallas de Circuitos 1.2.4 Tabular Frecuencias de causas de interrupciones 1.2.5 Calcular N° total de Interrupciones por Circuitos y Subestaciones FUENTE: El Autor, Octubre 2003 Figura N° 16 – Modelo Conceptual de Procesos ELEORIENTE DFD Lógico Procesos Diarios (1.1) 1.1.2 1.1.1 Necesidades diarias/eventuales de los Clientes/Usuarios Necesidades Juntas de Vecinos, Alcaldías y Gobernaciones Consultar CALL CENTER Datos interrupción Fecha,referencia sector Consultar/Actualizar Boleta Sistema Datos del Cliente datos de interrupción Integrado atención y TED fallados o Usuario Cliente/usuario en SIAR Fecha,referencia sector D1 Archivo de TED Fallados Datos interrupción Fecha,referencia sector 1.1.4 Normas calidad de servicio Distribución eléctrica Consumo de Energía y Demanda fecha, bs. kVa,kWh Actualiza TED recuperados para instalar. (Distrito) TED recuperado Fecha,distrito, circuito,sector marca,serial,kVa D2 Archiva datos TED recuperado Datos Diarios Calidad del Servicio TTI, TR, Frecuencia, variación de voltaje LOSE (Reglamento) FUENTE: El Autor, Noviembre 2002 Procesos Mensuales Datos Mensuales Procesos Anuales Reportes/Consultas sobre Indicadores de gestión para la Toma de Decisiones Filial ELEORIENTE Gerencias de Zonas, Coord. De Distribución Dirección de Operaciones Dirección Técnica Presidencia ELEORIENTE CADAFE Figura N° 17 – DFD a Nivel de Contexto Manejo de Transformadores Eléctricos de Distribución Procesos Diarios-Área Operativa-ELEORIENTE IV.1.- Diagrama de Flujo de Datos Lógico – Procesos Diarios En el Centro de Operaciones de Distribución (COD), hay dos unidades las cuales captan (recepcionista de guardia) y tramitan (operador de guardia) las interrupciones o eventualidades ocurridas al cliente. El recepcionista de guardia recibe las quejas de interrupciones de líneas, las 24 horas del día y luego consulta/verifica y actualiza en el Sistema de Información de Interrupciones y Atención de Reclamos (SIAR), los datos del cliente y el sector donde ocurrió el hecho en referencia. Inmediatamente el operador de guardia emite la Boleta de Interrupción del SIAR (ver anexos) y toma la decisión de enviar al personal respectivo al sitio. Los procesos diarios (1.1) de la Figura N° 17, están formados por tres (3) subprocesos: 1.1.1.- Consultar la situación de factura del cliente mediante el sistema Centro de Llamadas del Cliente – CALL CENTER, la búsqueda se realiza por: la referencia, cédula o nombre emitida por el cliente. Consultar/Actualizar datos del cliente en el SIAR: En éste proceso el recepcionista incorpora los datos de cédula del cliente/usuario, dirección de referencia, problemática presentada, fecha y hora del evento. 1.1.2.- Se Inspeccionan y detectan los problemas por interrupción de TED: el operador de guardia emite la Boleta de Interrupción del SIAR (ver anexos), consulta en el sistema de información de teleseñalización (XMASTER) las fallas ocurridas y detecta el problema en el circuito del distrito que corresponda (Cumaná o Carúpano), toma la decisión de realizar la revisión respectiva en sitio y si observan anomalías en los TED que amerite cambios llena el formulario de fallas de TED con los datos técnicos, marca, serial y causa del problema para enviarlo al departamento de Distrito de la Zona Sucre. La unidad de distrito dicta la pauta para su revisión, desincoporación e incorporación de un nuevo TED. En el reporte de fallas se reflejan las especificaciones técnicas del TED fallado y las causas del problema. 1.1.3.- Actualizar por el sistema SIAR los TED recuperados. Se adecuan los TED para ser instalados con todas las características señaladas en las placas de salida del departamento de almacén y se actualiza esta data en el sistema SIAR. La unidad de Distrito se encarga de solicitar a almacén un TED que sustituya al anterior bajo las especificaciones técnicas del informe de reporte de fallas, es decir, seguir las normas de calidad de servicio de distribución de electricidad y aplicar la frecuencia y variación de voltaje exigida por la Ley Orgánica del Servicio Eléctrico(LOSE). La unidad de distrito, en caso de no conseguirlo en almacén, busca un TED el cual sea adaptado para corregir la falla y lo incorpora, vacía la información y archiva manualmente el informe de falla en el departamento. En caso de no encontrarlo continúa en espera del mismo. Son con éstos procesos diarios que se archiva la información que reposa en el departamento de Distrito de la Zona Sucre, como muestra la Figura N° 17, identificados de la siguiente manera: ♦ D1: TED fallados ♦ D2: Adecuados e instalados IV.2.- Procesos Diarios y Prototipo DWH La creación de la arquitectura DWH “Prototipo del Sistema Manejo de TED”, está basada en el Modelo Conceptual de Procesos de la Figura 16, para ello se describen las fuentes de datos (tablas) relacionadas con cada uno de éstos procesos del sistema actual estudiado, al mismo tiempo se señala con un asterisco las tablas que serán usadas para el diseño de la arquitectura del DWH. Proceso 1.1.1 Consultar estado de la facturación del cliente cuando éste manifiesta una interrupción Base de Datos Tablas CALL CENTER - Sistema de Maestro.dbf Campos Referencia, Nombre, No-factura, Deuda-tot Condicion, Monto-rec, Ult-fecha, Fecha_cort Atención de Llamadas al Cliente Fecha_act, Tipo, Dirección FUENTE: El Autor, Octubre 2003 Tabla N° 5 – Base de Datos Call Center ELEORIENTE La tabla N° 5 muestra la estructura de la base de datos CALL CENTER. Esta tabla no se usará para el prototipo DWH. Sin embargo el campo fecha-act es de importancia para el DWH definitivo. Proceso 1.1.2 Consultar y Actualizar datos de interrupciones por fallas de TED y proceso 1.1.3 Actualizar TED recuperados. En la Tabla N° 6 se pueden observar las bases de datos, tablas de datos y campos que son usados en este proceso. Base de Tablas Campos Datos SIAR Siarboleta Num-rec, n-cuenta-bol, ced-sus-bol, tel-sus-bol, fec-rec, fec-tra-cua-bol, fectiempocola, fec-rep-bol, fec-env-dtto, cod-rec-bol, cod-ope-bol, cod-pri-bol,codtip-fal-b, cod-cuadrilla, cod-causa-b, cod-tipsis-bo, cod-sec-bol, inf-adi-bol, observaciones-bol, estado, turno-ope-bo. Siarcaufalla Cod-caufal, descripción-caufal, modificado, creado Siargesuniint Aviso, inicio, fin, cod, turno, accion, observación. Siarcuadri Cod-dttocua, cod-cua, nom-cua, estado, guardia, cod-lin1, cod-lin2, cod-lin3, cod-lin4, cod-lin5, cod-lin6, modificado Siargestion Codigo, fecha-inicio, hora-inicio, fecha-fin, hora-fin, usuario, cod-lin1, cod-lin2. Siarhistorico Fec-tra-cua-bol, fec-tiempocola, fec-rep-bol, fec-env-dtto, num-rec, n-cuentabol, ced-sus-bol, tel-sus-bol, fec-rec, fec-sol-dtto, cod-rec-bol, cod-ope-bol, codpri-bol,cod-tip-fal-b, cod-cuadrilla Siarhorarioope Cod-ope, turno, dia, semana Siarliniero Cod-lin, nom-lin, modificado, creado Siarmatbol Num-rec, cod-matuti-b, cantidad,poste Siarmatuti Co-matuti, descripción, modificado, creado Siarmuerto Num-rec, n-cuenta-bol, ced-sus-bol, tel-sus-bol, fec-rec, cod-rec-bol, cod-opebol, cod-pri-bol, cod-tip-fal-b, cod-sec-bol, inf-adi-bol, estado, turno-ope Siaropera Cop-ope, nom-ope, clave-ope, log-ope, autorizado, AT Siarprio Cod-prio, descripción-p, modificado, creado Siarrecep Cod-rec, nom-rec, clave-rec, log-rec, autorizar, modificado, creado Siarregzon Region, zona, dia, mantenient, jefe, cargo Siarsector Cod-dttosec, cod-sec, nom-sec, circuito,modificado, creado siarsuscriptor n-cuenta, ced-sus, tel-sus, nom-su, ape-sus, dis-sus, cod-sec, num-pos Siartiprecl Cod-tiprec, descripcion-ti, modificado, creado Siartipsis Cod-tipsis, descripcion-ti, modificado, creado FUENTE: El Autor, Octubre 2003 Base de Datos GESCI Tabla N° 6 – Base de Datos Sistema de Interrupción de Atención y Reclamos (SIAR). Tablas zona Campos Cod-zona, nom-zona, kva-instalado, km-lin-total, modificado, creado Transformadores Cod-transf, marca, serial, capacidad, causa, fecha, cod-cir, dirección, poste, creado, modificado novedades Cod-nov, cod-ope, tipo-novedad, fecha, novedad, turno, mod, creado tipointerrupcion Cod-tip-int, nom-tip-int, mod, cvreado señal Cod-señal, nom-señal, modif, creado *Sub-estación Cod-dtto, cosd-se, nom-se, tipo-acceso, cap-ins, atendida, cod-ciralim, cod-cir-alim, modif. *sistemas Cod-sist, nom-sist, modificado, creado *interrupcion Cod-in, agrupadas-int, fecha-registro, cod-tip-int, cod-señal, horainicio, hora-fin, cod-sist, cod-cir, carga, cod-causa, cir-rel, observacion, estado, duracion-txt, duracion-int, kva-int, revisar *distrito Cod-zona, cod-dtto, nom-dtto, kva-instalado, modificado, creado *circuito Cod-se, cod-cir, nom-cir, tipo-cir, kva-inst, cod-jef-lin, nivel-ten, km-lin, factor-potenc, tarifa-cir *causas FUENTE: El Autor, Octubre 2003 Base de Datos *SAAR Tablas RD710201 Cod-causas, nom-causas, tip-int, AE, modificado, creado Tabla N° 7 – Base de datos GESCI Campos R_REGION, R_ZONA, R_DTTO, R_HFAL, R_HRECEP, R_SECTOR, R_FRECLA, R_PRIOR, R_TIFAL, R_RECEP, R_SIST, R_HTRANS, R_CAUSA, R_HREPAR, R_MATER, R_FREPAR, R_CUAD, R_OPER FUENTE: El Autor, Octubre 2003 Tabla N° 8 – Base de datos SAAR IV.3.- Diagrama de Flujo de Datos Lógico – Procesos Mensuales Los procesos mensuales, mostrados de la Figura N° 18, están formados por cinco (5) subprocesos, tal como se describen a continuación: 1.2.1.- Calcular Interrupciones ocurridas: Por medio del SIAR se recopila la información de los distritos técnicos Cumaná y Carúpano: fecha y hora, inicio y fin de la interrupción ocurrida, lo cual origina los resultado, o bien llamados indicadores de calidad de servicio, número de interrupciónes, frecuencia media, duración promedio, tiempo total de interrupción, número de reclamos técnicos, tiempo promedio de solución de reclamos técnicos, TED eléctricos fallados. Para realizar el prototipo de DWH es de vital importancia obtener los datos de fecha y hora, inicio y fin de todas éstas interrupciones con el objeto de correlacionar con los eventos ocurridos en los transformadores quemados. Ver anexos. 1.2.2.- Calcular el número de TED fallados y recuperados: Diaria o eventualmente se transcribe la data de los TED fallados o recuperados, al final de mes se elaboran resúmenes mensuales con la información de: fecha, capacidades, marcas, municipio. Para realizar el prototipo de DWH es importante obtener los datos de fecha, hora de ocurrencia de éstos eventos además de las características propias del TED como marca, serial, capacidad, causa de la falla, circuito donde falló. Ver anexos. 1.2.3.- Calcular el número total de interrupciones de los Distritos Cumaná y Carúpano por: subestación, circuito, mes y trimestre. El prototipo de DWH requiere de las fechas y tipo de distrito afectado cuando un TED falle. Ver anexos. 1.2.4.- Tabular Frecuencia de causas de Interrupción: cantidad, frecuencia, duración y tiempo total de interrupción. A los efectos del prototipo DWH solo interesa las causas que afectan a los TED fallos. Ver anexos. 1.2.5.- Calcular el número de interrupciones por circuito y subestaciones cuyos datos contenidos son fecha, circuito y subestación. El prototipo de DWH requiere de las fechas y tipo de distrito afectados cuando un TED falle. Ver anexos. Los reportes mensuales son: estadísticas de TED fallados por marcas, municipios y capacidades; reporte de TED recuperados tanto por la unidad de Mantenimiento Especializado como por las empresas externas; informe de indicadores de gestión área operativa; reporte de interrupciones ocurridas por distritos, circuitos y subestaciones; y causas principales de interrupciones. En la Figura 18 se representan los archivos que almacenan la información descrita como: D3 reserva la data del número de interrupciones eléctrica; D4 TED fallados y recuperados; D5 interrupción por distrito; D6: causas de interrupción; D7: interrupciones por circuitos y subestaciones. DFD Lógico Procesos Mensuales (1.2) Necesidades diarias/eventuales de los Clientes/Usuarios Fecha,distrito, circuito,sector marca,serial,kVa Datos interrupción Fecha,referencia sector 1.2.1. Calcular Interrupciones ocurridas 1.2.2 Municipio, fecha, Calcular TED fallados y marca,kVa,cantidad recuperados (I1,I2) . Necesidades Juntas de Vecinos, Alcaldías y Gobernaciones Datos TED obras Fecha,distrito, circuito,sector marca,serial,kVa . Normas Calidad de Servicio Distribución Eléctrica Consumo de Energía y Demanda fecha, bs. kVa,kWh Calidad del Servicio TTI, TR, Frecuencia, variación de voltaje fecha,ni,distrito Tt1,fm,dpi,nrt, Tpsr,tf fecha,causa, cant.,frec., duración 1.2.3 Calcular por N° total de Interrupciones Distrito (I3) 1.2.4 Tabular Frecuencia de causas de Interrupción Total Fecha,distrito, circuito,sector marca,serial,kVa D3 Archivo Interrupción Archivo TED Fallados y recup. Municipio, fecha, marca,kVa,cantidad D4 Total Fecha, FM, DPI, TTI,TPRR, N° Interr., NRT TF Archivo interrup. D5 Por distrito Total fecha,causa, cant.,frec., duración 1.2.5 N° interrupción por Circuito y subestación Archivo de causas D6 De interrupción D7 Archivo de interr. Por circuito y subest. LOSE (Reglamento) FM: frecuencia media; DP: duración promedio; TTI: tiempo total interrupción; TPSR: tiempo promedio solución reclamos; TF: transformadores fallados; NRT: n° reclamos técnicos FUENTE: El Autor, Noviembre 2003 Procesos Anuales Toma de Decisiones Figura N° 18 – DFD a Nivel de Contexto Manejo de Transformadores Eléctricos de Distribución Procesos Mensuales- Área Operativa ELEORIENTE Gerencias de Zonas, Coord. De Distribución Dirección de Operaciones Dirección Técnica Presidencia ELEORIENTE CADAFE IV.4.- Diagrama de Flujo de Datos Lógico – Procesos Anuales Los procesos anuales (1.3) están formados por tres (3) subprocesos (ver Figura N° 19): 1.3.1.- Consolidar Interrupciones ocurridas: Igual que en los procesos mensuales, el sistema SIAR recopila la información de los distritos técnicos Cumaná y Carúpano: fecha y hora, inicio y fin de la interrupción ocurrida; se generan los indicadores de calidad de servicio del número de interrupción, frecuencia media, duración promedio, tiempo total de interrupción, número de reclamos técnicos, tiempo promedio de solución de reclamos técnicos, TED fallados. Para realizar el prototipo de DWH es de vital importancia obtener los datos de fecha y hora, inicio y fin de todas éstas interrupciones con el objeto de correlacionar con los eventos ocurridos en los transformadores quemados. Datos puntuales del tiempo total de interrupción: 1 día de interrupción por cada 365 días al año. Ver anexos. 1.3.2.- Consolidar TED fallados y recuperados: mensualmente se obtiene los datos de los TED fallados o recuperados, al final del año se elaboran resúmenes con la información de: fecha, capacidades, marcas, municipio. Para realizar el prototipo de DWH es importante obtener los datos de fecha, hora de ocurrencia de éstos eventos además de las caracteristicas propias del TED como marca, serial, capacidad, causa de la falla, circuito donde falló. Ver anexos. 1.3.3.- Consolidar el número total de interrupciones de los Distritos Cumaná y Carúpano por: por: subestación, circuito, mes y trimestre. El prototipo de DWH requiere de las fechas y distrito afectado cuando un TED falle. Ver anexos. 1.3.4.- Tendencias de Interrupciones por circuitos y subestaciones: los datos que se manejan para este reporte son fecha, número de interrupciones, circuitos y subestaciones. Este proceso se plantea como una necesidad para el prototipo del DWH, al conservar la data requiriente como ya se puede obtener en otros procesos. Para realizar el proceso de Estimación de datos en archivos históricos y variables contenidas en la Gaceta Oficial de la Ley del Servicio Eléctrico, se realizan los ajustes necesarios de acuerdo a los lineamientos establecidos de la Casa Matriz – CADAFE, Estadísticas CAVEINEL, lineamientos a nivel ejecutivo de ELEORIENTE, estrategias de la dirección de operaciones y los comportamientos económicos del país (Instituto Nacional de Estadística-INE, Banco Central de Venezuela– BCV). Para obtener los archivos históricos éstos se alimentan de los datos diarios y cálculos mensuales para luego almacenarlos en el SIAR y hojas Excel. Ver Figura N° 19. IV.5 Procesos Mensuales, Anuales y Prototipo DWH El prototipo DWH de mantenimiento de TED es capaz de controlar los procesos mensuales y anuales relacionados con los transformadores del sistema actual, además de otros requerimientos necesarios en la organización, para ello se requiere data de años anteriores, hojas de calculo, archivos de procesador de palabras donde la información recopilada esté bajo una misma plataforma computacional. DFD Lógico Procesos Anuales (1.3) Necesidades diarias/eventuales de los Clientes/Usuarios Fecha,distrito, circuito,sector marca,serial,kVa Datos interrupción Fecha,referencia sector Municipio, fecha, marca,kVa,cantidad Necesidades Juntas de Vecinos, Alcaldías y Gobernaciones Normas calidad De servicio Distribución eléctrica . Datos interrupción Fecha,referencia sector fecha,ni,distrito Tt1,fm,dpi,nrt, Tpsr,tf Consumo de Energía y Demanda fecha, bs. kVa,kWh 1.3.1 Consolidar Interrupciones ocurridas 1.3.2 Consolidar TED fallados y recuperados (I1,I2) 1.3.3 Calcular por N° total de Interrupciones Distrito (I3) 1.3.4 Tendencias interrupción por Circuito y subestación Total Fecha,distrito, circuito,sector marca,serial,kVa Municipio, fecha, marca,kVa,cantidad D9 Archivo TED Fallados y recup. Archivo interrup. D10 Por distrito Total Fecha, FM, DPI, Archivo de causas D11 TTI,TPRR, N° Interr., De interrupción NRT TF D12 Archivo de interr. Por circuito y subest. Calidad del Servicio TTI, TR, Frecuencia, variación de voltaje LOSE (Reglamento) Toma de Decisiones FM: frecuencia media; DP: duración promedio; TTI: tiempo total interrupción; TPSR: tiempo promedio solución reclamos; TF: transformadores fallados; NRT: n° reclamos técnicos FFUENTE El Autor, Noviembre 2003 Tendencias, estimaciones, pronósticos, presupuestos Gerencias de Zonas, Coord. De Distribución Dirección de Operaciones Dirección Técnica Presidencia ELEORIENTE CADAFE Figura N° 19 – DFD Integral a Nivel de Contexto Manejo de Transformadores Eléctricos de Distribución Procesos Anuales Área Operativa ELEORIENTE CAPÍTULO V PLANEACIÓN Y REQUERIMIENTOS V.- Aspectos de la Planeación del DWH (Fase II). La etapa de planeación en el ciclo de desarrollo del DWH para el manejo de TED requiere de los enfoques que a continuación se explican: a) En cuanto a la selección de un ámbito de implementación que produzca beneficios inmediatos a un grupo de usuarios; se escoge la selección de un enfoque o visión de arriba hacia abajo (de lo general a lo particular), ya que delinea con claridad las fronteras de implementación del DWH. La tecnología es conducida por el negocio (altos directivos), y no a la inversa (área operativa) por la finalidad de comunicar los beneficios del DWH a quienes toman las decisiones y a los inversionistas. Además; - La organización posee experiencia en el desarrollo de aplicaciones (STRATEGOS WEB) con base en la identificación de requerimientos empresariales de arriba hacia abajo. - Los ejecutivos: Presidentes, Directores y Gerentes; los que toman las decisiones preveen un conjunto claro de objetivos para el DWH. - Se tiene idea clara de cómo usar el DWH, es un subproceso de un proceso empresarial; Subproceso – el manejo de TED (en caso de que la empresa adquiera un sistema como mantenimiento TED); Proceso – acceso del STRATEGOS WEB del área operativa del sistema. b) Se seleccionó para la metodología de desarrollo la técnica de espiral, ya que se basa en la observación y facilidad de redirigir un sistema desplegado con base en nuevos requerimientos que construir una solución completa con requerimientos inadecuados y no disponibles. Se presta al desarrollo de aplicaciones de base de datos, al desarrollo de DWH y al desarrollo de sistemas orientado a objeto. Se genera rápidamente el sistema con intervalos cortos entre versiones sucesivas. c) En cuanto al enfoque de la arquitectura a usar, se tomó el DWH y mercado de datos, donde las necesidades de DWH especificas del departamento de operaciones y distribución, se deben abordar junto con la necesidad de DWH corporativo. Este último actúa como un recopilador y distribuidor de información a partir de fuentes de datos por toda la organización. d) Para el desarrollo de escenarios de uso empresarial, el DWH debe ser usado por usuarios finales, Presidentes, Directores y Gerentes de la empresa ELEORIENTE, esto se basa en establecimiento de expectativas de lo que puede ofrecer el DWH. Los escenarios empresariales son una importante herramienta del Prototipo de requerimientos –Manejo de TED-. V.1.- Detectar Necesidades Del Negocio, Generar Diagrama de Sachman Se desarrolla un esquema global sobre las necesidades de la organización para así ajustarlo a un prototipo de sistema DWH de fácil adaptabilidad, funcional y versátil orientado hacia el área ejecutiva de la Empresa. En el diagrama de Sachman, se muestra la perspectiva, de arriba hacia abajo conducidas por el negocio CADAFE-ELEORIENTE, para el sistema de información relacionado con el control del manejo de TED. Las filas del diagrama representan puntos de vista o perspectivas de la organización (CADAFE-ELEORIENTE) y las columnas representan un aspecto o visión del sistema del manejo de TED. Ver Tabla N° 9. Visión del Sistema (Hileras o Perspectivas) Funcionario Público de Alto Nivel (Presidente, Director de Operación y Gerentes) Datos ¿Que? Realizar las actividades de planeación y coordinación de la alta gerencia. Predice costos e ingresos y manejo de riesgos. Función ¿Cómo? Proporcionar a los gerentes productos y servicios, datos sobre el impacto en el ambiente empresarial con otras empresas del estado venezolano. Clientes e inversiones tecnológicas Red de Trabajo ¿Donde? Áreas Gerencial y Operativa. Usuario Empresarial (Coord. De Distribución, Jefe de Operación y Distribución) Mejorar la productividad/eficiencia del personal de la organización para ofrecer un mejor servicio. Recolección de datos que permita tomar decisiones sobre TED en los Distritos Cumaná y Carúpano. Usa los componentes para desplegar la información y entregarla a la alta gerencia. (TED fallados por año, subestación, distrito, tipo de servicio, TTI por subestación). Áreas Gerencial y Operativa. Diseñadores y Transformar e integrar las Constructores del sistema bases de datos relacionales Hoja de cálculo (macros) Excel y y no relacionales para Visual Basic. Manejador de Bases uniformizar la estructura de Datos relacionales, no del DWH. Facilitar su uso, relacionales. Uso de servidor, exactitud y precisión de la equipos PC e Impresora. información y tener la Capacidad de respuesta con los datos. FUENTE: El Autor, Octubre 2003 Tabla N° 9 – Diagrama de Sachman Informática V.2.- Perspectiva de los Requerimientos (ajuste de la arquitectura) ♦ Funcionario Público de Alto Nivel, en este caso Presidente, Director de Operaciones, Gerente de Zona, el apoyo principal de la arquitectura al Gobierno en el prototipo manejo de TED, es poder realizar actividades de planeación y coordinación, predecir costos e ingresos y el manejo de riesgos. El rango de productos y servicios, el impacto en el ambiente empresarial con otras empresas eléctricas del estado venezolano, los clientes y el mismo impacto en las inversiones tecnológicas. Con respecto al análisis costo/beneficio, involucra el costo de adquisición de TED, costo de mantenimiento y recuperación, análisis de tiempo de vida con los TED. Se requiere calcular la recuperación de inversión (RI) y el cálculo de recuperación de activos (RA). Se obtiene un diagrama de riesgos donde se identifique otras alternativas de adquisición de TED y se evalúe las ventajas y desventajas de las distintas opciones. ♦ Para el usuario final (empresarial): Coordinador de Distribución, Jefe del Centro de Operación y Distribución; el interés es mejorar la productividad y la eficiencia del personal y la organización para ofrecer un mejor servicio, aumentar la calidad e innovar. Se busca obtener una información acerca de interrupciones relacionadas con TED que sea limpia y verídica para que se simplifique el análisis. Información histórica valedera, para usar diversas herramientas de análisis, para entender y asimilar los datos. Al lograr obtener la información de ésta manera, los usuarios convierten la información en hechos, transforman los hechos en conocimientos y usan el conocimiento para llegar a decisiones y recomendaciones. Se presentan los resultados del análisis de un modo coherente y lógico. ♦ Para los diseñadores, constructores del sistema tenemos dos casos: a) la organización que aporte la tecnología de información, en éste caso el departamento de informática, de la empresa, o b) en caso de ser una empresa contratada para el servicio. Cabe destacar que en este trabajo se hace una evaluación costo-beneficio de ambos casos con el fin de obtener el más adecuado. CAPÍTULO VI ANÁLISIS Y DISEÑO DWH VI.- Análisis de las Necesidades Empresariales, Visión, Modelaje y Transporte Empresarial (Fase III). El almacén de datos para soporte de decisiones, referido en éste caso a las necesidades empresariales de la Coordinación de Distribución de ELEORIENTE, nos inducen a aplicar distintos métodos a fin de modelar y representar la información de manera adecuada en el DWH. En la medida que evoluciona éste análisis también se describen y amplían los bloques y su contenido del desarrollo de la arquitectura de referencia o estructura de transporte empresarial para el DWH de los TED, tal como muestra la Figura N° 20. Bloque 3 Bloque 1 Bloque 2 Fuentesde deDatos Datos Fuentes SIAR,SAAR, SAAR, SIAR, Internosde deOficina Oficina Internos MercadoDe DeDatos Datos Mercado DWH DWH Usuarios11 Usuarios CoordinadorDistribución Distribución Coordinador Usuarios22 Usuarios JefeCOD COD Jefe Bloque 4 UsuarioGerencial Gerencial Usuario Presidente,Director, Director, Presidente, Gerente Gerente FUENTE: Harjinder S. Gill y Prakash Figura N ° 20 C. Rao,1996 Transporte Empresarial. Estos métodos se describen luego de mostrar una visión amplia (de lo general a lo particular) como en la Figura N° 21 y de ésta manera permiten establecer las prioridades para la generación de información y consulta de datos de las operaciones. a) Visión de arriba hacia abajo (top-down): La Figura N° 21 muestra como se relacionan estas visiones con los diversos componentes del DWH. Visión de Arriba hacia abajo (Permite la selección de la información CORRECTA para el DWH) SAAR RDBD0100 HISTÓRICOS INTERNOS OFICINA Fuentes de Datos Visión de DWH Tablas De Eventos DWH Tablas De Llaves DWH DWH Visión de Consulta Empresarial Coord. De Tablas De Dimensión DWH Distribución Jefe COD Mercado de Datos Presidente, Director, Gerente SIAR GESCI Metadatos para Fuentes Visión de Fuentes de datos Usuarios Finales FUENTE: Harjinder S. Gill y Prakash Figura N ° 21 C. Rao,1996 Interrelaciones entre las tres visiones. b) Visión y Modelado de Fuentes de Datos b.1) Visión de Fuentes de Datos: De acuerdo al componente del bloque arquitectónico de fuentes de datos de la Figura N° 22, se describe el origen de las fuentes encontradas en la Empresa-Zona Sucre que permitan dar inicio a la conformación de la arquitectura propuesta. Fuentes de Datos Datosde de Datos Producción Producción SIAR SIAR Datosde de Datos Herencia Herencia SAAR SAAR Sistemasinterno interno Sistemas deoficina oficina de Metadatospara para Metadatos fuentes fuentes FUENTE: Harjinder S. Gill y Prakash Figura N° 22 Componente del bloque arquitectónico de fuentes de C. Rao,1996 datos. 1) Datos de Producción Relacional 1.1) El SIAR, base de datos con tecnología relacional recopilada de las aplicaciones operacionales y manejada por el Sistema Integrado para la Atención de Reclamos (SIAR), sobre plataforma WINDOWS, en lenguajes de programación Visual Studio y SQL, orientado para su uso multiusuario, usa conexiones ODBC (Origen de Conexión para Base de Datos) Access 97, Access 2000 y/o SQL, éste sistema cuenta con un generador de reportes desarrollado en Cristal Report en Visual Basic. Puede accesarse en línea. Para el prototipo solo se usa datos históricos. El SIAR brinda una herramienta de optimización de los procesos de atención de reclamos, garantiza un manejo adecuado de los datos registrados, cuenta con información estadística confiable en tiempo real que permita llevar un control efectivo del personal y que interviene en el sistema de distribución de Baja y Media Tensión. Ver Tabla N° 10, extraída del sistema SIAR. Cod_int Agrupadas_Int Fecha_Registro Cod_Tip_Int Cod_Señal Hora_Inicio Hora_Fin Cod_Sist Cod_Cir 64 64 25/07/01 1 17 25/07/01 25/07/01 2 103 105 105 29/07/01 1 26 29/07/01 29/07/01 2 19 130 130 30/07/01 1 5 30/07/01 30/07/01 2 19 285 285 08/08/01 1 25 08/08/01 08/08/01 2 81 564 564 04/09/01 1 26 04/09/01 04/09/01 2 81 763 763 27/09/01 1 16 27/09/01 27/09/01 2 5 FUENTE: El Autor, 2004 Tabla N° 10 Tabla SIAR (base de datos generadas con Visual Basic y manejador Access de extensión .mdb) 1.2) El SAAR, Sistema de Atención de Reclamos, es una base de datos de producción y de herencia, ver Tabla N° 11; herramienta de optimización de los procesos de atención de reclamos, que fue sustituida por el SIAR; funcionó en línea hasta mediados del 2002. Es posible acceder a sus tablas utilizando características de EXCEL para la importación de datos. Tablas de Datos almacenadas en diskettes, provenientes de diferentes dependencias y con distintas arquitecturas de soporte, básicamente, EXCEL y Access. Garantiza un manejo de datos registrados históricamente, cuenta con información confiable al tiempo que permita llevar un control efectivo de las interrupciones. Creado en plataforma Windows, programación Fox-Pro y genera bases de datos con R_REGIONR_ZONA 7 1 7 1 7 1 7 1 7 1 7 1 7 1 7 1 7 1 7 1 7 1 R_DTTO R_HFAL 2 0100 2 0100 2 0100 2 0100 2 0100 2 0100 2 0100 2 0100 2 0100 2 0100 2 0100 R_HRECEP 1645 1645 1520 1655 1416 1450 1350 1410 1210 1030 2310 R_SECTOR 011 011 119 119 031 032 021 023 034 034 032 R_FRECLA 0205 0205 0205 0205 0205 0205 0205 0705 0705 0705 0805 R_PRIOR R_TIFAL 05 15 05 01 05 01 05 01 05 01 05 01 05 15 05 15 05 01 05 01 05 15 R_RECEP 04 04 04 04 04 04 04 03 03 03 03 R_SIST 02 02 02 02 02 02 02 02 02 02 02 R_HTRANS R_CAUSA 1650 22 1848 08 1525 13 1858 13 1510 08 1515 08 1510 22 1415 22 1512 03 1035 08 2310 24 R_HREPAR 2035 1850 1745 1920 1735 1602 1537 1620 1530 1135 2350 R_MATER 01 27 45 45 27 27 01 01 25 27 39 R_FREPAR 0205 0205 0205 0205 0205 0205 0205 0705 0705 0705 0805 R_CUAR_OPER 004 01 004 01 004 01 004 01 004 01 004 01 004 01 001 03 001 03 001 03 003 03 extensión.dbf. FUENTE: El Autor, 2004 Tabla N° 11 Tabla SAAR base de datos generadas con manejador Fox-Pro y de extensión.dbf En la Tabla N° 12 se muestran los archivos de herencia recopilados por años, del SAAR. Disco por Fuentes de Datos (archivos) Año 1999 RDXX0199, RDXX0299, RDXX0499, RDXX0599 (ene, feb, abr, may) 2000 RDXX0100, RDXX0200, RDXX0500, RDXX1000, RDXX1100, RDXX1200 (ene, feb, may, oct, nov, dic) 2001 RDXX0201, RDXX0301 (feb, mar) FUENTE: El Autor, 2004 Tabla N° 12 Inventario Fuentes de Datos Herencia, SAAR Para simplificar la transformación de datos, se mantendrá, en el almacén de datos de la DWH, la estructura de las tablas de SIAR. Esto implica que al recobrar datos de las otras fuentes se necesitará una transformación para llevarlos a la estructura de SIAR. 2) Datos de Producción No Relacional Datos Internos de Oficina (Históricos) son documentos encontrados en hojas de cálculo Excel con información de los años 1998-2002. Ver tabla N° 13 para un ejemplo. Estos datos también necesitan una transformación para implementarla en la DWH. FECHA LUGAR CIRCUITO S/E oct-99 AV.ROMULO GALLEGOS RIO CARIBE M.A. ARISMENDI RIO CARIBE CASERIO STA. ISABEL DE RIO RIO CARIBE STA. RIO CARIBE M.A. ARISMENDI RIO CARIBE oct-99 CALLE STA. BARBARA FTE. RIO CARIBE FECHA FABRICA FECHA GARANTIA DIF. AÑOS Y MESES KVA INSTALADOS 37,5 0,0 TXS COLOCADO PROLEC, M98L1 37.5 KVA,12-1998 25 KVA, 01-99 25 KVA, 04-90 oct-77 22,1 25,0 PROLEC, M98L21 AL MERCADO RIO CARIBE M.A. ARISMENDI RIO CARIBE 25 KVA, 12-1998 LUCIA FTE. A LA SRA. ROMELIA 25 KVA, 12-1998,12 33848 RIO CARIBE STO. M.A. ARISMENDI RIO CARIBE EL MUCO DE PTO. STO. M.A. ARISMENDI RIO CARIBE FUENTE: El Autor, 2004 25 KVA, 12-1998 0,0 08-85, 08-86 Tabla N° 13 Tabla Datos Internos de Oficinas (Excel) 3) Almacenamiento Múltiple de Datos Con el fin de percibir como es el almacenamiento múltiple de los datos en el contenido las tablas antes señaladas se pueden observar los siguientes aspectos: - Las diferentes tecnologías de almacenamientos múltiples basadas en datos no relacionales (tabla interna de oficina) y relacionales como el SIAR y SAAR. Estándar de transmisión EBCDIC y conectividad TCP/IP. - Definiciones múltiples de datos o sinónimos; como ejemplo tenemos: SAAR: F_RECLA y SIAR: Fecha_Registro, tienen la misma información pero diferentes nombres. - Diferencias de formatos, tipos de datos y longitud entre campos similares de dos bases de datos distintas. Ejemplo: SAAR: R_SIST y SIAR: COD_SIST. - Se presentan duplicidades en cuanto a los datos de elementos largos de datos como ejemplo: Circuito S/E de la tabla datos interno de oficina y el campo Cod_Cir de la tabla SIAR. Ver apéndice B y C. 4) Mezcla de las Fuentes de Datos Dado que las fuentes de datos se consideran tuberías que suministran datos al DWH, a continuación se explica como mezclar el contenido de esas tuberías o fuentes de datos y permitir que se conserven organizados; para ello es necesario realizar los siguientes pasos: a) Obtener el inventario de las fuentes de datos de herencia SAAR (sistema sin funcionamiento), el cual se encuentra organizado en disquetes por año. No todos los meses de cada año fueron obtenidos motivado a fallas por discos dañados y bases de datos creadas en hoja de cálculo Form Tool, herramienta no disponible actualmente. Las base de datos anuales halladas son 1998-1999-2000-2001. b) Se crea un archivo denominado SAAR con la herramienta Excel 2000 que contiene hojas de cálculo internas denominadas: historico98, historico99, historico00, historico01 y consolidado SAAR. c) Se lee el SAAR.dbf y se filtran aquellos registros del sistema de distribución con condición tipo de sistema igual al sistema de distribución (R_Sist = 2) y causa de falla igual a transformadores fallados (R_Causa = 13); luego es exportada esa información a los archivos de su correspondencia anual. Ver apéndice A. d) La base de datos SIAR.dbf se leen igualmente con el manejador de base de datos Access 2000. Se localiza la tabla interrupción, y se exportan solo los registro filtrados con la condición sistema de distribución igual al codigo 02 (Cod_Sist = 02) y causa de falla igual a transformadores dañados (Cod_Causa = 35). Ver apéndice B. e) Se crea un archivo denominado DWH, que contiene el almacén de datos formado por las siguientes hojas de calculo: subestacion, distrito, circuito (ver apéndice N), Interrupcion SAAR, Interrupcion SIAR, almacén de datos, tabla dimensión año, tabla dimensión tti, tabla dimensión se, tabla dimensión distrito, tabla dimensión ubicacion; tabla de eventos año, tabla de eventos TTI, tabla de eventos se, tabla de eventos distrito. f) En el SIAR se obtuvo la información referente a los años del 2001-2002. Estas tablas se forman con el sistema actual en línea que permite adquirir la información incluso en tiempo real. En éste prototipo se obtiene la data hasta el año 2002. No se maneja el DWH con el sistema de información en línea. g) La base de datos internos por oficina se trata de acuerdo a los campos afines a las bases de datos mencionadas. Ver apéndice C. 5) Transformación de la Fuentes de Datos Se transforma el modelo de fuente consolidada en un modelo de DWH; se agregan registros de origen, fecha y hora; elementos derivados y datos precalculados; valores de resúmen y de codificación. Para ello se tomó como base las entrevistas realizadas al: Coordinador de Distribución y al Jefe del Centro de Operación y Distribución (COD), éstos como personal idóneo para suministrar los reportes (indicadores de gestión) administrativos a los ejecutivos empresariales; así se determina el nivel de adición requerido, frecuencia de carga de datos y cantidad de ciclos (mensual, trimestral y anual) a mantener dentro del DWH. b.2) Modelado de Fuentes de Datos: Las fuentes de datos se integran para formar los modelos de datos tema, como se muestra a continuación: Área tema Fuente Tecnología Objeto Interrupciones de TED OLTP Relacional Tablas SubEstación OLTP Relacional Tablas Circuito OLTP Relacional Tablas Distrito OLTP Relacional Tablas FUENTE: El Autor, 2004 Tabla N° 14 Modelo de Datos Tema c) Visión y Modelado del DWH c.1) Visión del DWH: Internamente, en el archivo creado y denominado DWH.xls, existen dos hojas de cálculo llamadas Interrupción Saar e Interrupción Siar (ver apéndice A y B), con los datos tal cual como se encuentran desde su origen. Con ellos se genera una tercera hoja de cálculo denominada almacén de datos (ver apéndice D), donde se realizan los procesos de refinamiento y reingeniería, se estandariza con una estructura adecuada para poder recibir la información congruente con las necesidades de análisis del usuario empresarial. Dentro de los pasos de refinamiento y reingeniería se estandariza, se limpia y se filtra la información extraída de las fuentes del SAAR, SIAR y datos internos de oficina. También los datos se ajustan en los campos de fecha, minutos de interrupción y código de subestación por contener formatos diferentes debido al almacenamiento múltiple de los datos. En la Figura N° 23 se observa el componente del bloque arquitectónico de construcción del DWH. Se almacenan totales precalculados como resúmenes y adiciones por: mes, años, subestacion y circuitos en el DWH. Se incorporan a la información datos adicionales como la fuente, la fecha y la hora de origen, para proporcionar un contexto histórico; de esta manera el modelo de DWH facilita el uso y se hace comprensible para los usuarios finales. c.2) Modelado del DWH: Se escogió el modelado estrella de DWH (ver Figura N° 24), pues representa una perspectiva empresarial especifica sobre la información. Como el nombre sugiere, el esquema estrella tiene un solo objeto en medio (llaves y gráficos), conectado con varios objetos como las tablas de dimensiónes de años (ver apéndice E), subestaciones (ver apéndice F), distritos (ver apéndice G) y circuitos (ver apéndice H), todos organizados. Refinamiento y Reingeniería Creacíón del mercado de datos Modelar Modelar Filtraryyajustar ajustar Filtrar Integraryy Integrar fragmentar fragmentar Condensar Condensar Condensaryy Condensar agregar agregar Agregar Agregar Hacerun uncálculo cálculo Hacer previoyyderivar derivar previo Conciliaryy Conciliar Validar Validar Imprimirlalafecha fecha Imprimir delalafuente fuente de dedatos datos de Desarrollar Desarrollar consultas consultas sobrelalaarquitectura arquitectura sobre Crearyyextraer extraer Crear losmetadatos metadatos los FUENTE: El Autor, 2004 CrearGlosario Glosario Crear Examinar Examinar navegarpor por yynavegar losmetadatos metadatos los Figura N° 23-Bloque Arquitectónico del DWH Tabla de dimensión de Año Muchos Muchos atributos atributos de de tiempo tiempo Tabla de dimensión de Subestaciones Muchos atributos de tienda SE Tabla de dimensión de Distrito Llave_Tiempo Llave_Producto Llave_Circuito Muchos atributos de producto Distrito Llave_Tienda Llave_SE Tabla de dimensión de Circuito Llave_Ubicación Llave_Mercado Muchos atributos de Circuito Ventas_dolares TED Año Eventos Ventas_Unitarias TTI por SE TED por SE TED Dist.-Año TED Tipo Servicio FUENTE: El Autor, 2004 Figura N° 24 - Modelado Estrella d) Visión y modelado de la Consulta Empresarial d.1) Visión de la Consulta Empresarial: Como se usó el modelado de estrella multidimensiónal, el analista empresarial visualiza la consulta de una manera clara como una consulta multidimensiónal. De ahí que una consulta empresarial sea una solicitud de eventos a través de varias dimensiónes como se muestra en la Figura N° 25. Año Area Tema Interrupciones de TED Dimensión Año Mes Por TTI Por Subestación Año Dimensión Subestación Subestacion Distrito Tipo de Servicio Circuito FUENTE: El Autor, 2004 Dimensión Circuito Dimensión Distrito Figura N° 25 Molde de Consulta para una consulta empresarial de interrupciones. El bloque de acceso y uso del DWH de la Figura N° 26, tiene dos componentes: acceso y recuperación, análisis y reporte. Este bloque proporciona un acceso directo al DWH sin accesar directamente el almacén de datos. También es responsable de transformar los datos recuperados en vistas multidimensiónales o de almacenarlos en una base de datos multidimensiónal. En las tablas de eventos antes mencionadas se encuentran las llaves y gráficos obtenidos y su acceso depende de un menú aplicado en una hoja adicional denominada menú DWH, que permite tener el acceso directo según la necesidad escogida por el usuario. Administrar Administrar metadatos metadatos delDWH DWH del Acceso y Recuperación Análisis y Reporte AccesoyyUso Uso Acceso delDWH DWH del Herramientasde de Herramientas reporte reporte Accesoalal Acceso mercadode dedatos datos mercado Herramientas Herramientas SSD SSD Reingeniería Reingeniería Herramientas Herramientas demodelado modelado de Empresarial Empresarial Transformaraa Transformar estructura estructura multidimensional multidimensional Herramientas Herramientas paramineria mineriade de para datos datos Creardepósito depósito Crear local local Aplicaciones Aplicaciones denueva nueva de producción producción Crearyyextraer extraer Crear losmetadatos metadatos los Reporteyy Reporte administración administración demetadatos metadatos de OLAP OLAP FUENTE: Harjinder S. Gill y Prakash Figura N° 26 C. Rao,1996 Componentes del bloque arquitectónico de acceso y uso. Se aplicó la técnica de adición en las tablas de eventos existentes para mejorar el desempeño de las consultas, en los rubros estudiados. Se segmentaron las tablas de eventos por hojas de cálculo para ser consultado según los requerimientos. Se crearon llaves únicas para mejorar el desempeño de los vínculos. d.2) Modelado de la Consulta Empresarial: Al aplicar la técnica de modelado, es decir se buscan candidatos potenciales de la tabla de eventos y dimensión para el modelo del DWH, se construyen moldes de consultas por área tema y se consolidan, como se indicó en la Figura N° 25. Una vez identificados los moldes de consulta para cada consulta empresarial, éstos se consolidan, y forman el modelo STARNET (Red estrella), es de hacer notar que las dimensiónes son un reflejo de los requerimientos empresariales. Se establecen los siguientes reportes/consultas adaptadas al prototipo de TED. Ver gráficas de acuerdo a la numeración continua. 1. Reporte/Consulta de TED quemados por Año. Ver apéndice I. TED Fallados por Año 00:00 Cantidad 00:00 29 00:00 Interrupciones 21 00:00 17 00:00 Lineal (Interrupciones) 00:00 00:00 7 5 00:00 1998 1999 2000 Años 2001 2002 2. Reporte/Consulta de Tiempo Total de Interrupción (TTI) por subestación. Ver apéndice J. Minutos Tiempo Total de Interrupción (TTI) Por SubEstación 600 500 400 300 200 100 0 TTI SubEstaciones 3. Reporte/Consulta de TED quemados por subestación. Ver apéndice K. TED quemados por Subestacion Años 1998-2002 TED 15 10 5 0 Int errupción Subestacion 4. Reporte/Consulta de TED quemados por Distrito-Año. Ver apéndice L. Transformadores Quemados por Distritos Cantidad 25 20 15 TED 10 5 Cu m an Cu a 1 9 m an 98 Cu a 1 99 m a 9 Cu na m 200 an 0 Cu a 2 00 m an 1 a 20 02 Ca ru p Ca ano ru p 19 Ca ano 98 ru 20 p 0 Ca ano 0 ru 20 pa 0 no 1 20 02 0 Distritos 5. Reporte/Consulta de TED quemados por Tipo de Servicio. Ver apéndice M. TED quemados por Tipo de Servicio 1998-2002 Indus trial Res idencial Rural Urbano CAPÍTULO VII ANÁLISIS TÉCNICO-ECONÓMICO VII.- Evaluación Tecnológica de la Empresa ELEORIENTE. a) Antecedentes: Desde el año 1994, la gerencia de informática de la empresa inicia una serie de actividades con la finalidad de adecuar a la empresa tecnológicamente. Desde esa misma fecha se inician los procesos de solicitud para la adquisición de equipo y un Sistema Integral Administrativo. Es la casa Matriz (CADAFE), ente centralizado, la que se encarga de la aprobación económica, dada la relación de dependencia de su filial ELEORIENTE. En el año 1996, ELEORIENTE insiste en adquirir un sistema integral administrativo, lo cual motivó a realizar el levantamiento de información para luego paralizar el proyecto. b) Inventario de fuentes de datos: Hoy en día la empresa cuenta con Sistemas de información instalados independientes y en ejecución, ver Tabla 15. Todas las licencia son adquiridas por la empresa bajo estándares impuestos por la casa Matriz CADAFE. Años Sistemas de Programación Externo, Información Antes 1996 Nómina, Plataforma Interno Tecnológica Externo Risc 6000 Visual Basic Interno Windows Servicios Visual Basic Interno Windows Interno Windows Contabilidad, Cobol Facturación 1996 Alpha (recaudación, Facturación), Presupuesto 1998 Almacén, Médicos, SAAR 2001 SIAR, Otros sistemas Visual Basic FUENTE: El Autor, 2004 Tabla N° 15 Inventario de Fuentes de datos de ELEORIENTE c) Inventario de Equipos (Hardware): Con respecto a la adquisición de plataforma hardware, en el año 1999 se inicia la actualización de la redes de datos con la creación de redes LAN, en la sede ELEORIENTE y las zonas Anzoátegui, Bolívar y Sucre. Ver inventario de Hardware en la tabla N° 16. Zona topología Anzoátegui Estrella Velocidad Conexión 100 Mbps Bolívar Estrella 100 Mbps X Sucre Estrella 100 Mbps X FIB OP RA TIC A FUENTE: El Autor, 2004 Swiches Contrad. X x Conexión Servidor Pentium III Xeon 500Mhz marca HP modelo LH3 Pentium III Xeon 500Mhz marca HP modelo LH3 Cable UTP Nivel 5 UTP Nivel 5 (Oficinas C.) Fibra Optica (4 hilos) Pentium III UTP Nivel 5 Xeon 500Mhz marca (Oficinas C.) Fibra Optica HP modelo LH4 (6 hilos) Tabla N° 16 Inventario de Hardware de ELEORIENTE CADAFITO A BR I C I F PT O A ZONA SUCRE SEDE COD COMERCIAL PISO 7 SW 3COM PISO 4 PISO 3 PISO 1 SW 3COM / SERV A BR A FI TIC OP PISO 5 PISO 4 SEDE F OP IBR TI A CA PISO 6 PISO 2 PISO 1 PB FUENTE: El Autor, 2004 Figura N° 27 - Conexiones de cableado en las Zonas En la figura N° 28, se observa la distribución de la red LAN en la Filial y Zona Sucre. Tal como muestra la figura el bloque denominado Edificio zona Sucre, el cual está distribuido en planta baja (PB) donde se encuentra ubicado el Centro de Operaciones y Distribución (COD) que procesa el sistema SIAR. En el piso 1 se encuentra un servidor de la zona Sucre donde se mantiene toda la información de la interrupciones manejada por el SIAR; tres estaciones de trabajo las cuales son manejadas por: a) un especialista de tecnología de la información el cual creó el DWH, b) el Coordinador de Distribución como usuario gerencial y c) el Gerente de zona Sucre como usuario gerencial. Además, el servidor instalado en el piso 1, está conectado con al edificio de la Filial Empresa, donde se encuentra localizada la Presidencia y Direcciones, estos actúan también como usuarios gerenciales. Las conexiones son realizadas a través de Frame Relay por buzones creados con antelación. Switch/Hub 10/100Mb BayNetwork 4 Concentradores 10 Mb 3com Edificio Zona 2 UTP Categoría 5 Fibra Optica Servidor HP Netserver LH4 3 1 Cadafito 2 PB 1 Aferición FUENTE: El Autor, 2004 PB Centro de Computación Taquilla Única Vigilancia Almacén Figura N° 28 Esquema de la red LAN - ELEORIENTE d) Internet: Existen 15 cuentas de internet distribuidas en sede zonas y conexión de 60 cuentas adicionales de CANTV, de 60 cuentas adicionales a través de Frame Relay. Hay comunicación interna a través del correo electrónico, mensajería OUTLOCK y buzones de datos en cada equipo (estructura + iniciales del nombre) a través de la red Frame Relay. VII.1.- Análisis Técnico-Económico Tomando en cuenta lo manifestado por los implementadores pioneros del DWH, lo cual se mencionó en la justificación del trabajo, se resume lo siguiente: No es posible comprar un DWH, hay que construirlo. El Data Warehouse es un proceso, no un lugar-Meta Group Según los estudios no hay un DWH que se venda comercialmente, hay que construirlo a partir de los componentes disponibles, para ello el estudio técnico-económico se basa en: 1.- Analizar las necesidades empresariales, estudio realizado en el capitulo IV, sobre planificación y requerimientos del usuario. 2.- Construir una arquitectura la cual fue realizada en el capítulo V, sobre el análisis y diseño del DWH. 3.- Examinar las estructuras de los fabricantes: la empresa está dotada de los paquetes o software adecuado para realizar el presente trabajo: Windown NT, Windows 98, hoja de cálculo Excel 2000 de la empresa Microsoft y Microsoft Access. a) Teoría de la Justificación del Costo del DWH de Transformadores Eléctricos de Distribución. Construir este modelo económico significa definir y cuantificar los objetivos empresariales y establecer las estrategias y tácticas a usar. Se consideró la reutilización de las inversiones actuales en tecnología de la información, por lo tanto el reuso de las inversiones existentes facilita la superación de los obstáculos de recuperación sobre la inversión y sobre los activos. Se desarrolla a continuación los modelos proforma de ingresos y costos, los cuales conducen al modelo financiero proforma (ver tabla 17). Modelo de ingresos proforma Ingresos y beneficios (tangibles e intangibles) Minimizar la cantidad de transformadores quemados según la meta establecida por CADAFE (beneficio). Ver Formulario en Anexos. Modelo de Costo proforma Costo del DWH Sueldo del personal creador del DWH inicial. Sueldo del personal de TI para el mantenimiento del DWH y de equipos (TI, Coordinador, Director y Presidente) mensual. Mantenimiento de Impresoras (TI, Coordinador, Director y Presidente) mensual. FUENTE: El Autor, 2004 Tabla N° 17 - Modelo Económico El Modelo de Ingreso Proforma puede tener mediciones tangibles como intangibles. Las mediciones tangibles son los valores monetarios o declaración de objetivos que consisten en convertir todo a un valor monetario, en nuestro caso la cantidad de transformadores que puedan salvarse de daños en la zona Sucre. Implica incremento de costos e ingresos. Modelo de Costo Proforma: Hay dos submodelos el de costos empresariales y el de DWH. El submodelo de costos empresariales se subdivide en costos nuevos y en incremento en los costos actuales. Los costos de incremento incluyen el costo de profesionales de la Tecnología de información. Se requieren los siguientes submodelos De Costos Empresariales Costos nuevos: Se incurre en costos para generar nuevos ingresos o incrementarlos. Incremento en los costos actuales: Para cuantificar los costos del incremento, es esencial primero establecer los costos actuales. Deben incluir los costos de profesionales en TI para apoyar al usuario empresarial del DWH. De DWH: Costos de DWH Iniciales: Son los gastos por única vez (diseño, construcción y despliegue del DWH); también los costos de capital (hardware y software). Costos recurrentes fijos: actualización continua del DWH, a partir de fuentes de datos. Costo Variables continuos: elementos como el crecimiento del DWH conforme aumenta el ámbito cuando se incorporan más usuarios. Costos de DWH recurrentes (continuos). El modelo de costos proforma debe incluir todas las erogaciones, los costos en tecnología de la información y los costos de la organización de los usuarios empresariales. Se deben clasificar, asignar e incluir en los costos totales los de hardware y software, incluyendo las cuotas de mantenimiento. El Modelo Financiero de Utilidades Proforma: es una medición de la rentabilidad (beneficios tangibles de la iniciativa del DWH y de los beneficios intangibles por alcanzar. No se considera pues se sale del alcance del trabajo. La filosofía de la tecnología de la información del DWH debe ser: Costos iniciales más bajos Los menores costos recurrentes Más rápido calendario de implementación (el tiempo es costo e inversión) Máxima reutilización de las inversiones existentes. El medio financiero proforma debe incluir proyecciones para no más de tres años, el medio de los negocios es demasiado dinámico y cambiante. Para grandes empresas se debe considerar 5 años. b) Detalle de la Justificación del Costo del DWH de Transformadores Eléctricos de Distribución. La empresa CADAFE establece metas a lograr en un tiempo determinado, luego ELEORIENTE las distribuye a lo largo de los 12 meses del año. Como se observa en el Anexo A, en el año 2002 se presenta un total de 312 TED quemados y en el año 2003 CADAFE establece una meta máxima de 293 TED. El objetivo es minimizar la cantidad de TED quemados, para ello se distribuye la diferencia de 19 TED en el año y se obtiene un promedio de 2 TED mensuales máximos a quemar. El costo de los TED se obtienen del promedio de la compra de transformadores adquiridos por un precio aproximado para el año 2003, de Bs.3.259.670 mensual y de Bs. 39.116.040,00 anual. Ver anexo B donde se presenta el formulario de orden de compra del 18/06/2003. Como incrementos de los Costos, se incurre, en cursos de especialización del DWH para el personal de tecnología de informática equivalente a Bs. 6.000.000,00 anuales. El entrenamiento solo se impartirá a expertos en lenguajes SQL Server u otro manejador similar con el objeto de adiestrarse en la administración del módulo único de diseño DWH. Se deja a la empresa la implementación libre en soluciones de los módulos de fuentes de datos y consultas gerenciales en datawarehousing. Como Incremento de costos de mantenimiento se incurre en el sueldo para un ingeniero del área de informática que administre el DWH y un técnico de soporte. En cuanto a los ingresos: dependerá de las decisiones gerenciales las cuales se toman en base a la información suministrada por el DWH. Principalmente el control preventivo de los TED para evitar que se generen en las cantidades que ahora ocurren. A continuación se tabula los valores relacionados con el análisis técnico: Rubro N° Costo Anual Costo Mensual Costo Unitario Personal TSU de TI 22 155.945.600 12.995.467 590.703 12.000.000 1.200.000 1.200.000 22 155.945.600 12.995.467 590.703 30 13.620.000 1.135.000 37830 1 6.000.000 500.000 500.000 (sueldos) Generan DWH Personal Ingeniero de 1 TI (sueldos) Generan DWH Mantenimiento Equipos HP Mantenimiento Impresora HP Costo desarrollo DWH dentro de la Empresa Transformadores * FUENTE: El Autor, 2004 1 1.629.835 Tabla N° 18 Rubros para el análisis Técnico Económico ESTADO DE RESULTADOS MENSUAL Ingresos Recuperación (Dos Transformadores)......................... 3.259.670 Costo 1.200.000 Personal TI (un ingeniero)...................................................... Personal TSU.......................................................................... Mantenimiento PC.................................................................. Mantenimiento Impresora....................................................... Entrenamiento y Mejoras del Sistema.................................... 590.703 590.703 37.830 500.000 Total Costo Mensual.................................... (2.919.236) Utilidad de Operación................................................................... 340.434 Conclusiones Evaluación Técnico/Económico: 1.- Se necesitan dieciocho (18) meses aproximadamente para recuperar la inversión inicial del costo de desarrollo del DWH por Bs. 6.000.000,00. 2.- Una vez lograda esta recuperación, el beneficio incurre en Bolívares 340.434,00 mensual si se aplica el control para manejo de TED con el DWH, en la empresa ELEORIENTE. 3.- Los ingresos se mantienen y los costos disminuyen en el tiempo. El sistema se autogestiona invirtiendo en desarrollo permanente generando beneficio para la empresa. Ingresos Escenario: Costos 4.- Al reducir la cantidad de TED quemados y ajustarse o bien, superar la meta establecida por CADAFE anualmente, se incrementa la atención al cliente, se eleva la venta de energía y la recaudación, es decir mayor ingreso y mejor calidad de servicio. CONCLUSIONES Y RECOMENDACIONES CONCLUSIONES A partir de los resultados arrojados del análisis del estudio, surgen una serie de conclusiones que permiten de alguna manera cumplir con los objetivos trazados, los cuales se mencionan a continuación: Información operativa desorganizada. La calidad de los archivos y la documentación determina la optimización de la fuente. Datos históricos incompletos (el prototipo trabaja con datos completos en todas sus dimensiones). Las Coordinaciones de Distribución y Planificación carecen de un sistema integrado para el control de transformadores eléctricos de distribución, que permita controlar las demandas y ejecución de obras para la zona Sucre. El Coordinador de Distribución no recibe información de los datos de TED asignados por obras ejecutadas lo que ocasiona el desconocimiento del gasto real de TED usados. No se aplican métodos estadísticos para cálculo de pronósticos, solo se ajustan valores según la casa Matriz CADAFE. No existen manuales de operación de los sistemas de información de interrupciones instalados en la Empresa. El sistema SIAR instalado actualmente, no reporta todo el conjunto de gráficos requeridos para los usuarios gerenciales, por lo que los datos se obtienen de forma manual para luego trasladarlos a herramientas como Word o Excel y finalmente afinarlas y reportarlas mensualmente en los índices de gestión. RECOMENDACIONES En función a los resultados del Prototipo (modelo) desarrollado como el sistema de Soporte de Decisiones DWH, así como su entorno, se considera necesario tomar en cuenta las recomendaciones que permitan elevar el servicio ofrecido por la empresa a los clientes de la zona, así como incrementar los índices de calidad establecidos; por ende es imprescindible: Crear conciencia de mantener en forma adecuada la información histórica. La calidad de los archivos y la documentación determina la optimización de la fuente. Ampliar la comunicación y los controles entre la coordinación de distribución y la coordinación de planificación, con el objeto de unificar criterios para cubrir las necesidades de las comunidades, a nivel del TED. Aumentar los estudios sobre TED quemados en especial las zonas críticas del Estado Sucre, con el fin de disminuir las pérdidas. Mantener manuales operativos de los sistemas en ejecución de la empresa, ya que de éstos depende la calidad de la documentación, determina el éxito para extraer datos de la fuentes almacenadas y permite alimentar correctamente a la DWH en caso de implementar. Realizar estudios pertinentes con el departamento de informática y usar la tecnología de información con el fin de instalar un sistema de soporte de decisiones DWH definitivo a nivel gerencial. BIBLIOGRAFÍA [Gill, Harjinder. S. y Rao, Prakash C. 1996]. Datawarehousing. QUE Corporation, Mexico. [UNA;1996]. Teoría de Sistemas Tomo I y II (306). Tercera reimpresión,1996. Caracas:Autor. [CAIVET;2000]. Transformadores de Potencia 34.5/13.8kV de 10 MVA. Curso de Adiestramiento. Caracas. [CAIVET;2000]. Aspectos Técnicos. Disponible en http://www.caivet/htm/aspectos _técnicos.htm [Marcelo Arnold, Ph.D. y Francisco Osorio, M.A.;2000]. Introducción a los Conceptos Básicos de la Teoría General de Sistemas. Departamento de Antropología. Universidad de Chile. [Gerencia de Informática y Telecomunicaciones;1998]. Proyectos 1998-2001. Eleoriente, Filial de CADAFE 1998. [IQ/Vision;2004]. Open OLAP for Multidimensional, Data Analysis. Disponible en www.dbmsmag.com. [SAS, INSTITUTE COLOMBIA S.A.;2004]. SAS Bodegas de Datos, Data Warehousing. Colombia,2003; Disponible en: www.catalogodesoftware.com/software. [GACETA OFICIAL;2003]. Gaceta Oficial de la República Bolivariana de Venezuela. Número 37.825. Caracas, martes 25 de noviembre de 2003. Caracas, Venezuela. [Ruth Priscila Landeros Gómez;1997]. Herramientas CASE. Universidad Veracruzana. Sistemas Computacionales Administrativos.Disponible en www.monografias.com. [KENDALL & KENDALL;2000]. Análisis y Diseño de Sistemas. 3ra Edición. 2000. [Elena - Irina Neaga;2002]. La minería de datos mejora el conocimiento. [ María M. García, Luis A. Quintales, Francisco J. García, José P. Martín;2000]. Aplicación de Técnicas de Minería de Datos en la Construcción y Validación de Modelos Predictivos y Asociativos a partir de Especificaciones de requisitos de Software. Universidad de Salamanca. [CADAFE;1999]. Manual de Dirección de Operaciones (Anexo informe 14100/MC/007 de 1997. Versión Actualizada a Febrero 1999. Caracas. [Jesús Ibarra;2003]. Síntesis de Metodología para el análisis, diseño e implantación de un DWH. Naucalpan Edo. De México. [ELEORIENTE CENTRO DE OPERACIONES DE DISTRIBUCION SUCRE;2001]. Manual Usuario SIAR (Sistema de Atencion de Reclamos) Plus. Cumaná Estado Sucre. Versión I. 2001. [PCMagazine vol 9, nro 3, pag 47-52]. ANEXOS Breve Análisis Referentes a los Gráficos Anexos A pesar de no recabar la totalidad de los datos históricos en el tiempo establecido 1998-2002, se concluye de los gráficos anexos lo siguiente: En el año 2002, es donde se refleja el número más alto de TED quemados. En las subestaciones Espuga y Cumanacoa se observa el numero más alto de interrupción (indicador TTI). La subestacion con menor índice es Catuaro con menor número poblacional. Se vidualiza un alto incremento de TED fallados en las zonas que corresponden a la subestacion de Cumanacoa, valle caracteristico de gran humedad, altas lluvias y tormentas. También la zona correspondiente a la subestación Manzanares con alto índice poblacional, ambas en los años 1998 hasta el 2002. En el distrito Cumaná del año 2002, se observa mayor cantidad de TED quemados es donde hay mayor población residencial que supera al resto de las subestaciones y tipo de mercado señalado. El desvalance en los años 2001 y 2002 originado por ondas tropicales en el sistema de distribución, hace aumentar los TED fallados. los fenómenos naturales de las zonas acompañado de las fuerte lluvias con contínuas descargas y vientos huracanados. La falta de mantenimiento preventivo y correctivo en las redes de distribución durante los años 2001 y 2002 por no contar con los materiales requeridos para tal fin. Se recomienda solicitar a los distritos tecnicos Cumana y Carúpano la planeación del mantenimiento anual, y hacer los seguimientos respectivo. Recuperar los transformadores quemados, y sustituir aquellos en recuperación. Agilizar los trámites para adquirir los materiales de distribución. Reactivar los programas de limpieza de los diferentes distritos más afectados. Recuperar los transformadores averiados (no quemados). ENTREVISTAS Área Técnica - Gerente de Logística 1.- ¿Cuál(es) unidad(es) solicita(n) la compra de transformadores eléctricos?. - Gerencias de zonas - Coordinación de Almacén ELEORIENTE - CADAFE 2.- ¿Cómo se canaliza la compra de transformadores eléctricos?. - Por orden de compra - Licitación selectiva (escoge la empresa) - Licitación General - Adquisición directa 3.- ¿Cuál es el alcance económico para la compra? Por la Dirección Técnica - Gerencia de Logística - 1.100 UT; 17 millones de bolívares por orden de compra Por la Presidencia de la Filial - 5.000 UT 4.- Posee sistema de información que controle la entrada y salida de TE Si, el sistema de información que funciona bajo la coordinación de almacén. 5.- Llevan algunas estadísticas con respecto al manejo de TE para analizar costos-beneficios. No 6.- Cada cuanto tiempo se adquieren TE. Cuando hay requerimientos de parte de la zona o bien por Cadafe. 7.- Que método se aplica para realizar los presupuestos - Se aplica el incremento porcentual a las compras adquiridas en el año anterior. 8.- Desea usted mayor información estadística Si, se requiere más precisión en cuanto a datos estadísticos. - Cuando hay requerimientos Área Operativa – Gerencia de Distribución 1.- ¿De cuál(es) unidad(es) recibe información de transformadores eléctricos?. - Gerencias de zonas - Sucre a través del COD y el sistema SIAR - Anzoátegui y Bolívar (Acrobat) 2.- ¿Con qué frecuencia?. - Diaria y mensual por Zona 3.- ¿Cuál es el alcance? Toda el área operativa de las zonas. 4.- En que formatos las recibe - Sucre a través del COD y el sistema SIAR - Anzoátegui y Bolívar (Acrobat) 5.- ¿ Hacia que unidades reporta información y cada cuanto tiempo? Hacia la dirección de operaciones, mensualmente. 6.- Como suministra la información hacia sus superiores. En formatos de WORD 7.-¿ Interviene en la adquisición de TE? Si, cuando se realiza la solicitud de transformadores. 8.-¿Cómo genera los presupuestos para los años siguientes? En función al año anterior incrementando porcentajes según cambios y requerimientos de la unidad operativa. 9.- Información de tensión, controlada, 34.5, 120 voltios. Baja tensión es baja tensión. Encargado COD ¿Diga cuáles son los datos manejados en el sistema de Centro de Atención al Cliente y el Sistema Integrado para la Atención de Reclamos(SIAR) del Centro de Operaciones de Distribución? ♦ Interrupción en el sitio de ocurrencia: Se solicita el código de ruta-cuenta impreso en la factura del cliente. Si tiene más de tres facturas vencidas se sugiere ir a la oficina comercial, sino se transcriben los datos personales entre ellos cédula, nombre, dirección y se archivan los datos de la interrupción. ♦ Interrupción del Sector: 1) El recepcionista solicita al cliente su cédula o su teléfono como referencia personal. 2) Luego, solicita al cliente datos del reclamo: dirección y puntos de referencia. Información Adicional: Sector Residencial, Comercial, Industrial, Gubernamental u Oficial. 3) Transcribe el tipo de reclamo ej.: sector sin corriente; línea reventada etc. 4) Refleja por pantalla un listado del estado de reclamos denominado Boleta Abierta y Boletas en Proceso; el cual refleja los reclamos pendientes por ejecutar y los reclamos en proceso. Se muestra la siguiente data: Distrito, Circuito, nro. boleta, fecha recibida, nombre, apellido, sector, tipo de reclamo. 5) Se contabilizan los reclamos y pueden ser accesados en cualquier momento. 6) Se ordena a la cuadrilla del COD asistir al reclamo con la evidencia (boleta) emitida por el sistema SIAR. 7) Si se detecta quema de transformadores se usa la planilla Reporte de Fallas Transformadores de Distribución, se elabora, firma y se envia original y copia a unidad de Distrito. 8) Distrito recibe el reporte de fallas transformadores de distribución y canaliza la adquisición del transformador a reponer en sitio. ¿Diga cómo se ejecutan los reclamos del Centro de Operaciones de Distribución?