ESCUELA POLITÉCNICA NACIONAL FACULTAD DE INGENIERÍA DE SISTEMAS IMPLEMENTACION DE UN DATAMART PARA EL ÁREA DE CAPACITACIÓN Y CONSULTORÍA DEL CENTRO DE EDUCACIÓN CONTINUA “CEC” PROYECTO PREVIO A LA OBTENCIÓN DEL TÍTULO DE INGENIERO EN SISTEMAS INFORMATICOS Y DE COMPUTACION JIMÉNEZ CHAMBA FERNANDO SANTIAGO fernando_jmnz_07@yahoo.com ZAMBRANO NOGUERA EDGAR ROLANDO edgrolan722@hotmail.com DIRECTOR: MSc. FRANCISCO VILLAVICENCIO fvillavi@yahoo.com Quito, Diciembre 2009 2 DECLARACIÓN Nosotros, Jiménez Chamba Fernando Santiago y Zambrano Noguera Edgar Rolando, declaramos bajo juramento que el trabajo aquí descrito es de nuestra autoría; que no ha sido previamente presentada para ningún grado o calificación profesional; y, que hemos consultado las referencias bibliográficas que se incluyen en este documento. A través de la presente declaración cedemos nuestros derechos de propiedad intelectual correspondientes a este trabajo, a la Escuela Politécnica Nacional, según lo establecido por la Ley de Propiedad Intelectual, por su Reglamento y por la normatividad institucional vigente. __________________________ Fernando Santiago Jiménez _______________________ Edgar Rolando Zambrano 3 CERTIFICACION Certifico que el presente trabajo fue desarrollado por Jiménez Chamba Fernando Santiago y Zambrano Noguera Edgar Rolando, bajo mi supervisión. __________________________ Ing. Francisco Villavicencio DIRECTOR DE PROYECTO 4 DEDICATORIA El presente trabajo va dedicado de todo corazón a mi Papá y a mi Mamá, quienes me han apoyado incondicionalmente a cada momento, por esforzarse noche y día para ofrecerme siempre lo mejor, por enseñarme valiosos principios y por incentivarme a ser una mejor persona cada día. A mi querida hermana, por apoyarme constantemente, por darme muy buenos consejos y por enseñarme que a pesar de las adversidades que se puedan presentar uno siempre debe salir adelante y no rendirse. A mis padrinos Libia y Germán por estar siempre pendientes de mi y por motivarme a alcanzar mis objetivos. A mis amigos Alexis, Amanda y Edgar por ser como unos hermanos para mí, por compartir conmigo gratos momentos y por ofrecerme su apoyo cuando lo he necesitado. A mis profesores por haber compartido sus conocimientos y experiencias con la finalidad de incentivarnos a ser buenos profesionales. A nuestro tutor, MSc. Francisco Villavicencio, que gracias a su guía y apoyo, fue posible culminar este proyecto, Fernando 5 DEDICATORIA Dedico este proyecto y toda mi vida a Dios por estar a mi lado dia a día, dándome las fuerzas necesarias par seguir adelante. A mis padres, Vicente y Ma. Salomé, por su apoyo infinito, amor incondicional y humildad, sus consejos y paciencia, quienes han sido siempre mi fuente de inspiración y guía de vida. A mis hermanos, Carmita (+) que desde el Cielo me cuida y es mi ángel de la guarda, Nixon por sus consejos, y Jeanneth por ser como mi segunda madre. A mis sobrino, Esteban por enseñarme lo paciente que puede ser un niño, por la alegría y pureza con que se pueden realizar las cosas y ser la razón de mi vida. A mi amigo Fernando, por su dedicación, empeño y paciencia que tuvo durante todos los proyectos que se nos presentaron, durante la carrera. A mis profesores y compañeros de clases por haberme transmitido sus conocimientos y darme lecciones tanto profesionales como de vida. A nuestro tutor, MSc. Francisco Villavicencio, que gracias a su valiosa orientación, fue posible culminar este proyecto, Edgar 6 INDICE CAPITULO 1 ...................................................................................................... 20 1.1 JUSTIFICACIÓN DE LA METODOLOGÍA DE DESARROLLO ........... 20 1.1.1 METODOLOGÍA PROPUESTA POR GILL HARJINDER Y RAO PRAKASH ................................................................................................... 20 1.1.1.1 Planificación ................................................................................ 20 1.1.1.2 Requerimientos ........................................................................... 23 1.1.1.3 Análisis........................................................................................ 24 1.1.1.4 Diseño ......................................................................................... 25 1.1.1.5 Construcción ............................................................................... 26 1.1.1.6 Despliegue .................................................................................. 26 1.1.1.7 Expansión ................................................................................... 27 1.1.2 METODOLOGÍA PROPUESTA POR SAS INSTITUTE ................ 27 1.1.2.1 Evaluación................................................................................... 28 1.1.2.2 Requerimientos ........................................................................... 29 1.1.2.3 Diseño ......................................................................................... 30 1.1.2.4 Construcción ............................................................................... 30 1.1.2.5 Pruebas Finales .......................................................................... 31 1.1.2.6 Despliegue .................................................................................. 31 1.1.2.7 Revisión ...................................................................................... 32 1.1.3 SELECCIÓN DE LA METODOLOGÍA DE IMPLEMENTACIÓN ... 33 1.1.3.1 Planificación ................................................................................ 33 1.1.3.2 Requerimientos ........................................................................... 34 1.1.3.3 Análisis........................................................................................ 35 1.1.3.4 Diseño ......................................................................................... 36 1.1.3.5 Implementación........................................................................... 36 1.1.3.6 Pruebas....................................................................................... 37 1.2 SELECCIÓN DE HERRAMIENTAS DE IMPLEMENTACIÓN.............. 39 7 1.2.1 HERRAMIENTAS BUSINESS INTELLIGENCE ............................ 39 1.2.1.1 Microsoft SQL Server Business Intelligence MSSBI .................. 39 CAPITULO 2 ...................................................................................................... 42 IMPLEMENTACION DEL DATAMART .......................................................... 42 2.1 PLANIFICACION................................................................................... 42 2.1.1 Objetivo del Datamart..................................................................... 42 2.1.2 Situación actual de la Coordinación de Capacitación y Consultoría (CCC) 42 2.1.2.1 Generalidades:............................................................................ 42 2.1.2.2 Detalle del Proceso Productivo de la CCC ................................. 43 2.1.2.3 Modelo orgánico funcional de la CCC ........................................ 44 2.1.2.4 Productos de la CCC .................................................................. 46 2.1.2.5 Infraestructura Tecnológica ........................................................ 47 2.1.2.6 Identificación de problemas ........................................................ 50 2.1.3 Desarrollo del cronograma y presupuesto del proyecto ................ 50 2.1.4 Definición de los objetivos de uso empresarial.............................. 51 2.1.4.1 Audiencia de destino:.................................................................. 51 2.1.4.2 Plataforma tecnológica: .............................................................. 52 2.1.4.3 Características y Funciones........................................................ 52 2.1.4.4 Selección de la estrategia de implementación ........................... 53 2.1.4.5 Selección del método de desarrollo............................................ 53 2.1.4.6 Selección del ámbito inicial de implementación ......................... 53 2.1.4.7 Origen de las fuentes de datos ................................................... 53 2.1.4.8 Modelo Empresarial .................................................................... 53 2.1.5 Selección del enfoque arquitectónico ............................................ 54 2.1.6 Desarrollo de escenarios de uso empresarial................................ 55 2.1.7 Recopilación de datos y metadatos ............................................... 56 2.2 REQUERIMIENTOS ............................................................................. 56 2.2.1 Requerimientos del propietario ...................................................... 56 2.2.2 Requerimientos del arquitecto ....................................................... 56 8 2.2.2.1 Bloques del Datamart ................................................................. 57 2.2.2.2 Capas del datamart.................................................................... 60 2.2.3 Requerimientos del desarrollador .................................................. 61 2.2.3.1 Fuentes de Datos........................................................................ 61 2.2.3.2 Datamart ..................................................................................... 61 2.2.3.3 Acceso y Uso .............................................................................. 61 2.2.4 Requerimientos del usuario final.................................................... 61 2.2.4.1 Requerimientos de consulta ....................................................... 62 2.2.4.2 Requerimientos de reporte ......................................................... 63 2.3 ANALISIS .............................................................................................. 64 2.3.1 DIMENSIONES .............................................................................. 64 2.3.2 TABLAS DE HECHO...................................................................... 65 2.3.2.1 Proceso de medición académica................................................ 65 2.3.2.2 Medidas....................................................................................... 65 2.3.2.3 Dimensiones ............................................................................... 65 2.3.2.4 Modelo Lógico............................................................................. 66 2.3.3 Proceso de medición de evaluación a cursos................................ 66 2.3.3.1 Medidas....................................................................................... 66 2.3.3.2 Dimensiones ............................................................................... 66 2.3.3.3 Modelo Lógico............................................................................. 67 2.3.4 Proceso de medición de encuestas realizadas.............................. 67 2.3.4.1 Medidas....................................................................................... 67 2.3.4.2 Dimensiones ............................................................................... 67 2.3.4.3 Modelo Lógico............................................................................. 68 2.3.5 Proceso de medición de rendimiento de cursos ............................ 68 2.3.5.1 Medidas....................................................................................... 69 2.3.5.2 Dimensiones ............................................................................... 69 2.3.5.3 Modelo Lógico............................................................................. 69 2.3.6 Estrategia de Carga y Refrescamiento de datos .......................... 70 9 2.3.6.1 Estrategia de carga de datos ...................................................... 70 2.3.6.2 Estrategia de Refrescamiento de Datos ..................................... 74 2.4 DISEÑO ................................................................................................ 75 2.4.1 Dimensiones................................................................................... 75 2.4.1.1 Diseño físico de la dimensión DIM_OBSERVACION:................ 75 2.4.1.2 Diseño físico de la dimensión DIM_TIEMPO ............................. 75 2.4.1.3 Diseño físico de la dimensión DIM_ITEM................................... 75 2.4.1.4 Diseño físico de la dimensión DIM_INSTRUCTOR.................... 75 2.4.1.5 Diseño físico de la dimensión DIM_EVALUABLE ...................... 75 2.4.1.6 Diseño físico de la dimensión DIM_CURSO .............................. 76 2.4.1.7 Diseño físico de la dimensión DIM_CLIENTE ............................ 76 2.4.2 Proceso de medición académica ................................................... 76 2.4.2.1 Diseño físico de la tabla de hechos FACT_ACADEMICO ......... 76 2.4.2.2 Modelo físico de la tabla de hechos FACT_ACADEMICO......... 76 2.4.3 Proceso de medición de evaluación a cursos................................ 77 2.4.3.1 Diseño físico de la tabla de hechos FACT_EVALUACION ....... 77 2.4.3.2 Modelo físico de la tabla de hechos FACT_EVALUACION ....... 77 2.4.4 Proceso de medición de encuestas realizadas............................. 78 2.4.4.1 Diseño físico de la tabla de hechos FACT_ENCUESTA............ 78 2.4.4.2 Modelo físico de la tabla de hechos FACT_ENCUESTA ........... 78 2.4.5 Proceso de medición de rendimiento de cursos ............................ 79 2.4.5.1 Diseño físico de la tabla de hechos FACT_RENDIMIENTO ...... 79 2.4.5.2 Modelo físico de la tabla de hechos FACT_RENDIMIENTO .... 80 2.4.6 Diseño detallado de la arquitectura de aplicación ......................... 80 2.4.6.1 Fuentes de datos ........................................................................ 81 2.4.6.2 Datamart ..................................................................................... 81 2.4.6.3 Acceso y uso............................................................................... 81 2.4.6.4 Componente de visualización ..................................................... 82 2.4.7 Definición de los niveles de seguridad........................................... 83 10 2.5 IMPLEMENTACIÓN.............................................................................. 84 2.5.1 Implementación de la Estrategia de Carga.................................... 84 2.5.2 Implementación de la Estrategia de Refrescamiento de datos ..... 86 2.5.3 Explotación ..................................................................................... 87 2.5.3.1 Orígenes de datos ...................................................................... 87 2.5.3.2 Vista de orígenes de datos ......................................................... 89 2.5.3.3 Cubos .......................................................................................... 91 2.5.4 Elaboración de Consultas .............................................................. 95 2.5.4.1 Parámetros de consulta .............................................................. 95 2.5.4.2 Estructura del reporte ................................................................. 96 2.6 PRUEBAS ............................................................................................. 97 2.6.1 Pruebas de validación de requerimientos...................................... 97 2.6.2 Pruebas Funcionales...................................................................... 99 2.6.2.1 Pruebas de extracción, transformación y carga ....................... 99 2.6.2.2 Prueba de refrescamiento de datos..........................................101 2.6.2.3 Pruebas de seguridad...............................................................102 2.6.2.4 Pruebas de rendimiento del sistema ........................................103 2.6.3 Despliegue....................................................................................105 2.6.3.1 Instalación inicial del datamart..................................................105 2.6.3.2 Capacitación a los usuarios del datamart.................................105 2.6.4 Revisión y expansión ...................................................................108 2.6.4.1 Requerimientos limitados por el modelo de datos del datamart 108 2.6.4.2 Identificación de otras fuentes de datos externas que no han sido tomadas en cuenta en el ámbito inicial..................................................109 2.6.4.3 Potenciación y mejoramiento del modelo de datos del datamart 109 2.6.4.4 Coordinaciones no atendidas ..................................................109 CAPITULO 3 ....................................................................................................111 CONCLUSIONES Y RECOMENDACIONES ...............................................111 11 3.1 Conclusiones.......................................................................................111 3.2 Recomendaciones ..............................................................................114 12 ÍNDICE DE FIGURAS Figura 1: Proceso Iterativo del SAS Rapid Warehousing Methodology ........... 28 Figura 2: Definición de la Fase de Planificación ................................................ 34 Figura 3: Definición de la Fase de Requerimientos ........................................... 35 Figura 4: Definición de la Fase de Análisis........................................................ 35 Figura 5: Definición de la Fase de Análisis y Diseño......................................... 36 Figura 6: Definición de la Fase de Implementación........................................... 37 Figura 7: Definición de la Fase de Implementación........................................... 39 Figura 8: Mapa de Procesos del CEC................................................................ 43 Figura 9: Proceso Productivo de la CCC ........................................................... 43 Figura 10: Organigrama Funcional de la Coordinación de ................................ 45 Figura 11: Infraestructura tecnológica el CEC ................................................... 49 Figura 12: Arquitectura Cliente / Servidor de dos capas ................................... 55 Figura 13: Arquitectura propuesta del datamart ............................................... 57 Figura 14: Modelo Físico de la base de datos SISCEC .................................... 58 Figura 15: Arquitectura del datamart a alto nivel .............................................. 59 Figura 16: Modelo lógico del datamart FACT_ACADEMICO ............................ 66 Figura 17: Modelo lógico del datamart FACT_EVALUACION........................... 67 Figura 18: Modelo lógico del datamart FACT_ENCUESTA .............................. 68 Figura 19: Modelo lógico del datamart FACT_RENDIMIENTO......................... 69 Figura 20: Extracción y carga de datos desde las fuentes de datos ................. 70 Figura 21: Modelo físico del proceso de medición académica .......................... 77 Figura 22: Modelo físico del proceso de medición de evaluación a cursos ...... 78 Figura 23: Modelo físico del proceso de encuestas realizadas ......................... 79 Figura 24: Modelo físico del proceso de medición de rendimiento de cursos... 80 Figura 25: Arquitectura cliente/servidor de la aplicación ................................... 81 Figura 26: Interfaz de autenticación de usuarios ............................................... 82 Figura 27: Interfaz de reportes........................................................................... 83 Figura 28: Proceso de extracción, transformación y carga de la base de datos SISCEC ....................................................................................................... 85 13 Figura 29: Proceso de extracción, transformación y carga de la base de datos dmTransformacion a la base de datos dmCCC. ........................................ 86 Figura 30: Calendarización del DTS .................................................................. 87 Figura 31: Selección de la base de datos del datamart como origen de datos. 88 Figura 32: Verificación de conexión con el origen de datos .............................. 88 Figura 33: Selección de credenciales para Analysis Services .......................... 89 Figura 34: Selección del origen de datos relacional .......................................... 89 Figura 35: Selección de las dimensiones y tablas de hechos ........................... 90 Figura 36: Asignación del nombre de la vista de origen de datos..................... 90 Figura 37: Vista de orígenes de datos ............................................................... 91 Figura 38: Selección del método de generación del cubo................................. 91 Figura 39: Selección de la vista de orígenes de datos ...................................... 92 Figura 40: Identificación de las tablas de hechos y de dimensiones................. 92 Figura 41: Identificación de propiedades de tiempo en la dimensión DIM_TIEMPO.............................................................................................. 93 Figura 42: Medidas a incluir en el cubo ............................................................. 93 Figura 43: Especificación del nombre del cubo ................................................. 94 Figura 43: Esquema del cubo generado............................................................ 95 Figura 45: Extracción, transformación y carga desde la base de datos SISCEC a la base de datos dmTransformacion .....................................................100 Figura 46: Extracción, transformación y carga desde la base de datos dmTransformacion a la base de datos dmCCC. ......................................101 Figura 47: Pantalla de inicio de sesión del administrador de reportes SEG_CEC ..................................................................................................................103 Figura 48: Reporte de visualización del indicador de satisfacción del cliente.103 Figura 49: Evaluación de rendimiento del Servidor de datamart.....................105 Figura 50: Porcentaje de aceptación en aprendizaje ......................................106 Figura 51: Porcentaje de aceptación en navegabilidad...................................107 Figura 52: Porcentaje de aceptación en interpretación de resultados ............107 Figura 53: Porcentaje de aceptación en lineamiento.......................................107 14 ÍNDICE DE TABLAS Tabla 1: Distribución de Laboratorios y Equipos por Sede................................ 47 Tabla 2: Distribución de servidores por Sede .................................................... 47 Tabla 3: Distribución de Base de datos por Sede ............................................. 48 Tabla 4: Identificación de Problemas................................................................. 50 Tabla 5: Tiempo estimado del proyecto............................................................. 50 Tabla 6: Presupuesto del Proyecto .................................................................... 51 Tabla 7: Característica y funciones a ser cubiertas por el datamart ................. 53 Tabla 8: Escenarios de uso empresarial............................................................ 56 Tabla 9: Requerimientos de consulta................................................................. 63 Tabla 10: Diseño de la dimensión DIM_OBSERVACION ................................. 75 Tabla 11: Diseño de la dimensión DIM_TIEMPO .............................................. 75 Tabla 12: Diseño de la dimensión DIM_ITEM ................................................... 75 Tabla 13: Diseño de la dimensión DIM_INSTRUCTOR .................................... 75 Tabla 14: Diseño físico de la dimensión DIM_EVALUABLE ............................. 76 Tabla 15: Diseño de la dimensión DIM_CURSO ............................................... 76 Tabla 16: Diseño de la dimensión DIM_TIEMPO .............................................. 76 Tabla 17: Diseño de la tabla de hechos FACT_ACADEMICO .......................... 76 Tabla 18: Diseño de la tabla de hechos FACT_EVALUACION......................... 77 Tabla 19: Diseño de la tabla de hechos FACT_ENCUESTA ............................ 78 Tabla 20: Diseño físico de la tabla de hechos FACT_RENDIMIENTO ............. 79 Tabla 21: Niveles de Seguridad ......................................................................... 84 Tabla 22: Coordinaciones no atendidas ..........................................................110 15 RESUMEN El presente trabajo muestra el proceso seguido para el desarrollo de un Datamart cuyo objetivo será facilitar la toma de decisiones del Área de Capacitación y Consultoría del Centro de Educación Continua “CEC” mediante la generación de reportes que permitirán contestar preguntas relacionadas con los principales indicadores de rendimiento. La tesis realizada pone de manifiesto la gran utilidad que tienen las metodologías para la construcción de Data Warehouse propuestas por Gill Harjinder - Rao Prakash y la metodología “SAS Rapid Warehousing Methodology” propuesta por propuesta por el SAS Institute, ya que constatamos que ofrecen mucha flexibilidad y ayuda a realizar este tipo de proyectos de una manera eficiente y eficaz. Para la implementación del datamart se seleccionó las herramientas proveídas por Microsoft, en este caso: SQL Server 2005 como motor de base de datos, Integration Services para la creación de soluciones empresariales de transformación e integración de datos, Analysis Services para la construcción de cubos multidimensionales y Reporting Services para la elaboración de reportes de acceso y uso del usuario final, ya que las mismas se adaptaron fácilmente a las necesidades de la organización, la cual posee las licencias de las mismas. 16 INTRODUCCION El presente documento da a conocer el proceso llevado a cabo para realizar la implementación del datamart para la Coordinación de Capacitación y Consultoría (CCC) del Centro de Educación Continua CEC. Antes de la implementación del datamart, la Coordinación no contaba con una estrategia de extracción, carga y transformación de datos automática, la consolidación de la información se realizaba de manera manual en hojas de cálculo, manteniendo una periodicidad irregular. La realización de los gráficos, reportes e informes gerenciales eran muy difíciles de elaborar debido a la consolidación de dicha información, por lo que fue necesario identificar los problemas encontrados y el impacto que tenía cada uno de estos dentro de la Coordinación. A esto fue necesario definir una metodología que permita el desarrollo rápido de proyectos de data warehouse y datamarts, analizando dos metodologías; la primera de ellas, propuesta por Gill Harjinder y Rao Prakash enfocada en la gestión del proyecto, mientras que la segunda metodología SAS Rapid Warehousing Methodology propuesta por el SAS Institute enfocada al desarrollo de procesos iterativos e incrementales. Para la definición de la metodología propuesta en este trabajo, se tomó las mejores prácticas de cada una de las metodologías, sin perder el enfoque de desarrollo rápido e independiente de la herramienta de implementación, obteniendo como resultado una metodología de desarrollo con seis fases las cuales son: planificación, requerimientos, análisis, diseño, implementación y pruebas. En la fase de planificación de la metodología propuesta, se revisó la situación actual del CEC y de la CCC, el plan y presupuesto del proyecto, se analizó su proceso productivo y se pudieron identificar los principales indicadores de medición de la Coordinación los cuales son: el índice de satisfacción del 17 cliente, el número de cursos dictados, el número de participantes, el número de horas de capacitación y el total de ingresos económicos generados. Posteriormente, se identificó la audiencia de destino, es decir las personas o áreas que se beneficiarán de la implementación de datamart y son los siguientes: el Subcoordinador General, el Subcoordinador de cursos Abiertos, el Subcoordinador de cursos Cerrados y el Subcoordinador de cursos In Company. Se definió como estrategia de implementación del datamart el enfoque bottom up, ya que se requiere satisfacer las necesidades de información de una área en particular, la que en este caso es la Coordinación de Capacitación y Consultoría. El método de desarrollo elegido es el método en Espiral, puesto que pone énfasis en la velocidad de culminación del proyecto. En la fase de requerimientos se tomaron en cuenta cuatro tipos de enfoques: requerimientos del propietario del datamart, en donde se definen los temas de interés para la Coordinación; requerimientos del arquitecto en el cual se diseña los componentes del datamart para satisfacer los requerimientos actuales y posteriores; requerimientos del desarrollador donde se selecciona las plataformas y herramientas según la infraestructura tecnológica de la organización a utilizar y finalmente los requerimientos del usuario final, en el cual se define la funcionalidad que ofrece el datamart, las consultas empresariales de interés, los requerimientos de reporte y consulta. En la fase de análisis se identificaron cuatro procesos de medición identificados de acuerdo al ciclo por el cual pasa un curso o evento de capacitación, los cuales son los siguientes: - Proceso de medición académica - Proceso de medición de evaluación a cursos - Proceso de medición de encuestas realizadas en cursos - Proceso de medición de rendimiento de cursos Para el modelado de datos del datamart se utilizó el esquema de almacenamiento en estrella, dividido en cuatro tablas de hecho, cada una 18 definida para los procesos citados anteriormente. Además, en esta etapa se diseñaron los modelos lógicos correspondientes a cada uno de los procesos de medición. Adicionalmente, se definieron estrategias de carga y refrescamiento que se encargarán de la carga inicial y el mantenimiento del datamart. Finalmente se definió el nivel de seguridad de acceso a los requerimientos definidos. En la fase de diseño del datamart se definieron los modelos físicos y diccionarios de datos correspondientes a cada uno de los procesos de medición. Se estableció el diseño detallado de la arquitectura de la aplicación, en el cual se especifican los siguientes componentes: - Componente ETL: se aloja en el servidor del datamart y es el encargado del proceso de extracción, transformación y carga. - Componente datamart: se aloja en el servidor y se encarga de realizar la exploración y explotación del cubo multidimensional. - Componente de acceso y uso: componente que se encarga del manejo de seguridades y autenticación de usuarios a través de un nombre de usuario y contraseña asignados. - Componente de visualización: componente alojado en el servidor encargado de la creación y visualización de los reportes generados. Para la construcción del datamart se tomaron los modelos de datos definidos durante la fase de diseño, adicionalmente se construyó la estrategia de carga y refrescamiento del datamart como fue definido durante la fase de análisis. Se crearon los reportes de acuerdo a los requerimientos de consulta identificados durante la fase de requerimientos y cada uno de estos clasificados según el proceso de medición. Y finalmente se creó el administrador del sistema, el cual permite el acceso a los reportes generados según el perfil de usuario definido en la fase de análisis y la administración de dichos perfiles. 19 Para verificar la conformidad del datamart construido, se procedió a ejecutar las pruebas con Coordinador de Capacitación y Consultoría, dichas pruebas se dividieron en: pruebas de validación de requerimientos, pruebas de extracción, pruebas de refrescamiento de datos pruebas de seguridad y pruebas de rendimiento de sistema. Finalmente se ejecutó el plan de capacitación a los usuarios del sistema, con el objetivo de evaluar el grado de aceptación del datamart dentro de la organización, para tal efecto se consideraron aspectos como la facilidad de aprendizaje, la navegabilidad del sistema, la facilidad de interpretación de los resultados obtenidos en las consultas realizadas y la eficacia con la cual es proporcionada la información estratégica a los usuarios. 20 CAPITULO 1 SELECCIÓN DE LA METODOLOGÍA DE DESARROLLO 1.1 JUSTIFICACIÓN DE LA METODOLOGÍA DE DESARROLLO Para la selección de la metodología de desarrollo del datamart se ha tomado en cuenta la propuesta por Gill Harjinder - Rao Prakash y la propuesta por SAS Institute “SAS Rapid Warehousing Methodology" ya que éstas metodologías son aplicables para el desarrollo de proyectos de data warehouse y datamart. 1.1.1 METODOLOGÍA PROPUESTA POR GILL HARJINDER Y RAO PRAKASH Gill Harjinder y Rao Prakash consideran siete fases en su ciclo de desarrollo para data warehouse [8], las cuales son: - Planificación - Requerimientos - Análisis - Diseño - Construcción - Despliegue - Expansión 1.1.1.1 Planificación La fase de planificación incluye los siguientes pasos: 1. Selección de la estrategia de implementación: La estrategia depende de la manera en la que se realizan las tareas dentro de la organización. Se debe elegir uno de estos tres enfoques: top down1, bottom up2 y paralelo3[20]. [8] HARJINDER S. GILL, PRAKASH C. Rao. Datawarehousing. La Integración de la Información para la mejor toma de decisiones 21 - Selección de la metodología de desarrollo: se toma en cuenta de que todos los requerimientos no se pueden identificar completamente y con toda claridad al inicio del proyecto y debido al énfasis en la velocidad de desarrollo, el método de desarrollo en espiral4 resulta el más recomendable para la implementación de un data warehouse. 2. Selección del ámbito de implementación: Para la gran parte de las organizaciones, el motivo principal para la implementación de un data warehouse es satisfacer las necesidades más urgentes de un grupo bien determinado de usuarios, por ello hay que definir un conjunto general de objetivos para el data warehouse, con el fin de obtener un ámbito restringido para la primera implementación. El ámbito inicial del proyecto puede determinarse a través de dimensiones que se dividen en dos categorías: - A partir de la perspectiva del usuario empresarial del data warehouse. - En base a consideraciones tecnológicas. 3. Selección del enfoque arquitectónico: Se pueden elegir entre las siguientes opciones arquitectónicas: - Almacenamiento operacional: en donde las consultas del data warehouse accederán a los datos de las bases de datos operacionales a través del modelo del data warehouse. - Un data warehouse: en este caso sólo un data warehouse lógico alimenta a todos los usuarios finales. 1 Top Down: parte de la visión de construir datamarts en base a la estructura del data warehouse, el mismo satisface un conjunto de requerimientos empresariales bien definidos. 2 Bottom up: los datamarts se construyen primero en base a datos aislados necesarios para satisfacer las funciones o requerimientos de un departamento por medio de los procesos de extracción, transformación y transportación. 3 Paralelo: toma propiedades de los enfoques top down y bottom up, ya que su proceso de diseño permite construir paralelamente los datamarts y data warehouse, tomando en cuenta que el modelo de datos del data warehouse es utilizado por los datamarts en se construcción. [20] Generalidades y patrones de desarrollo de datamarts. 4 Método de desarrollo en espiral: en este modelo los productos son creados a través de múltiples repeticiones dentro del ciclo de vida del proyecto. A cada repetición se le denomina mini-proyectos. 22 - Un almacén de datos (Datamart): es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. - Un data warehouse y un datamart: esta arquitectura se utiliza cuando se reconoce la necesidad de implementar un datamart departamental conjuntamente con un data warehouse corporativo. - Separación de plataforma e infraestructura: se refiere a separación en distintas plataformas los bloques de fuentes de datos, data warehouse, datamart y las herramientas de usuario final. - Arquitectura cliente/servidor de dos capas: en donde una capa arquitectónica contiene a los clientes y otra capa contiene al servidor. Con lo cual las herramientas de usuario final se ejecutan en el o los clientes y las fuentes de datos, el data warehouse y el almacén de datos residen en los servidores. [21] - Arquitectura cliente servidor de tres capas: en esta arquitectura, la capa cliente consiste en una estación de trabajo, la capa intermedia consiste en un servidor y la tercera capa se encuentra establecida en una microcomputadora, la misma que se encarga de las fuentes de datos y las transformaciones. 4. Desarrollo del plan del proyecto: Esta fase considera cuatro puntos: - Plan: al realizar el plan del proyecto se deben identificar los departamentos que utilizarán el data warehouse y determinar las medidas para estimar la retribución del mismo. - Presupuesto: uno de los puntos más importantes a tener en cuenta en el momento de decidir implementar un data warehouse es el costo que conlleva. [21] Principalmente los costos asociados a un proyecto data Fundamentos de Data warehouse. warehouse son el Costo de Construcción5 y el costo de Mantenimiento 23 y Operación6 una vez construido. 5. Desarrollo de escenarios de uso empresarial: Consiste en incluir al usuario final en el establecimiento de expectativas de lo que debe hacer el data warehouse. Un escenario de uso empresarial consta de lo siguiente: - Un usuario empresarial claramente identificado y definido, como por ejemplo: un gerente de ventas. - Un área funcional que respalde al data warehouse o al datamart. - Una o varias consultas de interés para el área funcional que actualmente no sean resueltas por los sistemas operacionales existentes. 6. Recopilación de metadatos: Consiste en la definición de los datos que se deben recolectar y almacenar, es el primer paso para garantizar la integración y transformación de los datos operacionales y de otras fuentes en la información analítica. Los metadatos son la guía de todo lo que se encuentra dentro del data warehouse y de cómo llegó ahí. Los metadatos correlacionan la información de la fuente al objetivo. [22] 1.1.1.2 Requerimientos La fase de requerimientos es una especificación precisa de las funciones que se obtendrán del data warehouse y del ambiente operativo en el que se desenvolverá. Se identifican cuatro tipos de requerimientos: 1. Requerimientos del propietario: El propietario es el inversionista, patrocinador o dueño del data warehouse, su interés se limita al análisis de inversiones y pagos, por ello debe tomar en cuenta lo siguiente: o Áreas tema. 7 o Granularidad. 8 5 Costo de Construcción: Es similar al costo de construcción de cualquier sistema de tecnología y considera el tiempo, recursos humanos y tecnología. 6 Costo de Mantenimiento y Operación: una vez que se ha finalizado la construcción y se ha entregado el producto es necesario dar soporte, que a su vez es una fuente continua de costos. Entre los costos de operación se consideran: el costo de evolución, costo de crecimiento y costo producido por cambios. [22] Guía de productos para crear una solución Data warehouse completa. 7 Areas Tema: consiste en temas de interés para diversas funciones empresariales. o Dimensiones. 9 24 2. Requerimientos del arquitecto: El arquitecto es el responsable de diseñar los componentes de la arquitectura del data warehouse de manera que satisfaga las necesidades a corto y a largo plazo dentro de la organización. El diseño de los componentes se determina en base a la compilación de un grupo de requerimientos que coincidan con la visión del propietario. 3. Requerimientos del desarrollador: Los requerimientos del desarrollador están muy cercanos a la arquitectura de implementación. El desarrollador necesita que la arquitectura del data warehouse se subdividan en interfaces de usuario, bases de datos, comunicaciones y aplicaciones bien establecidas. Por lo tanto los requerimientos del desarrollador son mucho más específicos que los del arquitecto. 4. Requerimientos de los usuarios finales: El usuario final accede al data warehouse a través de aplicaciones de alto nivel y a través de herramientas de consulta y reporte, lo demás queda oculto. Los requerimientos del usuario final pueden distribuirse en una o varias de las siguientes categorías: o Flujo de Trabajo. o Requerimientos de consulta. o Requerimientos de reporte. o Tipos de actividades. o Visualización de datos. 1.1.1.3 Análisis Esta fase consiste en transformar el conjunto de requerimientos obtenidos en la fase de requerimientos en especificaciones que brinden soporte al diseño del data warehouse. Harjinder y Prakash identifican 3 tipos de especificaciones: 8 9 Granularidad: hace referencia al nivel de detalle de la información requerida por los usuarios finales. Dimensiones: agrupa los datos de acuerdo al rango de valores de la consulta realizada. 25 1. Requerimientos de enfoque empresarial: Delinean las fronteras de información que debe comprender el data warehouse. 2. Especificaciones de requerimientos de fuentes de datos: Delinean las fronteras de información disponible en las fuentes de datos. 3. Especificaciones de requerimientos de usuario final y acceso: Definen como se utilizará la información del data warehouse. Básicamente el proceso de análisis se enfoca en la obtención de modelos físicos y lógicos de datos para el data warehouse y el datamart. También se encarga de especificar los procesos de conexión a las fuentes de datos, al data warehouse, al datamart y las herramientas de usuario final. 1.1.1.4 Diseño En esta fase los modelos lógicos se convierten en modelos físicos, los procesos establecidos en la etapa de análisis se convierten en diseños para programas que realizarán las tareas requeridas por los procesos[8]. Esta fase presenta dos actividades de diseño principales: 1. Diseño detallado de la arquitectura de datos: Esta actividad consiste en establecer los modelos físicos de datos de las bases de datos de almacenamiento con las que contará el data warehouse, teniendo en cuenta que dicho modelo debe coincidir con los modelos físicos de las fuentes de datos. 2. Diseño detallado de la arquitectura de aplicación: Comprende de varios grupos de procesos tales como: o Procesos internos a las fuentes de datos. o Procesos internos al data warehouse. o Procesos que conectan al data warehouse con el datamart. o Procesos internos al datamart. [8] HARJINDER S. GILL, PRAKASH C. Rao. Datawarehousing. La Integración de la Información para la mejor toma de decisiones 26 o Procesos que conectan al data warehouse con las herramientas de usuario final. o Procesos de administración del data warehouse como sistema. 1.1.1.5 Construcción Es responsable de implementar físicamente los diseños desarrollados en la fase previa. La construcción del data warehouse es muy similar a la de construcción de un sistema de bases de datos relacional a gran escala. Entre las aplicaciones más comunes que requieren construir son las siguientes: - Programas que creen y modifiquen las bases de datos para el data warehouse. - Programas que extraigan datos de fuentes tanto relacionales como no relacionales. - Programas que realicen transformación de datos. - Programas que actualicen bases de datos relacionales. - Programas que realicen búsquedas en base de datos muy grandes. La fase de construcción debe enfrentarse a varios retos como la administración de metadatos y la capacidad de integración de sistemas. 1.1.1.6 Despliegue Realiza actividades de implementación del data warehouse en el ambiente operativo, lo cual incluye procesos de instalación, configuración y uso del data warehouse. Es de mucha importancia si la organización tiene experiencia previa en el despliegue de sistemas de información empresarial. A más de los requerimientos normales de despliegue, el sistema data warehouse tiene los siguientes requerimientos adicionales: - Ya que la mayoría de los usuarios del data warehouse no son personal técnico, es necesario disponer de definiciones de información contenida en el data warehouse en un lenguaje comprensivo. - Existe la necesidad de promover la información entregada por el data warehouse entre los usuarios finales. 27 El data warehouse requiere de capacidades adicionales como las siguientes: - Comercialización de la información. - Directorio / Catálogo de la información. - Browsers de información. 1.1.1.7 Expansión El método en espiral es importante para obtener una implementación rápida del data warehouse mediante el incremento de características y funciones basadas en experiencias previas de despliegue[8]. Luego de un tiempo de uso del data warehouse se pueden identificar oportunidades de mejora en áreas como: - Consultas empresariales limitadas por el modelo de datos del data warehouse. - Consultas empresariales que deben considerar fuentes externas de datos que no fueron tomados en el ámbito inicial de implementación. - Rendimiento no satisfactorio de uno o varios componentes del data warehouse. - Incrementar el modelo de datos del data warehouse para ampliar el ámbito inicial de implementación. 1.1.2 METODOLOGÍA PROPUESTA POR SAS INSTITUTE El SAS Rapid Warehousing Methodology propuesta por el SAS Institute, es un conjunto de mejores prácticas, cuyo objetivo es el desarrollo rápido de proyectos de data warehouse, el cual está basado en procesos iterativos e incrementales, que divide un proyecto potencialmente grande en varios más pequeños, llamados entregables. Cada entregable incluye documentación técnica, administración del proyecto y procesos de aseguramiento de calidad, dentro de cada una de sus etapas. [10] [8] HARJINDER S. GILL, PRAKASH C. Rao. Datawarehousing. La Integración de la Información para la mejor toma de decisiones [10] Data Warehousing Implementation with the SAS System 28 Además define responsabilidades, recursos asignados y metas claras para cada fase del proyecto. Ofrece las siguientes ventajas: - Despliegue rápido de los entregables a los usuarios del negocio. - Retorno rápido de la inversión. - Reducción de riesgos. - Procesos iterativos. En la figura 1 se puede observar las fases del ciclo de desarrollo de data warehouse como un procesos iterativo basado en la metodología del SAS INSTITUTE. Figura 1: Proceso Iterativo del SAS Rapid Warehousing Methodology [11] 1.1.2.1 Evaluación Esta fase consiste en evaluar si la organización está lista para crear un proyecto de data warehouse. Está compuesto por dos etapas: 1. Definición del proyecto: define las áreas de la organización que podrían beneficiarse del data warehouse. En esta etapa los miembros principales trabajan junto con los miembros del área organizativa, para definir las metas [11] SAS Rapid Warehousing Methodology”; SAS e-Intelligence; Paper sas43093_0501 29 del data warehouse, proveer los criterios de evaluación, y los recursos del área organizativa necesitados para el proyecto. En esta etapa se toma en cuenta los siguientes factores críticos: - Elegir el patrocinador del proyecto. - Elegir un equipo de alto nivel tanto por parte del negocio, como de la unidad de TI10 que llevará a cabo el proyecto. - Definir los recursos comprometidos al proyecto. - Determinar el propietario del proyecto. - Determinar los criterios de evaluación del proyecto. - Asegurar la unidad entre los miembros del equipo - Determinar el primer módulo del proyecto a implementar. 2. Evaluación de la infraestructura IT: en esta etapa se valida la capacidad de la infraestructura tecnológica de la organización para alojar las demandas y requerimientos del data warehouse. El entregable en esta fase es un documento formal en donde se define la factibilidad del proyecto, y los responsables de la toma de la decisión, para que el proyecto se lleve a cabo o no. 1.1.2.2 Requerimientos Esta fase se lleva a cabo cuando se ha tomado la decisión de construir el data warehouse, y encamina las necesidades de alto nivel al medio ambiente del data warehouse. Los requerimientos del negocio y técnicos (incluyendo la infraestructura) son reunidos durante esta fase. Entrevistas, talleres y análisis de sistemas y documentos existentes pueden ser usados confirmar los hechos necesarios para reunir y [12] . Esto se logra a través de dos etapas: 1. Reunión de requerimientos: donde se toma las necesidades de información de las unidades organizativas a través de varios métodos de recolección de requerimientos, tales como entrevistas, encuestas, etc., a los miembros de 10 TI: Tecnologías de la Información [12] The SAS Methodology for Solutions Development”; SAS Institute Inc; Paper wp_3562 30 dicha unidad. Se examina los componentes del medio ambiente tecnológico que sirve actualmente a las unidades organizativas a través de entrevistas con los miembros del departamento de IT. 2. Análisis: se realiza un análisis entre los requerimientos de los usuarios de la organización y la capacidad de la infraestructura de IT. El entregable en esta fase es un documento de definición de requerimientos, el cual contiene: modelo físico y lógico de datos, diagrama de la infraestructura de la extracción OLTP a través del uso de data warehouse, estrategia de refrescamiento, plan del proyecto calendarizado. 1.1.2.3 Diseño Esta fase toma como entrada el documento de definición de requerimientos, se enfoca en la construcción del proyecto a tiempo. En esta fase se incluye: - Diseño lógico y físico para el modelo de datos del data warehouse. - Especificación detallada del modelo del proceso para extracción, transformación y carga. - Creación del modelo de la aplicación o herramientas de explotación. - Diseño de aspectos adicionales tales como: modelos de los metadatos y la seguridad. El entregable en esta fase es un documento de diseño detallado el cual contiene: la descripción detallada de las fuentes de datos, descripción de los modelos de datos del data warehouse, detalle del proceso de extracción, transformación y carga. 1.1.2.4 Construcción Durante esta fase se construye el modelo físico de datos en base al modelo lógico diseñado. Esto se lleva a cabo dentro de tres etapas: 31 1. Administración: donde los datos transaccionales son extraídos y transformados en los datos que se cargarán al data warehouse. El proceso de transformación está compuesto por algunos subprocesos: validación, depuración e integración: - Validación: se identifican datos inválidos, perdidos, fuera de rango, y duplicados. - Depuración: corrige los problemas de los datos identificados en el proceso de validación mediante una remodificación. - Integración: extrae de las variables de datos, significados consistentes, valores y medidas. 2. Organización: en esta etapa los datos son cargados al data warehouse, las estructuras de datos son indexadas, y las vistas a ellos son creados, los metadatos son capturados y creados. 3. Explotación: en esta etapa se encarga de construir los mecanismos de acceso al data warehouse (GUIs11) para el análisis, reportes y gráficas. El entregable en esta fase es un cubo dimensional y los mecanismos de acceso a él disponible para su uso por parte de los usuarios finales y la unidad IT. 1.1.2.5 Pruebas Finales Durante esta fase un equipo de aseguramiento de calidad, prueba el sistema antes de ser entregado al cliente verificando que el sistema incluya todos los requerimientos funcionales basados en casos de prueba. 1.1.2.6 Despliegue Tiene que ver con la instalación, puesta en marcha, entrenamiento de los usuarios, uso del data warehouse.[12] Algunas de las actividades de esta etapa son: 11 GUI: Grafic User Interface (Interfaz gráfica de usuario) [12] The SAS Methodology for Solutions Development”; SAS Institute Inc; Paper wp_3562 32 - Instalación inicial incluyendo las conexiones del data warehouse con las fuentes de datos, actualización y sincronización de los datos. - Entrenamiento a los usuarios. - Planificación e implementación de la actualización y mantenimiento del data warehouse cuando sea necesario. 1.1.2.7 Revisión Durante esa fase se realiza una evaluación del data warehouse planteando preguntas que permitan mejorar o potenciar la utilización que se haga del nuevo sistema. En esta fase son conducidas tres ejecuciones con cada construcción: - Seguir la fase de construcción para evaluar el proceso de implementación y aprendizaje de satisfacciones y contratiempos. - Otra vez, de 3 a 6 semanas después del revisar la fase de despliegue y asegurar que la transición a soportar ha ido sin problemas y que los usuarios tienen acceso al data warehouse. - Una vez más, de 18 a 24 meses después de la construcción inicial, medir algún beneficio tangible, calcular el ROI12 y asegurar que el medio ambiente del data warehouse está continuando para conocer los requerimientos de la comunidad organizativa. 12 ROI: por sus siglas in inglés significa el Retorno de la Inversión, es el beneficio que obtenemos por el dinero invertido en tecnología durante un periodo de tiempo y suele utilizarse para analizar la viabilidad de un proyecto y medir su éxito. 33 1.1.3 SELECCIÓN DE LA METODOLOGÍA DE IMPLEMENTACIÓN Objetivo: el objetivo principal de la metodología a proponer es mantener el desarrollo rápido de proyectos de data warehouse o datamarts basados en procesos iterativos, cada uno de estos alineados a los objetivos organizacionales, tomando mejores prácticas y recomendaciones de las metodologías descritas. 1.1.3.1 Planificación En esta etapa se pretende determinar el objetivo principal que tendrá el data warehouse o datamart y la perspectiva que tiene la organización para implementarlo. Para la formulación de esta etapa se ha considerado definir las actividades principales de la organización y su situación actual, su infraestructura tecnológica, el desarrollo del cronograma y presupuesto necesarios para su implementación como lo propone Harjinder y Prakash en la fase de Planificación de su metodología. Adicionalmente es conveniente identificar los principales problemas percibidos que pueden dar su razón de ser al proyecto. De la fase de planificación propuesta por Harjinder y Prakash se han elegido aquellos puntos que enfocan el ámbito de aplicación del proyecto durante todo su ciclo de vida, dichos puntos son los siguientes: - Desarrollo del cronograma y presupuesto del proyecto. - Definición de los objetivos de uso empresarial. - Selección de la estrategia de implementación, el método de desarrollo, el ámbito de implementación, el enfoque arquitectónico e identificación de riesgos y problemas. 34 De la fase evaluación propuesta por el SAS INSTITUTE en su metodología se ha seleccionado el siguiente criterio: - Recopilación de metadatos: mediante este criterio se definirá un primer enfoque del diseño lógico para el datamart. Además se establece como entregable en esta primera fase un documento formal en donde se define la factibilidad del proyecto y la planeación. Finalmente se establece como entregable un documento formal que incluye, situación actual de la organización, problemas percibidos, cronograma y presupuesto del proyecto. En la figura 2, se puede observar la definición de la fase de Planificación. Figura 2: Definición de la Fase de Planificación 1.1.3.2 Requerimientos Para la fase de requerimientos se ha tomado los ítems establecidos por Harjinder y Prakash en la fase de requerimientos, en la cual se toman en cuenta los requerimientos desde los puntos de vista: del propietario, arquitecto, desarrollador, y el usuario final. Finalmente se establece como entregable un documento formal de definición de requerimientos, el cual contiene el alcance del proyecto. En la figura 3, podemos observar la definición de la fase de Requerimientos: 35 Figura 3: Definición de la Fase de Requerimientos 1.1.3.3 Análisis Esta etapa consiste en convertir el conjunto de requerimientos obtenidos en la fase anterior en descripciones para generar medidas, dimensiones y hechos que brinden soporte al modelo lógico del datamart, así como también definir la estrategia de carga y refrescamiento de datos desde las fuentes de datos hacia el data warehouse o datamart propuesta por el SAS INSTITUTE. [12] Adicionalmente, es necesario definir los niveles de seguridad que se debe tener sobre los diferentes componentes y niveles de la solución, debido a lo sensible que puede ser para la organización la información que suelen manejar este tipo de aplicaciones. [5] El entregable de la fase de análisis contiene, la definición de dimensiones, tablas de hecho, modelos lógicos y la descripción del proceso de carga y refrescamiento del data warehouse o datamart. En la figura 4 se puede observar la definición de la fase de Análisis. Figura 4: Definición de la Fase de Análisis [12] [5] The SAS Methodology for Solutions Development”; SAS Institute Inc; Paper wp_3562 KIMBALL Ralph; ROSS, Margy; “The Datawarehouse Toolkit, Segunda Edición 36 1.1.3.4 Diseño En esta etapa se debe detallar la definir la arquitectura de los datos y la arquitectura de la aplicación [4] , según lo definido durante la fase de Análisis. Finalmente se establece como entregable un documento de análisis y diseño el cual contiene la descripción detallada de: las fuentes de datos, los modelos de datos del datamart, la arquitectura de la aplicación, y la estrategia del proceso de carga y refrescamiento. En la figura 5, se puede observar la definición de la fase de Diseño. Figura 5: Definición de la Fase de Análisis y Diseño 1.1.3.5 Implementación En esta fase se realiza la implementación física los diseños detallados en la fase anterior. De la fase de construcción propuesta por el SAS INSTITUTE en su metodología se seleccionaron los siguientes puntos: - Administración: donde los datos transacciones son cargados desde las fuentes de datos hacia el data warehouse o datamart a través de procesos de validación, depuración e integración de datos en base a la estrategia de carga de datos. [11] - Organización: en donde se implementa la carga inicial del datamart y se implementa la estrategia de refrescamiento de los datos validados. - Explotación: donde se realiza la implementación de GUIs de acceso al data warehouse o datamart. [4] JARKE Matthias, LENZERINI Maurizio, VASSILIOU Yannis, VASSILIADIS Panos. Fundamentals of Data warehouses. [11] SAS Rapid Warehousing Methodology”; SAS e-Intelligence; Paper sas43093_0501 37 Finalmente se establece como entregable en esta fase, la implementación del datamart disponible para su uso por parte de los usuarios finales y la unidad IT, como un primer encuentro entre el usuario y el datamart. En la figura 6, se puede observar la definición de la fase de Implementación. Figura 6: Definición de la Fase de Implementación 1.1.3.6 Pruebas La fase de Pruebas es la encargada de cerrar el ciclo iterativo de la metodología propuesta, con el fin de evaluar la solución planteada a lo largo de la metodología y mejorar la utilización del data warehouse o datamart. Está fase se la ha dividido en tres etapas, las cuales son: 1. Pruebas Funcionales del sistema [22] En esta etapa se realizan las pruebas necesarias que aseguran el grado de calidad en la implementación del data warehouse o el datamart. Se pueden considerar las siguientes pruebas funcionales: - Pruebas de validación de requerimientos. - Pruebas de transformación, proceso y carga. - Pruebas de refrescamiento de datos. - Pruebas de seguridad - Pruebas de rendimiento del sistema. 2. Despliegue En esta fase se llevan a cabo los procesos para la puesta en marcha y el uso del datamart en el ambiente operacional. De la fase de despliegue [22] Guía de Productos para Crear una Solución Data warehouse Completa 38 propuesta por el SAS INSTITUTE en su metodología, se ha seleccionado los siguientes puntos: o Instalación inicial. o Capacitación a los usuarios. o Plan de mantenimiento del data warehouse o datamart. 3. Revisión y Expansión El objetivo en esta fase es la de potenciar el uso del datamart dentro de la organización. De la fase de expansión de la metodología propuesta por Harjinder y Prakash se toman en cuenta los siguientes aspectos: - Consultas empresariales limitadas por el modelo de datos del data warehouse. - Consultas empresariales que deben considerar fuentes externas de datos que no fueron tomados en el ámbito inicial de implementación. Además se debe tener en cuenta los procesos de potenciación y mejoramiento que se haga al nuevo sistema. El entregable en esta fase es un documento que contendrá tres secciones: las pruebas realizadas, resultados sobre la capacitación realizada y plan de mantenimiento y posibles mejoras a realizar sobre el producto final. En la figura 7 se puede observar la definición de la fase de Pruebas. 39 Figura 7: Definición de la Fase de Implementación 1.2 SELECCIÓN DE HERRAMIENTAS DE IMPLEMENTACIÓN La selección de las herramientas para la construcción de un data warehouse es un proceso que debe realizarse tomando en cuenta la infraestructura tecnológica de la organización y las necesidades de información requeridas por parte de los usuarios. 1.2.1 HERRAMIENTAS BUSINESS INTELLIGENCE La solución a desarrollarse se fundamenta en los requerimientos establecidos por el arquitecto del sistema, por ello se ha definido las siguientes herramientas: 1.2.1.1 Microsoft SQL Server Business Intelligence MSSBI Es una plataforma completa de Business Intelligence desarrollada por Microsoft[18] que proporciona las características, herramientas, funcionalidades y componentes de servidor para crear: - Grandes y complejos data warehouse que resulten fáciles de consultar y económicos de mantener. [18] An introduction to SQL Server data warehousing concepts. 40 - Pequeña presentación de informes y sistemas de análisis que las empresas más pequeñas, o los departamentos de las empresas de mayor tamaño, pueden fácilmente construir y gestionar. - Circuito cerrado de análisis y de minería de datos de sistemas. - Sistemas integrados que ampliar el alcance de la inteligencia de negocios. Los componentes que presenta este sistema de Business Intelligence reúne algunos elementos de Microsoft SQL Server 2000 y SQL Server 2005 y estos son: - Diseño: Microsoft Business Intelligence Development Studio, es el primer entorno de desarrollo integrado diseñado para el desarrollador de sistemas business intelligence. Construido sobre Visual Studio ® 2005, el entorno ofrece una plataforma de desarrollo profesional, variada e integrada. [24] - Integración: Microsoft Integration Services ha sido rescrita para llevar a cabo la integración de datos complejos, transformación, y la síntesis a gran velocidad en caso de grandes volúmenes de datos. Integration Services, Analysis Services, y Reporting Services trabajan juntos para presentar una vista perfecta de los datos pertenecientes a fuentes heterogéneas. [15] - Almacenamiento: Microsoft SQL Server 2005 diluye las líneas entre las bases de datos relacionales y multidimensionales. Se puede almacenar datos en la base de datos relacional, en la base de datos multidimensional, o utilizar la nueva característica Proactive Cache para obtener lo mejor de ambos mundos. [14] - Análisis: La minería de datos en SQL Server siempre ha sido fácil de usar. Ahora es aún mejor con la incorporación de nuevos algoritmos importantes, incluidas las Reglas de la asociación, de series de tiempo, árboles de regresión, de secuencia de conglomerados, Neural Nets, y Naïve Bayes. [16] [24] [15] [16] Business Intelligence and Data Warehousing in SQL Server 2005 MICROSOFT: SQL Server Integration Services MICROSOFT: SQL Server Analysis Services 41 - Reporte: Microsoft Reporting Services extiende la plataforma Microsoft Business Intelligence para llegar al usuario de negocios que necesita consumir el análisis. Reporting Services es un ambiente empresarial para la administración de reportes, integrado y gestionado a través de servicios Web. [23][17] - Administración: Microsoft SQL Server Management Studio integra la administración de todos los componentes Microsoft SQL Server 2005. A través de Management Studio, los componentes de la plataforma Business Intelligence ganan mayor escalabilidad, confiabilidad, disponibilidad y facilidad de programación. [14] [23] [17] [14] Características de Reporting Services MICROSOFT: SQL Server Reporting Services MICROSOFT: Documentación de SQL Server 2005 42 CAPITULO 2 IMPLEMENTACION DEL DATAMART 2.1 PLANIFICACION 2.1.1 Objetivo del Datamart El objetivo principal del datamart es, “Facilitar la toma de decisiones a la Coordinación de Capacitación y Consultoría del Centro de Estudios a la Comunidad CEC, mediante el uso de herramientas que faciliten el análisis de información generado por los indicadores definidos, cuya actualización esté basada en una estrategia de refrescamiento de información según periodos representativos”. 2.1.2 Situación actual de la Coordinación de Capacitación y Consultoría (CCC) 2.1.2.1 Generalidades: La Coordinación de Capacitación y Consultoría (CCC), conjuntamente con la Coordinación de Lingüística del CEC son los encargados de ser el nexo directo con el medio externo, tales como personas naturales y empresas que requieran servicios de capacitación continua en las áreas: Tecnológicas, Administrativas e Idiomas. Estas áreas son apoyadas operativamente por las coordinaciones de Calidad y Talento Humano, Financiero - Administrativo, Desarrollo Tecnológico y coordinadas a través de la Dirección de la institución, tal como se puede observar en el mapa de procesos del CEC de la figura 8. 43 Figura 8: Mapa de Procesos del CEC[1] 2.1.2.2 Detalle del Proceso Productivo de la CCC El objetivo principal de la CCC es alcanzar al menos el 88% de satisfacción del cliente en los eventos de capacitación y al menos el 90% del plan operativo. En la figura 9, se puede observar el proceso productivo de la CCC. Objetivo: Alcanzar al menos el 88% de satisfacción del cliente en los eventos de capacitación Proveedores 1 Sociedad Entradas 1.Clientes y sus requerimientos 2 Clientes individuales 2. Resultados de las encuestas y corporativos 3. Reglamento CEC 3 EPN ETAPAS DEL PROCESO 1. Planificación 2. Ejecución 4 Dirección CEC 5 Sistemas y medios de información 6 Instructores 4. Plan Estratégico y Objetivos de Calidad 5. Nuevas tendencias Salidas 1 Clientes capacitados Clientes 1. Clientes individuales y corporativos 2 Evaluaciones académicas 2. Clientes individuales y corporativos y certificados 3 Evaluaciones del evento 3. Sub coordinación, apoyo técnico, Instructor. 4. Clientes corporativos 4 Informe final 3. Evaluación 6. Sugerencias de cursos (DCC-RP-02) Responsable del proceso: Parámetros/Medición/seguimiento Documentos 1. Número de cursos Procedimiento DCC-PP-01 2. Ingresos Económicos Instructivos de trabajo Involucrados: 3. Número de participantes Registros Subcoordinadores y asistentes 4. Número de horas de capacitación Coordinador 5. Ïndice de satisfacción de clientes Recursos Procesos/Actividades de soporte Requisitos a cumplir Humanos: Coordinadora, 2 Sub coordinadora Proceso Administrativo Financiero Reglamentos internos 3 Asistentes, Diseñador gráfico Gestión de la Calidad y Talento Humano Contratos/Convenios Tecnicos : Laboratorios informáticos Dirección CEC ISO 9001:2000 en red y con salida a internet, Unidad Técnica cañones de proyección, proyectores de transparencias, pizarras, manuales Figura 9: Proceso Productivo de la CCC[1] [1] [1] Centro de Educación Continua - CEC. Procedimiento Proceso Productivo “Capacitación y Consultoría” Centro de Educación Continua - CEC. Procedimiento Proceso Productivo “Capacitación y Consultoría” 44 En resumen, los proveedores del proceso está compuesta por: - La sociedad, a través de los clientes y sus demandas; - Los clientes, y el resultado de las encuestas generadas en cada evento de capacitación generado. - EPN, a través del reglamento interno del CEC-EPN. - Medios de difusión y publicaciones. - Instructores capacitados que están alineados a los objetivos de la institución. El proceso está siendo medido través de los siguientes parámetros, que son generados en las diversas etapas por las que pasa el proceso: - Número de cursos - Ingresos Económicos generados - Numero de Participantes - Número de horas de capacitación - Índice de Satisfacción de clientes Como resultado del proceso se tiene Clientes Capacitados y las diferentes evaluaciones generadas en base a los estándares de calidad definidos por la certificación con la que actualmente cuenta el CEC. 2.1.2.3 Modelo orgánico funcional de la CCC En la figura 10, podemos observar el Organigrama de la CCC. 45 Coordinador Subcoordinador General Ejecutivo de Cuenta Subcoordinador Cursos Abiertos Subcoordinador Cursos Virtuales Asistente Académico 1 Asistente Académico 2 Subcoordinador Cursos Cerrados Asistente Académico Figura 10: Organigrama Funcional de la Coordinación de Capacitación y Consultoría - Funciones del Coordinador: se encarga de planificar las programaciones anuales y trimestrales de capacitación de cursos abiertos, preparar propuestas de capacitación de cursos cerrados, aprobar el contenido de los cursos y programas ofertados, dirigir la ejecución de los eventos de capacitación y consultoría y evaluar los cursos, programas y demás servicios ofertados por la Coordinación. - Funciones del Subcoordinador General: se encarga de proporcionar información de los eventos de capacitación a los clientes, a demás se encarga de revisar y verificar los requerimientos previos al inicio de los cursos en general. - Funciones del Subcoordinador de Cursos Abiertos, Cerrados y Virtuales: se encarga de seleccionar los instructores para los eventos de capacitación, coordinar clases demostrativas con instructores nuevos y administrar sugerencias y pedidos de los clientes. - Funciones del Asistente Académico: se encarga de la apertura y cierre de cursos, atención telefónica y personal a los clientes, apoyo y seguimiento a los instructores de Capacitación y Consultoría, inscripción de participantes, proporcionar información de las alternativas de financiamiento y proporcionar información de los cursos a través de medios tales como: mail, dípticos, cartilla, entre otras. 46 - Funciones del Ejecutivo de Cuenta: se encarga de comercializar los productos/servicios que oferta el CEC-EPN en el área de capacitación y consultoría, recolectar información referente al mercado, competencia, precios y otros indicadores para el mejoramiento de su gestión, establecer contacto con los clientes con el fin de detectar sus necesidades para levantar requerimientos para la elaboración de propuestas, realizar actividades de cobranza de las ventas realizadas y elaborar el informe semanal de actividades, incrementar el número de clientes con la apertura de mercado. 2.1.2.4 Productos de la CCC La CCC actualmente cuenta con 4 tipos de productos: - Cursos Abiertos: son todos aquellos eventos de capacitación13 que se realiza bajo especificaciones establecidas por el CEC-EPN y bajo demanda del mercado. Los eventos son ofrecidos al público en general y son realizados en las instalaciones definidas por el CEC-EPN. - Cursos Cerrados: son aquellos eventos de capacitación que el CEC-EPN realiza bajo demanda del cliente, en cuyo caso los contenidos, horarios y demás especificaciones se establecen con el mismo. Los cursos cerrados se los puede realizar en las instalaciones del CEC-EPN ó en lugares establecidos por el cliente. En el caso en el que el evento de capacitación se realice en las instalaciones del cliente empresarial, el curso cerrado se denomina Curso In Company. - Cursos Virtuales: comprenden aquellos eventos de capacitación que son ofrecidos al público en general en la modalidad virtual de acceso a través del Internet. - Consultoría: el CEC-EPN ofrece servicios de asesoría y consultoría a organizaciones de distinta índole en las áreas de desarrollo de software y aplicaciones, gestión de sistemas de calidad, gestión estratégica y organizacional, gestión de proyectos, entre otros. 13 Evento de capacitación: un evento está compuesto por cursos o seminarios en las áreas de: Informática aplicada y ciencias de la computación, Tecnologías de la información y comunicaciones, Diseño y evaluación de proyectos, Gestión empresarial, entre otros. 47 2.1.2.5 Infraestructura Tecnológica En cuanto a la infraestructura tecnológica usada actualmente por el CEC, según lo descrito por la Coordinación de Desarrollo Tecnológico, se cuenta con lo siguiente: - Hardware: o Existen 47 equipos distribuidos entre el personal administrativo de las diferentes unidades. Se cuentan con 108 equipos distribuidos en siete laboratorios tal como lo ilustra la tabla 1: Ubicación Laboratorio Nro. de Equipos Laboratorio 1 21 Laboratorio 2 21 Laboratorio 3 17 Sede EPN Laboratorio 4 12 Laboratorio 5 17 Laboratorio 6 10 Laboratorio Sede Araucaria 10 TOEFL Tabla 1: Distribución de Laboratorios y Equipos por Sede - Servidores: o CEC cuenta actualmente con 7 servidores distribuidos en sus dos sedes tal como lo ilustra la tabla 2: Ubicación Sede EPN Sede Araucaria - Laboratorio Nro. de Equipos Servidor de base de datos SQL Server 1 Firewall 1 Servidor de Datos 1 Servidor de base de datos SQL Server 1 Servidor de Datos 1 Servidor de Correo y Firewall 1 Servidor de Correo 1 Tabla 2: Distribución de servidores por Sede Software: o Licenciamiento: CEC pertenece al Campus Agreement de la Escuela Politécnica Nacional en cuanto a licenciamiento de productos Microsoft. De la misma manera cuenta con licencias de otros paquetes como Autocad, Swish, Flash, etc. o Sistemas de Información: CEC cuenta con sistemas de información para: Facturación, Contabilidad, Sistemas Académicos. 48 o Bases de datos: CEC cuenta con base de datos para los sistemas de información distribuidas tal como lo ilustra la tabla 3. Ubicación Base de Datos Base de Datos Facturación: SISFAC Sede EPN Base de Datos Sistema Contable: CADILAC Base de Datos Sistema Académico: SISCEC Base de Datos Facturación: SISFAC Sede Araucaria Base de Datos Sistema Contable: CADILAC Base de Datos Sistema Académico: SISCEC Tabla 3: Distribución de Base de datos por Sede - Red: o Acceso a Internet: El CEC-EPN cuenta con dos enlaces de 512 Mbps clear channel. La conexión a Internet es de libre acceso para todos los integrantes de la organización según requerimientos de la coordinación a la que pertenecen. - Seguridades: o El CEC, cuenta actualmente con un plan de políticas de seguridad para respaldos de información, e identificación y mitigación de riesgos. La figura 11, ilustra la infraestructura tecnológica del CEC. RED DE EQUIPOS ADMINISTRATIVOS LABORATORIO 6 LABORATORIO 5 LABORATORIO 4 LABORATORIO 3 LABORATORIO 2 LABORATORIO 1 192.168.56.* Servidor de BDD SQL Server 2000 Internet 512 Kbps Clear channel 1:1 Firewall Linux CentOS 4.5: 192.168.56.1 Firewall Linux CentOS 5.0: 192.168.57.3 Internet 512 Kbps Clear channel 1:1 Enlace de radio inalámbrico: 2Mbps Figura 11: Infraestructura tecnológica el CEC Servidor de Datos SEDE: ESCUELA POLITECNICA NACIONAL 49 Servidor de BDD CADILAC Servidor de Correo 192.168.57.1 192.168.57.* Servidor de BDD SISFAC y datos RED DE EQUIPOS ADMINISTRATIVOS LABORATORIO TOEFL SEDE: EDIF. ARAUCARIA 50 2.1.2.6 Identificación de problemas En la tabla 4 se detallan los problemas internos identificados de la CCC en cuanto a la elaboración de reportes gerenciales. Problema Actualmente, no se cuenta con una estrategia de refrescamiento, carga y transformación de información: la consolidación de la información se la realiza de forma manual recolectada en hojas de cálculo, de forma no periódica. Impacto Prioridad ALTO ALTO ALTO ALTO MEDIO BAJO MEDIO ALTO ALTO ALTO ALTO ALTO No se encuentra disponible la información histórica de encuestas y evaluaciones realizadas por el estudiante. ALTO ALTO Heterogeneidad en los rangos de valores de las evaluaciones a través del tiempo. ALTO ALTO Existe redundancia de información de estudiantes, cursos e instructores. MEDIO MEDIO La base de datos transaccional con diseño no normalizado. BAJO MEDIO No se cuenta con una herramienta formal, que apoye a la toma de decisiones dentro de la Coordinación. No existen perfiles de usuario para el acceso a la información establecidos. La realización de gráficos, reportes e informes son muy complicados de elaborar. No existe información básica del cliente almacenada como el género, fecha de nacimiento del estudiante para definir rangos de edad y tipo de cargo debido a la variabilidad de la naturaleza del negocio. No existe información de encuestas y evaluaciones realizadas por el estudiante, sino únicamente a nivel de curso con datos totalizados. Tabla 4: Identificación de Problemas 2.1.3 Desarrollo del cronograma y presupuesto del proyecto Cronograma: en la tabla 5 se detallan los tiempos estimados en semanas para el desarrollo del proyecto en sus diferentes fases. Fase Planificación Tiempo Estimado (semanas) 2 Requerimientos 3 Análisis 3 Diseño 2 Implementación 4 Pruebas 5 Duración Total 19 Tabla 5: Tiempo estimado del proyecto 51 Presupuesto: en la tabla 6, se detalla los rubros considerados para la elaboración del presupuesto del proyecto. Elemento Cantidad Costo Unidad (USD) Subtotal (USD) HARDAWARE Servidor para el Datamart 1 1100 1100 Equipos para desarrollo 2 400 800 Total: 1900 SOFTWARE 1 Licencia SQL 2005 con: Analysis, Integration y Reporting Service. 1 Licencia Windows 2003 Server Total: 1 800 0 1 600 600 600 RECURSO HUMANO Analista 2 500 1000 Programador 1 400 400 Total (mes) 1400 Total(19 semanas) 6650 SUMINISTROS Resmas de papel bond 5 3,5 17,5 Torre de CD´s (25 unidades) 2 18 36 Tonner para impresora Láser 1 37 37 Total : 90,5 TOTAL: 9240,5 Tabla 6: Presupuesto del Proyecto 2.1.4 Definición de los objetivos de uso empresarial A continuación se definen los objetivos de la CCC en base a la definición de los objetivos empresariales: 2.1.4.1 Audiencia de destino: La solución servirá de apoyo al proceso de toma decisiones que realiza la CCC a través de: - El Subcoordinador General. - El Subcoordinador de cursos Abiertos, - El Subcoordinador de cursos Cerrados. - El Subcoordinador de cursos In Company. 52 Adicionalmente, la solución brindará apoyo al área de Marketing a través de reportes sobre las encuestas generadas en cada evaluación. 2.1.4.2 Plataforma tecnológica: La solución se adaptará a la plataforma con la que actualmente cuenta el CEC, la cual se detalla a continuación: - Servidor de las fuentes de datos: MS SQL Server 2000 sobre Windows 2000 Server. - Servidor del datamart: MS SQL Server 2005, IIS, sobre Windows 2003 Server. - Clientes: navegador de Internet. 2.1.4.3 Características y Funciones En la tabla 7 se describen las características y funciones que son planteadas en base a los problemas percibidos dentro de la CCC: Problemas percibidos Actualmente, no se cuenta con una estrategia de refrescamiento, carga y transformación de información: la consolidación de la información se la realiza de forma manual recolectada en hojas de cálculo, de forma no periódica. No se cuenta con una herramienta formal, que apoye a la toma de decisiones dentro de la Coordinación. No existen perfiles de acceso a la información definidos. La realización de gráficos, reportes e informes son muy complicados de elaborar. No existe información básica del cliente almacenada como el género, fecha de nacimiento del estudiante para definir rangos de edad y tipo de cargo debido a la variabilidad de la naturaleza del negocio. Características y funciones Automatización de los procesos de extracción, carga y transformación de información. Definición de una estrategia de refrescamiento de información. Acoplamiento con las plataformas tanto de software como de hardware disponibles en la organización. Consolidación de la Información histórica en un servidor central. Disponibilidad de la información las 24 horas del día. Procesamiento rápido, preciso y confiable de datos. Definición de perfiles de usuario. Acceso eficiente y oportuno a la información de acuerdo a los perfiles de usuario establecidos. Variedad de criterios de navegación o filtrado de información para solución de consultas y reportes. Entrega a los usuarios de herramientas que permitan la fácil generación de reportes. Agregar los campos de género, fecha de nacimiento y tipo de cargo en la tabla CLIENTE. Propuesta para la redefinición de datos del estudiante. Generación de un proceso de identificación de género a partir del nombre del cliente. 53 No existe información de encuestas y evaluaciones realizadas por el estudiante, sino únicamente a nivel de curso con datos totalizados. No se encuentra disponible la información histórica de encuestas y evaluaciones realizadas por el estudiante. Generar una estructura a nivel de base de datos que permita el almacenamiento de las evaluaciones y encuestas realizadas por el estudiante. Se tendrá como carga inicial de información los datos tabulados a nivel de curso de la tabla evaluación. Para el refrescamiento de datos, se deberá tomar en cuenta la información almacenada en la estructura definida para el registro de las evaluaciones y encuestas por cada estudiante. Homogeneización de los rangos de calificaciones de evaluación, en base a entrevistas al Coordinador del la CCC. Carga de información a una base de datos intermedia para facilitar la carga al datamart. Heterogeneidad en los rangos de valores de las evaluaciones a través del tiempo. La base de datos transaccional con diseño no normalizado y redundancia de información. Tabla 7: Característica y funciones a ser cubiertas por el datamart 2.1.4.4 Selección de la estrategia de implementación Para la implementación del datamart se seleccionará el enfoque bottom up, ya que se requiere satisfacer los requerimientos de una área particular del CEC que en este caso será la CCC, debido a que no cuenta con un datamart construido actualmente. 2.1.4.5 Selección del método de desarrollo El método de desarrollo en Espiral es el más recomendable para la implementación de un data warehouse, considerando el énfasis en la velocidad culminación del proyecto. 2.1.4.6 Selección del ámbito inicial de implementación La implementación del datamart se realizará tomando en cuenta la información detallada en los siguientes puntos. 2.1.4.7 Origen de las fuentes de datos La sede EPN cuenta con un servidor de base de datos en el cual se almacena la información académica de la CCC y un repositorio donde se almacenan hojas de cálculo los cuales contienen las metas de los indicadores principales. 2.1.4.8 Modelo Empresarial La solución a implementar proveerá respuestas a preguntas relacionadas a las perspectivas de la CCC de acuerdo a las siguientes perspectivas: 54 - Cliente: es la persona o grupo de personas individuales o corporativas que acceden a los diferentes productos ofertados por la CCC. - Curso: son todos los eventos de capacitación generados, los cuales son sometidos a evaluaciones y encuestas. - Tipo de Curso: se puede clasificar a los cursos o eventos de capacitación como: abiertos, cerrados, in-company y virtuales. - Programa: se refiere a la programación a la cual pertenece el curso - Instructor: es el principal proveedor de la CCC, rigurosamente seleccionado de tal forma que permita el cumplimiento de los objetivos y contenido del evento de capacitación. - Tiempo: Una clasificación según el tiempo permitirá obtener información sobre los cursos o eventos de capacitación realizados. - Ítems de Evaluación: son todos los puntos de revisión de la evaluación realizada por el alumno con el fin de medir su nivel satisfacción. - Ítems de Encuesta: son todos los puntos de revisión de encuestas realizadas al alumno. Por lo tanto lo que se pretende monitorear con el datamart implementado son los proceso de medición de académica, evaluación, encuestas y rendimiento de los cursos generados relacionados con los principales índices de medición del CEC los cuales son: - Número de estudiantes - Número de cursos - Total de ingresos económicos - Numero de horas dictadas - Nivel de satisfacción del cliente 2.1.5 Selección del enfoque arquitectónico La solución propuesta, utilizará la arquitectura para datamarts ya que cubrirá las necesidades específicas de la CCC. Adicionalmente la solución se implementará bajo una arquitectura cliente/servidor de dos capas en la cual las 55 herramientas de usuario final se ejecutarán en el cliente y, las fuentes de datos y datamart se alojarán en un servidor como se puede observar en la figura 12. Figura 12: Arquitectura Cliente / Servidor de dos capas 2.1.6 Desarrollo de escenarios de uso empresarial La solución deberá resolver las necesidades especificadas en la tabla 8. Descripción Fuente Medir la satisfacción del cliente con el servicio del CEC. Proceso de planificación estratégica del CEC. Medir el porcentaje de estudiantes por género CCC-RQ-04 Evaluación final Medir el porcentaje de estudiantes que recomiendan el producto. CCC-RQ-04 Evaluación final Medir el porcentaje de estudiantes por tipo de institución. CCC-RQ-04 Evaluación final Medir el porcentaje de estudiantes de acuerdo al medio de difusión por el cual se enteraron de los productos. CCC-RQ-04 Evaluación final Medir el porcentaje de estudiantes por rango de edad. CCC-RQ-04 Evaluación final Medir el porcentaje de estudiantes por nivel o cargo profesional. CCC-RQ-04 Evaluación final Medir el porcentaje de estudiantes por grupo de clientes (empresarial, individual). Proceso de planificación estratégica del CEC. Medir el total de ingresos que general cada grupo de cliente. Proceso de planificación estratégica del CEC. Medir la cantidad de clientes del CEC por periodo académico. Proceso de planificación estratégica del CEC. Indicar cual ha sido el curso de mayor demanda. Entrevista. Indicar el curso con mayor número de alumnos matriculados. Entrevista. Medir el número de alumnos que aprobaron los cursos ofertados. Procedimiento CCC V6. 56 Cantidad de estudiantes matriculados por curso. Medir la cantidad de cursos y consultorías realizadas por el CEC. Medir el crecimiento de los ingresos. Procedimiento CCC V6. Proceso de planificación estratégica del CEC. Proceso de planificación estratégica del CEC. Identificar cual ha sido el instructor que más ha dictado cursos. Entrevista. Identificar cual ha sido el instructor que ha obtenido la mejor evaluación. Entrevista. Tabla 8: Escenarios de uso empresarial 2.1.7 Recopilación de datos y metadatos Recopilación de datos: Actualmente la CCC cuenta con un modelo entidad relación y una hoja de cálculo con las metas mensuales de los indicadores de rendimiento. Recopilación de metadatos: El diccionario de datos correspondiente a la base de datos académica y las metas mensuales de los indicadores de rendimiento.. 2.2 REQUERIMIENTOS 2.2.1 Requerimientos del propietario Mantener la información actualizada de forma transparente ya que la consolidación de información con la que actualmente cuenta la CCC se la realiza de forma manual y con más de un mes de retraso. Resolver preguntas referentes al desarrollo de escenarios de uso empresarial. Disponer de una herramienta que facilite el análisis para la toma de decisiones en base a los indicadores y metas definidas. 2.2.2 Requerimientos del arquitecto Los requerimientos del arquitecto han sido formulados tomando en cuenta la arquitectura de referencia para el datamart, como se muestra en la Figura 12: 57 Figura 13: Arquitectura propuesta del datamart [5] 2.2.2.1 Bloques del Datamart Los bloques de: Fuentes de datos, Datamart, Acceso y uso, nos permitirán establecer el ámbito operativo que tendrá el datamart. 1. Fuentes de Datos: Datos de Producción: se cuenta con una base de datos transaccional llamada SISCEC con información académica generada por la CCC. En la figura 14 se muestra el modelo físico de la base de datos SISCEC. [5] KIMBALL Ralph; ROSS, Margy; “The Datawarehouse Toolkit”, Segunda Edición. FK_CURSO_RELATIONS_EMPRESA int char(65) char(12) char(12) char(12) char(65) char(50) char(50) char(11) varchar(50) varchar(50) varchar(50) varchar(50) varchar(50) varchar(50) varchar(10) varchar(50) smallint smallint smallint smallint smallint smallint smallint smallint smallint smallint smallint smallint smallint smallint smallint smallint smallint varchar(70) INSTRUCTOR CURSO int int int int int int datetime int char(256) numeric datetime datetime float text varchar(200) text text int int float float <fk3> TIPO Id_curso int <pk,fk> Id_fecha int <pk> Fecha datetime Fecha_Curso int <pk> ID_PROG NOMBRE_PROGRAMA char(60) DESCRIPCION_PROGRAMA char(55) PROGRAMA ID_TIPO_CURSO int <pk> DESCRIPCION_TIPO char(55) Id_Curso int <pk> Id_Est int <pk> Id_Contador int <pk> Valor char(5) Asistencia FK_Fecha_Curso_CURSO FK_CURSO_INCLUIDO_PROGRAMA FK_CURSO_TIENE___TIPO ID_CURSO int <pk,fk1> ID_FACTURA int <pk,fk2> GENERA FK_GENERA_GENERA2_FACTURA int <pk> int <fk> decimal(6,2) decimal(6,2) text text int FK_FACTURA_PAGA_ESTUDIAN FK_GENERA_GENERA_CURSO FK_SALDO_CANCELA_ESTUDIAN ID_SALDO ID_EST ABONO SALDO1 NUMERO_FACTURA COMENTARIO NUM_COMPROBANTE SALDO IMPUESTO int <pk> ID_IMPUESTO ID_FACTURA int <fk> VALOR1 money DESCRIPCION_TIPO_PAGO char(65) DESCUENTO <pk> ID_CHEQUE int NUMERO1 int BANCO char(65) CHEQUE FK_TIPO_PAG_ES_CHEQUE ID_TIPO_PAGO ID_CHEQUE ID_FACTURA TIPO DESCRIPCION_TIPO_PAGO int <pk> int <fk> money char(65) ROL_DE_PAGOS int <pk> ID_ROL_PAGOS int <pk> int <fk1> ID_TIPO_PAGO int <fk> int <fk2> FK_ROL_DE_P_ES___TIPO_PAG TIPO_EMPLEADO char(15) char(45) RESPONSABLE char(45) char(65) ID_DESCUENTO ID_FACTURA VALOR1 DESCRIPCION_TIPO_PAGO TIPO_PAGO int <pk> int <fk> datetime char(65) FK_DESCUENT_TIENE_FACTURA char(65) char(65) char(12) char(65) decimal(2,2) FK_TIPO_PAG_CONTIENE_FACTURA decimal(2,2) FK_IMPUESTO_TIENE__FACTURA ID_FACTURA ID_EST FECHA_EMISION_FACTURA NOMBRE DIRECCION CIUDAD TELEFONO DEPENDENCIA SUBTOTAL TOTAL FACTURA FK_DETALLE__GENERA__FACTURA int <pk> int <fk> int char(65) decimal(3,2) DETALLE_FACTURA ID_DETALLE ID_FACTURA NUMERO1 DESCRIPCION_TIPO_PAGO PRECIO Figura 14: Modelo Físico de la base de datos SISCEC ID_CURSO ID_EMPRESA ID_EVALUACION ID_TIPO_CURSO ID_PROG MANUAL FECHA_MANUAL <pk> ID_INSTRUCTOR NOMBRE_CURSO DURACION_CURSO FECHA_INICIO_CURSO FECHA_FIN_CURSO COSTO_CURSO LUGAR_CURSO CONTENIDO_CURSO DESCRIPCION_HORARIO FK_CURSO_DICTA_INSTRUCTDIAS ID_MANUAL_INSTRUCTOR Duracion_Dias costo_hora costo_total <pk> <fk1> <fk2> <fk5> <fk4> int <pk,fk2> int <pk,fk1> float float float varchar(20) varchar(5) varchar(50) int varchar(50) float float char(10) char(10) varchar(50) float FK_CURSO_PO_RECIBE2_CURSO ID_EST ID_CURSO NOTA ASISTENCIA NOTA_PROGRAMA Diploma Parqueadero Como Id_saldo Observación Descuento Abono Factura Comprob Factura1 Abono1 CURSO_POR_ESTUDIANTE FK_CURSO_PO_RECIBE_ESTUDIAN int <pk> int <fk> char(40) char(65) char(20) char(12) char(12) char(12) char(65) char(47) char(60) ESTUDIANTE FK_DIPLOMA_OBTIENE_ESTUDIAN int <pk> int <fk> datetime datetime text DIPLOMA ID_DIPLOMA ID_EST FECHA_EMISION FECHA_ENTREGA ESTADO_DIPLOMA int <pk> ID_EST int <fk> ID_EMPRESA char(65) APELLIDO_EST char(85) NOMBRE_EST char(15) CI_EST char(15) FK_ESTUDIAN_ES_AUSPIC_EMPRESA TELEF_CASA__EST char(15) TELEF_OFICI_EST char(15) TELEF_CELULAR_EST char(15) DIRECCION_EST char(40) EMAIL_EST char(45) Nombres_completos char(20) FK_CURSO_ES_GENERA_EVALUACI ID_EMPRESA ID_TIPO NOMBRE_EMPRE DIRECCION_EMPRE TELEFONO_EMPRE RUC_EMPRE TELEFONO1_EMPRE TELEFONO2_EMPRE FAX_EMPRE EMAIL_EMPRE REPRESENTANTE_EMPRE TIPO_EMPRESA EMPRESA FK_EMPRESA_PUEDE_SER_TIPO_EMP ID_INSTRUCTOR NOMBRE_INST TELEF_CASA_INST TELEF_OFICI_INST TELEF_CELULAR_INST DIRECCION_INST EMAIL_INST EMAIL2_INST CI_INST titulo titulo2 maestria1 maestria2 otro1 CONTRATO otro2 experiencia ID_CONTRATO int <pk> area ID_INSTRUCTOR int <fk> marketing_ventas NUMERO_CONTRATO char(25) FK_CONTRATO_FIRMA_INSTRUCT proyectos COSTO_HORA decimal(3,2) administracion FECHA_FIRMA datetime finanzas ESTADO1 text rrhh leyes procesos redes bases windows linux tcp programacion_web visual ofimatica diseno_web proyectos_informaticos otros int <pk> float float float nvarchar(50) float float float float float float float float float float float float float float float float float float float float float float float float float EVALUACION ID_EVALUACION EVALUACION_EST EVALUACION_COOR EVALUACION_SCLIENTE ENLACE_ARCHIVO EVALUACION_4 EVALUACION_5 PROMEDIO EVALUACION_EQ MAS FEM RECSI RECNO EPUBLICA EPRIVADA PRENSA REVISTAS REFERENCIA WEB EMAIL OTROS MENOSV ENTREV ENTRET MAST MASC EJECUTIVO MEDIOS OPERATIVO OTRO TIPO_EMP ID_TIPO int <pk> TIPO_EMPRESA text 58 59 Datos de Heredados: se cuenta con respaldos de la base de datos académica SISCEC el cual comprenden aquellos datos históricos de los eventos de capacitación generados como fecha de inicio a partir del 07 de Enero del 2005. Adicionalmente se cuenta con hojas electrónicas que contiene las metas mensuales de los indicadores de rendimiento. Metadatos de las Fuentes: La definición de los metadatos del datamart será referente a la información extraída de los datos de producción y datos heredados. 2. Datamart Este componente es el encargado de estandarizar, transformar, integrar y cargar la información proveniente de las diferentes fuentes de datos, el manejo de los metadatos y la lista de consultas y reportes diseñados para el datamart, como se muestra en la figura 15. Figura 15: Arquitectura del datamart a alto nivel [9] [9] CONNOLLY Thomas, BEGG Carolyn. DATABASE SYSTEMS. A practical Approach to Design, Implementation and Management. 60 3. Acceso y Uso Este componente permitirá el análisis del cubo multidimensional, la elaboración de reportes, herramientas de explotación, exploración del datamart y la obtención de gráficos y reportes según los perfiles de los usuarios. Como herramienta de construcción, análisis y explotación del cubo multidimensional se utilizará MSS Analysis Services. De igual manera, como herramienta de visualización y reportería se utilizará MSS Reporting Services. Finalmente se contará con un módulo de autenticación de usuarios, en el cual se controlará el acceso a los reportes generados de acuerdos a los perfiles establecidos para la aplicación. 2.2.2.2 Capas del datamart Las capas de: Administración de datos, metadatos, transporte, infraestructura, y herramientas, tecnología y funciones, determinan el ambiente necesario para la implementación y funcionamiento del datamart. Administración de Datos: Esta capa se encargará de realizar el proceso de extracción, transformación y carga de las fuentes de datos y ubicarlos en el datamart, divididos por fases de tiempo y la administración de los metadatos. Administración de metadatos: Esta capa se encargará de administrar la definición de los datos depositados en el datamart. Transporte: esta capa se encarga de proveer el componente de transporte entre los distintos bloques de la arquitectura. Infraestructura: Se utilizará una arquitectura cliente / servidor. Herramientas, tecnología y funciones: Herramientas: los tecnológicos que se utilizarán para el desarrollo del datamart serán: componentes 61 - Herramienta de definición y diseño de datos. - Herramientas de documentación. - Herramientas de administración de bases de datos. - Herramientas de extracción, transformación y carga. - Herramientas de generación y análisis de cubos - Herramientas de reporte. - Herramientas de acceso para el usuario final. - Hojas electrónicas. Tecnología: se utilizará la infraestructura tecnológica base con la que actualmente dispone el CEC. 2.2.3 Requerimientos del desarrollador La tecnología a utilizarse se dividirá de acuerdo a los bloques detallados en la arquitectura del datamart: 2.2.3.1 Fuentes de Datos Microsoft SQL Server 2005 como sistema de administración de bases de datos. Power Designer 12 como herramienta para definición, diseño y documentación de metadatos. 2.2.3.2 Datamart Integration Service de SQL Server 2005 como herramienta de extracción, transformación y carga de datos. Analysis Services de SQL Server 2005 como herramienta de generación de cubos multidimensionales. 2.2.3.3 Acceso y Uso Reporting Services de SQL Server 2005 como herramienta de generación de reportes y gráficos. Microsoft .NET 2008 como herramienta de construcción de interfaz de usuario. 2.2.4 Requerimientos del usuario final 62 Para satisfacer las necesidades de los usuarios finales se ha dividido los requerimientos en dos grupos: 2.2.4.1 Requerimientos de consulta A la CCC le interesa resolver preguntas con respecto a los indicadores principales de medición, como se muestra en la tabla 9: 63 Indicador Pregunta ¿Cuál es el nivel de satisfacción del cliente (total general) por evento de capacitación e instructor? ¿Cuál es el nivel de satisfacción del cliente con respecto al diseño del curso? Nivel de Satisfacción del cliente ¿Cuál es el nivel de satisfacción del cliente con respecto al instructor del curso? ¿Cuál es el nivel de satisfacción del cliente con respecto al material didáctico del curso? ¿Cuál es el nivel de satisfacción del cliente con respecto a la organización y desarrollo del curso? ¿Cuál es el nivel de satisfacción del cliente con respecto a la infraestructura del curso? ¿Cuál es el número de estudiantes total matriculados por curso el instructor en un período de tiempo determinado? ¿Cuál es el porcentaje de estudiantes por género? ¿Cuál es el porcentaje de estudiantes que recomiendan el curso? Número de estudiantes ¿Cuál es el porcentaje de estudiantes que han tomado cursos según el tipo de institución del que provienen? ¿Cuál es el porcentaje de estudiantes que han tomado un curso, de acuerdo al medio de difusión por el cual se enteraron del mismo? ¿Cuál es el porcentaje de estudiantes que han tomado un curso según rangos de edad? ¿Cuál es el porcentaje de estudiantes que han tomado un curso según el cargo profesional? ¿Cuál es el porcentaje de crecimiento de la CCC en cuanto clientes con respecto al año base? ¿Cuál es el curso con mayor número de alumnos matriculados? ¿Cuál es el número de estudiantes que aprobaron un dictado? curso Ingresos económicos ¿Cuál es el porcentaje de crecimiento de la CCC en cuanto a ingresos económicos con respecto al año base? Número de horas ¿Cuál es el porcentaje de crecimiento de la CCC en cuanto al número de horas dictadas? ¿Cuál es el porcentaje de crecimiento de la CCC en cuanto a ingresos económicos con respecto al año base? Número de cursos ¿Cuál es el instructor que dictó mayor número de cursos? ¿Cuál es el curso con mayor demanda? Tabla 9: Requerimientos de consulta 2.2.4.2 Requerimientos de reporte Los usuarios finales de la CCC requieren las siguientes características: 64 - Acceso a través del un navegador de Internet. - Interfaz de acceso a los reportes previa autenticación de usuarios. - Acceso autorizado a los reportes en base a perfiles definidos. - Visualización gráfica de los datos. 2.3 ANALISIS Para el modelado de datos del Datamart propuesto, se utilizará el esquema de almacenamiento en estrella[13]14, dividido en 4 tablas de hechos que representan los procesos de medición definidas en las etapas del Proceso Productivo de la CCC (planificación, ejecución, evaluación), las cuales son las siguientes: - Proceso de medición académica - Proceso de medición de evaluación a cursos. - Proceso de medición de encuestas realizadas en cursos. - Proceso de medición de rendimiento de cursos. 2.3.1 - DIMENSIONES DIM_OBSERVACION: dimensión que almacena las observaciones referentes al desempeño de los cursos dictados. - DIM_TIEMPO: Esta dimensión contiene los periodos de tiempo en base al cual se realizará la visualización de las consultas. - DIM_ITEM: dimensión que almacena los ítems en base a los cuales se realizan las encuestas a los estudiantes que tomaron un curso. - DIM_INSTRUCTOR: dimensión que almacena la información correspondiente a cada instructor, lo que incluye la experiencia y las competencias adquiridas por el mismo, así como también el número de cursos que ha dictado. - DIM_EVALUABLE: dimensión que almacena los parámetros de medida de la evaluación final correspondiente al curso dictado. [13] Diseño de un Dataware house: Estrella y Copo de nieve Esquema en Estrella: es el esquema de almacenamiento multidimensional mas simple y se representa cuando la jerarquía de los atributos de una dimensión es lineal. 14 65 - DIM_CURSO: Dimensión que contiene el nombre asignado al curso dictado, el tipo de curso al que pertenece y su programación correspondiente. - DIM_CLIENTE: dimensión que almacena los datos personales de los clientes y empresas que toman el evento de capacitación. 2.3.2 TABLAS DE HECHO 2.3.2.1 Proceso de medición académica Permite medir los parámetros de seguimiento del proceso académico de los estudiantes matriculados en eventos de capacitación que se han llevado a cabo por parte de la CCC. La figura 16 muestra el modelo lógico del datamart para el proceso de medición académica (FACT_ACADEMICO). 2.3.2.2 Medidas - Nota promedio del estudiante. - Asistencia promedio del estudiante. - Porcentaje de descuento por estudiante. - Ingreso económico generado por estudiante. - Número de diplomas entregados. - Número de parqueaderos asignados. 2.3.2.3 Dimensiones - DIM_TIEMPO - DIM_CURSO - DIM_INSTRUCTOR - DIM_CLIENTE - DIM_OBSERVACIÓN 66 2.3.2.4 Modelo Lógico DIM_TIEMPO id_tie <pi> Integer fecha_tie Date & Time horario_tie Variable characters (250) nombre_mes_tie Variable characters (40) bimestre_tie Integer trimestre_tie Integer semestre_tie Integer anio_tie Integer <M> <M> <M> <M> <M> <M> <M> <M> DIM_INSTRUCTOR id_ins <pi> Integer <M> nombre_ins Variable characters (80) <M> titulo_principal_ins Variable characters (50) <M> maestria_principal_ins Variable characters (50) <M> titulo_adicional_uno_ins Variable characters (50) <M> area_experiencia_ins Variable characters (50) <M> anio_experiencia_ins Variable characters (20) <M> Identifier_1 <pi> Identifier_1 <pi> TIE_ACA INS_ACA FACT_ACADEMICO est_nota est_asistencia est_descuento est_ingreso est_diploma_entrega est_parqueadero DIM_CURSO id_cur <pi> Integer descripcion_tipo_cur Variable characters (80) nombre_programa_cur Variable characters (80) nombre_cur Variable characters (260) CUR_ACA <M> <M> <M> <M> Decimal (9,2) Decimal (9,2) Decimal (9,2) Decimal (15,2) Short integer Short integer <M> <M> <M> <M> <M> <M> CLI_ACA Identifier_1 <pi> DIM_CLIENTE OBS_ACA id_obs <pi> Integer <M> nombre_obs Variable characters (50) <M> id_cli <pi> Integer <M> id_emp_cli Integer <M> id_est Integer <M> nombre_emp_cli Variable characters (80) <M> representante_emp_cli Variable characters (50) <M> tipo_convenio_emp_cli Variable characters (50) <M> nombre_est Variable characters (80) <M> genero_est Characters (1) tipo_cargo_est Variable characters (30) Identifier_1 <pi> Identifier_1 <pi> DIM_OBSERVACION Figura 16: Modelo lógico del datamart FACT_ACADEMICO 2.3.3 Proceso de medición de evaluación a cursos Este proceso tiene como objetivo medir el índice de satisfacción de los estudiantes en base a los parámetros de evaluación realizados a los estudiantes en cada evento de capacitación. La figura 17 muestra el modelo lógico del datamart para el proceso de medición de (FACT_EVALUACION). 2.3.3.1 Medidas - Índice de satisfacción por parámetro de evaluación. 2.3.3.2 Dimensiones evaluación a cursos 67 - DIM_TIEMPO - DIM_CURSO - DIM_INSTRUCTOR - DIM_EVALUABLE 2.3.3.3 Modelo Lógico DIM_TIEMPO id_tie <pi> Integer fecha_tie Date & Time horario_tie Variable characters (250) nombre_mes_tie Variable characters (40) bimestre_tie Integer trimestre_tie Integer semestre_tie Integer anio_tie Integer DIM_INSTRUCTOR <M> <M> <M> <M> <M> <M> <M> <M> <pi> Integer <M> id_ins nombre_ins Variable characters (80) <M> titulo_principal_ins Variable characters (50) <M> maestria_principal_ins Variable characters (50) <M> titulo_adicional_uno_ins Variable characters (50) <M> area_experiencia_ins Variable characters (50) <M> anio_experiencia_ins Variable characters (20) <M> Identifier_1 <pi> Identifier_1 <pi> TIE_EVA INS_EVA FACT_EVALUACION ind_satisfaccion Decimal (9,2) <M> EVAL_EVA CUR_EVA DIM_CURSO DIM_EVALUABLE id_eval <pi> Integer <M> nombre_evaluable Variable characters (30) <M> Identifier_1 <pi> <pi> Integer id_cur descripcion_tipo_cur Variable characters (80) nombre_programa_cur Variable characters (80) nombre_cur Variable characters (260) <M> <M> <M> <M> Identifier_1 <pi> Figura 17: Modelo lógico del datamart FACT_EVALUACION 2.3.4 Proceso de medición de encuestas realizadas El proceso medición de encuestas tiene como finalidad medir el número de estudiantes por evento de capacitación según ítems de encuesta. La figura 18 muestra el modelo lógico del datamart para el proceso de medición de encuestas realizadas (FACT_ENCUESTA). 2.3.4.1 Medidas - Número de estudiantes que realizaron la encuesta. 2.3.4.2 Dimensiones - DIM_TIEMPO 68 - DIM_CURSO - DIM_INSTRUCTOR - DIM_ÍTEM 2.3.4.3 Modelo Lógico DIM_TIEMPO DIM_INSTRUCTOR id_tie <pi> Integer fecha_tie Date & Time horario_tie Variable characters (250) nombre_mes_tie Variable characters (40) bimestre_tie Integer trimestre_tie Integer semestre_tie Integer anio_tie Integer <M> <M> <M> <M> <M> <M> <M> <M> <pi> Integer <M> id_ins nombre_ins Variable characters (80) <M> titulo_principal_ins Variable characters (50) <M> maestria_principal_ins Variable characters (50) <M> titulo_adicional_uno_ins Variable characters (50) <M> area_experiencia_ins Variable characters (50) <M> anio_experiencia_ins Variable characters (20) <M> Identifier_1 <pi> Identifier_1 <pi> INS_ENC TIE_ENC FACT_ENCUESTA num_estudiantes_enc Integer <M> ITM_ENC CUR_ENC DIM_ITEM <pi> Integer <M> id_item nombre_item Variable characters (30) <M> nombre_subitem Variable characters (50) <M> Identifier_1 <pi> DIM_CURSO <pi> Integer id_cur descripcion_tipo_cur Variable characters (80) nombre_programa_cur Variable characters (80) nombre_cur Variable characters (260) <M> <M> <M> <M> Identifier_1 <pi> Figura 18: Modelo lógico del datamart FACT_ENCUESTA 2.3.5 Proceso de medición de rendimiento de cursos Este proceso tiene como objetivo medir el grado de cumplimiento de los indicadores principales de rendimiento de los cursos dictados con respecto a las siguientes metas: - Nivel de satisfacción del cliente - Número de cursos dictados - Número de participantes por curso - Ingresos generados por curso - Número de horas de capacitación dictadas 69 La figura 19 muestra el modelo lógico del datamart para el proceso de medición de rendimiento de cursos (FACT_RENDIMIENTO). 2.3.5.1 Medidas - Nivel de satisfacción del cliente - Número de cursos dictados - Número de participantes por curso - Ingresos generados por curso - Número de horas de capacitación dictadas 2.3.5.2 Dimensiones - Tiempo - Curso - Instructor 2.3.5.3 Modelo Lógico DIM_TIEMPO <pi> Integer id_tie fecha_tie Date & Time horario_tie Variable characters (250) nombre_mes_tie Variable characters (40) bimestre_tie Integer trimestre_tie Integer semestre_tie Integer anio_tie Integer DIM_INSTRUCTOR <M> <M> <M> <M> <M> <M> <M> <M> <pi> Integer <M> id_ins nombre_ins Variable characters (80) <M> titulo_principal_ins Variable characters (50) <M> maestria_principal_ins Variable characters (50) <M> titulo_adicional_uno_ins Variable characters (50) <M> area_experiencia_ins Variable characters (50) <M> anio_experiencia_ins Variable characters (20) <M> Identifier_1 <pi> Identifier_1 <pi> INS_REN TIE_REN FACT_RENDIMIENTO num_participantes_cur num_participantes_met tot_ingresos_cur tot_ingresos_met tot_horas_cur tot_horas_met ind_satisfaccion_cur ind_satisfaccion_met Integer Integer Decimal Decimal Integer Integer Decimal Decimal <M> <M> (9,2) <M> (9,2) <M> <M> <M> (9,2) <M> (9,2) <M> CUR_REN DIM_CURSO id_cur <pi> Integer descripcion_tipo_cur Variable characters (80) nombre_programa_cur Variable characters (80) nombre_cur Variable characters (260) <M> <M> <M> <M> Identifier_1 <pi> Figura 19: Modelo lógico del datamart FACT_RENDIMIENTO 70 2.3.6 Estrategia de Carga y Refrescamiento de datos 2.3.6.1 Estrategia de carga de datos A partir del análisis a las fuentes de datos descrito en la fase de Planificación, se ha determinado la necesidad de crear un modelo de datos auxiliar, el mismo que servirá para realizar un proceso de carga de información previa a la extracción, transformación y carga de datos hacia la base de datos del datamart, como se muestra en la figura 20. Extracción Fuentes de datos SISCEC: OLTP + histórico Archivos Planos: Metas de indicadores de rendimiento Primera etapa de carga Transformación Base de datos auxiliar dmTransformacion Segunda etapa de carga Carga Datamart dmCCC Figura 20: Extracción y carga de datos desde las fuentes de datos Por lo tanto el proceso de carga de datos se la realizará en dos etapas: - Primera etapa: comprende en la carga y transformación de los datos transaccionales e históricos provenientes de la fuente de datos SISCEC y las metas de los indicadores almacenadas en las hojas de cálculo hacia una base de datos intermedia denominada dmTransformacion, de la siguiente manera: 71 o AUX_EVALUACION: se tomará la información de la tabla EVALUACION, concerniente a las evaluaciones y encuestas generadas en cada evento de capacitación. o AUX_EMPRESA: se tomará información de la tabla EMPRESA concerniente a instituciones o empresas que han tomado algún tipo de curso o evento de capacitación. o AUX_ESTUDIANTE: se tomará información de la tabla ESTUDIANTE concerniente a estudiantes que han tomado algún tipo de curso o evento de capacitación. o AUX_TIPO_CURSO: se tomará información de la tabla TIPO_CURSO concerniente a los tipos de curso con la que cuenta actualmente el CEC. o AUX_INDICADOR: se tomará información de la hoja electrónica llamada INDICADORES.xls, concerniente a las metas definidas según indicadores de medición de rendimiento de la CCC. o AUX_PROGRAMA: se tomará información de la tabla PROGRAMA concerniente a los programas al que pertenece el curso o evento de capacitación. o AUX_CURSO: se tomará información de la tabla CURSO el cual va a ser considerado una sola vez en el proceso de carga, concerniente al nombre de cursos o eventos de capacitación con los que cuenta el CEC. o AUX_DETALLE_CURSO: se tomará información de la tabla CURSO con el detalle de cada curso o evento de capacitación clasificado en la tabla AUX_CURSO. o AUX_CURSO_POR_ESTUDIANTE: se tomará información de la tabla CURSO_POR_ESTUDIANTE, correspondiente a la información de estudiantes matriculados en cada curso o evento de capacitación. o AUX_EVALUABLE: se tomará información de la tabla EVALUABLE, correspondiente los ítems de evaluación del curso o evento de capacitación y de la tabla AUX_EVALUACION, los ítems de evaluacion ya definidos en dicha estrucutura mediante el uso de tablas temporales para la clasificación de información. 72 En el anexo B se muestra el modelo entidad-relación de la base de datos auxiliar (dmTransformacion). - Segunda etapa: comprende en el cálculo y carga de datos desde la base de datos auxiliar (dmTransformacion) hacia la base de datos del datamart (dmCCC), tanto a las dimensiones como a las tablas de hecho según procesos de medición definidos. DIMENSIONES: o DIM_TIEMPO: se tomará información de la tabla AUX_DETALLE_CURSO, concerniente a la fecha de inicio de cursos o eventos de capacitación. Esta dimensión estará compuesto por las siguientes jerarquías: fecha, mes, bimestre, trimestre, semestre y año. o DIM_CURSO: se tomará información de la tabla AUX_CURSO, el nombre único de cada curso AUX_TIPO_CURSO o se evento tomarán de el capacitación. nombre del De tipo la de tabla curso correspondiente al curso, y de la tabla AUX_PROGRAMA el nombre del programa al que pertenece. Esta dimensión estará compuesta por 3 niveles de jerarquía: tipo de curso, programa, curso. o DIM_OBSERVACION: se tomará AUX_CURSO_POR_ESTUDIANTE observación ingresada por cada información correspondiente estudiante de al la detalle matriculado. tabla de Estas observaciones, pueden ser descripciones de descuentos, pronto pago, estudiante EPN, convenios, etc. Esta dimensión no contiene niveles de jerarquía. o DIM_CLIENTE: se tomará información de la tabla AUX_ESTUDIANTE el nombre del estudiante, de la tabla AUX_EMPRESA el nombre de la empresa a la q pertenece el estudiante y TIPO_EMP el tipo de empresa. Esta dimensión tendrá las siguientes jerarquías: tipo de empresa, empresa, estudiante. o DIM_INSTRUCTOR: se tomará información de la tabla AUX_INSTRUCTOR el nombre de los instructores que han dictados los 73 diferentes curso o eventos de capacitación. Esta dimensión no contiene niveles de jerarquía. o DIM_ITEM: se tomará información de la tabla AUX_EVALUACION el nombre de los ítems de medición de encuestas, mediante una clasificación previa de la información en tablas temporales. Esta dimensión tendrá las siguientes jerarquías: item, subitem de medición de encuesta. o DIM_EVALUACION: se tomará información de la tabla AUX_EVALUABLE el nombre de los ítems de medición de evaluaciones, mediante una clasificación previa de la información en tablas temporales. Esta dimensión no contiene niveles de jerarquía. TABLAS DE HECHO: o FACT_ACADEMICO: se tomará información de la tabla AUX_ESTUDIANTE_CURSO la nota promedio, asistencia promedio, porcentaje de descuento, ingreso generado, diploma entregado, parqueadero solicitado por el estudiante matriculado, según instructor, periodo de tiempo, curso, estudiante, y observación registrada. o FACT_EVALUACION: se tomará la información de las tablas PREGUNTAENCUESTA, EVALUABLEENCUESTA, el valor promedio del ítem de evaluación del curso, si el curso está registrado en la tabla CASOEVALUACION de la base de datos SISCEC si el curso no está registrado en dicha tabla el valor promedio deberá ser calculado de la tabla AUX_EVALUACION, según ítem de evaluación, periodo de tiempo, curso e instructor. o FACT_ENCUESTA: se tomará la información de las tablas DETALLEINFOGENERAL, INFORMACIONGENERAL el valor de número de estudiantes si el curso está registrado en la tabla CASOEVALUACION de la base de datos SISCEC, si el curso no está registrado en dicha tabla el valor promedio deberá ser calculado de la tabla AUX_EVALUACION, según ítem de encuesta, periodo de tiempo, curso e instructor. o FACT_RENDIMIENTO: se tomará AUX_CURSO_POR_ESTUDIANTE la el información número de de la tabla participantes matriculados, total de ingresos generados por estudiante, de la tabla 74 AUX_DETALLE_CURSO el número de cursos generados, número de horas por curso dictado, de la tabla CASOEVALUACION el valor promedio de la evaluación total general ponderada del curso si el curso existe en dicha tabla de la base de dato SISCEC. Si el curso no existe en dicha tabla, se tomará el valor promedio de la evaluación desde la tabla AUX_EVALUACION y de la tabla AUX_INDICADOR, el valor de las metas de: número de estudiantes, número de cursos, ingresos, horas curso, nivel de satisfacción del cliente, según periodo de tiempo, curso, instructor. 2.3.6.2 Estrategia de Refrescamiento de Datos La carga inicial de los datos se realizará tomando todos los cursos, capitaciones y consultorías realizadas a partir de enero del 2005 a través del DTS15 implementado anteriormente, debido a que un previo análisis de la información, existe mucha información incorrecta y no estandarizada. El proceso de refrescamiento de datos al datamart dependerá de la programación planificada de forma mensual por la CCC, según la demanda que se genere por cada uno de los cursos o eventos de capacitación en la modalidad abiertos, cerrados, virtuales, in-company. Por lo tanto la estrategia de refrescamiento de datos tiene una carga transaccional acumulada con frecuencia mensual, por lo que esta estrategia deberá ser ejecutada después de que se hayan cerrado dichos eventos de capacitación y se hayan ingresado los resultados de las evaluaciones realizadas a los mismos. Este proceso generalmente se cierra los 10 primeros días de cada mes, por lo que es necesario realizar el refrescamiento posterior a esta fecha de forma mensual. También a este proceso debe permitir que el refrescamiento de información se lo haga de forma reprocesable, es decir que la nueva información solo actualice al periodo actual de carga únicamente. 15 DTS (Data Transformation Service): servicio que permite realizar múltiples tareas sobre base de datos a través del uso de varios tipos de conexiones a las fuentes de datos. 75 2.4 DISEÑO 2.4.1 Dimensiones 2.4.1.1 Diseño físico de la dimensión DIM_OBSERVACION: Campo Tipo de Dato Longitud ID_OBS INTEGER 4 NOMBRE_OBS VARCHAR 50 Tabla 10: Diseño de la dimensión DIM_OBSERVACION 2.4.1.2 Diseño físico de la dimensión DIM_TIEMPO Campo Tipo de Dato ID_TIE INTEGER FECHA_TIE DATETIME HORARIO_TIE NVARCHAR NOMBRE_MES_TIE NVARCHAR BIMESTRE_TIE INTEGER TRIMESTRE_TIE INTEGER SEMESTRE_TIE INTEGER ANIO_TIE INTEGER Tabla 11: Diseño de la dimensión DIM_TIEMPO Longitud 4 8 250 80 4 4 4 4 2.4.1.3 Diseño físico de la dimensión DIM_ITEM Campo Tipo de Dato ID_ITEM INTEGER NOMBRE_ITEM VARCHAR NOMBRE_SUBITEM VARCHAR Tabla 12: Diseño de la dimensión DIM_ITEM Longitud 4 30 50 2.4.1.4 Diseño físico de la dimensión DIM_INSTRUCTOR Campo Tipo de Dato Longitud ID_INS INTEGER 4 NOMBRE_INS VARCHAR 80 TITULO_PRINCIPAL_INS VARCHAR 50 MAESTRIA_PRINCIPAL_INS VARCHAR 50 TITULO_ADICIONAL_UNO_INS VARCHAR 50 AREA_EXPERIENCIA_INS VARCHAR 50 ANIO_EXPERIENCIA_INS VARCHAR 20 Tabla 13: Diseño de la dimensión DIM_INSTRUCTOR 2.4.1.5 Diseño físico de la dimensión DIM_EVALUABLE 76 Campo Tipo de Dato Longitud ID_EVAL INTEGER 4 NOMBRE_EVALUABLE VARCHAR 30 Tabla 14: Diseño físico de la dimensión DIM_EVALUABLE 2.4.1.6 Diseño físico de la dimensión DIM_CURSO Campo Tipo de Dato ID_CUR INTEGER DESCRIPCION_TIPO_CUR VARCHAR NOMBRE_PROGRAMA_CUR VARCHAR NOMBRE_CUR VARCHAR Tabla 15: Diseño de la dimensión DIM_CURSO Longitud 4 80 80 260 2.4.1.7 Diseño físico de la dimensión DIM_CLIENTE Campo Tipo de Dato ID_CLI INTEGER ID_EMP_CLI INTEGER ID_EST INTEGER NOMBRE_EMP_CLI VARCHAR REPRESENTANTE_EMP_CLI VARCHAR TIPO_CONVENIO_EMP_CLI VARCHAR NOMBRE_EST VARCHAR GENERO_EST CHAR TIPO_CARGO_EST VARCHAR Tabla 16: Diseño de la dimensión DIM_TIEMPO 2.4.2 Longitud 4 4 4 80 50 50 80 1 30 Proceso de medición académica 2.4.2.1 Diseño físico de la tabla de hechos FACT_ACADEMICO Campo Tipo de Dato Longitud ID_INS INTEGER 4 ID_CLI INTEGER 4 ID_TIE INTEGER 4 ID_CUR INTEGER 4 ID_OBS INTEGER 4 EST_NOTA DECIMAL (5,2) EST_ASISTENCIA DECIMAL (5,2) EST_DESCUENTO DECIMAL (5,2) EST_INGRESO DECIMAL (5,2) EST_DIPLOMA_ENTREGA SMALLINT 2 EST_PARQUEADERO SMALLINT 2 Tabla 17: Diseño de la tabla de hechos FACT_ACADEMICO 2.4.2.2 Modelo físico de la tabla de hechos FACT_ACADEMICO 77 DIM_INSTRUCTOR ID_INS NOMBRE_INS TITULO_PRINCIPAL_INS MAESTRIA_PRINCIPAL_INS TITULO_ADICIONAL_UNO_INS AREA_EXPERIENCIA_INS ANIO_EXPERIENCIA_INS DIM_CURSO int <pk> varchar(80) varchar(50) varchar(50) varchar(50) varchar(50) varchar(20) ID_CUR DESCRIPCION_TIPO_CUR NOMBRE_PROGRAMA_CUR NOMBRE_CUR int <pk> varchar(80) varchar(80) varchar(260) FK_FACT_ACA_CUR_ACA_DIM_CURS FK_FACT_ACA_INS_ACA_DIM_INST FACT_ACADEMICO FK_FACT_ACA_OBS_ACA_DIM_OBSE DIM_OBSERVACION int <pk> ID_OBS NOMBRE_OBS varchar(50) ID_INS ID_CLI ID_T IE ID_CUR ID_OBS EST_NOTA EST_ASISTENCIA EST_DESCUENTO EST_INGRESO EST_DIPLOMA_ENTREGA EST_PARQUEADERO int int int int int decimal(9,2) decimal(9,2) decimal(9,2) decimal(15,2) smallint smallint <pk,fk3> <pk,fk1> <pk,fk5> <pk,fk2> <pk,fk4> FK_FACT_ACA_CLI_ACA_DIM_CLIE FK_FACT_ACA_T IE_ACA_DIM_TIEM DIM_TIEMPO ID_TIE FECHA_TIE HORARIO_TIE NOMBRE_MES_TIE BIMESTRE_TIE TRIMESTRE_TIE SEMESTRE_TIE ANIO_T IE int <pk> datetime varchar(250) varchar(40) int int int int DIM_CLIENTE ID_CLI ID_EMP_CLI ID_EST NOMBRE_EMP_CLI REPRESENTANTE_EMP_CLI TIPO_CONVENIO_EMP_CLI NOMBRE_EST GENERO_EST TIPO_CARGO_EST int <pk> int int varchar(80) varchar(50) varchar(50) varchar(80) char(1) varchar(30) Figura 21: Modelo físico del proceso de medición académica 2.4.3 Proceso de medición de evaluación a cursos 2.4.3.1 Diseño físico de la tabla de hechos FACT_EVALUACION Campo Tipo de Dato Longitud ID_INS INTEGER 4 ID_EVAL INTEGER 4 ID_CUR INTEGER 4 ID_TIE INTEGER 4 IND_SATISFACCION DECIMAL (5,2) Tabla 18: Diseño de la tabla de hechos FACT_EVALUACION 2.4.3.2 Modelo físico de la tabla de hechos FACT_EVALUACION 78 DIM_EVALUABLE int <pk> ID_EVAL NOMBRE_EVALUABLE varchar(200) FK_FACT_EVA_EVAL_EVA_DIM_EVAL DIM_INSTRUCTOR ID_INS NOMBRE_INS TITULO_PRINCIPAL_INS MAESTRIA_PRINCIPAL_INS TITULO_ADICIONAL_UNO_INS AREA_EXPERIENCIA_INS ANIO_EXPERIENCIA_INS FACT_EVALUACION <pk> int varchar(80) ID_INS int FK_FACT_EVA_INS_EVA_DIM_INST varchar(50) ID_EVAL int varchar(50) ID_CUR int varchar(50) ID_TIE int varchar(50) IND_SATISFACCION decimal(9,2) varchar(20) DIM_CURSO <pk,fk3> int <pk> ID_CUR FK_FACT_EVA_CUR_EVA_DIM_CURS <pk,fk2> DESCRIPCION_TIPO_CUR varchar(80) <pk,fk1> NOMBRE_PROGRAMA_CUR varchar(80) <pk,fk4> NOMBRE_CUR varchar(260) FK_FACT_EVA_TIE_EVA_DIM_TIEM DIM_TIEMPO ID_TIE FECHA_TIE HORARIO_TIE NOMBRE_MES_TIE BIMESTRE_TIE TRIMESTRE_TIE SEMESTRE_TIE ANIO_TIE <pk> int datetime varchar(250) varchar(40) int int int int Figura 22: Modelo físico del proceso de medición de evaluación a cursos 2.4.4 Proceso de medición de encuestas realizadas 2.4.4.1 Diseño físico de la tabla de hechos FACT_ENCUESTA Campo Tipo de Dato Longitud ID_ITEM INTEGER 4 ID_CUR INTEGER 4 ID_TIE INTEGER 4 ID_INS INTEGER 4 NUM_ESTUDIANTES_ENC INTEGER 4 Tabla 19: Diseño de la tabla de hechos FACT_ENCUESTA 2.4.4.2 Modelo físico de la tabla de hechos FACT_ENCUESTA 79 DIM_INSTRUCTOR ID_INS NOMBRE_INS TITULO_PRINCIPAL_INS MAESTRIA_PRINCIPAL_INS TITULO_ADICIONAL_UNO_INS AREA_EXPERIENCIA_INS ANIO_EXPERIENCIA_INS int <pk> varchar(80) varchar(50) varchar(50) varchar(50) varchar(50) varchar(20) FK_FACT_ENC_INS_ENC_DIM_INST DIM_CURSO ID_CUR DESCRIPCION_TIPO_CUR NOMBRE_PROGRAMA_CUR NOMBRE_CUR FACT_ENCUESTA ID_ITEM int <pk> FK_FACT_ENC_CUR_ENC_DIM_CURS ID_CUR varchar(80) ID_TIE varchar(80) ID_INS varchar(260) NUM_ESTUDIANTES_ENC int int int int int DIM_ITEM <pk,fk3> FK_FACT_ENC_ITM_ENC_DIM_ITEM <pk,fk1> ID_ITEM int <pk> <pk,fk4> NOMBRE_ITEM varchar(30) <pk,fk2> NOMBRE_SUBITEM varchar(50) FK_FACT_ENC_TIE_ENC_DIM_TIEM DIM_TIEMPO ID_TIE FECHA_TIE HORARIO_TIE NOMBRE_MES_TIE BIMESTRE_TIE TRIMESTRE_TIE SEMESTRE_TIE ANIO_TIE int <pk> datetime varchar(250) varchar(40) int int int int Figura 23: Modelo físico del proceso de encuestas realizadas 2.4.5 Proceso de medición de rendimiento de cursos 2.4.5.1 Diseño físico de la tabla de hechos FACT_RENDIMIENTO Campo Tipo de Dato Longitud ID_CUR INTEGER 4 ID_INS INTEGER 4 ID_TIE INTEGER 4 NUM_PARTICIPANTES_CUR INTEGER 4 NUM_PARTICIPANTES_MET INTEGER 4 TOT_INGRESOS_CUR DECIMAL (5,2) TOT_INGRESOS_MET DECIMAL (5,2) TOT_HORAS_CUR INTEGER 4 TOT_HORAS_MET INTEGER 4 IND_SATISFACCION_CUR DECIMAL (5,2) IND_SATISFACCION_MET DECIMAL (5,2) Tabla 20: Diseño físico de la tabla de hechos FACT_RENDIMIENTO 80 2.4.5.2 Modelo físico de la tabla de hechos FACT_RENDIMIENTO DIM_TIEMPO id_tie fecha_tie horario_tie nombre_mes_tie bimestre_tie trimestre_tie semestre_tie anio_tie DIM_INSTRUCTOR int <pk> datetime varchar(250) varchar(40) int int int int id_ins nombre_ins titulo_principal_ins maestria_principal_ins titulo_adicional_uno_ins area_experiencia_ins anio_experiencia_ins int <pk> varchar(80) varchar(50) varchar(50) varchar(50) varchar(50) varchar(20) FK_FACT_REN_INS_REN_DIM_INST FK_FACT_REN_TIE_REN_DIM_TIEM FACT_RENDIMIENTO id_cur id_ins id_tie num_participantes_cur num_participantes_met tot_ingresos_cur tot_ingresos_met tot_horas_cur tot_horas_met ind_satisfaccion_cur ind_satisfaccion_met int <fk1> int <fk2> int <fk3> int int decimal(9,2) decimal(9,2) int int decimal(9,2) decimal(9,2) FK_FACT_REN_CUR_REN_DIM_CURS DIM_CURSO id_cur descripcion_tipo_cur nombre_programa_cur nombre_cur int <pk> varchar(80) varchar(80) varchar(260) Figura 24: Modelo físico del proceso de medición de rendimiento de cursos El diseño físico final del datamart se encuentra detallado en el anexo D. 2.4.6 Diseño detallado de la arquitectura de aplicación Como se describió en la fase de Requerimientos, la solución se implementará bajo una arquitectura cliente/servidor de dos capas. La figura 25, muestra los componentes creados y los componentes individuales de acuerdo a los bloques detallados en el ambiente operativo del datamart. 81 Figura 25: Arquitectura cliente/servidor de la aplicación 2.4.6.1 Fuentes de datos - Componente ETL16: este componente alojado en el servidor, se encargará de realizar el proceso de extracción, transformación y carga desde las fuentes de datos hacia el datamart. Este componente se lo implementará a través de la elaboración de paquetes de Business Intelligence SQL Server Integration Services 2005. 2.4.6.2 Datamart - Componente Datamart: este componente alojado en el servidor se encargará de realizar la exploración y explotación del cubo multidimensional. Este componente se lo implementará a través de la elaboración de proyectos con SQL Server Analysis Services 2005. 2.4.6.3 Acceso y uso - Componente Módulo de Seguridades: Este componente alojado en el servidor se encargará de controlar el acceso adecuado a los reportes en base a una previa autenticación y asignación de perfiles de acceso. - Diseño de Interfaz de autenticación: Como se muestra en la figura 26, el usuario deberá identificarse previamente a través del nombre de usuario y contraseña asignados. 16 ETL: por sus siglas en inglés se define como el componente encargado de la Extracción, Transformación y Carga de datos desde las fuentes. 82 Figura 26: Interfaz de autenticación de usuarios 2.4.6.4 Componente de visualización Este componente alojado en el servidor se encargará de realizar la creación y visualización de reportes generados a partir del análisis al cubo multidimensional. Este componente se lo implementará a través de la elaboración de proyectos con SQL Server Reporting Services 2005. - Diseño de Interfaz de Usuario: Como se muestra en la figura 27, se proporcionará listas de selección para los criterios de búsqueda, a partir de los cuales el usuario determinará la información que desea visualizar en las áreas de: gráfico de resultados y tabla de resultados. Estos criterios de búsqueda estarán localizados en la parte superior de la interfaz. En la parte superior izquierda se tendrá el menú mediante el cual se accederá a los diferentes reportes definidos para cada perfil de usuario. 83 100 Curso1 50 0 Curso2 1er 2do 3er 4to trim. trim. trim. trim. Curso3 Figura 27: Interfaz de reportes - Componente Navegador Web: Este componente estará alojado en cada cliente, se encargará de permitir el acceso, navegación y visualización de la aplicación a través de la intranet. 2.4.7 Definición de los niveles de seguridad Los niveles de seguridad de acceso a los reportes se lo hará a través de un módulo de seguridad, en el cual, se definirán los perfiles de acceso en base a la audiencia de destino y los indicadores señalados en los requerimientos de consulta, como se detalla en la tabla 21: 84 INDICADOR Nivel de Satisfacción del cliente Índice de estudiantes por género. Índice de estudiantes que recomiendan un curso Índice de estudiantes por tipo de institución Índice de estudiantes por medio de difusión. Índice de estudiantes por grupos de edad. Índice de estudiantes por nivel o cargo profesional. Coordinador x x x x x x x Índice de estudiantes por grupo de clientes Ingresos económicos por grupo de clientes Nivel de crecimiento de la CCC respecto a clientes Nivel de crecimiento de la CCC respecto a ingresos económicos Curso más dictado Curso con mayor número de alumnos x Instructores que mas cursos dictó Tabla 21: Niveles de Seguridad x Subcoordinador x x x x x x x x x x x x x x 2.5 IMPLEMENTACIÓN El desarrollo del Datamart se realizará utilizando las siguientes herramientas: - Microsoft SQL Server 2005 como Sistema de Administración de Bases de Datos Relacionales en el bloque de fuentes de datos[14]. - Microsoft Business Intelligence, Proyecto de Integration Services: como herramienta de Extracción, transformación y carga de datos.[15] - Microsoft Business Intelligence, Proyecto de Analysis Services: como herramienta de generación y explotación de cubos multidimensionales.[16] - Microsoft Business Intelligence, Proyecto de Reporting Services herramientas OLAP para el acceso del usuario final. [17] 2.5.1 [14] Implementación de la Estrategia de Carga MICROSOFT: Documentación de SQL Server 2005 MICROSOFT: SQL Server Integration Services [16] MICROSOFT: SQL Server Analysis Services [17] MICROSOFT: SQL Server Reporting Services [15] 85 Para la implementación de la estrategia de carga de datos del datamart se crearon DTS realizados con Microsoft Business Intelligence, Integration Services de MS SQL Server, el cual se encargará de realizar el proceso de extracción, transformación, carga y despliegue del cubo multidimensional[15]. Este paquete contiene dos grupos de carga según la estrategia definida, de la siguiente manera: - Cargar base de datos Transformación: Este grupo se encarga de realizar el proceso de extracción, transformación y carga de la información de la base de datos histórica y transaccional SISCEC para su respectiva normalización en la base de datos dmTransformacion, como se puede observar en la figura 28. Figura 28: Proceso de extracción, transformación y carga de la base de datos SISCEC a la base de datos dmTransformacion. - Cargar Datamart: Este grupo se encarga de realizar el proceso de extracción, transformación y carga de la información desde la base de datos dmTransformacion hacia la las dimensiones y tabla de hechos del datamart en la base de datos dmCCC, como se puede observar en la figura 29. [15] MICROSOFT: SQL Server Integration Services 86 Figura 29: Proceso de extracción, transformación y carga de la base de datos dmTransformacion a la base de datos dmCCC. La descripción de las tareas que componen el paquete DTS se encuentra detallado en el anexo D. 2.5.2 Implementación de la Estrategia de Refrescamiento de datos Para la implementación de la estrategia de refrescamiento de datos del datamart se creó una nueva tarea que ejecute el DTS de forma periódica en el agente de MS SQL Server, tomando en encuentra la definición de la estrategia de refrescamiento en la fase de análisis. La figura 30 muestra la configuración y calendarización de la tarea, que contiene la ejecución del paquete DTS de refrescamiento y carga del datamart de forma mensual. 87 Figura 30: Calendarización del DTS 2.5.3 Explotación Para la creación del cubo multidimensional se utilizó el asistente de creación de cubos de Microsoft SQL Server Business Intelligence Analysis Services[28][29], mediante el cual se deben definir los siguientes aspectos: 2.5.3.1 Orígenes de datos Utilizamos el asistente para orígenes de datos para seleccionar la base de datos del datamart cuyo nombre es dmCCC, como se observa en la figura 31. [28] [29] Microsoft: Best Practices for the Data Warehouse INFORMATION MANAGMENT: Best Practices for Data Warehouse Database Developers 88 Figura 31: Selección de la base de datos del datamart como origen de datos En la figura 32 muestra la conexión con el origen de datos seleccionado y sus propiedades. Figura 32: Verificación de conexión con el origen de datos En la figura 33, podemos observar la definición de las credenciales que utilizará Analysis Services para conectarse con el origen de datos. 89 Figura 33: Selección de credenciales para Analysis Services 2.5.3.2 Vista de orígenes de datos Para la creación de la vista de orígenes de datos relacionales, se selecciona el origen de datos previamente creado. Se eligen las tablas de dimensiones y las tablas de hechos que serán incluidas dentro de la vista como se observa en las figuras 34 y 35 respectivamente. Figura 34: Selección del origen de datos relacional 90 Figura 35: Selección de las dimensiones y tablas de hechos Por convención, el nombre de la vista de orígenes de datos estará compuesto por el prefijo “vw” seguido del nombre de la base de datos del datamart, como se puede observar en la figura 36. Figura 36: Asignación del nombre de la vista de origen de datos Finalmente en la figura 37 podemos observar el modelo físico del datamart dmTransformacion. 91 Figura 37: Vista de orígenes de datos 2.5.3.3 Cubos Iniciamos el asistente para cubos y seleccionamos como método de generación del cubo la “Generación automática”. [16] Figura 38: Selección del método de generación del cubo [16] MICROSOFT: SQL Server Analysis Services 92 Se selecciona la vista vwdmCCC a partir de la cual se definen las tablas de hechos FACT_ACADEMICO, FACT_RENDIMIENTO FACT_ENCUESTA, FACT_EVALUACION y y sus correspondientes tablas de dimensiones como se observa en la figura 39. Figura 39: Selección de la vista de orígenes de datos En la figura 40 se observa la especificación de las tablas de hechos, las tablas de dimensiones y como dimensión de tiempo la tabla DIM_TIEMPO. Figura 40: Identificación de las tablas de hechos y de dimensiones 93 En la figura 41 se observa la definición de las propiedades de tiempo de acuerdo a la dimensión DIM_TIEMPO. Figura 41: Identificación de propiedades de tiempo en la dimensión DIM_TIEMPO Posteriormente en la figura 42 se observa la selección de las medidas que se van a incluir en el cubo y que servirán para definir nuevos miembros calculados. Figura 42: Medidas a incluir en el cubo 94 Finalmente, por convención se asigna como nombre del cubo qbDMCCC, el cual servirá de referencia para realizar la futura explotación como se puede observar en la figura 43. Figura 43: Especificación del nombre del cubo Finalmente en la figura 44, se puede observar el esquema del cubo generado, de tal manera que se pueden identificar las dimensiones de las tablas de hecho. 95 Figura 44: Esquema del cubo generado 2.5.4 Elaboración de Consultas Los reportes[25] han sido elaborados tomando en cuenta los indicadores de mayor interés para el CCC, dichos reportes han sido organizados de la siguiente manera: 2.5.4.1 Parámetros de consulta Los reportes tienen definidos parámetros que permiten establecer el grado de detalle con que se presentarán la información y son los siguientes: - AÑO - SEMESTRE - TRIMESTRE - MES - TIPO DE CURSO - CURSO - INSTRUCTOR [25] SQL Server Reporting Services Fast Guide 96 2.5.4.2 Estructura del reporte El contenido de los reportes ha sido organizado por año, semestre, trimestre y mes, de modo que facilite el análisis de la información desde un nivel general hasta un nivel más detallado. Los reportes elaborados se detallan a continuación: 1. Desempeño curso: Muestra el desempeño de los cursos dictados tomando en cuenta los siguientes parámetros: - Número de estudiantes que han asistido a los eventos de capacitación. - Porcentaje de estudiantes retirados. - Porcentaje de alumnos con nota menor a 7. - Porcentaje de estudiantes que han recibido descuento por prontopago. - Porcentaje de estudiantes que han recibido algún tipo de descuento. - Porcentaje de estudiantes con convenio con el CEC. - Porcentaje de estudiantes que han sido becados. - Nota promedio. - Porcentaje de fidelidad de los estudiantes con respecto a los cursos de capacitación ofertados. 2. Evaluación Instructor: Muestra un listado de los instructores que prestan sus servicios al CEC desplegados en orden descendente de acuerdo a la evaluación obtenida por cada uno de ellos, además se incluye los ingresos económicos generados por instructor y el número de cursos dictados por cada uno. 3. Nivel de Satisfacción: Muestra el nivel de satisfacción de los clientes que han tomado los cursos ofertados, dicho nivel ha sido obtenido en base al promedio de las evaluaciones totales efectuadas. Además se muestra el valor objetivo, el porcentaje de crecimiento del nivel de satisfacción y el logro alcanzado. 97 4. Número de Cursos: Muestra el número total de eventos de capacitación dictados, así como también el número de cursos objetivo en base al cual se determina el porcentaje de crecimiento de cursos dictados y el logro alcanzado. 5. Número de horas capacitación: Muestra el número total de horas de capacitación que se han dictado, el número de horas objetivo, el porcentaje de crecimiento que se ha producido y el logro alcanzado. 6. Ingresos Económicos: Muestra los ingresos económicos totales que han generado los eventos de capacitación dictados, el ingreso económico trazado como objetivo para cada período de tiempo en base al que se determina el porcentaje de crecimiento alcanzado y el logro de la CCC. 7. Número de participantes: Muestra la cantidad de participantes ó número de alumnos que han tomado los eventos de capacitación ofertados por el CCC, se muestra también un número referencial de participantes en base a los cuales se han calculado el porcentaje de crecimiento del número de participantes y el correspondiente logro. 8. Evaluación cursos: Muestra las calificaciones totales desglosados por cada ítem de las evaluaciones finales de los cursos dictados, con las cuales se puede determinar la tendencia de los parámetros de evaluación. 2.6 PRUEBAS Una vez que se ha implantado el datamart en el servidor de la CCC, se procedió a realizar las pruebas[22] con el Coordinador de Capacitación y Consultoría. Las pruebas se han dividido en dos categorías: 2.6.1 [22] Pruebas de validación de requerimientos Guía de Productos para Crear una Solución Data warehouse Completa 98 Permite verificar la consistencia de datos y visualización de resultados[20] entre el reporte de seguimiento de indicadores mensuales que actualmente utiliza la CCC y los reportes obtenidos por el del datamart. a. Resultado esperado: - Los resultados generados por el datamart deben coincidir con los resultados mostrados en el reporte de seguimiento de indicadores mensuales obtenido por el Coordinador de la CCC para cada indicador establecido. - El cuadro de resumen general debe reflejar el estado de cada uno de los indicadores a través de colores ó símbolos que lo represente. - El reporte debe mostrar la meta para cada año y el logro obtenido para cada indicador de interés. - Las tablas de contenido deben tener la opción de abrir o desglosar los resultados, de modo que permitan un análisis mas granular de la información. - El gráfico debe evidenciar a simple vista la evolución de los indicadores a través del tiempo y además debe mostrar los valores correspondientes. - Debe existir consistencia entre los datos presentados en los resúmenes y su correspondiente gráfico. b. Resultado obtenido: - Los resultados obtenidos por el datamart son muy semejantes a los obtenidos por el Coordinador de Capacitación. Existen datos que varían levemente debido a que el datamart controla automáticamente rangos y promedios definidos, mientras que el Coordinador realiza el control de los datos de manera manual. - Los reportes obtenidos por el datamart muestran solamente valores totales de los indicadores ordenados por orden de prioridad y no muestran sus estados mediante algún símbolo o color descriptivo. [20] Generalidades y patrones de desarrollo de datamarts 99 - El cuadro de resumen anual muestra únicamente los totales de cada indicador de rendimiento. - El grafico solamente muestra datos agrupados por tipo de curso y año, careciendo de valores para cada dato mostrado. - Existe coincidencia entre los datos mostrados en las tablas de resumen y su correspondiente gráfico. c. Procedimiento de corrección: - Para el control de rangos de las evaluaciones, se han tomado como válidas aquellas realizadas a partir del año 2005, puesto que en años anteriores las evaluaciones sobrepasan el valor máximo de 4. En los casos en los que fue necesario, se recalculo el promedio de las evaluaciones para obtener datos confiables. - A más de los valores totales de los indicadores, se agregaron las columnas Meta, Crecimiento y Cumplimiento. - Para los mostrar el grado de cumplimiento de los indicadores se han considerado intervalos de tiempo anual, semestral, trimestral, bimestral y mensual para facilitar el seguimiento de los resultados en los reportes. - Los gráficos han sido complementados ubicando el valor de los indicadores a través del tiempo. En los casos en que la legibilidad de los datos no sea óptima se omiten los valores. 2.6.2 Pruebas Funcionales 2.6.2.1 Pruebas de extracción, transformación y carga a. Resultado Esperado: La ejecución del paquete ETL debe llevarse a cabo sin ningún inconveniente en las dos etapas de carga definidos, además no deberá existir duplicación de datos en ninguna dimensión y tabla de hechos. b. Resultado Obtenido: 100 - Primera Etapa: el proceso de extracción, transformación y carga de los datos transaccionales e históricos de la base de datos SISCEC hacia la base de datos dmTransformacion se ha realizado satisfactoriamente, tal como se muestra en la figura 45. - Segunda Etapa: Una vez migrados los datos a la base de datos intermedia, la segunda etapa de carga de datos se ha llevado a cabo con éxito, así como se muestra en la figura 46. Figura 45: Extracción, transformación y carga desde la base de datos SISCEC a la base de datos dmTransformacion 101 Figura 46: Extracción, transformación y carga desde la base de datos dmTransformacion a la base de datos dmCCC. 2.6.2.2 Prueba de refrescamiento de datos a. Resultado Esperado: El proceso de refrescamiento de datos debe realizarse de manera satisfactoria de acuerdo al período representativo17 que maneja la CCC. b. Resultado Obtenido: En la ejecución del proceso de refrescamiento se presentó un error de desbordamiento numérico sobre el campo tot_ingresos_cur de la tabla de hechos FACT_RENDIMIENTO. c. Procedimiento de Corrección: 17 Periodo representativo: periodo en el cual el flujo de información organización. tiene alta incidencia para la 102 Se realizó la conversión del tipo dato a cargar sobre el atributo tot_ingresos_cur de la tabla de hechos FACT_RENDIMIENTO, mediante el casting del mismo. 2.6.2.3 Pruebas de seguridad El acceso a los reportes por parte del Coordinador y Subcoordinadores de la CCC debe realizarse de acuerdo los esquemas de seguridad establecidos anteriormente. a. Resultado Esperado Para controlar el acceso a los reportes proporcionados por el administrador de reportes la solución se han tomado en cuenta dos consideraciones: - El usuario del sistema deberá acceder a los reportes que le correspondan a su perfil, a través del componente módulo de seguridades mostrado en la figura 47. - El usuario accederá a los reportes no debe tener conocimiento de la ubicación de los reportes (ruta) para su posterior acceso mediante el uso de su URL a través del navegador. b. Resultado Obtenido Los reportes son visualizados mediante el administrador de reportes SEG_CEC de acuerdo a los perfiles de usuario establecidos, tal como se muestra en la figura 48. 103 Figura 47: Pantalla de inicio de sesión del administrador de reportes SEG_CEC Figura 48: Reporte de visualización del indicador de satisfacción del cliente 2.6.2.4 Pruebas de rendimiento del sistema 104 Haciendo uso del Monitor de Sistema que ofrece Windows Server 2003 se ha creado un registro de rendimiento del sistema, en el cual se han definidos los siguientes contadores: - Páginas por segundo. - Longitud media de cola en disco. - Porcentaje de tiempo de procesador. - Porcentaje de tiempo de disco. - MBytes disponibles. - Asignaciones de bloque paginado. a. Resultado Esperado Durante el proceso de carga de datos, se espera que el servidor asignado por parte de la CCC para lojar nuestro datamart funcione adecuadamente y que los contadores definidos en el monitor del sistema se mantengan en los parámetros normales. b. Resultado Obtenido Luego de realizar el proceso de carga de datos se pudo observar que se presentaron valores altos para los contadores de porcentaje de tiempo de procesador y porcentaje de tiempo de disco, tal como se muestra en la figura 49. Los valores para los contadores mencionados es alto durante el proceso de refrescamiento de información al datamart, por un tiempo aproximado de 1 minuto, por lo tanto el rendimiento del servidor del datamart cubre las necesidades de procesamiento del datamart. c. Procedimiento de corrección 105 Para minimizar el impacto que produce la carga de datos en procesador y disco, se recomienda acortar los tiempos de refrescamiento de datos, de esta forma se tendrá una menor cantidad de información a procesar. Figura 49: Evaluación de rendimiento del Servidor de datamart 2.6.3 Despliegue 2.6.3.1 Instalación inicial del datamart Para la instalación inicial y puesta en marcha del datamart fue necesario crear un manual de instalación y configuración descrito en el anexo A 2.6.3.2 Capacitación a los usuarios del datamart Debido a que el CEC cuenta con una certificación a la calidad, fue necesario crear un plan de capacitación para los usuarios del sistema con el apoyo de la Coordinación de Calidad y Talento Humano, para de esta manera encaminar a la mejora de la satisfacción de los clientes pero sin perder de vista los objetivos 106 empresariales de la organización en base al uso adecuado del sistema y a la interpretación adecuada de los resultadas obtenidos. Este plan de capacitación fue desarrollado en base a los siguientes parámetros de evaluación: - Aprendizaje: Permite evaluar la capacidad de la aplicación para permitir el aprendizaje del usuario. - Navegabilidad: Permite evaluar la facilidad de exploración y navegación que tiene el usuario a través del sistema. - Interpretación de resultados: permite evaluar la interpretación de resultados obtenidos y generados en gráficos y tablas. - Lineamiento: Permite evaluar el lineamiento de los requerimientos solventados con respecto a los indicadores de medición descritos en el manual de procesos de calidad del CEC. De acuerdo a la encuesta realizada a diversos usuarios del datamart se obtuvieron los siguientes resultados: APRENDIZAJE 10% 20% ACEPTACION RECHAZO NEUTRAL 70% Figura 50: Porcentaje de aceptación en aprendizaje 107 NAVEGABILIDAD 0% ACEPTACION RECHAZO NEUTRAL 100% Figura 51: Porcentaje de aceptación en navegabilidad INTERPRETACION DE RESULTADOS 0% 28% ACEPTACION RECHAZO NEUTRAL 72% Figura 52: Porcentaje de aceptación en interpretación de resultados LINEAMIENTO 10% 20% ACEPTACION RECHAZO NEUTRAL 70% Figura 53: Porcentaje de aceptación en lineamiento 108 De los resultados obtenidos, podemos concluir: - La figura 50, muestra que el 80% de las personas encuestadas aceptan haber aprendido como utilizar correctamente el producto. - La figura 51, muestra que el 100% de las personas encuestadas aceptan que el sistema tiene una alta capacidad de navegabilidad y fácil control por parte del usuario. - La figura 52, indica que el 72% de las personas encuestadas interpretaron correctamente los resultados desplegados por el sistema tanto en forma gráfica como en datos, sin embargo el 28% de los encuestados presentaron problemas debido a que existía confusión entre los gráficos generados en los diferentes períodos de tiempo (anual, semestral, trimestral, bimestral y mensual). - La figura 53, indica que el 70% de los encuestados está de acuerdo a que los indicadores generados en los reportes están alineados con los indicadores descritos en el cuadro de mando integral señalada en la planificación estratégica del CEC. 2.6.4 Revisión y expansión 2.6.4.1 Requerimientos limitados por el modelo de datos del datamart Para potenciar el uso del datamart dentro de la CCC, se han considerados los siguientes aspectos: - Complejidad en la estandarización de información: existen consultas que no se consideraron en el ámbito inicial de implementación del datamart debido la complejidad para estandarizar datos almacenados en la fuente de datos SISCEC tales como: o Número de quejas presentadas en los diferentes cursos. o Número de sugerencias presentadas. 109 - Consultas empresariales limitadas por el modelo de datos inicial del datamart: Las consultas proporcionadas a la CCC están limitadas a cinco indicadores de rendimiento principales, los cuales son: o Nivel de satisfacción del cliente. o Número de estudiantes que han tomado un curso. o Ingresos económicos. o Número de horas dictadas. o Número de cursos dictados. 2.6.4.2 Identificación de otras fuentes de datos externas que no han sido tomadas en cuenta en el ámbito inicial Para incluir información financiera al datamart, será necesaria la inclusión de la fuente de datos SISFAC, la misma que contiene información referente a los ingresos que recibe el CEC por concepto de cursos dictados. 2.6.4.3 Potenciación y mejoramiento del modelo de datos del datamart Para la potenciación y mejoramiento del sistema, es conveniente considerar los siguientes aspectos: - Implementar de forma estandarizada la información que generan las consultas que no pudieron ser incluidas en el ámbito inicial del datamart. - Generación de las metas de los indicadores directamente en la base de datos y no en horas de cálculo como actualmente se lo realiza. - Normalización y mejoramiento del modelo de la base de datos transaccional, se controle el flujo de información de forma mas adecuada. 2.6.4.4 Coordinaciones no atendidas En la tabla 22 se detalla las coordinaciones que no se han tomado en cuenta en la implementación inicial del datamart, debido a que no se encontraron fuentes de 110 datos para el indicador de rendimiento señalado, sin embargo ofrecen una oportunidad de mejora. COORDINACION LINGÜÍSTICA CALIDAD Y TALENTO HUMANO FINANCIERO ADMINISTRATIVO DESARROLLO TECNOLÓGICO ÁREA CLAVE DE RESULTADO CAPACITACION A LA MEDIDA INDICADOR Índice de satisfacción Nivel de mejoramiento en procesos Tasa de inconformidades y observaciones en auditorias. TALENTO HUMANO PROFESIONAL Número de horas de capacitación anual Y CALIFICADO Nivel de desempeño. Nuevos cursos y programas abiertos. MARKETING Nivel de fidelización de clientes. PRODUCTIVIDAD INTERNA Reporcesos y errores. Tasa de rotación de personal. CLIMA LABORAL Porcentaje de satisfacción con el clima laboral. Tasa de ejecución presupuestal por área CUMPLIMIENTO PRESUPUESTAL y total. SUPERÁVIT Superávit. Nivel de satisfacción con la tecnología. TECNOLOGÍA AVANZADA Tasa de actualizaciones realizadas. Tasa de automatización de procesos. Tabla 22: Coordinaciones no atendidas 111 CAPITULO 3 CONCLUSIONES Y RECOMENDACIONES 3.1 Conclusiones - La metodología propuesta combina la gestión de proyectos propuesta en la metodología de Harjinder y Prakash y los ciclos iterativos e incrementales que incluyen entregables establecidos en la metodología propuesta por el SAS Institute, sin perder el enfoque rápido de desarrollo. - La metodología propuesta para la implementación del datamart nos permite aprovechar las mejores prácticas de las metodologías propuestas por Harjinder – Prakash y SAS Institute, con lo cual se cubren aspectos necesarios para alcanzar una solución efectiva, mantenible y escalable, de forma independiente de la plataforma tecnológica y de las herramientas de desarrollo que se utilicen para su implementación. - La metodología de desarrollo en espiral permitió establecer de manera rápida los requerimientos de la implementación inicial del datamart, brindando así información clara y oportuna. - Sí bien en la actualidad existen diversas herramientas para el desarrollo de datamarts, tanto propietario como software libre, es importante considerar aquella que se integre adecuadamente a la infraestructura existente en la empresa en la cual se va a implementar la solución. - La implementación del datamart permitió integrar los datos transaccionales e históricos con los que dispone la CCC de forma consolidada, por lo cual la información estratégica requerida por la coordinación se encuentra a plena 112 disponibilidad, dejando de lado el acceso a la base de datos transaccional para su obtención. - La estrategia de implementación bottom-up escogida en nuestra metodología, permitió solventar de manera satisfactoria los requerimientos de información más urgente de la CCC, lo cual sienta el precedente para que se implementen datamarts para el resto de coordinaciones utilizando la misma estrategia. - Para el análisis y diseño del datamart para la CCC fue necesario identificar los procesos de medición que se llevan a cabo durante el ciclo académico de un curso o evento de capacitación, de acuerdo a lo establecido en el Proceso Productivo de la CCC. - La selección adecuada de las estrategias de carga y refrescamiento de información garantizan la confiabilidad y disponibilidad total que requiere en el futuro el uso del datamart implementado. - Los reportes generados, han sido elaborados tomando en cuenta los indicadores de rendimiento de mayor importancia para la CCC y cuya información se puede analizar a través de los filtros de consulta establecidos para el efecto. - El plan de capacitación a los usuarios llevado a cabo permite determinar que el datamart construido alcanzó niveles de aceptación satisfactorios en los parámetros de evaluación definidos. - La fase de revisión y expansión permite ampliar el alcance inicial del datamart con lo cual se podrán cubrir requerimientos Coordinación de Capacitación y Consultoría. no atendidos dentro de la 113 - Para la CCC el aspecto mas importante fue consolidación automática de información en periodos calendarizados, ya que anteriormente estos se los realizaba de forma manual con un retraso de dos meses cada uno. - De acuerdo al análisis realizado en el plan de capacitación de usuarios, se pudo determinar, que la satisfacción de los mismos debe ser independiente de la metodología que se siga. 114 3.2 Recomendaciones - Es recomendable que la CCC reestructure los procesos mediante los cuales se llevan a cabo el registro de los cursos o eventos de capacitación que se ofrecen, puesto que la información no tiene un alto grado de verificación. - Se recomienda a la CCC establecer tiempos de refrescamiento de datos al final de cada cierre en el ciclo de programación de cursos o eventos de capacitación, para garantizar la carga adecuada de información del datamart. - Se recomienda tomar en cuenta el modelo de datos establecido para la base de datos intermedia dmTransformacion como referencia para un posible proceso de reingeniería que se pueda llevar a cabo. - Es recomendable definir los procesos que se llevan a cabo en la CCC de tal forma que se puedan aprovechar los beneficios que brinda el datamart implementado. - Definir el rango correcto o relativo de los valores entre los cuales se encontrarán las evaluaciones realizadas a los cursos o eventos de capacitación generados, puesto que existen valores que no pudieron ser tomados en cuenta. - Para la visualización de los reportes de los indicadores de rendimiento se recomienda acceder desde el administrador de reportes puesto que se garantiza el acceso seguro a la información generada en base a perfiles de usuario definidos. - Incorporar los datos almacenados en archivos planos a fuentes más confiables de almacenamiento como la base de datos transaccional. 115 - Se debe considerar a futuro la posibilidad de desarrollar datamarts para las demás coordinaciones con las que cuenta el CEC, con lo cual se lograría obtener una solución integral para todos los procesos de negocio de la organización (data warehouse). 116 REFERENCIAS BIBLIOGRÁFICAS LIBROS Y MANUALES [1] Centro de Educación Continua - CEC. Procedimiento Proceso Productivo “Capacitación y Consultoría”, Código: CCC-PP-01, versión 05. [2] Cuadro de mando Integral, Perspectiva Cliente Usuario del Manual de Proceso de Planificación Estratégica del CEC. [3] INMON W.H, Building the Data warehouse, Second Edition 1996. (Evaluación de sistemas de soporte de decisión, medio ambiente del data warehouse, diseño, granularidad, tecnología, sistemas de información ejecutiva y Data warehouse). [4] JARKE Matthias, LENZERINI Maurizio, VASSILIOU Yannis, VASSILIADIS Panos. Fundamentals of Data warehouses. (Componentes, Diseño, Estructura Física, Repositorios, Integración de fuentes, Mantenimiento de Metadatos, Modelos de datos Multidimensionales, OLAP). [5] KIMBALL Ralph; ROSS, Margy; “The Datawarehouse Toolkit, Segunda Edición. (Técnicas Prácticas para la construcción de un Datawarehouse. Definición OLAP, Casos de Estudio). [6] STANEK R. William. SQL Server 2005: Manual del administrador. I Edición. México, 2006. (Integration Services, administración de datos, esquemas, tablas, índices, seguridades, afinamiento y monitoreo del servidor, configuraciones). 117 [7] MICROSOFT Oficial Course. 2780A Maintaining a Microsoft SQL Server Server 2005 Database. (Integration Services, administración de datos, esquemas, tablas, índices, seguridades, afinamiento y monitoreo del servidor, configuraciones. Guía Práctica). [8] HARJINDER S. GILL, PRAKASH C. Rao. Datawarehousing. La Integración de la Información para la mejor toma de decisiones. [9] CONNOLLY Thomas, BEGG Carolyn. DATABASE SYSTEMS. A practical Approach to Design, Implementation and Management. Segunda Edición. Addison Wesley. PÁGINAS INTERNET [10] “Data Warehousing Implementation with the SAS System”; SAS Institute Inc; Paper 132. http://www2.sas.com/proceedings/sugi22/DATAWARE/PAPER132.pdf [11] “SAS Rapid Warehousing Methodology”; SAS e-Intelligence; Paper sas43093_0501. http://www.rrc.si/papers/sas43093_0501.pdf [12] “The SAS Methodology for Solutions Development”; SAS Institute Inc; Paper wp_3562. http://www.sas.com/apps/forms/index.jsp;jsessionid=5CBA9F13B3C2F577F BD1A2DA47E9B329.tomcat2?id=wp&cid=3562 [13] Diseño de un datawarehouse: estrella y copo de nieve. http://informationmanagement.wordpress.com/2007/11/19/diseno-de-undata-warehouse-estrella-y-copo-de-nieve 118 [14] MICROSOFT: Documentación de SQL Server 2005 http://technet.microsoft.com/es-es/library/ms203721.aspx [15] MICROSOFT: SQL Server Integration Services http://technet.microsoft.com/es-es/library/ms141026.aspx [16] MICROSOFT: SQL Server Analysis Services http://technet.microsoft.com/es-es/library/ms175609.aspx [17] MICROSOFT: SQL Server Reporting Services http://technet.microsoft.com/es-es/library/ms159106.aspx [18] An introduction to SQL Server data warehousing concepts http://searchsqlserver.techtarget.com/video/0,297151,sid87_gci1354593,00. html?track=NL-465&ad=713024&asrc=EM_USC_8324042&uid=8602382 [19] Fases de Implantación de un Datawarehouse http://www.dataprix.com/fases-de-implantacion-de-un-data-warehouse [20] Generalidades y patrones de desarrollo de datamarts. http://redalyc.uaemex.mx/src/inicio/ArtPdfRed.jsp?iCve=66640714&iCveNu m=9392 [21] Fundamentos de Data warehouse http://afrodita.unicauca.edu.co/~ecaldon/docs/bd/fundamentosdedatawareh ouse.pdf [22] Guía de Productos para Crear una Solución Data warehouse Completa. http://iesbaixcamp.org/~jcuesta/apunts/oracle/oracle/DataWarehouse.pdf [23] Características de Reporting Services. http://msdn2.microsoft.com/es-es/library/ms159273.aspx 119 [24] Business Intelligence and Data Warehousing in SQL Server 2005 http://www.microsoft.com/technet/prodtechnol/sql/2005/dwsqlsy.mspx#ED5 AE [25] SQL Server Reporting Services Fast Guide http://searchsqlserver.techtarget.com/generic/0,295582,sid87_gci1172656_ mem1,00.html?track=NL-420&ad=720757&asrc=EM_NLT_8981330 [26] Desarrollo de un datamart de información académica http://biblioteca.usac.edu.gt/tesis/08/08_7974.pdf [27] INFORMATION MANAGMENT: DATA QUALITY http://www.information-management.com/channels/data_quality.html [28] Microsoft: Best Practices for the Data Warehouse http://msdn.microsoft.com/en-us/library/bb219347.aspx [29] INFORMATION MANAGMENT: Best Practices for Data Warehouse Database Developers http://www.information-management.com/issues/20011201/4340-1.html [30] IEEE: Best Practices in Data Warehousing to Support Business Initiatives and Needs http://www2.computer.org/plugins/dl/pdf/proceedings/hicss/2004/2056/08/20 5680223a.pdf?template=1&loginState=1&userData=anonymousIP%253A%253A190.152.169.158 [31] OPEN METHODOLOGY: ETL Best Practices Deliverable Template http://mike2.openmethodology.org/wiki/ETL_Best_Practices_Deliverable_T emplate 120 ANEXOS 121 ANEXO A MANUAL DE INSTALACION DEL DATAMART 122 ANEXO A MANUAL DE INSTALACION DEL DATAMART INTRODUCCIÓN: El presente Manual está dirigido a la(s) persona(s) de la Coordinación de Desarrollo Tecnológico que se encargará(n) de la puesta en marcha del datamart para la Coordinación de Capacitación y Consultoría del CEC versión 1.0 en toda su extensión; principalmente se dirige a los usuarios con perfil Administrador. Este documento explicará de una manera más técnica el proceso de instalación del sistema. REQUERIMIENTOS: 1. de Software: 1.1. Servidor Datamart: - Sistema Operativo: Windows XP, 2003 Server o Superior - Internet Information Service (IIS). - Microsoft SQL Server 2005 + (Agent Service) - Microsoft SQL Server 2005 Analysis Services. - Microsoft SQL Server 2005 Integration Services. - Microsoft SQL Server 2005 Reporting Services - Internet Explorer 6 o superior. - DOT NET Framework 3.5, lo puede encontrar en la página de instalación, en la sección pre-requisitos. 1.2. Cliente Datamart: - Sistema Operativo: Windows XP o superior 123 - Explorador Web 2. de Hardware: 2.1. Servidor Datamart - Procesador Intel Duo Core 2.8 GHz de 64 bits - Memoria RAM de 2 GB o superior - Espacio libre en Disco Duro de 500 GB - Mouse y teclado estándar - Monitor de 14’ con resolución de 1280 x 760 píxeles y color verdadero de 32 bits o superior - Interface de Red Ethernet 2.2. Cliente Datamart: - Procesador Pentium IV o superior - Memoria RAM de 1GB o superior - Espacio libre en Disco Duro de 10 GB - Mouse y teclado estándar - Monitor de 14’ con resolución de 1280 x 760 píxeles y color verdadero de 32 bits o superior - Interface de Red Ethernet 124 CONFIGURACIÓN E INSTALACIÓN 1. Creación del usuario USRCEC Previamente a la instalación del sistema, es necesario crear en el servidor un usuario con permisos de Administrador que tenga acceso a la base de datos tanto del datamart como de Reporting Services y al Sitio Web en donde se realizará la publicación de reportes y el módulo de Administración y Seguridad llamado SEG_CEC, realizando los siguientes pasos: - Acceder al Administrador del equipo. - Seleccionar Usuarios Locales y Grupos, abrir la carpeta usuarios y en el menú contextual seleccionar Usuario Nuevo. 125 - - Ingresar en la ventana Usuario Nuevo, la siguiente información, por default: USUARIO: USRCEC CONTRASEÑA: dm09okmCEC Ingresar a las propiedades del usuario USRCEC desde el menú contextual 126 - Seleccionar la pestaña Miembro de y agregar el usuario al grupo Administradores. - Finalmente iniciar la sesión en el sistema operativo con el usuario creado. 2. Instalación de Fuentes de Datos y Sitio Web 2.1. Instalación de la Base de Datos dmTransformacion: Para la instalación de la base de datos dmTransformacion, descargamos el archivo correspondiente desde la página de instalación segmento fuentes de datos, opción dmTransformación 127 El instalador automáticamente solicitará el servidor en donde se debe crear la base de datos dmTransformacion, por defecto se lo hará en el servidor local. 2.2. Instalación de la Base de Datos dmCCC: Para la instalación de la base de datos dmCCC, descargamos el archivo correspondiente desde la página de instalación segmento fuentes de datos, opción dmCCC. El instalador automáticamente solicitará el servidor en donde se debe crear la base de datos dmCCC, por defecto se lo hará en el servidor local. 128 2.3. Instalación de la Base de Datos dmSeguridad y Sitio Web SEG_CEC: Para la instalación de la base de datos dmSeguridad, descargamos el archivo correspondiente desde la página de instalación segmento fuentes de datos, opción dmSeguridad, Sitio Web SEG_CEC. El instalador automáticamente solicitará el servidor en donde se debe crear la base de datos dmSeguridad, por defecto se lo hará en el servidor local. 129 Adicionalmente se instalará el directorio virtual SEG_CEC en el Sitio Web Predeterminado del servidor local, en el Internet Information Server. Para verificar la instalación del Sitio Web, ingresamos al Administrador de Internet Information Services y verificamos que el directorio virtual SEG_CEC se haya creado correctamente. En las propiedades del directorio virtual SEG_CEC, podemos verificar lo siguiente: - En la pestaña Directorio Virtual, verificar que se encuentre habilitado el nombre de la aplicación 130 - En la pesaña Seguridad de Directorios, Autenticación y Control de Acceso, hacer clic en el botón Modificar y verificar que se encuentre marcada la opción Habilitar el Acceso Anónimo, el cual deberá contener el usuario USRCEC y contraseña por default creado previamente y en el bloque Acceso Autenticado deberá estar marcada la opción Autenticación de Windows Integrada. Si no se desea ejecutar el Sitio Web con el usuario predeterminado será necesario especificar en este sitio el usuario con el que se desee trabajar. 131 2.4. Instalación del archivo Indicadores.xls Descargar el archivo desde la página de instalación sección Fuentes de datos y lo ubicamos en la ruta C:\indicadoresCCC del servidor local o en una ruta relativa. Esta ruta deberá ser especificada en la configuración del paquete DTSX. 2.5. Configuración del Servidor Vinculado SISCEC Una vez finalizada la instalación de las bases de datos del sistema y el módulo de administración y seguridad SEG_CEC, es necesario crear el Servidor Vinculado (Link Server) a la base de datos SISCEC histórica desde el servidor del datamart dmCCC con el nombre SISCEC (si no se dispone de la base de datos SISCEC se puede obtener un backup desde la página de instalación en el segmento Componentes), realizando los siguientes pasos: - Ingresar al SQL Server Managment Studio y nos conectamos a la servidor del datamart donde fue instalado. 132 - Seleccionar la carpeta Objetos del Servidor, Servidores Vinculados (Link Server) y desde el menú contextual Agregar Servidor Vinculado. . - En la ventana Nuevo Servidor Vinculado, en la página General, realizar la configuración, teniendo en cuenta que en el campo Origen de datos el nombre del servidor puede cambiar. 133 - En la pestaña Seguridad, establecer las credenciales de acceso al servidor de la base de datos SISCEC proporcionado por la Coordinación de Desarrollo Tecnológico. - En la pestaña Opciones del servidor, habilitar la entrada y salida de RPC 2.6. Configuración del paquete DTS. Descargar desde la página de instalación el paquete pckDMCCC desde el segmento Componentes. 134 Configurar el paquete DTS en el servidor de base de datos, como una tarea calendarizada periódica en el Agente de SQL Server, para lo cual es necesario verificar que el servicio se encuentra levantado, realizando los siguientes pasos: - Crear un nuevo trabajo haciendo clic derecho sobre la carpeta Trabajos - En la pestaña general ingresar el nombre del trabajo y el propietario. 135 - Crear un nuevo paso en la pestaña pasos - Ingresar el nombre del paso, 136 - Seleccionar el tipo de ejecución del paquete: - Paquete SQL Server Integration Services: en donde seleccionamos la ubicación del DTS - Transact SQL utilizando el comando dtexec: para lo cual es necesario habilitar el procedimiento almacenado xp_cmdshell que se encarga de ejecutar comandos del sistema operativo a través de la Configuracion de Superficie de SQL Server. Para generar el comando de ejecución del DTS se puede utilizar la herramienta gráfica de dtexec conocida como DTEXECUI. - Verificar los orígenes de datos de ser necesario realizar los cambios de acuerdo al Administrador de Conexión independientemente del tipo de ejecución que se realice. 137 - Finalmente crear uno nueva programación para ejecutar el DTS de forma periódica o bajo demanda. 2.7. Publicación de Reportes Descargar desde la página de instalación, Reportes desde el segmento Componentes. 138 Ingresar a la solución y seleccionar las propiedades de la solución. Ingresar los datos del servidor de aplicaciones web configurado y especificar el nombre del sitio web predeterminado para la publicación de reportes para Reporting Services. Finalmente hacer clic nuevamente sobre la solución y seleccionamos Implementar. 139 ACCESO Y CONFIGURACIÓN DEL SISTEMA Para acceder por primera vez al sistema, debemos hacerlo con las siguientes credenciales: - Usuario: ADMINISTRADOR - Clave: ADM09@CEC1297CCC Hacer clic en el menú Sistema, Administración y se despliega la pantalla de Administración de Usuarios y Perfiles 140 En la pestaña Usuario, podemos crear, gestionar, definir perfiles y establecer contraseñas a los usuarios del sistema. 141 En la pestaña Perfil, administrar las opciones definidas en los perfiles de acceso al sistema. Adicionalmente podemos crear varios perfiles según como sea definido. Por defecto, las perfiles ingresados y habilitados actualmente en el sistema son las que fueron definidas en el documento de Análisis de Requerimientos. 142 En la pestaña Opción podemos administrar menús, submenús y las opciones que tiene actualmente el sistema. Adicionalmente podemos crear nuevas opciones estableciendo rutas de acceso específicas. Si se desea crear un nuevo reporte publicado en el servidor de Reporting Service se deberá ingresar la siguiente ruta: 143 ~/pages/frmReporting.aspx?reporte=NombreDelReporte Por defecto, las opciones ingresadas y habilitadas actualmente en el sistema son las que fueron definidas en el documento de Análisis de Requerimientos. 144 ANEXO B MODELO RELACIONAL DE LA BASE DE DATOS INTERMEDIA (dmTransformacion) float float ID_TIPO_CURSO int <pk> DETALLE_TIPO_CURSO varchar(60) AUX_TIPO_CURSO int <pk> ID_PROG NOMBRE_PROGRAMA varchar(60) int <pk> float float float FK_AUX_DETA_REFERENCE_AUX_EVAL FK_AUX_DETALLE_CURSO_AUX_CURSO nvarchar(50) float float float float AUX_CURSO float ID_CUR int <pk> float ID_TIPO_CURSO int <fk1> float ID_PROG int <fk2> float ID_GRUPO_CLIENTE int float NOMBRE CUR varchar(256) float float float float float float float float FK_AUX_CURS_REFERENCE_AUX_PROG float FK_AUX_CURS_REFERENCE_AUX_TIPO float float float float float float float AUX_PROGRAMA float AUX_EVALUACION ID_EVALUACION EVALUACION_EST EVALUACION_COOR EVALUACION_SCLIENTE ENLACE_ARCHIVO EVALUACION_4 EVALUACION_5 PROMEDIO EVALUACION_EQ MAS FEM RECSI RECNO EPUBLICA EPRIVADA PRENSA REVISTAS REFERENCIA WEB EMAIL OTROS MENOSV ENTREV ENTRET MAST MASC EJECUTIVO MEDIOS OPERATIVO OTRO EVALUACION_SOFT EVALUACION_RED PROME_EQ int <pk> int <fk1> int datetime datetime float text varchar(200) varchar(250) varchar(100) int float float int int <fk2> int int AUX_DETALLE_CURSO ID_DETALLE_CUR ID_CUR DURACION_CUR FECHA_INICIO_CUR FECHA_FIN_CUR COSTO_CUR LUGAR_CUR CONTENIDO_CUR DESCRIPCION_HORARIO_CUR DIAS_CUR DURACION_DIAS_CUR COSTO_HORA_CUR COSTO_TOTAL_CUR ID_EMPR ID_EVA ID_TIPO_CUR ID_INS TER varchar(20) PG varchar(1) AUX_INDICADOR indicadorId indicadorAnio indicadorMes indicadorNivelSatisfaccion indicadorNumeroCurso indicadorNumeroParticipantes indicadorIngresos indicadorHoras int <pk> float float float float float float float int <pk> int char(65) char(85) char(15) char(15) char(15) char(15) char(15) char(40) char(45) char(20) ID_EVALUABLEF int EVF_TIPO varchar(200) EVF_DESCRIPCION varchar(200) AUX_EVALUABLE ID_EMPRESA ID_TIPO NOMBRE_EMPRE DIRECCION_EMPRE TELEFONO_EMPRE RUC_EMPRE TELEFONO1_EMPRE TELEFONO2_EMPRE FAX_EMPRE EMAIL_EMPRE REPRESENTANTE_EMPRE TIPO_EMPRESA AUX_EMPRESA FK_AUX_ESTUDIANTE_AUX_EMPRESA int <pk,fk1> int <pk,fk2> float float float varchar(20) varchar(5) varchar(50) int varchar(50) float float char(10) AUX_ESTUDIANTE char(10) FK_AUX_CURSO_POR_ESTUDIANTE_AUX_ESTUDIANTE varchar(50) int <pk> ID_EST float ID_EMPRESA int <fk> APELLIDO_EST char(40) NOMBRE_EST char(65) CI_EST char(20) TELEF_CASA__EST char(12) TELEF_OFICI_EST char(12) TELEF_CELULAR_EST char(12) DIRECCION_EST char(65) EMAIL_EST char(47) NOMBRES_COMPLETOS char(60) NOMBRES char(60) GENERO char(1) AUX_POSIBLE_GENERO ID_DETALLE_CUR ID_EST NOTA ASISTENCIA NOTA_PROGRAMA Diploma Parqueadero Como Id_saldo Observacion Descuento Abono Factura Comprob Factura1 FK_AUX_CURSO_POR_ESTUDIANTE_AUX_DETALLE_CURSO Abono1 AUX_CURSO_POR_ESTUDIANTE ANEXO B MODELO RELACIONAL DE LA BASE DE DATOS INTERMEDIA (dmTransformacion) 145 146 ANEXO C DICCIONARIO DE DATOS DE LA BASE DE DATOS INTERMEDIA (dmTransformacion) 147 ANEXO C DICCIONARIO DE DATOS DE LA BASE DE DATOS INTERMEDIA (dmTransformacion) AUX_CURSO: Entidad que almacena la descripción general de un curso. CAMPO ID_CUR ID_TIPO_CURSO ID_PROG ID_GRUPO_CLIENTE NOMBRE_CUR TIPO DE DATO INTEGER INTEGER INTEGER INTEGER VARCHAR AUX_CURSO_POR_ESTUDIANTE: LONGITUD 4 4 4 4 256 Entidad DESCRIPCION Identificador de curso. Identificador de tipo curso. Identificador de programación Identificar de grupo de cliente Nombre del curso. que almacena los datos resultantes a la asistencia del estudiante al evento de capacitación. TIPO DE DATO INTEGER INTEGER FLOAT LONGITUD 4 4 8 FLOAT 8 Diploma VARCHAR 20 Parqueadero VARCHAR 5 Como VARCHAR 50 Id_saldo INTEGER 4 Observacion VARCHAR 50 Descuento FLOAT 8 Abono FLOAT 8 Factura CHAR 10 CAMPO ID_DETALLE_CUR ID_EST NOTA ASISTENCIA DESCRIPCION Identificador de detalle curso. Identificador de estudiante. Nota del estudiante. Porcentaje de asistencia del estudiante al curso dictado. Campo que indica si el diploma de aprobación de curso ha sido emitido o no. Campo que indica si se ha asignado un parqueadero o no. Campo que indica el medio mediante el cual se enteraron de los eventos de capacitación. Identificador de saldo a cancelar como pago del curso tomado. Campo que especifica alguna observación referente al estudiante que ha tomado el curso. Especifica el porcentaje de descuento que ha obtenido el estudiante al tomar el evento de capacitación. Cantidad en dólares que el estudiante abona como parte de pago del curso a dictar. Número de factura emitida por concepto de pago del curso. AUX_DETALLE_CURSO: Entidad que almacena los datos correspondientes a la programación de un curso. 148 FECHA_FIN_CUR COSTO_CUR LUGAR_CUR TIPO DE DATO INTEGER INTEGER INTEGER DATETIM E DATETIM E FLOAT TEXT CONTENIDO_CUR VARCHAR 200 DESCRIPCION_HORARIO_ CUR VARCHAR 250 DIAS_CUR VARCHAR 100 DURACION_DIAS_CUR INTEGER 4 COSTO_HORA_CUR FLOAT 8 COSTO_TOTAL_CUR ID_EMPR ID_EVA ID_TIPO_CUR ID_INS FLOAT INTEGER INTEGER INTEGER INTEGER 8 4 4 4 4 CAMPO ID_DETALLE_CUR ID_CUR DURACION_CUR FECHA_INICIO_CUR LONGITU D 4 4 4 DESCRIPCION Identificador de detalle de curso. Identificador de curso. Duración en horas del curso dictado. 8 Fecha de inicio del curso. 8 8 16 Fecha de fin de curso. Costo del curso dictado. Lugar en donde se dictó el curso. Descripción general con relación al curso dictado. Descripción de los horarios en los cuales de dictó un curso. Día de la semana en los cuáles se dictó un curso. Número de días en los cuales se dictó un curso. Costo por hora correspondiente al curso dictado. Costo total del curso dictado. Identificador de empresa. Identificador de evaluación. Identificador de tipo de curso. Identificador de instructor. AUX_EMPRESA: Entidad que guarda los datos básicos referentes a la empresa que ha tomado ó solicitado un evento de capacitación. CAMPO TIPO DATO ID_EMPRESA INT 4 Identificador de empresa. ID_TIPO INT 4 Identificador de tipo de empresa. NOMBRE_EMPRE CHAR 65 Nombre del cliente empresarial. DIRECCION_EMPRE CHAR 85 Dirección donde se encuentra ubicada la empresa. TELEFONO_EMPRE CHAR 15 Número telefónico de contacto. RUC_EMPRE CHAR 15 Número de RUC. TELEFONO1_EMPRE CHAR 15 Número telefónico de referencia como primer contacto. TELEFONO2_EMPRE CHAR 15 Número telefónico de referencia como segundo contacto. FAX_EMPRE CHAR 15 Número telefónico de fax. EMAIL_EMPRE CHAR 40 Dirección de correo electrónico de contacto. REPRESENTANTE_EMPRE CHAR 45 TIPO_EMPRESA 20 Nombre del representante legal de la empresa. Campo que especifica si la empresa es de tipo Pública y Privada. CHAR DE LONGITUD DESCRIPCION AUX_ESTUDIANTE: Entidad que guarda los datos básicos referentes al estudiante que toma un curso de capacitación. 149 ID_EMPRESA TIPO DE LONGITUD DESCRIPCION DATO INT 4 Identificador de Estudiante. INT 4 Identificador de empresa. APELLIDO_EST CHAR 40 Apellidos del estudiante. NOMBRE_EST CHAR 65 CI_EST CHAR 20 Nombres del estudiante. Número de cédula de estudiante. TELEF_CASA__EST CHAR 12 Número telefónico de domicilio. TELEF_OFICI_EST CHAR 12 Número telefónico de oficina. TELEF_CELULAR_EST CHAR 12 Número de celular. DIRECCION_EST CHAR 65 Dirección de residencia del estudiante. EMAIL_EST CHAR 47 NOMBRES_COMPLETOS CHAR 60 Dirección de correo electrónico de contacto. Campo que contiene los nombres y apellidos completos del estudiante. GENERO 1 CAMPO ID_EST CHAR identidad del Género del estudiante (M,F). AUX_EVALUABLE: Entidad que almacena el ítem evaluable del curso dictado organizado por género, medio de difusión, recomendación curso, tipo de institución, grupos de edad y nivel o cargo que desempenian los estudiantes. CAMPO TIPO DE DATO LONGITUD DESCRIPCION ID_EVALUABLEF INT 4 Identificador de evaluable. EVF_TIPO VARCHAR 200 Tipo de evaluable. EVF_DESCRIPCION VARCHAR 200 Descripción del evaluable. AUX_EVALUACION: entidad que almacena el registro de las evaluaciones realizadas a los cursos dictados. TIPO DE DATO LONGITUD INT 4 EVALUACION_EST FLOAT 8 EVALUACION_COOR FLOAT 8 EVALUACION_SCLIENTE FLOAT 8 Identificador de evaluación. Evaluación ponderada por instalaciones Evaluación ponderada por organización y desarrollo Evaluación ponderada por material didáctico NVARCHAR 100 Nombre del archivo de evaluación. EVALUACION_4 FLOAT 8 Evaluación ponderada por instructor EVALUACION_5 FLOAT 8 Evaluación ponderada por diseño PROMEDIO FLOAT 8 Evaluación total general EVALUACION_EQ FLOAT 8 MAS FLOAT 8 Evaluación ponderada por equipos Número de personas de género masculino. CAMPO ID_EVALUACION ENLACE_ARCHIVO DESCRIPCION 150 FEM FLOAT 8 RECSI FLOAT 8 RECNO FLOAT 8 Número de personas de género femenino. Número de personas que recomendarían el curso. Número de personas que no recomendarían el curso. EPUBLICA FLOAT 8 Personas por empresa pública. EPRIVADA FLOAT 8 PRENSA FLOAT 8 REVISTAS FLOAT 8 REFERENCIA FLOAT 8 WEB FLOAT 8 EMAIL FLOAT 8 OTROS FLOAT 8 MENOSV FLOAT 8 ENTREV FLOAT 8 ENTRET FLOAT 8 MAST FLOAT 8 MASC FLOAT 8 Personas por empresa privada. Personas que se enteraron por prensa. Personas que se enteraron por revistas. Personas que se enteraron por referencia personal. Personas que se enteraron por la Web. Personas que se enteraron por Email. Personas que se enteraron por otros medios. Personas con edad menor a veinte años. Personas con edad entre 20 a 25 años. Personas con edad entre 26 a 35 años. Personas con edad mayor a 35 años. Personas con edad mayor a 45 años. EJECUTIVO FLOAT 8 MEDIOS FLOAT 8 OPERATIVO FLOAT 8 Personas con cargo ejecutivo. Personas con cargos de nivel medio. Personas con cargos de nivel operativo. OTRO FLOAT 8 Personas con otros cargos. EVALUACION_SOFT FLOAT 8 Evaluación ponderada por software. EVALUACION_RED FLOAT 8 Evaluación ponderada por red. PROME_EQ FLOAT 8 Evaluación ponderada por equipos. AUX_INDICADOR: Entidad que almacena las metas de los indicadores de rendimiento. CAMPO indicadorId TIPO DE DATO INT LONGITUD DESCRIPCION 4 Identificador de indicador. 8 Indicador del año. indicadorAnio FLOAT indicadorMes FLOAT 8 indicadorNivelSatisfaccion FLOAT 8 indicadorNumeroCurso FLOAT 8 Indicador de mes. Meta del indicador de nivel de satisfacción por año y mes. Meta del indicador de número de 151 cursos por año y mes. indicadorNumeroParticipantes FLOAT 8 indicadorIngresos FLOAT 8 indicadorHoras FLOAT 8 Meta del indicador de número de participantes por año y mes. Meta del indicador del número de ingresos por año y mes. Meta del indicador del número de horas dictadas por año y mes. AUX_PROGRAMA: Entidad que almacena el detalle de los programas de los cursos dictados por la CCC. CAMPO ID_PROG NOMBRE_PROGRAMA TIPO DE DATO LONGITUD DESCRIPCION INT 4 Identificador de programa. VARCHAR 60 Nombre de programa. AUX_TIPO_CURSO: Entidad que almacena los tipos de curso dictados por la CCC. CAMPO ID_TIPO_CURSO DETALLE_TIPO_CURSO TIPO DE DATO LONGITUD INT 4 DESCRIPCION Identificador de tipo de curso. VARCHAR 60 Detalle del tipo de curso. 152 ANEXO D MODELO RELACIONAL DE LA BASE DE DATOS DEL DATAMART (dmCCC) int <pk> varchar(80) varchar(80) varchar(260) DIM_CURSO id_cur descripcion_tipo_cur nombre_programa_cur nombre_cur int <pk> datetime varchar(250) varchar(40) int int int int FK_FACT_EVA_TIE_EVA_DIM_TIEM FK_FACT_REN_TIE_REN_DIM_TIEM FK_FACT_ACA_TIE_ACA_DIM_TIEM FK_FACT_EVA_REFERENCE_DIM_CURS FK_FACT_EVA_EVAL_EVA_DIM_EVAL id_eval int <pk> nombre_evaluable varchar(30) DIM_EVALUABLE FK_FACT_ENC_REFERENCE_DIM_CURS FK_FACT_ENC_REFERENCE_DIM_TIEM FK_FACT_REN_REFERENCE_DIM_CURS id_tie fecha_tie horario_tie nombre_mes_tie bimestre_tie trimestre_tie semestre_tie anio_tie DIM_TIEMPO FK_FACT_ACA_CUR_ACA_DIM_CURS int int int int int int int decimal(9,2) decimal(9,2) decimal(9,2) decimal(15,2) smallint smallint int int int int int int int int int id_ins id_eval id_cur id_tie DIM_id_cur DIM_id_ins ind_satisfaccion int int int int int int decimal(9,2) FACT_EVALUACION id_item id_cur id_tie id_ins DIM_id_cur DIM_id_tie DIM_id_ins DIM_id_item num_estudiantes_enc <pk> <pk> <pk,fk1> <pk> <fk2> <fk3> <pk> <pk,fk1> <pk,fk3> <pk,fk2> <pk> <fk4> <fk5> <pk> <pk,fk2> <pk> <pk,fk1> <fk3> <fk4> <pk> <pk> <pk> <pk> <fk1> <fk2> <fk3> <fk4> int int int int int int int decimal(9,2) int decimal(9,2) FACT_ENCUESTA id_cur id_ins id_tie id_met DIM_id_cur DIM_id_ins num_participantes_cur tot_ingresos_cur tot_horas_cur ind_satisfaccion_cur FACT_RENDIMIENTO id_ins id_cli id_tie id_cur id_obs DIM_id_ins DIM_id_obs est_nota est_asistencia est_descuento est_ingreso est_diploma_entrega est_parqueadero FACT_ACADEMICO FK_FACT_EVA_REFERENCE_DIM_INST FK_FACT_ENC_REFERENCE_DIM_INST FK_FACT_ENC_REFERENCE_DIM_ITEM id_item int <pk> nombre_item varchar(30) nombre_subitem varchar(50) DIM_ITEM FK_FACT_REN_REFERENCE_DIM_INST int <pk> int int varchar(80) varchar(50) varchar(50) varchar(80) id_ins nombre_ins titulo_principal_ins maestria_principal_ins titulo_adicional_uno_ins area_experiencia_ins anio_experiencia_ins int <p varchar(80) varchar(50) varchar(50) varchar(50) varchar(50) varchar(20) DIM_INSTRUCTOR id_cli id_emp_cli id_est nombre_emp_cli representante_emp_cli tipo_convenio_emp_cli nombre_est DIM_CLIENTE int <pk> id_obs nombre_obs varchar(50) DIM_OBSERVACION FK_FACT_ACA_REFERENCE_DIM_OBSE FK_FACT_ACA_REFERENCE_DIM_INST FK_FACT_ACA_CLI_ACA_DIM_CLIE MODELO RELACIONAL DE LA BASE DE DATOS DEL DATAMART (dmCCC) ANEXO D 153 154 ANEXO E MODELO RELACIONAL DE LA BASE DE DATOS DE SEGURIDAD (dmSeguridad) COD_USU ID_PER APELLIDOS_USU NOMBRES_USU CONTRASENIA_USU FECHA_INI_USU FECHA_FIN_USU ESTADO_USU varchar(20) <pk> int <fk> varchar(50) varchar(50) varchar(20) datetime datetime bit SEG_USUARIO FK_SEG_USUA_TIENE_SEG_PERF ID_PER NOMBRE_PER DESCRIPCION_PER ESTADO_PER ID_OPC PADRE_OPC NOMBRE_OPC VALOR_OPC HABILITADO_OPC ORDEN_PADRE_OPC ORDEN_OPC int <pk> int <fk> varchar(100) varchar(200) bit int int SEG_OPCION FK_SEG_OPCI_OPCION_X__SEG_OPCI int <pk,fk2> ID_OPC ID_PER int <pk,fk1> habilitado bit SEG_OPCION_X_PERFIL FK_SEG_OPCI_OPCION_X__SEG_PERF int <pk> varchar(20) varchar(50) bit SEG_PERFIL FK_SEG_OPCI_PERTENECE_SEG_OPCI MODELO RELACIONAL DE LA BASE DE DATOS DE SEGURIDAD (dmSeguridad) ANEXO E 155 156 ANEXO F CREACION DEL PAQUETE DTS PARA EXTRACCION, TRANSFORMACION Y CARGA 157 ANEXO F CREACION DEL PAQUETE DTSX PARA EXTRACCION, TRANSFORMACION Y CARGA Creación del Paquete DTSX Este paquete contiene dos grupos de tareas definidas de la siguiente manera: Cargar base de datos Transformación: Tarea 1: Limpiar base Transformación Tipo: Tarea de Ejecución SQL Descripción: elimina los datos de las tablas de la base de datos intermedia dmTransformacion para la extracción y transformación de información previa a la carga del datamart. Tarea 2: Cargar AUX_EVALUACION Tipo: Tarea de Flujo de datos Descripción: carga la información de la tabla EVALUACION de la base de datos SISCEC a la tabla AUX_EVALUACION de la base de datos dmTransformacion. La figura 2 muestra el proceso de carga de la tabla AUX_EVALUACION. Figura 1: proceso de carga de la tabla AUX_EVALUACION 158 Tarea 3: Cargar AUX_EMPRESA Tipo: Tarea de Flujo de datos Descripción: carga la información de la tabla EMPRESA de la base de datos SISCEC a la tabla AUX_EMPRESA de la base de datos dmTransformacion. La figura 2 muestra el proceso de carga de la tabla AUX_EMPRESA. Figura 2: proceso de carga de la tabla AUX_EMPRESA Tarea 4: Cargar AUX_ESTUDIANTE Tipo: Tarea de Flujo de datos Descripción: carga la información de la tabla ESTUDIANTE de la base de datos SISCEC a la tabla AUX_ESTUDIANTE de la base de datos dmTransformacion. La figura 3 muestra el proceso de carga de la tabla AUX_ESTUDIANTE. Figura 3: proceso de carga de la tabla AUX_ESTUDIANTE Tarea 5: Cargar AUX_TIPO_CURSO Tipo: Tarea de Flujo de datos 159 Descripción: carga la información de la tabla TIPO de la base de datos SISCEC a la tabla AUX_TIPO_CURSO de la base de datos dmTransformacion. La figura 4 muestra el proceso de carga de la tabla AUX_TIPO_CURSO. Figura 4: proceso de carga de la tabla AUX_TIPO_CURSO Tarea 6: Cargar INDICADORES Tipo: Tarea de Flujo de datos Descripción: carga la información de las metas mensuales de los principales indicadores de medición de rendimiento ubicados en el archivo INDICADORESCCC.xls a la tabla AUX_INDICADOR de la base de datos dmTransformacion. La figura 5 muestra el proceso de carga de la tabla AUX_INDICADOR. Figura 5: proceso de carga de la tabla AUX_INDICADOR Tarea 7: Cargar AUX_PROGRAMA Tipo: Tarea de Flujo de datos 160 Descripción: carga la información de la tabla PROGRAMA de la base de datos SISCEC a la tabla AUX_PROGRAMA de la base de datos dmTransformacion. La figura 6 muestra el proceso de carga de la tabla AUX_PROGRAMA. Figura 6: proceso de carga de la tabla AUX_PROGRAMA Tarea 8: Normalizar tabla Curso Tipo: Tarea de Ejecución SQL Descripción: esta tarea se encarga de normalizar la tabla CURSO de la base de datos SISCEC y copiarlos en las tablas AUX_CURSO y AUX_DETALLE_CURSO de la base de datos dmTransformacion, tomando en cuenta el nombre único de cada curso y el código del primer curso dictado con su nombre. Tarea 9: Cargar AUX_CURSO_POR_ESTUDIANTE Tipo: Tarea de Flujo de datos Descripción: carga la información de la tabla CURSO_POR_ESTUDIANTE de la base de datos SISCEC a la tabla AUX_CURSO_POR_ESTUDIANTE de la base de datos dmTransformacion. La figura 7 muestra el proceso de carga de la tabla AUX_PROGRAMA. 161 Figura 7: proceso de carga de la tabla AUX_CURSO_POR_ESTUDIANTE Tarea 10: Cargar AUX_EVALUABLE Tipo: Tarea de Flujo de datos Descripción: carga la información de la tabla EVALUABLE de la base de datos SISCEC a la tabla AUX_EVALUABLE de la base de datos dmTransformacion. La figura 8 muestra el proceso de carga de la tabla AUX_EVALUABLE. Figura 8: proceso de carga de la tabla AUX_EVALUABLE Cargar Datamart: Tarea 11: Limpiar Datamart 162 Tipo: Tarea de Ejecución SQL Descripción: elimina los datos de las tablas de la base de datos dmCCC Tarea 12: Cargar dimensión DIM_TIEMPO Tipo: Tarea de Flujo de datos Descripción: carga la información de la fecha de inicio de los cursos o eventos de capacitación realizados a partir del año 2005 que se encuentra en la tabla AUX_DETALLE_CURSO de la base de datos dmTransformacion a la dimensión DIM_ TIEMPO de la base de datos dmCCC. La figura 9 muestra el proceso de carga de la dimensión DIM_TIEMPO. Figura 9: proceso de carga de la dimensión DIM_TIEMPO Tarea 13: Cargar dimensión DIM_CURSO Tipo: Tarea de Flujo de datos Descripción: carga la información de cursos o eventos de capacitación, tipos de cursos y programas de la tabla AUX_CURSO, AUX_TIPO_CURSO, AUX_PROGRAMA de la base de datos dmTransformacion a la dimensión DIM_CURSO de la base de datos dmCCC. La figura 10 muestra el proceso de carga de la dimensión DIM_CURSO. 163 Figura 10: proceso de carga de la dimensión DIM_CURSO Tarea 14: Cargar dimensión DIM_OBSERVACION Tipo: Tarea de Flujo de datos Descripción: carga la información de observaciones de los estudiantes que han tomado un curso determinado de la tabla AUX_CURSO_POR ESTUDIANTE de la base de datos dmTransformacion a la dimensión DIM_CURSO de la base de datos dmCCC. La figura 11 muestra el proceso de carga de la dimensión DIM_ OBSERVACION. Figura 11: proceso de carga de la dimensión DIM_ OBSERVACION Tarea 15: Cargar dimensión DIM_CLIENTE Tipo: Tarea de Flujo de datos 164 Descripción: carga la información de los clientes, empresas y tipos de empresa que han AUX_ESTUDIANTE, tomado un curso AUX_EMPRESA determinado de la de base la de tabla datos dmTransformacion y TIPO_EMP de la base de datos SISCEC a la dimensión DIM_CLIENTE de la base de datos dmCCC. La figura 12 muestra el proceso de carga de la dimensión DIM_CLIENTE. Figura 12: proceso de carga de la dimensión DIM_CLIENTE Tarea 16: Cargar dimensión DIM_INSTRUCTOR Tipo: Tarea de Flujo de datos Descripción: carga la información de los instructores que han dictado un determinado curso o evento de capacitación de la tabla INSTRUCTOR de la base de datos SISCEC a la dimensión DIM_INSTRUCTOR de la base de datos dmCCC. La figura 13 muestra el proceso de carga de la dimensión DIM_INSTRUCTOR. 165 Figura 13: proceso de carga de la dimensión DIM_INSTRUCTOR Tarea 17: Preparar Encuesta - Cargar DIM_ITEM Tipo: Tarea de Ejecución SQL Descripción: prepara y carga la información de las encuestas generadas en cursos o eventos de capacitación a partir del año 2005 almacenados en la tabla AUX_EVALUACION de la base de datos dmTransformacion a la dimensión DIM_ITEM de la base de datos dmCCC. Tarea 19: Cargar dimensión DIM_EVALUABLE Tipo: Tarea de Flujo de datos Descripción: carga la información de los ítems de evalacuión de un curso o evento de capacitación determinado descritos en la tabla AUX_EVALUABLE de la base de datos dmTransformacion a la dimensión DIM_EVALUABLE de la base de datos dmCCC. La figura 14 muestra el proceso de carga de la dimensión DIM_ EVALUABLE. 166 Figura 14: proceso de carga de la dimensión DIM_EVALUABLE Tarea 20: Cargar FACT_EVALUACION Tipo: Tarea de Ejecución SQL Descripción: carga la información de la evaluación promedio según ítems de evaluación en un curso o evento de capacitación determinado, a partir de las tablas CASOEVALUACION y PREGUNTAENCUESTA de la base de datos SISCEC o AUX_EVALUACION de la base de datos dmTransformacion a tabla de hechos FACT_EVALUACION de la base de datos dmCCC. Tarea 21: Cargar FACT_ENCUESTA Tipo: Tarea de Ejecución SQL Descripción: carga la información del número de estudiantes según ítems de medición de encuestas generadas en un curso o evento de capacitación a partir de las tablas INFORMACIONGENERAL de la base de datos SISCEC o de la tablas la base de datos AUX_EVALUACION, AUX_DETALLE_CURSO de dmTransformacion a FACT_EVALUACION de la base de datos dmCCC. tabla de hechos 167 Tarea 22: Cargar FACT_ACADEMICO Tipo: Tarea de Flujo de datos Descripción: prepara y carga la información de estudiantes, nota promedio, descuentos, asistencia promedio, emisión de diplomas y solicitud de parqueaderos solicitados por los estudiantes en un curso o evento de capacitación a partir del año 2005 almacenados en la tabla AUX_DETALLE_CURSO, AUX_CURSO_POR_ESTUDIANTE de la base de datos dmTransformacion a tabla de hechos FACT_EVALUACION de la base de datos dmCCC. La figura 15 muestra el proceso de carga de la tabla de hechos FACT_EVALUACION. Figura 15: proceso de carga de la tabla de hechos FACT_ACADEMICO Tarea 23: Cargar FACT_RENDIMIENTO Tipo: Tarea de Flujo de datos Descripción: prepara y carga la información de los principales indicadores de medición de rendimiento de la CCC y las metas respectivas generadas en los diferentes cursos a partir del año 2005 almacenados en la tabla AUX_EVALUACION, AUX_DETALLE_CURSO, AUX_CURSO_POR_ESTUDIANTE, AUX_INDICADOR de la base de datos 168 dmTransformacion a tabla de hechos FACT_EVALUACION de la base de datos dmCCC. La figura 16 muestra el proceso de carga de la tabla de hechos FACT_RENDIMIENTO. Figura 16: proceso de carga de la tabla de hechos FACT_RENDIMIENTO Tarea 24: Actualizar Metas FACT_RENDIMIENTO Tipo: Tarea de Ejecución SQL Descripción: carga la información de las metas según indicadores de rendimiento de los cursos o eventos de capaitación durante el transcurso del tiempo almacenados en la tabla AUX_DETALLE_CURSO, AUX_INDICADOR de la base de datos dmTransformacion a tabla de hechos FACT_ RENDIMIENTO de la base de datos dmCCC. 169 ANEXO G DICCIONARIO DE DATOS DE LA BASE DE DATOS SISCEC 170 ANEXO G DICCIONARIO DE DATOS DE LA BASE DE DATOS SISCEC La base de datos SISCEC está compuesta de las siguientes tablas: ASISTENCIA: Entidad que guarda los registros de asistencia del estudiante de acuerdo al curso al que asiste. CAMPO Id_Curso Id_Est Id_Contador valor TIPO DE DATO INTEGER INTEGER INTEGER CHAR LONGITUD DESCRIPCION 4 Identificador de Curso. 4 Identificador del estudiante. 4 Identificador del contador. 5 Estado de la asistencia del estudiante. CHEQUE: Entidad que contiene la información referente al cheque emitido. CAMPO ID_CHEQUE NUMERO1 BANCO TIPO DE DATO INTEGER INTEGER CHAR LONGITUD 4 4 65 DESCRIPCION Identificador de cheque. Número de cheque. Banco de emisión del cheque. CONTRATO: Entidad que almacena la información de las cláusulas del contrato que tiene el CEC con el instructor. CAMPO ID_CONTRATO ID_INSTRUCTOR NUMERO_CONTRATO COSTO_HORA FECHA_FIRMA ESTADO1 TIPO DE DATO INTEGER INTEGER CHAR DECIMAL DATETIME TEXT LONGITUD 4 4 25 5 8 16 DESCRIPCION Identificador del contrato. Identificador del instructor. Número de contrato establecido. Valor de la hora de clase. Fecha de firma del contrato. Estado actual del contrato. CURSO: Entidad que almacena toda la información referente al evento de capacitación a ser dictado. CAMPO ID_CURSO ID_EMPRESA ID_EVALUACION ID_TIPO_CURSO ID_PROG MANUAL FECHA_MANUAL TIPO DE DATO INTEGER INTEGER INTEGER INTEGER INTEGER INTEGER DATETIME LONGITUD 4 4 4 4 4 4 8 DESCRIPCION Identificador de curso. Identificador de empresa. Identificador de evaluación. Identificador de tipo de curso. Identificador de programa. Nombre del manual de referencia. Fecha de actualización del manual. 171 ID_INSTRUCTOR NOMBRE_CURSO DURACION_CURSO FECHA_INICIO_CURSO FECHA_FIN_CURSO COSTO_CURSO LUGAR_CURSO CONTENIDO_CURSO INTEGER CHAR NUMERIC DATETIME DATETIME FLOAT TEXT VARCHAR 4 256 9 8 8 8 16 200 DESCRIPCION_HORARIO DIAS TEXT TEXT 16 16 ID_MANUAL_INSTRUCTOR Duracion_Dias costo_hora costo_total INTEGER INTEGER FLOAT FLOAT 4 4 8 8 Identificador de instructor. Nombre asignado del curso. Días de duración del curso. Fecha de inicio del curso Fecha de fin de curso. Costo total del curso. Lugar en donde se dictará el curso. Contenido del curso. Horario en el que se dictará el curso. Días en los que se dictará el curso. Identificador del manuela del instructor. Duración del curso en días. Costo del curso por hora dictada. Costo total del curso. CURSO_POR_ESTUDIANTE: Entidad que lleva un registro del los estudiantes matriculados por cada curso dictado e información relacionada con el financiamiento del evento de capacitación. CAMPO ID_EST ID_CURSO NOTA ASISTENCIA NOTA_PROGRAMA Diploma TIPO DE DATO INTEGER INTEGER FLOAT FLOAT FLOAT VARCHAR LONGITUD 4 4 8 8 8 20 Parqueadero VARCHAR 5 Como Id_saldo Observación Descuento Abono Factura Comprob Factura1 Abono1 VARCHAR INTEGER VARCHAR FLOAT FLOAT CHAR CHAR VARCHAR FLOAT 50 4 50 8 8 10 10 50 8 DESCRIPCION Identificador de estudiante. Identificador del curso. Nota obtenida por el estudiante. Asistencia del estudiante al curso. Nota con respecto al curso. Estado del diploma a emitirse. Señala si el estudiante hará uso del parqueadero. Medio de difusión por el cual se entero del curso. Identificador del saldo a cancelar. Observación referente al curso. Cantidad a ser descontada al estudiante. Abono cancelado por el estudiante. Número de factura. Comprobante de pago del estudiante. Identificador de la factura. Abono cancelado. DESCUENTO: Entidad que contiene el valor del descuento aplicado a un estudiante específico. CAMPO TIPO DE DATO LONGITUD ID_DESCUENTO INTEGER 4 ID_FACTURA INTEGER 4 DESCRIPCION Identificador del detalle de la factura sujeta a descuento. Identificador de la factura sujeta a descuento. 172 VALOR1 MONEY 4 DESCRIPCION_TIPO_PAGO CHAR Valor del descuento. Descripción del tipo de pago realizado. 65 DETALLE_FACTURA: Entidad que guarda el detalle completo de la factura emitida al estudiante, lo que incluye el precio a cancelar y el tipo de pago. CAMPO TIPO DE DATO LONGITUD ID_DETALLE ID_FACTURA NUMERO1 DESCRIPCION_TIPO_PAGO PRECIO INTEGER INTEGER INTEGER CHAR DECIMAL 4 4 4 65 5 DESCRIPCION Identificador de detalle de factura. Identificador de factura. Detalle del tipo de pago. Precio total de la factura. DIPLOMA: Entidad que almacena la información requerida para realizar la impresión de los diplomas a ser otorgados. CAMPO ID_DIPLOMA ID_EST FECHA_EMISION FECHA_ENTREGA ESTADO_DIPLOM A TIPO DE DATO INTEGER INTEGER DATETIME DATETIME LONGITUD DESCRIPCION 4 Identificador de diploma. Identificador del estudiante titular del 4 diploma. 8 Fecha de emisión del diploma. 8 Fecha de entrega del diploma TEXT 16 Estado actual del diploma emitido. EMPRESA: Entidad que almacena los datos correspondientes a la empresa que solicita un evento de capacitación. CAMPO ID_EMPRESA ID_TIPO NOMBRE_EMPRE TIPO DE DATO INTEGER INTEGER CHAR DIRECCION_EMPRE TELEFONO_EMPRE RUC_EMPRE TELEFONO1_EMPRE TELEFONO2_EMPRE FAX_EMPRE CHAR CHAR CHAR CHAR CHAR CHAR EMAIL_EMPRE CHAR REPRESENTANTE_EMPR E CHAR TIPO_EMPRESA CHAR LONGITU D DESCRIPCION 4 Identificador de la empresa. 4 Identificador de tipo de empresa. 65 Nombre de la empresa. Dirección de ubicación de la 85 empresa. 15 Teléfono principal de la empresa. 15 Número de RUC de la empresa. 15 Teléfono secundario 1 15 Teléfono secundario 2 15 Número de fax Dirección de correo electrónico de la 40 empresa. Nombre del representante legal de la empresa. 45 20 Descripción del tipo de empresa. 173 ESTUDIANTE: Entidad que guarda los datos personales del estudiante e información domiciliaria. ID_EST ID_EMPRESA APELLIDO_EST NOMBRE_EST CI_EST TIPO DE DATO INTEGER INTEGER CHAR CHAR CHAR TELEF_CASA__EST CHAR 12 TELEF_OFICI_EST CHAR TELEF_CELULAR_EST CHAR 12 12 DIRECCION_EST EMAIL_EST Nombres_completos 65 47 60 CAMPO CHAR CHAR CHAR LONGITUD 4 4 40 65 20 DESCRIPCION Identificador único de estudiante. Identificador de la empresa. Apellidos del estudiante Nombres del estudiante. Número de cédula del estudiante Número convencional del domicilio del estudiante Número del lugar de trabajo del estudiante Número de celular del estudiante. Dirección de domicilio actual del estudiante. Dirección de correo electrónico. Apellidos y nombres del estudiante. EVALUACION: Entidad encargada de almacenar los datos correspondientes a las evaluaciones realizadas al evento de capacitación. CAMPO ID_EVALUACION TIPO DE DATO INTEGER EVALUACION_EST FLOAT EVALUACION_COOR FLOAT EVALUACION_SCLIENTE FLOAT ENLACE_ARCHIVO nVARCHAR EVALUACION_4 EVALUACION_5 PROMEDIO FLOAT FLOAT FLOAT EVALUACION_EQ FLOAT MAS FLOAT FEM FLOAT RECSI FLOAT RECNO EPUBLICA EPRIVADA FLOAT FLOAT FLOAT PRENSA REVISTAS FLOAT FLOAT LONGITUD DESCRIPCION 4 Identificador de evaluación. Evaluación ponderada por 8 instalaciones Evaluación ponderada por 8 organización y desarrollo Evaluación ponderada por material didáctico 8 Nombre del archivo de 100 evaluación. Evaluación ponderada por 8 instructor 8 Evaluación ponderada por diseño 8 Evaluación total general Evaluación ponderada por 8 equipos Número de personas de género 8 masculino. Número de personas de género femenino. 8 Número de personas que 8 recomendarían el curso. Número de personas que no 8 recomendarían el curso. 8 Personas por empresa pública. 8 Personas por empresa privada. Personas que se enteraron por 8 prensa. 8 Personas que se enteraron por 174 REFERENCIA FLOAT 8 WEB FLOAT 8 EMAIL FLOAT 8 OTROS FLOAT 8 MENOSV FLOAT 8 ENTREV FLOAT 8 ENTRET FLOAT 8 MAST FLOAT 8 MASC EJECUTIVO FLOAT FLOAT 8 8 MEDIOS FLOAT 8 OPERATIVO OTRO FLOAT FLOAT 8 8 revistas. Personas que se enteraron por referencia personal. Personas que se enteraron por la Web. Personas que se enteraron por Email. Personas que se enteraron por otros medios. Personas con edad menor a veINTEGERe años. Personas con edad entre 20 a 25 años. Personas con edad entre 26 a 35 años. Personas con edad mayor a 35 años. Personas con edad mayor a 45 años. Personas con cargo ejecutivo. Personas con cargos de nivel medio. Personas con cargos de nivel operativo. Personas con otros cargos. FACTURA: Entidad que almacena la información necesaria para la emisión de la factura al estudiante. CAMPO ID_FACTURA ID_EST TIPO DE DATO INTEGER INTEGER FECHA_EMISION_FACTURA NOMBRE DIRECCION CIUDAD TELEFONO DATETIME CHAR CHAR CHAR CHAR DEPENDENCIA SUBTOTAL TOTAL CHAR decimal decimal LONGITUD DESCRIPCION 4 Identificador único de factura 4 Identificador único de estudiante Fecha en la que se emitió la factura. 8 65 Nombre del cliente 65 Dirección del cliente 65 Ciudad de emisión de factura 12 Teléfono del cliente Razón de dependencia del estudiante. 65 5 Valor subtotal a cancelar 5 Valor total a cancelar FECHA_CURSO: Entidad que registra la fecha de inicio del evento de capacitación de un curso en particular. CAMPO Id_curso Id_fecha Fecha TIPO DE DATO INTEGER INTEGER DATETIME LONGITUD DESCRIPCION 4 Clave primaria, identificador único de curso. 4 Clave primaria, identificador de la fecha 8 Fecha de realización del curso. 175 GENERA: Entidad que guarda las referencias del curso y la correspondiente factura emitida por concepto de pago. CAMPO ID_CURSO ID_FACTURA TIPO DE DATO INTEGER INTEGER LONGITUD 4 4 DESCRIPCION Identificador de curso. Identificador de factura. IMPUESTO: Entidad que guarda los datos correspondientes al impuesto generado por concepto del pago del curso. CAMPO ID_IMPUESTO ID_FACTURA VALOR1 TIPO DE DATO INTEGER INTEGER MONEY DESCRIPCION_TIPO_PAGO CHAR LONGITUD 4 4 8 65 DESCRIPCION Identificador de impuesto. Identificador de factura. Valor del impuesto. Descripción del tipo de pago. INSTRUCTOR: Entidad que guarda los datos personales del instructor, la información domiciliaria y los estudios realizados por el mismo. CAMPO ID_INSTRUCTOR TIPO DE DATO INTEGER LONGITUD DESCRIPCION 4 Identificador de instructor. Nombres completos del NOMBRE_INST CHAR 65 instructor. Número telefónico domiciliario TELEF_CASA_INST CHAR 12 del instructor. TELEF_OFICI_INST CHAR 12 Número telefónico de oficina. TELEF_CELULAR_INST CHAR 12 Número telefónico móvil. Dirección residencia del DIRECCION_INST CHAR 65 instructor. Dirección de correo electrónico EMAIL_INST CHAR 50 personal. Dirección de correo electrónico EMAIL2_INST CHAR 50 opcional. Número de cédula de CI_INST CHAR 11 ciudadanía. Titulo VARCHAR 50 Título principal obtenido. titulo2 VARCHAR 50 Título adicional obtenido. maestria1 VARCHAR 50 Maestría principal obtenida. maestria2 VARCHAR 50 Maestría adicional obtenida. otro1 VARCHAR 50 Título opcional 1. otro2 VARCHAR 50 Título opcional 2. Años de experiencia adquirida Experiencia VARCHAR 10 por el instructor. Área de especialización del Area VARCHAR 50 instructor. Valor 1 sí competencia del marketing_ventas SMALLINTEGER 2 instructor es en el área de marketing. 176 Proyectos SMALLINTEGER 2 administracion SMALLINTEGER 2 Finanzas SMALLINTEGER 2 Hr. SMALLINTEGER 2 Leyes SMALLINTEGER 2 Procesos SMALLINTEGER 2 Redes SMALLINTEGER 2 Bases SMALLINTEGER 2 Windows SMALLINTEGER 2 Linux SMALLINTEGER 2 Tcp SMALLINTEGER 2 programacion_web SMALLINTEGER 2 Visual SMALLINTEGER 2 Ofimatica SMALLINTEGER 2 diseno_web SMALLINTEGER 2 proyectos_informaticos SMALLINTEGER 2 Otros VARCHAR 70 Valor 1 sí competencia del instructor es en el área de proyectos. Valor 1 sí competencia del instructor es en el área de administración. Valor 1 sí competencia del instructor es en el área de finanzas. Valor 1 sí competencia del instructor es en el área de recursos humanos. Valor 1 sí competencia del instructor es en el área de leyes. Valor 1 sí competencia del instructor es en el área de procesos. Valor 1 sí competencia del instructor es en el área de redes. Valor 1 sí competencia del instructor es en el área de bases de datos. Valor 1 sí competencia del instructor es en el área de SO Windows. Valor 1 sí competencia del instructor es en el área de SO Linux. Valor 1 sí competencia del instructor es en el área de TCP. Valor 1 sí competencia del instructor es en el área de Programación Web. Valor 1 sí competencia del instructor es en el área de Visual. Valor 1 sí competencia del instructor es en el área de Ofimática. Valor 1 sí competencia del instructor es en el área de Diseño Web. Valor 1 sí competencia del instructor es en el área de Proyectos Informáticos. Valor 1 sí competencia del instructor se encuentra en otras áreas de interés. PROGRAMA: Entidad que guarda el nombre y el detalle de la programación del curso a ser dictado. 177 TIPO DE DATO INTEGER CHAR CAMPO ID_PROG NOMBRE_PROGRAMA LONGITUD DESCRIPCION 4 Identificación de programa. 60 Nombre asignado al programa. Detalle aspectos importantes del 55 programa. DESCRIPCION_PROGRAMA CHAR ROL_DE_PAGOS: Entidad que almacena los datos del rol de pagos de cada empleado de la organización. TIPO DE CAMPO DATO ID_ROL_PAGOS INTEGER ID_TIPO_PAGO INTEGER TIPO_EMPLEADO CHAR RESPONSABLE LONGITUD 4 4 15 CHAR 45 DESCRIPCION Identificador de rol de pagos. Identificador de tipo de pago. Descripción de tipo de empleado. Responsable de la emisión del rol de pagos. SALDO: Entidad que almacena los datos del saldo adeudado por el estudiante y lo números de comprobantes emitidos. CAMPO ID_SALDO ID_EST ABONO SALDO1 NUMERO_FACTURA TIPO DE DATO LONGITUD INTEGER 4 INTEGER 4 decimal 5 decimal 5 TEXT 16 COMENTARIO TEXT NUM_COMPROBANTE INTEGER 16 4 DESCRIPCION Identificador de saldo. Identificador de estudiante. Abono cancelado por el estudiante. Saldo pendiente. Número de factura Comentario correspondiente al pago. Número de comprobante emitido. TIPO: Entidad que guarda la descripción de los tipos de curso disponibles. CAMPO ID_TIPO_CURSO DESCRIPCION_TIPO TIPO DE DATO INTEGER CHAR LONGITUD 4 55 DESCRIPCION Identificador de tipo de curso. Descripción de tipo de curso. TIPO_EMP: Entidad que guarda la descripción de los tipos de empresa que requieren de un evento de capacitación. CAMPO ID_TIPO TIPO_EMPRESA TIPO DE DATO INTEGER TEXT LONGITUD DESCRIPCION 4 Identificador de tipo de empresa. 16 Descripción de tipo de empresa. 178 TIPO _ PAGO: Entidad que guarda los datos correspondientes al tipo de pago realizado por el estudiante. CAMPO ID_TIPO_PAGO ID_CHEQUE ID_FACTURA TIPO DESCRIPCION_TIPO_PAGO TIPO DE DATO INTEGER INTEGER INTEGER CHAR CHAR LONGITUD DESCRIPCION 4 Identificador de tipo de pago. 4 Identificador de cheque. 4 Identificador de factura. 45 Tipo de pago. 65 Descripción de tipo de pago