Anexo P. Post-Mortem En el presente documento se encuentra la comparación de lo que se propuso en la propuesta de grado frente a lo trabajado realmente en el transcurso del trabajo de grado. 1. Metodología propuesta vs. Metodología realmente utilizada Por ser un proyecto de aplicación práctica, se propuso trabajar con la metodología SEMMA, la cual se enfoca en los aspectos del desarrollo del modelo de minería de datos, pero paralelamente se trabajó con la metodología CRIPS DM ya que profundiza en mayor detalle sobre las tareas y actividades a ejecutar en cada etapa del proyecto. Se encontró que la metodología CRISP DM se ajustó mejor a los procesos y objetivos específicos definidos en el trabajo de grado y además por ser un modelo estándar y de libre uso hace que el proyecto se cumpla de forma exitosa, a diferencia de la metodología SEMMA, que fue creada para trabajar con el software de minería de datos de la compañía SAS y por ende hay fases que no están incluidas y son necesarias para el presente trabajo de grado, como lo es la fase de desarrollo. Las actividades realizadas en el trabajo de grado fueron propuestas por la metodología CRIPS DM, así que fue necesario ser más profundo y distribuir de forma equitativa las actividades propuestas en cada fase metodológica de dicha metodología, donde se enfocaba en realizar avances al director cada 15 días con el fin de recibir una retroalimentación en cada fase metodológica. El proyecto tuvo los siguientes cambios con respecto a lo propuesto: • Fase Entender el problema: Esta fase fue adicionada con el fin de profundizar y distribuir de una forma equitativa las actividades propuestas, se utiliza en la metodología CRIPS DM. Se adicionaron actividades de recopilación de información y definición del plan de trabajo y la necesidad de utilizar minería de datos en el proyecto. • Fase muestreo: Esta fase fue cambiada por la fase Entender los datos con el fin de seguir las actividades propuestas por la metodología CRISP DM adicionaron actividades de exploración, recopilación y descripción de datos con el fin de identificar la información pertinente para el proyecto. • Fase Exploración (Explore) y Manipulación (Modify): Esta fase fue cambiada por la fase de Preparación de datos propuesta por la metodología CRISP DM, donde se adicionaron actividades como la selección de las técnicas de minería para aplicar el problema de calidad del aire. • Fase Modelado (Model): Esta fase sigue igual a la propuesta del trabajo de grado, salvo por la distribución de actividades que se hacen junto con la fase anterior. Adicionalmente se creó un plan de diseño de pruebas con el fin de que en esta fase se utilizaran criterios para seleccionar los modelos generados por las técnicas escogidas. • Fase Evaluación: Para esta fase se adicionaron actividades de reunión con el equipo de alertas tempranas de la Secretaria Distrital del Ambiente, donde se validaron los patrones extraídos con expertos en calidad del aire, adicionalmente con trabajos de grado realizados con otras técnicas estadísticas y el conjunto de datos de prueba y del año 2013 para ver la evolución de la dinámica de la ciudad en este tiempo. Adicionalmente se seleccionaron los modelos adecuados para crear la base de conocimiento y con base en los patrones comunes por los demás modelos. • Fase Implementación del Prototipo: Esta fase continua con todas las actividades propuestas y adicionalmente se hace una evaluación de las características de los modelos y la aplicación por parte de la RMCAB en especial el grupo de alertas tempranas. También fue necesario crear un documento con la descripción de la arquitectura, manuales de administración y el manual de instalación. 2. Actividades propuestas vs. Actividades realizadas Las actividades propuestas no fueron suficientes para el desarrollo del trabajo de grado, ya que fue necesario utilizarlas como sub-procesos donde en cada uno de ellos se encontraban actividades detalladas y de complejidad media, a su vez fue necesario redistribuir dichas actividades en cada fase metodológica con el fin de solucionar el proyecto de forma más organizada y con tiempos de respuesta acordes a los parámetros de entrega. A continuación se presentan las actividades adicionales a la propuesta entregada por cada fase metodológica: FASE 1 FASE 2 FASE 3 • Extraer información de las herramientas de Minería de datos que mas se ajuste al TG • Probar algunas herramientas • Elegir las herramientas y definir la función que van a desepeñar • Recopilar los registros historicos. • Entrevistar al coordinador de la RMCAB para conocer la necesidad de ellos con base en los objetivos del proyecto. • Consultar a expertos acerca del tratamiento que se le deben hacer a los datos para que sean de utilidad para ellos. • Seleccionar las tecnicas de Mineria de Datos. FASE 4 FASE 5 FASE 6 • Realizar la planeación de un diseño de pruebas para los modelos. • Definir el conjunto de prueba y entrenamiento para los modelos • Evaluar los resultados de acuerdo a los trabajos relacionados y expertos en calidad del aire. • Seleccionar los modelos apropiados para la base de conocimiento. • crear la base de conocimiento. • Validación y verificación del protótipo por parte de la RMCAB. 3. Efectividad en la estimación de tiempos del proyecto Según lo estipulado en la propuesta de grado, el proyecto comenzaba el 15 de julio del 2013 para ser terminado el 9 de mayo del 2014 con el fin de tener un tiempo y espacio prudente para realizar cambios o pruebas en cada actividad y así mismo repetir el proceso. Sin embargo de acuerdo a las actividades adicionales identificadas y desarrolladas en el transcurso del proyecto y el retraso en la entrega de los registros históricos. Realmente el proyecto comenzó el 31 de julio del 2013 y termina el 25 de mayo del 2014, sin embargo cabe recalcar que en el periodo del año 2013 las actividades realizadas fueron más que todo de investigación y levantamiento de requerimientos, lo cual no fue de trabajo intenso en dicho año. Las actividades que tomaron más tiempo de lo planeado fueron las siguientes: Actividad Realizar el proceso de preparación de datos (construcción de la vista minable ) para cada técnica de Minería de Datos Tiempo utilizado propuesto Tiempo utilizado en realidad 19 días 30 días Calibrar y seleccionar los modelos de minería de datos pertenecientes a las técnicas seleccionadas 11 días Creación del documento Plan de Pruebas 12 días 25 días 16 días 4. Costo estimado vs. Costo real del proyecto El costo estimado en la propuesta de trabajo de grado fue de 17’449.000 peso y el costo real del proyecto es de 12’462.000, viendo que la inversión fue mucho menor de lo que se presupuestó y esto es por el bajo del costo del hardware ya que se descontó los 3.000.000 de pesos que costaba el equipo. A continuación se presentan los costos reales: Ítem Trabajo Directora TG Asesorías y reuniones con el equipo de la RMCAB Asesorías Minería de Datos Papelería Transporte Alimentación Servicios Públicos Valor Total Detalle 660.000 22 horas durante el TG 360.000 4 horas durante el TG por cada profesional 170.000 120.000 4 horas durante el TG Fotocopias, impresiones y tinta 500.000 2.392.000 2.900.000 2 diarios por 5 días a la semana y algunos sábados. 6 días durante la semana por 20 semanas 6 días durante la semana por 20 semanas Software Hardware Trabajo del estudiante Total 1.300.000 120.000 4.000.000 12.502.000 Microsoft Office, Data tools, spss de ibm, Enterprise Architect, Sistema Operativo Windows Disco Duro Extraíble Aproximadamente 400 horas 5. Efectividad en la estimación y mitigación de los riesgos del proyecto. Las estrategias propuestas para mitigar los riesgos fueron suficientes para desarrollar el trabajo de grado y se cumplieron a cabalidad. A continuación se presentan los posibles riesgos definidos en la propuesta del trabajo de grado: . Los riesgos que se presentaron durante el trabajo de grado fueron los siguientes: Responsables de la mitigación del riesgo Riesgo Ocurrido Como se mitigó Requisito de Ingles Inscribir en inter-semestral 2013 -2 y en el semestre 20133 inglés para cumplir los requisitos. Estudiante de TG No saber el detalle de los datos entregados Se contactó al encargado de la entrega de los datos y se recibieron asesorías con la directora de TG Estudiante y director de TG Daño al software del equipo donde se estaba realizando el TG Cargar de nuevo el sistema operativo y mantener en la nube y un disco externo el buckup del TG Estudiante TG