Anexo P. Post-Mortem - Trabajos de Grado | Ingeniería de Sistemas

Anuncio
Anexo P. Post-Mortem
En el presente documento se encuentra la comparación de lo que se propuso en la
propuesta de grado frente a lo trabajado realmente en el transcurso del trabajo de grado.
1. Metodología propuesta vs. Metodología realmente utilizada
Por ser un proyecto de aplicación práctica, se propuso trabajar con la metodología
SEMMA, la cual se enfoca en los aspectos del desarrollo del modelo de minería de
datos, pero paralelamente se trabajó con la metodología CRIPS DM ya que profundiza
en mayor detalle sobre las tareas y actividades a ejecutar en cada etapa del proyecto. Se
encontró que la metodología CRISP DM se ajustó mejor a los procesos y objetivos
específicos definidos en el trabajo de grado y además por ser un modelo estándar y de
libre uso hace que el proyecto se cumpla de forma exitosa, a diferencia de la
metodología SEMMA, que fue creada para trabajar con el software de minería de datos
de la compañía SAS y por ende hay fases que no están incluidas y son necesarias para el
presente trabajo de grado, como lo es la fase de desarrollo.
Las actividades realizadas en el trabajo de grado fueron propuestas por la metodología
CRIPS DM, así que fue necesario ser más profundo y distribuir de forma equitativa las
actividades propuestas en cada fase metodológica de dicha metodología, donde se
enfocaba en realizar avances al director cada 15 días con el fin de recibir una
retroalimentación en cada fase metodológica.
El proyecto tuvo los siguientes cambios con respecto a lo propuesto:
•
Fase Entender el problema: Esta fase fue adicionada con el fin de profundizar y
distribuir de una forma equitativa las actividades propuestas, se utiliza en la
metodología CRIPS DM. Se adicionaron actividades de recopilación de
información y definición del plan de trabajo y la necesidad de utilizar minería de
datos en el proyecto.
•
Fase muestreo: Esta fase fue cambiada por la fase Entender los datos con el fin
de seguir las actividades propuestas por la metodología CRISP DM adicionaron
actividades de exploración, recopilación y descripción de datos con el fin de
identificar la información pertinente para el proyecto.
•
Fase Exploración (Explore) y Manipulación (Modify): Esta fase fue cambiada
por la fase de Preparación de datos propuesta por la metodología CRISP DM,
donde se adicionaron actividades como la selección de las técnicas de minería
para aplicar el problema de calidad del aire.
•
Fase Modelado (Model): Esta fase sigue igual a la propuesta del trabajo de
grado, salvo por la distribución de actividades que se hacen junto con la fase
anterior. Adicionalmente se creó un plan de diseño de pruebas con el fin de que
en esta fase se utilizaran criterios para seleccionar los modelos generados por las
técnicas escogidas.
•
Fase Evaluación: Para esta fase se adicionaron actividades de reunión con el
equipo de alertas tempranas de la Secretaria Distrital del Ambiente, donde se
validaron los patrones extraídos con expertos en calidad del aire, adicionalmente
con trabajos de grado realizados con otras técnicas estadísticas y el conjunto de
datos de prueba y del año 2013 para ver la evolución de la dinámica de la ciudad
en este tiempo. Adicionalmente se seleccionaron los modelos adecuados para
crear la base de conocimiento y con base en los patrones comunes por los demás
modelos.
•
Fase Implementación del Prototipo: Esta fase continua con todas las
actividades propuestas y adicionalmente se hace una evaluación de las
características de los modelos y la aplicación por parte de la RMCAB en
especial el grupo de alertas tempranas. También fue necesario crear un
documento con la descripción de la arquitectura, manuales de administración y
el manual de instalación.
2. Actividades propuestas vs. Actividades realizadas
Las actividades propuestas no fueron suficientes para el desarrollo del trabajo de grado,
ya que fue necesario utilizarlas como sub-procesos donde en cada uno de ellos se
encontraban actividades detalladas y de complejidad media, a su vez fue necesario
redistribuir dichas actividades en cada fase metodológica con el fin de solucionar el
proyecto de forma más organizada y con tiempos de respuesta acordes a los parámetros
de entrega. A continuación se presentan las actividades adicionales a la propuesta
entregada por cada fase metodológica:
FASE 1
FASE 2
FASE 3
• Extraer información
de las herramientas
de Minería de datos
que mas se ajuste al
TG
• Probar
algunas
herramientas
• Elegir
las
herramientas
y
definir la función
que
van
a
desepeñar
• Recopilar
los
registros historicos.
• Entrevistar
al
coordinador de la
RMCAB
para
conocer
la
necesidad de ellos
con base en los
objetivos
del
proyecto.
• Consultar
a
expertos acerca del
tratamiento que se
le deben hacer a los
datos para que sean
de utilidad para
ellos.
• Seleccionar
las
tecnicas de Mineria
de Datos.
FASE 4
FASE 5
FASE 6
• Realizar
la
planeación de un
diseño de pruebas
para los modelos.
• Definir el conjunto
de
prueba
y
entrenamiento para
los modelos
• Evaluar
los
resultados
de
acuerdo
a
los
trabajos
relacionados
y
expertos en calidad
del aire.
• Seleccionar
los
modelos apropiados
para la base de
conocimiento.
• crear la base de
conocimiento.
• Validación
y
verificación
del
protótipo por parte
de la RMCAB.
3. Efectividad en la estimación de tiempos del proyecto
Según lo estipulado en la propuesta de grado, el proyecto comenzaba el 15 de julio del
2013 para ser terminado el 9 de mayo del 2014 con el fin de tener un tiempo y espacio
prudente para realizar cambios o pruebas en cada actividad y así mismo repetir el
proceso. Sin embargo de acuerdo a las actividades adicionales identificadas y
desarrolladas en el transcurso del proyecto y el retraso en la entrega de los registros
históricos. Realmente el proyecto comenzó el 31 de julio del 2013 y termina el 25 de
mayo del 2014, sin embargo cabe recalcar que en el periodo del año 2013 las
actividades realizadas fueron más que todo de investigación y levantamiento de
requerimientos, lo cual no fue de trabajo intenso en dicho año.
Las actividades que tomaron más tiempo de lo planeado fueron las siguientes:
Actividad
Realizar el proceso de preparación
de datos (construcción de la vista
minable ) para cada técnica de
Minería de Datos
Tiempo utilizado
propuesto
Tiempo utilizado en realidad
19 días
30 días
Calibrar y seleccionar los modelos
de minería de datos pertenecientes a
las técnicas seleccionadas
11 días
Creación del documento Plan de
Pruebas
12 días
25 días
16 días
4. Costo estimado vs. Costo real del proyecto
El costo estimado en la propuesta de trabajo de grado fue de 17’449.000 peso y el costo
real del proyecto es de 12’462.000, viendo que la inversión fue mucho menor de lo que
se presupuestó y esto es por el bajo del costo del hardware ya que se descontó los
3.000.000 de pesos que costaba el equipo. A continuación se presentan los costos reales:
Ítem
Trabajo Directora
TG
Asesorías y
reuniones con el
equipo de la
RMCAB
Asesorías Minería
de Datos
Papelería
Transporte
Alimentación
Servicios Públicos
Valor Total
Detalle
660.000
22 horas durante el TG
360.000
4 horas durante el TG por cada profesional
170.000
120.000
4 horas durante el TG
Fotocopias, impresiones y tinta
500.000
2.392.000
2.900.000
2 diarios por 5 días a la semana y algunos sábados.
6 días durante la semana por 20 semanas
6 días durante la semana por 20 semanas
Software
Hardware
Trabajo del
estudiante
Total
1.300.000
120.000
4.000.000
12.502.000
Microsoft Office, Data tools, spss de ibm, Enterprise
Architect, Sistema Operativo Windows
Disco Duro Extraíble
Aproximadamente 400 horas
5. Efectividad en la estimación y mitigación de los riesgos del proyecto.
Las estrategias propuestas para mitigar los riesgos fueron suficientes para desarrollar el
trabajo de grado y se cumplieron a cabalidad. A continuación se presentan los posibles
riesgos definidos en la propuesta del trabajo de grado:
. Los riesgos que se presentaron durante el trabajo de grado fueron los siguientes:
Responsables de la
mitigación del riesgo
Riesgo Ocurrido
Como se mitigó
Requisito de Ingles
Inscribir en inter-semestral
2013 -2 y en el semestre 20133 inglés para cumplir los
requisitos.
Estudiante de TG
No saber el detalle de
los datos entregados
Se contactó al encargado de la
entrega de los datos y se
recibieron asesorías con la
directora de TG
Estudiante y director
de TG
Daño al software del
equipo donde se estaba
realizando el TG
Cargar de nuevo el sistema
operativo y mantener en la
nube y un disco externo el
buckup del TG
Estudiante TG
Descargar