Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productivity in Construction Companies: Knowledge acquired from the databases Hernando Camargo Mila, Rogelio Flórez Díaz. Resumen l artículo presenta la forma como se pueden identificar los puntos de control en los procesos civiles que pueden apoyar la toma de decisiones en pro de una mayor productividad, a partir de realizar minería de datos a las bases de datos de una empresa de construcción. Se presenta la metodología para realizar estos estudios, los conceptos de descubrimiento de conocimiento y minería de datos (Knowledge Discovery and Data Mining - KDD), y las estrategias y ventajas para realizar estos estudios de productividad. E Abstract he article presents the way to identify checkpoints in civil works that may support decision making to get a greater productivity. The methodology to perform these studies is introduced. Furthermore, concepts on knowledge discovery and data mining KDD, strategies and advantages for productivity studies, are introduced also. T Keywords: Productivity in building companies, Knowledge discovery, KDD, Data Mining, CRISP-DM. Palabras Clave: Productividad en empresas de construcción, descubrimiento de datos, KDD, minería de datos, CRISP-DM. Recibido: Febrero 28 de 2013 Aprobado: Mayo 10 de 2014 Tipo de artículo: Investigación cientifica y tecnológica terminada. Afiliación Institucional de los autores: Universidad El Bosque. Los autores declaran que no tienen conflicto de interés. Hernando Camargo Mila, Rogelio Flórez Díaz. Introducción E n temas de negocio, siempre ha sido atractivo el estudio productividad en las diferentes actividades económicas, el cómo lograr que en los diferentes proyectos las tareas se hagan de una manera mas rápida, o el cómo se pueden disminuir el consumo de recursos físicos para reducir los gastos excesivos. En el presente articulo se pretende explicar como utilizando conceptos de minería de datos se puede lograr obtener resultados de productividad en una actividad económica especifica, la construcción. Como se habla de minería de datos, se debe hablar también de un proceso que nos dicte las tareas específicas que se deben seguir para llegar a realizar una buena investigación de este tipo, como de una metodología que nos ayude a organizar estas tareas. El proceso que mas se implementa en proyectos de minería de datos es el KDD (descubrimiento de conocimiento en bases de datos), y la metodología que soporta las fases de este procedimiento es CRISP-DM. Como todos estos procesos se deben soportar a partir de unos datos almacenados, se hablara a partir de la información suministrada por una empresa Colombiana, que realiza proyectos de Construcción, con mas de 7 años de experiencia. Y se tendrá en cuenta como definición de productividad, el como realizar más actividades con la misma cantidad de recursos, o hacer lo mismo con menor capital o recursos físicos [1]. KDD El concepto de KDD (descubrimiento de conocimiento en bases de datos) nace poco después del concepto de minería de datos, ya que la minería de datos se convierte en una de las fases fundamentales en todo el proceso de adquirir conocimiento en los datos almacenado, así estos conceptos se hallan utilizado como uno solo [2]. Fig 1. Proceso de KDD KDD Sistema de Información Prepareción de los datos Minería de datos Las fases que se muestran en la Fig. 1, tienen como finalidad adquirir patrones valiosos [2], novedosos, potencialmente útiles y, en última estancia comprensibles a partir de los datos, por lo tanto, el conocimiento extraído a través de este proceso debe tener las siguientes propiedades: • Válido: esto hace referencia a que los patrones deben seguir siendo precisos para datos nuevos (con cierto grado de certidumbre). • Novedoso: Que aporte conocimiento tanto para el sistema, como para el usuario. • Potencialmente útil: se deben buscar beneficios para el usuario. • Comprensible: una información incomprensible para Patrones Evaluación/ Interpretación/ Visualización Conocimiento Con lo anterior se puede observar que el proceso de KDD, pretende obtener la información que ayude a los usuarios a generar mejores resultados, ya sea por medio de una o varias iteraciones, la información obtenida siempre será evaluada y posible de interpretar. CRISP-DM Como se aclaró anteriormente, la metodología que soporta estas fases de desarrollo de KDD es CRISP – DM, esta metodología se basa en un modelo de jerarquías, que se trabaja en diferentes niveles, estos niveles son: fases, tareas genéricas, tareas especializadas e instancias de proceso. el usuario no es la mas útil, por esto todas las fases deben apuntar a generar conocimiento comprensible. 74 ¦ Revista de Tecnología ¦ Journal of Technology ¦ Volumen 13 ¦ Número 1 ¦ Págs. 73-77 Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Fig. 2 ciclo de vida Metodología CRISP-DM previas para cerciorarse que se hayan tenido en cuenta detalles importantes en la resolución de los problemas. • Despliegue: el despliegue del modelo no significa Comprensión del negocio Comprensión de los datos Preparación de los datos Despliegue Modelo Datos Evaluación la culminación del proyecto ya que se debe proporcionar la información suficiente al cliente para que pueda tomar acciones. Aunque esto depende de los requerimientos realizados ya que el despliegue puede ser un simple reporte o un proceso repetible de minería de datos a través de la empresa, por esto es muy común que el cliente y no el analista de datos sea el que realice esta fase. De esta manera se asegura que ninguna de las partes fundamentales de un proyecto de minería de datos se quede por fuera de análisis [3]. Minería de datos Las diferentes fases del ciclo de vida de la metodología CRISP - DM (Fig. 2) [3] que deben ser analizadas son: • Entendimiento del negocio: en esta fase se busca generar un completo entendimiento del negocio para convertirlo en un problema de minería de datos creando un plan para alcanzar los objetivos. • Entendimiento de datos: en esta fase se obtienen la información relacionada con el problema descrito y se procede a familiarizarse con esta en información para identificar posibles problemas como calidad de los datos, para detectar diferentes conjuntos que permitan generar ideas sobre el curso del proyecto y encontrar información desconocida. • Preparación de los datos: se preparan los datos para ser la fuente de información del modelo de datos, se puede dividir en varias tareas como tabulaciones, documentación, selección de atributos, transformación y limpieza. • Modelado: esta fase se relaciona directamente con la fase de preparación de datos, ya que es de ahí donde se aplican diferentes técnicas para generar modelos de información. • Evaluación: es una de las fases más importantes en esta metodología ya que es acá donde se verifica que los objetivos del negocio estén cubiertos dentro del modelo analizado luego de las tareas de minería, en diferentes ocasiones es necesario retornar a las fases Con los procesos de minería de datos, se demuestra que utilizar los datos que se guarda en las diferentes bases de datos, es útil para obtener información que no se conocía, este conocimiento se encuentra de diferentes maneras, en forma de patrones, de relaciones, reglas de inferencias de datos, o en forma de una descripción mas concisa. Estos modelos pueden presentarse de dos tipos: • Predictivos: estos modelos pretenden encontrar valores futuros o desconocidos de variables de interés, que se denominan variables objetivo o dependientes, por medio de otras variables de la base de datos que se denominan, variables independientes o predictivas. Un modelo predictivo puede ser el que se adopta para estimar el comportamiento de un producto en base a las ventas de otro producto que se pueda asemejar a este. • Descriptivo: este modelo se identifica por obtener patrones que explican o resumen los datos, es decir, sirve para explotar las propiedades de los datos examinados, no para predecir nuevos datos. Por ejemplo, los supermercados buscan obtener información sobre los gustos de las personas, para dar diferentes ofertas y organizar de manera diferente sus estanterías, dando de esta manera una experiencia diferente a la hora de mercar de sus clientes. Para cumplir los objetivos de la minería de datos, existen diferentes tareas que se pueden realizar, en el caso de las Revista de Tecnología ¦ Journal of Technology ¦ Volumen 13 ¦ Número 1 ¦ Págs. 73-77 ¦ 75 Hernando Camargo Mila, Rogelio Flórez Díaz. tareas predictivas son la clasificación y la regresión, y en el caso de las tareas descriptivas son el agrupamiento, las reglas de asociación y el análisis correlacional. En el caso del presente escrito, el tipo de minería de datos que se muestra en el proceso es, descriptiva, por medio de la tarea de clustering o agrupamiento. Esta tarea se utiliza gracias al algoritmo de K-Means que según las variables de entrada, busca encontrar grupos comunes que describen comportamientos característicos [2]. Productividad Haciendo referencia a la introducción, la productividad se puede definir cómo realizar más actividades con la misma cantidad de recursos, o hacer lo mismo con menor capital o recursos físicos. De esta manera se muestra, que existen dos factores fundamentales cuando se habla de productividad, el tiempo como factor de medición, y los recursos físicos dentro, de lo cuales alocamos la mano de obra. Factores que analizados de una manera correcta nos lleva a descifrar las claves de la productividad. Algunas de las estrategias para mejorar la productividad, son: • Asesoramiento práctico (ayudar en el “cómo hacer” en lugar de imponer el “usted debe”). • Identificar y aplicar soluciones de bajo costo. • Desarrollar soluciones orientadas a mejorar simultáneamente las condiciones de trabajo, la calidad de la construcción y la productividad del trabajo. • Concebir mejoras adaptadas a las situaciones reales totales. • Poner énfasis en la obtención de resultados concretos. • Vincular las condiciones de trabajo con los demás objetivos gerenciales. • Usar como técnica el aprendizaje a través de la práctica. • Alentar el intercambio de experiencias. • Promover la participación de los trabajadores. • Diseñar correctamente los puestos de trabajo. • Usar eficientemente la maquinaria. • Tener servicios de bienestar en el lugar de trabajo. • Mejorar las condiciones y el medio ambiente de trabajo. Las ventajas que se obtienen a partir de una mayor productividad pueden ser: • Mayor competitividad. • Satisfacción del cliente. • Confianza de clientes y proveedores. • Permanencia en el mercado a mediano y largo plazo. • Disminución y cumplimiento de los plazos de entrega. • Disminución de costos. • Uso eficiente de los recursos naturales y de la fuerza laboral, logrando con esto la reducción de desperdicios de materias primas. • Eliminación de desplazamientos innecesarios de materiales y de trabajadores. • Evita atrasos en las fechas de terminación de cada elemento en la obra. • La reducción de los tiempos muertos de máquinas. • Ahorro de energía. • Se incorporan medidas serias para controlar los efectos negativos para el entorno de accidentes imprevistos. • Recuperación de espacios de trabajo inutilizados. • Disminución de la rotación del personal. Mejoramiento continuo del capital humano y de un entorno que fomente la Creatividad y la innovación, así como las relaciones laborales entre trabajadores [1]. Gracias a estos conceptos, se puede enfocar de mejor manera la investigación y lograr los resultados que se esperan. Desarrollo Teniendo claros lo conceptos anteriormente descritos se puede comenzar al desarrollo del análisis, donde siguiendo los puntos de la metodología se debe: • Entender el negocio: en el entendimiento se sacan conclusiones sobre que factores que se deben tener en cuenta en el análisis. Para este caso los factores son los trabajadores, las tareas que realizan, El tiempo de desarrollo, las horas extras, y la propuesta presentada. • Entendimiento de los datos: se verifica que la informa- ción de los factores que se deben analizar estén completa. • Preparación de los datos: si en el entendimiento de los datos se muestra una falta de información, se complementa en esta sección • Modelado: en esta sección se toma la decisión de que tarea de minería de datos se utiliza, como se 76 ¦ Revista de Tecnología ¦ Journal of Technology ¦ Volumen 13 ¦ Número 1 ¦ Págs. 73-77 Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos nombro anteriormente la tarea es agrupamiento, que, con la información de entrada que se toman de la preparación de datos, trabajadores, tareas, tiempo de desarrollo, y horas extras, se describe el comportamiento de desarrollo de las tareas por cada uno de los grupos de trabajo. • Evaluación: en esta fase se evalúa si los clusters dados por las tareas de minerías si son suficientemente claros para describir los grupos de trabajos. • Despliegue: al tener claro que la descripción es correcta se comienzan a tomar, decisiones acerca de los grupos de trabajo como se trabaja mas rápido teniendo en cuenta las tareas especificas. Conclusión Conocer con anterioridad los recursos necesarios para la ejecución de las tareas permite realizar una estimación de costo beneficio, proyectando de manera correcta si es conveniente realizar la tarea o no, de esta forma se ayuda a cuidar las utilidades de la empresa. La fase de la metodología, entendimiento del negocio, permitió identifica cual era la forma, en que se medía la productividad en la empresa, de esta manera se introdujeron los nuevos conceptos de productividad para ser más certeros en la toma de decisiones. En la fase de la metodología, Preparación de datos, se permitió crear un modelo de base de datos, en donde se almaceno de una forma más organizada la información de las obras civiles de la empresa. La técnica de Clustering, es muy adecuada para describir los recursos necesarios para el desarrollo de las tareas de construcción. Si se realiza esta tarea con más frecuencia e introduciendo más información al modelo, el conocimiento adquirido va a ser cada vez más valioso. Los indicadores de productividad adquiridos, por la descripción de cada uno de los clusters, permiten evidenciar si se están utilizando demasiados recursos en el desarrollo de las tareas. Referencias [1] R. Alpuche Sánchez, Impacto de la calidad total y la productividad en las empresas de construcción, [ONLINE] http://catarina.udlap.mx/u_dl_a/tales/ documentos/lic/alpuche_s_r/capitulo3.pdf [2] J. Hernández Orallo, M. J. Ramírez Quintana, C. Ferri Ramírez. Introducción a la Minería de Datos , Madrid: Pearson Prentice Hall, 2007. [3] http://www.crisp-dm.org/download.htm Los Autores Hernando Camargo Mila Docente del programa Ingeniería de Sistemas de la Universidad El Bosque desde 2002 a la fecha, Distinción de la Universidad El Bosque a la “Excelencia en la Docencia” en el año 2004. Especialista en informática y Ciencias de la Computación, Fundación Universitaria Konrad Lorenz, Bogotá 2006. Ingeniero de Sistemas, Universidad Nacional de Colombia, Bogotá 1988, Docente del Programa en la Ingeniería de Sistemas de la Fundación Universitaria Konrad Lorenz desde 2001 a la fecha y desde el 2003 Coordinador Académico de las Facultades de Ingeniería y Matemáticas. Jefe del Departamento de Sistemas de Petróleos Colombianos Limited, Bogotá, desde 1990 a 1998. Gerencia de Proyectos informáticos en Comcel durante 1998. Gerencia de Proyectos de Outsourcing informático en Gestiontek S.A.,desde 1999 a 2001. hercamil@gmail.com. Carrera 7B Bis 132-11, Bloque M, Piso 3, Bogotá D.C. Grupo de Investigación OSIRIS. Rogelio Florez Diaz Ingeniero de sistemas de la Universidad El Bosque, Analista de inteligencia de negocios en DirectTV. Revista de Tecnología ¦ Journal of Technology ¦ Volumen 13 ¦ Número 1 ¦ Págs. 73-77 ¦ 77