UNIVERSIDAD CENTRAL MAESTRIA EN ANALÍTICA DE DATOS MÉTODOS ESTADÍSTICOS TEMA: MODELOS PREDICTIVOS EN LA PRODUCCIÓN DE FLORES DE INVERNADERO. DAVID AUGUSTO VILLABÓN BORJA dvillabonb@ucentral.edu.co BRYAN SMITH CASTRO PULIDO bcastrop@ucentral.edu.co ALEXIS YESID TARAZONA RINCON atarazonar@ucentral.edu.co BOGOTÁ SEPTIEMBRE DE 2021 INTRODUCCIÓN “Somos el país más importante en producción y exportación de flores de corte. Colombia como productor tiene para ser líder en el mundo por lo que estamos haciendo en innovación e investigación. Con la ventaja competitiva que tenemos los únicos países que nos pueden competir son Kenia y Etiopía, y, en nuestra región, Ecuador. El tema es buscar una combinación entre mecanización y mano de obra”, expresa el floricultor Carlos Manuel Uribe Lalinde. La calidad del suelo y el clima tropical colombiano han hecho de Colombia el segundo exportador de flores del mundo después de Países Bajos. Actualmente se generan cerca 140.000 empleos rurales formales directos, especialmente a madres cabeza de familia, así mismo el 95% de la producción de flores es exportada y representa el 75% de la carga aérea nacional, obteniendo aproximadamente entre 300 y 400 millones de dólares anuales en fletes aéreos. En cuanto a la exportación marítima de flores, Colombia se consolida como líder a nivel mundial. Debido a la importancia del mercado nace la necesidad de investigar aquel mundo floricultor, es importante resaltar en este punto que hasta el momento las teorías científicas, matemáticas y estadísticas no han logrado un avance significativo en los modelos predictivos que logren con asertividad identificar los factores que influyen en la producción de flores, más específicamente en los tiempos y números exactos de cosecha. Desde hace aproximadamente 6 años la empresa Sunshine Bouquet, se propuso como meta identificar y entender la información recolectada. El primer paso fundamental que se dio para lograr el objetivo fue generar procesos para recolectar datos que contemplen las variables del estudió, es una tarea difícil dado que el personal de apoyo como se indicó anteriormente es procedente de zonas donde el nivel de escolaridad es de primaria y un porcentaje ínfimo logra terminar su etapa de bachillerato. Una vez logrado este primer objetivo son muy pocos los escenarios en los que se utiliza la información para generar reflexiones y cuando se hace, carece de un análisis riguroso. No por falta de interés, sino por falta de experticia a la hora de hacer el análisis. De ahí surgió un interés particular por tomar la información que se recolecta y aplicar un análisis detallado, implementando herramientas adecuadas con profesionales idóneos; con el fin de construir un modelo predictivo para la producción de flores de diferentes especies, el cual facilite la toma de decisiones para las ventas y oportunidad de mercado que finalmente se traduce en mejores retornos económicos para la compañía. Sin embargo, pocos autores tratan o proponen teorías en este tema, un ejemplo de esto es “Hassett, M. R., & McGee, G. G. (2017). Negative binomial hurdle models to estimate flower production for native and nonnative northeastern shrub taxa.” Se Logra predecir el rendimiento a nivel nacional para cinco cultivos (trigo blanco, cebada de primavera, girasol, remolacha azucarera y papas) en tres distintos países. Aun así, estos modelos no son escalables en Colombia debido a sus particularidades climáticas. Dado todo lo anterior, se plantea en un primer escenario entender los factores climatológicos que se tienen en la sabana de Bogotá logrando mediante técnicas estadísticas, Redes Neuronales y/o series de tiempo establecer cuales de las variables tienen influencia en el comportamiento de las flores y su desarrollo fenológico. Finalmente, queremos un trabajo con responsabilidad y que, a su vez, genere resultados óptimos y eficaces que se traduzcan a un modelo de predicción de producción de flores de invernadero. Mediante la maestría y sus líneas de aplicación, trabajar en elegir el mejor camino para lo cual la base fundamental podría basarse en los conocimientos de computación, Big data, Machine Learning e inteligencia artificial que logren unificar las variables intangibles que rigen el mundo natural de flores los cuales logren explicar los ciclos productivos que aseguren el cumplimiento de las siembras en los tiempos establecidos y que respondan a las temporadas claves del negocio (San Valentín, en el mes de febrero; el día de la madre, en el mes de mayo; el día de Acción de Gracias, en el mes de noviembre y Navidad en diciembre). JUSTIFICACIÓN Las flores se comercializan en todo el mundo gracias a las ventajas competitivas y durante varias décadas han consolidado a la industria floricultora como líder en el sector agrícola, quizás requiera una actualización. Cultivos de rosas, claveles, crisantemos, alstroemerias, sunflower entre otras especies nativas, son algunas de las variedades plantadas en los campos colombianos. Algunos de los desafíos que se identifican en el sector se enfocan en lograr ser asertivos con la predicción de las producciones a largo plazo. Los ciclos productivos de las diferentes especies pueden variar de unas pocas semanas (9 a 12) para casos como el Sunflower o el Pompon y hasta ciclos de años 10 a 20 como es el caso de la Alstromeria y la Rosa. La finalidad de este trabajo es plantear modelos predictivos en productos cíclicos de corta duración. Se integrarán factores climáticos (Lluvia, Evapotranspiración, Temperatura, humedad, UV, radiación solar, entre otras) de la sabana de Bogotá usando estaciones meteorológicas propias que se ubican en cada una de las fincas de producción y asociadas a Canal Clima. Posteriormente se establecerá relación de estas variables descritas anteriormente con la producción de diferentes productos de la zona (Sunflower, Campanula y pompon). Como conclusiones esperamos obtener un modelo estadístico que pueda pronosticar la producción de dichas especies a 1 día y 1 semana, con el fin de lograr ofrecer a los clientes con anterioridad la demanda ofrecida, así como también la planeación de la mano de obra, talento humano e insumos que se requieren para el manejo de estas producciones. OBJETIVOS: General: - Establecer un modelo predictivo para la producción de flores de invernadero que integre factores climáticos y producciones históricas de especies de ciclo corto como sunflower, Campanula y pompón. Específicos: - Analizar el comportamiento climático de la sabana de Bogotá. Generar un índice que represente el comportamiento climático de la sabana de Bogotá. Establecer correlaciones entre producción de especies como Sunflower, Campanula, pompón y los índices climáticos de la sabana de Bogotá. Crear un modelo predictivo para la producción flores de especies como Sunflower, Campanula, pompón. Presentar un informe final de los resultados obtenidos. Origen de los datos: Este trabajo contiene dos fuentes de información: - Datos Climáticos, origen estaciones meteorológicas ubicadas en la sabana de Bogotá asociadas a Canal Clima. Datos de producción Real de especies de flor como Sunflower, Campanula y Pompón. Las dos bases de datos están indexadas en el tiempo desde el 2017. Base de datos de clima: Variables Estacion IdEstacion FechaHora Lluvia (mm) Temperatura (°C) Humedad(%) Vel_Viento (km/h) Dir_Viento (°) Evapotranspi racion (mm/h) Descripción Nombre común de la ubicación de la estación meteorológica Número de identificación de la estación meteorológica Fecha de observación La cantidad de lluvia registrada para el día en mm Temperatura en grados centígrados Tipo Cualitativa Cuantitativa Date Cuantitativa Cuantitativa Porcentaje de humedad La velocidad (km/h) de la ráfaga de viento Cuantitativa Cuantitativa La dirección de la ráfaga de viento en Grados Cuantitativa Cantidad de agua del suelo que vuelve a la atmósfera como Cuantitativa consecuencia de la evaporación y de la transpiración de las plantas (mm/h) Punto_Rocio (°C) UV (Index) Radiacion_S olar (w/m2) Presion Atmosferica (hPa) Temperatura en grados centígrados a la cual se debe enfriar el aire para que el vapor de agua se condense en rocío o escarcha Intensidad de radiación ultravioleta proveniente del Sol en la superficie terrestre con una escala que comienza en 0 y no está acotado superiormente conjunto de radiaciones electromagnéticas emitidas por el Sol (w/m²) Fuerza por unidad de superficie que ejerce el aire que forma la atmósfera sobre la superficie terrestre medida en en hectopascales (hPa) Cuantitativa Cuantitativa Cuantitativa Cuantitativa Base de datos de Produccion: Variables Finca Fecha Destino Flor Variedad Color Grado Cantidad Block Descripción Nombre común de la finca de producción Fecha de corte de la especie característica de flor exportable o flor nacional Especie y/o tipo de flor variedad de la especie y/o tipo de flor característica de color de la variedad característica de los tipos de tallos de las especies Produccion real en tallos por día Invernadero donde se cultivó la especie Tipo Cualitativa Date Cualitativa Cualitativa Cualitativa Cualitativa Cualitativa Cuantitativa Cualitativa Anexo1 FechaHora Lluvia (mm) Temperatura (°C) TemperaturaMaxima (°C) TemperaturaMinima (°C) Humedad(%) Vel_Viento (km/h) Max_Vel_Viento (km/h) Dir_Viento (°) Radiacion_Solar (w/m2) Punto_Rocio (°C) 01/01/2017 1:00 0 9,85 10,6 9,4 93 0 0 0 0 NULL 01/01/2017 2:00 0 8,85 9,2 8,6 95,17 0 0 0 0 NULL 01/01/2017 3:00 0,2 8,58 9,2 8,4 96,67 0 0 0 0 NULL 01/01/2017 4:00 0 9,52 9,9 8,8 94 0 0 22,5 0 NULL 01/01/2017 5:00 0 8,15 8,6 7,7 94,83 0 0 0 0 NULL 01/01/2017 6:00 0 8,88 9,4 7,9 96 0 0 7,5 0 NULL 01/01/2017 7:00 0 9,57 10,5 9 94,83 0 0 7,5 37,5 NULL 01/01/2017 8:00 0 12,4 14,1 10,9 91,83 0,8 3,2 33,75 168,83 NULL 01/01/2017 9:00 0 16,08 16,9 14,8 79,83 5,88 9,7 78,17 375 12,7 01/01/2017 10:00 0 17,38 18,2 16,8 74,17 5,07 6,4 116,67 534 12,73 12/31/2020 19:00 0 13,87 14 13,8 83,67 0 0 231 0 11,18 12/31/2020 20:00 0 13,72 13,8 13,7 84 0 0 231 0 11,1 12/31/2020 21:00 0 13,63 13,8 13,4 84 0 0 231 0 10,95 12/31/2020 22:00 0 13,42 13,5 13,4 84 0 0 231 0 10,78 12/31/2020 23:00 0 13,35 13,4 13,2 84 0 0 184 0 10,73 Anexo2 Finca ESMERALDA MED ESMERALDA MED ESMERALDA MED ESMERALDA MED ESMERALDA MED ESMERALDA MED ESMERALDA MED Fecha 08/30/2021 08/30/2021 08/30/2021 08/30/2021 08/30/2021 08/30/2021 08/30/2021 Destino Disponible Disponible Disponible Disponible Disponible Disponible Disponible Flor POM NOVELTY POM NOVELTY POM NOVELTY POM NOVELTY POM NOVELTY POM NOVELTY POM NOVELTY Variedad ALEGRIA ALEGRIA ALEGRIA ALEGRIA ALEGRIA ALEGRIA ALEGRIA Color Purple Purple Purple Purple Purple Purple Purple grado Select Fancy Select Fancy Fancy Select Fancy Cantidad 77 23 6 15 83 6 8 Block 28 28 21 21 28 28 28