BIGDATA y MACHINE LEARNING Dr. Ing. José Gómez Avila INSTRUCTIVO N° 6: PREPARACION DE DATOS EN SPARK – PYTHON - REGRESION Retomamos el trabajo con apache Spark y esta vez se llegará al manejo de DataFrames y aplicaremos una regresión. 1. Realizas la creación de node “Ejercicio_4”: 2. Exploramos la data BIGDATA y MACHINE LEARNING 3. Seguimos explorando los datos a nivel de estructura: 4. Si queremos extraer columnas por separado: Dr. Ing. José Gómez Avila BIGDATA y MACHINE LEARNING Dr. Ing. José Gómez Avila 5. Cuando creamos gráficas y explorar los datos. En ocasiones encontramos valores con caracteres especiales así podemos retirarlo con el sistema de formato. BIGDATA y MACHINE LEARNING 6. Aplicamos regresión para probar las tendencias. Dr. Ing. José Gómez Avila