Subido por olii olii

INSTRUCTIVO N 6

Anuncio
BIGDATA y MACHINE LEARNING
Dr. Ing. José Gómez Avila
INSTRUCTIVO N° 6:
PREPARACION DE DATOS EN SPARK – PYTHON - REGRESION
Retomamos el trabajo con apache Spark y esta vez se llegará al manejo de DataFrames y
aplicaremos una regresión.
1. Realizas la creación de node “Ejercicio_4”:
2. Exploramos la data
BIGDATA y MACHINE LEARNING
3. Seguimos explorando los datos a nivel de estructura:
4. Si queremos extraer columnas por separado:
Dr. Ing. José Gómez Avila
BIGDATA y MACHINE LEARNING
Dr. Ing. José Gómez Avila
5. Cuando creamos gráficas y explorar los datos.
En ocasiones encontramos valores con caracteres especiales así podemos retirarlo con el
sistema de formato.
BIGDATA y MACHINE LEARNING
6. Aplicamos regresión para probar las tendencias.
Dr. Ing. José Gómez Avila
Descargar