“Machine Learning Mina Antamina” Contrato N° CL02302100 ANEXO 5: ANALISIS DE LOS PARAMETROS NULOS SNC Lavalin Perú S.A. Figura 1. Diagrama de Barras de Valores no nulos (azul) y nulos (blanco) j hy th • Los datos generales de la Matriz Base de Machine Learning son: ➢ La cantidad de filas es 13,103. ➢ La cantidad de columnas es 29. ➢ La cantidad de registros es 379,987. ➢ La cantidad de registros nulos es 349,998. ➢ La cantidad de registros válidos es 29,989. ➢ La cantidad de registros válidos y útiles es 0. • En el gráfico de barras se evidencia lo siguiente: ➢ Hay gran cantidad de registros nulos de los parámetros. La cantidad de registro nulos de los parámetros es 349,998, lo cual equivale a 92.1% de la cantidad total de registros. ➢ El parámetro “DR” es el que tiene menor cantidad de registros nulos. ➢ Este cuenta con 59 registros nulos. ➢ No hay ninguna fila completa, ya que siempre hay registros con valores nulos. “Machine Learning Mina Antamina” Contrato N° CL02302100 ANEXO 5: ANALISIS DE LOS PARAMETROS NULOS Cantidad de Parámetros Nulos Cantidad de Filas Porcentaje de Filas 28/29 12,205 93.15% 8/29 491 3.75% 7/29 146 1.11% 12/29 95 0.73% 9/29 70 0.53% 10/29 57 0.44% 29/29 29 0.22% 13/29 4 0.03% 14/29 3 0.02% 11/29 3 0.02% Total de Filas 13,103 SNC Lavalin Perú S.A. 100% Tabla 1. El Cuadro detalla la cantidad de filas por cantidad de parámetros nulos • En el cuadro se evidencia lo siguiente: ➢ En 28 de 29 parámetros, se tiene 12,205 filas con valores nulos, lo cual equivale a 93.15% del total de filas. ➢ En 8 de 29 parámetros, se tiene 491 filas con valores nulos y lo cual equivale a 3.75% del total de filas. ➢ En 7 de 29 parámetros, se tiene 146 filas con valores nulos y lo cual equivale a 1.11% del total de filas. ➢ En 12 de 29 parámetros, se tiene 95 filas con valores nulos y lo cual equivale a 0.73% del total de filas. ➢ En 9 de 29 parámetros, se tiene 70 filas con valores nulos y lo cual equivale a 0.53% del total de filas. ➢ En 10 de 29 parámetros, se tiene 57 filas con valores nulos y lo cual equivale a 0.44% del total de filas. ➢ En 29 de 29 parámetros, se tiene 29 filas con valores nulos y lo cual equivale a 0.22% del total de filas. ➢ En 13 de 29 parámetros, se tiene 4 filas con valores nulos y lo cual equivale a 0.03% del total de filas. ➢ En 14 de 29 parámetros, se tiene 3 filas con valores nulos y lo cual equivale a 0.02% del total de filas. ➢ En 11 de 29 parámetros, se tiene 3 filas con valores nulos y lo cual equivale a 0.02% del total de filas.