Subido por Willians Carlos Enciso Melgarejo

Anexo 5 Analisis de los Parametros Nulos

Anuncio
“Machine Learning Mina Antamina”
Contrato N° CL02302100
ANEXO 5:
ANALISIS DE LOS PARAMETROS NULOS
SNC Lavalin
Perú S.A.
Figura 1. Diagrama de Barras de Valores no nulos (azul) y nulos (blanco)
j hy th
•
Los datos generales de la Matriz Base de Machine Learning son:
➢ La cantidad de filas es 13,103.
➢ La cantidad de columnas es 29.
➢ La cantidad de registros es 379,987.
➢ La cantidad de registros nulos es 349,998.
➢ La cantidad de registros válidos es 29,989.
➢ La cantidad de registros válidos y útiles es 0.
•
En el gráfico de barras se evidencia lo siguiente:
➢ Hay gran cantidad de registros nulos de los parámetros. La cantidad de registro
nulos de los parámetros es 349,998, lo cual equivale a 92.1% de la cantidad total
de registros.
➢ El parámetro “DR” es el que tiene menor cantidad de registros nulos.
➢ Este cuenta con 59 registros nulos.
➢ No hay ninguna fila completa, ya que siempre hay registros con valores nulos.
“Machine Learning Mina Antamina”
Contrato N° CL02302100
ANEXO 5:
ANALISIS DE LOS PARAMETROS NULOS
Cantidad de
Parámetros Nulos
Cantidad
de Filas
Porcentaje
de Filas
28/29
12,205
93.15%
8/29
491
3.75%
7/29
146
1.11%
12/29
95
0.73%
9/29
70
0.53%
10/29
57
0.44%
29/29
29
0.22%
13/29
4
0.03%
14/29
3
0.02%
11/29
3
0.02%
Total de Filas
13,103
SNC Lavalin
Perú S.A.
100%
Tabla 1. El Cuadro detalla la cantidad de filas por cantidad de parámetros nulos
•
En el cuadro se evidencia lo siguiente:
➢ En 28 de 29 parámetros, se tiene 12,205 filas con valores nulos, lo cual
equivale a 93.15% del total de filas.
➢ En 8 de 29 parámetros, se tiene 491 filas con valores nulos y lo cual equivale
a 3.75% del total de filas.
➢ En 7 de 29 parámetros, se tiene 146 filas con valores nulos y lo cual equivale
a 1.11% del total de filas.
➢ En 12 de 29 parámetros, se tiene 95 filas con valores nulos y lo cual equivale
a 0.73% del total de filas.
➢ En 9 de 29 parámetros, se tiene 70 filas con valores nulos y lo cual equivale
a 0.53% del total de filas.
➢ En 10 de 29 parámetros, se tiene 57 filas con valores nulos y lo cual equivale
a 0.44% del total de filas.
➢ En 29 de 29 parámetros, se tiene 29 filas con valores nulos y lo cual equivale
a 0.22% del total de filas.
➢ En 13 de 29 parámetros, se tiene 4 filas con valores nulos y lo cual equivale
a 0.03% del total de filas.
➢ En 14 de 29 parámetros, se tiene 3 filas con valores nulos y lo cual equivale
a 0.02% del total de filas.
➢ En 11 de 29 parámetros, se tiene 3 filas con valores nulos y lo cual equivale
a 0.02% del total de filas.
Descargar