! Predecir!la!deserción!usando!machine(learning! En! este! estudio! se! analizan! tres! métodos! de! machine! learning,! para! predecir!la!deserción!en!estudiantes!de!una!amplia!muestra!de!alumnos! inscritos! en! programas! de! educación! a! distancia! (ED)! en! China.! La! deserción! impacta! negativamente! tanto! a! las! instituciones! como! a! los! estudiantes.! A! las! primeras! les! representa! un! mayor! costo! por! alumno,! mientras!que!a!los!estudiantes!les!significa!un!desperdicio!de!su!inversión! y!esfuerzo!iniciales,!además!de!que!el!fenómeno!obstaculiza!la!aceptación! de!la!ED.!En!China,!la!deserción!en!educación!a!distancia!es!entre!10!y!35%! más! elevada! que! en! escenarios! presenciales,! por! lo! que! es! relevante! predecirla!e!implementar!intervenciones!que!la!reduzcan.!! Tradicionalmente,! el! problema! se! ha! abordado! a! través! del! análisis! de! datos! demográficos,! semestres! perdidos,! tasa! de! aprobación! y! área! de! formación.!El!investigador!por!lo!general!sigue!una!de!las!siguientes!líneas:! adquiere! datos! a! través! de! cuestionarios! y! corre! correlaciones! entre! variables;!identifica!tendencias!de!variables!demográficas;!ubica!razones! para! desertar! a! partir! de! transcripciones! de! entrevistas! con! análisis! de! textos;!o!bien,!combina!uno!de!estos!procedimientos.!Sin!embargo,!debido! a! las! amplias! diferencias! entre! estudiantes,! estas! estrategias! de! nivel! macro!resultan!poco!efectivas.!! El!primer!modelo!importante!para!representar!y!estudiar!la!deserción!fue! propuesto! por! Tinto.! Señala! que! los! antecedentes! familiares,! factores! individuales! y! educación! previa! son! relevantes.! Más! tarde,! Kember! concluyó!que!se!trata!de!un!proceso!en!el!que!diversas!variables!cambian! de!forma!dinámica!y!llevan!al!estudiante!a!tomar!la!decisión!de!desertar.! Bean!y!Metzner!crearon!un!modelo!que!incluye!calificaciones,!variables! académicas!como!hábitos!de!estudio,!resultados!psicológicos!y!variables! de!contexto,!como!estatus!económico.!! Con!base!en!estas!propuestas!previas,!Rovai!propuso!un!modelo!aplicable! a!la!ED.!Incluye!características!personales!como!edad!y!raza,!habilidades! para! aprender,! factores! internos! como! la! integración! social,! así! como! factores! externos,! como! el! nivel! económico.! Partiendo! de! este! modelo,! Park!estableció!una!serie!de!relaciones!entre!estos!factores!y!propuso!un! marco!teórico!aplicable!a!educación!en!línea.!! En!el!estudio,!se!trabajó!con!datos!de!la!Universidad!Abierta!de!China,!con! una!matrícula!de!3.59!millones!en!el!momento!de!la!investigación.!A!partir! de! información! disponible! en! registro! escolar! y! en! la! plataforma,! se! evaluaron! tres! métodos:! redes! neuronales,! árboles! de! decisión! y! redes! Bayesianas.!Una!vez!que!se!utilizaron!con!una!muestra!de!más!de!62!mil! estudiantes,! se! analizó! el! poder! predictivo! de! cada! uno! con! base! en! la! deserción!real.!Si!bien!los!tres!fueron!efectivos!para!predecir!la!deserción,! el!árbol!de!decisión!resultó!el!más!exacto.! ! Tan, M.; Shao, P. (2015). Prediction of student dropout in E-learning program through the use of machine learning method, International Journal of Technologies in Education, 10 (1), recuperado de: http://online-journals.org/index.php/ijet/article/view/4189 !