LaDeserción Estudiantil en la Universidad del Quindío 2008 UNIVERSIDAD DEL QUINDÍO Rectoría Deserción Estudiantil en la Universidad del Quindı́o Autores: Diana Milena Galvis Maria Dolly Garcia Luis Hernando Hurtado Abril de 2008 II P RESENTACI ÓN La deserción estudiantil en la población universitaria es una variable más de la problemática social del paı́s y un indicador de ineficiencia del Sistema Educativo en todos sus niveles, tiene una estrecha relación con la calidad de la Educación Básica y es por lo tanto un problema de interés y objeto de análisis para quienes dirigen la Educación Superior en Colombia. Este documento reúne los resultados de una investigación realizada durante el segundo semestre del año 2007, sobre el problema de la deserción en la población estudiantil de la Universidad del Quindı́o. La idea surgió de la Rectorı́a en acuerdo con el Grupo de Investigación y Asesorı́a en Estadı́stica y ante la necesidad de tener en un tiempo razonablemente corto elementos que permitan diseñar estrategias para enfrentar con alguna eficacia el problema. La estructura del documento es la siguiente: Un primer capı́tulo, resume la visión que se tiene del problema y en consecuencia, la forma de descomponerlo para su análisis. Un segundo capı́tulo, muestra en forma detallada, el desarrollo del trabajo. Un tercer capı́tulo de conclusiones y posibles guı́as para diseñar una estrategia que permita disminuir la deserción en la Universidad del Quindı́o. El cuarto capı́tulo, resume la metodologı́a estadı́stica utilizada. En estas condiciones, los primeros tres (3) capı́tulos reúnen el cuerpo del III P RESENTACI ÓN trabajo; el cuarto capı́tulo está dirigido solamente a quienes se interesen en el análisis estadı́stico. Más allá de producir un documento, en realidad lo que la Rectorı́a y el Grupo de Estadı́stica se proponen es generar una dinámica alrededor del tema de la deserción estudiantil, donde a través de diferentes metodologı́as se identifiquen factores determinantes y posibles estrategias de intervención, que surjan desde el interior de los Programas académicos; el documento entonces es sólo un elemento para apoyar la discusión. El grupo que tuvo a cargo la realización de este trabajo, hace un reconocimiento a la Rectorı́a de la Universidad, por depositarle la confianza en una tarea de tales dimensiones, reconoce y agradece además, el apoyo permanente del Centro de Sistemas y Nuevas Tecnologı́as, la colaboración del Laboratorio Virtual de la Facultad de Educación, con su capacitación en el manejo del SPADIES, a la Oficina de Admisiones, Registro y Control Académico por permitirnos consultar sus archivos y a los administradores del Programa SPADIES. Los aciertos se comparten con todos ellos, los errores son responsabilidad exclusiva de quienes realizaron el trabajo. IV Í NDICE GENERAL 1. I NTRODUCCI ÓN 2. D ESERCI ÓN 1 EN LA P OBLACI ÓN U NIVERSITARIA 2.1. L A D ESERCI ÓN C OMO VARIABLE 2.2. F ACTORES A SOCIADOS A LA DEL S ISTEMA S OCIAL . . . . . . DE LA 7 D ESERCI ÓN . . . . . . . . . . . . . . . 10 3. F ACTORES D ETERMINANTES 3.1. P ANORAMA G ENERAL 7 15 D ESERCI ÓN EN LA U NIVERSIDAD . . . 15 3.2. F ACTORES D ETERMINANTES . . . . . . . . . . . . . . . . . . . . . . 17 3.3. E FECTO C ONJUNTO 4. A M ANERA DE LOS F ACTORES . . . . . . . . . . . . . . . 33 C ONCLUSI ÓN 39 5. M ETODOLOG ÍA E STAD ÍSTICA 43 DE 5.1. F UNCI ÓN DE S OBREVIVENCIA . . . . . . . . . . . . . . . . . . . . . 43 5.2. M ODELO DE R EGRESI ÓN L OG ÍSTICA . . . . . . . . . . . . . . . . . 46 V Í NDICE G ENERAL VI Í NDICE 2.1. P ORCENTAJE SEMESTRES . 2.2. F ORMA DE FIGURAS DE ESTUDIANTES QUE REINGRESAN DESPU ÉS DE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . DE CUANTIFICAR EL TIEMPO DE SOBREVIVENCIA . 3.1. S OBREVIVENCIA Q UIND ÍO . DE LOS ESTUDIANTES EN LA . . . . . U NIVERSIDAD 8 9 DEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.2. L OGROS A CAD ÉMICOS DAD DEL n Q UIND ÍO DE LOS ESTUDIANTES DE LA U NIVERSI - . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.3. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN EL G ÉNERO . . . . 18 3.4. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN LA E DAD . . . . . . 19 3.5. E DADES DE LOS ESTUDIANTES AL INGRESAR A LA 3.6. S OBREVIVENCIA U NIVERSIDAD . DE LOS ESTUDIANTES SEG ÚN EL N ÚMERO 20 DE H ERMANOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.7. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN LA TRE LOS HERMANOS . 3.8. S OBREVIVENCIA TIVO DE LA EN - . . . . . . . . . . . . . . . . . . . . . . . . . 22 DE LOS ESTUDIANTES SEG ÚN EL M ADRE . P OSICI ÓN N IVEL E DUCA - . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.9. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN LA 3.10. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN EL FACTOR BAJABA AL PRESENTAR EL P ROCEDENCIA . 24 T RA - ICFES. . . . . . . . . . . . . . . . . . 25 3.11. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN EL PUNTAJE 3.12. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN EL TIPO DE COLE - GIO DONDE TERMIN Ó EL ICFES. 26 B ACHILLERATO . . . . . . . . . . . . . . . 27 VII Í NDICE DE F IGURAS 3.13. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN LA JORNADA . 3.14. S OBREVIVENCIA DE LOS ESTUDIANTES SEG ÚN EL C ALIDAD . DE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.15. S OBREVIVENCIA VIVIENDA . DE LOS ESTUDIANTES SEG ÚN LA TENENCIA DE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.16. S OBREVIVENCIA MILIAR . P UNTAJE . . . 28 DE LOS ESTUDIANTES SEG ÚN EL I NGRESO F A - . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.17. P UNTAJE PROMEDIO DE CALIDAD . . . . . . . . . . . . . . . . . . . 34 3.18. P UNTAJE ICFES. . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.19. E DAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.20. N ÚMERO DE HERMANOS . . . . . . . . . . . . . . . . . . . . . . . . 37 VIII C AP ÍTULO 1 I NTRODUCCI ÓN La Revolución Educativa es uno de los pilares del actual Plan Nacional de Desarrollo y en ella se plantean tres (3) objetivos: ampliación de la cobertura, aumento de la calidad y mejoramiento de la eficacia y la eficiencia del Sistema Educativo. El primero de estos objetivos, la ampliación de la cobertura, ha sido una de las preocupaciones del Estado en los últimos 10 años, tal vez porque se acepta que existe una estrecha relación entre la Educación y el Desarrollo, sobre todo en lo que se refiere al desarrollo humano. Resultado de esta preocupación es un significativo aumento de la cobertura educativa en todos los niveles incluyendo, por supuesto, a la Educación Superior. La ampliación de la cobertura ha estado acompañada de un aumento considerable en la deserción de los estudiantes, ası́ que el aumento en la cobertura por sı́ sólo no resulta ser un buen indicador para este objetivo, pues no basta con aumentar el acceso a la Educación Superior, además es necesario garantizar la permanencia de los estudiantes en el Sistema y más aún verificar cuantos de ellos consiguen graduarse. El aumento de la cobertura además ha demostrado ser proporcional a la vulnerabilidad de los que ingresan y el crecimiento en la cobertura lo que ha implicado es un aumento de la deserción, con muy poco efecto real en el número de graduados; por esta razón, el esfuerzo que en un principio estaba concentrado en aumentar los cupos en las Instituciones de Educación Superior, IES, se traslada ahora al fomento de las condiciones que permitan aumentar la probabilidad de que quienes logran ingresar a la universidad 1 1. I NTRODUCCI ÓN permanezcan en ella hasta graduarse. La deserción de la población estudiantil universitaria es un indicador de ineficiencia del Sistema Educativo en todos sus niveles, es muy clara su relación con la calidad de la Educación Básica y, es por lo tanto, un problema de interés y objeto de análisis para posible intervención, por parte de quienes dirigen la Educación Superior en Colombia. En últimas, la deserción es una variable más de la problemática social del paı́s. El problema de la deserción en la población universitaria, por supuesto, no es exclusivo de Colombia, es también una preocupación de los paı́ses latinoamericanos, claramente expresada en el Seminario Internacional Rezago y Deserción en la Educación Superior, realizado en Talca, Chile en el año 2005. Como uno de los resultados de este seminario se sugiere profundizar en la investigación experimental, con el fin de identificar las causas de la deserción y las relaciones entre ellas, de tal forma que se puedan emprender acciones eficaces y sin desperdicio de recursos para mitigar el fenómeno. Con esta motivación el Consejo Nacional de Acreditación ha generado mecanismos para ubicar la deserción como un problema que debe ser considerado dentro de los indicadores para la autoevaluación de las universidades. Por otra parte, las IES acompañadas por el Ministerio de Educación Nacional, han liderado el diseño e implementación de una metodologı́a para el análisis y seguimiento de la deserción estudiantil en la Educación Superior, que se concreta en la construcción de un software llamado Sistema para la Prevención y Análisis de la Deserción en la Instituciones de Educación Superior, SPADIES. Pero este sistema, con todas sus virtudes y el calificado equipo cientı́fico que lo acompaña, no es más que una herramienta informática de gran ayuda en la recolección, almacenamiento y manejo de la información, sobre la dinámica de la población estudiantil al interior de las universidades y con algunas orientaciones hacia el análisis de la deserción; pero por sı́ solo y encomendado a un técnico que produzca reportes periódicamente, es muy poco lo que contribuye como soporte para orientar polı́ticas institucionales. 2 Se requiere acompañarlo de una mirada crı́tica, aún en su parte metodológica, y hacerle una adaptación a las particularidades de las diferentes universidades, impulsándolo a que se convierta en elemento generador de una dinámica que permita analizar y buscarle soluciones pertinentes al problema de la deserción estudiantil universitaria. En este contexto, la Universidad del Quindı́o aborda el análisis y la búsqueda de soluciones al problema de la deserción en su población estudiantil, conformando un equipo con integrantes del Grupo de Investigación y Asesorı́a en Estadı́stica, para que se encargue de hacer el Estudio sobre la Deserción estudiantil en la Universidad del Quindı́o, socializarlo entre los diferentes estamentos, a tal punto que el problema y las soluciones lleguen a ser una preocupación de toda la comunidad universitaria. La estrategia metodológica de este estudio y algunos de los resultados, coinciden parcialmente con el Informe de acompañamiento a la Universidad del Quindı́o, elaborado por el Ministerio de Educación Nacional y el CEDE de la Universidad de los Andes, en agosto de 2007; sin embargo son más sobresalientes las diferencias, sobre todo en la rigurosidad del análisis estadı́stico. En el trabajo de la Universidad del Quindı́o se hace una aplicación juiciosa del Análisis de Sobrevivencia y la Regresión Logı́stica, haciendo el análisis primero en forma global, para toda la Universidad y luego por cada programa académico. Se verifica el efecto que puedan tener sobre la deserción quince (15) factores, considerados, primero en forma separada, comparando estadı́sticamente las curvas de sobrevivencia por medio de pruebas de hipótesis Logrank en el caso discreto y Razón de Verosimilitud en las variables continuas; luego se analiza el efecto conjunto, por medio de la Regresión Logı́stica, evaluando también la calidad del modelo y cuantificando el porcentaje de variabilidad en la Sobrevivencia que se puede atribuir a los factores que aportan significativamente, según este análisis. Un subproducto muy importante del trabajo realizado es la revisión detallada de los datos de entrada, en esta parte resultó muy valioso el aporte del 3 1. I NTRODUCCI ÓN SPADIES y el software institucional ACADEMUSOFT. Para el procesamiento estadı́stico de la información, se utilizó el software STATGRAPHICS CENTURIÓN XV, adquirido por la Universidad del Quindı́o, con número de producto F791-R105-G761-Z265. Los resultados obtenidos muestran que para la Universidad del Quindı́o la mayor deserción de los estudiantes se presenta en los cuatro (4) primeros semestres, situación que es generalizable a todos los Programas Académicos de la modalidad presencial. También se encuentra que al considerar los factores o variables en forma conjunta, los que muestran un efecto significativo en la deserción son: el puntaje de calidad promedio, la jornada académica, el puntaje obtenido en la prueba ICFES, la edad de presentación de las prueba de Estado y el número de hermanos; estos factores, sin embargo varı́an parcialmente al interior de los diferentes programas académicos. Otro aspecto para tener en cuenta es que los factores que resultaron influyendo significativamente en la deserción, en conjunto, solamente explican el 27,3 % de la variación en la deserción, lo cual resulta muy poco orientador para diseñar una estrategia de intervención. Este resultado además está diciendo que se quedaron sin incluir en el análisis otras variables, muy seguramente las que más aportan a la explicación del problema de la deserción. En cuanto a lo que muestra el análisis sobre el efecto de las variables explicativas en la deserción, más la relación entre la deserción y el porcentaje de materias aprobadas, se podrı́a ensayar como una primera explicación, la presencia de algo determinante que resulta de la conjunción de tres (3) elementos: un deficiente nivel en el desarrollo de competencias básicas, como el análisis y la lectura comprensiva que muestran los estudiantes al ingresar a la Universidad, reflejados en los resultados de las pruebas ICFES y el bajo puntaje de calidad que obtienen, en el tiempo que permanecen en la Universidad; una falta total de disciplina de estudio que se manifiesta en el bajo porcentaje de aprobación de materias en los primeros semestres; y una nece- 4 sidad de incorporarse tempranamente al mercado laboral, principalmente en quienes tienen mayor edad en el momento de la presentación de las Pruebas de Estado. 5 1. I NTRODUCCI ÓN 6 C AP ÍTULO 2 L A D ESERCI ÓN EN LA P OBLACI ÓN U NIVERSITARIA 2.1. L A D ESERCI ÓN C OMO VARIABLE DEL S ISTEMA S OCIAL La deserción de la población universitaria, considerada como una variable del Sistema Social, se puede mirar como una variable explicativa de muchas situaciones de la realidad social y también, como una resultante o expresión de ineficiencia del Subsistema Educativo. El abandono de los estudios universitarios, sin obtener un tı́tulo, representa ante todo una frustración para el individuo y su familia, pero también una pérdida de recursos para el Estado, en el caso de las universidades públicas y de esfuerzo para las instituciones educativas en general. Como variable explicativa, la deserción es uno de los factores de mayor peso en la marginalidad social, y como variable respuesta, en ella se resumen situaciones de distinto tipo: individual, sociocultural, académico, institucional y económico; se pretende puntualizar estas situaciones en los diferentes contextos especı́ficos, en este caso, las universidades y su entorno. Concretamente, para intervenir la deserción en un contexto particular, interesa identificar las variables de distinto tipo que la determinan y el peso de cada una de ellas, sólo ası́ se podrá diseñar una estrategia para reducirla. Un indicador de la deserción estudiantil (o de su dual que es la retención), se puede construir a partir del número de matrı́culas que puede certificar el estudiante; con este indicador se define en forma cuantificable, lo que se 7 2. D ESERCI ÓN EN LA P OBLACI ÓN U NIVERSITARIA F IGURA 2.1 Porcentaje de estudiantes que reingresan después de n semestres. considera un desertor, pero esta definición está condicionada por cada contexto y es difı́cilmente generalizable. Para el caso particular de la Universidad del Quindı́o, en este trabajo, se considera como desertor al estudiante que abandona los estudios universitarios y que al cerrar la ventana de estudio, lleva más de dos (2) semestres sin reingresar. La misma definición se aplica al análisis de la deserción, dentro de cada Programa Académico y se presenta el caso de desertores de un Programa que no lo son de la Universidad, como ocurre cuando hay traslados internos o cambios de programa. Esta definición se apoya en la observación de una muestra de 723 estudiantes y entre los que abandonaron la Universidad, se registró el tiempo transcurrido, en semestres, entre el abandono y el reingreso. Los resultados que se ilustran en la Figura 2.1, muestran que un 6.8 % de los que reingresan lo hacen un semestre después, mientras que solamente un 1.6 % lo hacen a los dos semestres y un porcentaje muy pequeño reingresa después de dos (2) semestres. 8 2.1. L A D ESERCI ÓN C OMO VARIABLE DEL S ISTEMA S OCIAL F IGURA 2.2 Forma de cuantificar el tiempo de sobrevivencia. Aunque la definición se apoya en resultados de una situación particular de la Universidad del Quindı́o, coincide con la que propone el SPADIES, como general para todas las Instituciones de Educación Superior. Aprovechando esta coincidencia, con un gráfico similar al utilizado por los autores del SPADIES, se ilustran las diferentes situaciones que pueden presentarse para un estudiante que pertenece a la cohorte en estudio. En la última columna de la Figura 2.2 aparecen los tiempos de sobrevivencia, es decir el tiempo en semestres que cada individuo de la cohorte en estudio permanece en la Universidad, en calidad de estudiante. Los tiempos que aparecen acompañados de un * se denominan datos censurados en el contexto del Análisis de Sobrevivencia y corresponden a aquellas situaciones en las cuales el estudiante, al momento de cerrar la ventana de estudio, aún está activo y por lo tanto, su tiempo de permanencia en el sistema es mayor o igual al que aparece registrado; para efectos operativos los graduados se asimilan a datos censurados. Los tiempos de sobrevivencia de cada uno de los individuos, constituyen la información de entrada para el estudio de la deserción (o de la retención), esta variable se considera además como una respuesta que refleja el efecto de factores individuales, académicos, institucionales, socioculturales y económicos que influyen en la deserción de los estudiantes. A la gravedad del hecho de abandonar los estudios, sin conseguir un tı́tulo, se 9 2. D ESERCI ÓN EN LA P OBLACI ÓN U NIVERSITARIA suele agregar en los desertores un bajo acumulado de logros académicos; en el poco tiempo que permanecen en la Universidad, consiguen menos logros de los esperados, esto sugiere que complementario al tiempo de sobrevivencia se analice otra variable respuesta que refleje la forma como el estudiante aprovecha el tiempo de permanencia en la Universidad, esta nueva variable tiene relación con la calidad y es un indicador que se mide como el porcentaje de cursos aprobados. 2.2. FACTORES A SOCIADOS A LA D ESERCI ÓN En la búsqueda de variables que expliquen la deserción de los estudiantes universitarios, pueden surgir muchas propuestas, pero la necesidad de encontrar resultados que permitan enfrentar cuanto antes el problema con algún grado de eficacia, hace que se adopte como estrategia, iniciar el análisis, aprovechando la información existente en varias fuentes secundarias como: el anterior sistema de información de la Universidad SIDUQ, el nuevo sistema ACADEMUSOFT y el SPADIES; además utilizar la información en fı́sico que existe en la Oficina de Admisiones, Registro y Control Académico. Resulta ası́ un total de 15 variables o factores para analizar la relación que tienen con la deserción y son los siguientes: Género La Edad en años cumplidos en el momento de presentar las Pruebas de Estado. Número de hermanos. Lugar que ocupa entre los hermanos que conforman su familia. Nivel educativo de la madre, considerado como el máximo alcanzado y teniendo en cuenta las siguientes categorı́as: Desconocido, Primaria o menos, Secundaria, Media vocacional o Técnica y Universitaria. 10 2.2. F ACTORES A SOCIADOS A LA D ESERCI ÓN Procedencia geográfica, referida a la ubicación del colegio donde terminó la Secundaria y separada en dos (2) categorı́as: procedente del Departamento del Quindı́o o de fuera del mismo. Actividad que realizaba en el momento de presentar las Pruebas de Estado, concretamente si trabajaba en ese momento. Puntaje en las Pruebas de Estado, referido al obtenido en las Pruebas ICFES, ponderado según al Programa Académico al cual se ingresa y convertido a la escala comprendida entre 0 y 100. Tipo de colegio donde terminó la secundaria: público, privado o validante ICFES. Programa académico al cual pertenece. Jornada académica, diurna o nocturna. Puntaje de calidad promedio. Porcentaje de materias aprobadas en el momento de retirarse del Programa Académico. Tenencia de la vivienda: si su familia es o no propietaria de vivienda. Ingreso familiar, clasificado en siete (7) categorı́as: desconocido, menos de un (1) salario mı́nimo legal vigente (SMLV), entre uno (1) y menos de dos (2) SMLV, entre dos (2) y menos de tres (3) SMLV, entre tres (3) y menos de cuatro (4) SMLV, entre cuatro (4) y menos de cinco (5) SMLV y cinco (5) o más SMLV. La información sobre estas variables se registra para los estudiantes de las dos (2) cohortes que ingresan en el año 2002, en todos los Programas Académicos que estaban activos en ese entonces. La ventana de estudio comprende los semestres transcurridos entre el inicio del primer semestre académico de 2002 hasta el final del primer semestre académico de 2007. 11 2. D ESERCI ÓN EN LA P OBLACI ÓN U NIVERSITARIA Analizar la deserción (o la retención) de los estudiantes en la Universidad, como un problema de sobrevivencia, permite aprovechar para el procesamiento de la información, un conjunto de técnicas estadı́sticas que se agrupan bajo el nombre de Análisis de Sobrevivencia (T.S. Lee, 2002) y que se describen en forma resumida en el cuarto (4o ) capı́tulo del presente trabajo. Utilizando entonces técnicas de Análisis de Sobrevivencia, conocidas como el Producto Lı́mite de Kaplan y Meier, se construyen funciones de Sobrevivencia y su representación gráfica, la Curva de Sobrevivencia, para las variables Tiempo de sobrevivencia y Porcentaje de materias aprobadas durante la permanencia del estudiante en la Universidad. En cuanto a la relación entre la sobrevivencia en la Universidad y las variables consideradas explicativas de la deserción, se analiza primero en forma separada para cada variable explicativa o factor, utilizando una prueba estadı́stica Chi-cuadrado como extensión de la prueba Log-Rank, aplicada al caso de más de dos categorı́as en las variables discretas y una prueba de Razón de verosimilitud, para el caso de las variables continuas. Se trata de precisar con estas pruebas, si existe un comportamiento diferente de la deserción cuando se hace una clasificación por: Género y Edad, en el momento de presentar las Pruebas de Estado, Número de hermanos, Lugar que ocupa en la familia entre los hermanos, Nivel educativo de la madre, Procedencia geográfica, Si trabajaba o no en el momento de presentar las Pruebas de Estado, Puntaje obtenido en las Pruebas de Estado, Tipo de colegio donde terminó la secundaria, Programa Académico al cual pertenece, Jornada académica, Puntaje de calidad promedio, Tenencia de la vivienda e Ingreso familiar. Como las variables explicativas que muestran tener un efecto estadı́sticamente significativo sobre la deserción, no actúan en forma separada, y más bien lo hacen simultáneamente sobre cada sujeto, es necesario analizarlas a través de un modelo que considere su efecto conjunto sobre la deserción, ya que muy seguramente entre ellas existe correlación y el efecto que sobre la 12 2.2. F ACTORES A SOCIADOS A LA D ESERCI ÓN deserción tienen unas variables consideradas en forma separada puede ser absorbido por otras variables al analizarlas en forma conjunta; en esta forma se podrá identificar el conjunto máximo de factores, dentro de los considerados en el análisis, que tienen un efecto significativo sobre la deserción y que constituyen la base para diseñar una estrategia que permita intervenirla con algún éxito. El análisis conjunto, permite además evaluar la capacidad explicativa que tiene sobre la deserción, este conjunto máximo de variables; la técnica estadı́stica utilizada en este caso es la Regresión Logı́stica con Selección de Variables. Cuando este conjunto máximo de variables explica un porcentaje suficiente de la deserción, puede utilizarse para construir una Función de Riesgo y a través de ella cuantificar el riesgo de deserción en cada uno de los estudiantes de la universidad, se podrı́a ası́ hacer una clasificación de los estudiantes que fuera aprovechable para diseñar las estrategias de intervención. 13 2. D ESERCI ÓN EN LA P OBLACI ÓN U NIVERSITARIA 14 C AP ÍTULO 3 L A D ESERCI ÓN U NIVERSIDAD DEL I DENTIFICACI ÓN DE EN LA Q UIND ÍO , FACTORES D ETERMINANTES 3.1. PANORAMA G ENERAL DE LA D ESERCI ÓN EN LA U NIVERSI - DAD Una forma de ilustrar la permanencia de los estudiantes de dos (2) cohortes, a través de la ventana de estudio, es por medio de la curva de sobrevivencia de la Figura 3.1. Dos (2) indicadores de la deserción que se pueden obtener de esta curva son los siguientes: La probabilidad de graduarse un estudiante que ingresa a la Universidad del Quindı́o es del 40 % y el Tiempo Mediano de Sobrevivencia, es decir, el tiempo en que una cohorte se reduce a la mitad, es de seis (6) semestres. Complementario a estos dos (2) indicadores está otro que muestra a través del tiempo el porcentaje de materias que logra aprobar el estudiante durante su permanencia en la Universidad, Figura 3.2. En esta curva se observa que el Tiempo Mediano de Sobrevivencia es de aproximadamente el 45 % de las materias, es decir que este primer 50 % de estudiantes que se retira alcanza 15 3. F ACTORES D ETERMINANTES F IGURA 3.1 Sobrevivencia de los estudiantes en la Universidad del Quindı́o. a aprobar máximo un 45 % de las materias. Otras observaciones que resultan de la comparación de estas dos (2) curvas son las siguientes: De los estudiantes que ingresan, en el primer semestre abandona la Universidad aproximadamente un 22 %, logrando como máximo aprobar el 10 % de las materias. En los tres (3) primeros semestres, la cohorte se reduce en un 40 % y quienes abandonan, logran aprobar máximo un 27 % de las materias; esto sugiere que gran parte de la deserción está motivada por un problema de bajo rendimiento académico en los estudiantes. Los altos niveles de deserción en los primeros semestres están reflejando, entre otros, las dificultades de adaptación que tienen los estudiantes cuando ingresan a la universidad y que son una consecuencia de las diferencias con el sistema de educación secundaria: aumento significativo en el ritmo de estudio, cambios en el sistema de evaluación y modificaciones en el ni16 3.2. F ACTORES D ETERMINANTES F IGURA 3.2 Logros Académicos de los estudiantes de la Universidad del Quindı́o vel de responsabilidad frente al aprendizaje. Sumado a ello los problemas de inestabilidad propios de la adolescencia y en muchos casos la frustración de encontrarse en una carrera que dista mucho de sus expectativas profesionales. 3.2. FACTORES D ETERMINANTES Con el propósito de identificar posibles factores que determinan la deserción de los estudiantes universitarios, se analiza a continuación el efecto individual que puedan tener 13 de las variables mencionadas, sobre las cuales se tiene información para las dos (2) cohortes del año 2002, en la función de sobrevivencia. 17 3. F ACTORES D ETERMINANTES 3.2.1. G ÉNERO . Lo que muestra la Figura 3.3, más el valor del error tipo I en la prueba Chi– cuadrado (P-Valor = 0.0061), permiten afirmar, que hay un comportamiento diferente de la deserción por Género y contrario a lo esperado, la deserción es mayor en los hombres. F IGURA 3.3 Sobrevivencia de los estudiantes según el Género. T ABLA 3.1 Prueba Logrank. FACTOR Género Chi-Cuadrado 7.51521 18 Df 1 p-Valor 0.0061 3.2. F ACTORES D ETERMINANTES 3.2.2. E DAD LAS DEL ESTUDIANTE AL MOMENTO DE PRESENTAR P RUEBAS DE E STADO . Las edades de los estudiantes en el momento de presentar las Pruebas de Estado varı́an entre 14 y 33 años; la Figura 3.4 muestra las dos (2) situaciones extremas y, la prueba Chi-cuadrado, permite afirmar que hay un comportamiento significativamente diferente de las curvas de sobrevivencia asociado a la Edad de presentación de la prueba. F IGURA 3.4 Sobrevivencia de los estudiantes según la Edad. T ABLA 3.2 Prueba de razón de verosimilitud. FACTOR Edad al momento de presentar las Pruebas de Estado Chi-Cuadrado Df p-Valor 15.3119 1 < 0.001 Más que la edad en el momento de presentar la Prueba de Estado, lo que 19 3. F ACTORES D ETERMINANTES está influyendo en la deserción, en este caso, es una variable muy correlacionada con ella que es la edad de ingreso a la Universidad; para los que tienen más edad en el momento de ingresar a la Universidad, es más alta la probabilidad de abandonar los estudios, seguramente porque son más propensos a contraer otras obligaciones de tipo familiar y laboral. Por supuesto el peso de este factor en la deserción no resulta muy significativo dada la distribución de las edades de ingreso a la Universidad, Figura 3.5, donde se muestra que en más del 90 % estas edades están entre 14 y 20 años. F IGURA 3.5 Edades de los estudiantes al ingresar a la Universidad. 20 3.2. F ACTORES D ETERMINANTES 3.2.3. N ÚMERO DE HERMANOS . Para analizar el posible efecto de esta variable en la deserción, se consideraron cinco (5) categorı́as: desde uno (1) que representa los hijos únicos hasta la categorı́a cinco (5) que corresponde a los casos donde hay cinco (5) o más hermanos. La prueba Chi-cuadrado permite afirmar que hay diferencia significativa entre las curvas de sobrevivencia mostradas en la Figura 3.6, es decir, que este factor tiene efecto en la sobrevivencia de los estudiantes en la Universidad y es en los estudiantes que provienen de familias numerosas, donde se presenta mayor deserción. F IGURA 3.6 Sobrevivencia de los estudiantes según el Número de Hermanos. T ABLA 3.3 Prueba de razón de verosimilitud. FACTOR Número de hermanos Chi-Cuadrado Df p-Valor 11.4419 1 0.0007 21 3. F ACTORES D ETERMINANTES 3.2.4. P OSICI ÓN QUE OCUPA ENTRE LOS HERMANOS . El lugar que el estudiante ocupa entre los hermanos que conforman su familia, no es un factor que influye en la deserción, como se ilustra en la Figura 3.7 y se concluye del resultado de la prueba Chi–cuadrado. F IGURA 3.7 Sobrevivencia de los estudiantes según la Posición entre los hermanos. T ABLA 3.4 Prueba Logrank FACTOR Posición entre los hermanos Chi-Cuadrado Df p-Valor 8.18268 5 0.1465 22 3.2. F ACTORES D ETERMINANTES 3.2.5. N IVEL EDUCATIVO DE LA MADRE . El valor que la madre le da a la Educación Superior, depende de su nivel educativo y se espera que influya en la permanencia de su hijo en la Universidad, sin embargo, este factor que se ilustra en la Figura 3.8, no muestra un efecto significativo en la curva de sobrevivencia. F IGURA 3.8 Sobrevivencia de los estudiantes según el Nivel Educativo de la Madre. T ABLA 3.5 Prueba Logrank. FACTOR Nivel Educativo de la madre Chi-Cuadrado Df p-Valor 6.76526 4 0.1488 23 3. F ACTORES D ETERMINANTES 3.2.6. P ROCEDENCIA G EOGR ÁFICA . El análisis de la procedencia geográfica, que se ilustra con la Figura 3.9 y se apoya en el resultado de la prueba Chi-cuadrado, muestra que no hay una diferencia en las curvas de sobrevivencia, entre quienes son del Departamento del Quindı́o y los que provienen de otras regiones del paı́s. F IGURA 3.9 Sobrevivencia de los estudiantes según la Procedencia. T ABLA 3.6 Prueba Logrank. FACTOR Procedencia Geográfica Chi-Cuadrado Df p-Valor 0.0059105 1 0.9387 24 3.2. F ACTORES D ETERMINANTES 3.2.7. A CTIVIDAD QUE REALIZABA EN EL MOMENTO DE PRE - SENTAR LAS P RUEBAS DE E STADO . Con el análisis de este factor, se pretende valorar el efecto que pueda tener la vinculación al mercado laboral, antes del ingreso a la Universidad, en la deserción de los universitarios; aunque en muchos casos las dos (2) actividades no se desarrollen simultáneamente, pues algunos estudiantes, una vez son admitidos, dejan el trabajo para dedicarse al estudio. Como se observa en la Figura 3.10 y se corrobora con el resultado de la prueba Chi-cuadrado, no hay un efecto significativo de este factor en la deserción de los estudiantes. F IGURA 3.10 Sobrevivencia de los estudiantes según el factor Trabajaba al presentar el ICFES. T ABLA 3.7 Prueba Logrank. FACTOR Actividad que realizaba al presentar las Pruebas de Estado Chi-Cuadrado Df p-Valor 4.67165 2 0.0967 25 3. F ACTORES D ETERMINANTES 3.2.8. P UNTAJE EN LAS P RUEBAS DE E STADO . Esta variable aparece como uno de los factores claramente determinantes de la deserción en los universitarios (P-Valor = 0.0001) y como lo muestra la Figura 3.11, los que ingresan con bajos puntajes en las Pruebas de Estado, son los primeros candidatos a desertar. F IGURA 3.11 Sobrevivencia de los estudiantes según el puntaje ICFES. T ABLA 3.8 Prueba Logrank. FACTOR Puntaje en las Pruebas de Estado Chi-Cuadrado Df p-Valor 16.2773 1 0.0001 26 3.2. F ACTORES D ETERMINANTES 3.2.9. T IPO DE COLEGIO DONDE TERMIN Ó LA SECUNDARIA . Aunque la probabilidad de error al afirmar que este factor está relacionado con la deserción, empieza a ser un poco alta (P-Valor= 0.0812), hay algo para destacar y es que la diferencia se produce entre los estudiantes que provienen de colegios públicos y validantes ICFES con los estudiantes de colegios privados, con un comportamiento muy similar entre los dos (2) primeros, tal como se puede observar en la Figura 3.12. F IGURA 3.12 Sobrevivencia de los estudiantes según el tipo de colegio donde terminó el Bachillerato. T ABLA 3.9 Prueba Logrank. FACTOR Tipo de Colegio donde terminó la Secundaria Chi-Cuadrado Df p-Valor 5.02133 2 0.0812 27 3. F ACTORES D ETERMINANTES 3.2.10. J ORNADA ACAD ÉMICA . La prueba Chi–cuadrado permite afirmar que, en general para toda la Universidad y considerando en forma aislada la variable Jornada académica, no es significativa la diferencia entre las curvas de deserción de las distintas jornadas, como se ilustra en la Figura 3.13. Este resultado podrı́a esperarse, ya que la clasificación de los estudiantes por jornadas es básicamente una formalidad, pues se dispone de los mismos recursos (docentes, técnicos y fı́sicos) en los dos casos y cada vez más estudiantes registran materias en ambas jornadas. El resultad, sin embargo, hay que tomarlo con cuidado porque no todos los programas tienen las dos (2) jornadas claramente definidas y al hacer el análisis conjunto o al nivel de Programa, este factor puede resultar con un efecto significativo. F IGURA 3.13 Sobrevivencia de los estudiantes según la jornada. T ABLA 3.10 Prueba Logrank. FACTOR Jornada Académica Chi-Cuadrado 0.473985 28 Df 1 p-Valor 0.4912 3.2. F ACTORES D ETERMINANTES 3.2.11. P UNTAJE DE CALIDAD PROMEDIO . Esta variable aparece también como uno de los factores determinantes de la deserción (P-Valor < 0.0001) , como se puede observar en la Figura 3.14, los desertores están acompañados de los más bajos puntajes de calidad. F IGURA 3.14 Sobrevivencia de los estudiantes según el Puntaje de Calidad. T ABLA 3.11 Prueba de razón de verosimilitud. FACTOR Puntaje de Calidad Chi-Cuadrado 550.874 29 Df 1 p-Valor < 0.001 3. F ACTORES D ETERMINANTES 3.2.12. T ENENCIA DE LA VIVIENDA . El hecho de que la familia del estudiante sea o no propietaria de vivienda, no muestra un efecto significativo en la deserción, como puede afirmarse con el resultado de la prueba Chi–cuadrado. F IGURA 3.15 Sobrevivencia de los estudiantes según la tenencia de vivienda. T ABLA 3.12 Prueba Logrank. FACTOR Tenencia de la vivienda Chi-Cuadrado Df p-Valor 0.104619 2 0.9490 30 3.2. F ACTORES D ETERMINANTES 3.2.13. I NGRESO FAMILIAR . El Ingreso familiar no es un factor determinante de la deserción como puede concluirse del P-Valor en la prueba LogRank. F IGURA 3.16 Sobrevivencia de los estudiantes según el Ingreso Familiar. T ABLA 3.13 Prueba Logrank. FACTOR Ingreso Familiar Chi-Cuadrado 4.18066 31 Df 4 p-Valor 0.382 3. F ACTORES D ETERMINANTES Una sı́ntesis de los factores analizados que muestran tener un efecto individual en la deserción, se presenta en la Tabla 3.14. T ABLA 3.14 Efecto individual de los factores en la deserción. FACTOR Género Edad del estudiante Número de hermanos Posición que ocupa entre los hermanos Nivel educativo de la madre Procedencia Geográfica Actividad que realizaba en el momento de presentar las Pruebas de Estado Puntaje obtenido en las Pruebas de Estado Tipo de colegio donde terminó la Educación Secundaria Jornada académica Puntaje de calidad promedio Tenencia de la vivienda Ingreso familiar p-Valor 0.0061 0.00001 0.0007 0.1465 0.1488 0.9387 0.0967 Calificación Significativo Significativo Significativo No significativo No significativo No significativo Significativo 0.0001 0.0812 Significativo Significativo 0.4912 0.00001 0.9490 0.382 No significativo Significativo No significativo No significativo Los otros dos (2) factores, que son considerados en su relación con la deserción de los estudiantes son: el porcentaje de materias aprobadas, que ya se analizó como complementaria al tiempo de sobrevivencia y el programa académico al cual están vinculados. Dada su trascendencia y las posibilidades que ofrece, en términos del diseño de una estrategia de intervención, este último factor se estudia en forma separada, haciendo un análisis de la deserción al interior de cada programa académico, estudiando el efecto individual de los 13 factores ya mencionados y luego en forma conjunta, pretendiendo que los resultados ası́ obtenidos sean el insumo básico para un producto final que será el diseño de unas estrategias surgidas y sentidas al interior de los Programas, el análisis de la deserción en cada programa no hace parte de este documento. 32 3.3. E FECTO C ONJUNTO 3.3. E FECTO C ONJUNTO DE LOS DE LOS F ACTORES FACTORES Como ya se mencionó en el capı́tulo anterior, los factores que muestran un efecto sobre la deserción no actúan en forma separada, y más bien lo hacen simultáneamente sobre cada sujeto, por lo tanto, es necesario analizarlos a través de un modelo que considere su efecto conjunto sobre la deserción, en este caso un Modelo de Regresión Logı́stica (Hosmer D.W., Lemeshow S. 1989) que se aplica transformando previamente la variable de análisis en dicotómica: desertor y no desertor. Los resultados de aplicar el Modelo de Regresión Logı́stica, con selección de variables sobre trece (13) de los factores considerados en la deserción, se resumen en la Tabla 3.15. T ABLA 3.15 Factores que conjuntamente aportan a la deserción. Factor Estimación gl P-Valor -0,214066 Chicuadrado 59,8814 Edad al presentar las pruebas del ICFES Número de hermanos Puntaje de Calidad Puntaje en la prueba ICFES Jornada académica 1 0,0000 -0,325433 2,35567 -0,0468071 5,96535 376,381 37,3924 1 1 1 0,0146 < 0, 001 < 0, 001 0,461952 5,05009 1 0,0246 En la Tabla 3.15 se puede apreciar que, al considerar en forma conjunta los factores, por efectos de las correlaciones entre ellos, solamente cinco (5) tienen definitivamente un efecto significativo sobre la deserción, estos son en orden de importancia: el Puntaje de Calidad, la Jornada Académica, la Edad en el momento de presentar las pruebas del ICFES, el Número de hermanos y el Puntaje obtenido en las mismas. El indicador que aparece en la segunda columna de la Tabla 3.16 (Odd Ratio) da una idea del peso de cada factor en la retención de estudiantes; por ejemplo, para el factor Puntaje de Calidad el valor OR = 9.83, quiere decir que por el aumento de una unidad en el puntaje de calidad hay un aumento de 9.83 33 3. F ACTORES D ETERMINANTES T ABLA 3.16 Razones de chance para los factores significativos. Factores Edad al presentar las pruebas del ICFES Número de hermanos Puntaje de Calidad Puntaje en la prueba ICFES Jornada académica OR 0,794869 0,855258 9,8383 0,94152 1,52831 veces en la posibilidad de permanecer en la Universidad, mientras que por un (1) año más de edad en el momento de presentar las Pruebas de Estado, se disminuye en 0.7948 veces esta posibilidad. Con el propósito de profundizar un poco sobre estos cinco (5) factores, que contribuyen parcialmente a la explicación del problema, se hace a continuación una descripción de su comportamiento, en relación con la deserción. F IGURA 3.17 Puntaje promedio de calidad. La Figura 3.17 ilustra una relación entre los Puntajes de Calidad y la condi34 3.3. E FECTO C ONJUNTO DE LOS F ACTORES ción de desertor o no desertor. Se puede observar que los Puntajes de Calidad altos son una caracterı́stica de los no desertores (parte inferior de la figura), pero entre los desertores (parte superior de la figura) se dan todo tipo de puntajes de calidad: una parte con puntajes inferiores a dos con cinco (2.5), que corresponde a quienes deben abandonar la Universidad por razones de Reglamento Estudiantil, y existe también un buen número de estudiantes desertores con puntajes de calidad por encima de tres (3.0) para quienes el abandono de los estudios no se puede atribuir a razones de bajo rendimiento académico. Otro factor a considerar en su relación con la deserción, es el Puntaje en las Pruebas del ICFES, que se ilustra en la Figura 3.18 y permite observar que el efecto de los Puntajes de ingreso en la deserción es claro para valores por debajo de 70 puntos, es decir que, entre quienes ingresan a la Universidad del Quindı́o con puntajes estandarizados menores de 70 puntos, hay una mayor proporción de desertores. A partir de ese valor, la proporción entre desertores y no desertores se mantiene igual y el resultado final es que también hay una buena cantidad de desertores con puntajes altos en las Pruebas de Estado. F IGURA 3.18 Puntaje ICFES. 35 3. F ACTORES D ETERMINANTES La Edad de ingreso de los estudiantes a la Universidad, es una variable que afecta la deserción en el sentido de que hay más abandono entre quienes ingresan con mayor edad. Este comportamiento es claro, según la Figura 3.19, a partir de los diez y siete (17) años y tiene tendencia a agudizarse con el tiempo. F IGURA 3.19 Edad. En forma similar a la Edad de ingreso actúa el factor Número de hermanos: entre quienes tienen mayor Número de hermanos, se presenta mayor deserción y la situación se hace aún más clara, según lo que muestra la Figura 3.20, a partir de tres (3) hermanos. Este comportamiento es una manifestación indirecta de la presencia del factor económico en la deserción de los estudiantes universitarios. El otro factor por analizar en detalle, es la Jornada académica, pero la descripción de su comportamiento, en relación con la deserción, no aporta nuevos elementos a los ya observados en la comparación de las curvas de sobrevivencia. Finalmente, estos cinco (5) factores, en conjunto explican solamente un 27,3 % de la variación en la permanencia de los estudiantes en la Univer36 3.3. E FECTO C ONJUNTO DE LOS F ACTORES F IGURA 3.20 Número de hermanos. sidad, lo cual hace pensar que aún faltan por identificar factores importantes que están influyendo en la deserción de los estudiantes y que no fueron incluidos en este análisis. 37 3. F ACTORES D ETERMINANTES 38 C AP ÍTULO 4 A M ANERA DE C ONCLUSI ÓN Dos (2) tipos de conclusiones surgen de los resultados hasta ahora obtenidos: las primeras tienen que ver con aspectos metodológicos del trabajo y las otras se refieren propiamente a los resultados. Condicionar el estudio de la deserción a la información disponible en fuentes secundarias, lleva a que solamente es posible explicar un 27.3 % del problema, y eso si se tiene en cuenta que uno sólo de los factores (el Puntaje de calidad promedio), explica aproximadamente el 24 %. Ası́ mismo, es conveniente observar que nueve (9) factores de los propuestos por el SPADIES, fueron incluidos en este análisis y solamente tres (3) de ellos resultaron significativos, explicando en conjunto menos de un 4 %. Hay aquı́ un llamado de alerta para quienes confı́an en que se puede manejar el problema de la deserción, solamente alimentando el programa SPADIES con datos de la Institución. El bajo poder explicativo que tienen en conjunto los factores identificados como determinantes de la deserción, cuestiona la validez de una Función de Riesgo, con la cual se pretendı́a hacer una clasificación de los estudiantes, que sirviera como base del diseño de las estrategias para intervenir el problema. La Función de Riesgo, que podrı́a construirse en este momento sólo podrı́a mirarse como un paso inicial, pensando en que es posible su perfeccionamiento a medida en que se vayan identificando nuevos factores, los cuales, unidos a los actuales, aumenten su poder explicativo sobre la deserción. Una tarea prioritaria para quienes se interesan en el problema de la deser- 39 4. A M ANERA DE C ONCLUSI ÓN ción de los estudiantes universitarios, es la identificación de los verdaderos factores que determinan esta situación; un primer paso en la Universidad del Quindı́o es actualizar la información sobre los diferentes apoyos que reciben los estudiantes (académicos, económicos y financieros), como lo propone también el SPADIES, pues es muy probable que algunos de estos respaldos resulten ser factores que aporten significativamente a la explicación del problema. Desafortunadamente, en este análisis no fue posible incluirlos debido a la poca confiabilidad de la información que sobre ellos existe actualmente en la Universidad. A propósito del tema de apoyos académicos, es conveniente acoger la sugerencia de los investigadores de la Universidad Nacional de Bogotá (Pinto Segura y otros, 2007) en el sentido de replantear el criterio de meritocracia, como el único para diseñar los programas de apoyo, aceptando que en un esquema preventivo, resulta más razonable pensar en términos de una función de Riesgo. Es necesario idear estrategias basadas en información primaria, como podrı́an ser diferentes estudios transversales y apoyarse además en metodologı́as, tal vez de tipo participativo, para identificar nuevos factores que intervienen en la deserción de los estudiantes. En cuanto a los resultados del trabajo, lo sobresaliente es que los factores que determinan la deserción en la Universidad del Quindı́o son fundamentalmente de tipo académico, lo cual tiene la ventaja de que se pueden buscar soluciones desde la misma Institución; solamente uno de los factores es de tipo individual y es el Número de hermanos. También para destacar el hecho de que la deserción se produce prácticamente en los cuatro (4) primeros semestres y si se tiene en cuenta que el Puntaje de Calidad es el factor determinante, acompañado con un peso mucho menor del Puntaje en las Pruebas de Estado, se podrı́a intentar explicar la deserción de los estudiantes universitarios como el resultado de la conjunción de tres (3) elementos: un bajo nivel en el desarrollo de competencias básicas como el 40 análisis y la lectura comprensiva en el momento de ingresar a la Universidad y que se refleja en los resultados de las pruebas ICFES y posteriormente en el bajo rendimiento académico; una falta total de disciplina de estudio que se manifiesta en el bajo porcentaje de aprobación de materias en los primeros semestres; y la necesidad de incorporarse tempranamente al mercado laboral, principalmente en quienes tienen mayor edad en el momento de la presentación de la Pruebas de Estado. Es clara entonces, la necesidad de establecer un diálogo permanente con la Educación Secundaria y la Media Vocacional. Por último, hay un elemento muy importante que no fue incluido en el análisis por no disponer de la información en el momento, y tiene que ver con la identificación del estudiante con el Programa Académico al cual se vincula: la edad tan temprana a la que los estudiantes están ingresando a la Universidad, Figura 3.5 (Página 20), hace que no se pueda esperar de ellos una claridad sobre la carrera que están escogiendo; generalmente intervienen más en esa decisión, las presiones externas, como la tradición familiar, las limitaciones económicas, los gustos de los padres y hasta de los compañeros de estudio; todo ello favorecido por un ambiente de confusión en el estudiante, que se refuerza con el desconocimiento que tiene de la mayorı́a de las profesiones. El análisis del problema, al interior de cada uno de los Programas Académicos, dará seguramente muchas respuestas al respecto de este tema. 41 4. A M ANERA DE 42 C ONCLUSI ÓN C AP ÍTULO 5 R ESUMEN DE LA M ETODOLOG ÍA E STAD ÍSTICA U TILIZADA En este capı́tulo se incluye, en la forma mas elemental posible y con referencia al problema concreto de la deserción, un resumen de las técnicas estadı́sticas utilizadas en el trabajo: Análisis de Sobrevivencia y Regresión Logı́stica; los interesados en profundizar sobre estos temas encontrarán un buen apoyo en libros como Statistical Methods for Survival Análisis y Applied Logistic Regression. 5.1. F UNCI ÓN DE S OBREVIVENCIA Al número de semestres que un estudiante logra permanecer activo en la Universidad, dentro de la ventana de observación, se le llama el tiempo T de sobrevivencia y, cuando no se conoce exactamente este tiempo, se le considera como un tiempo censurado. La censura puede ser a la izquierda si se desconoce el momento exacto en que abandona pero se sabe que ocurrió antes de un tiempo t, y a la derecha si el evento ocurre después del tiempo t, ya sea por retiro forzoso o voluntario o porque termina sus estudios y recibe su grado. En este trabajo, los casos de censura que se presentan son a derecha y ocurren en los estudiantes que al momento de cerrar la ventana de estudio, aún estaban activos o se habı́an graduado. 43 5. M ETODOLOG ÍA E STAD ÍSTICA Con esta definición del tiempo de sobrevivencia T , se construye la función de sobrevivencia: S(t) = P (T ≥ t ) Esta función expresa la probabilidad de que un estudiante permanezca matriculado en la Universidad más de t semestres. En una muestra donde se registran los semestres de permanencia en la Universidad de n estudiantes, la función S(t) se puede estimar utilizando la técnica del Producto Lı́mite de Kaplan - Meier, la cual se fundamenta en el hecho de que un estudiante que aparece matriculado en segundo (2o ) semestre, tuvo que estar matriculado en primer (1o ) semestre; es decir que: S(2) = P (T ≥ 1 )P (T ≥ 2 |T ≥ 1) y, en general la probabilidad de permanecer t semestres está dada por el producto de probabilidades: S(t) = P (T ≥ 1 )P (T ≥ 2 /T ≥ 1) . . . Si se denominan t1 , t2 , t3 , . . . , tn los tiempos de permanencia de los n estudiantes analizados en la muestra y se renombran estos tiempos para ordenarlos en forma ascendente, ası́ que t(1) ≤ t(2) ≤ t(3) ≤, . . . , ≤ t(n) , la función de sobrevivencia a t semestres puede expresarse como: S(t) = Y n−r n−r+1 , t(r)≤t donde t es mayor que cero y r es un entero positivo, tal que t(r) es menor que t. Cuando varios ti son iguales, para el cálculo de S(t), se utiliza el que corresponde al mayor valor de i. La función S(t), ası́ construida, es no creciente y cumple además las siguientes condiciones: 44 5.1. F UNCI ÓN DE S OBREVIVENCIA 1. S(0) = 1. 2. S(n) = 0 cuando n tiende a infinito. La comparación de dos (2) funciones de sobrevivencia, S1 (t) y S2 (t) se hace probando el siguiente sistema de hipótesis: H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t) De las pruebas que existen en la literatura estadı́stica se utilizará en este caso, para las variables discretas, una prueba no paramétrica, llamada LOGRANK, que está basada en una estimación del logaritmo de la función de sobrevivencia. La extensión de esta prueba a la comparación de k funciones de sobrevivencia, con k ≥ 2, se obtiene utilizando el estadı́stico: X2 = k P Sj2 nj j=1 s2 , que bajo la hipótesis nula tiene distribución Chi–cuadrado con k − 1 grados de libertad y donde Sj es el valor del estadı́stico utilizado en la prueba LOGRANK para la j - ésima función de sobrevivencia y s2 es la varianza de los puntajes utilizados en esa misma prueba (Elisa T. Lee, 2002). La relación de las funciones de Sobrevivencia con variables continuas, se hace a través de una prueba de razón de Verosimilitud. 5.1.1. L A F UNCI ÓN DE R IESGO Otra forma de describir el comportamiento de la deserción en el tiempo, es a través de la Función de Riesgo R(t) que se construye a partir de la Función de Sobrevivencia S(t) por medio de: R(t) = f (t) f (t) = , 1 − F (t) S(t) 45 5. M ETODOLOG ÍA E STAD ÍSTICA donde f (t) es la función de densidad de probabilidad y F (t) la función de distribución acumulada. Esta función es un indicador del riesgo que tiene un estudiante, de la cohorte en estudio, de convertirse en desertor en cada semestre de la carrera. 5.2. M ODELO DE R EGRESI ÓN L OG ÍSTICA Una forma de relacionar dos (2) variables X y Y , es a través de una función de la forma: E[Y |X] = f (x) que se conoce como la Regresión de X sobre Y . En este caso, a la variable Y se le dice una variable respuesta o dependiente y la variable X es una variable explicativa o independiente. Dependiendo de la forma funcional de f , se tienen distintos tipos de modelos de regresión, particularmente en el caso donde f es una función logı́stica y Y una variable dicotómica, se tiene: E[Y |X] = eβ0 +β 1 X , 1 + eβ0 +β1 X que corresponde al modelo de Regresión Logı́stica. Como Y es una variable dicotómica (Y = 0 o Y = 1) se puede suponer que tiene distribución de Bernoulli, ası́ que: E[Y |X] = P (Y = 1|X), y entonces, π(x) = P (Y = 1|X) = eβ0 +β1 X , 1 + eβ 0 +β 1 X que expresa la probabilidad del evento en función de la variable explicativa. Para facilitar el manejo estadı́stico, esta función se puede transformar en ln π(x) = β0 + β1X 1 − π(x) 46 5.2. M ODELO DE R EGRESI ÓN L OG ÍSTICA En general, cada respuesta Y puede expresarse como Y = E[Y |X] + ε, o más bien Y = π(x) + ε, donde ε es el término de error que en este caso tiene distribución Bernoulli con media cero (0) y varianza π(x)(1 − π(x)), ya que Y toma solamente dos (2) valores: Y = 1 con probabilidad π(x) y Y = 0 con probabilidad 1 − π(x). La estimación de los parámetros a partir de una muestra de tamaño n puede hacerse por máxima verosimilitud, teniendo en cuenta que π(x) = P (Y = 1|X) y 1 − π(x) = P (Y = 0|X). Ası́ que en una muestra de tamaño n la función de verosimilitud está dada por: l(β) = n Y y 1−yi (π(xi )) i (1 − π(xi )) i=1 o también: ln (l(β)) = n X [yi ln π(xi ) + (1 − yi ) ln (1 − π(xi ))], i=1 siendo β el vector de parámetros. El valor de β que maximiza esta función, es el vector de los estimadores de máxima verosimilitud para los parámetros. Este razonamiento también se extiende naturalmente al caso de X1 , X2 ,. . . , Xp variables explicativas. Para la interpretación de los coeficientes, se tiene en cuenta que la posibilidad de ocurrencia de un evento se puede evaluar por comparación con la ocurrencia de un evento de referencia, esta comparación se conoce como la Razón de Chance (Odds Ratio) y para su análisis se consideran dos (2) casos: 47 5. M ETODOLOG ÍA E STAD ÍSTICA C ASO 1: Variable independiente dicotómica Cuando la variable explicativa es dicotómica, existen solamente dos (2) valores para π(x) : π(0) y π(1), igual sucede para 1 − π(x) y se tienen entonces las siguientes expresiones para cada uno de los posibles valores de π(x). T ABLA 5.1 Expresiones para valores de π(x). Variable Independiente X=1 Variable respuesta exp(β 0 +β 1 ) 1+exp(β 0 +β 1 ) Y =0 π(1) = Y =1 1 − π(1) = 1 1+exp(β 0 +β 1 ) X=0 π(0) = exp(β 0 ) 1+exp(β 0 ) 1 − π(0) = 1 1+exp(β 0 ) Las posibilidades (odds) de ocurrencia del evento, cuando la variable respuesta se presenta en los individuos con variable independiente X = 1, está definida como: π(1) , 1 − π(1) y en forma similar se puede definir esta posibilidad cuando X = 0 a través de: π(0) 1 − π(0) La Odds Ratio o comparación de posibilidades de ocurrencia de los dos (2) eventos, denotada por ψ, está dada por: ψ= π(1)/ (1 − π(1)) π(0)/ (1 − π(0)) 48 5.2. M ODELO DE R EGRESI ÓN L OG ÍSTICA que también puede escribirse, a partir de las expresiones de la Tabla 5.1, como: ψ= eβ 0 +β 1 1+eβ 0 +β 1 eβ 0 1+eβ 0 1 1+eβ 0 1 1+eβ 0 +β 1 = eβ 0 +β 1 = eβ 1 , eβ 0 lo cual indica que el evento Y = 1 tiene eβ1 veces más posibilidades de ocurrencia cuando X = 1 que cuando X = 0. Un caso más general al de una variable dicotómica, es el de una variable nominal con k categorı́as. El análisis en este caso puede hacerse a partir de k − 1 variables de diseño que son utilizadas para representar los posibles valores de la variable nominal; por ejemplo, si se tiene la variable nominal Zona con las categorı́as: Norte, Sur y Centro, entonces se pueden crear dos (2) variables de diseño D1 , D2 , de tal manera que si se quiere representar el evento “Zona Norte”, debe hacerse D1 = 0 y D2 = 0, si se quiere representar el evento Zona Sur, entonces D1 = 1 y D2 = 0 y por último Zona Centro será representada por D1 = 0 y D2 = 1. En la Tabla 5.2 se resume la codificación de esta variable de diseño. T ABLA 5.2 Codificación de la variable de diseño. Variable diseño Zona D1 D2 Norte 0 0 Sur 1 0 Centro 0 1 La razón de posibilidades, puede hacerse entonces para cada categorı́a de la variable Nominal, ubicando en el denominador la categorı́a de la variable que se obtiene al hacer todas las variables de diseño iguales a cero (0), ası́ en el ejemplo de la Tabla 5.2, la razón de posibilidades se harı́a teniendo como 49 5. M ETODOLOG ÍA E STAD ÍSTICA base la categorı́a Norte. C ASO 2: Variable independiente continua Como se hizo para variables nominales, también es posible calcular la razón de chance para variables independientes continuas haciendo π(x + c)/ (1 − π(x + c)) = eβ 1 c , ψ= π(x)/ (1 − π(x)) donde c es un número real. El resultado ası́ obtenido, se puede interpretar como la posibilidad que tiene de ocurrir el evento en un individuo, cuando la variable respuesta cambia su valor en c unidades. Otro aspecto a considerar en los Modelos de Regresión Logı́stica es la identificación de las variables explicativas, que realmente aportan a la variación de la variable respuesta, es decir, las variables que son significativas en el modelo. Para evaluar la significancia de las variables explicativas en el modelo, se utiliza el estadı́stico: G = −2 ln l(β) , l(β, Xi ) donde l(β, Xi ) es la función de verosimilitud que incluye la variable Xi y l(β) es la misma función de verosimilitud que excluye a Xi . Bajo la hipótesis nula, el estadı́stico G tiene distribución χ21 , cuando la variable Xi es continua y χ2(k−1) cuando la variable es nominal con k categorı́as. En este último caso, la variable nominal debe ser reemplazada por k −1 variables de diseño. El Desvı́o de un modelo es una medida del grado de diferencia entre las frecuencias observadas y predichas por el modelo para la variable dependiente, de tal manera que a mayor desvı́o peor es el modelo o también la reducción en el Desvı́o, al incluir una variable en el modelo es una medida del poder ex50 5.2. M ODELO DE R EGRESI ÓN L OG ÍSTICA plicativo que tiene esa variable. La evaluación del modelo, que se construye finalmente con las variables que resultaron significativas, se hace entonces calculando el porcentaje de “Desvı́o” explicado por el modelo. 51 5. M ETODOLOG ÍA E STAD ÍSTICA 52 R EFERENCIAS B IBLIOGR ÁFICAS [1] Hosmer D.W., Lemeshow S. : Applied Logistic Regression. John Wiley and Sons, 1989. [2] Lee Elisa T., Wang J. W. : Statistical Methods for Survival Data Analysis. Wiley Series in Probability and Statistics, 2003. [3] Ministerio de Educación Nacional, CEDE Universidad de los Andes.: Investigación sobre Deserción en las Instituciones de Educación Superior en Colombia. Informe de acompañamiento a la Universidad del Quindı́o, 2007. [4] Pinto M., Durán D., Pérez-Almonacid R., Reverón C., Rodrı́guez A. Cuestión de supervivencia: Graduación, Deserción y Rezago en la Universidad Nacional de Colombia. 2007. Universidad Nacional de Colombia. [5] Seminario Internacional, rezago y deserción en la educación Superior.: Talca Chile, 2005. 53