Actividad nº 69 La metodología de investigación cuantitativa aplicada a la docencia universitaria Dr. Albert Sesé Universitat de les Illes Balears ALGUNAS CONSIDERACIONES INICIALES • La implantación del Espacio Europeo de Educación Superior (EEES) conlleva la implementación de sistemas de calidad. • La filosofía de la calidad aplicada a la docencia universitaria implica no sólo ajustar nuestra guía docente desde el punto de vista de la carga de trabajo y la temporalidad de las actividades, sino también implica probar empíricamente que nuestras propuestas didácticas son eficientes (principio de mejora continua). • Sólo a partir de la obtención de evidencia empírica podemos evaluar la eficiencia de nuestra acción docente. OBJETIVO Conocer qué métodos son efectivos, para mantenerlos, y cuáles no, para no repetirlos ¿Suponemos la eficiencia de lo que hacemos? ¿Suponemos que ante unos malos resultados son los alumnos quienes fallan? ¿Supone el nuevo sistema Bolonia que los malos resultados son siempre causa del profesorado? ¿Suponemos que los buenos resultados se deben a la calidad de nuestra docencia? ¿Seguimos suponiendo? ¿Valor? SS “Se le supone” EL SESGO ATRIBUCIONAL La hipótesis de la envidia como deporte nacional rn a Ex t er na Los demás In te Ex t Fracaso er na In te Éxito rn a Yo EL PRINCIPIO DE MEJORA CONTINUA Ventajas • Búsqueda de estrategias eficientes • Mejor ajuste de cargas de trabajo y actividades formativas • Obligación de reciclaje académico y didáctico • Mejor grado de satisfacción e implicación Inconvenientes • Utilizar la asignatura como “banco de pruebas” no es sencillo • Implica un mayor nivel de trabajo • Requiere un mínimo de formación en investigación educativa • Puede degenerar de forma que sea más importante el método que el propio resultado ESTRATEGIA DE ACCIÓN DISEÑO EVALUACIÓN IMPLANTACIÓN MEDICIÓN LA MATEMATIZACIÓN DE LA REALIDAD La perspectiva cuantitativa A se considera causa de B siempre que: 1. A preceda a B 2. Haya covariación entre A y B → 3. Se controle el efecto de variables extrañas EL MÉTODO DE INVESTIGACIÓN Generalización de relaciones Marco teórico Teoría Análisis de datos Proposiciones Observaciones Hipótesis Diseño empírico Plan de investigación CARACTERÍSTICAS DEL MÉTODO Generalizabilidad Escepticismo Empirismo Parsimonia Replicabilidad Accidentalidad (Serendipity) LAS HIPÓTESIS Fuentes de generación de hipótesis • • • • • • ¿Por qué ocurre un fenómeno? Curiosidad científica Derivación de teorías Lagunas de conocimiento en algún área Replicación de resultados obtenidos en investigaciones previas La propia experiencia Las necesidades que surgen a lo largo de la investigación Criterios de Formulación (Arnau, 1995) • • • • • • Formulación clara y operativa Adecuación al problema y poder explicativo Comprobables o falsables (contrastabilidad) Establecer relaciones entre variables Seguir el principio de parsimonia Coherencia con el resto de hechos ya contrastados LAS VARIABLES Los conceptos que expresan o representan características o propiedades de la realidad fenoménica reciben el nombre de Variables. Se trata de dimensiones a las que se asignan valores numéricos de acuerdo a unos supuestos o criterios. Nominales Cualitativas Ordinales Tipos de variables Discretas Cuantitativas Continuas LA VALIDEZ EN LA INVESTIGACIÓN VALIDEZ INTERNA Grado con el que un experimento demuestra de forma inequívoca lo que pretende demostrar. VALIDEZ EXTERNA Grado en el que una investigación puede generalizar una relación causa-efecto a y entre sujetos, contextos, ocasiones y medidas diferentes VALIDEZ DE CONSTRUCTO Grado en el que los constructos teóricos utilizados han sido adecuadamente operacionalizados (validez de contenido, de criterio, y factorial) VALIDEZ Se refiere al grado de corrección con el que se DE CONCLUSIÓN infieren las hipótesis a nivel estadístico. ESTADÍSTICA VALIDEZ ECOLÓGICA Grado de semblanza entre la situación experimental y la situación real en la cual se produce habitualmente el fenómeno de estudio TIPOS DE DISEÑOS DE INVESTIGACIÓN Tipo de diseño Características Finalidad Experimental • Manipulación de las variables independientes • Aleatorización de los sujetos • Máximo control interno • Verificación del impacto de variables manipuladas sobre variables dependientes Cuasiexperimental • Extensión del experimental • Ausencia de aleatorización • Disminución de control • Probar los efectos de intervenciones sociales en situaciones con poca posibilidad de control • Ausencia de manipulación y en ocasiones de aleatorización • Poca existencia de control • Descripción de muestras, relación entre variables, predicción, estudio del cambio • Registro “en directo” de la conducta de los individuos, categorización y clasificación, para conseguir una descripción en condiciones naturales (sin control). • Estudiar individuos en condiciones naturales, procesos de cambio. Selectiva (encuestas, comparativa, correlacional) Observacional UN CONTINUO ENTRE LOS MÉTODOS DE INVESTIGACIÓN Metodología selectiva Metodología observacional Metodología experimental Máxima intervención del investigador. Alto nivel de control interno Grado máximo de naturalidad Control inexistente o escaso Validez ecológica Validez interna DISEÑOS EXPERIMENTALES DISEÑOS EXPERIMENTALES El método experimental representa una forma de adquisición del conocimiento a través de una modalidad del método científico que tiene como objetivo: Establecer relaciones causales entre variables a partir de la manipulación de la posible causa y bajo condiciones de control, que permiten eliminar o neutralizar la influencia de variables extrañas. Elementos fundamentales • Situación en la que, al menos, se manipula 1 variable. • Proceso aleatorio de selección de la muestra, asignación aleatoria de unidades (sujetos) a los diferentes niveles o categorías de la variable o variables manipuladas, bajo condiciones de control • Los tres ejes básicos de la metodología experimental son: La aleatorización, el control y la manipulación de la variable independiente (VI) DISEÑOS BÁSICOS EN METODOLOGIA EXPERIMENTAL b1 a1 a2 a1 a2 ... b2 b3 a1 ak a2 Diseño ENTRE unifactorial de dos grupos Diseño ENTRE unifactorial multigrupo Diseño ENTRE Factorial (2 x 3) b1 a1 a1 a2 S1 S2 S3 S4 S5 Diseño INTRA simple ... ak b1 S1 S2 S3 S4 S5 Diseño INTRA Factorial (2 x 2) a2 b2 b1 b2 S1 S2 a1 S3 S4 S5 S6 S7 a2 S8 S9 S10 Diseño MIXTO (A entre 2 x B intra 3) b2 b3 DISEÑOS CUASI-EXPERIMENTALES DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (I) La metodología cuasi-experimental afronta situaciones donde no es posible o no es ético aplicar la metodología experimental, o donde los estrictos requisitos del método experimental no se satisfacen, como por ejemplo, el contexto educativo. Secuencia de Registro Diseño pretest-postest GRUPOS Único ASIGNACIÓN NE PRETEST O1 TRATAMIENTO X POSTEST O2 NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida Ejemplo. Pasamos una prueba de nivel en un grupo de nuestra asignatura. Posteriormente aplicamos una intervención y seguidamente volvemos a evaluar con una prueba de nivel. La diferencia pretest-postest ofrece evidencia empírica del efecto de la intervención. DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (II) Secuencia de Registro Diseño Solo postest GRUPOS ASIGNACIÓN Experimental (GE) Control (GC) NA NA PRETEST TRATAMIENTO X - POSTEST O2 O2 NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida Ejemplo. Queremos probar qué efecto genera una determinada estrategia didáctica. Disponemos de un grupo en el que aplicaremos la estrategia, frente a otro en el que no. No hay mediciones a priori del rendimiento académico, pero sí a posteriori. Se evalúa la diferencia entre las medidas postest de los dos grupos. DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (III) Secuencia de Registro Grupo control no equivalente GRUPOS ASIGNACIÓN Experimental (GE) Control (GC) NA NA PRETEST TRATAMIENTO O1 O1 X - POSTEST O2 O2 NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida Ejemplo. Queremos probar qué efecto genera una determinada estrategia didáctica. Disponemos de un grupo en el que aplicaremos la estrategia, frente a otro en el que no. Establecemos mediciones a priori del rendimiento académico, y también a posteriori. Se evalúa la diferencia entre las medidas pretest y postest en ambos grupos. DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (IV) Secuencia de Registro Diseño con doble pretest GRUPOS ASIGN. Experimental (GE) Control (GC) NA NA PRET 1 O1 O1 PRET 2 O2 O2 TRATAM. X - POSTEST O3 O3 NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida Ejemplo. Probamos la efectividad de una actividad formativa en un grupo. Se establecen dos medidas pretest, se implementa la actividad en el grupo experimental, y luego se obtiene una medida postest en ambos grupos. Las dos medidas pretest se suelen establecer para analizar la estabilidad de la medida previa. DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (V) Secuencia de Registro Diseño de cohortes COHORTES ASIGNACIÓN Primera (GC) Segunda (GE) NA NA PRETEST O1 TRATAMIENTO X POSTEST O2 NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida Ejemplo. Utilizamos dos grupos de una misma asignatura pertenecientes a cursos académicos diferentes. Medimos el nivel previo al tratamiento en la primera cohorte, pero la intervención se hace en la segunda, así como la medida postest. Se evalúa la diferencia pretest-postest suponiendo que aunque se trate de cohortes diferentes, no se observarán cambios en su composición pretratamiento. DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (VI) Secuencia de Registro Discontinuidad de la regresión GRUPOS ASIGNACIÓN Experimental (GE) Control (GC) NAC NAC PRETEST TRATAMIENTO O1 O1 POSTEST X - O2 O2 NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida Ejemplo. Utilizamos un grupo de una asignatura, al cual pasamos una prueba pretest de nivel. En función de un punto de corte determinado, establecemos dos subgrupos de nivel alto y bajo. Aplicamos la actividad formativa a evaluar sobre uno de los dos grupos, por ejemplo, el de nivel alto, y medimos a posteriori. Si no hay efecto, los dos grupos mantendrán su nivel inicial. Si hay efecto, el grupo tratado discontinuará la regresión. GE GE POSTEST Efecto no significativo GC PRETEST POSTEST GC Efecto significativo PRETEST DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (VII) Secuencia de Registro Series temporales interrumpidas simples Series temporales interrumpidas con grupo control no equivalente GRUPOS ASIGNACIÓN Único NA-NAC PRETEST TRATAMIENTO O1 O2 O3 X POSTEST O4 O5 O6 Secuencia de Registro GRUPOS ASIGNACIÓN Exper. (GE) Control (GC) NA-NAC NA-NAC PRETEST O1 O2 O3 O1 O2 O3 TRATAMIENTO X - POSTEST O4 O5 O6 O4 O5 O6 NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida Ejemplo. En una asignatura se detecta un problema en el tiempo de dedicación al estudio. Se decide probar la eficacia de un método motivacional. Se establecen una serie de mediciones de la cantidad de tiempo empleada (O1-O2-O3) para después introducir la intervención en uno de los dos grupos. Se sigue recogiendo el tiempo de estudio a posteriori y se estudia su evolución (O4-O5-O6), e incluso si hay fluctuación en el tiempo. DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (VII) Diseño de series temporales interrumpidas con grupo control no equivalente METODOLOGÍA SELECTIVA DISEÑOS DE METODOLOGÍA SELECTIVA (I) • Pretenden describir una población en un momento determinado. • La recogida de datos se hace de una sola vez y durante un periodo corto, con el objetivo de captar ciertos fenómenos presentes en el momento de realizar la encuesta. Diseños transversales • Adecuados especialmente para estudiar fenómenos estables en el tiempo. • Si interesa estudiar la asociación entre variables: diseño correlacional. • Si interesa predecir una variable de respuesta a partir de otras variables (predictoras), hablamos de estudios predictivos. Las posibles predicciones se han de plantear a priori, y sobre ellas construir la encuesta. • Se pretende observar el cambio en una población, y para ello se toman diferentes medidas a lo largo de un periodo de tiempo. Diseños longitudinales • Incorporan la dimensión temporal, y se toman medidas con un mismo instrumento de las mismas personas, o sobre sujetos comparables. • Requieren tamaños de muestra más pequeños que los transversales. DISEÑOS DE METODOLOGÍA SELECTIVA (II) • Repetición de una serie de encuestas transversales en distintos momentos temporales para investigar el cambio en el nivel o distribución de una variable o en las relaciones entre algunas variables. • Las encuestas se realizan con muestras diferentes de la misma población. Diseños longitudinales con grupos de sujetos distintos • Se siguen los cambios de una variable en una misma población, muestreando de nuevo en cada medida. • Para poder realizar comparaciones entre estos estudios sucesivos, es necesario controlar al máximo todas las posibles variables extrañas, y también la composición de la muestra. • Se puede evaluar cambio en la población, a nivel general, no cambio intraindividual. DISEÑOS DE METODOLOGÍA SELECTIVA (III) Diseños de panel • Implican la recogida de medidas sucesivas de los mismos sujetos a lo largo de un periodo de tiempo (medidas repetidas). • Permite el estudio del cambio en los sujetos y en la población; permite estudiar el cambio intraindividual. • Describe el cambio evolutivo, además de intentar explicar el cambio estableciendo relaciones entre variables. • Supone la selección inicial de una muestra y la observación de sus elementos en más de una ocasión. • Una de las desventajas del modelo es la alta mortalidad estadística que presenta. Diseños de cohortes • Estudia los procesos de cambio en toda su amplitud, contemplando los efectos de la edad, del periodo (momento de medida u observación), y de la cohorte. • Analiza el cambio de la cohorte a lo largo del tiempo y también en relación a otras cohortes. • Puede estudiar transversalmente las diferencias cada año entre las cohortes, las diferencias en la evolución de cada cohorte, así como los efectos de la edad y la cohorte, y el periodo de medida. • Los inconvenientes del diseño son fundamentalmente los costos elevados y una gran mortalidad estadística. METODOLOGÍA OBSERVACIONAL DISEÑOS DE METODOLOGÍA OBSERVACIONAL (I) Según el grado de estructuración de la observación Observación natural La observación se realiza en contexto natural y el observador es un espectador que no interviene en la situación. Observación estructurada Existe cierto grado de intervención del observador. Tiene el compromiso de mantener el contexto natural, pero introduciendo cierta estructuración de la situación. Experimento de campo Grado de estructuración mayor de la situación en contexto natural. Subyace una teoría tentativa explicativa de los datos a observar. Se requieren al menos dos situaciones de observación diferentes para probar la teoría. DISEÑOS DE METODOLOGÍA OBSERVACIONAL (II) Según el grado de intervención del observador No participante o externa El observador permanece distanciado del objeto de estudio. No existe interacción entre él y los sujetos que observa. La objetividad del observador es su principal ventaja. El observador forma parte de los acontecimientos que observa. Permite una mejor comprensión del comportamiento estudiado. Presenta una mayor accesibilidad a los sujetos. Observación Participante Autoobservación • O. como participante: Se conoce su papel de investigador pero no toma parte. • Participante/observador: Toma parte activa en los hechos, y su estatus es conocido por todos. • Participación completa: Participa de los hechos, pero su rol no es conocido por los otros sujetos. Es la observación de un sujeto sobre sí mismo. Supone el más alto grado de participación: uno mismo es objeto y sujeto. Es imprescindible para el acceso a conductas privadas, encubiertas o poco accesibles. DISEÑOS DE CASO ÚNICO (N=1) DISEÑOS DE CASO ÚNICO (N=1) • Intenta averiguar en qué medida la conducta de un sujeto, correctamente operativizada y registrada, presenta algún tipo de cambio como consecuencia de una intervención o tratamiento. • N=1. Sólo utilizan como unidad de análisis un único sujeto. • El interés se centra en el individuo más que en el efecto del tratamiento en sentido estricto. • Tratan de probar causalidad entre la VI y la VD. (manipulación de la VI y control de factores extraños). ¿Cuándo utilizar un diseño N=1? • En entornos clínicos resulta muy difícil conseguir grupos de sujetos con el mismo problema. • El sujeto es su propio control. En el entorno clínico es muy difícil usar grupos control (problemas éticos). • La persona es un cliente que demanda una intervención concreta e inmediata, y efectiva en ella misma, independientemente del grado de efectividad estadística. • El diseño N=1 normalmente se utiliza cuando la investigación se orienta al tratamiento de procesos básicos, o con clara base biológica. ¿Podemos proponer ejemplos aplicables de diseños de investigación en función de las distintas actividades formativas que introducimos en nuestra docencia? EL ANÁLISIS DE LOS DATOS Algunos modelos estadísticos básicos EL PROCESO DE ANÁLISIS DE DATOS FASES ANTECEDENTES FASES DEL PROCESO DE ANÁLISIS DE DATOS FASES FINALES Fundamentación teórica Introducción de datos Interpretación de análisis Diseño de investigación Elaboración y selección de instrumentos Obtención de medidas Depuración de datos Transformación de datos Análisis exploratorios Análisis de contraste Selección de resultados Conclusiones y discusión LA DESCRIPCIÓN UNIVARIANTE DE LAS VARIABLES: ANÁLISIS EXPLORATORIO DE DATOS Principios básicos del EDA (Exploratory Data Analysis) • Da más importancia a las medidas de localización, variabilidad, forma y posición que tienen la propiedad de resistencia, razón por la cual son indicadores adecuados para una gran variedad de distribuciones. • Utiliza diversos resúmenes estadísticos en lugar de trabajar únicamente con uno o dos. Así, mientras que la estadística descriptiva clásica se basa fundamentalmente en la media aritmética y la variancia, el EDA utiliza un gran número de índices. • Utiliza resúmenes visuales, dando mucha más relevancia a la información recogida de forma gráfica. ANÁLISIS EXPLORATORIO DE DATOS. Un ejemplo. Tras la celebración de un examen parcial de la asignatura de “Psicología General” se han obtenido las calificaciones numéricas (escala de 0 a 10) que aparecen a continuación. Llevar a cabo la descripción univariante completa de la variable mediante análisis exploratorio de datos (Menú “Analizar”→“Estadísticos descriptivos” → “Explorar” del programa SPSS) 5 6,5 5 5 0 4 8 7,5 7 6 3 1 6 6 5 7 6,5 7 6,5 5,75 0 6,6 7 7,5 6 5,5 6 0 9 4 La cuestión de la inferencia estadística Población Parámetro Toda característica de la población bajo estudio. Conjunto formado por todos los elementos sobre los cuales queremos obtener información. π p m μ s p±e m±e s±e Estimación puntual de un sólo valor como el estimador del parámetro. Muestra Subconjunto de los elementos que forman la población. σ Estimación por intervalo al que pertenece el parámetro con alta probabilidad. Estadístico Función de las observaciones x1, x2, … , xn que se pueden obtener en una muestra. Estimador Regla que establece el cálculo de una estimación basada en observaciones muestrales. Muestra aleatoria simple n observaciones x1, x2,…,xn independientes, extraída con reemplazamiento o sin él, pero de una población grande. ESTADÍSTICA Establece inferencias con respecto a la población a partir de la información contenida en una muestra. UN EJEMPLO DE ANÁLISIS ESTADÍSTICO BÁSICO La guía docente de una asignatura perteneciente a un título oficial de grado de la UIB incluye una serie de itinerarios evaluativos que han permitido obtener un conjunto de variables relacionadas con el proceso de enseñanza-aprendizaje y el rendimiento y que se detallan a continuación: • Sexo (“sexo”) → Variable dicotómica nominal (Hombre-Mujer) • Calificación 1er parcial (“rendim1”) → Variable cuantitativa (0-10) • Calificación 2º parcial (“rendim2”) → Variable cuantitativa (0-10) • Método de examen (“método”) → Variable categórica nominal (1-2-3) • Horas de estudio (“horasestudio”) → Variable cuantitativa (0-40) • Motivación (“motivación”) → Variable cuantitativa (0-100) • Ansiedad ante los exámenes (“ansiedad”) → Var. cuantitativa (0-40) LA COMPARACIÓN DE DOS MEDIAS (Grupos independientes) Vía paramétrica Teniendo en cuenta la variable “sexo”, podemos plantear hacer una comparación de medias entre el grupo de hombres y de mujeres con relación a la variable “rendimiento 1”. Llevar a cabo la estimación de una prueba t para grupos independientes teniendo en cuenta las variables consideradas. (Menú “Analizar”→ “Comparar medias” → “Prueba T para muestras independientes” del programa SPSS). Se requiere la distribución normal de la variable de contraste en ambos grupos, así como homogeneidad de varianzas. LA COMPARACIÓN DE DOS MEDIAS (Grupos dependientes) Vía paramétrica Dado que se han realizado dos exámenes parciales, nos puede interesar saber si se han producido diferencias estadísticamente significativas entre las calificaciones de ambas pruebas. Para ello hay que aplicar una prueba T para muestras dependientes, ya que en este caso, comparamos el mismo grupo de sujetos en dos momentos temporales diferentes. (Menú “Analizar”→ “Comparar medias” → “Prueba T para muestras relacionadas” del programa SPSS). Al tratarse de un grupo único medido en dos ocasiones, cada sujeto hace de control de sí mismo, y no es necesaria la condición de homogeneidad de varianzas, aunque sí la normalidad. LA COMPARACIÓN DE DOS MEDIAS (Grupos independientes) Vía no paramétrica Ante el incumplimiento de los supuestos para la comparación de medias correspondiente a la variable “rendim2” respecto al sexo, se debe aplicar una prueba no paramétrica de comparación de medias para grupos independientes. Una de las pruebas no paramétricas para este tipo de análisis es la U de Mann-Whitney (Menú “Analizar”→ “Pruebas no paramétricas” → “2 muestras independientes” del programa SPSS). LA COMPARACIÓN DE DOS MEDIAS (Grupos dependientes) Vía no paramétrica Ante el incumplimiento del supuesto de normalidad en el caso de la comparación de las medias de las calificaciones obtenidas por el mismo grupo de sujetos en los dos exámenes parciales, se debe aplicar una prueba no paramétrica de comparación de medias para grupos relacionados. Una de las pruebas no paramétricas para este tipo de análisis es la de Wilcoxon. (Menú “Analizar”→ “Pruebas no paramétricas” → “2 muestras relacionadas” del programa SPSS). EL ANÁLISIS DE LA VARIANZA Vía paramétrica Cuando se trata de comparar más de dos medias simultáneamente, el modelo estadístico a aplicar es el análisis de la varianza (ANOVA). Para ejemplificar este análisis tomaremos la variable “método de examen”, que presenta tres modalidades: preguntas cortas, de desarrollo, o de alternativas, respecto a las calificaciones obtenidas en el segundo parcial (“rendim2”). (Menú “Analizar”→ “Comparar medias” → “ANOVA de un factor” del programa SPSS). Se necesita el cumplimiento de la homoscedasticidad de las varianzas de los grupos y de la normalidad de la variable de contraste. EL ANÁLISIS DE LA VARIANZA Via no paramétrica Si se produce un incumplimiento de los supuestos sobre la comparación de las media de las calificaciones en el segundo parcial respecto del tipo de preguntas del examen, se debe recurrir al análisis de la varianza no paramétrico. La prueba no paramétrica más utilizada en este caso es la H de Kruskal-Wallis. (Menú “Analizar”→ “Pruebas no paramétricas” → “k muestras independientes” del programa SPSS). LA CORRELACIÓN LINEAL El estadístico de asociación lineal más conocido es el coeficiente de correlación lineal de Pearson (rxy). Es un valor estandarizado que oscila entre -1 y +1, indicando el 0 la situación de independencia (“esfera”) entre dos variables x e y. Rxy es simétrico y no establece una dirección en la asociación (no así en la regresión lineal). La prueba de significación determina si el valor en la muestra es o no distinto de 0 en la población. Teniendo en cuenta la matriz de datos, podemos calcular la correlación existente entre las calificaciones de los dos parciales (Menú “Analizar”→ “Correlaciones” → “Bivariadas” del programa SPSS). LA REGRESIÓN LINEAL SIMPLE En la regresión lineal simple se pretende evaluar la capacidad explicativa de una variable X sobre una variable de respuesta Y. El método de mínimos cuadrados ordinarios permite obtener una recta de regresión del tipo Y = b0 + b1 X Llevar a cabo un análisis de regresión lineal simple tomando como variable explicativa la motivación y como variable de respuesta las calificaciones del primer parcial. (Menú “Analizar”→ “Regresión” → “Lineal” del programa SPSS). LA REGRESIÓN ¿LINEAL? SIMPLE La regresión lineal ajusta una ecuación sobre el patrón de asociación lineal entre dos variables, pero no es capaz de captar asociaciones no lineales. Por ello es fundamental utilizar un diagrama de dispersión de forma previa al cómputo de una ecuación de regresión lineal. Las variables a relacionar son la ansiedad ante los exámenes y rendim2 (Menú “Gráficos”→ “Cuadros de diálogo antiguos” → “Dispersión/Puntos” del programa SPSS). Dado el carácter no lineal de la relación, obtener una estimación de relación lineal y cuadrática entre ambas variables. (Menú “Analizar”→ “Regresión” → “Estimación curvilínea” del programa SPSS). La cuestión de la significación estadística: El caso de la regresión lineal simple (I) Una investigación ha tratado de estudiar la correlación existente entre el nivel de actividad política y el rendimiento académico. Para ello extraen una muestra aleatoria simple de 10 estudiantes de primer curso de grado, a los cuales se mide con un cuestionario el nivel de actividad política, y se recoge el promedio de las calificaciones obtenidas durante el curso académico. El valor obtenido para la correlación es de 0.052 (r2=0.003), con una probabilidad p=0.887, es decir, no se puede rechazar la hipótesis nula que expresa que el valor de la correlación en la población es igual a 0. Por tanto, la actividad política y el rendimiento académico aparecen como independientes. La cuestión de la significación estadística: El caso de la regresión lineal simple (II) Supongamos que el investigador del ejemplo anterior consiguió extraer una muestra de 3000 estudiantes de primer curso de grado, a los cuales midió con un cuestionario el nivel de actividad política, y recogió el promedio de las calificaciones obtenidas durante el curso académico. Al establecer de nuevo la estimación del modelo de regresión lineal simple, el valor obtenido para la correlación es de 0.052 (r2=0.003), con una probabilidad p=0.004, es decir, podemos rechazar la hipótesis nula, y por tanto, el valor de la correlación en la población es distinta de 0. Por tanto, la actividad política y el rendimiento mantienen una relación positiva significativa. La significación estadística: Condición necesaria pero no suficiente Una correlación significativa de magnitud positiva igual a 0.052, con un nivel de significación p=0.004, por lo tanto estadísticamente significativa, ¿qué significa realmente?, ¿qué implicaciones tiene? Significa que, a pesar de haber alcanzado la significación estadística, la influencia porcentual que ejerce el nivel de actividad política del alumnado sobre las diferencias obtenidas en el rendimiento académico es solamente del 0.3% (r2=0.003). En resumen, cualquier prueba estadística puede alcanzar la significación estadística al aumentar el tamaño de la muestra, pero resulta necesario establecer un análisis sobre el TAMAÑO DEL EFECTO. El tamaño del efecto permite al investigador establecer un juicio acerca de la significación sustantiva de los resultados obtenidos; no así la significación estadística. LA REGRESIÓN LINEAL MÚLTIPLE La regresión lineal múltiple permite estimar el efecto combinado de un conjunto de variables predictoras (X) sobre una variable de respuesta (Y). Vamos a utilizar el formato de la regresión lineal múltiple para intentar predecir la variable rendim1, a partir de las variables sexo, horas de estudio y motivación. (Menú “Analizar”→ “Regresión” → “Estimación curvilínea” del programa SPSS). SIN PRETENSIÓN DE EXHAUSTIVIDAD Y A MODO DE CONCLUSIÓN Es complicado conocer la totalidad de modelos y submodelos estadísticos que existen, pero es fundamental aplicar aquella técnica que mejor se adapte a la estructura de los datos y al diseño de investigación que manejemos. Lo importante es mantener conciencia acerca del principio de calidad que debe regir nuestra docencia, y que implica la evaluación empírica de la eficacia de nuestras actividades formativas. Siempre debe primar la idea de que cualquier pequeña prueba empírica nos ayudará a arrojar luz sobre los resultados. “When description opens the way to measurement, calculation replaces discussion” Stevens, S.S. (1951) Activitat nº 69 La metodología de investigación cuantitativa aplicada a la docencia universitaria albert.sese@uib.es Dr. Albert Sesé Universitat de les Illes Balears