Tema II. La Psicometría y la Teoría de los Tests INDICE o Introducción o Definiciones y objetivo de la Psicometría o Historia de la Psicometría o El objeto de la medición en Psicología o El método de la Psicometría o Los contenidos de la Psicometría o La Teoría de los Tests BIBLIOGRAFÍA RECOMENDADA Martínez-Arias, R (1995). Psicometría: Teoría de los tests psicológicos y educativos. Madrid: Síntesis. Capítulo 1. Introducción La finalidad de este tema es presentar la Psicometría e introducir uno de sus contenidos más importantes: la Teoría de Tests. Intentar definir un concepto complejo como el de "Psicometría", al igual que ocurre con la denominación de cualquier disciplina científica, es una tarea difícil, razón por la que, al contrario de lo que se podría pensar, no abundan las definiciones explícitas. Bajo la palabra "Psicometría" pueden convivir contenidos, enfoques, objetivos y hasta concepciones diferentes sobre la ciencia y la función social de la Psicología. Por todo ello, tal vez la única estrategia útil 2 para abordar una delimitación conceptual comprehensiva y lo más exacta posible de la Psicometría sea recorrer desde una perspectiva histórica la evolución de la medición psicológica, esbozar un análisis de la naturaleza del "objeto" de la medición psicológica, describir el método psicométrico, presentar los contenidos de la Psicometría y, a pesar de las dificultades ... no resistir la tentación final de proponer una definición propia de la Psicometría. Definiciones y objetivo de la Psicometría En este apartado se aborda el significado de la denominación de la disciplina y se señalan los elementos comunes de las definiciones propuestas por diferentes autores. El término "Psicometría" es el más extendido y general para hacer referencia a la medición psicológica. Su significado popular y la etimología de la palabra apuntan en la misma dirección: la disciplina que se encarga de la medición en Psicología. De hecho, los diccionarios de uso más común como el de la Real Academia de la Lengua o el de María Moliner también coinciden en su significado: la medida de los fenómenos psíquicos. Para avanzar en el camino hacia una delimitación conceptual de la disciplina es necesario detenerse en las definiciones explícitas que, desde la propia Psicología, se han propuesto para la Psicometría. Señalar los puntos comunes y las diferencias de matiz entre ellas pueden ayudar a entender el alcance de la disciplina. Yela (1968) apunta que la Psicometría se ocupa de todas las medidas en el campo psicológico, habiéndose desarrollado a través de dos ramas principales: los métodos psicofísicos y la teoría de los tests. Nunnally (1973) se refiere a la Psicometría como la metodología encargada del desarrollo y utilización de las técnicas de medición en todos los ámbitos de la psicología. Muñiz (1998) define la Psicometría como "... el conjunto de métodos, técnicas y teorías implicadas en la medición de variables psicológicas... lo específico de la Psicometría sería su énfasis y especialización en aquellas propiedades métricas exigibles a las mediciones psicológicas independientemente del campo sustantivo de aplicación y de los instrumentos utilizados" (pág. 17). 3 La definición de Martínez-Arías (1995) introduce un matiz que apunta hacia la relación entre la Psicometría y la Psicología Matemática. Para la autora, la Psicometría "... aglutina todo el conjunto de modelos formales que posibilitan la medición de variables psicológicas, centrándose en las condiciones que permiten llevar a cabo todo proceso de medición en psicología" (pág. 21). No resulta difícil entresacar los elementos comunes de las definiciones anteriores. La Psicometría es una disciplina metodológica, sin un contenido psicológico propio, pero con un campo sustantivo: la teoría de la medición en sentido amplio. Muñiz (1998) afirma que el trabajo psicomético tiene como finalidad construir y utilizar adecuadamente los tests y las escalas, de tal modo que se garantice su fiabilidad, validez y aplicación adecuada. Historia de la Psicometría La revisión de los antecedentes históricos y de la evolución de la medida en Psicología, ofrece una perspectiva útil para comprender la Psicometría actual. Para algunos autores, la historia de los tests mentales es tal vez uno de los mejores ejemplos de la existencia de una interacción entre las demandas sociales y la evolución de una disciplina científica. Salvando las distancias, la valoración es aplicable al conjunto de la historia de la medida en Psicología. La historia de la medición psicológica ha estado marcada por la interrelación entre la evolución interna de la Psicometría y de la Psicología con el deseo de responder a las demandas sociales de cada momento histórico, reflejando un mayor acento en las aplicaciones prácticas que en el desarrollo teórico. Este apartado pretende esbozar el entorno intelectual y social en el que nace la Psicología moderna y con ella la Psicometría. A continuación, sólo se aborda una de las dos líneas de trabajo que más trascendencia han tenido para la evolución de la Psicometría: el estudio de las diferencias individuales; para la otra línea: la Psicofísica, se puede recurrir a la bibliografía complementaria del tema. Por último, se señalan los acontecimientos que han marcado la consolidación de la disciplina. 4 Estudio de las diferencias individuales Debemos advertir de una doble simplificación. Primera, dejar a un lado, por razones de tiempo, la Psicofísica impide lograr una visión comprehensiva de la historia de la medición en Psicología; segunda, la que vamos a cometer en este apartado, reducir la historia del estudio de las diferencias individuales a la historia de los tests psicológicos y presentarla recurriendo a las aportaciones de algunas figuras clave. La última es reduccionista pero difícil de evitar: gran parte de la Psicometría actual no se puede comprender sin atender a los antecedentes y orígenes históricos de los tests psicológicos y de la medida de la inteligencia. El rápido progreso económico y social en la Europa de finales del siglo XIX planteó la necesidad de evaluar las capacidades y conocimientos de los individuos en contextos educativos, laborales, etc. Si la Filosofía y la Fisiología fueron las disciplinas que más influyeron en el trabajo de los primeros psicofísicos, el impacto más dramático sobre el estudio de las diferencias individuales vino de la Biología. Al tiempo que Fechnner presentaba sus trabajos, Darwin (1809-1882) presentó su teoría en La Evolución de las Especies (1859) y su aplicación al estudio del hombre en El origen del hombre y la selección en relación al sexo (1871). Darwin defendió que la inteligencia y el sentido moral también se habían ido perfeccionando de manera gradual a través de la selección natural. Al defender esta idea Darwin no hacía sino reflejar la visión científica y la opinión popular dominante en la Inglaterra del siglo XIX, que justificaba el colonialismo y el sistema de clases bajo la creencia de que el hombre de letras inglés de clase media era el pico de la evolución humana (Rust y Golombok, 1989). No es exagerado afirmar que las necesidades de la evaluación educativa fueron las primeras demandas sociales con un impacto significativo y duradero en la evolución del estudio de las diferencias individuales y, por ende, de la Psicometría. Los intentos por medir la inteligencia como respuesta a esas demandas caminan de la mano de los desarrollos metodológicos durante este periodo. Thorndike (1997) señala al movimiento hacia la educación obligatoria en Francia, Inglaterra y Estados Unidos a finales del siglo XIX, como uno de los desarrollos críticos que propiciaron la medida de la inteligencia. La llegada por primera vez a las escuelas de niños cuyos padres no había recibido una educación o, como en el caso americano, cuya lengua materna no era el inglés, generó una 5 heterogeneidad en la población de alumnos como antes no se había conocido. La exposición de estos niños a un currículo antiguo, diseñado para un grupo selecto de estudiantes, trajo como resultado niveles dramáticos de fracaso escolar próximos al 50%. Este fracaso fue visto como una pérdida de recursos en un tiempo en que eran limitados, de forma que se planteó la necesidad de destinar los recursos a quienes más se pudieran beneficiar, el medio: la evaluación de la inteligencia. Este es el contexto en el que se debe situar la obra de Binet Los pioneros de la Psicología llevaban años intentando una formulación aceptable de la inteligencia. Según Rust y Golombok (1989) los primeros autores tenían unas definiciones de la inteligencia que no iban más allá de lo que podría ser la psicología popular del maestro común de escuela. Se reconocía la diferencia entre una persona educada y una persona inteligente, entendiendo esta última como una persona "educable", con un origen esencialmente genético y receptora ideal de los recursos educativos, frente a los "torpes" incapaces de beneficiarse de la educación normal. Entre los pioneros en el estudio de las diferencias individuales destaca el considerado por muchos autores, como el fundador de la Psicometría: Francis Galton. Primo de Darwin, inició sus investigaciones llevado por el objetivo de mostrar el componente hereditario del "genio". Para ello reunió el primer banco con los datos de personas relacionadas y no relacionadas. Influido por el asociacionismo de Locke y llevado por sus observaciones de que las personas con deficiencias mentales presentaban una peor ejecución a la hora de discriminar sensaciones de frío, calor, dolor, etc., pensó que la discriminación sensorial podía ser el medio para cuantificar el intelecto de una persona. Sus aportaciones propiamente metodológicas abarcan la formulación de las bases de procedimientos estadísticos, como el “coeficiente de correlación” desarrollado por K. Pearson (1857-1936), las intuiciones sobre la forma de "campana", como imagen para describir la distribución de puntuaciones en un test, así como las primeras aplicaciones de las escalas de "rating" y los métodos de cuestionario (Anastasi y Urbina, 1997). J. M. Catell (1860-1944) trabajo con Wundt, con quién compartió el interés por los fenómenos perceptivos y sensomotores, y el rigor en el control de las condiciones en que se realizaban las observaciones, pero de quién se distanció ante el despreció del experimentalista alemán por las diferencias individuales. Más tarde trabajo con Galton e inició en Estados Unidos el estudio de las diferencias individuales. Acuñó el término "test mental" en un artículo publicado en 1890 en la revista Mind bajo el título “Mental test and measurements”. Asumió la idea de Galton sobre la posibilidad de 6 medir las funciones intelectuales por medio de tests de discriminación sensorial y tiempo de reacción. Sin embargo, los primeros estudios que se realizaron para evaluar este tipo de tests ofrecieron resultados desalentadores: el "rendimiento intelectual" mostraba poca correspondencia de unos tests a otros y prácticamente ninguna relación con estimaciones independientes del nivel intelectual realizadas por los profesores. Por el contrario, Ebbinghaus, apuntando ya un cambio de enfoque, había obtenido con un test de terminación de frases una correspondencia clara con el rendimiento académico de los niños. Pero sin duda, la consolidación social de la medición psicológica vino de la obra del francés Alfred Binet (1857-1911) cuya influencia en el desarrollo de la teoría de los tests perdura en la actualidad. Binet ya a finales de los años noventa del siglo XIX criticó la aproximación de Galton y Cattell con el argumento de que para medir procesos mentales complejos era necesario observar la ejecución de los individuos en actos mentales complejos, rechazando la idea de que fuese necesaria una mayor precisión para la que no había instrumentos disponibles, ya que las diferencias individuales eran mayores respecto a los procesos superiores que en cuanto a la discriminación sensorial. Binet recibió en 1904 el encargo del ministerio francés de instrucción pública de elaborar un instrumento de medida capaz de diferenciar entre los niños "educables" y los que no podrían beneficiarse de la educación normal. Junto con su colaborador Simon presentó en 1905 la primera versión del test Binet-Simon. El test estaba formado por 30 problemas o tareas dispuestos en orden de dificultad creciente, que medían la capacidad de juicio, razonamiento y comprensión. Para determinar el nivel de dificultad, los problemas habían sido administrados a 50 niños de entre 3 y 11 años más a algún niño retrasado. La segunda versión del test editada en 1908, incluía un número mayor de ítems junto con la eliminación de algunos que se habían considerado podían reflejar diferencias en función de la extracción social de los niños, además aparecían ya agrupados por niveles de edad. Binet prefirió el término "nivel mental" al de "edad mental" popularizado por las sucesivas traducciones de la escala, ya que el primer término estaba exento de las connotaciones evolutivas del segundo. Al poco tiempo de su presentación, el test de Binet y Simon fue traducido a diferentes idiomas y aplicado en diversos países, lo que prueba la favorable acogida social que recibió. El interés por la obra de Binet se ha mantenido a lo largo del tiempo. Van der Linden (1986) ha resaltado las contribuciones estrictamente metodológicas de la aproximación de Binet a la medida de la inteligencia. Primero, frente a los experimentos antropométricos y psicofísicos que planteaban una única tarea, Binet decidió alargar la 7 longitud del test por dos motivos: a) el conjunto de ítems debía ser una representación adecuada de la gran variedad de tareas a las que se debe enfrentar una persona en su vida diaria; y b) conocedor de las teorías de Spearman entendió que cada ítem en sí mismo era una media imprecisa, por lo que era necesario combinar observaciones de un buen número de ítems para obtener una medida fiable. Segundo, la insistencia de Binet en la estandarización de la aplicación del test, reflejada en la extrema precisión de las guías sobre el material, la administración, la puntuación y la interpretación de las mediciones. Por último, la práctica de "normativizar" el test para iniciar una interpretación relativa de la ejecución de las personas. Tras las aportaciones de Binet, los mayores desarrollos en la medición de las diferencias individuales hay que buscarlos en un área y lugar diferente. El test de Binet fue introducido en Estados Unidos por H. H. Goddard, cuya traducción y adaptación recibieron el beneplácito de la audiencia médica, al venir a cubrir la necesidad de una medida estandarizada y objetiva para el diagnóstico de la subnormalidad. Sin embargo, fue rápidamente desplazada por la revisión y adaptación psicométricamente más sólida, realizada por L. M. Terman en 1916 en la Universidad de Stanford. Al entrar Estados Unidos en la Primera Guerra Mundial, un comité encabezado por R. M. Yerkes detecta la necesidad de clasificar de forma rápida al millón y medio de reclutas con respecto a su nivel intelectual. De nuevo, una demanda social provoca un avance metodológico: los primeros tests de inteligencia de administración grupal y no verbales, para evaluar a los reclutas analfabetos o que no tenían como lengua materna el inglés. En este contexto hay que situar las contribuciones de A. S. Otis, por la introducción del formato de elección múltiple y otros formatos de puntuación objetiva. Impulsado por las necesidades militares aparece también el primer test estandarizado para la evaluación de variables de personalidad: el “Personal Data Sheet” de R. S. Woodworth, un instrumento pensado para la detección de personas con inestabilidad emocional. La consolidación institucional de la Psicometría De forma paralela a los avances teóricos y las aplicaciones prácticas, se fue produciendo la consolidación institucional de la Psicología y, claro está, de la propia Psicometría. Esta consolidación se refleja en la creación de asociaciones profesionales, de publicaciones especializadas para la comunicación entre profesionales y de empresas privadas dedicadas desde el inicio al floreciente negocio de la evaluación psicológica. 8 J. Jastrow habla sobre los tests en la primera convención de la American Psychological Association (APA) en 1892. La APA formó en 1895 un comité especializado en la nueva tecnología de los tests. En 1899 Kilpatrick, presidente de la APA, realizó un llamamiento a los psicólogos para que elaborarán tests de tal naturaleza que "... pudieran ser aplicados tanto a niños como adultos, que fueran de tal forma que todas las personas tuvieran las mismas oportunidades de mostrar las capacidades examinadas, y que en aras de la economía del tiempo fueran diseñados de forma que se pudieran administrar a una clase o escuela de una vez" (Thorndike, 1997, pág. 6). Impulsado por la figura clave de Terman el uso de los tests de inteligencia en las escuelas creció rápidamente. El propio Terman calculó que en el periodo entre 1920 y 1921 más de dos millones de niños habían respondido a un test de inteligencia. El uso de test también se extendió al mundo laboral como prueba su incorporación a las prácticas de selección de la administración americana. Cattell fundó la Psychological Corporation para la producción industrial de tests en 1922. En 1947 se funda el Educational Testing Service (ETS) institución sin animo de lucro que no sólo se ha encargado de la producción de tests estandarizados de rendimiento y tests de aptitud académica, sino que desde su constitución, ha contribuido a la formación y práctica profesional de influyentes psicómetras. Desde 1975, el ETS edita en formato CD-ROM el proyecto ERIC donde con una periodicidad anual se recoge la información disponible sobre tests, escalamiento y medición psicológica y educativa. Galton, Pearson y Weldon fundaron en 1901 la revista Biometrika que desde entonces publica trabajos matemáticos relacionados con la Biología y la Psicología. Thorndike funda en Estados Unidos en 1936 la publicación Psychometrika, revista de referencia para la Psicometría desde sus inicios. Desde entonces, la aparición de revistas relacionadas con la medición psicológica ha sido continua. Como muestra se pueden citar el Educational and Psychological Measurement (1941), el British Journal of Statistical Psychology (ahora con el nombre de British Jorunal of Statistical and Mathematical Psychology) (1947), el Journal of Mathematical Psychology y el Journal of Educational Measurement (1964), el Multivariate Behavioral Research y el Aplied Psychological Measurement (1977), el Applied Measurement in Education (1988), etc. Un acontecimiento que se ha convertido en referente obligado para todos los profesionales es la publicación por las asociaciones profesionales más relevantes de las guías técnicas y éticas de la medición psicológica y educativa. Las recomendaciones elaboradas 9 por la APA son, sin duda, las que han tenido y tienen una mayor influencia. Tablas cronológicas con los acontecimientos, figuras, publicaciones, etc., relativas a la medición psicológica y educativa pueden consultarse en numerosas fuentes (e. g., Anastasi y Urbina, 1997; Muñiz, 1998). La Psicometría española La aparición de la Psicometría en España está ligada al nacimiento y desarrollo de la propia Psicología científica al igual que en el resto del mundo. Carpintero (1996) señala uno de los rasgos distintivos de la psicología española que también imprime carácter a la propia Psicometría: España ha sido un país más receptor que creativo y el interés por la disciplina fue el resultado de la constatación de que la Psicología podía ofrecer soluciones prácticas en ámbitos como la educación, la clínica o la empresa. Autores del Renacimiento como Luis Vives (1492-1540) o Huarte de San Juan (1530-1589) son los iniciadores de una tradición que retomará la psicología científica cuando inicia su andadura en las últimas décadas del siglo XIX. Carpintero (1996) sitúa en la Guerra Civil la frontera divisoria entre dos épocas. Antes de la ruptura que supuso la guerra es posible rastrear entre las aportaciones de diferentes figuras los antecedentes de la Psicometría española. Muñiz (1991) recoge una reseña de un libro publicado por Julian Besteiro en 1897 con el título de La Psicofísica. Carpintero (1996) destaca entre los personajes de lo que denomina "la primera psicotecnia" a Emilio Mira y López (1896-1964). Mira fundó en Barcelona el Institut d'Orientacio Professional en 1918, realizó trabajos en el campo de la orientación y selección profesional y fue autor de un test influido por el acercamiento sensomotriz a la consciencia: el Test Miokinetiko (PMK). Carpintero (1996) achaca a la falta de un análisis masivo de sujetos normales en contextos industriales o militares al igual que se hacía en Estados Unidos, la falta de una consciencia amplia sobre la utilidad social de la Psicología durante este periodo. José Germain (1898-1986) había iniciado su labor antes de la guerra en el entorno intelectual de la Institución Libre de Enseñanza, como prueba la adaptación y baremación para la población española del test de Terman que realizó junto a Mercedes Rodrigo en 1930. Sin embargo, destaca su figura por ser el iniciador, junto con sus discípulos, del largo proceso de recuperación de la psicología científica en España de los años cuarenta. Germain fue en 1948 el primer director del recién creado Departamento de Psicología 10 Experimental, dentro del Instituto de Filosofía del Consejo Superior de Instituciones Científicas. Entre los discípulos de Germain se encontraba Mariano Yela (1921-1994) figura sin la que es imposible entender la Psicometría española. Para obtener una idea global de la persona y obra de Yela es útil leer la monografía que la revista Psicothema publicó en 1996 poco después de su fallecimiento (vol. 8). La Psicometría española carece de una revista específica aunque son muchas las publicaciones periódicas que dedican un apartado a la metodología de la medición psicológica. En 1995 se constituyó la Asociación Española de Metodología de las Ciencias del Comportamiento (AEMCO), encargada de organizar los Congresos de Metodología que con periodicidad bienal, van ya por su sexta celebración. AEMCO ha editado en 1999 el primer número de la revista Metodología de las Ciencias del Comportamiento con la pretensión de ser el lugar de referencia para las publicaciones de los metodólogos españoles en el ámbito de las ciencias humanas y sociales. El objeto de la medición en Psicología Al presentar las definiciones explícitas de la Psicometría elaboradas por diferentes autores, se entresacaron sus elementos comunes: disciplina metodológica, sin contenido psicológico propio, pero con un dominio sustantivo: la teoría de la medición psicológica en un sentido amplio. La definición de Muñiz (1998) señala además, el rasgo definitorio de la preocupación psicométrica por la medida: las condiciones métricas exigibles a todas medición. Sin embargo, hay otra fuente de singularidad en la preocupación psicométrica por las condiciones métricas de la medición que no es posible soslayar: la que viene impuesta por la peculiaridad de los objetos psicológicos de medición. A diferencia de las variables físicas, las variables psicológicas no se pueden observar de manera directa. No quiere esto decir, que en psicología no se midan conductas directamente observables, cuya cuantificación se suele obtener a través de alguno de sus parámetros: duración, frecuencia, intensidad, etc., sino que, incluso en estos casos, la conductas observables se interpretan como indicios o resultado de variables inobservables más complejas. Atributos como "autoestima", "habilidad lectora", "razonamiento analógico", etc., son variables inobservables que sólo es posible medir por medio de los comportamientos observables a los que den lugar. 11 Hay un amplio consenso sobre el término con el que referirse de forma genérica a los objetos de medición: constructos. El término "constructo" se ha hecho familiar en el campo de la medición psicológica desde su utilización en el artículo de L. Cronbach y P. E. Meehl titulado "Construct validity in Psychological Test" (1955). Cronbach y Meehl (1955) entendieron por constructo un instrumento intelectual para organizar la experiencia en categorías. Crocker y Algina (1986) lo definen como "... productos de la imaginación informada de los científicos sociales qué intentan desarrollar teorías para explicar el comportamiento humano" (pág. 4). Crocker y Algina (1986) ilustran el proceso de elaboración de constructos insistiendo en su papel de "etiqueta" para resumir comportamiento y remarcan la importancia de establecer alguna regla de correspondencia entre el constructo y los comportamientos observables que son sus indicadores legítimos. La dificultad a la hora de encontrar la conexión "legítima" entre el constructo y sus indicadores comportamentales es valorada como uno de los lastres que impide el desarrollo de la medida psicológica. Lord y Novick (1968) fijaron la definición obligatoria de los constructos como requisito previo para su medición. La definición de los constructos se debe abordar a dos niveles: Definición operacional o “semántica”. Consiste en enumerar la serie de comportamientos indicadores que “engloba” el constructo. Dichos comportamientos son considerados los “indicadores empíricos” del constructo objeto de la medición. La importancia de la definición operacional es evidente: debe conectar la “etiqueta verbal” con los datos observables. Definición conceptual o “sintáctica”. Recoge la teoría sobre el constructo objeto de la medición. Se trata de un discurso “conceptual” en el que se hacen explícitas las relaciones del constructo objeto de la medición con otros constructos y/o indicadores empíricos de otros constructos con los que el objeto de la medición está relacionado. La definición de los constructos a los dos niveles anteriores es el primer paso inexcusable a la hora de iniciar cualquier medición. 12 El supuesto sobre la estabilidad de los constructos La medición psicológica asume, o al menos tiene en cuenta, algunos supuestos sobre la naturaleza del objeto de la medición, es decir, sobre la naturaleza de los constructos. Sin duda, el supuesto común a la práctica totalidad de los modelos de medición es el de la estabilidad de la variable. Numerosos estudiosos de la medición psicológica defienden la idea de que las diferentes versiones de la teoría de los tests (e. g., la teoría clásica, la teoría de la generalizabilidad y la teoría de respuesta al ítem) están elaboradas para hacer inferencias con el mismo "esqueleto": la tendencia de las personas a comportarse de manera prescrita en situaciones prescritas a partir de sus repuestas a un conjunto de tareas predeterminadas. Por ejemplo, la perspectiva tradicional para medir la inteligencia responde a este esquema inferencial: empleo de tests estandarizados, compuesto por ítems o tareas predeterminadas, aplicados bajo condiciones estandarizadas y con la pretensión de predecir el rendimiento futuro de las personas en situaciones igualmente "estandarizadas": la escuela, el trabajo, el ejercito, etc., En definitiva, los modelos de medida se han elaborado bajo el supuesto de estabilidad de la variable. El supuesto de estabilidad está siendo amenazado por las perspectivas más recientes sobre la evaluación psicológica, es decir, por la necesidad de extender el "paradigma metodológico tradicional" para responder, por ejemplo, a las inferencias que el paradigma cognitivo plantea sobre las personas: las formas de uso y adquisición de conocimientos y habilidades, en definitiva, para modelar el cambio. La polémica sobre el objeto de la medición La cuestión sobre la naturaleza del objeto no ha estado exenta de debate a lo largo de la historia de la medición psicológica como reflejo de las discusiones sobre el propio objeto de estudio de la psicología. Resulta difícil evitar plantearse preguntas como las lanzadas por Meliá (1990): "¿Cuántos atributos latentes o rasgos subyacentes existen?... ¿en qué medida son estables o evolucionan? ¿son comunes a todas las personas?" (pág. 37). Rust y Golombok (1989) defienden que la discusión sobre el objeto de medición ha dividido a la Psicometría en dos escuelas: la Psicometría del rasgo y la Psicometría funcional. Spearman (1904, 1907) da carta de naturaleza a la Psicometría de los rasgos al 13 plantear que la esencia de la tarea de la medida mental es identificar rasgos a través de las tendencias de los individuos a comportarse de formas prescritas en situaciones prescritas. El fuerte carácter hereditario atribuido por los pioneros de la medida mental a los rasgos aparece suavizado en la definición de Messick (1989): "Un rasgo es una característica relativamente estable de una persona –un atributo, proceso duradero o disposición– que se manifiesta consistentemente en algún grado a pesar de variaciones considerables en el rango de contextos y circunstancias" (pág. 15). Por el contrario, la Psicometría funcional defiende como un principio de partida que ningún rasgo o variable psicológica interviniente es relevante. Plantea que dado que es posible definir y medir directamente los comportamientos a los que supuestamente conducen los rasgos, el papel de estos es redundante. Rust y Golombok (1989) contrastan la preeminencia de la Psicometría funcional en la evaluación educativa, con la de la Psicometría de los rasgos para la evaluación clínica; y proponen resolver el enfrentamiento atendiendo a los procesos de toma de decisión que realizan los clientes de la evaluación y de la selección psicométrica: las decisiones se realizan resumiendo la medición en términos de rasgos que reflejan lo que denominan "la psicología popular humana" ("don de gentes", "genio", "liderazgo", etc.). El método de la Psicometría Meliá (1990) plantea que la conexión entre la Psicometría y la psicología matemática, permite considerar el método de la Psicometría desde una doble vertiente: por un lado, en tanto que la teoría psicométrica se refiera a contenidos empíricos, el método no es otro que el método científico propio de toda ciencia empírica; y por otro lado, el componente matemático de los modelos formales de medición, sujeta a la teoría psicométrica, como a la psicología matemática, a los criterios formales de las matemáticas. La relación entre la psicología matemática y la Psicometría ha llevado a algunos autores a defender que el método de la Psicometría es el de la psicología matemática. El esquema elaborado por Jáñez (1989) es la referencia obligada a la hora de presentar el método de la psicología matemática. De manera resumida, dos son las características distintivas del método de la psicología matemática: a) la presentación formal, generalmente en términos matemáticos, del componente teórico; y b) el recurso a procedimientos deductivos 14 basados en la lógica o a procedimientos de simulación a la hora de derivar las consecuencias del modelo matemático. Mención especial merece la simulación, por la preponderancia que está adquiriendo en Psicometría. El papel metodológico de la simulación no resulta fácil de establecer. Muchos campos de la Psicometría la utilizan como técnica de obtención de datos, cuando el problema de investigación hace imposible contrastar el modelo con datos empíricos. Este es el caso cuando se pretende descubrir las propiedades y características de índices estadísticos, métodos de estimación, potencia de contrastes, etc. Además, la simulación preserva también el estatus de método en cuanto generadora de conocimiento. El análisis del método no puede obviar el papel instrumental de la Psicometría como herramienta metodológica para la contrastación empírica de las teorías psicológicas. La aplicación del método científico en psicología obliga a que la Psicometría desempeñe un papel activo en diferentes momentos del proceso. Arnau (1989) articula las relaciones entre el plano teórico y empírico del método científico en tres niveles: el nivel teórico-conceptual, que abarca desde el planteamiento del problema hasta la formulación de hipótesis empíricamente contrastables; el nivel técnico-metodológico que abarca el plan de investigación y la estrategia de recogida de datos; y el nivel estadístico-analítico, donde se realiza la modelización estadística de los datos y las inferencias sobre las hipótesis sometidas a contrastación. La generalización de los resultados hace retornar la aplicación del método al nivel teórico-conceptual con lo que se cierra el ciclo. La Psicometría acompaña a la aplicación del método en cada uno de los tres niveles. El nivel teórico conceptual recoge a teoría que contextualiza el problema de investigación. La teoría debe incluir la definición operacional y "sintáctica" de los constructos implicados en las hipótesis. A su vez, la teoría condiciona la elección del modelo de escalamiento y, por tanto, de las condiciones métricas que se exigirán a las mediciones. La red nomológica desempeña además un papel crucial durante la elaboración de tests para determinar la utilidad de las puntuaciones obtenidas. El nivel técnico metodológico implica la construcción o selección de los instrumentos de medida idóneos para la medición de los constructos de interés. La Psicometría debe guiar el proceso de elaboración de instrumentos, teniendo en cuenta la teoría psicológica y el modelo de medida seleccionados en el nivel teórico-conceptual. Dentro del nivel estadístico analítico, las propiedades métricas de las mediciones valoradas en el nivel anterior, condicionarán la 15 modelización estadística de los datos y la elaboración de proposiciones a partir de los resultados. Por ejemplo, la información sobre la fiabilidad y validez de las mediciones, condicionará la generalización de los resultados en el regreso del proceso de investigación al nivel teórico conceptual. Los contenidos de la Psicometría Hay un consenso amplio en la disciplina sobre cuales son los contenidos propios de la Psicometría. Las diferencias entre las propuestas de los autores responden a las distintas tradiciones de investigación de las que procedan o a diferencias en las estrategias de estudio de una misma temática. Si se unen las diferentes versiones de la teoría de los tests bajo una denominación común, se obtiene la división en tres grandes grupos de los contenidos psicométricos: teoría de la medición, escalamiento y teoría de los tests. Los dos primeros contenidos han sido o serán objeto de un tema en el programa de la asignatura. La teoría de los tests es introducida en el siguiente apartado. La teoría de los tests La teoría de los tests puede verse como un esquema conceptual formalizado para hacer inferencias a partir de las puntuaciones de las personas en los tests y permitir la toma de decisiones que impliquen el constructo objeto de la medición. La teoría de los tests proporciona los fundamentos para la elaboración y uso de los tests, aportando además las herramientas para examinar las propiedades métricas de las mediciones obtenidas con ellos. La definición de “test” no ha variado de forma significativa conforme evolucionaba la teoría de los tests. Valgan como muestra las definiciones de Anastasi o Lord. Para Anastasi (1968), un test psicológico es esencialmente una medida objetiva y tipificada de una muestra de conducta; para Lord (1980) “un test psicológico o educativo es un instrumento para obtener una muestra de conducta” (pág. 3). La definición de Yela (1996) expresa en términos más generales la finalidad de los tests como “un reactivo que aplicado a 16 un sujeto revela y da testimonio de la índole o grado de su instrucción, aptitud o manera de ser” (pág. 249). (definición de test) La mayoría de los profesionales de la medición psicológica coinciden en que las características definitorias de un test psicológico son: Procedimiento o instrumento estandarizado. Los tests plantean a las personas evaluadas una serie de tareas previamente determinadas, a las que deben responder siguiendo unas instrucciones fijadas de antemano y, de forma habitual, en un contexto controlado. Obtención de muestras de conducta. Los tests están diseñados para la obtención de los comportamientos reveladores del constructo objeto de la medición. Asignación numérica. Los tests deben permitir la cuantificación objetiva de acuerdo con unas reglas establecidas. Dispone de información sobre la calidad de las mediciones. Los autores de los tests y, en algunas circunstancias, los usuarios deben aportar información técnica sobre la precisión y relevancia para el objetivo de la evaluación de las mediciones aportadas por el test. Se han elaborado diversas clasificaciones de los tests utilizando diferentes criterios. Crocker y Algina (1986) ofrecen una clasificación útil de los tests atendiendo al carácter general de la tarea que deben realizar las personas: tests de ejecución óptima, en los que se instruye a la persona para que conteste lo mejor que pueda (incluiría los tests de inteligencia, aptitudes y rendimiento); y tests de ejecución típica, que demandan de la persona información sobre sus actitudes, sentimientos, intereses, etc., donde se incluirían los cuestionarios e inventarios de personalidad. Las definiciones de Anastasi y Lord utilizan la expresión “muestras de conducta” que sintetiza la finalidad última de la teoría de los tests. Crocker y Algina (1986) enumeran los problemas por los que la medida psicológica está contaminada por el error: Ausencia de una aproximaciones únicas a la medición de la mayoría de los constructos. El problema reside básicamente en las diferencias en las definiciones operacionales de la mayoría de las variables psicológicas, lo cual suele conducir a procedimientos diferentes de medida y distintas conclusiones sobre la evaluación de una misma persona. 17 Muestreo limitado del comportamiento. La mediciones suelen basarse en un número limitado de comportamientos, obtenidos en un muestreo reducido de situaciones y momentos temporales. Así, determinar, por ejemplo, el número de ítems y la variedad de los contenidos de un test es uno de los problemas habituales en la elaboración de los procedimientos de medida. Presencia inevitable de los errores de medida. Las limitaciones “muestrales” en la obtención de los comportamientos indicadores obliga a estimar el grado de error presente de forma inevitable en cualquier medición. Evolución de las teorías psicológicas. Al ser los constructos “herramientas conceptuales” para la elaboración de teorías, el significado de las mediciones siempre estará sujeto a la evolución de la teoría de la que forma parte, dependiendo de la obtención de evidencias que la confirmen o modifiquen. La finalidad de la teoría de los tests es aportar soluciones para minimizar el impacto de estos problemas sobre la medición psicológica (Martínez-Arias, 1995). La imposibilidad de observar de forma directa la mayoría de las variables psicológicas obliga a considerar la teoría de los tests como una maquinaria conceptual para la inferencia psicométrica. ¿En qué consiste la inferencia psicométrica? La elaboración de ítems debe reflejar la definición operacional y sintáctica del constructo objeto de la medición (Lord y Novick, 1968). El papel de los ítems es el de provocar que las respuestas de las personas en una situación estandarizada, reflejen la conductas que en situaciones “espontáneas”, se considerarían los indicadores conductuales del constructo. La cuantificación se produce cuando a través de un procedimiento de escalamiento se asignan valores cuantitativos a los patrones de repuesta de las personas en el test. Sobre la inferencia, desde el valor cuantitativo o puntuación resumen de la ejecución de la persona hasta el constructo, pueden incidir diferentes fuentes de variabilidad “no deseada”, por no relacionada con el constructo objeto de la medición, que pueden amenazar la corrección de la inferencia: fuentes de variabilidad aleatoria, que tradicionalmente se agrupan bajo la denominación general de “fiabilidad”; y fuentes de variación sistemática, agrupadas bajo la etiqueta de “validez”. El objetivo principal de la teoría de los tests es estudiar este proceso de inferencia y aportar procedimientos para realizarla (Crocker y Algina, 1986). Este objetivo ha hecho que bajo la denominación “teoría de los tests” tengan cabida contenidos tan diversos como: construcción de tests, elaboración de ítems, análisis de ítems, métodos de puntuación e interpretación de las puntuaciones y, de forma 18 preponderante, el análisis de la fiabilidad y validez de las medidas aportadas por los tests. La teoría de los tests suele dividirse en dos grandes ramas: la teoría clásica de los tests y la teoría de respuesta a los ítems. La cita de Hambleton y van der Linden (1982) expresa con toda claridad esta división: “Las teorías de los tests pueden dividirse en dos grandes categorías. La primera es la teoría clásica de los tests, que parte de la concepción de Spearman de la puntuación observada en el test como compuesta de un componente verdadero y otro de error... Importantes hitos en esta larga y venerable tradición son Theory of mental tests de Gulliksen (1950) y Statistical theories of mental test scores de Lord y Novick (1968)... La segunda es la teoría de respuesta al ítem, o teoría del rasgo latente, como se ha llamado hasta hace poco. Actualmente la teoría de respuesta al ítem esta teniendo un mayor impacto en el campo de los tests” (pág. 373). Bibliografía Anastasi, A. (1968). Psychological testing. New York: MacMillan. Anastasi, A. y Urbina, S. (1997). Psychological Testing (7ª ed.). Englewood Cliffs, NJ: Prentice-Hall. Arnau, J. (1989). Metodología de la investigación y diseño. En J. Arnau y H. Carpintero (Eds.). Historia, teoria y método. Madrid: Alhambra Universidad. Canpintero, H. (1996). Historia de las ideas psicológicas. Madnd: Pirámide. Cronbach, L.J. y Meehl, P.E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302. Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston. Hambleton, R.K. y van der Linden, W.J. (1982). Advances in IRT and applications: An introduction. Applied Psychological Measurement, 6(4), 373-378. Lord, F.M. (1980). Applications of item response theory to practical testing problems. Hillsdale, New Jersey: Lawrence Erlbaum Associates. Lord, F.M. y Novick, M.R (1968). Statistical theories of mental test scores. New York: Addison-Wesley. Martínez-Arias, R (1995). Psicometría: Teoría de los tests psicológicos y educativos. Madrid: Síntesis. Meliá, J.L. (1990). La construcción de la Psicometría coma ciencia teórica y aplicada. Valencia: Cristóbal Serrano. Messick, S. (1989). Validity. En Linn, R.L. (Ed.). Educational measurement. New York: MacMillan. 19 Muñiz, J. (1991). Introducción a los métodos psicofísicos. Barcelona: PPU. Muñiz, J. (1998). La teoría clásica de los tests. Madrid: Pirámide. Nunnally, J. C. (1973). Introducción a la medición psicológica. Buenos Aires: Paidós. Rust, J. y Golombok, S. (1989). Modern psychometrics: The science of psychological assessment. London: Routledge. Thorndike, R. M. (1997). The early history of intellegence testing. En D. P. Flanagan, J. L. Genshaft y Harrison, P.L. (Eds.), Contemporary intelectual assessment, theories, tests and issues, (pp. 3-17). New York: The Guildford Press. van der Linden, W. J. (1986). The changing conception of measurement in education and psychology. Applied Psychological Measurement, 10, 325-332. Yela, M. (1968). Apuntes de psicometria y estadística. Madrid: Universidad Complutense de Madrid.