MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA UNIDAD I ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL 1 Introducción ...............................................................................................2 La evaluación psicológica en la antigüedad..............................................2 Antecedentes científicos de la evaluación psicológica .............................4 Constitución y desarrollo de la evaluación psicológica .............................7 La contribución de Galton......................................................................7 La contribución de Cattell ......................................................................8 La contribución de Binet ........................................................................8 Aportaciones de otros autores.................................................................10 La repercusión de la primera y de la segunda guerra mundial ...............10 Período de crisis de la evaluación psicológica....................................14 La evaluación conductual ........................................................................17 La evaluación psicológica en la actualidad .............................................20 Crisis de la evaluación conductual ......................................................20 Otros aspectos de actualidad ..............................................................21 Futuro de la evaluación psicológica ........................................................25 Lectura 1 Buela, G. y Sierra, J. (1997). Evolución histórica de la evaluación psicológica. En G. Buela y Sierra (dirs.). Manual de evaluación psicológica. Madrid:Siglo XXI. UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA INTRODUCCIÓN El estado actual de la evaluación psicológica es, sin duda, un producto de la evolución histórica de la disciplina y de su interacción con el desarrollo de la propia psicología y otras ciencias afines. Por tanto, no cabe adentrarse en el concepto de evaluación psicológica, sin pasar previamente por un análisis histórico. De hecho, los distintos autores, tanto españoles (Pelechano, 1976, 1988; Silva, 1982, 1985; Blanco, 1986a, 1990; Martorell, 1988; Avila, 1992a; Fernández-Ballesteros, 1992; Peñate, Matud e Ibáñez, 1993) como extranjeros (Anastasi, 1973, 1988; Aiken, 1985; Nelson y Hayes, 1986; Goldstein y Hersen, 1990a; Thorndike y cols., 1991; Kaplan y Saccuzzo, 1993) que han tratado el concepto de evaluación psicológica, han comenzado por un minucioso análisis histórico. McReynolds (1986) justifica este análisis histórico argumentando varias razones; en primer lugar, un conocimiento de la evolución histórica de la evaluación ofrece una amplia información y una mejor apreciación del estado actual de la evaluación psicológica; en segundo lugar, el pasado es importante por sí mismo, ya que forma parte de la herencia de la humanidad; y, en tercer lugar, hace posible que algunas aproximaciones o directrices empleadas por nuestros antecesores, y olvidadas desde entonces, vuelvan a ser descubiertas. LA EVALUACIÓN PSICOLÓGICA EN LA ANTIGÜEDAD Al examinar la historia de la humanidad, McReynolds (1986) pretende poner de manifiesto que, desde los tiempos más antiguos, en todas las sociedades civilizadas se utilizó algún procedimiento de evaluación. Así, dentro de una primera etapa, que podría etiquetarse como mágica o mítica, aparece en muchas culturas la adivinación o predicción del futuro, donde podría incluirse la astrología. Ésta es considerada por diversos autores (McReynolds, 1986; Silva, 1985; Pelechano, 1988) como uno de los primeros antecedentes de la evaluación psicológica. Según McReynolds (1975), el comienzo de la astrología podría situarse en el siglo v. a C. con el Tetrabiblos (libro de los signos zodiacales) de Ptolomeo. Los astrólogos plantean que de igual forma que los astros regulan la ritmicidad del ciclo día-noche, de las mareas, de las cosechas, etc., también determinan una gran parte de la conducta humana -entiéndase carácter humano-. En otras palabras, los individuos 2 son particularmente sensibles a la influencia de los astros, estando dicha influencia determinada por la posición relativa de los planetas en el momento del nacimiento. A primera vista, parece que se dan las condiciones necesarias para un proceso diagnóstico, puesto que existe un evaluador, un evaluado, unos instrumentos, una intención por la explicación y el pronóstico y una teoría que lo sustenta. Sin embargo, un análisis más detallado nos lleva a entender la astrología como algo considerablemente distinto de la evaluación psicológica, para que pueda considerarse un antecedente. En primer lugar, la astrología es una práctica que podría incluirse dentro de lo mágico; en segundo lugar, el sujeto objeto de evaluación no es el individuo en sí, ni su ambiente inmediato, sino tan sólo una fecha, una hora y un lugar, de hecho se puede hacer una predicción sin la presencia de la persona supuestamente evaluada; en tercer lugar, no tiene ninguna utilidad social, puesto que se limita a predecir el destino determinado por los astros; y, por último, la astrología ha tenido una mínima o escasa evolución desde sus inicios hasta la actualidad, sin darse ningún tipo de interacción con la evolución de la psicología, es decir, la psicología se ha desarrollado con total independencia de la astrología. Muestra de ello es que ningún astrólogo ha ido desarrollando su teoría hasta convertirla en una escuela o corriente psicológica. Por tanto, no hay aspectos de la astrología que se hayan transformado hasta convertirse en un constructo psicológico. En definitiva, en nuestra opinión, aunque aparentemente tienen aspectos comunes, consideramos que la astrología no ha sido un antecedente de la actual evaluación psicológica. DuBois (1970) sitúa el nacimiento de la evaluación psicológica en la antigua China, donde se realizaba una selección de los niños que en el futuro podrían ejercer funciones en la administración pública. Los seleccionados eran sometidos a un intenso programa de aprendizaje, al final del cual se evaluaba si habían conseguido la capacitación para ocupar los puestos que les serían asignados. Por tanto, parece un claro antecedente de la selección de personal. Otro hecho aislado que se suele citar como antecedente de la evaluación psicológica son los procedimientos de la escuela de Pitágoras para seleccionar a sus alumnos (Martorell, 1988). Otro antecedente en el que suelen coincidir los autores que han estudiado la evolución histórica de la evaluación psicológica es la fisiognomia (las características psicológicas de un individuo pueden UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA evaluarse por sus rasgos físicos), que tiene sus raíces en el pensamiento filosófico griego. Según Rubinstein (1981), la historia de la ciencia demuestra cómo las antiguas ideas de los filósofos griegos se formaron en el proceso cognoscitivo práctico del hombre, con la acumulación de conocimientos de los naturistas, médicos y filósofos. Dichas ideas se desarrollaron en oposición a las ideas mitológicas sobre el mundo en general y sobre el hombre en particular. En este contexto, resulta de especial importancia la concepción filosófica de Aristóteles, quien aspira a vencer el dualismo de su maestro Platón. Aristóteles entiende el cuerpo y el alma como algo indivisible. Por tanto, cada una de las funciones orgánicas tiene su alma, considerando al cuerpo un organismo compuesto por órganos e instrumentos del alma. Por ello, la teoría del alma es la teoría general de la vida y sus funciones, lo que implica tanto sus funciones orgánicas como la vida consciente (Rubinstein, 1981). Con Aristóteles, lo psíquico se aproxima a lo físico, lo que implica una base biológica del carácter. Las ideas de Aristóteles tuvieron su continuidad en su discípulo Teofrasto. Este hace una sistematización de los principios de la fisiognomia que lleva a plantear distintos caracteres que se establecen por medio de la observación de la conducta manifiesta de los individuos. Se establece así una nosología de los caracteres, en la que se incluyen diversos adjetivos tales como arrogantes, estúpidos, avaros, cobardes, etc., que servían para clasificar a los individuos según sus hábitos. Esta interacción cuerpopsique es defendida posteriormente por Cicerón y Séneca en la Roma Clásica, así como por autores árabes como Averroes o Avicena. La idea de la evaluación de las características psicológicas a través de las características somáticas está presente en tiempos más recientes en las tipologías de Kretschmer y Sheldon. Siguiendo en este contexto, nos encontramos con la teoría de Hipócrates que postula cuatro tipos (sanguíneo, flemático, colérico y melancólico) a partir de cuatro clases de humores. Esta concepción naturalista manifestada por una evaluación psicológica a partir de características somáticas (propia de la fisiognomía y del pensamiento hipocrático) será frenada en la Edad Media por la filosofía teológica, que tendrá su máximo exponente en la concepción de la locura como una posesión diabólica. Con el fin de diferenciar a los sujetos poseídos de aquellos que no lo estaban se publica en 1486 el libro Malleus Malleficarum [El martillo de los herejes], en cuya segunda parte se describen los signos que permitían identificar a las 3 brujas. Estos procedimientos utilizados por la Inquisición para evaluar, o mejor dicho para interrogar, a sus víctimas podrían ser considerados un antecedente remoto de la entrevista estructurada (Zubin, 1989). A caballo entre los antecedentes filosóficos y biológicos se encuentra la contribución más importante de este período a la evaluación psicológica, la obra de Juan Huarte de San Juan Examen de ingenios para las ciencias, publicada en 1575 y traducida al inglés, en 1698, con el título The tryal of wits (McReynolds, 1986). En España se reeditó en cinco ocasiones hasta que en 1581 fue incluida en el catálogo de libros prohibidos de Lisboa y dos años después en el de Madrid. Siguiendo las correcciones de la Inquisición, Huarte redacta una nueva versión que es publicada por su hijo Luis Huarte en 1594. Esta versión tiene bastantes erratas, quizás debido a lo desordenado que dejó el material antes de morir. Sin embargo, fue la versión utilizada en las ediciones posteriores que se hicieron en España, mientras que las ediciones realizadas en Holanda fueron de la edición original. Este libro fue traducido al latín, inglés, holandés, italiano, francés y alemán (García Vega, 1989; Velarde, 1993). En esta obra se plantea por primera vez la evaluación de una forma explícita. Se considera que las personas difieren en cuanto a su talento y que dichas diferencias deben evaluarse para conseguir una adecuación entre las habilidades, las distintas ocupaciones y los tipos de educación. Así, considera que el ambiente influye en el aprendizaje, por lo que recomienda que los estudios deben realizarse en una ciudad diferente de la que se es natural, pues la influencia de familiares y amigos es un estorbo para el aprendizaje (Pérez-Alvarez, 1991). Su libro es una profesiografía en la que incluye las principales ocupaciones de su tiempo (véase Gondra, 1994). Es, por tanto, el precursor más claro de la selección de personal. En opinión de Carpintero (1989), Huarte de San Juan fue un discípulo de Vives, puesto que ambos compartían la idea de que el ingenio deriva de los humores. Vives ya había planteado anteriormente el tema de la diversidad de los ingenios, las diferentes adaptaciones a los estudios y la importancia social de una educación adaptada a las dotes de los educandos. En su obra El tratado del alma propone la práctica de la observación introspectiva y objetiva para llegar a conocer las funciones del alma. Vives fue considerado por Watson como el padre de la psicología moderna, aunque actualmente se le considera más como un antecedente de la modificación de conducta (Pérez-Álvarez, 1991). UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA Dentro del ámbito universitario, la evaluación surge de forma paralela a la creación de las primeras universidades europeas, donde se realizaban exámenes regulares para la obtención de títulos y distinciones (Anastasi, 1988). En definitiva, quizás el antecedente más claro de la evaluación psicológica sea la tendencia natural del hombre a evaluar a los demás. Podría señalarse un sinfín de posibles antecedentes de la evaluación psicológica; sin embargo, para contextualizar los principales acontecimientos que dieron lugar a los actuales instrumentos de evaluación, no necesitamos remontarnos más allá del siglo XVIII. ANTECEDENTES CIENTÍFICOS DE LA EVALUACIÓN PSICOLÓGICA Los importantes avances científicos ocurridos durante el siglo XVIII, y sobre todo en el xlx, harán que la psicología se separe de la especulación filosófica y se acerque al método científico. Los antecedentes científicos de la evaluación psicológica podrían situarse en el desarrollo de disciplinas como la frenología, la matemática, la psicofísica, la psiquiatría, la psicología educativa y el evolucionismo. La frenología surge a finales del siglo XVIII y pronto alcanza una gran popularidad. Su creador, Gall (1758-1828), proporciona la primera conceptualización sistemática de los rasgos, la cual se apoya en los siguientes enunciados: a) Las facultades mentales son innatas. b) El cerebro es el órgano de la mente. c) La forma y el tamaño del cerebro se pueden conocer según la forma y medida del cráneo. d) La mente posee facultades separadas, el cerebro está compuesto de órganos separados y cada facultad mental se manifiesta por medio de un órgano cerebral distinto. e) El tamaño de cada órgano puede ser estimado durante la vida y, con las restantes condiciones iguales, el tamaño es una medida de la capacidad del órgano. 4 f) Todo órgano, si es predominantemente activo, imprime al cuerpo ciertas actitudes y movimientos, que se denomina "su lenguaje natural". Aunque la frenología ya forma parte de la historia, sirvió para asentar la idea de que la conducta y el organismo no son entidades independientes, sino que están íntimamente unidas. Gall practicaba un sistema de diagnóstico basado en la palpación del cráneo para conocer las facultades dominantes en cada individuo. Entre las aportaciones que, según McReynolds (1986), la frenología aporta a la evaluación psicológica destacan las siguientes: a) Se crea una taxonomía mental, según la cual se pueden explicar las diferencias individuales b) Se hace énfasis en las diferencias individuales. c) Se postula una vertiente aplicada de la psicología. d) Se propone el paradigma de la evaluación, diferenciando los elementos incluidos en una sesión de evaluación (evaluados, sujetos evaluado, perfiles…). e) Se elaboran escalas para evaluar variables de personalidad. f) Se hace énfasis en la objetividad de los datos. En España la frenología estuvo representada por Cubí, quien realizó algunas aportaciones teóricas a esta disciplina y propagó estas ideas hasta el punto de llegar a crear una escuela. Mediante la craneoscopia se diagnosticaban dimensiones y facultades psicológicas en los individuos, de acuerdo con un sistema preestablecido. Según Carpintero (1989), la obra de Cubí ha tenido su importancia en la historia de la evaluación psicológica en España. La matemática tuvo cierta influencia en la constitución y el posterior desarrollo de la evaluación psicológica. La primera aportación está representada por Quetelet, un matemático belga que hoy es considerado como uno de los fundadores de la aplicación de la estadística a las ciencias sociales (Silva, 1982). Quetelet estudió variables biológicas y sociológicas, observando que ambas seguían una distribución gaussiana, por lo que desarrolló normas y medidas de tendencia central. Su influencia sobre la evaluación psicológica se centra en dos aspectos importantes: ser uno de los autores que se interesó de forma sistemática por las diferencias individuales y que sus métodos tuvieron UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA gran influencia en autores importantes como Galton, Pearson y Spearman. La psiquiatría ha sido otra disciplina que ha contribuido en buena medida al desarrollo de la evaluación psicológica. El esfuerzo por diferenciar los trastornos mentales se traduce en la necesidad de técnicas de evaluación para establecer diagnósticos diferenciales. Así, Pinel (1745-1826) introduce una breve clasificación de las enfermedades mentales que posibilitaba un tratamiento más diferenciado. Pinel defiende el valor de las historias clínicas para el diagnóstico. Pero, sin duda, su contribución más importante fue el cambio de actitud sobre los enfermos mentales, pasando a considerarlos como enfermos con derecho a un tratamiento y a la libertad, y no como sujetos que había que separar y encerrar, tal como se consideraban hasta entonces. Las ideas de Pinel llegaron a Italia, encontrando su máximo defensor en Lombroso, quien centró su obra en la relación entre lo penal y lo psiquiátrico, planteando la posible eximente en los delitos cometidos por enfermos mentales. El estudio de la relación entre delincuencia y enfermedad le llevó a postular su famosa teoría sobre la "delincuencia innata". Según esta teoría, la conducta delictiva puede tener un origen degenerativo del organismo, debido al efecto de factores como la sífilis, el alcohol, la epilepsia, la edad avanzada de los padres, etc., los cuales actuarían durante el desarrollo fetal produciendo una degeneración de los centros nerviosos superiores, que posteriormente serían la causa del comportamiento delictivo. La obra de Pinel alcanza su culminación en la figura de Kraepelin (1856-1926), quien se interesó por la problemática de la clasificación de los trastornos mentales, considerando que para poder hacer una buena evaluación e intervención era necesario contar previamente con una clasificación. Quizás su contribución más importante fue el cambio de una concepción sintomática de la enfermedad a una concepción evolutiva, es decir, las manifestaciones externas de la enfermedad son secundarias respecto a su origen y evolución. Su aportación a la evaluación psicológica se centra de forma más concreta en su interés constante por evaluar de forma objetiva la conducta de sus pacientes. Así, evaluaba funciones o aptitudes como memoria, atención, capacidad de aprendizaje, tiempo de reacción, asociaciones verbales, etc. Paralelamente a esta etapa aumenta el interés por los retrasados mentales, creándose en Europa y América numerosas instituciones para su cuidado. El interés por un trato adecuado a los retrasados mentales puso de manifiesto la necesidad de 5 criterios diagnósticos y de clasificación que permitiesen diferenciar entre sujetos normales, enfermos mentales y retrasados. Dentro de este contexto hay que destacar a Esquirol (1772-1840), médico francés que en 1838 publicó una obra de dos volúmenes, en la que dedicó más de un centenar de páginas al retraso mental. Otra contribución importante de Esquirol fue su concepción del retraso mental. Para este autor, el retraso variaba a lo largo de un continuo desde la normalidad hasta el retraso más profundo. Por ello, realizó varios intentos para evaluar y clasificar los distintos grados y tipos de retraso mental, llegando a la conclusión de que el mejor criterio para evaluar el nivel de deterioro intelectual es el uso del lenguaje. Es importante considerar que los criterios actuales sobre el retraso mental son en gran parte lingüísticos, y que los tests de inteligencia suelen estar bastante saturados de contenidos verbales (Anastasi, 1988). Las aportaciones de Seguin, otro médico francés, supusieron un nuevo avance al considerar el retraso mental como curable. En 1837 crea la primera escuela dedicada a la educación de niños retrasados mentales. Muchos de los procedimientos de intervención que se utilizan en la actualidad en los centros de educación especial están fundamentados en las técnicas propuestas por Seguin para el adiestramiento de los sentidos y de la actividad muscular. Pero sin lugar a dudas, su gran aportación a la evaluación psicológica fue la incorporación de las pruebas de inteligencia manipulativa. Una buena muestra ha sido su Test de ajuste de formas, que consiste en una especie de puzzle en el que hay que insertar varias piezas de formas diversas y en el menor tiempo posible. La psicofísica puede considerarse como una disciplina precursora de la psicología científica. Los métodos ideados por Fechner permiten relacionar las experiencias subjetivas con medidas objetivas. Por tanto, se plantea que las experiencias psicológicas se pueden verbalizar y en consecuencia clasificar en escalas de intensidad o discriminación. La psicofísica tenía como postulado inicial el descubrimiento de leyes generales para describir las relaciones mente-cuerpo. Su contribución a la evaluación psicológica se puede observar en el estudio concreto de fenómenos psíquicos, relacionando la experiencia subjetiva con medidas objetivas, la creación de nuevos métodos para la investigación de dichos fenómenos y su sistematización teórica (Zabrodin, 1985). Aunque autores como Fechner y Weber estaban más interesados en leyes generales que en diferencias individuales, con UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA ellos nace la situación de examen psicológico; así por ejemplo, Fechner ya utiliza el autoinforme del sujeto como instrumento de evaluación. La psicología educativa muestra su auge con los planteamientos innovadores producidos en relación al creciente interés por la educación, con la consiguiente escolarización obligatoria, naciendo así la necesidad de aplicar los principios psicológicos a la escuela y, por tanto, la demanda de evaluación del rendimiento académico. Este interés por la evaluación en el ámbito escolar tuvo su continuidad en autores tan relevantes como Thorndike, Hall y Binet. El evolucionismo marca un hito importante en la historia de las ciencias humanas. El parentesco entre Darwin y Galton propició aún más la influencia de las teorías evolucionistas para tratar de explicar las diferencias individuales y, en último término, la inteligencia humana. La base del evolucionismo consiste en admitir la variabilidad de los miembros de una misma especie, donde las características pueden heredarse. Por tanto, en la naturaleza se produce una selección natural a través de la supervivencia de los miembros más fuertes o mejor adaptados. En la especie humana, la diferente capacidad de adaptación se denomina inteligencia. Las diferencias de inteligencia eran perfectamente asumidas en la sociedad del siglo xIX. Así, el darwinismo social servía para justificar el orden social establecido. En este contexto el estudio y evaluación de la inteligencia adquiere gran relevancia (Marrero, Espino y Gámez, 1989). Los antecedentes más científicos de la evaluación psicológica tienen sus raíces en los primeros laboratorios de psicología. En 1877 se produjo el primer intento para fundar un laboratorio de psicofisiología por parte de los científicos británicos Venn y Ward. Sin embargo, el Senado de Cambridge rechazó esta iniciativa, calificando a dichos científicos de ateos (Yakunin, 1985). Dos años más tarde, Wundt inauguraba en Leipzig (1879) el primer laboratorio de psicología, considerándose este momento como el nacimiento de la psicología científica. La idea de Wundt de acercar la psicología a la fisiología, a pesar de encontrar una clara oposición en los círculos filosóficos, pronto ganó adeptos. Sin embargo, esta idea no era nueva, ya que 6 Séchenov, un destacado científico ruso, había tratado de interpretar los fenómenos psíquicos desde un punto de vista fisiológico. De hecho, su libro Reflejos del cerebro fue editado en 1863, es decir, once años antes de que Wundt publicara Bases de la psicología fisiológica. En un artículo escrito en 1873, Séchenov, partiendo de la tradición materialista de los pensadores rusos, defiende la tesis sobre la determinación objetiva de la psiquis. Las ideas de Séchenov tuvieron una gran acogida entre los psiquiatras y neurólogos rusos, lo cual llevó a una reestructuración de la psicología desde una vertiente fisiológica. Una muestra de ello es la creación del primer laboratorio de psicología en Rusia, fundado por Béjteriev en 1886 en la clínica de enfermos alienados y enfermedades nerviosas en la ciudad de Kazán. Pocos años después, en 1891, se constituía la Sociedad Rusa de Psicología Experimental (Yakunin, 1985). Desde su creación y hasta el principio del siglo xx el laboratorio de Wundt se consideró el centro de la psicología experimental, siendo el ejemplo a seguir en la creación de nuevos laboratorios. El objeto de estudio de los nuevos psicólogos experimentales era llegar a plantear descripciones generales de la conducta humana. Las diferencias individuales no sólo no interesaban, sino que llegaban a considerarse como "errores de medida". En la elección de los temas y en algunos métodos utilizados se plasmaba la influencia de la medicina y de la fisiología. Coincidimos con Pelechano (1988) al considerar que el tipo de psicología experimental practicada por Wundt y sus seguidores supuso en realidad una limitación al desarrollo de la evaluación psicológica. Wundt negó la importancia de la psicología diferencial, no autorizaba la utilización de cuestionarios para la investigación psicológica, no aceptaba la posibilidad de una psicología científica fuera del laboratorio ni los estudios filogenéticos y ontogenéticos del psiquismo humano. Sin embargo, no todo fue negativo, puesto que la psicología experimental del siglo XIX sirvió para poner de manifiesto la importancia de controlar de forma rigurosa las condiciones en las que se hacían las observaciones. Por ejemplo, se controlaban las características del estímulo, el contexto en el que se presentaba, las instrucciones que recibía el sujeto, etc. En definitiva, se trataba de evaluar a todos los sujetos en las mismas condiciones tipificadas. Como es bien sabido, esto fue totalmente asumido en el proceso de construcción y en la aplicación de tests (Anastasi, 1988). UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA CONSTITUCIÓN Y DESARROLLO DE LA EVALUACIÓN PSICOLÓGICA Existe un cierto consenso en considerar a Galton, Cattell y Binet como los autores que configuraron la evaluación psicológica como disciplina científica. A continuación se hará referencia a ellos, así como a otros autores que también han contribuido de modo relevante a la constitución de la evaluación psicológica. En segundo lugar, se hará un recorrido por los diferentes acontecimientos que han supuesto el desarrollo de esta disciplina. La contribución de Galton Galton (1822-1911) es considerado como el padre de la psicometría y de la psicología diferencial. A pesar de ser un hombre polifacético en cuanto a sus intereses científicos, supo centrar su investigación sobre la herencia de la inteligencia humana. Pensaba que ésta es innata y, por tanto, mediante el carácter hereditario podía conseguirse una mejora de los individuos a través de la eugenesia. Su laboratorio antropométrico del Kensington Museum en Londres se hizo famoso en todo el mundo. En el año 1884, coincidiendo con la celebración de un congreso internacional de higiene, establece un laboratorio antropométrico y propone a los visitantes conocer, por el precio de tres peniques, la medida de algunos de sus rasgos físicos, la agudeza visual y auditiva, el tiempo de reacción, la fuerza muscular y algunas funciones sensoriales. Con estos datos publicó la primera tabla de baremos, donde podían comparar sus resultados los posteriores visitantes del laboratorio (DuBois, 1970). La mayoría de los instrumentos que se utilizaban en su laboratorio antropométrico fueron creados por él mismo, y algunos siguen vigentes aún en la actualidad, como es el caso de la barra de Galton para la discriminación visual de la longitud y la serie de pesos graduados para medir la discriminación cinestésica. Dio especial importancia a la discriminación sensorial, pues pensaba que ésta servía para evaluar la capacidad intelectual. Así, en las múltiples evaluaciones realizadas encontró que los idiotas tendían a presentar deficiencias en la capacidad de discriminación de la temperatura y del dolor (Anastasi, 1988). 7 Como se ha dicho anteriormente, Galton estaba influido por las ideas de su primo Darwin, influencia que queda plasmada en su primera obra Hereditary genius [La herencia de la genialidad] publicada en 1869. Diez años después, y coincidiendo con el año en que Wundt inauguraba el primer laboratorio de Psicología, Galton publica dos artículos sobre psicometría titulados «Psychometric experiments» y «Psychometric facts». En 1883 publica su obra más importante Inquiries into human faculty and its development [Investigaciones sobre la facultad humana y su desarrollo], que con el transcurso del tiempo se convertiría en un clásico de la evaluación psicológica. Las aportaciones más relevantes de Galton podrían resumirse en los siguientes puntos (Pelechano, 1988): a. Interés por hacer un análisis cuantitativo de las características y diferencias humanas. En este aspecto se notaba una influencia del matemático Quetelet, quien en el año 1846 ya había demostrado cómo ciertos indicadores antropométricos seguían una distribución gaussiana. Por tanto, Galton defendía que las diferencias individuales se podían explicar de forma adecuada si se concebían como continuos cuantitativos que seguían la distribución de la curva de Gauss. b. Interés por la recopilación empírica y sistemática de la información. Esto se demuestra en su infatigable labor en el laboratorio antropométrico del South Kensington Museum de Londres, donde llegó a recopilar datos correspondientes a 9 377 personas que eran evaluadas en un número considerable de pruebas (tiempo de reacción, medidas físicas, respuestas a escalas de calificación...). c. Aplicación de la estadística para interpretar la información. Además de utilizar algunas medidas de tendencia central, Galton introdujo el índice de correlación (de hecho, en el año 1888 llegó a publicar un artículo sobre «Corelations and their measurement, chiefly from antropometric data») que posteriormente sería completado por Pearson, dando lugar al coeficiente de correlación y sobre el cual se asentaría el modelo correlacional. d. Interés por el estudio de las diferencias individuales. Siguiendo la teoría evolucionista, Galton entendía las diferencias individuales como resultado de mecanismos y procesos hereditarios. Para demostrar esto utilizó el estudio de los árboles genealógicos y las correlaciones de pruebas UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA psicológicas entre padres e hijos. Por medio de esta metodología pudo llegar a plantear la ley de regresión a la media. Galton se vio obligado a plantear esta ley para poder explicar algunos datos tales como que padres muy inteligentes tendían a tener hijos menos inteligentes, mientras que padres poco inteligentes tendían a tener hijos más inteligentes. El pensamiento de Galton y un buen resumen de su obra pueden verse en el libro Herencia y eugenesia, en el que se recoge una recopilación de textos procedentes de diversas obras suyas. La contribución de Cattell James McKeen Cattell (1861-1934) fue un psicólogo estadounidense con una sólida formación adquirida en Europa. Su tesis doctoral trató sobre las diferencias individuales en el tiempo de reacción y fue realizada en el laboratorio de Wundt (Leipzig). Posteriormente, trabajó con Galton en el laboratorio antropométrico del South Kensington Museum de Londres. En 1888 fue nombrado profesor de psicología en la Universidad de Pensilvania. Dos años después publica en la revista Mind un artículo titulado «Mental tests and measurements», el cual marca un hito en la historia de la evaluación psicológica, puesto que es la primera vez que se utiliza el término "test" en la literatura psicológica (McReynolds, 1986) y en él se describían los tests que se aplicaban anualmente a los estudiantes universitarios con la intención de evaluar su nivel intelectual. Posteriormente se trasladó a la Universidad de Columbia, donde creó la primera batería de pruebas de evaluación psicológica. En poco tiempo la metodología y el procedimiento para elaborar los tests se hicieron muy populares. En la última década del siglo xIx los tests se aplicaban, en Estados Unidos, a todo tipo de sujetos (escolares, estudiantes universitarios, adultos...). Sin embargo, la fulgurante trayectoria de Cattell se detiene, al menos parcialmente, ante las críticas planteadas por Wissler y Sharp. El primero, que había sido discípulo de Cattell, presentó un detallado estudio en el que analizaba los resultados de Cattell, demostrando la poca validez alcanzada por los tests. En concreto, demostró que los coeficientes de correlación entre los tests psicológicos y las calificaciones escolares eran relativamente bajos. Lo mismo ocurría cuando se contrastaban distintos tests que supuestamente evaluaban lo mismo. Por otra parte, 8 Sharp demostró la baja fiabilidad y el poco valor predictivo que tenían los tests de Cattell (Pelechano, 1988). Estas críticas unidas al hecho de que Cattell sigue vinculado a procedimientos de laboratorio y a la evaluación de procesos psicológicos básicos hace que destaque la figura de Binet (Silva, 1982). La contribución de Binet Binet (1857-1911) era un licenciado en leyes y doctor en ciencias naturales que entró en la psicología de la "mano" de Ribot, el gran promotor de la psicología experimental en Francia. Ribot entendía que el progreso de la psicología estaba en los métodos experimentales (aunque no era un investigador), no en vano fue el fundador del primer laboratorio de psicología en la Universidad de la Sorbona, en el año 1889. Este laboratorio estuvo dirigido por Bonin hasta 1895, a partir de entonces la dirección pasa a Binet (Yakunin, 1985). En el año 1895, Binet funda L'Année Psychologique, la primera revista francesa de psicología. En esta revista publica un artículo, «La psychologie individuelle», en el que presenta las bases para una nueva aproximación a la evaluación de la inteligencia. Binet compartía con Galton el interés por la evaluación de las diferencias individuales, pero rechazaba la idea de que la inteligencia humana podía evaluarse por medio de los procesos sensoriomotores. En su artículo, Binet y Henri defienden que la inteligencia debe evaluarse según el rendimiento de los sujetos en diversas tareas que impliquen una variedad de procesos mentales complejos (McReynolds, 1986). Binet y Henri comenzaron evaluando procesos como la memoria, la atención, la imaginación, la comprensión, la sensibilidad artística y moral, la sugestibilidad, la fuerza de voluntad y la habilidad motora. Binet incluye como características de la conducta inteligente el tomar y mantener una dirección definida, el adaptarse para alcanzar un fin y la autocrítica (Cronbach, 1990). La gran oportunidad de Binet llega cuando es nombrado por el Ministerio de Educación francés miembro de la comisión que se encargaría de buscar una solución para los niños deficientes que habían entrado en la escuela pública como consecuencia de la puesta en vigor de la enseñanza obligatoria en Francia. En respuesta a esta petición, Binet, en colaboración con Simon, desarrolla una escala que contiene 30 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA problemas con grado de dificultad creciente. Para calcular el nivel de dificultad se aplicó la escala a 50 niños normales con edades comprendidas entre 3 y 11 años y a algunos con retraso mental. El contenido de los ítems cubría gran variedad de funciones, aunque predominaban los problemas relativos a comprensión y razonamiento. La prueba resultante que se conoce como la escala de 1905 fue considerada como un instrumento de evaluación provisional (Anastasi, 1988). Como señala Pichot (1994, p. 120) «por primera vez se había salido de la era de las experiencias de laboratorio para entrar en la vida c o n c r e t a » . Binet y Simon siguen trabajando en esta escala, y en 1908 presentan una segunda versión en la que se habían adaptado series de ítems para grupos de edad. La edad mental se establecía según la edad correspondiente a la serie más elevada resuelta totalmente. Puesto que cada serie, que se corresponde con una edad mental determinada, consta de cinco problemas, se añadía a la edad base (la de la serie correctamente realizada en su totalidad) 1/5 de año por cada test bien resuelto perteneciente a series superiores. La edad mental obtenida se ponía en relación con la edad cronológica, viendo de esta forma si el niño seguía una evolución normal, retrasada o adelantada. En 1911, se presenta una tercera versión de la escala, se aumentó el número de ítems en algunos niveles y se extendió a la edad adulta. Sin embargo, la versión más difundida fue la realizada por Terman en la Universidad de Stanford, conocida como la E s c a l a de Stanford-Binet. En ésta se utiliza por primera vez el término de «cociente intelectual» (CI), como razón resultante de dividir la edad mental por la edad cronológica. Posteriormente, aparecieron otras versiones, pero resulta de especial interés la realizada por Kuhlmann en 1912 ( E s c a l a K u b l mann-Binet) que extendió la escala por su parte inferior hasta la edad de tres meses, siendo revisada posteriormente en 1937 y 1960'. Terman efectúa otras dos revisiones y, finalmente, Thorndike realiza la última hasta la fecha, en 1986 (Rogers, 1995). Sin embargo, estas escalas no estaban exentas de problemas. Así, mientras Galton postulaba la medida de una inteligencia innata o biológica, Binet defiende la evaluación de una inteligencia de origen social (Luján, 1991). Pronto el movimiento eugenísta toma como instrumento el test de Binet y Símon identificando la inteligencia innata con la social. Pelechano (1988) señala que la lógica utilizada por Binet en la construcción e interpretación de la escala era correcta, pero vista desde una óptica actual tenía algunos problemas importantes: 9 a. No se demostró que las conductas muestreadas fuesen representativas de lo que se pretendía evaluar (la capacidad intelectual). b. La muestra utilizada para la tipificación de las puntuaciones no era representativa de la población a la que luego se aplicaba. c. La utilización de la edad cronológica como variable criterio para graduar la edad mental, haciendo así implícito que cada doce meses se produce un cambio en la capacidad intelectual. d. El modelo acumulativo según el cual cada problema resuelto equivale a un período de edad mental no fue demostrado. e. El supuesto de que la distribución de las puntuaciones es igual en cada grupo de edad no es correcto. f. Se supone que todos los niños tienen un desarrollo normativo, es decir, igual al del grupo de referencia. Por otra parte, el tipo de problemas que se planteaba estaba íntimamente relacionado con los contenidos académicos, por lo que la escala era buena predictora del rendimiento académico, que no es lo mismo que capacidad intelectual. A pesar de los problemas metodológicos que se detectan en las escalas de Binet, éste debe ser considerado como el gran propulsor de la evaluación psicológica. Su actividad ha sido realmente la de un evaluador y su influencia ha estado vigente durante varias décadas. Una buena muestra de ello fue la cantidad de investigadores que se interesó por la evaluación de la inteligencia durante las dos primeras décadas del siglo XX. La producción en este campo era tan abundante como diversificada. Por ello, en 1921 los directores del Journal of Educational Psychology organizaron un congreso bajo el título La inteligencia y su medida e invitaron a distintas autoridades en la materia (Terman, Thorndike, Peterson, Thurstone, Woodrow, Pinter, Colvin, Henmon...) para tratar sobre la naturaleza de la inteligencia (Sternberg, 1986). El resultado fue decepcionante; había casi tantas concepciones de inteligencia como expertos que opinaban sobre el tema. El desconcierto era tal que Binet llegó a pronunciar la famosa frase «inteligencia es lo que miden los tests». Sin embargo, el congreso sirvió para establecer un cierto acuerdo acerca del camino a seguir en la futura investigación de la inteligencia (Marrero y cols., 1989). UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA Desde entonces, han pasado más de setenta años y aún no se ha llegado a un acuerdo unánime acerca de lo que es la inteligencia y de cómo debe evaluarse (Eysenck, 1991). APORTACIONES DE OTROS AUTORES Cuando Cattell abandonó la Universidad de Pensilvania su lugar fue ocupado por Witmer (1867-1956) quien, al igual que el anterior, estaba interesado en el estudio de las diferencias individuales. Sin embargo, su principal interés se centraba en la aplicación práctica de los conocimientos psicológicos. En el año 1896, Witmer funda la primera clínica psicológica (de hecho suele considerarse esta fecha como el nacimiento de la psicología clínica, aunque por ello no debe interpretarse que Witmer fue el primer psicólogo clínico). El tipo de trabajo que se realiza en esta clínica se recoge en los primeros números de la revista The Psychological Clinic, fundada en 1906 y dirigida por Witmer. La mayoría de los casos que se trataba procedía del ámbito escolar. En los primeros años, no disponía de pruebas específicas de evaluación por lo que su diagnóstico se basaba fundamentalmente en la entrevista. Posteriormente, cuando aparecen los tests, adopta alguno de ellos e incluso crea el Witmer formboard y el Witmer cylinders, que fueron utilizados durante varios años en su clínica. Se centraba en la evaluación de conductas específicas de los sujetos con vistas al tratamiento de dichas conductas. Por ello, se le ha considerado como un antecesor de la evaluación conductual (McReynolds, 1986). Witmer fue un autor con una influencia limitada en la evaluación psicológica. Sin embargo, su gran mérito fue tratar de aplicar la psicología a los problemas que se plantean en la vida real. Por otra parte, su clínica psicológica sirvió como modelo a otras muchas que se fundaron posteriormente. Spearman (1863-1945) supone otro paso importante en la constitución de la evaluación psicológica por haber aplicado los métodos correlacionales a la investigación de la inteligencia. En el año 1904 publicó un importante artículo titulado «General intelligence, objectively determined and measured», donde se sientan las bases de la teoría psicométrica. Fue el primer autor que se interesó en buscar una explicación a la baja correlación que se obtenía entre distintos tests de inteligencia y en plantear la necesidad de utilizar pruebas paralelas para 10 su evaluación. La gran aportación de Spearman no sólo fue metodológica, sino que además fue el autor de la primera gran teoría de la inteligencia, denominada teoría de los dos factores (un factor general y unos factores específicos). Según dicha teoría, la capacidad representada en el factor general (factor g) está relacionada con todas las tareas intelectuales, mientras que las capacidades representadas en los factores específicos se relacionan con tareas sencillas. Para explicar la naturaleza del factor g Spearman propuso dos teorías. En la primera, se decía que el factor g estaba relacionado con el nivel de energía cerebral que las personas pueden utilizar para resolver problemas intelectuales; la segunda considera que las diferencias en el factor g pueden explicarse según las diferencias individuales en la capacidad de las personas para utilizar tres principios cualitativos de cognición: aprehensión de la experiencia, deducción de relaciones y deducción de correlaciones (Sternberg, 1986; Marrero y cols., 1989). En la década de los años treinta este esquema bifactorial será sustituido por un modelo multifactorial representado por Thurstone. Por último, Freud (1856-1939) plantea un enfoque diagnóstico basado en las técnicas de asociación y en la utilización del simbolismo. En 1909 sus conferencias en la Clark University of New York propiciarán la difusión del psicoanálisis en Estados Unidos (Ávila, 1992b), dando lugar al diagnóstico dinámico que se desarrollará a partir de la década de los años treinta con el uso de las técnicas proyectivas. LA REPERCUSIÓN DE LA PRIMERA Y DE LA SEGUNDA GUERRA MUNDIAL Existe un cierto acuerdo entre los diferentes autores en considerar las dos contiendas mundiales como hechos determinantes en la evolución de la evaluación psicológica, enmarcándose entre esos dos momentos históricos lo que Silva (1982) denomina la "época clásica" del diagnóstico psicológico; así, según este autor, tanto la línea psicométrica como la proyectiva y la clínica de la actual evaluación psicológica viven aún de los grandes hitos de esta época: los grandes tests de inteligencia, los primeros cuestionarios de intereses y los primeros tests proyectivos. Durante las dos primeras décadas del siglo xx, la evaluación psicológica se vio enriquecida por un gran número de investigaciones, artículos y manuales sobre el tema, como puede verse de forma UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA detallada en McReynolds (1986). El desarrollo alcanzado por la evaluación psicológica hasta entonces es interpretado por Silva (1982) en función de tres aspectos importantes: a. La construcción y perfeccionamiento de las pruebas de Binet-Simon y las posteriores aportaciones de Goddard (traductor de las escalas de Binet-Simon al inglés en 1910), Stern (introductor del concepto cociente mental) y Terman (autor de la versión de la escala Stanford-Binet de 1916 e introductor del concepto cociente intelectual). b. La importancia que adquiere la educación (fundamentalmente a raíz de la entrada en vigor de las leyes que regulan la educación obligatoria en varios países) lleva consigo un interés creciente de la evaluación psicológica en el ámbito educativo. c. La gran aportación metodológica de Pearson y Spearman que sientan los fundamentos de una teoría psicométrica, vigente aún en la actualidad. Por otra parte, la teoría de la inteligencia propuesta por Spearman generó diversas líneas de investigación acerca de la naturaleza de la inteligencia y de los instrumentos para evaluarla. Con el comienzo de la primera guerra mundial, la industria generada en torno a la guerra afecta también a la psicología, y más concretamente a la evaluación psicológica. Así, la American Psychological Association (APA) nombró un comité que se encargaría de estudiar la posible ayuda que podría ofertar la psicología. Era quizás una buena oportunidad para demostrar a la sociedad que la psicología podía tener una importante vertiente aplicada. El comité estaba dirigido por Robert Yerkes y contaba con miembros tan relevantes como Terman, Woodworth y Otis, entre otros. Pronto se vio la necesidad de seleccionar a más de un millón de soldados, para lo cual era imprescindible disponer de pruebas colectivas que permitiesen clasificar a los soldados según su nivel intelectual y sus aptitudes para desempeñar uno u otro tipo de servicio. Dado que la mayoría de los tests existentes era de aplicación individual, fue necesario recurrir a todo tipo de tests que se pudiesen aplicar de forma colectiva. Arthur Otis puso a disposición del Ejército una serie de tests que estaba elaborando, pero que aún no había llegado a publicar. En cierto modo 11 podría decirse que la situación era similar a la que se le había planteado unos años antes a Binet, aunque había dos diferencias muy claras: el equipo de Yerkes tenía que seleccionar sujetos adultos de una población general (piénsese que la mayoría de las pruebas estaba elaborada para niños y estudiantes universitarios) y además la selección debería hacerse "contra reloj". Se necesitaban pruebas de dificultad progresiva, con respuestas cortas, corrección rápida y objetiva, con diferentes formas (para evitar el aprendizaje) y de aplicación colectiva. Las pruebas construidas para evaluar el nivel intelectual fueron conocidas como el Army alpha test y el Army beta test. La primera se aplicaba a la población general (instruida) y constaba de las siguientes subpruebas: cumplir órdenes, problemas aritméticos, sinónimos y antónimos, juicios prácticos, analogías, información y gramática. Cada subprueba tenía una dificultad creciente y debía responderse en un tiempo limitado. La segunda prueba estaba pensada para personas analfabetas o personas que no hablaban inglés; por tanto, en ésta no se incluían contenidos verbales, sino que constaba de laberintos, series, cubos, puzzles, construcciones geométricas, cifras, símbolos y números. Por supuesto, el tiempo para responder también era limitado. Para evaluar la sintomatología neurótica se utilizó el Woodworth personal data sheet, un inventario de personalidad elaborado por Woodworth y que llegó a aplicarse a más de un millón y medio de personas. La influencia de todo este proceso ha tenido gran importancia en el desarrollo de la evaluación psicológica en diversos aspectos, que intentaremos sintetizar en los siguientes puntos: a. El primero, y quizás el más importante, ha sido considerar la figura del psicólogo como un profesional cualificado que puede resolver problemas de la vida real. b. El perfeccionamiento de la metodología de la construcción de tests y la formación de un gran banco de datos (más de un millón y medio de sujetos) de la población general. c. El tipo de evaluación realizada en el ejército se adaptó a campos como el industrial (selección y evaluación de personal) y el clínico. d. La consolidación de la aplicación de tests con la consiguiente connotación del "psicólogo pasador de tests". UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA La evaluación psicológica del período entre las dos guerras mundiales es caracterizada por Silva (1982) como de «creciente expansión» y «creciente disociación». La «creciente expansión» se refiere a la universalización de la evaluación psicológica y su generalización a otros ámbitos (distintos del militar) y la especialización de la evaluación en áreas tan diversas como inteligencia, aptitudes, motricidad, intereses, conducta social, personalidad, etc. La «creciente disociación» hace referencia a que, por un lado, se produce un espectacular crecimiento del modelo psicométrico y, por otro, surge también con gran fuerza una evaluación clínica, principalmente de tipo proyectivo, y que no acepta los avances técnicos y metodológicos del modelo psicométrico. Esta evaluación de corte clínico no surge al azar después de la primera guerra mundial. Por un lado, los instrumentos de evaluación clínica no tenían ninguna utilidad en las tareas de selección y colocación requeridas por el ejército estadounidense, pero sí se convierten en necesarios después de la guerra para la reinserción de sujetos a la sociedad. La difusión de las técnicas proyectivas tiene su inicio en la publicación por parte de Rorschach en 1921 de Psychodiagnostik, aunque no conviene olvidar que Jung ya había presentado en 1904 la prueba de asociación libre de palabras. Los antecedentes del test de Rorschach pueden remontarse a la antigua idea griega de que la interacción de una persona con una entidad ambigua facilita información para el conocimiento de la primera. Según Álvarez (1972), en sus versiones más primigenias, el test de Rorschach es tan antiguo como el hombre de Cro-Magnon, cuando interpretaba las "manchas" de aquellos refugios rupestres. En el Renacimiento, Leonardo da Vinci aconsejaba a sus discípulos que ejercitaran su imaginación contemplando los desconchones o las figuras que la humedad dibujaba en las paredes. También puede relacionarse con una costumbre arraigada en algunas regiones de Alemania que consistía en tirar una gota de plomo fundido en un recipiente de agua fría e interpretar la forma resultante al solidificarse. Según la tradición, cuando la interpretación se realizaba en la noche de San Silvestre podía averiguarse el futuro de la persona que arrojaba el plomo fundido. Pero sin duda, el antecedente más claro es la técnica denominada klebsografía (desarrollada por Klebs) que consiste en echar unas gotas de tinta sobre un papel que posteriormente se dobla por la mitad, interpretándose las manchas resultantes. A finales del siglo XIX, Binet 12 comienza a utilizar las manchas de tinta para estudiar la capacidad de imaginación visual. Algunos años después, Herman Rorschach utiliza esta técnica para el diagnóstico de la personalidad y de los trastornos psíquicos. De la totalidad de láminas utilizadas selecciona diez con el fin de publicar su método, lo cual no consiguió hasta dos años después, gracias a la mediación de Morgenthaler, que además sugirió a Rorschach que cambiase su título original, «Método y resultados de un experimento diagnóstico basado en la percepción e interpretación de formas causales» por el de «Psicodiagnóstico». En un principio, el libro tuvo muy poca aceptación. Las críticas fueron pocas y en general desfavorables, lo cual le produjo una decepción considerable. Rorschach murió sin saber la popularidad que llegaría a tener la técnica que había creado (Serrate, 1980). En los años siguientes la evaluación dinámica irrumpe con fuerza, fundamentalmente en la psicología de la personalidad, y la técnica de Rorschach se convierte en una de las pruebas más conocidas y utilizadas (Goldstein y Hersen, 1990b). Una encuesta realizada por Lubin, Larsen y Matarazzo (1984) entre psicólogos clínicos estadounidenses sitúa al Rorschach en el cuarto lugar entre los tests más usados, detrás del Wechsler adults inteligente scale (WAIS), Minnesota multiphasic personality inventory (MMP1) y el Test gestáltico de Bender. Pocos años después, Murray publica en 1935 el Test de apercepción temática (TAT) como una alternativa a la técnica de Rorschach por su subjetivismo y falta de fiabilidad y validez. Otra fecha relevante es la de 1939 cuando Frank propone el término "método proyectivo" para aludir a estas pruebas, caracterizándolas por un material con una estructura mínima y en las que el sujeto "estructura" el material proyectando en esta estructuración su modo personal de ordenar la realidad. De forma paralela a este desarrollo de técnicas proyectivas se siguen produciendo avances en el área psicométrica manifestados por un refinamiento de las técnicas factoriales. Así, Thurstone publica en 1935 Vectors of the mind y en 1938 Primary mental abilities, en donde la inteligencia adquiere una naturaleza multivariable (Rogers, 1995). En 1939 se publica la Wechsler-Bellevue intelligence scale, la primera escala de Wechsler para adultos, con algunas diferencias con respecto a la Stanford-Binet: cada subtest incluía ítems para cada grupo de edad, hacía menos énfasis en la velocidad de respuesta y contenía bastantes componentes no verbales (Rogers, 1995). Otras publicaciones relevantes de esta época son el Inventario de intereses vocacionales de UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA Strong en 1927 y el Test gestáltico de Bender en 1938. La coexistencia de estos dos polos (clínico-proyectivo e intelectual-psicométrico), aparentemente opuestos, ha conducido, tal como plantea Pelechano (1988), a una cierta hibridación; así, la evaluación picométrica intenta ir más allá de una simple puntuación y, al mismo tiempo, hay un intento de objetivización y cuantificación de las técnicas proyectivas. Sin embargo, a pesar de los esfuerzos realizados para aumentar la fiabilidad de las técnicas proyectivas [véase, por ejemplo, Exner (1990)], las críticas que recibieron fueron contundentes. Ante esta situación, Silva (1982, 1985) plantea tres posibles opciones: seguir utilizando estas técnicas basándose en una aproximación proyectivodinámica, haciendo caso omiso de las críticas científicas; prescindir de ellas; o mantenerlas, sustituyendo las interpretaciones psicodinámicas por otras propias de enfoques interpretativos diferentes. A pesar de que la opción más adecuada es la última (Martorell, 1988), las más frecuentemente seleccionadas son las primeras. En la década de los años treinta comienza una época de discusiones teóricas en la psicología soviética —entiéndase el término como genérico, y no como la psicología de una determinada escuela. En 1930 comienza la "discusión reactológica"; la reactología había sido propuesta pocos años antes por Kornilov y en ella se trataba de integrar la reflexología de Béjteriev y la psicología de la conciencia. Posteriormente, en 1932, se amplía la discusión a la teoría del desarrollo cultural de las funciones psíquicas superiores (desarrollada por Vigotski). Las discusiones sobre la reflexología, la reactología y la teoría del desarrollo cultural llevan a una intervención del gobierno. En palabras de Rubinstein (1981, p. 103) «sólo la resolución del Comité Central del PC de la U.S. del 4 de julio de 1936 desenmascaró algunas teorías sumamente perjudiciales y reaccionarias, las cuales inhibían con sus falsas frases seudomarxistas el desarrollo de la psicología, disgregándola por medio de conceptos acientíficos. Dicha resolución eliminó al mismo tiempo varios impedimentos externos de organización en el trabajo de la investigación psicológica de la URSS». En esta resolución se prohibía la construcción y utilización de los tests en la Unión Soviética (tal como estaba constituida hasta 1991). A partir de dicha resolución la evaluación psicológica en la Unión Soviética se centra en la elaboración de procedimientos experimentales de evaluación de procesos básicos (memoria, percepción, atención...) y complejos (pensamiento, comprensión, abstracción...). La producción, 13 tanto teórica como experimental, se incrementa de forma considerable. Se crean varios centros de investigación y/o docencia en psicología: el Instituto Estatal de Psicología de Moscú, la Cátedra de Psicología del Instituto Pedagógico Estatal (Leningrado), un Departamento de Psicología en el Instituto Béjteriev de Investigación Cerebral, y otros en Georgia y Ucrania. Fruto de ello, cabe resaltar los trabajos de Blonskii (sobre la memoria), Teplov (sobre las facultades o aptitudes), Kravkov (sobre psicofisiología), etc. Por otra parte, se potenció la evaluación neuropsicológica, como quedó patente en los numerosos y excelentes trabajos de Luria. Tal como había sucedido con la primera guerra mundial, la segunda guerra mundial también tiene como consecuencia un gran incremento en la construcción y aplicación de tests. Para la selección del personal militar, en Estados Unidos se desarrolló el Army general classification test (que incluía subpruebas de lectura, vocabulario, razonamiento aritmético, cálculo aritmético y relaciones espaciales), una prueba de aplicación colectiva —por razones obvias— y que fue aplicada a más de nueve millones de personas durante la guerra. Además, se elaboraron otras pruebas más específicas para la selección de oficiales y de cuerpos técnicos del Ejército. Mientras tanto, el ejército británico había optado por la utilización de pruebas de inteligencia general (que evaluaban el factor g) con contenidos no verbales. Dos de las pruebas que se emplearon están vigentes en la actualidad: las Matrices progresivas de Raven y el Test de los dominós de Anstey. En definitiva, podría decirse que la segunda guerra mundial supuso la aplicación de tests más numerosa que se ha hecho hasta la actualidad. Se estima que en 1944, en los países aliados, se pasaron unos sesenta millones de tests a unos veinte millones de personas (Pelechano, 1988). Al comienzo de los años cuarenta, Hathaway y Mckinley presentaron el Minnesota multiphasic personality inventory (MMPI), construido según el modelo psicométrico, y que constituye una de las mayores aportaciones en el ámbito de la evaluación de la personalidad y de la evaluación clínica (Goldstein y Hersen, 1990b). El auge que tuvo esta prueba fue enorme, y todavía en la actualidad continúa siendo uno de los instrumentos más utilizados en la práctica clínica (Lubin y cols., 1984; Keller, Butcher y Slutske, 1990). Para elaborar las escalas que se incluyen en el MMPI se seleccionaron aquellos ítems que maximizaban UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA las diferencias entre los sujetos con clara sintomatología psicopatológica y sujetos "normales". A modo de resumen, se puede apuntar que esta etapa coincidente con las guerras mundiales supone un desarrollo de la evaluación de la personalidad, al mismo tiempo que se sigue desarrollando la evaluación de la inteligencia a través de escalas individuales como las de Terman y las de Wechsler y el refinamiento de la evaluación colectiva gracias a las técnicas factoriales. En este período surge también, tal como se comentó, la polémica entre la evaluación proyectíva y la psícométrica que llevará a incongruencias, que se siguen manteniendo todavía en la actualidad, tales como el empleo simultáneo del MMPI, el Rorschach y las escalas de Wechsler. Período de crisis de la evaluación psicológica Al finalizar la segunda guerra mundial, en Europa comienza un período de reconstrucción a todos los niveles, pero con una preferencia en los sectores económico y laboral. En este contexto, la psicología queda relegada a un segundo plano en espera de una mejor situación económica, produciéndose así un incremento en la emigración —que había comenzado antes de la guerra— de importantes psicólogos europeos a Estados Unidos (Titchener, Münsterberg, Levin...). Sin duda, ésta fue una causa adicional que contribuyó a un mayor desarrollo de la psicología en Estados Unidos a partir de la posguerra. Estados Unidos al final de la guerra se encuentra con el problema de la integración de los soldados a la vida civil. La "desarrollada" evaluación psicológica especializada en selección de grandes masas ya no tenía tanta utilidad. Ahora era necesaria una psicología orientada a la evaluación individual y a la rehabilitación. Por otra parte, la polémica, en un principio académica, sobre genetistas y ambientalistas pasa a ser un tema de debate social. A esto se unía una crítica, cada vez mayor, hacia el uso indiscriminado de todo tipo de tests, tal como ilustra Cronbach (1972, p. 36): un psicólogo que hubiese inventado un test se limitaba a imprimir copias para su uso general y a través, generalmente, de una empresa que vendía aparatos a los laboratorios de psicología. Cuando la demanda de tests creció después de la primera guerra mundial, algunas firmas se especializaron en la 14 publicación de tests, incluyendo las especializadas en tests escolares... Cada institución, universidad, empresa, o cualquier otra, planificaba y financiaba su propio programa. Cada cual adaptaba un test según su propia elección. Y en este sentido, reinaba una absoluta libertad. La utilización de tests llega a ser tan frecuente que el propio Cronbach se sorprende de que, sólo treinta meses después de haberse aplicado el primer test colectivo para población escolar, éste se había administrado a más de cuatro millones de niños en Estados Unidos. Por su parte, Holtzman (1971) estima que en los colegios estadounidenses se aplican anualmente más de 250 millones de tests. La psicología soviética durante estos años no sólo se había consolidado, sino que además había afinado sus críticas hacia los tests. Algunas de estas críticas se resumen en los siguientes puntos (Rubinstein, 1981): a. Si dos personas resuelven o no un mismo test, el significado psicológico de este hecho no es único, puesto que un mismo resultado puede ser motivado por procesos psíquicos diferentes. Por tanto, el que un test haya sido resuelto o no, no determina la naturaleza interna del acto psíquico correspondiente. b. Según el método de los tests, la evaluación de la personalidad se deriva tan sólo de la evaluación estadística de los datos externos que se han obtenido por el individuo en respuesta a determinadas cuestiones. Por tanto, este método sólo se basa en un enfoque mecánico, que parte de la conducta y se orienta hacia la personalidad. Se intenta establecer la evaluación de la personalidad que se va desarrollando sólo con una prueba, sin tener en cuenta el desarrollo del individuo y la influencia de la educación. c. El error se acentúa si se quiere establecer un pronóstico, partiendo para ello del supuesto de que el nivel que se ha calculado por medio de dicho test en un determinado grado de desarrollo caracterizará también en el futuro a la persona evaluada. Según esto, se admite una trascendente predeterminación de toda ulterior evolución de un ser humano bajo las condiciones que se han dado y, consciente o inconscientemente, se niega la posibilidad de transformación del hombre: del adulto por la interacción social y del niño por medio de la educación. d. Cuando a dos personas de distinto desarrollo y en condiciones diferentes se les formula el mismo test estándar y, según sus respectivas UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA soluciones, quieren obtenerse conclusiones sobre su inteligencia, se comete evidentemente un error, pues no se tiene en cuenta que los resultados dependen de las condiciones de evolución o desarrollo. Dos estudiantes o dos trabajadores pueden resolver los tests de diferente manera, porque uno de los estudiantes está menos preparado y uno de los trabajadores menos versado que los otros. Pero por medio de la enseñanza los unos pueden superar a los otros. e. El hecho de que determinados tests puedan ser resueltos por el 75% de los niños de un intervalo de edad y de un determinado ambiente escolar no es razón para considerarlo como criterio mediante el cual se pueda establecer la inteligencia o el desarrollo intelectual de los niños que fueron educados en condiciones muy distintas. Postular tal conclusión equivaldría a no considerar que los resultados del test dependen de las condiciones de evolución del ser humano concreto. f Otro inconveniente es el hecho de que se emplean escalas estandarizadas y se intenta clasificar a los individuos por medio de pruebas en las cuales no se tienen en cuenta las diferencias individuales. g. También debe resaltarse el contenido casuista y a menudo provocador de estas pruebas, las cuales, por lo general, no consideran la preparación específica del sujeto en la evaluación. Al formular problemas que no están ligados con la enseñanza se cree, equivocadamente, poder obtener conclusiones sobre la capacidad de aprendizaje del sujeto. Todos estos factores contribuyeron a una crisis que Maloney y Ward (1976) describieron como un período de exacerbado pragmatismo empirista y con tendencia a las fórmulas y recetarios de evaluación a modo de "libros de cocina". Al igual que Cronbach (1972), estos autores también hablan del abuso y uso indiscriminado que se ha hecho de los tests, así como de su mala interpretación y/o desconocimiento del significado de los mismos. Silva (1982) describe esta situación como una «crisis externa», de cara a la sociedad, pero, además, este autor habla de una «crisis interna», centrada en las garantías científicas y aspectos psicométricos. La eficacia predictiva de los instrumentos psicométricos queda en entredicho en una revisión de Ghiselli en 1955; por su parte, Edwards en 1957 habla de la influencia de la deseabilidad social en los cuestionarios de personalidad. Durante este período las críticas iban dirigidas tanto a las pruebas psicométricas como a las técnicas proyectivas y al diagnóstico psiquiátrico. Así, los tests de inteligencia eran acusados de tener escasa utilidad de cara a la intervención psicológica, algunas de las escalas del MMPI como las 15 de depresión y esquizofrenia estaban contaminadas por otras categorías diagnósticas, etc. Tanto el Rorschach como el TAT fueron objeto de múltiples estudios con el fin de analizar su objetividad y los diferentes tipos de fiabilidad y validez, los cuales en general mostraron resultados negativos. Por su parte, el diagnóstico psiquiátrico fue fuertemente criticado por la falta de fiabilidad y validez, y por sustentarse en el modelo médico de enfermedad, considerando la conducta anormal como un síntoma de enfermedad y etiquetando a la persona según un sistema nosológíco. Las críticas llegaron incluso a la efectividad de la psicoterapia, surgiendo así una nueva área de la evaluación psicológica, la evaluación de las intervenciones. Un buen ejemplo de ello es la publicación en 1952 de The effects of psychoterapy: An evaluation por parte de Eysenck. Sin embargo, toda crisis tiene sus aspectos innovadores y positivos; así, en este contexto aparecen numerosas publicaciones, consideradas clásicas actualmente, referentes a aspectos psicométricos. En 1950 Gulliksen publica The theory of mental test con el fin de sistematizar los procedimientos de validación de los tests; en 1955 aparece el trabajo de Cronbach y Meehl Construct validity in psychological tests; y en 1958 se publica la primera edición de Psychological testing de Anastasi. El esfuerzo por un acercamiento más individualizado a la evaluación psicológica hace que surjan durante la década de los años cincuenta diferentes pruebas vigentes todavía en la actualidad: la Prueba de clasificación Q de Stephenson, el Diferencial semántico de Osgood y las Técnicas de rejilla de Kelly (Silva, 1982). Asimismo, esta década va a suponer también el desarrollo de la evaluación factorial de la personalidad. En Gran Bretaña, Eysenck comienza a elaborar y desarrollar sus cuestionarios de factores básicos de personalidad; mientras, en Estados Unidos, Cattell publica su cuestionario de dieciséis factores. Otro hito importante en esta época es la publicación por parte de Meehl en 1954 del libro Clinical versus statistical prediction. A theoretical analysis anda review of the evidence, en donde se critican abiertamente las técnicas proyectivas, en especial su baja objetividad, su poca fiabilidad test-retest y su baja validez predictiva, presentándose como alternativa científica el MMPI; además, como manifiesta Pelechano (1988), la falta de una teoría en la que sustentarse lleva a identificar estas técnicas con las teorías psicoanalíticas. Sin embargo, estas críticas no influyeron en absoluto en su empleo; así, Sundberg (1961) comunica que entre los tests más UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA utilizados por psicólogos clínicos en el año 1959 se encontraba en primer lugar el Rorschach y en segundo el TAT. Holtzman relata su experiencia cuando fue contratado por las Fuerzas Aéreas de Estados Unidos, con la finalidad de comprobar la eficacia del test de Rorschach en la selección de pilotos: …no se trataba exactamente de la puesta a prueba de la utilidad del Rorschach en la evaluación clínica de los pacientes, o cualquiera que sufra un trastorno emocional o mental. Era más bien un intento por comprobar algo que muchos de los defensores del Rorschach proclamaban, en aquel tiempo, que era capaz de hacer. Durante e inmediatamente después de la segunda guerra mundial algunos de los pioneros del Rorschach, como Klopfer entre otros, dijeron que podían utilizar el test para predecir el éxito en las Fuerzas Aéreas. Y así se utilizaba, por ejemplo, para decidir entre dos candidatos a piloto de guerra [...]. El experimento era la adecuada puesta a prueba de esas particulares exageraciones. El Rorschach había sido propuesto para la selección de pilotos; para comprobar su eficacia fui contratado por las Fuerzas Aéreas a tiempo completo. En el estudio colaboraron 20 clínicos, expertos en Rorschach, muy conocidos, repartidos por todo Estados Unidos. Se les proporcionaron protocolos seleccionados al azar, pidiéndoles que diferenciaran los candidatos que habían tenido éxito de aquellos que no. No fueron capaces de hacerlo. Este estudio tuvo una gran importancia en su momento porque supuso la caída del Rorschach en los círculos académicos [...]. Lo que me resultó más sorprendente es que ninguno de los clínicos, a pesar de sus declaraciones, fuera capaz de superar el mero azar [...] y eso es muy pobre [Holtzman, 1989, pp. 108-109]. Es importante resaltar que Holtzman fue uno de los primeros en realizar estudios sobre la fiabilidad y validez del Rorschach y que cuando le contrataron para evaluar la eficacia de este test se encontraba en pleno auge la polémica iniciada por Meehl sobre predicción estadística frente a predicción clínica, siendo Holtzman, en aquel momento, un defensor de esta última. En 1988, la Society of Personality Assessment le concedió el 16 galardón Distinguished Contribution Award por contribuciones a la evaluación de la personalidad. sus importantes En un esfuerzo por mejorar la calidad de los instrumentos de evaluación psicológica, la APA crea un comité dirigido por Cronbach encargado de elaborar el informe Technical recommendations for psychological tests and diagnostic aids 2 de 1954 en donde se plantea la necesidad de que los tests vayan acompañados de un manual con información acerca de la interpretación de los resultados, validez, fiabilidad, administración, etc. (Rogers, 1995). Sin embargo, todos estos esfuerzos son estériles y la crisis externa de la evaluación psicológica alcanza su punto culminante en el movimiento antitests que tuvo lugar en Estados Unidos en la década de los años cincuenta y, sobre todo, los sesenta. La polémica fue iniciada entre defensores de posturas genéticas y ambientalistas, utilizando ambos los resultados de los tests de inteligencia para defender sus posiciones. La realidad era que, a pesar de que los primeros psicómetras utilizaron los tests con la intención de que todas las personas tuviesen igualdad de oportunidades en función únicamente de su capacidad, estos procedimientos de evaluación terminaron favoreciendo a las clases dominantes y privilegiadas. Pronto esta discusión pasó de los círculos científicos a la vida ciudadana. Así, se producen hechos tan notables como la quema de protocolos en una escuela de Texas en 1959, la prohibición del uso de pruebas psicológicas en el estado de California y en las escuelas de Nueva York. Los tests de personalidad fueron blanco también de fuertes críticas; se manifiesta un descontento por la utilización de estos tests en la industria, e incluso se habla de invasión de la privacidad (Rogers, 1995). En opinión de Blanco (1986b), esta revuelta antitests fue fruto de cuatro factores diferentes: las limitaciones reales tanto técnicas (déficit conceptuales, metodológicos e instrumentales) como humanas (lagunas de conocimiento, fallos o errores), los abusos cometidos en una administración indiscriminada e inadecuada de pruebas, las reacciones defensivas de la sociedad ante unos instrumentos que pueden potencialmente violar su intimidad y, en último lugar, las críticas derivadas de una presentación inadecuada de los resultados del proceso diagnóstico; es decir, no es la técnica en sí misma, sino su inadecuado uso lo que puede acarrear riesgos. UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 17 LA EVALUACIÓN CONDUCTUAL Los inicios de la psicología conductual podrían situarse en las primeras aplicaciones de los principios del aprendizaje al estudio de la conducta, lo cual se remonta a los trabajos de Béchterev a finales del siglo XIX, primero en la ciudad de Kazán (donde fundó el primer laboratorio de psicología en Rusia) y luego en San Petersburgo donde crea otro laboratorio y desarrolla diversos equipos para registrar la sensibilidad cutánea, el dolor, la cinestesia, etc. Fue el fundador de la reflexología colectiva y del principio del estudio comparativo, el cual permitía evaluar la influencia de la relación entre sujetos sobre la respuesta de un sujeto, lo que constituye el primer intento serio y experimental del estudio del comportamiento humano (Lómov, 1985). Desde la perspectiva de la psicología soviética, Béjteriev es considerado como el creador de la orientación de la psicología de la conducta, no sólo en la psicología soviética, sino en toda la psicología (Rubinstein, 1981). Esta visión es compartida por Kazdin (1991) al plantear que los antecedentes de la evaluación y la modificación de conducta se encuentran en los trabajos de Béjteriev, Watson, Rayner, Jones, etc. Sin embargo, hay que matizar que en lo referente a la evaluación, tal como ha puesto de manifiesto McReynolds (1986), Watson no ve como incompatibles el modelo psicométrico y su punto de vista conductual. Ello se demuestra en una carta (fechada el 22 de mayo de 1917) que escribe Watson a Goddar (introductor de los tests de Binet en Estados Unidos) solicitándole una lista de tests psicológicos, con vistas a preparar un curso de psicología que tenía que impartir a estudiantes de medicina especializados en psiquiatría. Poco después dedica su libro Psychology from the standpoint of a behaviorist (1919) a Cattell y a Meyer, donde además incluye cinco páginas sobre tests. Además, en otro libro publicado en 1928 (Psychological care of infant and child) describe varios tests. El origen de la evaluación conductual puede situarse, por un lado, en la aplicación de los principios del aprendizaje a la modificación del comportamiento humano anormal y, por otro, en el intento de suplir los déficit de la evaluación psicológica de la época al hacer frente a la conducta anormal (Fernández-Ballesteros, 1994). Así, en investigaciones clásicas, como la de Watson y Rayner con el pequeño Albert en la década de los años veinte o la de los Mowrer con sujetos enuréticos en la de los treinta, se realizan evaluaciones de la conducta. Sin embargo, será a mediados del siglo XX cuando se produce un hito histórico en el desarrollo de la psicología y que posteriormente afectará a la evaluación psicológica. Tres autores sientan las bases de la modificación de conducta: Skinner (Estados Unidos) publica en 1953 Ciencia y conducta humana (que daría lugar a la modificación de conducta basada en el modelo operante), Wolpe (Sudáfrica) publica en 1958 Psicoterapia por inhibición recíproca (con base en el condicionamiento clásico y donde ya se describen técnicas como la desensibilización sistemática y el entrenamiento asertivo) y Eysenck (Gran Bretaña) publica en 1960 Terapia de conducta y neurosis, donde se describe la neurosis como una conducta inadaptada cuya adquisición y eliminación pueden explicarse en términos del condicionamiento clásico (véase Franks, 1991). Así, en estos textos se encuentran ya esbozos de la evaluación conductual; por ejemplo, Wolpe da una gran importancia a la entrevista como instrumento para determinar los estímulos que evocan las reacciones de temor. Skinner, por su parte, formula un concepto fundamental dentro de la evaluación conductual: el análisis funcional, el cual enfatiza la conducta manifiesta y los eventos ambientales que la controlan. Skinner radicalizó la perspectiva de Watson, comenzando a desarrollar estudios experimentales sobre la conducta operante para lo cual propone el análisis experimental de la conducta (búsqueda de las relaciones funcionales que prevalecen entre aspectos medibles de la conducta y las diferentes circunstancias y hechos de la vida de un organismo), que se convertirá en el punto de partida de la evaluación conductual. Además del trabajo experimental, Skinner resaltó las repercusiones que tendría sobre la clínica. En los años siguientes se produce un gran desarrollo, tanto a nivel conceptual como instrumental, consolidándose así la psicología conductual que se convierte en el movimiento más importante dentro de la psicología clínica en las últimas décadas. En definitiva, la evaluación conductual surge como una necesidad ante la aplicación de los principios del aprendizaje al tratamiento de la conducta anormal e incluso ante la inutilidad que se empezaba a manifestar desde algunos círculos de los tests psicométricos, proyectivos y de los sistemas clasificatorios vigentes (Fernández-Ballesteros, 1994). De esta misma opinión son Hersen y Bellack (1976), quienes consideran que la evaluación conductual surge como respuesta a una serie de factores tales como los problemas de fiabilidad y validez que presentan UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA los diagnósticos psiquiátricos a través del DSM-I y el DSM-II, la relación indirecta entre la evaluación realizada por medio de tests tradicionales (como por ejemplo, los proyectivos) y la planificación y puesta en práctica del tratamiento, la gran aceptación de la terapia de conducta entre los psicólogos clínicos y el desarrollo de la evaluación en general, haciendo posible registros de conducta más precisos. Nelson (1983) otorga la "paternidad" de la evaluación conductual a la percepción de la debilidad de las técnicas de evaluación tradicional y a las innovaciones en la evaluación de los primeros terapeutas de conducta. Este nuevo modelo de evaluación se caracterizará por los siguientes principios: énfasis en aspectos observables; la conducta es fruto del aprendizaje, dependiendo de una serie de hechos controlables; la evaluación y el tratamiento están estrechamente interrelacionados, implicando todo ello una evaluación de carácter idiográfico (Matud, 1993). Dentro de este nuevo enfoque, Kanfer y Saslow (1965) publican el artículo «Behavioral analysis», dando lugar al nacimiento "oficial" de la evaluación conductual, aunque según Goldfried y Linehan (1977) la idea (no el término) aparece por primera vez en un texto de Johnson en el año 1946, donde se trata sobre el tipo de evaluación que debe hacer el psiquiatra, diciendo que éste debe obtener información acerca de lo que hace y en qué situaciones lo hace. La aportación de este trabajo es la admisión de variables subjetivas (eventos internos y variables personales u organísmicas) dentro del análisis funcional propuesto por Skinner, quedando abierta la posibilidad del empleo de autoinformes, aunque con cierta cautela. Poco después, Cautela (1968) y Goldfried y Pomeranz (1968) utilizan por primera vez el término behavioral assessment; esta nueva forma de evaluación aparece posteriormente con tres nombres: evaluación conductual, análisis funcional de la conducta y análisis conductual, que son considerados como sinónimos por la mayoría de los autores (Silva y Martorell, 1991). Por otra parte, Goldstein y Hersen (1990b) entienden que el desarrollo de la evaluación conductual está, en cierto modo, relacionado con la innovación en los instrumentos de registro o evaluación de la conducta, lo cual se puede comprobar en los primeros números de las revistas Journal of Applied Behavior Analysis, Behaviour Research and Therapy, Journal of Behavior Therapy and Experimental Psychiatry y Behavior Modification, donde aparece una gran cantidad de artículos sobre nuevos métodos e instrumentos de registro conductual. 18 Un apoyo importante a esta incipiente evaluación conductual es la publicación de Personality and assessment por parte de Mischel en 1968. En esta obra se vierte una fuerte crítica sobre la evaluación psicológica "tradicional", proponiéndose la evaluación conductual como alternativa que hará énfasis sobre la especificidad, lo idiográfico, etc. El situacionismo constituyó una dura crítica a la evaluación tradicional de la personalidad (teoría de los rasgos y teoría psicodinámica). Su crítica se centra en la validez, fiabilidad y en la falta de utilidad que aportan los instrumentos de evaluación de la personalidad, resaltando la inadecuación de los rasgos para predecir la conducta. La teoría de los rasgos era criticada por el supuesto de que la personalidad se encuentra constituida por predisposiciones estables y duraderas que ejercen efectos generalizados sobre la conducta. De igual forma, critica la teoría psicodinámica por su énfasis en las entidades internas y en la estabilidad temporal y transituacional. Para explicar la conducta humana, Mischel asume una concepción interaccionista en la que se tienen en cuenta variables orgánicas, ambientales y de la propia conducta. Sin embargo, su mayor aportación podría considerarse en el giro que supone buscar la explicación de la variabilidad de la conducta, en vez de tratar de hacerlo en función de la estabilidad y consistencia, tal como se venía haciendo. Su obra ha servido para impulsar los estudios de la evaluación de situaciones, contextos y ambientes. Paralelamente, Peterson (1968) publicaba The clinical study of social behavior, donde se planteaba que dentro del ámbito clínico era necesario la construcción de situaciones que proporcionaran muestras representativas de las conductas a predecir; además, este autor recomienda la no utilización de los instrumentos de la evaluación tradicional para inferir las características de la personalidad. Asimismo, cabe destacar el trabajo de Lang (1968) sobre el triple sistema de respuesta y el de Goldfried y Kent (1972) sobre las diferencias y semejanzas entre la evaluación psicométrica y la evaluación conductual. Sin embargo, un hecho llamativo es el retraso en el desarrollo que tuvo la evaluación conductual con respecto a la modificación de conducta. Así, se comprueba que en las publicaciones de Eysenck y Rachman (1965), Meyer y Chesser (1970) y Wolpe (1969) no se hacen indicaciones acerca del análisis conductual. Sin embargo, ello no debe ser entendido como una falta de interés por la evaluación en los nuevos psicólogos conductuales, puesto que ya Staats y Staats (1963) se UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA planteaban la necesidad de incluir métodos conductuales de evaluación. Dos años después, Ullmann y Krasner (1965) en la introducción de su libro mantienen que hay un lugar para la evaluación psicológica en la modificación de conducta, indicando que la evaluación está íntimamente relacionada con el tratamiento. Se podrían plantear dos razones explicativas del relativo retraso de la evaluación conductual con respecto a la terapia de conducta. En primer lugar, no conviene olvidar que el nuevo enfoque nace claramente orientado al tratamiento. Por tanto, desde esta perspectiva, parece lógico que primero se desarrollen las técnicas de intervención y a la zaga la evaluación; en otras palabras, la evaluación conductual surge cuando las técnicas de intervención conductual se ponen en práctica, donde se demuestra que la evaluación tradicional no da una información adecuada sobre la conducta del paciente, por lo que tiene sentido que su desarrollo sea posterior. En segundo lugar, los primeros psicólogos conductuales se encontraron con una evaluación psicológica muy desarrollada y consolidada, por lo menos en lo que se refiere a la evaluación de corte psicométrico. Es importante considerar que la consolidación de la terapia de conducta coincide con la superación de la crisis que supuso la revuelta antitests. Como consecuencia de la crisis, los procedimientos para la elaboración de los tests se habían perfeccionado. Además, se produce una centralización y unificación en la construcción y distribución de tests motivada por algunas leyes que prescriben qué tipo de tests deben utilizarse y fundamentalmente por el desarrollo de la "industria de los tests". La edición de tests se había convertido en un negocio, como afirma Cronbach (1972); ya no era suficiente con publicar un test que elaboraba un profesor en sus ratos de ocio, sino que era necesario contar con un equipo de profesionales cualificados y que contasen con una red de colaboradores por todo el país. Además, debían demostrarse sus ventajas y garantías científicas en congresos y disponer de unos buenos canales de distribución. Se había creado una competitividad por conseguir el "test más eficaz". Todo ello sirvió, sin duda, para seleccionar los tests que llegaban a aplicarse, con la consiguiente mejora de la imagen, a lo que también contribuía una tecnología más avanzada, tanto en los sistemas de corrección automática, como en el tipo de presentación de resultados. Por tanto, los psicólogos conductuales no sólo tenían que elaborar un nuevo sistema de evaluación, sino que, además, había que demostrar que los tests, un sistema tecnológicamente muy avanzado y con grandes garantías científicas, no servían para los propósitos del enfoque 19 conductual. Evidentemente, esto suponía un período de reflexión antes de comenzar a elaborar un nuevo sistema de evaluación. Recuérdese, por ejemplo, que el propio Wolpe (uno de los pilares de la terapia de conducta) en su libro de 1958 recomendaba la utilización de inventarios de personalidad. Visto desde esta perspectiva, incluso nos atreveríamos a decir que la evaluación conductual ha tenido un desarrollo relativamente rápido, sobre todo si se tiene en cuenta que la consolidación de la terapia de conducta se produce a partir de mediados de la década de los años sesenta y que en la siguiente década tiene lugar una gran expansión de la evaluación conductual. A partir de la mitad de la década de los años setenta se produce la consolidación de la evaluación conductual como consecuencia de la multitud de publicaciones que sobre el tema van saliendo a la luz; entre los manuales más destacados se podrían citar Behavioral assessment. A practical handbook de Hersen y Bellack (1976), Behavior therapy assessment: Diagnosis, design and evaluation de Mash y Terdal (1976), Handbook of behavioral assessment de Ciminero, Calhoun y Adams (1977), Behavioral assessment. New directions in clinical psychology de Cone y Hawkins (1977), Behavior modification: Handbook of assessment, intervention and evaluation de Gambrill (1977), Principies of behavioral assessment de Haynes (1978), A practical guide to behavioral assessment de Keefe, Kopel y Gordon (1978) y Behavioral assessment: Recent advances in methods, concepts and aplications de Haynes y Wilson (1979). A estos manuales, ya clásicos, hay que añadir la aparición en 1979 de las revistas BehavioralAssessment yJournalof Behavioral Assessment 3. El número de publicaciones sobre este enfoque llegó a ser tan elevado que el único análisis posible es el realizado a través de estudios bibliométricos, como el de Prieto, Tortosa y Silva (1984), quienes hacen un análisis cuantitativo de las publicaciones sobre evaluación conductual entre los años 1971-1982 a través de la base de datos Social sciences citation index, concluyendo que se ha producido un incremento considerable en los artículos publicados a lo largo de estos años, que estos artículos no aparecían exclusivamente en revistas especializadas (por ejemplo, encontraron que la revista que más trabajos publicó sobre esta temática fue Psychological Reports) y que el autor más productivo en el área de la evaluación conductual fue Alan E. Kazdin. UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA A esta fase de consolidación de la evaluación conductual producida durante la década de los años setenta, a la cual Nelson (1983) califica como "luna de miel", sucede un período de "desencanto", tal como es calificado por Fernández-Ballesteros (1994), en el cual la evaluación conductual entra en una crisis en la que todavía parece estar inmersa. Por otra parte, durante todo este período de auge del modelo conductual, la evaluación de corte psicométrico continúa dando lugar a publicaciones importantes entre las que destaca un manual de evaluación psicológica por parte de Cronbach en 1972 en donde se sistematiza la teoría de la generalizabilidad y la obra de Wiggins (1973) Personality and prediction: Principies of personality assessment. La situación de la evaluación psicológica desde la década de los años ochenta hasta la actualidad será abordada en el siguiente apartado. LA EVALUACIÓN PSICOLÓGICA EN LA ACTUALIDAD En este apartado se describirá la situación de la evaluación psicológica desde la década de los años ochenta hasta la actualidad. Para ello se hará un breve repaso de los acontecimientos más importantes ocurridos en los últimos años, así como algunas reflexiones sobre las cuestiones de especial relevancia que caracterizan este período, como puede ser la crisis que experimenta la evaluación conductual, la apertura de la evaluación psicológica a otras áreas, la introducción de la informática en la evaluación o la teoría de respuesta al ítem, entre otras. La característica que puede definir la evaluación psicológica de los últimos años tal vez sea, como comenta Matud (1993), la reelaboración y ampliación de los modelos y procedimientos de evaluación, manifestándose de una forma clara una postura más tolerante e integradora entre las diferentes aproximaciones, incluso entre la evaluación psicométrica y la evaluación conductual. Crisis de la evaluación conductual La década de los años ochenta se caracteriza por una serie de cambios dentro de la evaluación conductual, y por un período de reflexión dentro de la evaluación psicológica. Hayes y Follete (1993) y FernándezBallesteros (1994) señalan algunos hechos que constituyen un reflejo de 20 esta crisis; en primer lugar, dada la relevancia que tomó el DSM-III (1980) y DSM-III-R (1987) los evaluadores conductuales empiezan a familiarizarse y a utilizar etiquetas diagnósticas, por lo que se intenta una aproximación entre evaluación conductual y diagnóstico psiquiátrico (Haynes y O'Brien, 1988; Hersen, 1988); en segundo lugar, Kendall y Hollon (1981) publican Assessment strategies for cognitive-behavioral intervention que va a suponer una ruptura con la propia evaluación conductual; y, por último, se produce un debilitamiento del análisis funcional y una pérdida de vigencia de los planteamientos que oponen la evaluación conductual a otros modelos de evaluación psicológica 4. Como ejemplo clarificador de esta situación están las palabras de Bellack y Hersen (1988, p. 613): «[...] Si empleamos entrevistas estandarizadas con el propósito de alcanzar un diagnóstico con base en el DSM-III, generamos escalas clínicas sobre la severidad de síntomas, administramos inventarios de autoinforme y evaluamos estilos cognitivos, podemos preguntarnos “¿es todavía conductual la evaluación conductual?”. Esta crisis de asunciones teóricas de la evaluación conductual se pone de manifiesto en un análisis de los artículos publicados entre 1980 y 1987 en Behavioral Assessment y en el Journal of (Psychopathology and) Behavioral Assessment realizado por Fernández-Ballesteros (1988) [citado en Fernández-Ballesteros (1994)]. En BehavioralAssessment únicamente un 15% de los trabajos trataba sobre temas conceptuales y solamente un 0,40% hacía referencia al análisis funcional de la conducta; en la segunda revista los datos tampoco son nada alentadores, con un 6,50% de artículos conceptuales y un 0,50% referido al análisis funcional de la conducta. El mayor porcentaje de trabajos alude a aspectos metodológicos. A partir de estos datos, Fernández-Ballesteros (1994) concluye que los evaluadores conductuales no han dedicado mucho tiempo a reflexionar sobre aspectos conceptuales. En otro estudio realizado por Haynes y O'Brien (1990) en el que se analiza una serie de revistas conductuales (Behavior Modification, Behaviour Research and Therapy, Behavior Therapy y Journal of Applied Behavior Analysis) se concluye que únicamente un 20% de las intervenciones descritas estaba basado en el análisis funcional. En definitiva, parece que el análisis funcional de la conducta no ha sido el elemento fundamental de la evaluación conductual. UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA La crisis de la evaluación conductual afecta también a aspectos metodológicos. Así, el empleo por parte de los evaluadores conductuales de técnicas conductuales (por ejemplo, la observación) de una forma exclusiva y el rechazo de los tests tradicionales no terminó nunca de hacerse realidad. En el estudio de Fernández-Ballesteros (1988) [citado en Fernández-Ballesteros (1994)] se informa que sólo un 14,20% de los trabajos de Behavioral Assessment y un 10,30% de los del Journal of (Psychopathology and) Behavioral Assessment en el período 1980-1987 están dedicados a la observación y un 18,40% y un 21%, respectivamente, se centraban en técnicas psicométricas. Según Matud (1993), esta desilusión metodológica se fundamenta en tres pilares importantes: la imperfección de las técnicas actuales de evaluación conductual, las cuales no muestran un acuerdo entre las diferentes medidas de la misma conducta, la impracticabilidad de muchas de ellas, habiendo sido utilizadas (excepto la entrevista) en menos de la mitad de los casos tratados por terapeutas de conducta, y la ausencia de avances en la tipificación de las técnicas, proliferando técnicas no estandarizadas. Este último hecho ha originado una de las discusiones más intensas de los últimos años entre quienes consideran necesaria la incorporación de criterios psicométricos a la evaluación conductual y quienes los rechazan. Así, por ejemplo, Nelson (1983) se opone a esta incorporación argumentando por un lado dificultades prácticas, ya que el número de técnicas necesario para cubrir los diferentes sistemas de respuesta, los diferentes métodos de evaluación y las posibles situaciones de evaluación es casi infinito, y por otro dificultades teóricas existiendo tres diferencias insalvables entre el modelo psicométrico y el conductual: los supuestos de consistencia-estabilidad de la conducta, los modelos de causalidad de la conducta (estructural intrasujeto frente a funcional ambiente-sujeto) y el nivel de análisis (individual frente a grupal). Otros autores, tal vez más realistas, plantean una complementariedad de ambos enfoques. Así, Bellack y Hersen (1988) afirman que la aproximación nomotética de rasgo podría ser conveniente en las fases iniciales de la evaluación con el fin de categorizar al paciente y realizar una descripción general de la disfunción y la situación vital, mientras que en una segunda fase de evaluación cuando es necesario realizar un análisis funcional y establecer medidas objetivas de conductas específicas estarían justificadas las técnicas conductuales. 21 En resumen, parece que los evaluadores conductuales han propuesto unos principios básicos y han practicado otros. A pesar de los presupuestos iniciales, la evaluación conductual utiliza escasamente el análisis funcional, utiliza técnicas basadas en diseños intersujetos implicando planteamientos nomotéticos y está empleando conceptos intrapsíquicos (Fernández-Ballesteros, 1994); sin embargo, a nuestro entender, esto no es más que una manifestación de la evolución a la cual está sometido cualquier concepto (Sierra, 1996). Ahora bien, a pesar de la crisis que experimenta la evaluación conductual en su seno, ésta goza de un ámbito propio y específico, y sigue manteniéndose en diferentes publicaciones; así, Cone (1993) informa que desde el período 1980-1982 a 1990-1992 se produce un incremento del 15,80% de trabajos publicados sobre evaluación conductual, así como un aumento del número de revistas en donde se publica este tipo de artículos. Sin embargo, no debemos olvidarnos, tal como plantea Fernández-Ballesteros (1993), que la salida de esta crisis pasa por la mejora de las garantías científicas de las medidas conductuales. Otros aspectos de actualidad Junto al gran desarrollo de la evaluación conductual, la psicología en general se fue abriendo a otros campos. En estos últimos años, la Organización Mundial de la Salud (OMS) ha recomendado, en reiteradas ocasiones, la necesidad de "invertir en salud", considerando además que la psicología es importante en más de la mitad de los objetivos planteados para mejorar la salud de la población. De estas recomendaciones parece haberse hecho eco la actual psicología clínica. En opinión de Richelle (1991), la psicología clínica ha experimentado un proceso de cambio que puede observarse a tres niveles. Primero, se ha dado un cambio de enfoque, pasando del interés por el sujeto "psicológicamente enfermo o anormal" al interés por el sujeto normal que se encuentra con problemas psicológicos que, en cierta medida, son consecuencia de las complejidades de la vida moderna; segundo, se produce una diversificación en su campo de acción, abarcando los aspectos psicológicos de otros tipos de enfermedad, además de la mental; y, tercero, se presta gran atención a la prevención de la enfermedad. Por otra parte, la inclusión de la psicología en los servicios sociales ha dado lugar al UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA nacimiento de la psicología comunitaria, abordándose así una gran diversidad de problemas desde un punto de vista social o de grupo (Holtzman, 1989). Todo ello contribuye, sin duda, a una extensión de la evaluación psicológica a estos nuevos campos. Todo ello, lleva a que la evaluación psicológica abra sus dominios a otras áreas: evaluación neuropsicológica (véase Benton, 1994), evaluación en tráfico y seguridad vial, psicología del trabajo y de las organizaciones (véase Fernández-Ríos, 1993; Rodríguez, 1993), psicología jurídica (véase Garrido, 1991), psicología del deporte (véase Cruz, 1995, y Cruz y Capdevilla en este mismo manual), etc. Asimismo, se produce un desarrollo importante de la psicología ambiental, lo que lleva emparejado un interés por la evaluación ambiental, surgiendo publicaciones como Environmental problems/behavioral solutions de Cone y Hayes (1980) y Pol (1994). Surge una necesidad de evaluar los contextos (settings) conductuales, la percepción de los mismos, su influencia en la conducta normal y patológica y la evaluación de los cambios ambientales sobre la salud mental (Manid, 1993). En los últimos años se ha desarrollado un gran interés por la evaluación de intervenciones y programas (Sechrest y Figueredo, 1993; FernándezBallesteros, 1995; Hernández, 1996). Incluso en áreas tradicionales como la evaluación de la inteligencia se produce una expansión de los objetivos planteados; así, por medio de los tests de inteligencia no nos limitamos a la obtención de un cociente intelectual, sino que evaluamos procesos cognitivos en pacientes con daño cerebral o esquizofrénicos (Goldstein y Hersen, 1990b). En definitiva, la actual evaluación psicológica no se puede identificar con la mera aplicación de tests psicológicos o la perspectiva clásica del psicodiagnóstico; hoy, la evaluación psicológica es un elemento fundamental de la intervención e investigación psicológica (Almeida y Ribeiro, 1994). En cuanto a la evaluación tradicional, no sólo no ha desaparecido sino que se ha seguido desarrollando; así, siguen apareciendo manuales importantes tales como New horizont in testing de Weiss (1983), Psychological testing (6a ed.) de Anastasi (1988), Psychological testing. Principies and applications (2a ed.) de Murphy y Davidshofer (1991) o The psychological testing enterprise. An introduction de Rogers (1995). Kaplan y Saccuzzo (1993) indican que en la evaluación psicológica actual se ha producido una proliferación de nuevos tests, muchos de ellos basados en modelos, teorías o conceptos claramente diferentes a 22 los de los tests tradicionales; estos tests no tradicionales están basados en teorías del aprendizaje, en la psicología social o experimental. Este hecho respondería, en primer lugar, a un incremento de los aspectos científicos de la psicología en el campo de la evaluación psicológica y, en segundo lugar, al esfuerzo realizado por integrar los tests en otros aspectos de la psicología aplicada (por ejemplo, el tratamiento). Además, se ha producido un incremento de la tecnología, una mejora de la objetividad de los tests, y una alta preocupación por los aspectos éticos implicados en la evaluación (especialmente el abuso de los tests) puesta de manifiesto en 1988 por el Joint Committee on Testing Practices y respaldada por la American Association for Counseling and Development, la American Educational Research Association, la American Psychological Association, la American Speech-LanguageHearing-Association y el National Council on Measurement in Education. Otro aspecto relevante citado por Kaplan y Saccuzzo (1993) es que en la actualidad el "público" en general tiene un mayor conocimiento de los tests; hoy existe una mayor demanda de servicios psicológicos, incluyendo la evaluación, lo cual, a su vez, repercute en la mejora de la calidad de los tests. En un análisis realizado de 65 practicum de psicodiagnóstico en psicología en Estados Unidos, Craig y Horowitz (1990) muestran una perspectiva del empleo de tests durante estos años; así, estos autores concluyen que los tests proyectivos, las escalas de Wechsler y el MMPI siguen gozando de gran popularidad entre los evaluadores psicológicos, hay un incremento en el empleo de tests neuropsicológicos, se usan los mismos tests para los adolescences que para los adultos y, por último, tests como el Millon clinical multiaxial inventory (MCMI) o el Millon adolescent personality inventory (MAPI) son poco usados en la actualidad pero es muy recomendado su aprendizaje, posiblemente porque los directores de los practicum creen que serán instrumentos importantes en un futuro próximo. En la última década también se ha producido un incremento en el interés por el diagnóstico psicopatológico; hay que destacar la publicación por parte de la Asociación Psiquiátrica Americana de tres ediciones del Diagnostic and statistical manual of mental disorders (DSMIII en 1980, DSM-III-R en 1987 y DSM-IV en 1994). Las críticas a la falta de fiabilidad y validez de las anteriores clasificaciones son superadas en parte con la inclusión de criterios descriptivos ateóricos en cada una de las categorías diagnósticas y la presentación de un sistema UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA de evaluación multiaxial de cara a planificar el tratamiento y predecir la evolución del trastorno. Todos estos hechos conducen a un progresivo acercamiento de las diferentes opciones de evaluación; es decir, se ha producido una concepción de la evaluación psicológica «entendida en un sentido amplio, que abarca desde la descripción del comportamiento hasta la valoración de programas de intervención» (Fernández-Ballesteros y Silva, 1985, p. 3). La gran cantidad de acontecimientos que afectan a la evaluación psicológica en estos últimos años hace que la valoración de la situación actual se convierta en una tarea sumamente ardua, lo cual, en realidad, es un indicador del alto grado de desarrollo que se ha alcanzado. Quizás nada mejor para ilustrar el estado actual que referirnos a dos trabajos sobre este tema. El primero es un estudio bibliométrico realizado por Carbonell, Silva y Carpintero (1988) sobre las publicaciones relativas a la evaluación psicológica. El material analizado incluía los manuales de Anastasi (1982), Groffman y Michel (1982/1983), Fernández-Ballesteros (1983), Cronbach (1984), Golstein y Hersen (1984) y los cinco primeros volúmenes (1968-1981) de Advances in psychological assessment compilados por McReynolds. Los resultados más relevantes podrían resumirse en los siguientes puntos: a. Los autores más citados, en general, y que por tanto podrían considerarse como los más influyentes fueron en orden decreciente: Cattell, Cronbach, Eysenck, Reitan, Exner, Guilford, Golden, Jackson, McReynolds, Anastasi, Gough, Hersen, Mischel, etcétera. b. Mediante un análisis factorial de correspondencias se determinó la relación entre autores y temas. Así, se obtuvieron cuatro factores bipolares que mostraban los autores más citados junto con los temas más tratados. En el primer factor aparece evaluación neuropsicológica (inteligencia y memoria) con Reitan, Golden, Benton, Venables, Wechsler, etc., frente a Exner/Rorschach (y otras técnicas proyectivas) con Exner, Swartz, Bandura, Holtzman, etc. En el segundo factor aparecen determinantes situacionales con Barker, Moos, Haynes, Patterson, etc., frente a determinantes individuales con Fleishman, Galton, Binet, Terman, etc. En el tercer factor aparece evaluación ambiental con Moos, Barker, etc., frente a evaluación conductual con Haynes, Nelson, Cone, Bellack, Kazdin, etc. El resto de los factores 23 presentan bastantes dificultades de interpretación, aunque en uno de ellos aparecía una dicotomía bastante clara: evaluación de la inteligencia frente a evaluación de la personalidad. En un análisis más reciente, Sierra (1996) informa que los quince autores de evaluación psicológica con más citas recibidas en el período 19931995 son Beck, Spitzer, Wechsler, Bandura, Piaget, Eysenck, Cronbach, Spielberger, Achenbach, Endicott, Rosenthal, Kazdin, Campbell, Cattel y Zuckerman. En este mismo estudio, analizando los contenidos del IV Congreso de Evaluación Psicológica (1994) y el 23nd International Congress of Applied Psychology (1994), se pone de manifiesto que las áreas más relevantes de la evaluación psicológica son la clínica y salud, personalidad, psicología del trabajo y de las organizaciones, psicología educativa, evaluación de programas, seguridad vial, psicología jurídica, psicología del deporte y psicología ambiental. En otro estudio realizado por Carbonell, Carpintero y Silva (1988) se solicitó información, por medio de una encuesta acerca de la «situación actual y perspectivas futuras de la evaluación psicológica (o psicodiagnóstico en su sentido más amplio)», a más de cien profesionales seleccionados de los más representativos de la evaluación psicológica a nivel internacional. El primer resultado, que llama la atención de los autores, es que la mayoría de los especialistas encuestados evita describir de forma estructurada la situación actual, lo cual es interpretado por Carbonell y cols. (1988) como una muestra del grado de especialización alcanzado, con la consiguiente dificultad que supone dar una visión global y estructurada de la actual evaluación psicológica. Los resultados relacionados con aspectos conceptuales ponen de manifiesto: a. Una necesidad de fundamentación teórica de la evaluación psicológica en su conjunto, incidiéndose además en que hay que eliminar la idea de que evaluación psicológica es sinónimo de aplicación de tests, y no dejarse llevar por la especialización tecnológica que no esté contextualizada en un modelo teórico. b. Que especialistas con diversos enfoques plantean la necesidad de una integración de las diversas técnicas e instrumentos, proponiendo como ejemplo a imitar la evaluación neuropsicológica. Sin embargo, algunos representantes del modelo conductual se manifiestan reacios a una necesidad de integración. UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA c. d. e. Que las variables biológicas adquieren relevancia. Que crece el interés por la evaluación de la personalidad. Adquiere importancia la visión evolutiva de la evaluación. En relación a las aplicaciones de la evaluación psicológica las conclusiones más importantes son: Una expansión de la evaluación a nuevos ámbitos (evaluación de ambientes y organizaciones). b. Un énfasis en la relación entre evaluación y tratamiento, coincidiendo los autores en señalar que la evaluación debe ser un medio que permita seleccionar las alternativas de intervención, resaltando la especificidad del diagnóstico y los estudios de caso único. c. Se recupera la confianza en los tests. d. Se espera una próxima incorporación de los microordenadores a la práctica habitual. e. Las repercusiones sociales de la evaluación y las garantías éticas deben estar siempre presentes. 24 inteligencia, de la personalidad y de la conducta son apartados imprescindibles en un currículo clínico. b. En esta formación se combinan técnicas psicométricas (MMPI2, 16PF...) con técnicas proyectivas (Rorschach, TAT...) y técnicas conductuales (observación, autorregistro...). c. Hay un auge de la evaluación por ordenador, referida tanto a la administración de tests como a su interpretación. a. Carbonell y cols. (1988) concluyen diciendo que el estado actual de la evaluación psicológica es positivo, fundamentalmente si se opina en función de la visión de los psicólogos que se identifican con modelos tradicionales. Sin embargo, quedan aún algunos problemas importantes por resolver, tales como las diferencias conceptuales entre distintos enfoques y el peligro de volver a la figura del psicólogo evaluador como un experto en aplicar tests. Un dato sorprendente, y a la vez ilustrativo, de la dificultad que implica describir la situación actual de la evaluación psicológica es el hecho de que autores como Cronbach o Guilford se manifestasen incapaces de contestar de forma precisa a la cuestión planteada. Recientemente, Piotrowski y Zalewski (1993) realizaron un análisis de los programas de doctorado en psicología clínica acreditados por la APA, llegando a una serie de conclusiones que también puede reflejar la situación actual de la evaluación psicológica. En este informe se concluye que: a. La evaluación psicológica es el área más importante en la formación de doctorado del psicólogo clínico; la evaluación de la La incorporación de los ordenadores a la evaluación psicológica puede considerarse actualmente ya una realidad; así, tal como plantean Kaplan y Saccuzzo (1993), el empleo de ordenadores va más allá de la corrección o la transformación de puntuaciones directas en típicas o centiles, llegando a la administración, corrección e interpretación de las puntuaciones. En un estudio realizado por Spielberger y Piotrowski (1990) entre los miembros de la Sociedad de Evaluación de la Personalidad se concluye que éstos consideran la evaluación computarizada como útil, aunque se debe mejorar la interpretación informatizada de los tests. Según Kaplan y Saccuzzo (1993), la aplicación de la informática a la evaluación psicológica puede hacerse a tres niveles: a. Procedimientos psicofísicos y de detección de señal, que consisten en presentar una señal al sujeto, el cual debe informar si la ha visto o no. De esta forma se puede evaluar la velocidad y/o la eficiencia del procesamiento de información, capacidad que está relacionada con las puntuaciones obtenidas en tests psicométricos de inteligencia. b. Informatización de tests clásicos. Muchos cuestionarios clásicos (MMPI, EPI, 16PF, Kuder...) disponen de una versión computarizada, mediante la cual el sujeto puede responder delante de la pantalla del ordenador. Una gran ventaja que presenta esta versión frente a la de lápiz y papel es que el evaluador puede disponer de la corrección e, incluso, de la interpretación al momento. Pero, además, esta aplicación informatizada puede llegar a aumentar el grado de confiabilidad y atractivo para el sujeto, además de disponer de una mayor versatilidad en la presentación de estímulos. La corrección de pruebas psicológicas y la obtención de una puntuación es tal vez la faceta más conocida de la aplicación de la informática a la evaluación psicológica, y algo habitual ya entre los evaluadores, por lo que el aspecto más actual es la UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA interpretación de resultados. Así, The Psychological Corporation en Estados Unidos y Técnicos Españoles Asociados (TEA) en España disponen de servicios a los que se puede acceder para obtener informes a partir de los resultados de diferentes pruebas (WATS, WISC, DAT, MMPI, Escalas de Beck, Rorschach...). Un ejemplo de estos informes se recoge en Keller y cols. (1990), quienes muestran un informe exhaustivo de un sujeto realizado por un programa informático a partir de las puntuaciones del MMPI-2; además, el informe se acompaña de un perfil gráfico de las escalas, así como de un listado de los ítems críticos de cada una de ellas. c. Informatización de la evaluación conductual. En este apartado las posibilidades de la informática son múltiples: almacenamiento de datos de autoinforme, codificación de observaciones, registro directo de conductas, análisis de datos, etcétera. Otro apartado importante de la aplicación de la informática a la evaluación psicológica es el referente a las entrevistas estructuradas. Así, algunas entrevistas como Present state examination (PSE) (Wing, 1980) o Diagnostic interview schedule (DIS) (Robins y cols.,1981) presentan una versión informatizada que formula los diagnósticos. Sin embargo, en el momento en que la entrevista se transforma en un programa informático deja de cumplir los requisitos necesarios para ser catalogada como tal y se convierte en un autoinforme. Un problema importante que nos encontramos ante estos avances tecnológicos es la responsabilidad ética de las conclusiones de un programa informático; ¿es el psicólogo el que realiza estas conclusiones o es el "frío" ordenador? De hecho, la APA ya ha recomendado que el informe informático debe acompañarse de un informe por parte del profesional (American Psychological Association, 1986). Un hecho de especial relevancia en la actual evaluación psicológica es el desarrollo de la teoría de la respuesta a los ítems (TRI), que se puede considerar una alternativa psicométrica a la teoría clásica de los tests. Frente a los tests clásicos (que hacen depender la evaluación del instrumento) y su corrección normativa (la puntuación del sujeto depende del grupo normativo), la TRI propone una medida invariable en relación a estos dos factores. La influencia de este cambio de concepción de los tests sobre la evaluación psicológica se concreta en los "tests a medida" (taylored tests). Según Muñiz (1990, p. 139) «[...] son unos tests que aun midiendo la misma variable no son idénticos para todos los 25 sujetos, varían en función del nivel de competencia al que vayan destinados a medir». A partir de un banco de ítems, un programa informático administra un grupo de ellos que se irán seleccionando a medida que se van evaluando las respuestas. Esto evitaría que los sujetos contestaran a ítems demasiado fáciles o difíciles, lo cual incrementaría la motivación y reduciría la fatiga (Muñiz, 1990; Renom, 1993). Sin embargo, esta teoría se encuentra con el problema de que requiere un requisito de unidimensionalidad, algo que sólo cumplen los tests de evaluación de conocimientos específicos (Muñiz y Cuesta, 1993), por lo que su campo de aplicación está limitado hasta el momento a la evaluación del rendimiento académico. Esto hace que se requieran importantes avances en la metodología de la TRI para poder ser aplicada a contenidos multidimensionales. Por último, para finalizar la descripción de la situación actual de la evaluación psicológica se comentarán algunas de las reuniones científicas internacionales más importantes sobre esta disciplina celebradas en los últimos años, y que nos pueden servir para clarificar la situación de la disciplina en la actualidad. En Europa, un hecho relevante que supone un marco de referencia para la evaluación psicológica del viejo continente es la transformación en junio de 1990 de la Sociedad Española de Evaluación Psicológica en la European Association of Psychological Assessment, cuyo órgano oficial de comunicación va a ser el European Journal of Psychological Assessment (la publicación predecesora fue Evaluación Psicológica/Psychological Assessment). Esta sociedad ha organizado hasta la fecha cuatro congresos: Barcelona (1991), Gronigen (1993), Trier (1995) y Lisboa (1997). FUTURO DE LA EVALUACIÓN PSICOLÓGICA Algunos de los aspectos comentados anteriormente nos permiten predecir en cierta medida el rumbo que tomará la evaluación psicológica en los próximos años. Sin embargo, queremos hacer algunas reflexiones (o predicciones) acerca de las futuras tendencias de esta disciplina. En líneas generales, nos atrevemos a decir que el futuro de la evaluación psicológica es prometedor. Para ello, nos basamos, tal como consideran Kaplan y Saccuzzo (1993), en el importante papel UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA que ha jugado esta disciplina en el reconocimiento de la psicología. Si observamos el gran desarrollo alcanzado por la psicología (psicología conductual, psicofisiología, psicología de las organizaciones, psicología comunitaria, etc.), no podemos ocultar el gran papel que está desempeñando y tiene que desempeñar la evaluación psicológica en un futuro. Por otro lado, la proliferación de nuevos tests y la actualización de los tradicionales auguran un buen futuro para la evaluación psicométrica. La reciente aparición en el campo de la evaluación de la inteligencia del Wechsler adult intelligence scale (WAIS-R), del Wechsler intelligence scale for children-3th ed. (WISC-III) y del Wechsler preschool and Primary Scale of Intelligence-Revised (WPPSI-R), y del MMPI-2 en el campo de la evaluación de la personalidad auguran a estos instrumentos un largo (y óptimo) futuro. En cuanto a la evaluación de la inteligencia, Matarazzo (1992) comenta que en los próximos años se continuarán utilizando los tests colectivos y las escalas individuales, pero que dada la importancia que están adquiriendo las minorías en Estados Unidos (hecho que se podría extrapolar a cualquier país) deberemos empezar a considerar la posibilidad de aplicar los instrumentos de evaluación teniendo en cuenta el contexto familiar y cultural del sujeto, con lo cual, tal vez, extinguiríamos algunas de las injusticias sociales de los tests tradicionales. Por otra parte, en la evaluación de la inteligencia se están desarrollando técnicas basadas en teorías innovadoras (por ejemplo, Carroll, Hunt o Sternberg) con las que se podrán estudiar desde los procesos mentales de primer orden hasta las habilidades cognitivas complejas como el razonamiento, la comprensión o la inteligencia. Otro hecho que está actualmente en sus inicios, pero que sin duda alcanzará gran importancia en los próximos años, es la evaluación de la inteligencia mediante indicadores biológicos. Por ejemplo, la correlación encontrada entre potenciales evocados e inteligencia puede hacer de ellos una alternativa a la evaluación tradicional de la inteligencia. Otra línea de investigación iniciada es la relación entre niveles de glucosa e inteligencia. No sería de extrañar, tal como plantea Matarazzo (1992), que en las próximas décadas se integrasen en un único modelo los planteamientos teóricos de Carroll, Hunt o Sternberg con sustratos biológicos del funcionamiento cognitivo. En un afán por mejorar la calidad de los tests, así como las habilidades de las personas que los aplican, se han formado dentro del marco de la Unión Europea diferentes comisiones de trabajo cuyas conclusiones se tratarán de poner en práctica en los próximos años; estos trabajos van 26 dirigidos en tres direcciones (Muñiz, 1995). En primer lugar, el Colegio Oficial de Psicólogos español ha creado una comisión que intentará elaborar unas normas que tendrán que cumplir los tests con el fin de poseer un criterio con el que contrastar si un test posee los requisitos técnicos exigibles para su uso; en este contexto el Colegio de Psicólogos alemán ha planteado recientemente la posibilidad de que los tests fuesen considerados por el Parlamento Europeo como productos sanitarios, con lo que ello implica a nivel de uso y de control de calidad. Por otro lado, el Colegio Oficial de Psicólogos español está integrado en una comisión liderada por la International Tests Commission (ITC) que está a punto de finalizar la elaboración de unas directrices técnicas para la correcta adaptación de un test de una lengua/cultura a otra; un primer avance con veintidós directrices agrupadas en cuatro apartados (contexto, desarrollo de instrumentos y adaptación, administración e interpretación de las puntuaciones) fue publicado recientemente (Hambleton, 1994). Por último, en el futuro alguien (probablemente los colegios de psicólogos) deberán acreditar a las personas para utilizar ciertos tipos de tests, lo cual implicará el establecimiento de unos curricula o conocimientos exigibles. De hecho, en un reciente trabajo de Moreland y cols. (1995) se establecen doce competencias mínimas que deben cumplir aquellas personas que trabajen con tests, que van desde evitar errores al establecer las puntuaciones y registrar los datos hasta no asumir que una norma o baremo para una determinada situación o grupo de sujetos puede aplicarse automáticamente a otra situación o grupo de sujetos distintos, pasando por abstenerse de entrenar a los sujetos en los ítems de los tests o no hacer fotocopias de materiales originales. En Inglaterra ya se empieza a realizar una acreditación de especialistas en tests (Bartran, 1996). Un buen ejemplo del desarrollo de la evaluación psicológica en los próximos años es, en palabras de Matarazzo (1992), la mejora de la evaluación neuropsicológica. Ante la situación que probablemente tengamos que afrontar (una población envejecida, un incremento de la enfermedad de Alzheimer y casos de lesiones neuronales) tendrán que desarrollarse baterías o tests que evalúen la eficacia para captar información por diferentes modalidades sensoriales, la capacidad de atención, concentración y de procesamiento de información y la habilidad para ejecutar operaciones verbales o motoras requeridas ante la presentación de un ítem. Por lo que respecta a la evaluación de la personalidad, Matarazzo (1992) pronostica el desarrollo de tests para el UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA diagnóstico de psicopatologías específicas como consecuencia del perfeccionamiento de la tecnología de elaboración de tests. Por otro lado, nuevas generaciones de cuestionarios de personalidad como el NEO basado en las cinco dimensiones básicas (Costa y McCrae, 1988) se irán afianzando. Pero sin duda ninguna, uno de los campos de evaluación más prometedores en el futuro será la psicología de la salud. Tareas como la evaluación ecopsicológica del sujeto (Fernández del Valle, 1996) para determinar factores de riesgo y realizar cambios ambientales serán fundamentales en los próximos años. La tercera edad será un área de gran importancia en donde la evaluación psicológica tendrá un papel relevante. Temas como los trastornos gastrointestinales, el dolor crónico, el asma, los trastornos de la menstruación, la miopía, la artritis reumatoide, programas de salud, calidad de vida, etc. demandarán al evaluador psicológico (véase Buela-Casal, Caballo y Sierra, 1996). Quisiéramos terminar con las predicciones sobre el futuro de la evaluación psicológica realizadas por algunos autores relevantes de esta disciplina. En opinión de R. Ardila (comunicación personal, 14 de septiembre de 1995), la evaluación psicológica probablemente va a continuar abarcando nuevas áreas de la conducta humana, utilizando técnicas estadísticas más elaboradas, lo cual no excluirá el empleo de técnicas cualitativas. Por su parte, L. Almeida (comunicación personal, 24 de septiembre de 1995) considera que en el futuro se realizará un mayor esfuerzo por integrar conceptos antagónicos hasta el momento, como rasgoconducta o E-R y cogniciones; según este autor, en los próximos años seremos testigos de grandes desarrollos en la evaluación psicofisiológica y en la computarización de la evaluación psicológica. Para A. E. Kazdin (comunicación personal, 17 de agosto de 1995) el "modelo estático" de evaluación en el que una persona es evaluada mediante un test para predecir su ejecución dará paso a un "modelo dinámico" en el que primará la identificación de influencias bidireccionales entre constructos, de procesos de relaciones entre individuos y de las personas con sus ambientes. Por su parte, L. E. Beutler (comunicación personal, 15 de agosto de 1995) augura una mayor relación entre investigación y práctica dentro de la evaluación psicológica, especialmente en la planificación de tratamientos, y que todos aquellos procedimientos que tengan dificultad para validarse terminarán desapareciendo de la práctica convencional. Por último, en 27 opinión de S. N. Haynes (comunicación personal, 23 de septiembre de 1995) el futuro de la evaluación psicológica se puede resumir en los siguientes apartados: a. Se producirá un incremento en el empleo de los instrumentos de evaluación validados previamente (Haynes, Bogan e Ignacio, en prensa). b. Se seguirá incrementando el uso concurrente de diferentes métodos de evaluación (cuestionarios de autoinforme, registros psicofisiológicos, observación, autorregistros...). c. La evaluación psicológica seguirá integrando medidas de componentes situacionales con medidas tradicionales como los rasgos de personalidad, produciéndose un incremento de la aceptación de modelos de interacción persona x situación. d. Los juicios clínicos seguirán cobrando gran importancia. e. Teniendo en cuenta que la conducta es dinámica y cambia a lo largo del tiempo (Haynes, Blaine y Meyer, 1995), se enfatizará una metodología de evaluación basada en medidas de series temporales. Así, métodos como las correlaciones testretest, medidas pre y postratamiento, etc. ayudarán a evaluar estas características dinámicas de las variables. f Se producirán avances importantes en el desarrollo de instrumentos de evaluación psicológica: registros de vídeo y audio, sistemas de computarización de datos de observación, registros ambulatorios de variables psicofisiológicas, etc. (Tryon, 1996). UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL MÓDULO 0515- EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA 28 UNIDAD I. ANTECEDENTES HISTÓRICOS DE LA EVALUACIÓN CONDUCTUAL