1 CAUSALIDAD, ESTADÍSTICA Y MECANISMOS CAUSALES “From methodological ´wars´ to methodological pluralism?" Universitat Pompeu Fabra, Barcelona, 12 de noviembre de 2009 Ignacio Lago Universitat Pompeu Fabra Departamento de Ciencias Políticas y Sociales Barcelona, España ignacio.lago@upf.edu 2 La investigación (empírica) en ciencias sociales debe iniciarse con la descripción de los fenómenos políticos y sociales que nos interesan. Es difícil plantear una explicación sin que sepamos antes algo sobre el mundo y qué debe explicarse en función de qué características. En los términos de Merton (1987: 1-6), se deben “establecer los fenómenos” antes de avanzar una explicación, esto es, hay que disponer de evidencia empírica que avale que estos fenómenos existen en realidad y que tienen la regularidad necesaria para requerir y permitir una explicación. Dado el número prácticamente infinito de hechos que se pueden observar, la descripción posibilita, por un lado, inferir información sobre hechos no observados a partir de los que sí se han contemplado, y, por otro, distinguir entre lo que estos hechos tienen de sistemático o regular y de no sistemático o aleatorio (King, Keohane y Verba, 1994: capítulo 2; véase también Coleman, 1990; Goldthorpe, 2000). Sin embargo, las descripciones no van más allá de la observación de correlaciones, de modo que las circunstancias causales que provocan los fenómenos políticos o sociales en cuestión están ausentes. A través de la descripción somos capaces de establecer las regularidades sociales o políticas que constituyen el explananda o la/s variable/s dependiente/s de nuestro análisis y definir así con precisión la pregunta de investigación que nos interesa. Pero no podemos plantear las razones o causas de estas regularidades o efectos. En las ciencias sociales, la identificación de las causas es el fundamento para entender los fenómenos y construir una ciencia explicativa. Como señala Elster (2000: 35), la meta de la investigación debe ser reemplazar por causas pasadas las huellas que deja en el presente el funcionamiento de esas causas. La causalidad es el principal medio que tenemos para ordenar y comprender el mundo. Si no sabemos quién está haciendo qué a quién, no podemos entender el mundo en el que vivimos, no podemos hacer responsables a las personas y a las instituciones de sus acciones y no podemos actuar eficazmente (Gerring, 2001: 129). Para poner en marcha una política pública dirigida a reducir las desigualdades horizontales en el mercado laboral (esto es, trabajadores de productividad equiparable que disfrutan de muy distintas oportunidades laborales) en Europa, por ejemplo, necesitamos saber cuáles son sus niveles en cada país. Pero también qué las causa: la protección legal frente al despido y el contexto institucional en el que se introducen los contratos temporales (Polavieja, 2005). E incluso cuando esta comprensión causal no tenga consecuencias sociales o políticas, entender los acontecimientos en términos de relaciones de causa- 3 efecto hace, como señala Pearl (2000: 345), que los sintamos “bajo control”. En palabras de Hume (1992) [1738], la causalidad es simplemente el cemento del universo. Como en tantas otras ocasiones en nuestro campo de conocimiento, pese a que el concepto causalidad se haya discutido durante siglos, no existe ninguna definición universalmente aceptada. El punto de encuentro de todas las caracterizaciones de la causalidad es que las relaciones causales se componen al menos de dos elementos: una causa, que también se suele denominar input, elemento causal, variable independiente, variable exógena o simplemente X, y un efecto, que a su vez se conoce también como output, resultado, variable dependiente, variable endógena o simplemente Y. De este modo, se puede manejar como definición mínima de la causalidad la que ofrece Gerring (2001: 129 y 138; 2005: 169): las “causas” son factores que incrementan las probabilidades (previas) de que suceda un acontecimiento o, más formalmente, X puede ser considerado la causa de Y si (y sólo si) eleva la probabilidad de que Y ocurra. Para tratar la causalidad como un concepto abstracto o teórico y entrar así en el debate sobre las aproximaciones metodológicas más fértiles en ciencias sociales, definiré la causalidad o los efectos causales en términos contrafácticos. En general, los conceptos de causa se construyen sobre la idea de comparar lo que en realidad ha sucedido, bajo ciertas condiciones, con lo que habría podido suceder bajo otras condiciones particulares diferentes. Por tanto, el efecto causal de cualquier acción se puede definir como la diferencia entre el resultado real y el que habría tenido lugar de acuerdo con la acción contrafáctica distinta. Con mayor precisión, King, Keohane y Verba (1994: cap. 3) definen el efecto causal como la diferencia en los valores de la variable dependiente cuando la variable explicativa adopta dos valores distintos y todo lo demás sigue igual. En otras palabras, el efecto causal de X es la diferencia en el resultado en Y que tendría lugar si pudiéramos realizar un experimento perfecto en el que sólo X cambia. Por ejemplo, supongamos que queremos saber qué influencia tiene el género (la X) sobre el salario (la Y). Un hombre determinado gana 30.000 euros anuales. Para definir el efecto causal (teórico) deberíamos convertir al hombre que teníamos antes en una mujer. Como todo sigue igual, a excepción de que ahora ha cambiado el género, la diferencia entre el salario en la situación real, cuando la persona es un hombre, y la simulada, cuando es una mujer, es el efecto causal del género sobre el salario. 4 Como es evidente, el problema de esta comparación es que resulta imposible que una persona sea hombre y mujer. En otras palabras, no se puede observar simultáneamente X y no-X para una determinada unidad. Se trata, en los términos de Holland (1986), del problema fundamental de la inferencia causal. Si bien son necesarias dos observaciones de un determinado caso para estimar un efecto causal, los investigadores sólo disponen de una en el mundo real. Para poder estimar el efecto causal que nos interesa debemos comparar los valores de la variable dependiente de unidades con distintos valores en la variable independiente. Es decir, el salario medio de hombres y mujeres. Pero ahora salta en pedazos el supuesto de todo lo demás igual, puesto que entre nuestros hombres y mujeres hay más variables distintas además del género, como el nivel de estudios o la antigüedad en el puesto de trabajo, que también influyen en el salario. Para evitar las relaciones espurias debemos controlar todas las variables independientes que, según nuestra teoría, explican la Y para conseguir que sólo una variable, la clave, sea la que difiere entre nuestras unidades. Por supuesto, esta discusión sobre la inferencia causal nos lleva a la bien conocida proposición de que mientras que la correlación o, más generalmente, la asociación no implica causalidad, la causalidad sí implica algún tipo de asociación. Este control se puede hacer a través de diseños experimentales y experimentos naturales en los que el investigador y la naturaleza, respectivamente, manipulan las variables para garantizar la homogeneidad causal o de las unidades. Desafortunadamente, las preguntas de investigación que se pueden responder a través de diseños experimentales y experimentos naturales son más la excepción que la norma. Estudiar el impacto del tipo la transición a la democracia en el sistema electoral del que se dota un país no parece un tema para un experimento. La estrategia más habitual es el uso de datos no-experimentales u observacionales, como los que tenemos en el ejemplo anterior. Y aquí no es fácil garantizar la homogeneidad causal. Como señalan Kiser y Hechter (1991: 7), la eliminación de las relaciones espurias es el problema fundamental para la justificación de la inferencia causal. Cuando se recure a los datos no-experimentales, disponemos de dos estrategias de investigación: la cualitativa o casos de estudio y la cuantitativa o la investigación con un número de observaciones grande. ¿Cuál de las dos es la mejor para estimar un efecto 5 causal? Ya sabemos que para recuperar el supuesto de la homogeneidad causal todas las potenciales variables confundidoras deben ser controladas. Una acción tendrá un efecto causal sobre una respuesta si la respuesta cambia cuando lo hace la acción y bajo las circunstancias en las que todo lo demás que es relevante para el resultado permanece igual. Desafortunadamente para los científicos sociales, nunca hay una única causa, sino que el mundo social es multicausal. Parece claro que el número de observaciones debe superar al número de variables independientes. Aun suponiendo que la única diferencia relevante entre dos personas para explicar su salario sea su género, harían falta dos observaciones, un hombre y un mujer, para estimar el impacto de una variable independiente, el género. Y si estas dos personas difieren también en su nivel de estudios, ya no nos valdría con sólo dos observaciones. La combinación de la multicausalidad y de los límites en la información que podemos extraer de cada observación ha llevado a que la regresión o cualquiera de sus variantes sea, de lejos, la estrategia más común para estimar los efectos causales. La regresión se puede entender como el modo más eficiente para establecer conclusiones a partir de las observaciones de las que disponemos. Un coeficiente de regresión recoge precisamente el cambio en Y cuando varía una X, manteniéndose constante todas las demás X que se manejan en la explicación. No obstante, esto no significa que los estudios cualitativos sean secundarios o prescindibles para los científicos sociales, como se desprende, en mi opinión, de las tesis de King, Keohane y Verba (1994)1. Los argumentos causales no sólo comprenden el establecimiento de efectos causales, sino también la identificación de un mecanismo causal −el camino o proceso a través del que se produce un efecto (Gerring, 2008: 161)2. Hay dos grandes razones sobre las que se sustenta mi argumento, englobado en el llamado realismo causal (Little, 1998) y las teorías de alcance medio (Merton, 1967)3. En primer lugar, un investigador nunca tiene la seguridad absoluta de que la relación que ha descubierto entre X e Y sea causal, puesto que siempre es posible que no se esté controlando alguna X relevante. La provisión de un mecanismo causal reduce el riesgo de que la relación sea espuria. Por ejemplo, Franco, Álvarez-Dardet y Ruiz (2004) muestran que, una vez que se controla el efecto del nivel de riqueza, de las 1 Véase, en este sentido, Brady y Coller (2004). Para una discusión de los distintos significados que se le han dado a los mecanismos causales, algunos incluso contradictorios, véase Gerring (2008). 3 Véase Hedström (2005: capítulo 2) para una discusión más amplia de la cuestión. 2 6 desigualdades o del gasto público de un país, la democracia aumenta la esperanza de vida de la población y reduce la mortalidad infantil y la materna, en comparación con los demás tipos de sistemas políticos. Aunque este resultado es robusto desde un punto de vista estadístico, los autores reconocen que no tienen claro por qué la democracia es buena para la salud. De este modo, siempre nos queda la duda de que esta relación sea en realidad espuria. En segundo lugar, una buena teoría no sólo nos cuenta qué pasa sino también qué hace que pase o qué impide que pase (Bunge, 1997). Si no podemos decir algo sobre la frecuencia o probabilidad de un tipo específico de situación y sus resultados, no podemos evaluar la relevancia o capacidad explicativa de un mecanismo causal, independientemente de lo bien que entendamos teóricamente la situación particular. Y si no somos capaces de señalar un mecanismo, no podemos comprender el significado politológico o sociológico de la covarianza observada entre las variables, al margen de su fuerza (Blossfeld, 1996). Supongamos, por ejemplo, que encontramos una relación estadísticamente entre ser hombre y tener un salario más elevado. Es muy distinto que el mecanismo causal sea la estrategia de maximización del bienestar que realizan las familias (Becker, 1993), las distintas orientaciones hacia el empleo que tienen las mujeres (Hakim, 1991) la discriminación (Petersen y Morgan, 1995) o las rigideces del mercado de trabajo (Blau, Ferber y Winkler, 1998). Cuando se trata de establecer los mecanismos en juego, los análisis cualitativos o los estudios de caso se llevan la parte del león. Puesto que abrir cajas negras exige un profundo conocimiento de las estrategias de los actores implicados en el fenómeno que se quiere explicar4, difícilmente se puede realizar esta tarea si se manejan muchas observaciones y se tienen en cuenta sólo técnicas cuantitativas. De hecho, la propia definición de estudios de caso −el estudio intensivo de un único (o varios) caso(s) con el propósito de entender un mayor conjunto de casos (Gerring, 2007: 95)− ilustra bien a las claras sus utilidades. 4 Por supuesto, el individualismo metodológico es la regla. 7 La conclusión más importante que se deriva de la discusión es le complementariedad entre los estudios de caso y los cuantitativos. Mientras que los primeros permiten al investigador explorar mecanismos causales y desarrollar teorías, los segundos sirven fundamentalmente para identificar efectos causales y confirmar o refutar teorías (Gerring, 2007). Y las dos cosas son igual de importantes en la buena ciencia social. Referencias Becker, Gary. 1993. Human Capital. Chicago: University of Chicago Press, 3era ed. Blau, F.D., M.A. Ferber y A. E. Winkler. 1998. The Economics of Women, Men, and Work. Upper Sadle River: Prentice Hall, 3era ed. Blossfeld, Hans-Peter. 1996. “Macro-sociology, Rational Choice Theory, and Time. A Theoretical Perspective on the Empirical Analysis of Social Processes”. European Sociological Review 12: 181-206. Brady, Henry E., y David Collier. 2004. Eds. Rethinking Social Inquiry. Diverse Tools, Shared Standards.Oxford: Rowman & Littlefield Publishers, Inc. Bunge, Mario. 1997. “Mechanism and Explanation”. Philosophy of the Social Sciences 27: 410-465. Coleman, James S. 1990. Foundations of Social Theory. Cambridge, MA: Harvard University Press. Elster, Jon. 2000. El cambio tecnológico. Investigaciones sobre la racionalidad y la transformación social. Barcelona: Gedisa. Franco, Álvaro, Carlos Álvarez-Dardet, y María Teresa Ruiz. 2004. “Effect of democracy in health: ecological study”. British Medical Journal 329:1421-1423. Hakim. Cattherine. 1991. “Grateful slaves and self-made women: fact and fantasy to women’s work orientations”. European Sociological Review 7: 101-121. Gerring, John. 2001. Social Science Methodology. A Critical Framework. Cambridge: Cambridge University Press. Gerring, John. 2005. “Causation: A Unified Framework for the Social Sciences”. Journal of Theoretical Politics 17: 163-198. 8 Gerring, John. 2007. “The Case Study: What it is and What it Does”. En Carles Boix and Susan Stokes (eds.). The Oxford Handbook of Comparative Politics. Oxford: Oxford University Press, pp. 90-122 Gerring, John. 2008. “The mechanistic worldview: thinking inside the box”. British Journal of Political Science 38: 161-179. Goldthorpe, John. 2000. “Causation, Statistics, and Sociology”. European Sociological Review 17: 1-20. Hedström, Peter. 2005. Dissecting the Social: Social Mechanisms and the Principles of Analytical Sociology. Cambridge: Cambridge University Press. Holland, Paul W. 1986. “Statistics and Causal Inference”. Journal of the American Statistical Association 81: 945-960. Hume, David. 1992 [1738]. Tratado de la naturaleza humana. Madrid: Tecnos. King, Gary, Robert O. Keohane and Sidney Verba. 1994. Designing social inquiry: scientific inference in qualitative research. Princeton (N.J.) : Princeton University Press Kiser, Edgar, y Michael Hechter. 1991. “The Role of General Theory in Comparativehistorical Sociology”. American Journal of Sociology 1: 1-30. Little, Daniel. 1998. On the Philosophy of the Social Sciences. Microfoundations, Method, and Causation. New Brunswick, NJ.: Transaction Publishers. Merton, Robert K. 1967. On Theoretical Sociology. Nueva York: Free Press. Merton, Robert K. 1987. “Three fragments from a sociologist’s notebook: establishing the phenomenon, specified ignorance and strategic research materials”. Annual Review of Sociology 13: 1-28. Pearl, Judea. 2000. Causality: Models, Reasoning, and Inference. Cambridge, MA.: Harvard University Press. Petersen, T. y L.A. Morgan. 1995. “Separate and Unequal: Occupation-Establishment Sex Segregation and the Gender Wage Gap”. American Journal of Sociology 101: 329365. Polavieja, Javier G. 2005. “Desregulación parcial y desigualdad horizontal en España”. Revista Internacional de Sociología 41: 9-36.