Notas sobre Epistemología. Lógica y método universal: Bayesianismo. FUENTE: PSIQUIATRIA.COM. 2004; 8(1) Fernando Ruiz Rey. Psiquiatra Wake County Human Services Raleigh, NC. USA E-mail: F5R7R0@AOL.com La falibilidad de las teorías, recalcada por Popper y otros filósofos, no parece ser confirmada por la experiencia. Una teoría como la de Newton, descalificada por la relatividad de Einstein, es utilizada con éxito en los cálculos de ingeniería en proyectos tan delicados como poner astronautas en la órbita de la Tierra. La lógica empleada para hacer estas afirmaciones de falibilidad no es adecuada, una teoría bien confirmada no puede tener una probabilidad de cero (P = # casos observados / # de casos posibles: infinitos=0). Un grupo de filósofos va ha utilizar el teorema de Bayes (1, 2) para intentar corregir esta situación, salvar la inferencia inductiva, ahora con reglas probabilísticas, y ofrecer una justificación y método universal para la ciencia. (3) Tradicionalmente la probabilidad se presentaba como un resultado particular, a la suerte, de un muestreo al azar de una variable fortuita; esta manera de presentar las probabilidades es conocida como frecuentismo; pero este acercamiento estadístico requiere de posibilidades regulares fortuitas y finitas, y, con frecuencia, numerosos ensayos para extraer el cálculo de posibilidades. Por estas condiciones básicas requeridas por el frecuentismo, su aplicación tiene numerosas limitaciones, porque hay situaciones en las que se requiere realizar un cálculo de probabilidades en las que no pueden repetirse los ensayos, como sería una situación clínica en la que se quiere calcular las probabilidades de éxito de una terapia. Tampoco se puede cumplir fácilmente la condición de posibilidades finitas, como es el caso de un dado que tiene solo seis posibilidades en su caída, la mayoría de los campos en que se aplica el cálculo de probabilidades se abren a innumerables posibilidades influidas por nuevas condiciones. El frecuentismo ha ido siendo reemplazado por un tipo de inferencia de probabilidades diferente, en la que es posible presentar las probabilidades de una proposición, suceso, hipótesis, no solo como un azar ciego, sino que también influidas por la evidencia que la soporta.(4, 5) Este nuevo acercamiento, lo permitió Thomas Bayes (1702-1761), matemático inglés, que ideó una fórmula matemática simple para calcular las probabilidades de una hipótesis o proposición, condicionada -que depende de- pruebas o evidencia que la apoyan: la probabilidad P condicionada de una proposición o hipótesis h depende de la evidencia e, este proceso constituye la inferencia bayesiana: P(h/e)=P(h&e)/P(e) Como se puede notar en la fórmula, la determinación de la probabilidad P es en función dos variables, h y e, por esto se habla de probabilidades condicionales. El principio de condicionalización comienza con un estado de probabilidad previa o inicial Pi que se modifica al adquirirse nueva evidencia acerca del suceso cuya probabilidad se está investigando; esta evidencia se puede presentar como una proposición de evidencia: e, y se asume en esta operación, que esta proposición resume toda la nueva evidencia adquirida, y que la probabilidad previa es mayor que cero. Así planteada la situación, la racionalidad bayesiana requiere que se ajuste la probabilidad previa o inicial, considerando la nueva información e, para obtener la probabilidad posterior o final: Pf, esta probabilidad representa el grado de credibilidad de una hipótesis en vista de la evidencia. Pf(h)=Pi(h/e) El teorema aplicado a la situación de la ciencia considera que la probabilidad final (Pf) de una hipótesis h en función de la evidencia e observacional o experimental: Pf(h/e), es directamente proporcional al producto de la probabilidad asignada a la hipótesis h en ausencia de la evidencia e, o sea, la probabilidad inicial: Pi (h), multiplicada por la razón de la probabilidad asignada a la evidencia e, en el supuesto de que la hipótesis h sea verdadera: P(e/h), y la probabilidad asignada a la prueba o evidencia e, en ausencia de cualquier suposición de verdad de la hipótesis h: P(e) Pf(h/e)=Pi(h)xP(e/h)/P(e) La fórmula propuesta por Bayes, posibilita calibrar la probabilidad de una hipótesis en vista de la evidencia, y mide la confianza que la persona tiene en la hipótesis con la suposición de que la evidencia es un hecho.(1) La probabilidad previa Pi(h) es modificada por la razón: P(e/h)/P(e) -la evidencia e resumida en una forma probabilística-, esta razón -razón de posibilidad (o verisimilitud)(“likelihood ratio”)- constituye el poder predictivo de la ecuación. El factor P(e/h) se refiere a la probabilidad de la evidencia en el supuesto que la hipótesis h es verdadera, de tal modo, que el valor de e será máximo: 1, si la evidencia e se sigue de una hipótesis h verdadera (realizado el experimento se establece la evidencia que sigue a la hipótesis h), pero tendrá un valor mínimo: 0 si la ausencia de evidencia e, se sigue de una hipótesis h verdadera. El factor P(e) refleja, inversamente, con el valor de la probabilidad de la evidencia o prueba, el apoyo que le prestaría a la hipótesis propuesta en caso de que la evidencia sea confirmatoria; así, si la prueba o evidencia es considerada muy probable (valor alto de P(e)), no ofrecerá ningún apoyo a la teoría propuesta, pero si se considera poco probable (valor bajo de P(e)), entonces apoyará la hipótesis. La confirmación de la hipótesis h depende de la improbabilidad de la evidencia. Según la teoría bayesiana, el grado de confirmación de una hipótesis h por la evidencia e, depende de la extensión con que el valor de P(e&/h) sobrepasa el valor de P(e). Chalmers (3) ilustra esta situación con la posible proposición de una nueva teoría de la gravitación que predijera la caída de los cuerpos pesados a la Tierra; esta evidencia no aportaría apoyo a la hipótesis, porque ya se sabe que los cuerpos caen, y esto, ya está explicado por la teoría de la gravedad vigente. La situación cambia si la prueba o evidencia es poco probable, como sería el caso hipotético de una nueva teoría que predijera un pequeño cambio de la gravedad producido por la temperatura, esto no se espera, y no está consultado en las teorías vigentes. (3, 6) Entonces, para determinar la probabilidad final de una hipótesis Pf(h), se debe asignar una probabilidad inicial Pi (h) a la hipótesis que se quiere probar (previo a la observación de la evidencia: datos observacionales y/o experimentales); luego, hay que asignar una probabilidad a la evidencia P(e) que se quiere lograr con el experimento, independientemente de la verdad o falsedad de la hipótesis h. Si se considera que la evidencia e, que surgirá del experimento, es de cualquier modo muy probable, tendrá un P(e) alta, pero no ofrecerá un respaldo importante a la hipótesis que está en juego si resulta positiva; por el contrario, si es muy improbable que ocurra esta evidencia e, la P(e) será baja, pero si ocurre, respaldará fuertemente a la hipótesis. Una vez realizado el experimento, se reajustan los cálculos de la ecuación para establecer la probabilidad de la hipótesis ante los datos establecidos. La Pf(h) se convierte en una nueva probabilidad inicial Pi(h) ante la perspectiva de nuevos experimentos con nueva evidencia. El teorema de Bayes se presenta en diversas versiones, según las funciones usadas para expresar la probabilidad incondicional y la razón de posibilidad (”likelihood ratio”) usado para expresar el poder predictivo que otorga la evidencia, pero el mensaje envuelto es el mismo, (1): probabilidad condicional = probabilidad incondicional x poder predictivo El teorema de Bayes combina el razonamiento inductivo y el deductivo; el proceso inductivo aparece en cuanto va evaluando diversas teorías a la luz de nuevas evidencias. La probabilidad posterior o final se transforma en probabilidad inicial en cuanto aparece una nueva evidencia, debiéndose condicionalizarse a ella, y así sucesivamente. El razonamiento deductivo se realiza en la generalización de P (e/h). El teorema tiene el atractivo de ser incontestable una vez aceptados los supuestos básicos del cálculo de posibilidades, y de arrojar resultados en términos matemáticos que permiten una elaboración precisa de ellos. (4) Una vez aceptado los axiomas fundamentales, el teorema tiene coherencia probabilística, justificada por lo que los bayesianos llaman el “libro holandés”, esto es, si un sujeto apuesta según su deseo, y esto no sigue la ley de las probabilidades, perderá su dinero en sus apuestas. Los bayesianos trabajan en el campo de las probabilidades, y por ello rechazan las posturas de Popper, Lakatos y otros filósofos, que intentan encontrar un procedimiento de estandarización absoluta y obligatoria para la ciencia. Los bayesianos señalan que las técnicas estadísticas usadas por estos filósofos para comparar hipótesis y estimar cantidades científicas inciertas, son las tradicionales del frecuentismo que están plagadas de inconsistencias y limitaciones, especialmente las pruebas de “significación” e “estimación”. Según Press y Tanur (5, pág. 214), esto ocurre fundamentalmente “ en el acercamiento popperiano (de falsificación, o generando una hipótesis de hombre de paja que se cree es falsa, y luego, mostrando que en verdad es falsa) para comparar teorías”. Además, como veremos más adelante, los bayesianos señalan que la subjetivad, que esos filósofos quieren evitar, es inevitable en la actividad científica. Sin embargo, los problemas surgen para el bayesionismo cuando se trata de asignar un valor “objetivo” a la proposición o hipótesis, inicial (Pi) o, cuando se intenta cuantificar la evidencia. Para proceder objetivamente en la determinación de la Pi hay que considerar las teorías disponibles acerca del dominio pertinente, como ocurriría en una carrera de caballos en la que no se tiene ninguna información de los competidores -ausencia de e-, si se quiere proceder objetivamente en asignar las probabilidades a cada caballo, estas deben repartirse por partes iguales entre ellos; pero en el caso de la ciencia, no resulta fácil decidir cuales son las teorías disponibles, y, teóricamente, el número de teorías posibles en un dominio es infinito, por lo que la probabilidad cae a cero, y así, no se puede aplicar el teorema de Bayes. (3) Este problema se soluciona abandonando la pretensión de objetividad para aceptar la “subjetividad” de los científicos en la elección de sus teorías preferidas y en la asignación de probabilidades, asumiendo que proceden razonablemente. Este carácter subjetivo del proceso, es minimizado, señalando que la operación misma del teorema es nítidamente lógica, la subjetividad se “formaliza” con la racionalidad del teorema. Además los bayesianos señalan que las variaciones ínter subjetivas que puedan existir al comienzo de una teoría o experimento, se van corrigiendo con el progreso de la investigación. Chalmers (3, pág. 170) explica este proceso, imaginando que dos científicos comienzan una investigación con serias diferencias acerca de la probable verdad de la hipótesis h, que predice un resultado e bastante improbable desde el punto de vista teórico del momento. El científico que atribuye alta probabilidad a la hipótesis h, se sentirá confiado en que el resultado e del experimento será positivo, y atribuirá a e una probabilidad alta. Por el contrario, el científico que no confía en la hipótesis h, no esperará que la evidencia e sea la esperada, y le dará una probabilidad baja. Se realiza el experimento, y e resulta confirmatoria; en vista de esta evidencia, ambos científicos deben reajustar las probabilidades de h para los experimentos que seguirán. El ajuste se hace con la ‘razón de posibilidad’: P(e/h)/P(e). Como la evidencia e se sigue de h en el experimento realizado, el valor de P(e/h) es 1, con lo que P(e/h)/P(e)=1/P(e). El científico que confiaba en h y atribuyó una probabilidad alta a e, tendrá un 1/P(e) bajo, y el que no confiaba en h, y asignó una probabilidad baja a e, tendrá un 1/P(e) alto. Como la ‘razón de posibilidad’: P(e/h)/P(e), según el teorema, se multiplica por la probabilidad inicial de h, modificándola; el científico que comenzó la investigación dudando del valor de verdad de la hipótesis h, aumenta la probabilidad de h al multiplicar por un factor alto, comparado al científico que confiaba en la hipótesis, y multiplica por un factor bajo. Según los bayesianos, con la prosecución de los experimentos disminuye la diferencia de opinión inicial que tuvieron los científicos. Una vez salvadas las primeras dificultades para la determinación de las probabilidades iniciales y de la evidencia, la fórmula bayesiana opera con nitidez matemática y puede aplicarse a casos históricos de la ciencia, y a otras características de la actividad científica. El bayesionismo tiene la ventaja frente a la estadística frecuentista, de ofrecer un modo uniforme de inferencia (Teorema de Bayes y derivaciones), tanto para las teorías deterministas, como para las teorías de probabilidad estadística. El factor P (e/h) del teorema varía según el tipo de teoría, para la teoría determinista, la evidencia confirmatoria de la teoría toma un valor de 1, en las teorías de probabilidad estadística, el P(e/h) toma un valor igual a la probabilidad estadística que la hipótesis confiere a la evidencia (5). El bayesionismo de Howson y Urbach (6) rechaza la teoría de la prueba de significación del frecuentismo, que informa cuando se debe rechazar o considerar falsa una hipótesis estadística. También rechaza la teoría de la estimación para calcular el rango de números considerados una buena aproximación al valor verdadero. Según estos autores, en estas ‘pruebas’ abundan las inconsistencias lógicas y la intervención de juicios subjetivos en la determinación de ciertos standards. Con la racionalidad bayesiana,es posible explicar por que una vez que una teoría ha sido confirmada por un experimento, los científicos no consideran que su repetición, bajo las mismas circunstancias, agregue una confirmación significativa a la teoría. Siguiendo la ecuación bayesiana, la repetición del mismo experimento aumenta la probabilidad de e, bajando el valor de la ‘razón de posibilidad’ que modifica la probabilidad de la hipótesis o teoría; con cada repetición del experimento, e incremento de P(e), aumenta en forma decreciente la probabilidad de la teoría, P(h). Por esta misma razón, una teoría obtiene más respaldo de experimentos nuevos que de la repetición de los ya efectuados.(3) El tratamiento que el bayesionismo hace de las teorías ad hoc es diferente al de otros filósofos que las eliminan como fraudulentas, el bayesionisma las acepta como científicas y las somete al cálculo de probabilidades, si las probabilidades son bajas, las teorías ad hoc son eliminadas. El bayesionismo ignora las condiciones establecidas por otras corrientes filosóficas que requieren que las teorías ad hoc sean probadas independientemente de la teoría que suplementan, y también rechaza la tesis que sostiene que una teoría no es aceptable, al menos, que esté apoyada por evidencia diferente a la que se usó para establecerla. Según Howson y Urbach (6, pág. 158), estas normas no son compatibles con la práctica científica, no son razonables, ni están a la altura de los standards de objetividad al que aspiran esas corrientes filosóficas. Como hemos visto, el bayesionismo de vertiente ‘objetiva’ tiene serias dificultades en establecer las probabilidades iniciales y en evaluar objetivamente la evidencia, pero también el bayesionismo de corte ‘subjetivo’ enfrenta problemas al depositar en el grado de creencia que el científico tiene de las teorías, la fuente de origen de sus probabilidades. Por ejemplo, en caso de un científico que propone una nueva teoría, un paradigma nuevo, en conflicto con la ciencia establecida del momento, la fuente de desavenencia radica en la creencia del científico. El bayesionismo no ofrece una respuesta ‘objetiva’, ‘racional’, para elegir entre las probabilidades de las teorías contendientes; La Pi de cada teoría es el resultado de antecedentes teóricos y experimentales previos, y de la creatividad y creencias del científico. Selección de teorías a este nivel, en base a sus probabilidades previas y posibles evidencias es totalmente conjetural. Tampoco ofrece un criterio para explicar el ‘progreso’ de la ciencia fuera del nivel de creencia de los científicos que pugnan por establecer nuevos paradigmas. Tampoco el bayesionismo establece un criterio para abandonar una hipótesis frente a una evidencia e desfavorable, ya que el científico puede tener una gran fe en su teoría y persistir en ella, a pesar de los resultados fallidos, y podría ser que nunca logre resultados positivos, pero también pudiera ser que tenga éxito más tarde; la historia de la ciencia confirma esta situación. (3, 5) A estas críticas, debe agregarse la dificultad que implica encontrar en un rastreo en la historia de la ciencia, las creencias privadas de los científicos acerca de las teorías que manejan, porque el grado de creencia que tienen, no puede ser medido por lo que efectúan y eligen de hecho: la acción no refleja automáticamente la creencia personal, hay otros factores que influyen en ella. Chalmers señala además, que en la situación de la ciencia moderna, la complejidad de las investigaciones envuelve un gran número de profesionales y técnicos en distintas áreas complementarias, por lo que determinar el grado de creencia personal resulta prácticamente imposible. (3, pág. 177-178) Los bayesianos subjetivos como Howson y Urbach toman la evidencia como datos dados para calcular la ‘razón de posibilidad’ y modificar la probabilidad inicial de la teoría, estos autores escriben: “La teoría de apoyo bayesiana es una teoría sobre cómo el dar por verdaderos unos enunciados de prueba afecta a la creencia en algunas hipótesis. Cómo se llega a aceptar la verdad de las pruebas y si está en lo correcto al aceptarlas como verdaderas, son asuntos irrelevantes desde el punto de vista de la teoría.” (Scientific Reasoning: The Bayesian Approch. First Edition. Pag 272. Citado en referencia 3) Pero el valor de los datos (e) de un experimento no radica en el grado de creencia que tiene el científico acerca de ellos. En su valor están envueltos una serie de standards de investigación empírica que deben respetarse para ser considerados datos fidedignos de consideración, si no se cumplen con las precauciones y las condiciones establecidas, los resultados se desechan sin necesidad de recurrir a grados subjetivos de creencia. (1) La fórmula bayesiana se aplica entonces, partiendo de bases subjetivas como grados de creencia en las hipótesis, pero no ofrece un criterio objetivo para seleccionar hipótesis rivales, ni para evitar el dogmatismo de los investigadores que se aferran a sus teorías preferidas. También se ha señalado que el bayesionismo con su lenguaje probabilístico no es suficiente para capturar lo esencial de la causalidad, la relevancia positiva de la causa al efecto; se trataría en el bayesionismo, más bien, de una mera conjunción de causa y efecto, y no de una relación causal propiamente tal. En el bayesionismo la objetividad de ciencia, viene con la observación y experimentación controlada (nunca completamente libre de elementos subjetivos: margen de error, eliminación de datos extremadamente fuera de rango, etc.), y el uso del teorema, que permite el paso de una creencia inicial o previa a una creencia final o posterior. Los bayesianos piensan que la mezcla cuidadosa de subjetividad y objetividad constituye “la esencia de toda buena ciencia.” (5, pág. 15) Press y Tanur (5, pág. 205) escriben: “La ciencia no puede, ni debe, ser totalmente objetiva, mas debería, y envuelve de hecho, una mezcla de ambos procedimientos, subjetivos y objetivos, con cada procedimiento alimentando retroactivamente (“feeding back”) al otro.” La objetividad de la ciencia es de carácter lógico -el Teorema de Bayes y sus derivaciones- y la evidencia, observacional o experimental, que es de carácter empírico. La utilidad del teorema de Bayes en el cálculo de probabilidades condicionadas ha ganado popularidad, y su uso se ha extendido a amplias áreas de la actividad científica y técnica, desde la astrofísica hasta la genética, desde la epidemiología hasta las ciencias políticas y económicas. La estadística basada en el Teorema de Bayes y sus derivaciones, ofrece una alternativa seria al frecuentismo que, como Howson y Urbach (6) señalan, no está carente de inconsistencias y elementos de subjetividad. Sin embargo, el bayesionismo no satisface a los filósofos que buscan en la dinámica de las ciencias, una respuesta racional, coherente y limpia, no solo el uso de un teorema que, partiendo de la subjetividad, pretende convertirse o reemplazar al método científico. Chalmers (3, pág. 180), por ejemplo, comenta que se podría conceder que el teorema tiene un rango igual a la lógica deductiva. “Esta concesión sirve para resaltar lo limitado de su postura [bayesianos subjetivos: Howson y Urbach]. Todo lo que su teoría del método científico dice acerca de la ciencia, equivale a la observación de que la ciencia se adhiere a los dictados de la lógica deductiva.” Esto no resulta satisfactorio para un filósofo de la ciencia. La racionalidad bayesiana, con toda su compleja elaboración técnica, y su practicidad en el cálculo de probabilidades en situaciones indeterminadas en las que inciden múltiples variables, no pasa de ser una descripción lógico-matemática de algunos aspectos de la praxis de la ciencia. Bibliografía 1. Joyce, James (2003). Bayes’s Theorem. Stanford Encyclopedia of Philosophy. plato.stanford.edu/entries/bayes-theorem 2. Talbot,William (2001). Bayesian Epistemology plato.sanford.edu/entries/epistemology-bayesian/ 3. Chalmers, Alan F (1982). ¿Qué es esa cosa llamada ciencia? Tercera edición. Siglo Veintiuno España Editores. 2000 4. Hatton, D. H. (2003). Introduction: The Bayesian View of Probability http://www.bib.hatton.btinternet.co.uk/dan/Mathematics/A_Bayesian_Perspective_on_Rec and Statistics. 5. Press SJ, Tanur, JM. (2001). The Subjectivity of Scientists and the Bayesian Approach. John Willey Inc. 6. Howson, C, Urbach, P (1989). Scientific Reasoning: The Bayesian Approach. Second Edition. La Salle, Illinois, Open Court. 1993