Notas sobre Epistemología. Lógica y método

Anuncio
Notas sobre Epistemología. Lógica y método universal: Bayesianismo.
FUENTE: PSIQUIATRIA.COM. 2004; 8(1)
Fernando Ruiz Rey.
Psiquiatra
Wake County Human Services
Raleigh, NC. USA
E-mail: [email protected]
La falibilidad de las teorías, recalcada por Popper y otros filósofos, no parece ser confirmada por la experiencia.
Una teoría como la de Newton, descalificada por la relatividad de Einstein, es utilizada con éxito en los cálculos de
ingeniería en proyectos tan delicados como poner astronautas en la órbita de la Tierra. La lógica empleada para
hacer estas afirmaciones de falibilidad no es adecuada, una teoría bien confirmada no puede tener una
probabilidad de cero (P = # casos observados / # de casos posibles: infinitos=0). Un grupo de filósofos va ha
utilizar el teorema de Bayes (1, 2) para intentar corregir esta situación, salvar la inferencia inductiva, ahora con
reglas probabilísticas, y ofrecer una justificación y método universal para la ciencia. (3)
Tradicionalmente la probabilidad se presentaba como un resultado particular, a la suerte, de un muestreo al azar
de una variable fortuita; esta manera de presentar las probabilidades es conocida como frecuentismo; pero este
acercamiento estadístico requiere de posibilidades regulares fortuitas y finitas, y, con frecuencia, numerosos
ensayos para extraer el cálculo de posibilidades. Por estas condiciones básicas requeridas por el frecuentismo, su
aplicación tiene numerosas limitaciones, porque hay situaciones en las que se requiere realizar un cálculo de
probabilidades en las que no pueden repetirse los ensayos, como sería una situación clínica en la que se quiere
calcular las probabilidades de éxito de una terapia. Tampoco se puede cumplir fácilmente la condición de
posibilidades finitas, como es el caso de un dado que tiene solo seis posibilidades en su caída, la mayoría de los
campos en que se aplica el cálculo de probabilidades se abren a innumerables posibilidades influidas por nuevas
condiciones.
El frecuentismo ha ido siendo reemplazado por un tipo de inferencia de probabilidades diferente, en la que es
posible presentar las probabilidades de una proposición, suceso, hipótesis, no solo como un azar ciego, sino que
también influidas por la evidencia que la soporta.(4, 5) Este nuevo acercamiento, lo permitió Thomas Bayes
(1702-1761), matemático inglés, que ideó una fórmula matemática simple para calcular las probabilidades de una
hipótesis o proposición, condicionada -que depende de- pruebas o evidencia que la apoyan: la probabilidad P
condicionada de una proposición o hipótesis h depende de la evidencia e, este proceso constituye la inferencia
bayesiana:
P(h/e)=P(h&e)/P(e)
Como se puede notar en la fórmula, la determinación de la probabilidad P es en función dos variables, h y e, por
esto se habla de probabilidades condicionales. El principio de condicionalización comienza con un estado de
probabilidad previa o inicial Pi que se modifica al adquirirse nueva evidencia acerca del suceso cuya probabilidad
se está investigando; esta evidencia se puede presentar como una proposición de evidencia: e, y se asume en
esta operación, que esta proposición resume toda la nueva evidencia adquirida, y que la probabilidad previa es
mayor que cero. Así planteada la situación, la racionalidad bayesiana requiere que se ajuste la probabilidad previa
o inicial, considerando la nueva información e, para obtener la probabilidad posterior o final: Pf, esta probabilidad
representa el grado de credibilidad de una hipótesis en vista de la evidencia.
Pf(h)=Pi(h/e)
El teorema aplicado a la situación de la ciencia considera que la probabilidad final (Pf) de una hipótesis h en
función de la evidencia e observacional o experimental: Pf(h/e), es directamente proporcional al producto de la
probabilidad asignada a la hipótesis h en ausencia de la evidencia e, o sea, la probabilidad inicial: Pi (h),
multiplicada por la razón de la probabilidad asignada a la evidencia e, en el supuesto de que la hipótesis h sea
verdadera: P(e/h), y la probabilidad asignada a la prueba o evidencia e, en ausencia de cualquier suposición de
verdad de la hipótesis h: P(e)
Pf(h/e)=Pi(h)xP(e/h)/P(e)
La fórmula propuesta por Bayes, posibilita calibrar la probabilidad de una hipótesis en vista de la evidencia, y
mide la confianza que la persona tiene en la hipótesis con la suposición de que la evidencia es un hecho.(1) La
probabilidad previa Pi(h) es modificada por la razón: P(e/h)/P(e) -la evidencia e resumida en una forma
probabilística-, esta razón -razón de posibilidad (o verisimilitud)(“likelihood ratio”)- constituye el poder predictivo
de la ecuación. El factor P(e/h) se refiere a la probabilidad de la evidencia en el supuesto que la hipótesis h es
verdadera, de tal modo, que el valor de e será máximo: 1, si la evidencia e se sigue de una hipótesis h verdadera
(realizado el experimento se establece la evidencia que sigue a la hipótesis h), pero tendrá un valor mínimo: 0 si
la ausencia de evidencia e, se sigue de una hipótesis h verdadera.
El factor P(e) refleja, inversamente, con el valor de la probabilidad de la evidencia o prueba, el apoyo que le
prestaría a la hipótesis propuesta en caso de que la evidencia sea confirmatoria; así, si la prueba o evidencia es
considerada muy probable (valor alto de P(e)), no ofrecerá ningún apoyo a la teoría propuesta, pero si se
considera poco probable (valor bajo de P(e)), entonces apoyará la hipótesis. La confirmación de la hipótesis h
depende de la improbabilidad de la evidencia. Según la teoría bayesiana, el grado de confirmación de una
hipótesis h por la evidencia e, depende de la extensión con que el valor de P(e&/h) sobrepasa el valor de P(e).
Chalmers (3) ilustra esta situación con la posible proposición de una nueva teoría de la gravitación que predijera
la caída de los cuerpos pesados a la Tierra; esta evidencia no aportaría apoyo a la hipótesis, porque ya se sabe
que los cuerpos caen, y esto, ya está explicado por la teoría de la gravedad vigente. La situación cambia si la
prueba o evidencia es poco probable, como sería el caso hipotético de una nueva teoría que predijera un pequeño
cambio de la gravedad producido por la temperatura, esto no se espera, y no está consultado en las teorías
vigentes. (3, 6)
Entonces, para determinar la probabilidad final de una hipótesis Pf(h), se debe asignar una probabilidad inicial Pi
(h) a la hipótesis que se quiere probar (previo a la observación de la evidencia: datos observacionales y/o
experimentales); luego, hay que asignar una probabilidad a la evidencia P(e) que se quiere lograr con el
experimento, independientemente de la verdad o falsedad de la hipótesis h. Si se considera que la evidencia e,
que surgirá del experimento, es de cualquier modo muy probable, tendrá un P(e) alta, pero no ofrecerá un
respaldo importante a la hipótesis que está en juego si resulta positiva; por el contrario, si es muy improbable
que ocurra esta evidencia e, la P(e) será baja, pero si ocurre, respaldará fuertemente a la hipótesis. Una vez
realizado el experimento, se reajustan los cálculos de la ecuación para establecer la probabilidad de la hipótesis
ante los datos establecidos. La Pf(h) se convierte en una nueva probabilidad inicial Pi(h) ante la perspectiva de
nuevos experimentos con nueva evidencia.
El teorema de Bayes se presenta en diversas versiones, según las funciones usadas para expresar la probabilidad
incondicional y la razón de posibilidad (”likelihood ratio”) usado para expresar el poder predictivo que otorga la
evidencia, pero el mensaje envuelto es el mismo, (1):
probabilidad condicional = probabilidad incondicional x poder predictivo
El teorema de Bayes combina el razonamiento inductivo y el deductivo; el proceso inductivo aparece en cuanto va
evaluando diversas teorías a la luz de nuevas evidencias. La probabilidad posterior o final se transforma en
probabilidad inicial en cuanto aparece una nueva evidencia, debiéndose condicionalizarse a ella, y así
sucesivamente. El razonamiento deductivo se realiza en la generalización de P (e/h). El teorema tiene el atractivo
de ser incontestable una vez aceptados los supuestos básicos del cálculo de posibilidades, y de arrojar resultados
en términos matemáticos que permiten una elaboración precisa de ellos. (4) Una vez aceptado los axiomas
fundamentales, el teorema tiene coherencia probabilística, justificada por lo que los bayesianos llaman el “libro
holandés”, esto es, si un sujeto apuesta según su deseo, y esto no sigue la ley de las probabilidades, perderá su
dinero en sus apuestas. Los bayesianos trabajan en el campo de las probabilidades, y por ello rechazan las
posturas de Popper, Lakatos y otros filósofos, que intentan encontrar un procedimiento de estandarización
absoluta y obligatoria para la ciencia. Los bayesianos señalan que las técnicas estadísticas usadas por estos
filósofos para comparar hipótesis y estimar cantidades científicas inciertas, son las tradicionales del frecuentismo
que están plagadas de inconsistencias y limitaciones, especialmente las pruebas de “significación” e “estimación”.
Según Press y Tanur (5, pág. 214), esto ocurre fundamentalmente “ en el acercamiento popperiano (de
falsificación, o generando una hipótesis de hombre de paja que se cree es falsa, y luego, mostrando que en
verdad es falsa) para comparar teorías”. Además, como veremos más adelante, los bayesianos señalan que la
subjetivad, que esos filósofos quieren evitar, es inevitable en la actividad científica.
Sin embargo, los problemas surgen para el bayesionismo cuando se trata de asignar un valor “objetivo” a la
proposición o hipótesis, inicial (Pi) o, cuando se intenta cuantificar la evidencia. Para proceder objetivamente en la
determinación de la Pi hay que considerar las teorías disponibles acerca del dominio pertinente, como ocurriría en
una carrera de caballos en la que no se tiene ninguna información de los competidores -ausencia de e-, si se
quiere proceder objetivamente en asignar las probabilidades a cada caballo, estas deben repartirse por partes
iguales entre ellos; pero en el caso de la ciencia, no resulta fácil decidir cuales son las teorías disponibles, y,
teóricamente, el número de teorías posibles en un dominio es infinito, por lo que la probabilidad cae a cero, y así,
no se puede aplicar el teorema de Bayes. (3)
Este problema se soluciona abandonando la pretensión de objetividad para aceptar la “subjetividad” de los
científicos en la elección de sus teorías preferidas y en la asignación de probabilidades, asumiendo que proceden
razonablemente. Este carácter subjetivo del proceso, es minimizado, señalando que la operación misma del
teorema es nítidamente lógica, la subjetividad se “formaliza” con la racionalidad del teorema. Además los
bayesianos señalan que las variaciones ínter subjetivas que puedan existir al comienzo de una teoría o
experimento, se van corrigiendo con el progreso de la investigación. Chalmers (3, pág. 170) explica este proceso,
imaginando que dos científicos comienzan una investigación con serias diferencias acerca de la probable verdad
de la hipótesis h, que predice un resultado e bastante improbable desde el punto de vista teórico del momento. El
científico que atribuye alta probabilidad a la hipótesis h, se sentirá confiado en que el resultado e del experimento
será positivo, y atribuirá a e una probabilidad alta. Por el contrario, el científico que no confía en la hipótesis h, no
esperará que la evidencia e sea la esperada, y le dará una probabilidad baja. Se realiza el experimento, y e
resulta confirmatoria; en vista de esta evidencia, ambos científicos deben reajustar las probabilidades de h para
los experimentos que seguirán.
El ajuste se hace con la ‘razón de posibilidad’: P(e/h)/P(e). Como la evidencia e se sigue de h en el experimento
realizado, el valor de P(e/h) es 1, con lo que P(e/h)/P(e)=1/P(e). El científico que confiaba en h y atribuyó una
probabilidad alta a e, tendrá un 1/P(e) bajo, y el que no confiaba en h, y asignó una probabilidad baja a e, tendrá
un 1/P(e) alto. Como la ‘razón de posibilidad’: P(e/h)/P(e), según el teorema, se multiplica por la probabilidad
inicial de h, modificándola; el científico que comenzó la investigación dudando del valor de verdad de la hipótesis
h, aumenta la probabilidad de h al multiplicar por un factor alto, comparado al científico que confiaba en la
hipótesis, y multiplica por un factor bajo. Según los bayesianos, con la prosecución de los experimentos disminuye
la diferencia de opinión inicial que tuvieron los científicos.
Una vez salvadas las primeras dificultades para la determinación de las probabilidades iniciales y de la evidencia,
la fórmula bayesiana opera con nitidez matemática y puede aplicarse a casos históricos de la ciencia, y a otras
características de la actividad científica. El bayesionismo tiene la ventaja frente a la estadística frecuentista, de
ofrecer un modo uniforme de inferencia (Teorema de Bayes y derivaciones), tanto para las teorías deterministas,
como para las teorías de probabilidad estadística. El factor P (e/h) del teorema varía según el tipo de teoría, para
la teoría determinista, la evidencia confirmatoria de la teoría toma un valor de 1, en las teorías de probabilidad
estadística, el P(e/h) toma un valor igual a la probabilidad estadística que la hipótesis confiere a la evidencia (5).
El bayesionismo de Howson y Urbach (6) rechaza la teoría de la prueba de significación del frecuentismo, que
informa cuando se debe rechazar o considerar falsa una hipótesis estadística. También rechaza la teoría de la
estimación para calcular el rango de números considerados una buena aproximación al valor verdadero. Según
estos autores, en estas ‘pruebas’ abundan las inconsistencias lógicas y la intervención de juicios subjetivos en la
determinación de ciertos standards.
Con la racionalidad bayesiana,es posible explicar por que una vez que una teoría ha sido confirmada por un
experimento, los científicos no consideran que su repetición, bajo las mismas circunstancias, agregue una
confirmación significativa a la teoría. Siguiendo la ecuación bayesiana, la repetición del mismo experimento
aumenta la probabilidad de e, bajando el valor de la ‘razón de posibilidad’ que modifica la probabilidad de la
hipótesis o teoría; con cada repetición del experimento, e incremento de P(e), aumenta en forma decreciente la
probabilidad de la teoría, P(h). Por esta misma razón, una teoría obtiene más respaldo de experimentos nuevos
que de la repetición de los ya efectuados.(3)
El tratamiento que el bayesionismo hace de las teorías ad hoc es diferente al de otros filósofos que las eliminan
como fraudulentas, el bayesionisma las acepta como científicas y las somete al cálculo de probabilidades, si las
probabilidades son bajas, las teorías ad hoc son eliminadas. El bayesionismo ignora las condiciones establecidas
por otras corrientes filosóficas que requieren que las teorías ad hoc sean probadas independientemente de la
teoría que suplementan, y también rechaza la tesis que sostiene que una teoría no es aceptable, al menos, que
esté apoyada por evidencia diferente a la que se usó para establecerla. Según Howson y Urbach (6, pág. 158),
estas normas no son compatibles con la práctica científica, no son razonables, ni están a la altura de los standards
de objetividad al que aspiran esas corrientes filosóficas.
Como hemos visto, el bayesionismo de vertiente ‘objetiva’ tiene serias dificultades en establecer las
probabilidades iniciales y en evaluar objetivamente la evidencia, pero también el bayesionismo de corte ‘subjetivo’
enfrenta problemas al depositar en el grado de creencia que el científico tiene de las teorías, la fuente de origen
de sus probabilidades. Por ejemplo, en caso de un científico que propone una nueva teoría, un paradigma nuevo,
en conflicto con la ciencia establecida del momento, la fuente de desavenencia radica en la creencia del científico.
El bayesionismo no ofrece una respuesta ‘objetiva’, ‘racional’, para elegir entre las probabilidades de las teorías
contendientes; La Pi de cada teoría es el resultado de antecedentes teóricos y experimentales previos, y de la
creatividad y creencias del científico. Selección de teorías a este nivel, en base a sus probabilidades previas y
posibles evidencias es totalmente conjetural. Tampoco ofrece un criterio para explicar el ‘progreso’ de la ciencia
fuera del nivel de creencia de los científicos que pugnan por establecer nuevos paradigmas. Tampoco el
bayesionismo establece un criterio para abandonar una hipótesis frente a una evidencia e desfavorable, ya que el
científico puede tener una gran fe en su teoría y persistir en ella, a pesar de los resultados fallidos, y podría ser
que nunca logre resultados positivos, pero también pudiera ser que tenga éxito más tarde; la historia de la ciencia
confirma esta situación. (3, 5)
A estas críticas, debe agregarse la dificultad que implica encontrar en un rastreo en la historia de la ciencia, las
creencias privadas de los científicos acerca de las teorías que manejan, porque el grado de creencia que tienen,
no puede ser medido por lo que efectúan y eligen de hecho: la acción no refleja automáticamente la creencia
personal, hay otros factores que influyen en ella. Chalmers señala además, que en la situación de la ciencia
moderna, la complejidad de las investigaciones envuelve un gran número de profesionales y técnicos en distintas
áreas complementarias, por lo que determinar el grado de creencia personal resulta prácticamente imposible. (3,
pág. 177-178)
Los bayesianos subjetivos como Howson y Urbach toman la evidencia como datos dados para calcular la ‘razón de
posibilidad’ y modificar la probabilidad inicial de la teoría, estos autores escriben: “La teoría de apoyo bayesiana
es una teoría sobre cómo el dar por verdaderos unos enunciados de prueba afecta a la creencia en algunas
hipótesis. Cómo se llega a aceptar la verdad de las pruebas y si está en lo correcto al aceptarlas como
verdaderas, son asuntos irrelevantes desde el punto de vista de la teoría.” (Scientific Reasoning: The Bayesian
Approch. First Edition. Pag 272. Citado en referencia 3)
Pero el valor de los datos (e) de un experimento no radica en el grado de creencia que tiene el científico acerca de
ellos. En su valor están envueltos una serie de standards de investigación empírica que deben respetarse para ser
considerados datos fidedignos de consideración, si no se cumplen con las precauciones y las condiciones
establecidas, los resultados se desechan sin necesidad de recurrir a grados subjetivos de creencia. (1)
La fórmula bayesiana se aplica entonces, partiendo de bases subjetivas como grados de creencia en las hipótesis,
pero no ofrece un criterio objetivo para seleccionar hipótesis rivales, ni para evitar el dogmatismo de los
investigadores que se aferran a sus teorías preferidas. También se ha señalado que el bayesionismo con su
lenguaje probabilístico no es suficiente para capturar lo esencial de la causalidad, la relevancia positiva de la
causa al efecto; se trataría en el bayesionismo, más bien, de una mera conjunción de causa y efecto, y no de una
relación causal propiamente tal.
En el bayesionismo la objetividad de ciencia, viene con la observación y experimentación controlada (nunca
completamente libre de elementos subjetivos: margen de error, eliminación de datos extremadamente fuera de
rango, etc.), y el uso del teorema, que permite el paso de una creencia inicial o previa a una creencia final o
posterior. Los bayesianos piensan que la mezcla cuidadosa de subjetividad y objetividad constituye “la esencia de
toda buena ciencia.” (5, pág. 15) Press y Tanur (5, pág. 205) escriben: “La ciencia no puede, ni debe, ser
totalmente objetiva, mas debería, y envuelve de hecho, una mezcla de ambos procedimientos, subjetivos y
objetivos, con cada procedimiento alimentando retroactivamente (“feeding back”) al otro.” La objetividad de la
ciencia es de carácter lógico -el Teorema de Bayes y sus derivaciones- y la evidencia, observacional o
experimental, que es de carácter empírico.
La utilidad del teorema de Bayes en el cálculo de probabilidades condicionadas ha ganado popularidad, y su uso
se ha extendido a amplias áreas de la actividad científica y técnica, desde la astrofísica hasta la genética, desde la
epidemiología hasta las ciencias políticas y económicas. La estadística basada en el Teorema de Bayes y sus
derivaciones, ofrece una alternativa seria al frecuentismo que, como Howson y Urbach (6) señalan, no está
carente de inconsistencias y elementos de subjetividad. Sin embargo, el bayesionismo no satisface a los filósofos
que buscan en la dinámica de las ciencias, una respuesta racional, coherente y limpia, no solo el uso de un
teorema que, partiendo de la subjetividad, pretende convertirse o reemplazar al método científico. Chalmers (3,
pág. 180), por ejemplo, comenta que se podría conceder que el teorema tiene un rango igual a la lógica
deductiva. “Esta concesión sirve para resaltar lo limitado de su postura [bayesianos subjetivos: Howson y
Urbach]. Todo lo que su teoría del método científico dice acerca de la ciencia, equivale a la observación de que la
ciencia se adhiere a los dictados de la lógica deductiva.” Esto no resulta satisfactorio para un filósofo de la ciencia.
La racionalidad bayesiana, con toda su compleja elaboración técnica, y su practicidad en el cálculo de
probabilidades en situaciones indeterminadas en las que inciden múltiples variables, no pasa de ser una
descripción lógico-matemática de algunos aspectos de la praxis de la ciencia.
Bibliografía
1. Joyce, James (2003). Bayes’s Theorem. Stanford Encyclopedia of Philosophy.
plato.stanford.edu/entries/bayes-theorem
2. Talbot,William (2001). Bayesian Epistemology
plato.sanford.edu/entries/epistemology-bayesian/
3. Chalmers, Alan F (1982). ¿Qué es esa cosa llamada ciencia? Tercera edición. Siglo Veintiuno España Editores.
2000
4.
Hatton,
D.
H.
(2003).
Introduction:
The
Bayesian
View
of
Probability
http://www.bib.hatton.btinternet.co.uk/dan/Mathematics/A_Bayesian_Perspective_on_Rec
and
Statistics.
5. Press SJ, Tanur, JM. (2001). The Subjectivity of Scientists and the Bayesian Approach.
John Willey Inc.
6. Howson, C, Urbach, P (1989). Scientific Reasoning: The Bayesian Approach. Second Edition. La Salle, Illinois,
Open Court. 1993
Descargar