3.7 Introducción al problema de la decisión.

Anuncio
Introducción al problema de la decisión
En este capítulo me voy a ocupar de estudiar si es posible contar o no con un
procedimiento que en tiempo finito determine si un cierto argumento es admisible
desde el punto de vista de un cierto formalismo. En realidad, tendremos siempre en
mente el caso de LPO de modo que el problema será determinar la existencia de un
procedimiento tal para la relación de derivabilidad o consecuencia semántica, tanto da,
de la Lógica de Primer Orden.
Aunque la decidibilidad de una Lógica suele adjudicarse con frecuencia al
cálculo, y no a los modelos –a la consecuencia semántica- en realidad no hay razones
que justifiquen esta postura. La definición que aquí se ha dado de lo que debe
entenderse por una Lógica permite considerar la decidibilidad como un rasgo genérico
del sistema que se analice en cada caso. La consabida coincidencia extensional entre
las relaciones de derivabilidad formal y consecuencia semántica para LPO permite que
estudiemos la decidibilidad como una propiedad de la Lógica de Primer Orden y no
como algo más específico. De hecho, veremos que algunos de los razonamientos son
absolutamente abstractos y no hace mención a contexto alguno, aunque también es
oportuno reconocer que en este caso la noción constructiva de prueba ejerce una
considerable influencia en todo el tratamiento.
La propiedad de ser decidible se puede predicar de una propiedad, relación, de
una definición, y, desde luego, de un procedimiento. Posee una vida propia que la
hace independiente de los aspectos específicos que encontramos asociados al estudio
de la derivabilidad y al estudio de la consecuencia. ¿Cuándo decimos que una
propiedad o relación es decidible? En primer lugar, es preciso fijar una colección de
objetos sobre la cual tiene sentido hacerse esa pregunta. Decimos entonces que
Lógica de Primer Orden
[1]
Una propiedad o relación es decidible sobre un dominio particular de
objetos syss existe un procedimiento efectivo que permite responder en
tiempo finito y de forma tanto afirmativa como negativa la pregunta de si
un objeto de ese dominio posee la propiedad o relación en cuestión.
Faltaría ver qué es eso de un procedimiento efectivo, pero siempre podemos
considerar que un procedimiento efectivo es uno en el que nos limitamos a aplicar una
serie de instrucciones inequívocas, siempre ejecutables en tiempo finito, y que
proceden de modo que nunca caben dudas acerca de qué instrucción corresponde
ejecutar a continuación.
Así las cosas, no parece que la decidibilidad, en lo que aquí nos afecta,
corresponda en abstracto a la derivabilidad o a la consecuencia semántica, sino más
bien a cada posible descripción concreta de esas nociones. ¿Supone esto que
debemos estar dispuestos a aceptar que un cierto sistema deductivo sea decidible
mientras que otro, equivalente al primero, no lo es? En tal caso, ¿qué debemos decir
de la derivabilidad para ese lenguaje, que es decidible o que no lo es? Hay sistemas
deductivos cuya estructura les hace de forma explícita malos candidatos a erigirse en
procedimientos de decisión. ¿Cómo responderíamos a la pregunta “¿X|A?” en Axc o
en DNc? Consideremos sólo el segundo caso. La única forma de comprobar si X|DNc A
es dando inicio a una derivación en la que tras colocar cada una de las fórmulas de X
como premisas intentaríamos hallar la conclusión A. ¿Qué pasa si tras una larga serie
de pasos aún no hemos llegado a A? ¿Debemos confiar en nuestras capacidades y
afirmar que si en k pasos A no ha sido hallada es porque no puede serlo, o debemos
insistir un poco más y prolongar la derivación otros n pasos más? Es obvio que el
Cálculo de Deducción natural no fue concebido como un procedimiento para
responder preguntas acerca de la derivabilidad de un argumento, sino, más bien,
como un procedimiento para construir derivaciones. Algo distinto es lo que sucede con
el Cálculo de Tablas Analíticas. La posibilidad de alcanzar un punto donde,
eventualmente, ya no se pueden seguir aplicando reglas permite pensar en una
detención del procedimiento en un punto que permita juzgar si el argumento en
384
Introducción al problema de la decisión
cuestión es o no derivable. Como se puede ver, que un sistema deductivo constituya o
no un procedimiento de decisión depende, en primer lugar, de su estructura o
arquitectura general: el cálculo de secuentes no está originalmente orientado a
la decisión, pero una serie de manipulaciones de su arquitectura permiten dar con un
procedimiento tal. Pero también depende del tipo de reglas que nos veamos obligados
a admitir. Estas reglas son resultado, a su vez, de la presencia de ciertas constantes
lógicas en el lenguaje formal que en cada caso se estudia. Con esto llegamos a un
hecho fundamental: la decidibilidad de un sistema deductivo puede depender, en
última instancia, del tipo de constantes lógicas presentes en un lenguaje formal. Si
admitimos que la presencia de constantes lógicas en un lenguaje formal es una forma
de medir su potencia expresiva, ese aserto se transforma en otro algo más vago, pero
mucho más significativo: la decidibilidad de un sistema deductivo puede depender de
la potencia expresiva del lenguaje formal cuya relación de consecuencia se estudia. Si
la decidibilidad afectada es la del único sistema deductivo orientado a la decisión,
entonces aún podemos obtener algo más definitivo hablando no ya de este o aquel
sistema formal, sino de la misma relación de derivabilidad. Es este hecho el que hace
tan importante el estudio de la decidibilidad, ya que parece aludir a una especie de
conexión general entre la textura con que un lenguaje formal representa la estructura
de la inferencia y la capacidad de juicio o control que nos concede. El descubrimiento
de sutiles puntos de equilibrio en un asunto tan fundamental como es ese, nos lleva
una vez más ante la existencia de una especie de materia formal que se manifiesta en
nuestras capacidad cognitivas y que en ocasiones parecemos descubrir más que
legislar.
Hemos hablado sólo de derivabilidad, ¿es que acaso la decidibilidad no se
puede predicar de la relación de consecuencia semántica? Es evidente que la relación
de consecuencia semántica posee una definición en modo alguno orientada a la
decisión. Eso no significa que en determinados casos no se pueda establecerse un
mecanismo de decisión propiamente semántico, pero ello exige un cierto alejamiento
de la definición original de la consecuencia.
385
Lógica de Primer Orden
Puede sorprender que en esta ocasión no termine ofreciendo uno de esos
teoremas que tanto proliferan en Lógica, uno que diga, por ejemplo, que la relación de
entrañamiento o la de derivabilidad son decidibles para LE (LC ). Para poder afirmar que
la derivabilidad es decidible para un lenguaje formal L bastará con que alguno de los
sistemas deductivos definidos constituya un procedimiento de decisión para preguntas
del tipo ¿X|S A?. Ya sabemos, por ejemplo, que la derivabilidad definida para LE es
decidible: TA se transforma fácilmente en uno de esos procedimientos, pero también lo
es la relación de consecuencia semántica mediante el método de tablas de verdad. No
lo es, sin embargo, la derivabilidad definida sobre LC . El estudio de esta situación nos
pondrá en contacto con uno de los problemas más profundos que pueden estudiarse
en Lógica. Me refiero a las limitaciones que nuestro ingenio formal encuentra para
tratar de forma mecánica la solución a problemas absolutamente legítimos. También
veremos que no todo LC es indecidible, existiendo fragmentos decidibles cuya
existencia nos pone ante una frontera epistemológica no siempre bien entendida ni
explicada. Pero todo esto será más adelante.
El término problema de la decisión que se menciona el título de este capítulo
data, como tal, de los primeros años del siglo xx. No se trata pues de una
denominación elegida simplemente como epígrafe de una nueva sesión de este curso,
sino de un asunto erigido en hito y tópico de cualquier exposición de los modernos
contenidos de la Lógica. El problema de la decisión –Entscheidungsproblem, en la
denominación original debida a Hilbert- consiste en determinar si un argumento dado
es correcto o no para la Lógica de Primer Orden. ¿Por qué debería representar este
asunto un problema? La comprobación de la existencia de un procedimiento de
decisión para la Lógica de Primer Orden no debería suponer nada distinto de la
demostración de un resultado, un teorema, en el que se establezca si éste es o no el
caso, sin que se vea en ello problema alguno. La razón de que la búsqueda de este
teorema fuera bautizada en su día como un problema se debe, en gran medida, al
número de consecuencias e implicaciones epistemológicas de todo tipo que poco a
poco se fueron concentrando en torno a esta cuestión.
386
Introducción al problema de la decisión
El periodo que se extiende desde los últimos años del siglo xix hasta el primer
tercio del siglo xx constituye una etapa de grandes esperanzas para el futuro de la
Lógica. El lenguaje de la Lógica de Primer Orden con identidad es considerado como
un medio óptimo para representar una gran cantidad de conocimiento matemático
hasta entonces expresado de manera más o menos informal. Esta impresión general
acerca del valor de la Lógica es desarrollada de manera sistemática por Hilbert y la
escuela formalista para proponer su programa de axiomatización de la Matemática. El
objetivo de este proyecto consistía, entonces, en reducir las distintas teorías
matemáticas particulares a sistemas axiomáticos formulados en LC =. El contenido
específico de cada una de estas teorías, expresadas antes en el lenguaje ordinario
con la imprecisión que eso conlleva, quedaría alojado en sus axiomas particulares y en
la interpretación de los símbolos lógicos que en LC = carecen de designación fija –las
letras predicativas, las letras de constante individual-. Una vez sometida a este nuevo
formato, la teoría matemática original habría pasado a comportarse en todo lo demás
como una teoría lógica. En particular, todo su aparato de prueba habrá quedado
convertido en el que LC = posee por tratarse de un sistema formal. Vemos cómo, poco a
poco, y ante la evidencia de la utilidad de un cierto lenguaje para expresar
conocimiento con sus recursos expresivos, el problema de determinar la derivabilidad
de un argumento lógico va acumulando consecuencias epistemológicas imprevistas.
Pero, ¿qué consecuencias de orden intuitivo tiene el que una teoría
axiomatizada posea, por tratarse de una teoría formalizada en LC =, un método para
determinar si una fórmula es o no consecuencia de esos axiomas? ¿Acaso no va esto
implícito en el logro de esa formalización la existencia de un mecanismo tal? Una
teoría axiomática posee, por el hecho de serlo, un procedimiento que permite
enumerar una tras otra las sucesivas conclusiones que se siguen de ella. Basta utilizar
los axiomas y los teoremas de dicha teoría para generar, mediante sus reglas de
inferencia, nuevos teoremas. La enumeración aludida se refiere a la posibilidad de
registrar en un listado –con posibles repeticiones- todas las fórmulas que van siendo
obtenidas. La descripción de este proceso parece dar a entender la reducción del
manejo de dicha teoría a un procedimiento mecánico capaz de determinar todas las
cuestiones relacionadas con ella. Sin embargo, esta interpretación podría ser
387
Lógica de Primer Orden
parcialmente incorrecta. Imaginemos que alguien pregunta a un grupo de expertos
dedicados al desarrollo de una teoría axiomatizada T si una determinada fórmula es o
no consecuencia de esa teoría. ¿Qué se supone que han de hacer estos
investigadores para comprobarlo? Posiblemente encargarían a uno de sus miembros
el repaso de la lista intentando localizar la presencia de la fórmula solicitada. Si ésta se
halla en la lista la respuesta es clara, pero ¿qué sucede si no se encuentra? La
respuesta habría de ser, tal vez, un “...bueno, por el momento no tenemos constancia,
pero quizá en el futuro...”. Dudo que nuestro hipotético solicitante se conformase con
esa respuesta ya que el no ha preguntado si su fórmula, sea ésta A, era tenida entre
los teoremas de T, sino si es un teorema de T. Caso de insistir, parece que la única
solución será hacer que uno de estos investigadores se disponga a buscar una
derivación de A a partir de T. Aunque desde un punto de vista informal la diferencia
entre lo que nuestro investigador hacía antes de esta molesta interrupción de su rutina,
derivar conclusiones sin más, y lo que hace ahora, buscar una en concreto, no es
apreciable en toda su extensión, se trata, tal vez, de uno de los distingo de orden
epistemológico más importante que cabe atribuir a la investigación Lógica. Mientras
que la primera actividad resulta mecánica en un sentido trivial, la segunda no lo es:
hay un objetivo cuya satisfacción obliga a una tarea de planificación y diseño de
estrategias para la cual no poseemos instrucciones precisas, en cualquier caso no se
trata de instrucciones dependientes de T. Imaginemos que disponemos una de estas
estrategias de búsqueda y procedemos a ensayar si A es o consecuencia de T. Al
cabo de un tiempo prudencial no hemos localizado A, ¿se debe a que A no es
realmente una consecuencia de T, o que nuestra estrategia no es adecuada? De
nuevo no hay nada en T que permita distinguir estas dos circunstancias, a saber, la
ausencia de una demostración por falta de pericia, o una ausencia debida a la
inexistencia de una demostración de A.
Es posible que nuestro cliente se atreva entonces a sugerir lo que parece
obvio: ¿acaso no es posible ir elaborando un listado alternativo en el que consten
exactamente aquellas fórmulas que no son consecuencia de T? Si las cosas están
bien hechas, no habrá nunca ninguna fórmula que pueda aparecer en ambas listas y
además, cada fórmula acabará por aparecer en una de ellas. Esta inteligente
388
Introducción al problema de la decisión
observación resuelve el problema que hemos experimentado al no saber cómo
interpretar el fracaso de nuestros intentos por determinar si A es o no un teorema de T.
Si A aún no ha sido localizada en T ello se puede deber a que realmente no está en T,
pero entonces habrá de estar en alguna posición de la lista de no-T –las fórmulas que
no son teoremas de T- y será cuestión de tiempo localizarla. Cuando una teoría posee
suficiente capacidad para comportarse de este modo, decimos que es decidible, en
caso contrario será sólo semidecidible. Pero, ¿de qué depende que una teoría sea o
no decidible?, ¿hay teorías de Primer Orden semidecidibles? Puesto que hemos
aceptado que nuestras teorías son teorías de Primer Orden con identidad, el asunto
sólo dependerá de la existencia de un procedimiento de decisión para ese lenguaje.
Elegir los sistemas axiomáticos no ha sido, desde este punto de vista, una buena
decisión. Ellos no están orientados a la decisión sino a la demostrabilidad, de modo
que debemos plantearnos otros mecanismos mejor encaminados. Los cálculos de
Secuentes –Sqc- , o de Tablas Analíticas –TAc- parecen mejores candidatos por las
razones que ya explicamos en su momento, ¿por qué no ensayar con ellos?
La razón para evitar un trabajo como el que aparentemente nos deberíamos
plantear ahora es la misma que permitió demostrar a Church y Turing en 1936, de
forma independiente, la inexistencia de un procedimiento de decisión para la Lógica de
Primer Orden con identidad. Ambos supieron ver que la capacidad expresiva de este
lenguaje formal y la posibilidad de emplearlo para formalizar importantes dominios de
la realidad matemática debía tener consecuencias en investigaciones aparentemente
de menor rango. Esa generalidad debía tener también una contrapartida para la Lógica
haciéndola vulnerable al impacto de los resultados que se pudieran dar
independientemente en teorías particulares –o fragmentos relevantes- que resultasen
a la larga formalizables en Primer Orden. De este modo, el problema de la decisión
para la Lógica de Primer Orden con identidad se resuelve, en realidad, desde fuera de
la misma Lógica. ¿Cómo?
Tanto Church como Turing, sobre todo el primero, venían trabajando en un
intento de descripción matemática completa de la clase de tareas que pueden ser
ejecutadas de manera efectiva, o por decirlo de otro modo, que son mecanizables.
389
Lógica de Primer Orden
Estas tareas se concentraban en aquellas relacionadas con el cálculo de funciones
numéricas entre números naturales, pero esto es lo de menos. Por entonces era un
problema de la mayor importancia saber si dada una de estas tareas –un descripción
exacta de sus instrucciones, en realidad- y un input para la misma, sea éste in, era
posible determinar de manera efectiva si dicha tarea finalizaría arrojando un output, no
importa cuál –este problema será después conocido por problema de parada-. La
conexión entre este problema y el que nos ocupa se produce en dos etapas. La
primera, menos comentada en la bibliografía, se refiere a la identificación del tipo de
operación mecánica que tiene lugar al ejecutar cada una de las instrucciones que
forman una de estas rutinas. Tales operaciones resultan en esencia idénticas a
aquellas que tienen lugar al aplicar cada una de las reglas de inferencia con las que
hemos generado los sistemas deductivos para LC =, es decir, resultan ser operaciones
efectivas en el mismo sentido de éste término –sea el que sea-. La segunda etapa es,
en parte consecuencia de ésta. Dada la generalidad de LC =, no es imposible imaginar
una forma de representar dentro de LC = el problema de parada para una tarea
previamente dada que opera sobre un input in igualmente dado. Tampoco es
imposible, ni siquiera difícil, representar mediante una fórmula de Primer Orden el acto
de aplicar una instrucción de las que posee la tarea para dar lugar a un paso ulterior
de esa tarea. Así las cosas, determinar el problema de parada de una tarea efectiva
dado un input se reduce a demostrar en Primer Orden la fórmula que expresa la
existencia de un output a partir de la aplicación de una serie de instrucciones
previamente fijadas. Por tanto, si la Lógica de Primer Orden con identidad resulta ser
decidible, el problema de parada para una tarea dada resultará igualmente decidible.
Esta consecuencia constituye el nudo del teorema que a continuación se
enuncia:
390
Introducción al problema de la decisión
[2]
Teorema (Church, Turing 1936): La Lógica de Primer Orden con
identidad no es decidible.
Esquema de demostración: Como se acaba de indicar, si el problema
de la decisión para la Lógica de Primer Orden con identidad tiene una
solución positiva, entonces el problema de parada para cualesquiera
tareas efectivas tiene, a su vez, una solución positiva. Sin embargo esto
último debe ser rechazada en función de un argumento independiente, y
por tanto, también la existencia de la solución indicada al problema de la
decisión.
Como puede verse, este resultado es, en realidad un corolario de un enunciado
tan perturbador o más que el propio teorema que acabamos de formular. La
demostración de la inexistencia de una solución general al problema de parada va más
allá de los contenidos de este curso formando parte íntegra de los cursos de Teoría de
la Computación.
La conclusión general que se desprende de todo ello es la definitiva ineficacia
de cualquier sistema deductivo o procedimiento que quepa formular para la Lógica de
Primer Orden. Esta observación resulta llamativa en la medida en que nos obliga a
reconocer que sistemas en principio bien orientados hacia el asunto de la decisión,
pienso en TAc, dejan de actuar adecuadamente a partir de un cierto punto. El cálculo
de Tablas Analíticas parecía ser un buen candidato para construir ese par de listas
donde irían acumulándose por orden fórmulas –argumentos- derivables y no
derivables. Bastaría enumerar todas las fórmulas de LC = para acometer, por orden, la
tabla de cada una de estas fórmulas –argumentos-. Si la tabla cierra todas sus ramas
la fórmula en cuestión es apuntada en la lista de teoremas de la Lógica de Primer
Orden con identidad, en caso contrario deberá ser apuntada en la lista alternativa.
¿Qué está mal en esta hipótesis? Sólo resulta incorrecta la suposición de que en este
caso cada tabla llegue realmente a terminar como vimos que sucedía en el caso de la
Lógica Proposicional Clásica. La inclusión de reglas para los cuantores permite, tal y
como vimos en su momento, reutilizar fórmulas cuantificadas reemplazando las
391
Lógica de Primer Orden
variables ligadas por parámetros no empleados antes. Este hecho no establece que
tales reemplazos introduzcan realmente información relevante para la construcción de
la tabla, o mejor dicho, para su desenlace. Podríamos imaginar la posibilidad de acotar
el desarrollo de una de estas tablas mediante el establecimiento de un número de
individuos máximo a tener en cuenta. Esa cantidad indicaría en definitiva el número
máximo de individuos que pueden ser diferenciados, reconocidos, mediante una
colección finita de enunciados de LC =. Puesto que la información codificada por cada
fórmula es finita, no es tan implausible la existencia de este número máximo. El
teorema anterior indica que realmente no hay tal límite.
¿Qué moraleja podemos obtener de todo esto? Es difícil hablar de una sola
consecuencia para un resultado de este calibre, pero la que más claramente de
impone, por su evidencia, es el definitivo divorcio entre el rigor que supone el carácter
formal de una teoría, y la mecanización de sus consecuencias. Estamos hablando, lo
sabemos ahora, de facultades cognitivas distintas. El tipo de construcción que lleva a
generar una enumeración de los teoremas de una teoría formal no constituye una
primera aproximación a la presentación definitiva de esa teoría en términos de algún
procedimiento de decisión para la clase de sus teoremas. Muy bien puede suceder
que esa etapa ulterior sea inalcanzable.
Vemos, en definitiva, cómo aparece ante nuestra vista una frontera
epistemológica del tipo más general que cabe imaginar. Esta frontera se encuentra
asociada a la capacidad expresiva de un lenguaje formal y surge debido, precisamente
a la capacidad de tal lenguaje formal para representar problemas concretos de
disciplinas particulares. Sabemos que el lenguaje de la lógica de enunciados está
asociado a un procedimiento de decisión, el que permite determinar los teoremas de la
Lógica Proposicional Clásica. Sabemos igualmente que esto no es cierto para el
lenguaje LC = y la consecuencia que sobre él se define. En algún punto entre LE y LC =
hay un frontera cuyas consecuencias epistemológicas no podemos ignorar, pero
¿dónde se encuentra exactamente este punto?
392
Introducción al problema de la decisión
La identidad bajo sospecha. La Lógica Clásica de Enunciados –Lógica Proposicional
clásica- es decidible. Sin embargo, la Lógica Clásica de Primer Orden con identidad,
una extensión directa de los métodos de la primera al dominio de las propiedades y
relaciones de individuos no lo es. Entremedias debe haber algún punto en el cual se
produce lo que parece una irreparable pérdida de control. Por otra parte, todo indica
que esa especie de frontera debe venir dada por algún tipo de ganancia en eso que
vagamente hemos venido llamando potencia expresiva de un lenguaje. No hay nada
en nuestra argumentación anterior que permita asociar este efecto al contenido
material, a una interpretación, de los símbolos de LC =; éstos continúan careciendo de
significado distinto del que atribuimos a las constantes. Es esta observación la que, en
cierto modo, presta plausibilidad a esas referencias a la potencia expresiva de un
lenguaje formal. La existencia de propiedades que se pierden o adquieren bajo
determinadas condiciones ajenas por completo al contenido material de teoría alguna,
suministra, en definitiva, una forma de medir esa potencia expresiva. Pero, ¿dónde se
encuentra la frontera exacta cuya existencia hemos comprobado en la sesión anterior?
Una conjetura obvia, según el desarrollo que aquí han tenido los
acontecimientos, es imputar el problema a la presencia de la identidad. Como ya dije,
su inclusión en LC para dar lugar a LC = obedece, en última instancia, a razones
históricas. Resulta muy difícil ver de qué modo se puede formalizar una teoría
matemática de manera realista sin contar, ya desde un principio, con el signo de
identidad. La demostración ideada por Church y Turing hace además uso del signo de
identidad de una forma explícita y relevante. Un lenguaje de Primer Orden con
identidad permite, por otra parte, expresar ciertas condiciones acerca del cardinal del
universo en las que la identidad es la responsable inmediata. Así, por ejemplo,
∃x∃y¬(x=y) no puede ser satisfecha por modelos con menos de dos individuos, etc.
Analizar si en cada uno de estos casos la identidad puede ser reemplazada por algún
recurso disponible en LC no resulta una estrategia suficientemente general. Así, en
lugar de proceder caso por caso, lo que se intenta es establecer un mecanismo
general de reemplazo de la identidad que permita ver si las propiedades de una
393
Lógica de Primer Orden
fórmula con identidad se conservan en la traducción en la que ese símbolo aparece
reemplazado de forma adecuada. Esta substitución no puede ser, obviamente, sólo
simbólica.
La identidad es, en definitiva, una relación binaria entre individuos del dominio.
Podemos elegir una letra, sea ésta E, para substituir la identidad, escribiendo Exy
donde antes escribiríamos x=y. No bastará con reemplazar la identidad por el símbolo
relacional E aplicando a continuación las cláusulas semánticas que antes convenían a
“=”. “E” no es una constante, es una letra relacional. Traducir una fórmula con
identidad a otra que no posee la identidad supone redistribuir el contenido de la
constante lógica eliminada sobre el símbolo “E” y sobre las restantes constantes
lógicas. ¿Es posible hacer esto de manera uniforme? Efectivamente. Existe una
traducción τ capaz de obtener para cada fórmula A en la que se presentan ocurrencias
del símbolo de identidad otra fórmula Aτ que preserva su conducta modelista. Esto se
resume en el siguiente resultado:
[3]
Teorema: Sea A una fórmula perteneciente a LC =, y sea µ un modelo
que satisface a A. Entonces existe una fórmula Aτ obtenida a partir de A
en la que no figura el símbolo de identidad y para la cual existe un
modelo µ’ que verifica a Aτ .
No hay una forma suficientemente informal de describir la traducción τ ni la
demostración de este resultado, aunque en este caso ninguno de estos dos elementos
añaden nada a lo ya dicho.
La consecuencia inmediata para nuestro estudio del problema de la decisión es
que la Lógica de Primer Orden definida sobre LC , esto es, sin identidad, es igualmente
indecidible. No cabe más remedio que admitirlo así. Todo parece indicar que el
legítimo deseo de penetrar en la estructura de los enunciados con que trabaja la
Lógica Proposicional tiene como contrapartida la pérdida de propiedades esenciales
como la de la decidibilidad. La frontera parece situarse, por tanto, entre la Lógica
394
Introducción al problema de la decisión
Proposicional Clásica, y la Lógica de Primer Orden. Esta conclusión, que a primera
vista resulta plausible, es, sin embargo, falsa. Dentro de la Lógica de Primer Orden
existen fragmentos decidibles que van silueteando la frontera de la decisión sin llegar
a definirla de un modo del todo exacto.
Fragmentos decidibles: el fragmento monádico. El primer fragmento decidible del que
cabe hablar está formado por lo que en ocasiones se denomina Lógica de Predicados
de Primer Orden, o siendo más correctos, por el fragmento monádico de la Lógica de
Primer Orden. Como cabe imaginar, el fragmento aludido consiste en aquel que
resulta de considerar sólo letras relacionales unarias –de predicado o propiedad- en el
vocabulario básico de LC . Esta operación da lugar a un lenguaje, LC 1, en el que las
únicas letras relacionales son unarias, siendo, por lo demás en todo idéntico a LC . No
importa, además, incluir la identidad como constante lógica destacada, obteniendo así,
un lenguaje monádico con identidad que simbolizamos como LC 1=. El resultado es el
mismo: la Lógica de Primer Orden restringida al lenguaje LC 1= resulta decidible. De
hecho, la demostración que se aporta a continuación se ajusta a este caso que es, en
definitiva, más general. Resulta llamativo, no obstante, que después de llegar
prácticamente a convertir la eliminación de la diferencia ingenua entre propiedades y
relaciones en la condición de posibilidad de la lógica moderna nos encontremos que
vuelve ahora a emerger en unos términos tan precisos. Parece que la silogística
ideada por Aristóteles y desarrollada con ahínco durante la Edad Media no constituía,
después de todo, un corte arbitrario en la estructura oracional que es capaz de
reconocer la Lógica de Primer Orden.
Para demostrar que un fragmento de la Lógica de Primer Orden es decidible
hay que recuperar una idea cuyo desarrollo suspendimos al hablar de la indecidibilidad
de este sistema considerado al completo. Ya hemos visto que la decidibilidad es una
propiedad que no se predica de un sistema deductivo o de un sistema formal, es decir,
no le conviene más un tratamiento modelista que uno caracterizado por las técnicas de
la teoría de la demostración, sino que se predica directamente de una lógica –lo que
395
Lógica de Primer Orden
aquí he caracterizado como un triplo de tipo <L, [|S], √>-. Esto, unido al hecho de que
la Lógica de Primer Orden es completa –y a fortiori su fragmento monádico- permite
que tratemos el problema de la decisión desde donde más convenga. En esta ocasión,
el contexto es modelista. La idea a la que me refiero es aquella que lleva a reducir el
problema de la existencia de un modelo para una fórmula cuantificacional a la
construcción de un modelo con cardinal finito. En el caso de la Lógica de Primer Orden
al completo no hizo falta considerar esta posibilidad: el teorema de Church-Turing
constituye una garantía de que tal reducción no es, en general, posible. Pero esto no
se aplica al fragmento monádico. El resultado es que podemos afirmar que:
[4]
Teorema: Sea B una fórmula del fragmento monádico de LC 1=. Sucede,
entonces que B tiene un modelo syss tiene un modelo con cardinal finito
con a lo sumo 2m .v elementos, donde m es el número de letras
predicativas en B y v el número de variables.
Esquema de la demostración: El nudo de esta demostración se
encuentra en reconocer que una fórmula de LC 1= sólo es capaz de
distinguir entre un número finito de elementos del dominio original del
modelo. Por Pk , 1# k#m, se entenderá cada una de las letras relacionales
unarias que aparecen en B. Dados cualesquiera dos elementos ui, uj en
el universo del modelo original µ, definimos una relación de equivalencia
≈B del modo que sigue:
-
ui≈Buj syss para toda letra relacional Pk en B sucede que <ui>∈I(Pk )
syss <uj>∈I(Pk ).
En otras palabras, dos individuos del dominio de µ son idénticos desde
el punto de vista de B syss satisfacen sus mismas subfórmulas
atómicas, que en este caso vienen dadas por las letras relacionales
unarias indicadas. ¿Cuántas clases de equivalencia distintas hay de
este tipo? Es obvio que hay exactamente 2m donde m es, recuérdese, el
número de letras relacionales distintas. Tomando ahora el dominio U del
modelo µ y la relación ≈B construimos lo que se denomina su espacio
396
Introducción al problema de la decisión
cociente constituido por las clases de equivalencia de individuos de U
módulo ≈B, que representamos como [ui]≈B. Para construir el nuevo
dominio, que representamos como U/ ≈B, bastaría con tomar un individuo
de cada una de esas clases, si prescindimos de la identidad. En caso
contrario será preciso contar a lo sumo con tantos individuos como
variables distintas de individuo haya en B, si la clase original contiene al
menos v elementos, y los que posea si está formada por menos de v
elementos. Esto hace que el número de individuos que debemos incluir
en el universo U≈B sea lo sumo 2m .v. Es evidente que si µ es modelo de
B también lo será el modelo µ≈B así obtenido. La demostración completa
se obtiene por inducción sobre el grado lógico de las fórmulas de LC 1=.
Imagino que la inclusión de v elementos del dominio original puede sorprender.
La razón es sin embargo fácil de entender. Aunque dos individuos pueden ser
indistinguibles desde el punto de vista del contenido predicativo de B sí pueden ser
reconocidos como distintos por medio del uso del símbolo de identidad. Ahora bien,
nunca habrá más distingos expresables en B por medio de la identidad que aquellos
que correspondan al número de variables individuales distintas en B, que son, a lo v.
Un dato que merece también comentario a propósito de este teorema es la
referencia explícita a una cota superior, un número máximo, para el tamaño del
universo en el cual hay que buscar un modelo para una fórmula de LC 1=, si es que ha
de tener uno. ¿No nos hubiera bastado con establecer que toda fórmula de estas
características que tiene un modelo formado por un universo con infinitos elementos
tiene también uno con finitos elementos? Este es un resultado sin duda interesante,
pero no basta para hacer que el fragmento lingüístico donde se satisface resulte
decidible. La razón es bien simple. La existencia de un modelo finito para una fórmula
no aclara mucho sobre la dimensión real que puede tener la búsqueda de dicho
modelo. Eventualmente, podemos encontrarnos ante una búsqueda en la que seamos
incapaces de establecer si aún no hemos dado con el modelo que satisface la fórmula
397
Lógica de Primer Orden
porque su universo no dispone todavía de suficientes elementos, o porque tal modelo
no existe.
La principal consecuencia que se desprende del teorema [4] afecta a un
problema con una larga tradición dentro del pensamiento occidental: la forma en que
entendemos y manipulamos el concepto de infinito. Dejando a un lado viejas
cuestiones filosóficas lo que sí resulta evidente es que este teorema anuncia la
existencia de fórmulas dotadas de modelos cuyo universo nunca es finito, o en
cualquier caso, de modelos finitos cuyo cardinal no puede ser determinado a partir de
la información contenida en la propia fórmula. Pero, ¿significa esto que en el caso del
fragmento monádico las fórmulas en LC 1,= sí contienen información suficiente acerca
del cardinal de los universos en los cuales cabe encontrar modelos para tales
fórmulas? Dudo que esta lectura sea correcta. Más bien parece que es el contexto en
el cual se interpretan el que facilita que exista esa información. Sea como fuere, creo
que a estas alturas podemos reconocer que el modo en que una fórmula contiene
información acerca del tamaño de los modelos que la satisfacen es, posiblemente, uno
de los asuntos más apasionantes que cabe encontrar en teoría de modelos.
Una forma de ver la manera en que el contexto en que se interpretan las
fórmulas de LC influye en el problema de la decisión es considerar sólo modelos finitos.
¿Puede una fórmula de LC resultar indecidible sobre un modelo finito? Evidentemente
no. Para ello basta ver cómo una fórmula de LC cuando se interpreta sobre un universo
finito no porta más información que la que expresaría una fórmula puramente
proposicional convenientemente diseñada. El mejor modo presentar esta afirmación es
recordar la existencia del mecanismo de traducción que conecta una fórmula de
Primer Orden con otra de la Lógica proposicional.
[3] Traducción.
C0) [¬A] t/U = ¬[A] t/U
C1) [AoB]t/U =[A] t/U o[B]t/U, donde o∈{&,v,→}
398
Introducción al problema de la decisión
C2) [∀xA]t/U =[Ax/u1]t/U & [Ax/u2]t/U &...&[Ax/u n]t/U , donde {u1,u2,...un}
son todos y cada uno de los elementos de U.
C3 [∃xA]t/U = [Ax/u1]t/U v [Ax/u2 ]t/U v...v[Ax/un]t/U , donde {u1,u2,...un}
son todos y cada uno de los elementos de U.
t/U
C4) [A] = A, si A es atómica.
La razón de incluir siempre mención al universo U en el proceso de traducción
se debe a que siempre hay que tener presentes sus elementos. Nunca construimos
algo así como una traducción de la fórmula en cuestión sobre un universo de cardinal
finito pero indeterminado, sino sobre modelos de cardinal finito conocido.
La frontera de la decisión –quizá habría que decir mejor de la decidibilidadparece situarse, entonces, entre el fragmento monádico LC 1,= y la Lógica de Primer
Orden al completo siempre que se consideren modelos de cualquier cardinal. ¿Es
posible ganarle otra rebanada más a LC para mayor gloria de nuestras habilidades
formales? El siguiente resultado muestra la imposibilidad de extender este proceso
incorporando, por ejemplo, un lenguaje que admitiese relaciones de ariedad 2.
[4]
Teorema: El conjunto de fórmulas de LC cuyos únicos símbolos no
lógicos son letras predicativas diádicas no es decidible.
Asumiremos este resultado sin demostración, aceptando a partir de ahora que
lo que parece evidente: que las relaciones binarias, y de ahí todas aquellas de mayor
ariedad, son las que nos llevan a cruzar la frontera de la decisión. ¿A qué se debe esta
especie de pertinaz resistencia de nuestro mapa cognitivo a olvidar toda distinción
relevante entre propiedades y relaciones? Si queremos evitar tentaciones metafísicas
poco justificadas, el mejor modo de analizar esta cuestión será repasar el teorema que
establece originalmente la indecidibilidad de LC . Parece obvio que la explicación de por
qué las relaciones, entendiendo por tal, relaciones de ariedad n∃2, han de
desempeñar algún papel especial o destacado que quepa apreciar. Y así es: la noción
de prueba en un sistema deductivo que es, en definitiva la que genera el conflicto que
399
Lógica de Primer Orden
aquel teorema muestra, es una noción sólo entendible como una relación binaria entre
premisas y conclusión. No es, por tanto, algo en el fondo tan misterioso o intrigante
que la Lógica de relaciones de ariedad n∃2 sea indecidible: simplemente refleja la
categoría formal enteramente abstracta a que responde una noción conflictiva como es
la de prueba.
Como ya dijimos en su momento, lo malo de la Lógica, entendida como un puro
formalismo, es que ese mismo carácter la hace vulnerable a fenómenos que pueden
tener lugar relativamente lejos de lo que son su dominios. Puede parece que la
frontera de la decisión está ya bien fijada. Y es verdad si por tal se entiende la
identificación de un fragmento del lenguaje, significativo en algún sentido, que permita
establecer un aquí y un allí de forma justificada. Pero también es cierto que hay formas
de entender esa frontera que hacen de ella una franja no muy precisa dentro de la cual
aún es posible encontrar fragmentos decidibles. Para poder hablar de ello tenemos
que introducir un recurso útil en general: las formas normales.
Formas normales: fragmentos decidibles. El concepto de forma normal encuentra
utilidad en muy distintos dominios de la Lógica moderna. En nuestro caso, su uso se
predica sólo de fórmulas, y por ello hablaremos siempre de fórmulas en forma normal
o de formas normales, pero también existen aplicaciones distintas frecuentes en
distintos dominios de la Lógica no elemental. En general, una fórmula en forma
normal es una fórmula que cumple ciertos requisitos, por lo general muy estrictos, en
cuanto a su aspecto. Dado un lenguaje formal L, sus formas normales bajo algún
determinado criterio previamente establecido no son sino un subconjunto propio de
ese mismo lenguaje. ¿Para qué sirven estas formas normales? Como ya hemos visto,
las propiedades lógicas de una fórmula, respecto a las relaciones de derivabilidad y
consecuencia semántica, por ejemplo, dependen por entero de su estructura. Muchas
veces hay alteraciones de esa estructura que preservan, no obstante, las propiedades
lógicas de la fórmula inicialmente considerada. Si fuera posible elegir una única
formula de entre todas aquellas que se comportan del mismo modo respecto a ciertos
400
Introducción al problema de la decisión
conceptos fundamentales, y fuera además posible reflejar del modo más directo esa
conducta en su forma, entonces el estudio de las propiedades generales,
metateóricas, de un lenguaje se simplificaría sobremanera. Las formas normales
responden a este objetivo. Para que la introducción de formas normales en un sistema
lógico tenga sentido tiene que poderse establecer previamente lo que se denomina un
teorema de normalización. Estos resultados establecen la bondad de las formas
normales consideradas al mostrar cómo consiguen capturar ellas solas y sin pérdida
alguna todas las propiedades relevantes de un lenguaje formal. En términos muy
generales, un teorema de forma normal para fórmulas tendría el siguiente aspecto:
[5]
Teorema de normalización para fórmulas. Sea L un lenguaje formal y Σ
una propiedad predicable de fórmulas de L. Entonces,
i.
Para cada fórmula B de L existe una fórmula BN , la forma normal
de B, y sucede, además, que
ii.
B satisface Σ syss BN satisface Σ.
Es fácil entender la utilidad de las formas normales: todo lo que se pueda decir
de las fórmulas de L se puede decir igualmente estudiando sólo sus formas normales.
Cuanto más compacta y uniforme sea la estructura de estas formas normales tanto
mejor se apreciarán las propiedades notables de una fórmula mediante una simple
inspección visual.
El primer tipo de fórmulas en forma normal que hemos estudiado son las que
tienen vigencia en la Lógica Proposicional Clásica. Aunque la noción de forma normal
puede establecerse en un lenguaje formal sin atender otras consideraciones, me
refiero al tratamiento de sus constantes lógicas, su utilidad depende de que pueda
establecerse el teorema anterior. Así, puede haber lógicas basadas en LE, por
ejemplo, que debido a una distinta interpretación de sus conectivas, no tienen formas
normales, o mejor dicho, sus formas normales no normalizan esa lógica, con lo cual
carecen de valor. Las formas normales pertinentes en la Lógica Proposicional Clásica
401
Lógica de Primer Orden
eran de dos tipos, formas normales disyuntivas, FND en símbolos, y formas normales
conjuntivas, FNC. Recordemos que
[6]
i. Una fórmula en forma normal disyuntiva es toda fórmula de la forma
C1vC2v...vC n, donde cada Ci es una conjunción formada por átomos o
negaciones de átomos.
ii. Una fórmula en forma normal conjuntiva es toda fórmula de la
forma D1vD2v...vD n, donde cada Di es una disyunción formada por
átomos o negaciones de átomos.
Para mostrar que siempre existe una fórmula en forma normal para otra dada
se puede proceder de dos maneras distintas en esta caso. La primera consiste en
definir un procedimiento de traducción en el que se emplean reglas de transformación
que preservan la equivalencia lógica entre la fórmula original y la traducción. Mostrar
desde aquí la satisfacción de [6] se reduce a comprobar que el procedimiento
establecido es efectivo y exhaustivo, es decir, se reduce, en realidad, a mostrar la
parte i del teorema de normalización, ya que la segunda está explícitamente
garantizada por el tipo de reglas empleadas. La segunda estrategia es más larga pero
permite mostrar muchas otras cosas a la vez y consiste, básicamente, en la que ya se
describió de manera exhaustiva en el cap. 2.5, [6].
El uso de formas normales –FND- en Lógica Proposicional Clásica tiene dos
aplicaciones de interés. La primera afectaba al problema de la completitud funcional.
La segunda consiste en la posibilidad de establecer un procedimiento muy directo y
general para resolver la validez (teorematicidad) de clases enteras de fórmulas.
El teorema de normalización para fórmulas garantiza que una fórmula en forma
normal preserva módulo equivalencia una cierta propiedad predicable sobre
expresiones de LE. En el caso que nos afecta, la propiedad que se preserva se refiere
a su conducta con respecto a la colección de interpretaciones admisibles de ese
lenguaje: si una fórmula es una tautología (contradicción), entonces también lo es
aquella forma normal que se obtiene de ésta mediante las oportunas manipulaciones,
402
Introducción al problema de la decisión
y viceversa. ¿Qué utilidad puede tener este hecho? Como es fácil imaginar, los
severos requisitos impuestos sobre una fórmula para que esté en forma normal
arbitrarios. Con ellos se intenta que las propiedades relevantes de las fórmulas del
lenguaje en cuestión estén a la vista, que destaquen con la mera lectura de esa
expresión, o al menos, que la comparación entre diversas fórmulas resulte mucho
más directa. Considérese la siguiente fórmula en forma normal:
[7]
pv(q&r)v(q&¬p&¬q).
Sabemos que no es una tautología con poco más que un somero análisis de
su estructura. El razonamiento es fácil. La fórmula posee tres variables distintas y está
en FND. Una fórmula en FND cuyos coyuntos elementales Ci consten de esos tres
átomos precisa 23 de esos coyuntos distintos para ser una tautología –la razón de ello
queda como ejercicio-. La fórmula en [7] está formada por conjunciones elementales
que carecen de algunas de las variables presentes en la fórmula. Pero además,
contiene una conjunción en la que se hallan presentes un átomo y su negación, razón
por la cual puede eliminarse directamente –propongo también que quede como
ejercicio la justificación de ese paso-. El siguiente listado muestra cómo alcanzar la
fórmula que finalmente interesa considerar:
[8]
i. pv(q&r)v(q&¬p&¬q)
ii. pv (q&r)
iii. (p&q)v(p&¬q)v(q&r)
iv. (p&q&r)v(p&q&¬r)v(p&¬q)v(q&r)
v. (p&q&r)v(p&q&¬r)v(p&¬q&r)(p&¬q&¬r)v(q&r)
vi. (p&q&r)v(p&q&¬r)v(p&¬q&r)(p&¬q&¬r)v(p&q&r)v(¬p&q&r)
vii (p&q&¬r)v(p&¬q&r)(p&¬q&¬r)v(p&q&r)v(¬p&q&r).
Este procedimiento se puede agilizar de múltiples maneras dando lugar a un
sofisticado método de análisis que en un mayor grado de desarrollo conduce a lo que
se conoce como Método de Resolución de Robinson.
403
Lógica de Primer Orden
Este procedimiento tiene más sentido cuando damos el paso que nos lleva a la
Lógica de Primer Orden aproximándonos a esa tenue línea divisoria que hemos venido
denominando aquí frontera de la decisión. Es ahí donde más partido se puede sacar a
las reducciones de fórmulas a una forma normal cuyas propiedades puedan ser
fácilmente asociadas a elementos característicos de su estructura, a ciertos patrones,
en definitiva, apreciables en la disposición de sus elementos constitutivos. ¿Es posible
refinar aún más aquella frontera arrebatando a la Lógica de Primer Orden fragmentos
significativos incorporables al dominio de las expresiones cuya satisfacibilidad o
teorematicidad son decidibles? La respuesta, por extraño que parezca, es afirmativa:
la frontera de la decisión no es siquiera una línea recta. Para mostrar la existencia de
estas clases se acudió en su día a ciertas formas normales características de la Lógica
de Primer Orden.
[9]
Una fórmula en forma normal prenexa es toda expresión del lenguaje LC
en la que los cuantores aparecen todos ellos a la izquierda de una
expresión que constituye su alcance.
Una fórmula en forma normal prenexa tiene será de la forma Q1...Qn(Ψ), donde
cada Qi es un cuantor universal o un cuantor existencial. La serie de cuantores Q1...Qn
recibe el nombre de prefijo, y la fórmula Ψ el de matriz. Este tipo de formas normales
satisfacen los requisitos del teorema de normalización para fórmulas incluso cuando la
propiedad Σ es la de ser satisfecho por un modelo. Es decir,
[10]
Para toda fórmula B existe una fórmula BFNP tal que para cualquier
modelo µ, [B]µ =V syss [BFNP]µ =V.
Haciendo uso de este resultado se ha conseguido establecer la decidibilidad,
entre otras, de las siguientes clases de fórmulas:
[11]
i. ∀x1∀x2...∀xn ∃y1∃y2...∃y n Ψ.
ii. ∀x1∀x2...∀xn Ψ.
404
Introducción al problema de la decisión
iii. ∃y 1∃y2...∃yn Ψ.
iv. Aquellas que no contienen más de un cuantor existencial.
Como se puede ver, la localización de cada una de estas clases se basa en el
estudio minucioso de ciertos componentes identificables en el prefijo cuantificacional
de estas fórmulas en FNP. Como ya he dicho hay más clases que las listadas en [11]
que son también decidibles. No obstante, el estudio de la geografía exacta de la
frontera de la decisión no puede ir aquí mucho más allá de este punto. Un último
intento de sistematizar aún más el estudio de la decidibilidad en Primer Orden es el
que se lleva a cabo con las llamadas formas normales de Skolem. El valor de este
recurso queda probado al mostrar su utilidad no sólo en el problema que ahora nos
ocupa, sino también al permitir simplificar ciertos aspectos de la prueba de completitud
de original de Gödel para LPO, o reforzar el alcance del teorema original de
Löwenheim. Este tipo de formas normales requieren la introducción de un recurso
extra que recibe el nombre de funciones de Skolem. Para representar una función de
Skolem haremos uso de la notación habitual: f(x1,...xn), etc. El lenguaje resultante de
admitir este tipo de recurso se simbolizará como LC SK admitiendo la existencia de los
recursos semánticos oportunos para tratar con funciones, aunque aquí no se vayan a
explicar por el momento.
[12]
Una fórmula de normal de Skolem es toda aquella expresión de LC SK en
forma normal prenexa en la que los cuantores existenciales preceden a
cualquier cuantor universal.
Una fórmula en forma normal de Skolem presenta el siguiente aspecto:
∃y1∃y2...∃yn ∀x1∀x2...∀xm Ψ, donde la matriz admite la presencia de símbolos
funcionales. El teorema de normalización asociado a este tipo de fórmulas es algo más
débil esta vez:
405
Lógica de Primer Orden
[13]
Para toda fórmula B de LC existe un fórmula BFNS en LC SK tal que si B es
satisfecha por algún modelo µ, entonces BFNS es satisfecha por otro
modelo µ’, el cual no tiene que coincidir con el original.
La propiedad que el teorema de normalización preserva no es en esta ocasión
de la “ser satisfecho por un modelo µ”, sino la de “existir un modelo que satisfaga la
fórmula”. Dicho de otra forma, una fórmula B y su forma normal de Skolem BFNS
podrían no ser equivalentes.
Dada una fórmula en forma normal prenexa, su transformación a una forma
normal de Skolem, si no lo es ya, sólo exige alterar de algún modo la presencia de
cuantores existenciales ubicados tras algún cuantor universal. Para ello basta con
aplicar una transformación en la que, como no podía ser de otro modo, se hace un
uso relevante de las funciones de Skolem:
[14]
∀x1...∀xi∃yj Qk ....QnΨ reemplácese por ∀x1...∀xi Qk ....QnΨ(yj/f(x1...xi))
No es muy difícil entender qué hace una de estas funciones de Skolem. La
ocurrencia de un cuantor existencial tras una secuencia de cuantores universales se
lee en castellano del siguiente modo: “para todo x1, x2,...xi hay un yj ...tal que...” Es
obvio que el individuo del domino que vaya a reemplazar a la variable yi estará en
función de aquello que se diga en la matriz de la fórmula de los x1,...x n. Eso es
exactamente lo que expresa una función de Skolem -existe una forma normal de
Skolem dual de ésta en la que son los cuantores universales los que preceden a
cualquier cuantor existencial. Entonces se hace referencia a formas ∀∃ y formas ∃∀.
Si se toma en serio la observación anterior puede no resultar tan extraño que
este tipo de expresiones basten por sí solas para representar toda la variedad de
formas admisibles que puede tener que ver con la adquisición o pérdida de la
satisfacibilidad en primer orden. La uniformidad tiene en este caso un precio que es
necesario satisfacer: la clase de fórmulas normales de Skolem no es decidible. De otro
406
Introducción al problema de la decisión
modo las fórmulas de la Lógica Clásica de Primer Orden también lo serían y ello en
función tan sólo del teorema de normalización que las fórmulas de Skolem satisfacen.
A partir de este punto el estudio de la decidibilidad de la Lógica de Primer
Orden se pierde en un mar de precisiones y detalles que apenas añaden nada nuevo a
lo ya visto. Sorprende y creo que siempre lo hará, ver cómo algo que debería
responder relativamente bien a nuestra voluntad se muestre finalmente tan esquivo y
autónomo. Estamos acostumbrados a considerar que la ambigüedad o el contenido de
los términos de una teoría son invariablemente los responsables de todas las
deficiencias o limitaciones de esa teoría. Nunca se nos habría ocurrido pensar en que
un lenguaje desprovisto por completo de contenido material pudiera mostrar
dificultades que le hacen adquirir algo en cierto modo parecido a una conducta. Esto
sólo quiere decir que los lenguajes formales tal vez, no son pura forma, sino que
contienen ya la expresión de alguna realidad independiente de difícil identificación.
407
Lógica de Primer Orden
Orientación bibliográfica.
Para entender el contexto histórico en que se plantea el Problema de la
Decisión se puede tener en cuenta [Gareth Ashurst, 1982], y [Kleene, 1952]. Un
texto mucho más preciso y profundo es [Sieg, 1999].
Para la decidibilidad de fragmentos de LC está indicado [Hunter, 1974], secc.
50, y [Garrido, 1974], cap. XV, secc.
Para consultar con más detenimiento el papel que desempeña la identidad se
dispone de [Bell y Machover, 1977], cap. 2, secc.11. Hay también consideraciones
generales sobre capacidad expresiva en [Manzano, 1989] cap. II, secc. 3.1.
Para analizar las fórmulas en forma normal para LE es más que suficiente lo
que se contiene en [Garrido, 1974], cap.XII, secc. 6 y 7 y [Hunter, 1969] Segunda
Parte. Un interesante comentario sobre la importancia de estos resultados en contexto
no clásicos se encuentra en [Blamey, 1986]. Este ítem sólo lo recomiendo como
segunda lectura.
La referencia obligada para el método de Resolución es obviamente
[Robinson, 1965]. Otra referencia para ampliar información acerca de técnicas
próximas a las implementaciones computacionales es [Cuena, 1985].
Para el estudio de formas normales y de Skolem para Lógica de Primer Orden
son referencias útiles, [Bell y Machover, 1977], cap. 2, secc. 9 y sobre todo [Hunter,
1974], Cuarta Parte, secc.58. Un interesante comentario al respecto es el que figura
en [Kleene, 1952], secc. 76.
408
Descargar