Planteamiento no intuitivo de la síntesis orgánica II. Predicción de la

Anuncio
Planteamiento no intuitivo de la síntesis
orgánica II. Predicción de la reactividad
POR CARLOS SEGANE PRADO
Recibido: 14 de Marzo de 1990
Presentado por el académico numerario D. Manuel Lora Tamayo.
Resumen
El desarrollo de la síntesis orgánica en los últimos tiempos ha llevado a un planteamiento
informático que podríamos ya calificar de "clásico", apoyado sobre un archivo de reacciones. Se
recogen en este trabajo las dificultades y limitaciones de este planteamiento y las alternativas al
mismo a través de un enfoque no basado en archivos de reacciones, sino en la predicción a priori
de la reactividad de las moléculas orgánicas. Supone ello la generación automática de reacciones
orgánicas y su evaluación sobre criterios termoquímicos y electrónicos para predecir su factibilidad. Se considera tanto la aplicación a las reacciones directas como a los procesos de síntesis en
análisis retrosintético.
1.
Introducción
En un trabajo anterior (Seoane, 1991) se consideró el planteamiento intelectual de la Síntesis Orgánica, en lo que se refiere a su evolución desde
un planteamiento intuitivo a un enfoque racional a través de los conceptos
de sintón, inversión dipolar y desconexión de enlaces estratégicos. El diseño de síntesis a través de la espectrometría de masas permitió un primer
paso hacia lo que hemos llamado diseño sintético "supraracional". En esta
línea, la incorporación de la informática a la Síntesis Orgánica, tan lógica
como inevitable (Seoane, 1989), supone un notabilísimo avance en el planteamiento del diseño sintético. El carácter sistemático y exhaustivo de un
tratamiento informático permite la certeza de un análisis retrosintético sin
omisión de posibilidades. El archivo de reacciones orgánicas almacenadas en
la base de datos permite al sistema informático examinar todas las alternativas posibles en cada etapa retrosintética y alcanzar así, de modo completo y
automático, el árbol de síntesis para cada molécula que haya de prepararse.
2.
El problema del tratamiento informático clásico:
Archivo de reacciones
Sin embargo, este enfoque informático, que podríamos ya llamar clásico,
tiene un serio problema, un factor limitante: la base de datos, el arsenal de
reacciones entre los que el proceso informático puede elegir. Necesariamente
en continua actualización, la base de datos está condenada a una hipertrofia
casi patologia imposible de controlar. En efecto, existen reacciones generales
214
CARLOS SEDANE PRADO
de cada grupo funcional, pero muchas clases de compuestos tienen sus reacciones específicas y otros procesos son aplicables a una sola molécula. Cada
semana, por otra parte, se descubren nuevas reacciones en un crecimiento
que parece exponencial.
¿Han de introducirse todas estas reacciones en la base de datos?. Se han
desarrrrollado sistemas con más de 5000 reacciones, mas el proceso es intrinsecamente inacabable. Pero además, y sobre todo, cualquier sistema apoyado
sobre un archivo de reacciones está limitado a las reacciones conocidas, pues
evidentemente sólo estas pueden introducirse en la memoria. ¿Qué gigantesco paso adelante puede suponer el desarrollo de un sistema informático
capaz de "razonar" sin la limitación de un archivo de reacciones?.
No está tal vez de más recordar aquí una reflexión de un gran químico
sintético, R.B.Woodward (1978). Enfrentado a una síntesis, escribió Woodward, "el químico sintético debe intentar, en este orden, una reacción que
sea:
a) conocida,
b) predecible,
c) deseable, sea o no conocida o predecible"
Pues bien, es esta búsqueda de nuevas reacciones deseables lo que hemos de
pedir a ese nuevo razonamiento cibernético.
3.
Sistemas "inteligentes" de Síntesis Orgánica
Los denominados sistemas inteligentes o sistemas expertos de Síntesis
Orgánica no utilizan en absoluto una bibliografía de reacciones preconstituida. Por el contrario, se pretende que sean capaces de generar su propia
química. Así ocurre en el programa EROS (Elaboration or Reactions for
Organic Systhesis) en el que nos centraremos, en la vanguardia misma de la
Química Orgánica (Gasteiger et al., 1987). Un nutrido grupo de investigadores internacionales, en una sugestiva simbiosis entre el mundo académico
y el industrial, ha creado un sistema cibernético que abre perspectivas inimaginadas.
Esta "creatividad informática" puede aplicarse tanto para obtener rutas retrosintéticas como para la predicción de la reactividad, dos aspectos
inseparablemente relacionados. Un enfoque como éste no sólo supera a todo tratamiento informático anterior, sino incluso al investigador humano, al
menos en cierto sentido. En efecto, cuando un investigador se enfrenta a una
reacción sintética centra su atención en los grupos funcionales presentes que,
a su vez, le sugieren reacciones que conoce. Frente a un determinado grupo
funcional, se revisan mentalmente las reacciones que para él se conocen. Las
que sean compatibles con los restantes grupos funcionales presentes y las
condiciones a emplear serán elegidas como candidatas. Así funciona nuestra
mente, en cierto modo atrapada por el concepto de grupo funcional.
215
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II
Sin embargo, el concepto de grupo funcional tiene sus limitaciones. Es
válido y muy útil en moléculas sencillas, pero puede fallar, a veces estrepitosamente, en moléculas polifuncionales. Como ejemplo, el comportamiento
del hidrato de cloral frente a hidróxido no resulta inmediato a partir del
conocimiento de sus grupos funcionales: hidrato de aldehido y haluro de
alquilo (Fig. l).
ci
ci OH
OH
CI
o
I
^
CI—C — C
H O — C — C—OH -«7/- CI—C — C—OH
I
I
''
H
Cl
Cl
H
H
Cl
+OH
0
CI
O
II
0
- CI—C — H + C — O +H2O
Cl
H
CH3
CH3
HO — CH2 — CH2—C — CI +OH
© //
—ff+
HO—CH2—CH2—C—OH
CH3
CHs
CH3
HO—CH2—CH= C ;
CH3
CH3
©
O—CH2—CH2— C — CI
CH3
CH3
O—UcH3
0=CH2 + H2Cb= C^ + CI
CH3
CH3
Figura 1
©
216
CARLOS SEDANE PRADO
Aunque la formación de aldehido puede producirse en el equilibrio, no se da
sustitución de cloro por hidroxilo. Se produce, por el contrario, un proceso
de tipo haloformo para dar ion formiato por rotura de un enlace carbonocarbono. Por su parte, el 3-cloro-3-metilbutanol al reaccionar con hidróxido
no conduce a un 1,3-diol, ni a un alcohol alílico ni a un oxetano, como haría
esperar la química de los grupos funcionales. Se rompe de nuevo un enlace
carbono-carbono para formar algo tan inesperado como formaldehido, isobuteno e ion cloruro. Estos ejemplos indican con claridad que al determinar
la reactividad han de tenerse en cuenta enlaces no contenidos en el grupo
funcional.
El concepto de EROS pretende evitar tanto la limitación de un archivo
de reacciones como la limitación del concepto de grupo funcional. Su filosofía
básica consiste en realizar un tratamiento puramente formal de las reacciones orgánicas, que se tratan como simples procesos de rotura y formación
de enlaces, con la única consideración adicional de los desplazamientos electrónicos. Este tratamiento se aplica por igual a todos los átomos y enlaces
de la molécula, prescindiendo de la preconcepción de grupo funcional. De
este modo pueden generarse libremente reacciones orgánicas, sobre modelos
matemáticos de la constitución molecular (Dugundji y Ugi, 1973).
4.
Generación de reacciones
Un compuesto cíclico funcionalizado puede ilustrar el modo en que el sistema genera reacciones orgánicas. Las características de una condensación
aldólica, en su versión retrosintética, son la rotura de un enlace C-C y un
enlace Ó-H y la creación de un enlace C=C y un enlace C-H (Fig. 2). Pero
cabe una generalización: considerar simplemente que se rompen dos enlaces
entre los átomos J e I y K y L, mientras que esos átomos pasan a unirse a
través de dos nuevos enlaces.
c —o
I I
C
H
i
I
J
K
I
L
C =O
I —K
C —H
J —L
Figura 2
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA
217
Como veremos enseguida, otros esquemas formales de reacción juegan también su papel al describir otros tipos de procesos, pero el esquema que acabamos de mencionar, rotura los dos enlaces y formación de otros dos nuevos, es de extraordinaria generalidad en Química Orgánica. De hecho, un
importantísimo número de reacciones orgánicas de los más variados tipos
mecanísticos siguen este esquema. Así, la adición de hidrógeno a un olefina corresponde a este generador de reacción, como corresponde también la
sustitución electrófila aromática o la reducción de un carbonile (Fig. 3).
-C = C
Br—Br
4-4Br
—^C— Br
HO—H
Br
OVl·l+Br- Br-
/C=O
H —H
C
Br
OH
H
Br+H—Br
—C—O —H
" " " H
Figura 3
Más aún, tambiém implica rotura y formación de dos enlaces una solvolisis
de un derivado halogenado o incluso el cierre electrocíclico de un dieno.
Pero existen además otras posibilidades formales de generación de reacciones, con diversas combinaciones de enlaces y electrones libres (Bart et
al., 1977). Las reacciones orgánicas principales pueden incluirse en unos generadores de reacción característicos (Fig. 4). Cada uno de ellos recibe una
denominación del tipo RGxyz. RG significa "Reaction Generator", x el número de enlaces rotos e y el número de enlaces formados. Cuando hay más
de un generador donde x e y coinciden, se asigna el tercer dígito z, que no es
más que un número correlativo que permite la identificación inequívoca de
cada generador. En todo caso, estos generadores de reacción han de cumplir
el requisito de conservar el número de pares electrónicos á ambos lados de
Ía ecuación. Así, RG22 incluye todo proceso en el que se rompen dos enlaces
y se crean otros dos y, como hemos dicho, es uno de los más generales en
las reacciones orgánicas. RG33 implica rotura y formación de tres enlaces
y también incluye muchas reacciones orgánicas. RG12 exige ya la intervención de un par electrónico libre, pues se forman dos enlaces mientras que
ser rompe uno sólo y exige un cambio en el estado de valencia del átomo x.
Cuando EROS aplica este esquema, es preciso que sólo se hagan intervenir
estados de valencia permitidos para cada átomo.
218
CARLOS SEGANE PRADO
RG 221
RG22
!'
I-J
^>-\
K L
K-L
:X
I
RG33
L — K
I-J
K
I.
L
N-M
I
J-K
N
M-L
X
/
K
RG222
RG12
:K
X:
J — L
\J
RG21
/I
Figura 4
En efecto, entre los "conocimientos químicos básicos" de EROS se encuentran los grados de oxidación posibles de cada elemento. Por otro lado, ya
que se pretende que el sistema pueda trabajar tanto en sentido directo como
retrosintético, es preciso disponer también de los generadores de reacción
formalmente inversos. RG21, por ejemplo, es el proceso inverso a RGÌ2,
pero la valencia.X se ha reducido. Es obvio, que procesos como éstos no pueden aplicarse de modo indiscriminado, pues resultarían muchas reacciones
absurdas. Más adelante veremos como se filtran estos procesos irreales en
el curso de la evaluación, de modo que se proponga sólo para los centros
de reacción apropiados. RG221 y RG222 son dos generadores que implican
rotura y formación de dos enlaces y el desplazamiento.de electrones libres.
En el esquema, las líneas curvas denotan enlaces que son necesarios pero no
intervienen en el. proceso.
La Figura 5 indica ejemplos de aplicación de los generadores de reacción
a moléculas concretas. La oxidación de un sulfuro a sulfóxido es un primer
caso. La etapa inicial rompe un sólo enlace y crea dos (RG12), mientras que
la segunda es un proceso RG22. La formación de un ciclopropano por su parte, exige un proceso RG21 para la generación del carbeno, mientras que la
ciclopropanación rompe un enlace y genera dos (RG12). Finalmente, las cicloadiciones 1,3-dipolares corresponden a los generadores RG221 y RG222.
La primera corresponde a la cicloadición directa, mientras que la RG222
representa una retrocicloadición 1,3-dipolar (o la propia cicloadición si se
tratase de un proceso retrosintético).
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II
:S: + R—C
O
S
S
219
O
S
:S=O + R—C
O—OH
"O—H
O—H
/CH2
CI
\
H2
u^
©
o
R—C=N-Ö|
RG221
HaC=CH2
RG222
R-
^,
\ /
H2C—CH2
Figura 5
Es importante señalar que, aunque esta lista no es exhaustiva, el propio
sistema EROS es capaz de producir nuevos generadores de reacción a partir de etapas mecanísticas elementales. En ello radica su enorme capacidad
creativa.
Tomemos de nuevo nuestra molécula cíclica y apliquemos a ella el sistema para hallar los distintos esquemas de rotura y formación de enlaces
que pueden encontrarse en la molécula, sin el "corsé" de la química convencional de grupos funcionales. El número de posibilidades es muy grande
CARLOS SEGANE PRADO
220
y algunas de ellas parecen absurdas (Fig. 6). Además, para cada pareja de
enlaces rotos puede haber dos alternativas para la construcción de dos nuevos, como ocurre en las parejas 9.1 y 9.2 y en las 9.4 y 9.5. Por otra parte,
los dos enlaces formados no tienen que estar necesariamente en una misma
molécula.
9.1
„OH
9.2
H— OH
+
9.3
O
OH
9.4
O
OH
HO
9.5
O-H
+ CH3—H
OH
OH
+H-H
9.7
H
O-H
Figura 6
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II
221
Las reacciones 9.3 y 9.6, por ejemplo, forman uno de los enlace en una molécula independiente (agua o metano). Inversamente (9.7) los dos enlaces
rotos pueden provenir de dos moléculas y no de una sola. Un "generador
de reacciones humano" podría también ejecutar esta tarea, pero podría no
hacerlo de modo exhaustivo y, sobre todo, dejaría de contemplar muchas
posibilidades que sus conocimientos previos de la química funcional le harían descartar. EROS, en cambio, puede proponer todas las posibilidades
que formalmente existen.
Es importante poner de manifiesto que, para generar estas reacciones,
el sistema informático no necesita saber si son o no conocidas. No hay, ni
es necesaria, una base de datos de reacciones, cuya construcción y actualización desaparecen cono problema. De este modo, el tratamiento formal
de las reacciones como roturas y formación de enlaces y desplazamientos
electrónicos permite, en principio, la generación de todos los procesos concebibles. Constituye, por tanto, un método para tratar con total libertad
la arquitectura molecular. El resultado puede ser una reacción que ya sea
conocida. Pero, igualmente, EROS puede ofrecer reacciones nuevas, aún no
descubiertas, que podrán acabar incorporándose al cuerpo de conocimientos
que llamamos Química Orgánica.
No obstante, esta enorme creatividad tiene un precio. La generación automática de reacciones puede conducir a un ingente número de ellas, muchas
de las cuales serán, para evitar eufemismos, insensateces. Uno no puede,
en efecto, elegir cualesquiera enlaces en una molécula, romperlos, formar
otros nuevos y obtener siempre una reacción practicable. El proceso 9.6 de
la Figura 6, por ejemplo, parece bastante improbable. Podríamos así encontrarnos en la enojosa situación de tener que examinar multitud de reacciones,
muchas de las cuales resultarían químicamente absurdas.
No ocurre así. Desde un principio los creadores de EROS han desarrollado procedimientos de evaluación, un "automatic evaluation package" en
su propia definición, que ha de seleccionar únicamente aquellas reacciones
que sean posibles. Este "filtro", en continua mejora, permitirá al programa
descartar muchas reacciones de las generadas y ofrecer al investigador sólo
las que, conocidas o nuevas, sean realmente viables como procesos sintéticos.
Ejercido este control, hay una ventaja adicional en trabajar con generadores formales de reacción. Las reacciones representadas en los esquemas
de generación de reacciones nada implican en cuanto a su direccionalidad.
En otras palabras, el esquema es formalmente reversible y las reacciones
que se ajustan a un determinado generador pueden interpretarse en uno u
otro sentido. Por consiguiente, si se supone que la reacción ha de ocurrir
fisicamente en la dirección generada por el sistema informático estaríamos
llevando a cabo una predicción de reactividad. A partir de un compuesto
inicial, el sistema procede a través de varias estruturas intermedias hasta
dar con los productos de reacción (Fig. 7)
Ahora bien, alternativamente pueden considerarse las reacciones generadas por el ordenador como procesos retrosintéticos. El sistema procede
entonces desde la molécula objetivo a través de precursores sintéticos hasta
222
CARLOS SEDANE PRADO
a) Búsqueda Directa
A+B
- In
- PII+.
I2i
- P21+.
b) Búsqueda Retrosintética
BÚSQUEDA DIRECTA Y RETROSINTÉTICA MEDIANTE
GENERADORES FORMALES DE REACCIÓN
Figura 7
llegar a los posibles productos de partida que nos propone. De nuevo son
varias las alternativas exploradas.
Naturalmente, debe haber diferencias entre estos dos modos alternativos
de actuación del sistema. Sin embargo, no derivan de los mecanismos de
generación de reacciones, pues se tratan a través de los mismos esquemas
formales. Las diferencias proceden del modo en que las reacciones generadas
se evalúan y seleccionan.
5. Evaluación de reaccciones: Criterios básicos
En cualquier caso, directo o retrosintético, el propósito de la evaluación
no es otro sino eliminar propuestas inútiles. Es obvio que la calidad de la
evaluación determinará la calidad global del sistema.
Los criterios de evaluación son de tres tipos: fisicoquímicos, económicos y estratégicos, y pueden aplicarse a reacciones directas o a secuencias
sintéticas (Fig. 8).
Además, dependiendo de cada caso, puede asignarse mayor o menor pero
relativo a cada criterio de evaluación. Por otra parte, varios criterios de evaluación pueden apoyarse en una fuente común. Así, los valores de entalpia
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA
Fisicoquímicos
Compuestos
Reacciones
Síntesis
Económicos
Estabilidad —Precio
Equilibrio -»- -*- Costes energéticos
Rendimiento
global
Número de etapas
223
Estratégicos
Complejidad de anillos
Protección de grupos
Convergencia
Figura 8
de reacción determinados para cada proceso pueden utilizarse para evaluar
la estabilidad de un compuesto o la constante de un equilibrio, pero también permiten el cálculo de los costos energéticos en un proceso del ámbito
industrial.
La aplicación en EROS de estos criterios desde el punto de vista práctico se apoya en el desarrollo de modelos químicos (Suckling et al., 1978)
para cada uno de los aspectos. Estos modelos pueden representar propiedades fisicoquímicas en función de conceptos químicos cuantitativos, como
la transferencia de carga entre átomos de diferente electronegatividad o las
energías de enlace. Los parámetros fisicoquímicos son los únicos necesarios
para la predicción directa de reacciones. Una vez que se hayan modelizado
adecuadamente, el curso de una reacción y sus productos podrán predecirse
de modo automático.
El primer punto a considerar es el centro reactivo de la molécula: cual
es el centro de mayor reactividad para determinar el curso de reacción predominante y, en su caso, los centros de reacción secundarios. Esto, naturalmente, requiere la evaluación de la reactividad de cada centro, lo que a su
vez precisa asignar un valor de reactividad a cada enlace de la molécula.
Al intentarlo, sin embargo, surge una seria dificultad: la Química Orgánica
no ha sido aún capaz de desarrollar una teoría completamente general de
la reactividad orgánica. Fue necesario, pues, desarrollar un esquema capaz
de asignar valores de reactividad a lo largo de la molécula apoyándose en el
análisis de las etapas individuales de los procesos orgánicos y los efectos que
los controlan, tanto energéticos como electrónicos.
La cuantificación de estos efectos, usados con frecuencia a nivel cualitativo, es el paso necesario para que un programa permita su tratamiento
informático, por lo demás imprescindible dado el elevado número de cálculos necesarios. Para ello se diseñó un modelo numérico molecular para cada
aspecto, que se traduce a un algoritmo matemático (Fig. 9).
224
CARLOS SEGANE PRADO
EROS
Modelo
Conocimiento
químico
»- Algoritmo
/
-\
Reacciones
+
Moléculas
Evaluación
Figura 9
Además, a través del propio programa puede perfeccionarse el modelo inicial.
Al introducir una molécula de química conocida, las propuestas del sistema,
una vez evaluadas, se comparan con el comportamiento real de la molécula.
Las discrepancias que surjan se introducen como correcciones del modelo,
refinándolo hasta una concordancia satisfactoria. De este modo, el programa
dispone de modelos capaces de albergar moléculas de hasta setenta átomos,
manejados a través de algoritmos que pueden procesarse en cortos tiempos.
Con todo, la evaluación de todos los criterios no puede ser simultánea
y han de distinguirse dos tipos: aquellos que pueden determinarse sobre la
molécula de partida per se (energías de disociación de enlace, por ejemplo) y
las que exigen la aplicación a reactivos y productos simultáneamente (como
energías de reacción). Es claro que conviene comenzar por las evaluaciones
del primer tipo para detectar que enlaces han de intervenir realmente en la
reacción, lo que nos guiará hacia reaccciones razonables. Obtenido el producto final de cada reacción generada pueden ya aplicarse las evaluaciones
del segundo grupo, hasta definir aquellos procesos, sólo los posibles, a que
antes nos referíamos.
6. Parámetros para la evaluación de reacciones
La cuestión inmediata, por tanto, es el modo de utilizar los distintos
criterios de evaluación. No son otros más que los que el químico orgánico humano emplearía al intentar la interpretación de una reacción que no
conoce (Fig. 10).
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA
225
l -Calores de reacción
-TERMODINÂMICOS
Parámetros
para
evaluación
de
reacciones
I -Energías de enlace
-Cargas atómicas parciales
-Efectos inductivos
-EFECTOS ELECTRÓNICOS i -Efectos de resonancia
-Polarizabilidad
-Hiperconjugación
-Aproximación de orbitales fronterizos
Figura 10
a) Parámetros termoquímicos
Los criterios termoquímicos engloban las entalpias de reacción y las
entalpias de enlace, factores que primero condicionan el cursó de una
reacción orgánica.
La entalpia de reacción se abordó como diferencia entre las entalpias
de formación de productos y reactivos:
AHr = EA/f/ (Productos) - E A/// (Reactivos)
Se requiere, pues, el conocimiento de las entalpias de formación de
las moléculas implicadas. Para lograrlo, de acuerdo con la filosofía general, se desglosan las moléculas en subestructuras, para efectuar el
sumatorio energético de los parámetros subestructurales (Gasteiger y
Dammer, 1978; Gasteiger, 1979). Es obvio que la precisión será tanto
mayor cuantos más parámetros se empleen. EROS utiliza el esquema
de Alien (1959; 1966) numéricamente equivalente al esquema de aditividad de Benson (1976) como compromiso entre un número manejable
de parámetros y la necesaria precisión. En él, los contenidos energéticos se determinan por las energías de interacción 1,2 entre átomos, que
equivalen a enlaces, y las interacciones 1,3 para todos los átomos excepto hidrógeno. La idea es más simple de lo puede parecer, ya que en
cada reacción generada, sólo es preciso considerar las subestructuras
que implican a los enlaces que intervienen en esa reacción concreta.
Ello es perfectamente adecuado en moléculas acíclicas. Además, el sistema incluye dos aspectos energéticos más: la tensión de los ciclos
pequeños (Gasteiger y Dammer, 1978) y la energía de resonancia aromática en moléculas cíclicas. La precisión que así se alcanza es excelente y la concordancia entre entalpias calculadas y experimentales
226
CARLOS SEDANE PRADO
no suele superar 1 kcal/mol (Gasteiger et al, 1987), lo que resulta
completamente adecuado.
El segundo aspecto termoquímico es la energía de disociación de enlace. Su cálculo no exige más que la evaluación de entalpia de rotura de
enlace para dar átomos o radicales, es decir la entalpia de homolisis
de enlace:
A - B —> A" + B*
BDE(A - B) = AHr
Para ello se aplican los mismos parámetros de subestructuras, sin más
que incluir en ellos radicales libres. Así el sistema es capaz de calcular
la BDE ("Bond Dissociation Energy") de cada enlace de una molécula orgánica, y muestra una excelente concordancia con los valores
experimentales cuando estos están disponibles (Egger y Cook, 1973;
Gasteiger et al. 1987) e incluso refleja con fidelidad las pequeñas diferencias entre enlaces iguales sobre carbonos primarios, secundarios
y terciarios (McMillan y Golden, 1982). También en la determinación
de entalpias de enlace el programa tiene en cuenta la tensión de anillo
y la aromaticidad cuando ésta existe, al igual que hace con la energía
de delocalización a través de resonancia aulica o bencílica.
b) Parámetros electrónicos
El segundo tipo de criterios de evaluación, los efectos electrónicos derivan de un hecho evidente: las entalpias de enlace son un criterio válido
únicamente para los procesos homolíticos. El tratamiento cuantitativo
de los procesos heterolíticos, los más frecuente, es más complejo.
Simples consideraciones electrostáticas, en efecto, indican que la disociación de un enlace covalente en dos iones de signo opuesto es inherentemente desfavorable en términos energéticos. Para que sea posible es
preciso que operen mecanismos que estabilicen las cargas incipientes,
que la Química Orgánica ha clasificado en los diferentes efectos electrónicos: inductivo, resonancia, hiperconjugación. Sin embargo, estos
conceptos suelen manejarse cualitativamente, por lo que es precisa su
conversión en modelos cuantitativos para poder ser manejados por el
sistema informático. Aunque él aparato matemático es complejo y exige un análisis de multiregresióñ lineal, (Chapman y Shorter, 1978) que
se refino frente a datos experimentales, importa indicar lo esencial. El
modelo elegido recoge tres parámetros básicos: carga atómica parcial
(q), electronegatividad (%), y polarizabilidad (a) para cada átomo. De
este modo, los valores asignados a un determinado átomo dependen
del elemento de que se trate y del entorno en que se halle. Los parámetros de dos átomos enlazados entre si permiten asignar un valor
cuantitativo a ese enlace que refleja su reactividad polar.
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II
227
Por lo que respecta a cargas atómicas parciales, el primer intento de
EROS se dirigió al cálculo mecanocuántico a través del clásico análisis poblacional de Mulliken (1955). Dos inconvenientes lo impidieron:
la insuficiente precisión cuantitativa y el excesivo tiempo de cálculo.
Dado que se requiere un método rápido y preciso que pueda aplicarse a
moléculas complejas, el mejor enfoque resultó ser la simple aplicación
de la electronegatividad, definida a partir del potencial de ionización
y la afinidad electrónica de cada átomo (Ec. 1) (Hinze et al., 1963):
X=Q.5(IP+EA)
X = a+bq+cq2
(1)
(2)
La electronegatividad de un átomo, carbono en particular, depende tanto de la hibridación como de la ocupación orbital (Guillen y
Gasteiger, 1983) y es esto lo que recoge la ecuación 2, que expresa
la electronegatividad en función de la ocupación electrónica, aunque
su aplicación requiera un elaborado proceso iterativo para asegurar
la convergencia (Gasteiger y Marsili, 1980). Los valores de densidad
de carga atómica obtenidos por correlación experimental (momentos
dipolares, NMR; Gasteiger y Marsili, 1981) permiten lograr una optimization de los parámetros implicados. Corrigiendo los valores de
carga atómica en función de modelos cuantitativos para los efectos
inductivo y de resonancia que puedan existir en una determinada estructura orgánica, EROS puede calcular con precisión la carga de cada
átomo.
Más complejo es el manejo de la polarizabilidad como parámetro de la
reactividad. Una carga eléctrica externa induce un dipolo en una molécula. Cuanto más intenso sea él dipolo, mayor es la polarizabilidad.
Desde el punto de vista físico, esto produce una energía de estabilización que es función de la polarizabilidad ã, el valor de la carga, la
distancia y la constante dieléctrica del medio:
Ed = -aq2/2er4
Sin embargo, esta ecuación pierde su significado cuando la carga se
introduce en la molécula, lo que es precisamente la situación que se
pretende en la reactividad química, donde la carga resulta del ataque
de un nucleófilo o un electrófilo, y la distancia no es fija ni definida.
Por ello se definió un parámetro al que se denominó polarizabilidad
efectiva (Gasteiger y Hutchings, 1984), a¿, calculable empíricamente
y que representa, al ser proporcional a ella, la energía de estabilización
que resulta de la interacción carga-dipolo. Su principal interés es su
capacidad para correlacionar datos de reactividad química. Sirve como
ejemplo una reacción sencilla: la afinidad protónica de 49 alquilaminas
de la más variada estructura correlaciona directamente con los valores
de polarizabilidad efectiva calculados por el sistema EROS (Fig. 11).
228
CARLOS SEOANE PRADO
240
235
\
©
\©
-^N: + H —— -^N-H
PA
(kcal/mol)
230
225
220
PA = 209.2 + 2.70-oe.
215
6
ío
11
ad-
Figura 11
7.
El espacio multidimensional de la reactividad
Pero no dejemos que este aparato matemático nos haga perder nuestro
objetivo. El propósito de todos estos parámetros es ofrecer al sistema criterios que decidan cuando un proceso que sus generadores de reacción han
propuesto formalmente es en realidad viable o no. En definitiva: si la rotura
o formación de uno o más enlaces es químicamente posible y cómo.
Como en esta posibilidad de rotura de enlace influyen varios parámetros,
lo más práctico para el sistema informático es construir un espacio multidimensional de reactividad (Gasteiger et al., 1987) (Fig. 12). Cada coordenada
representa un determinado efecto, calculado de la manera indicada. En la
figura se representa tal espacio de reactividad sobre las tres dimensiones de
diferencia de carga, electronegatividad y polarizabilidad de enlace. A modo
de ejemplo, se han representado dos enlaces de muy diferente reactividad: el
enlace interhalógeno se caracteriza por su alta polarizabilidad, pero pequeña diferencia de electronegatividad y baja polaridad. Lo contrario es cierto
para el enlace H-F, cuyos átomos tienen muy diferente electronegatividad.
Es claro que esta representación permite ver que cuanto más alejados estén
en ella dos enlaces, tanto más diferente será su reactividad.
229
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II
oc
(x)I-Br
'A,
/
V
/
©H/F
I /
J/
.-K
Figura 12
Naturalmente, es posible introducir más parámetros y obtener un espacio
de más de tres dimensiones, manejable matemáticamente aunque carezca de
representación física.
Esto, finalmente, permite al sistema hacer una clasificación esencial: enlaces capaces de romperse en una reacción polar y enlaces que no pueden
romperse en ella (Fig. 13).
Enlaces fragmentables
H®- r,
Cl
H.
„tC=C "H
H
"H
H HH
I I I
o^H
Cl 0
A•
H-C-C-CS-C e«-e
I I I? ^O-H
H H Cl® •
e«-«l 1
Cl-C-CsH
1 U
Cl 0©
^H
V e^
? i? ,0
^?-?-?^
H H H H
Enlaces no fragmentables
©
ui»
u _-«
r\e
n
v~ — UI
«ító-C^H
H' *CQH
H
ClI Of
I 1
H HffiH
0
g^cic-c^
n ~^L\-f v w ^>
e*-®! I I e^O-H
H H Cl
*
'AIU'O
' Cl-C^c-H
I l®*e
Cl 0 ^ . .
iJ-O-c'0
I I
H H H"
»•*!
N
HH
Figura 13
El enlace C-C1 de la primera molécula, por ejemplo, puede romperse en ese
sentido heterolítico, pero no en el contrario. Esto deduce el sistema EROS,
230
CARLOS SEDANE PRADO
como determina también que los enlaces C-H del doble enlace no son fragmentables en ninguno de los dos sentidos.
Llegados a este punto, disponemos ya de los medios necesarios para el
tratamiento automático de las reacciones sintéticas: una metodología informática para generar todas las reacciones formales concebibles que afecten a
todos y cada uno de los enlaces de la molécula y, de otro lado, los criterios
energéticos y electrónicos necesarios para evaluar cuáles de esas reacciones
formales son realmente viables.
8.
Predicción de reacciones
Ha llegado el momento de poner a prueba nuestro sistema. ¿Qué éxito
tiene un sistema de inteligencia artificial como éste a la hora de predecir
reacciones sintéticas?
Presentábamos en un trabajo anterior (Secane, 1991) un conjunto de
reacciones complejas para las que incluso un químico orgánico experto no
encontraría fácil respuesta predictiva. La primera de ellas supone el tratamiento básico del hidroxiñorbornenó A (Fig. 14). Al enfrentarlo a esta
reacción, el sistema propuso una serie de roturas heterolíticas conducentes
a intermedios predichos de primer nivel.
Tres advertencias previas son aquí necesarias. En primer lugar, las cargas indicadas no han de tomarse en sentido literal. Representan tan sólo la
polarización calculada para el enlace y, por tanto, la dirección de la heterolisis que ha de producirse. En segundo lugar, en cada nivel el orden de
posibilidades de izquierda a derecha no es arbitrario. El sistem las ordena
en secuencia de probabilidad decreciente como resultado de las funciones de
reactividad calculada. Finalmente, los valores entre paréntesis, que también
se nos ofrecen, corresponden a las entalpias de reacción calculadas. Nótese,
además, que no todas las estructuras que aparecen en un nivel pasan al
siguiente. No son propuestas válidas y son ya descartadas.
A través de las funciones de reactividad, el sistema calculó para el hidroxiñorbornenó cuatro posibles roturas de enlace de acuerdo con factores
termoquímicos. A partir del alcóxido, en presencia de la base, se da el siguiente paso por fragmentación de un sólo enlace. El paso a molécula neutra,
por reconstrucción de enlaces lleva, como posible producto, al cetociclopenteno B. El proceso se repite de nuevo hacia el nivel siguiente, que Contiene
ya combinaciones de tres enlaces. La reconstrucción de enlace en uno de
estos intermedios conduce a E, isómero de B. Ambos procesos de reacción
son evaluados favorablemente por el sistema, en tanto que suponen entalpia negativa (-2.5 kcal/mol), más favorable que las otras alternativas. Junto
con estos, el sistema sugiere la fragmentación que lleva a G, en principio
plausible pero que se descarta porque los requerimientos de simetría orbital
se oponen a ella. El tercer precursosr del tercer nivel, C, puede conducir a
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA I
©\
[I
G
Q
O H®
231
/ 0\
OGH®
/Q
/
o
o
O
(-2.5)
(20.3)
D
E
F
0 o
(49.5)
©
0
M
(11.7)
Figura 14
O6 H®
O (10.1)
232
CARLOS SEDANE PRADO
dos posibles productos por reconstrucción de enlaces: los compuestos E y
F, acompañado de acetona. Pero la evaluación termoquímica descarta estas
posibilidades a consecuencia de su entalpia desfavorable. Sin embargo, el
tratamiento de las posibles evoluciones de C lleva, además, a un posible intermedio del nivel siguiente, H. La evolución que para él se predice conduce
a ciclopentadieno y acetona.
¿Qué ocurre realmente en la práctica?. Cuando el hidroxinorborneno A
se trata con hidruro potásico en HMPT, el cetociclopenteno B, con el 10%, y
su isómero D, con el 45%, son precisamente los productos aislados (Snowden,
1985) (Fig. 15). Más aún, con ligeras variaciones porcentuales, estos productos se mantienen cuando otro grupo alquilo ocupa el lugar del metilo. La
predicción, pues, no sólo es acertada sino también de considerable generable
generalidad.
45%(R=CH 3 )
rTY"
L / O
D
Y
o
62% (R=Ph-CH2)
Figura 15
La última vía, sin embargo, parece fracasar. Pues bien, cuando se aplicó el
proceso a un norborneno con un grupo bencilo, se aisló acetofenona con el
233
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA I
62% de rendimiento. La tercera predicción viene también confirmada por el
experimento.
Una consideración general permitirá ver en todo su alcance lo que esta
capacidad predictiva supone. El hidroxinorborneno A contiene en su molécula 22 enlaces, 18 de los cuales son constitucionalmente no equivalentes.
Hay, por tanto, 36 heterolisis de enlace posibles. La aplicación de los generadores formales de reacción conducirán a más de 11.000 posibilidades, pero
los criterios de evaluación redujeron ese número intratable a sólo unas cuantas posibilidades químicamente viables. El sistema sugirió las más probables
y estuvo en lo cierto.
9. Aplicación al planteamiento sintético
Una última molécula nos servirá para ilustrar este aspecto (Fig. 16): el
manejo de la interconversion de varias moléculas y su vertiente de planificación sintética. Se trata de un ejemplo del ámbito heterocíclico (A).
OH
AH
(41.3)
(37.8)
Figura 16
En el esquema se han suprimido ya las especies intermedias y tan sólo se
incluyen los productos o precursores propuestos por el sistema, indicando en
234
CARLOS SEGANE PRADO
los círculos el orden de prioridad asignado a cada proceso tras la generación
y evaluación de reacciones. Adicionalmente, la situación de cada molécula
en el esquema se corresponde con un orden vertical de entalpia creciente.
La entrada del sistema a este ciclo de reacciones comienza por eL furano A. La reacción propuesta por las funciones de reactividad es la que
conduce a B. Pero la evaluación termoquímica revela que esta reacción está
entalpicamente desfavorecida (+17.4 kcal/mol). La segunda reacción en orden de preferencia lleva al dihidrofurano C. Para comparar estos procesos,
se pidió al sistema que examinara la posible evolución de estas estructuras
por él propuestas. Al aplicarlo a B, el sistema predijo que la reacción más
favorecida era la reversión al furano inicial, pero la segunda prioridad corresponde al proceso que lleva a su isómero C. De este modo, cabe esperar
que la secuencia desde A sea la conversión en C, con B como intermedio. Por
otra parte, el proceso propuesto como más favorable para C es la formación
de la ciclopentenona E, una reacción que viene confirmada por la evaluación
entálpica (-16.5 kcal/mol). El segundo proceso en orden de prioridad lleva,
por apertura del dihidrofurano C, a un sistema poliénico (D), por lo que
esta molécula fue también introducida como estructura a evaluar. Las dos
reacciones sugeridas para ella llevan a la formación de uno o dos ciclos de
cuatro eslabones (F y G). Un químico orgánico objetaría a estos procesos
la tensión de anillo. Esto hizo también el sistema EROS y de modo cuantitativo, descartando estos productos a consecuencia de su elevada entalpia
de formación. La combinación de criterios de evaluación deduce que la reacción preferida de D es la ciclación a un anillo pentagonal, la ciclopentenona
E. La conclusión, por tanto, para el proceso global que empieza en A es la
secuencia: A—» C—> E.
¿Corresponde esta predicción a la química real de este hidroxialquilfurano A?. Sí, (Fiancatela' et al., 1978) y resulta precisamente un proceso que
ha tenido ya aplicación en la síntesis de prostaglandinas, perfumes y otros
productos para la creación de anillos ciclopentánicos a partir de furanos
(Dohgane et al., 1984).
Es este esquema, por último, un buen caso para examinar el aspecto
retrosintético del sistema EROS. Cuando las funciones de reactividad se
aplican a E, considerado como objetivo sintético, el sistema predice que E se
transformará en C o D. Ambos procesos se descartarían por sus entalpias positivas. Ahora bien, si estamos realizando un análisis retrosintético, estamos
hablando de procesos inversos a los que realmente vamos a emplear luego
en el laboratorio. Por tanto, las retroreacciones entalpicamente interesantes
son ahora precisamente las de entalpia positiva. Los aspectos electrónicos,
naturalmente, mantienen su paralelismo con la reacción directa. C y D son,
por tanto, adecuados precursores para la síntesis de la ciclopentenona E. El
sistema EROS los ha encontrado, una vez más, sin conocer las reacciones
orgánicas. Ha prediche un análisis retrosintético a través de las reacciones
que han de producirse.
Puede, para terminar, indicarse que en toda la discusión se han elegido moléculas y procesos de notable complejidad, incluyendo ciclaciones o
transposiciones, tipos de reacción con frecuencia difíciles de predecir. Desde
PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II
235
luego, EROS funciona perfectamente bien en la predicción de reacciones más
sencillas: adición, sustitución, condensaciones y, en definitiva, todo el comportamiento de los grupos funcionales. Y, además, con predicciones cuantitativas desde el punto de vista energético y electrónico y estimación de la
reactividad relativa de los distintos centros de una molécula.
BIBLIOGRAFÍA
[1] ALLEN, T. L, (19S9): /. Chem. Phys., 31, 1039; J. Am. Chem. Soc., 88, 2938.
[2] BART, J. C. Y GARAGNANI, E., (i977), Z. NATURFORSCH.: 32b, 455,465,678.
[3] BENSON, S. W., (1976): "Thermochemical Kinetics", 2a ed.,
Wiley , New York.
[4] CHAPMAN, N. B. Y SHORTER, J., (1978): "Correlation Analysis in Chemistry: Recent
Advances", Plenum Press, New York.
[5] DOHGANE, I., YAMACHIKA, H. Y
(Japan), 896.
MINAI, M., (19S4): J.Synth. Org. Chem.
[6] DUGUNDI, I., UGI, I., (1973): Topics Curr. Chem., 39, 19.
[7] EGGER, K. W. Y COCKS, A. T., (1973): Helv. Chim. Acta, 56, 1516.
[8] GASTEIGER, J., (1978): Còmput, ehem., 2,85.
[9] GASTEIGER, J., (1979): Tetrahedron, 35, 1419.
[10] GASTEIGER, J. y DAMMER, O., (1978): Tetrahedron, 34, 2939.
[11] GASTEIGER, J. y HUTCHINGS, M. G., (1984): J. Chem. Soc. Perkin H, 559; 1983,
Tetrahedron Lett., 24, 2541.
[12] GASTEIGER, J. y HUTCHINGS, M. G., CHRISTOPH, B., GANN, L., KILLER,
CH, Low, P., MARSILI, M., SALLER, H. Y YUKI, K., (1987): Topics Curr.
Chem., 137, 21.
[13] HENDRICKSON, J. B. Y BRAUN-KELLER, E., (i98i): Tetrahedron, 37 (Sup. ï),
359.
[14] KOCA, J. et. al., 1989: "Synthon Model of Organic Chemistry and Synthesis Design",
Springer— Velag, New York.
[15] GASTEIGER, J. Y MARSILI, M., (1980): Tetrahedron, 36, 3219.
[16] GASTEIGER, J. Y MARSILI, M., (i98i): Org. Magn. Reson., is, 353.
[17] GASTEIGER, J. Y SALLER, H., (i985): Angew. chem. int. Ed., 24,687.
[18] GUILLEN, M. D. Y GASTEIGER, J., (1983): Tetrahedron,) 39,1331.
[19] HIZEN, J., WHITEHEAD, M. A. Y JAFFE, H. H., (1963): /. Am. chem. soc., 85,
148.
[20] MCMILLAN, D. F. Y GOLDEN, D. M., (1982): Ann. Rev. Phys. chem., 33, 493.
[21] MULLIKEN, R. S., (1955): /. Chem. Phys., 23, 1833.
[22] PlANCATELLI, G., SCETTRI, A., DAVID, G., D'AURIA, M., (1978): Tetrahedron,
34, 2775.
236
CARLOS SEGANE PRADO
[23] SEGANE, C., (1989>: Aldrichlmlca Acta, 22, 41.
[24] SEGANE, C.: .Rev. Real Acad. Ciencias.
[25] SNOWDEN, R. L., (1985): Helv. Chim. Acta., 66, 1031.
[26] SUCKLING, C. J., SUCKLING, K. E. Y SUCKLING, C. W., (1978): "Chemistry
through Models", Cambridge University Press, Cambridge.
[27] WOODWARD, R. B.,(1978): Congreso 75 Aniversario de la R.S.E.Q., Madrid.
Descargar