Planteamiento no intuitivo de la síntesis orgánica II. Predicción de la reactividad POR CARLOS SEGANE PRADO Recibido: 14 de Marzo de 1990 Presentado por el académico numerario D. Manuel Lora Tamayo. Resumen El desarrollo de la síntesis orgánica en los últimos tiempos ha llevado a un planteamiento informático que podríamos ya calificar de "clásico", apoyado sobre un archivo de reacciones. Se recogen en este trabajo las dificultades y limitaciones de este planteamiento y las alternativas al mismo a través de un enfoque no basado en archivos de reacciones, sino en la predicción a priori de la reactividad de las moléculas orgánicas. Supone ello la generación automática de reacciones orgánicas y su evaluación sobre criterios termoquímicos y electrónicos para predecir su factibilidad. Se considera tanto la aplicación a las reacciones directas como a los procesos de síntesis en análisis retrosintético. 1. Introducción En un trabajo anterior (Seoane, 1991) se consideró el planteamiento intelectual de la Síntesis Orgánica, en lo que se refiere a su evolución desde un planteamiento intuitivo a un enfoque racional a través de los conceptos de sintón, inversión dipolar y desconexión de enlaces estratégicos. El diseño de síntesis a través de la espectrometría de masas permitió un primer paso hacia lo que hemos llamado diseño sintético "supraracional". En esta línea, la incorporación de la informática a la Síntesis Orgánica, tan lógica como inevitable (Seoane, 1989), supone un notabilísimo avance en el planteamiento del diseño sintético. El carácter sistemático y exhaustivo de un tratamiento informático permite la certeza de un análisis retrosintético sin omisión de posibilidades. El archivo de reacciones orgánicas almacenadas en la base de datos permite al sistema informático examinar todas las alternativas posibles en cada etapa retrosintética y alcanzar así, de modo completo y automático, el árbol de síntesis para cada molécula que haya de prepararse. 2. El problema del tratamiento informático clásico: Archivo de reacciones Sin embargo, este enfoque informático, que podríamos ya llamar clásico, tiene un serio problema, un factor limitante: la base de datos, el arsenal de reacciones entre los que el proceso informático puede elegir. Necesariamente en continua actualización, la base de datos está condenada a una hipertrofia casi patologia imposible de controlar. En efecto, existen reacciones generales 214 CARLOS SEDANE PRADO de cada grupo funcional, pero muchas clases de compuestos tienen sus reacciones específicas y otros procesos son aplicables a una sola molécula. Cada semana, por otra parte, se descubren nuevas reacciones en un crecimiento que parece exponencial. ¿Han de introducirse todas estas reacciones en la base de datos?. Se han desarrrrollado sistemas con más de 5000 reacciones, mas el proceso es intrinsecamente inacabable. Pero además, y sobre todo, cualquier sistema apoyado sobre un archivo de reacciones está limitado a las reacciones conocidas, pues evidentemente sólo estas pueden introducirse en la memoria. ¿Qué gigantesco paso adelante puede suponer el desarrollo de un sistema informático capaz de "razonar" sin la limitación de un archivo de reacciones?. No está tal vez de más recordar aquí una reflexión de un gran químico sintético, R.B.Woodward (1978). Enfrentado a una síntesis, escribió Woodward, "el químico sintético debe intentar, en este orden, una reacción que sea: a) conocida, b) predecible, c) deseable, sea o no conocida o predecible" Pues bien, es esta búsqueda de nuevas reacciones deseables lo que hemos de pedir a ese nuevo razonamiento cibernético. 3. Sistemas "inteligentes" de Síntesis Orgánica Los denominados sistemas inteligentes o sistemas expertos de Síntesis Orgánica no utilizan en absoluto una bibliografía de reacciones preconstituida. Por el contrario, se pretende que sean capaces de generar su propia química. Así ocurre en el programa EROS (Elaboration or Reactions for Organic Systhesis) en el que nos centraremos, en la vanguardia misma de la Química Orgánica (Gasteiger et al., 1987). Un nutrido grupo de investigadores internacionales, en una sugestiva simbiosis entre el mundo académico y el industrial, ha creado un sistema cibernético que abre perspectivas inimaginadas. Esta "creatividad informática" puede aplicarse tanto para obtener rutas retrosintéticas como para la predicción de la reactividad, dos aspectos inseparablemente relacionados. Un enfoque como éste no sólo supera a todo tratamiento informático anterior, sino incluso al investigador humano, al menos en cierto sentido. En efecto, cuando un investigador se enfrenta a una reacción sintética centra su atención en los grupos funcionales presentes que, a su vez, le sugieren reacciones que conoce. Frente a un determinado grupo funcional, se revisan mentalmente las reacciones que para él se conocen. Las que sean compatibles con los restantes grupos funcionales presentes y las condiciones a emplear serán elegidas como candidatas. Así funciona nuestra mente, en cierto modo atrapada por el concepto de grupo funcional. 215 PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II Sin embargo, el concepto de grupo funcional tiene sus limitaciones. Es válido y muy útil en moléculas sencillas, pero puede fallar, a veces estrepitosamente, en moléculas polifuncionales. Como ejemplo, el comportamiento del hidrato de cloral frente a hidróxido no resulta inmediato a partir del conocimiento de sus grupos funcionales: hidrato de aldehido y haluro de alquilo (Fig. l). ci ci OH OH CI o I ^ CI—C — C H O — C — C—OH -«7/- CI—C — C—OH I I '' H Cl Cl H H Cl +OH 0 CI O II 0 - CI—C — H + C — O +H2O Cl H CH3 CH3 HO — CH2 — CH2—C — CI +OH © // —ff+ HO—CH2—CH2—C—OH CH3 CHs CH3 HO—CH2—CH= C ; CH3 CH3 © O—CH2—CH2— C — CI CH3 CH3 O—UcH3 0=CH2 + H2Cb= C^ + CI CH3 CH3 Figura 1 © 216 CARLOS SEDANE PRADO Aunque la formación de aldehido puede producirse en el equilibrio, no se da sustitución de cloro por hidroxilo. Se produce, por el contrario, un proceso de tipo haloformo para dar ion formiato por rotura de un enlace carbonocarbono. Por su parte, el 3-cloro-3-metilbutanol al reaccionar con hidróxido no conduce a un 1,3-diol, ni a un alcohol alílico ni a un oxetano, como haría esperar la química de los grupos funcionales. Se rompe de nuevo un enlace carbono-carbono para formar algo tan inesperado como formaldehido, isobuteno e ion cloruro. Estos ejemplos indican con claridad que al determinar la reactividad han de tenerse en cuenta enlaces no contenidos en el grupo funcional. El concepto de EROS pretende evitar tanto la limitación de un archivo de reacciones como la limitación del concepto de grupo funcional. Su filosofía básica consiste en realizar un tratamiento puramente formal de las reacciones orgánicas, que se tratan como simples procesos de rotura y formación de enlaces, con la única consideración adicional de los desplazamientos electrónicos. Este tratamiento se aplica por igual a todos los átomos y enlaces de la molécula, prescindiendo de la preconcepción de grupo funcional. De este modo pueden generarse libremente reacciones orgánicas, sobre modelos matemáticos de la constitución molecular (Dugundji y Ugi, 1973). 4. Generación de reacciones Un compuesto cíclico funcionalizado puede ilustrar el modo en que el sistema genera reacciones orgánicas. Las características de una condensación aldólica, en su versión retrosintética, son la rotura de un enlace C-C y un enlace Ó-H y la creación de un enlace C=C y un enlace C-H (Fig. 2). Pero cabe una generalización: considerar simplemente que se rompen dos enlaces entre los átomos J e I y K y L, mientras que esos átomos pasan a unirse a través de dos nuevos enlaces. c —o I I C H i I J K I L C =O I —K C —H J —L Figura 2 PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA 217 Como veremos enseguida, otros esquemas formales de reacción juegan también su papel al describir otros tipos de procesos, pero el esquema que acabamos de mencionar, rotura los dos enlaces y formación de otros dos nuevos, es de extraordinaria generalidad en Química Orgánica. De hecho, un importantísimo número de reacciones orgánicas de los más variados tipos mecanísticos siguen este esquema. Así, la adición de hidrógeno a un olefina corresponde a este generador de reacción, como corresponde también la sustitución electrófila aromática o la reducción de un carbonile (Fig. 3). -C = C Br—Br 4-4Br —^C— Br HO—H Br OVl·l+Br- Br- /C=O H —H C Br OH H Br+H—Br —C—O —H " " " H Figura 3 Más aún, tambiém implica rotura y formación de dos enlaces una solvolisis de un derivado halogenado o incluso el cierre electrocíclico de un dieno. Pero existen además otras posibilidades formales de generación de reacciones, con diversas combinaciones de enlaces y electrones libres (Bart et al., 1977). Las reacciones orgánicas principales pueden incluirse en unos generadores de reacción característicos (Fig. 4). Cada uno de ellos recibe una denominación del tipo RGxyz. RG significa "Reaction Generator", x el número de enlaces rotos e y el número de enlaces formados. Cuando hay más de un generador donde x e y coinciden, se asigna el tercer dígito z, que no es más que un número correlativo que permite la identificación inequívoca de cada generador. En todo caso, estos generadores de reacción han de cumplir el requisito de conservar el número de pares electrónicos á ambos lados de Ía ecuación. Así, RG22 incluye todo proceso en el que se rompen dos enlaces y se crean otros dos y, como hemos dicho, es uno de los más generales en las reacciones orgánicas. RG33 implica rotura y formación de tres enlaces y también incluye muchas reacciones orgánicas. RG12 exige ya la intervención de un par electrónico libre, pues se forman dos enlaces mientras que ser rompe uno sólo y exige un cambio en el estado de valencia del átomo x. Cuando EROS aplica este esquema, es preciso que sólo se hagan intervenir estados de valencia permitidos para cada átomo. 218 CARLOS SEGANE PRADO RG 221 RG22 !' I-J ^>-\ K L K-L :X I RG33 L — K I-J K I. L N-M I J-K N M-L X / K RG222 RG12 :K X: J — L \J RG21 /I Figura 4 En efecto, entre los "conocimientos químicos básicos" de EROS se encuentran los grados de oxidación posibles de cada elemento. Por otro lado, ya que se pretende que el sistema pueda trabajar tanto en sentido directo como retrosintético, es preciso disponer también de los generadores de reacción formalmente inversos. RG21, por ejemplo, es el proceso inverso a RGÌ2, pero la valencia.X se ha reducido. Es obvio, que procesos como éstos no pueden aplicarse de modo indiscriminado, pues resultarían muchas reacciones absurdas. Más adelante veremos como se filtran estos procesos irreales en el curso de la evaluación, de modo que se proponga sólo para los centros de reacción apropiados. RG221 y RG222 son dos generadores que implican rotura y formación de dos enlaces y el desplazamiento.de electrones libres. En el esquema, las líneas curvas denotan enlaces que son necesarios pero no intervienen en el. proceso. La Figura 5 indica ejemplos de aplicación de los generadores de reacción a moléculas concretas. La oxidación de un sulfuro a sulfóxido es un primer caso. La etapa inicial rompe un sólo enlace y crea dos (RG12), mientras que la segunda es un proceso RG22. La formación de un ciclopropano por su parte, exige un proceso RG21 para la generación del carbeno, mientras que la ciclopropanación rompe un enlace y genera dos (RG12). Finalmente, las cicloadiciones 1,3-dipolares corresponden a los generadores RG221 y RG222. La primera corresponde a la cicloadición directa, mientras que la RG222 representa una retrocicloadición 1,3-dipolar (o la propia cicloadición si se tratase de un proceso retrosintético). PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II :S: + R—C O S S 219 O S :S=O + R—C O—OH "O—H O—H /CH2 CI \ H2 u^ © o R—C=N-Ö| RG221 HaC=CH2 RG222 R- ^, \ / H2C—CH2 Figura 5 Es importante señalar que, aunque esta lista no es exhaustiva, el propio sistema EROS es capaz de producir nuevos generadores de reacción a partir de etapas mecanísticas elementales. En ello radica su enorme capacidad creativa. Tomemos de nuevo nuestra molécula cíclica y apliquemos a ella el sistema para hallar los distintos esquemas de rotura y formación de enlaces que pueden encontrarse en la molécula, sin el "corsé" de la química convencional de grupos funcionales. El número de posibilidades es muy grande CARLOS SEGANE PRADO 220 y algunas de ellas parecen absurdas (Fig. 6). Además, para cada pareja de enlaces rotos puede haber dos alternativas para la construcción de dos nuevos, como ocurre en las parejas 9.1 y 9.2 y en las 9.4 y 9.5. Por otra parte, los dos enlaces formados no tienen que estar necesariamente en una misma molécula. 9.1 „OH 9.2 H— OH + 9.3 O OH 9.4 O OH HO 9.5 O-H + CH3—H OH OH +H-H 9.7 H O-H Figura 6 PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II 221 Las reacciones 9.3 y 9.6, por ejemplo, forman uno de los enlace en una molécula independiente (agua o metano). Inversamente (9.7) los dos enlaces rotos pueden provenir de dos moléculas y no de una sola. Un "generador de reacciones humano" podría también ejecutar esta tarea, pero podría no hacerlo de modo exhaustivo y, sobre todo, dejaría de contemplar muchas posibilidades que sus conocimientos previos de la química funcional le harían descartar. EROS, en cambio, puede proponer todas las posibilidades que formalmente existen. Es importante poner de manifiesto que, para generar estas reacciones, el sistema informático no necesita saber si son o no conocidas. No hay, ni es necesaria, una base de datos de reacciones, cuya construcción y actualización desaparecen cono problema. De este modo, el tratamiento formal de las reacciones como roturas y formación de enlaces y desplazamientos electrónicos permite, en principio, la generación de todos los procesos concebibles. Constituye, por tanto, un método para tratar con total libertad la arquitectura molecular. El resultado puede ser una reacción que ya sea conocida. Pero, igualmente, EROS puede ofrecer reacciones nuevas, aún no descubiertas, que podrán acabar incorporándose al cuerpo de conocimientos que llamamos Química Orgánica. No obstante, esta enorme creatividad tiene un precio. La generación automática de reacciones puede conducir a un ingente número de ellas, muchas de las cuales serán, para evitar eufemismos, insensateces. Uno no puede, en efecto, elegir cualesquiera enlaces en una molécula, romperlos, formar otros nuevos y obtener siempre una reacción practicable. El proceso 9.6 de la Figura 6, por ejemplo, parece bastante improbable. Podríamos así encontrarnos en la enojosa situación de tener que examinar multitud de reacciones, muchas de las cuales resultarían químicamente absurdas. No ocurre así. Desde un principio los creadores de EROS han desarrollado procedimientos de evaluación, un "automatic evaluation package" en su propia definición, que ha de seleccionar únicamente aquellas reacciones que sean posibles. Este "filtro", en continua mejora, permitirá al programa descartar muchas reacciones de las generadas y ofrecer al investigador sólo las que, conocidas o nuevas, sean realmente viables como procesos sintéticos. Ejercido este control, hay una ventaja adicional en trabajar con generadores formales de reacción. Las reacciones representadas en los esquemas de generación de reacciones nada implican en cuanto a su direccionalidad. En otras palabras, el esquema es formalmente reversible y las reacciones que se ajustan a un determinado generador pueden interpretarse en uno u otro sentido. Por consiguiente, si se supone que la reacción ha de ocurrir fisicamente en la dirección generada por el sistema informático estaríamos llevando a cabo una predicción de reactividad. A partir de un compuesto inicial, el sistema procede a través de varias estruturas intermedias hasta dar con los productos de reacción (Fig. 7) Ahora bien, alternativamente pueden considerarse las reacciones generadas por el ordenador como procesos retrosintéticos. El sistema procede entonces desde la molécula objetivo a través de precursores sintéticos hasta 222 CARLOS SEDANE PRADO a) Búsqueda Directa A+B - In - PII+. I2i - P21+. b) Búsqueda Retrosintética BÚSQUEDA DIRECTA Y RETROSINTÉTICA MEDIANTE GENERADORES FORMALES DE REACCIÓN Figura 7 llegar a los posibles productos de partida que nos propone. De nuevo son varias las alternativas exploradas. Naturalmente, debe haber diferencias entre estos dos modos alternativos de actuación del sistema. Sin embargo, no derivan de los mecanismos de generación de reacciones, pues se tratan a través de los mismos esquemas formales. Las diferencias proceden del modo en que las reacciones generadas se evalúan y seleccionan. 5. Evaluación de reaccciones: Criterios básicos En cualquier caso, directo o retrosintético, el propósito de la evaluación no es otro sino eliminar propuestas inútiles. Es obvio que la calidad de la evaluación determinará la calidad global del sistema. Los criterios de evaluación son de tres tipos: fisicoquímicos, económicos y estratégicos, y pueden aplicarse a reacciones directas o a secuencias sintéticas (Fig. 8). Además, dependiendo de cada caso, puede asignarse mayor o menor pero relativo a cada criterio de evaluación. Por otra parte, varios criterios de evaluación pueden apoyarse en una fuente común. Así, los valores de entalpia PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA Fisicoquímicos Compuestos Reacciones Síntesis Económicos Estabilidad —Precio Equilibrio -»- -*- Costes energéticos Rendimiento global Número de etapas 223 Estratégicos Complejidad de anillos Protección de grupos Convergencia Figura 8 de reacción determinados para cada proceso pueden utilizarse para evaluar la estabilidad de un compuesto o la constante de un equilibrio, pero también permiten el cálculo de los costos energéticos en un proceso del ámbito industrial. La aplicación en EROS de estos criterios desde el punto de vista práctico se apoya en el desarrollo de modelos químicos (Suckling et al., 1978) para cada uno de los aspectos. Estos modelos pueden representar propiedades fisicoquímicas en función de conceptos químicos cuantitativos, como la transferencia de carga entre átomos de diferente electronegatividad o las energías de enlace. Los parámetros fisicoquímicos son los únicos necesarios para la predicción directa de reacciones. Una vez que se hayan modelizado adecuadamente, el curso de una reacción y sus productos podrán predecirse de modo automático. El primer punto a considerar es el centro reactivo de la molécula: cual es el centro de mayor reactividad para determinar el curso de reacción predominante y, en su caso, los centros de reacción secundarios. Esto, naturalmente, requiere la evaluación de la reactividad de cada centro, lo que a su vez precisa asignar un valor de reactividad a cada enlace de la molécula. Al intentarlo, sin embargo, surge una seria dificultad: la Química Orgánica no ha sido aún capaz de desarrollar una teoría completamente general de la reactividad orgánica. Fue necesario, pues, desarrollar un esquema capaz de asignar valores de reactividad a lo largo de la molécula apoyándose en el análisis de las etapas individuales de los procesos orgánicos y los efectos que los controlan, tanto energéticos como electrónicos. La cuantificación de estos efectos, usados con frecuencia a nivel cualitativo, es el paso necesario para que un programa permita su tratamiento informático, por lo demás imprescindible dado el elevado número de cálculos necesarios. Para ello se diseñó un modelo numérico molecular para cada aspecto, que se traduce a un algoritmo matemático (Fig. 9). 224 CARLOS SEGANE PRADO EROS Modelo Conocimiento químico »- Algoritmo / -\ Reacciones + Moléculas Evaluación Figura 9 Además, a través del propio programa puede perfeccionarse el modelo inicial. Al introducir una molécula de química conocida, las propuestas del sistema, una vez evaluadas, se comparan con el comportamiento real de la molécula. Las discrepancias que surjan se introducen como correcciones del modelo, refinándolo hasta una concordancia satisfactoria. De este modo, el programa dispone de modelos capaces de albergar moléculas de hasta setenta átomos, manejados a través de algoritmos que pueden procesarse en cortos tiempos. Con todo, la evaluación de todos los criterios no puede ser simultánea y han de distinguirse dos tipos: aquellos que pueden determinarse sobre la molécula de partida per se (energías de disociación de enlace, por ejemplo) y las que exigen la aplicación a reactivos y productos simultáneamente (como energías de reacción). Es claro que conviene comenzar por las evaluaciones del primer tipo para detectar que enlaces han de intervenir realmente en la reacción, lo que nos guiará hacia reaccciones razonables. Obtenido el producto final de cada reacción generada pueden ya aplicarse las evaluaciones del segundo grupo, hasta definir aquellos procesos, sólo los posibles, a que antes nos referíamos. 6. Parámetros para la evaluación de reacciones La cuestión inmediata, por tanto, es el modo de utilizar los distintos criterios de evaluación. No son otros más que los que el químico orgánico humano emplearía al intentar la interpretación de una reacción que no conoce (Fig. 10). PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA 225 l -Calores de reacción -TERMODINÂMICOS Parámetros para evaluación de reacciones I -Energías de enlace -Cargas atómicas parciales -Efectos inductivos -EFECTOS ELECTRÓNICOS i -Efectos de resonancia -Polarizabilidad -Hiperconjugación -Aproximación de orbitales fronterizos Figura 10 a) Parámetros termoquímicos Los criterios termoquímicos engloban las entalpias de reacción y las entalpias de enlace, factores que primero condicionan el cursó de una reacción orgánica. La entalpia de reacción se abordó como diferencia entre las entalpias de formación de productos y reactivos: AHr = EA/f/ (Productos) - E A/// (Reactivos) Se requiere, pues, el conocimiento de las entalpias de formación de las moléculas implicadas. Para lograrlo, de acuerdo con la filosofía general, se desglosan las moléculas en subestructuras, para efectuar el sumatorio energético de los parámetros subestructurales (Gasteiger y Dammer, 1978; Gasteiger, 1979). Es obvio que la precisión será tanto mayor cuantos más parámetros se empleen. EROS utiliza el esquema de Alien (1959; 1966) numéricamente equivalente al esquema de aditividad de Benson (1976) como compromiso entre un número manejable de parámetros y la necesaria precisión. En él, los contenidos energéticos se determinan por las energías de interacción 1,2 entre átomos, que equivalen a enlaces, y las interacciones 1,3 para todos los átomos excepto hidrógeno. La idea es más simple de lo puede parecer, ya que en cada reacción generada, sólo es preciso considerar las subestructuras que implican a los enlaces que intervienen en esa reacción concreta. Ello es perfectamente adecuado en moléculas acíclicas. Además, el sistema incluye dos aspectos energéticos más: la tensión de los ciclos pequeños (Gasteiger y Dammer, 1978) y la energía de resonancia aromática en moléculas cíclicas. La precisión que así se alcanza es excelente y la concordancia entre entalpias calculadas y experimentales 226 CARLOS SEDANE PRADO no suele superar 1 kcal/mol (Gasteiger et al, 1987), lo que resulta completamente adecuado. El segundo aspecto termoquímico es la energía de disociación de enlace. Su cálculo no exige más que la evaluación de entalpia de rotura de enlace para dar átomos o radicales, es decir la entalpia de homolisis de enlace: A - B —> A" + B* BDE(A - B) = AHr Para ello se aplican los mismos parámetros de subestructuras, sin más que incluir en ellos radicales libres. Así el sistema es capaz de calcular la BDE ("Bond Dissociation Energy") de cada enlace de una molécula orgánica, y muestra una excelente concordancia con los valores experimentales cuando estos están disponibles (Egger y Cook, 1973; Gasteiger et al. 1987) e incluso refleja con fidelidad las pequeñas diferencias entre enlaces iguales sobre carbonos primarios, secundarios y terciarios (McMillan y Golden, 1982). También en la determinación de entalpias de enlace el programa tiene en cuenta la tensión de anillo y la aromaticidad cuando ésta existe, al igual que hace con la energía de delocalización a través de resonancia aulica o bencílica. b) Parámetros electrónicos El segundo tipo de criterios de evaluación, los efectos electrónicos derivan de un hecho evidente: las entalpias de enlace son un criterio válido únicamente para los procesos homolíticos. El tratamiento cuantitativo de los procesos heterolíticos, los más frecuente, es más complejo. Simples consideraciones electrostáticas, en efecto, indican que la disociación de un enlace covalente en dos iones de signo opuesto es inherentemente desfavorable en términos energéticos. Para que sea posible es preciso que operen mecanismos que estabilicen las cargas incipientes, que la Química Orgánica ha clasificado en los diferentes efectos electrónicos: inductivo, resonancia, hiperconjugación. Sin embargo, estos conceptos suelen manejarse cualitativamente, por lo que es precisa su conversión en modelos cuantitativos para poder ser manejados por el sistema informático. Aunque él aparato matemático es complejo y exige un análisis de multiregresióñ lineal, (Chapman y Shorter, 1978) que se refino frente a datos experimentales, importa indicar lo esencial. El modelo elegido recoge tres parámetros básicos: carga atómica parcial (q), electronegatividad (%), y polarizabilidad (a) para cada átomo. De este modo, los valores asignados a un determinado átomo dependen del elemento de que se trate y del entorno en que se halle. Los parámetros de dos átomos enlazados entre si permiten asignar un valor cuantitativo a ese enlace que refleja su reactividad polar. PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II 227 Por lo que respecta a cargas atómicas parciales, el primer intento de EROS se dirigió al cálculo mecanocuántico a través del clásico análisis poblacional de Mulliken (1955). Dos inconvenientes lo impidieron: la insuficiente precisión cuantitativa y el excesivo tiempo de cálculo. Dado que se requiere un método rápido y preciso que pueda aplicarse a moléculas complejas, el mejor enfoque resultó ser la simple aplicación de la electronegatividad, definida a partir del potencial de ionización y la afinidad electrónica de cada átomo (Ec. 1) (Hinze et al., 1963): X=Q.5(IP+EA) X = a+bq+cq2 (1) (2) La electronegatividad de un átomo, carbono en particular, depende tanto de la hibridación como de la ocupación orbital (Guillen y Gasteiger, 1983) y es esto lo que recoge la ecuación 2, que expresa la electronegatividad en función de la ocupación electrónica, aunque su aplicación requiera un elaborado proceso iterativo para asegurar la convergencia (Gasteiger y Marsili, 1980). Los valores de densidad de carga atómica obtenidos por correlación experimental (momentos dipolares, NMR; Gasteiger y Marsili, 1981) permiten lograr una optimization de los parámetros implicados. Corrigiendo los valores de carga atómica en función de modelos cuantitativos para los efectos inductivo y de resonancia que puedan existir en una determinada estructura orgánica, EROS puede calcular con precisión la carga de cada átomo. Más complejo es el manejo de la polarizabilidad como parámetro de la reactividad. Una carga eléctrica externa induce un dipolo en una molécula. Cuanto más intenso sea él dipolo, mayor es la polarizabilidad. Desde el punto de vista físico, esto produce una energía de estabilización que es función de la polarizabilidad ã, el valor de la carga, la distancia y la constante dieléctrica del medio: Ed = -aq2/2er4 Sin embargo, esta ecuación pierde su significado cuando la carga se introduce en la molécula, lo que es precisamente la situación que se pretende en la reactividad química, donde la carga resulta del ataque de un nucleófilo o un electrófilo, y la distancia no es fija ni definida. Por ello se definió un parámetro al que se denominó polarizabilidad efectiva (Gasteiger y Hutchings, 1984), a¿, calculable empíricamente y que representa, al ser proporcional a ella, la energía de estabilización que resulta de la interacción carga-dipolo. Su principal interés es su capacidad para correlacionar datos de reactividad química. Sirve como ejemplo una reacción sencilla: la afinidad protónica de 49 alquilaminas de la más variada estructura correlaciona directamente con los valores de polarizabilidad efectiva calculados por el sistema EROS (Fig. 11). 228 CARLOS SEOANE PRADO 240 235 \ © \© -^N: + H —— -^N-H PA (kcal/mol) 230 225 220 PA = 209.2 + 2.70-oe. 215 6 ío 11 ad- Figura 11 7. El espacio multidimensional de la reactividad Pero no dejemos que este aparato matemático nos haga perder nuestro objetivo. El propósito de todos estos parámetros es ofrecer al sistema criterios que decidan cuando un proceso que sus generadores de reacción han propuesto formalmente es en realidad viable o no. En definitiva: si la rotura o formación de uno o más enlaces es químicamente posible y cómo. Como en esta posibilidad de rotura de enlace influyen varios parámetros, lo más práctico para el sistema informático es construir un espacio multidimensional de reactividad (Gasteiger et al., 1987) (Fig. 12). Cada coordenada representa un determinado efecto, calculado de la manera indicada. En la figura se representa tal espacio de reactividad sobre las tres dimensiones de diferencia de carga, electronegatividad y polarizabilidad de enlace. A modo de ejemplo, se han representado dos enlaces de muy diferente reactividad: el enlace interhalógeno se caracteriza por su alta polarizabilidad, pero pequeña diferencia de electronegatividad y baja polaridad. Lo contrario es cierto para el enlace H-F, cuyos átomos tienen muy diferente electronegatividad. Es claro que esta representación permite ver que cuanto más alejados estén en ella dos enlaces, tanto más diferente será su reactividad. 229 PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II oc (x)I-Br 'A, / V / ©H/F I / J/ .-K Figura 12 Naturalmente, es posible introducir más parámetros y obtener un espacio de más de tres dimensiones, manejable matemáticamente aunque carezca de representación física. Esto, finalmente, permite al sistema hacer una clasificación esencial: enlaces capaces de romperse en una reacción polar y enlaces que no pueden romperse en ella (Fig. 13). Enlaces fragmentables H®- r, Cl H. „tC=C "H H "H H HH I I I o^H Cl 0 A• H-C-C-CS-C e«-e I I I? ^O-H H H Cl® • e«-«l 1 Cl-C-CsH 1 U Cl 0© ^H V e^ ? i? ,0 ^?-?-?^ H H H H Enlaces no fragmentables © ui» u _-« r\e n v~ — UI «ító-C^H H' *CQH H ClI Of I 1 H HffiH 0 g^cic-c^ n ~^L\-f v w ^> e*-®! I I e^O-H H H Cl * 'AIU'O ' Cl-C^c-H I l®*e Cl 0 ^ . . iJ-O-c'0 I I H H H" »•*! N HH Figura 13 El enlace C-C1 de la primera molécula, por ejemplo, puede romperse en ese sentido heterolítico, pero no en el contrario. Esto deduce el sistema EROS, 230 CARLOS SEDANE PRADO como determina también que los enlaces C-H del doble enlace no son fragmentables en ninguno de los dos sentidos. Llegados a este punto, disponemos ya de los medios necesarios para el tratamiento automático de las reacciones sintéticas: una metodología informática para generar todas las reacciones formales concebibles que afecten a todos y cada uno de los enlaces de la molécula y, de otro lado, los criterios energéticos y electrónicos necesarios para evaluar cuáles de esas reacciones formales son realmente viables. 8. Predicción de reacciones Ha llegado el momento de poner a prueba nuestro sistema. ¿Qué éxito tiene un sistema de inteligencia artificial como éste a la hora de predecir reacciones sintéticas? Presentábamos en un trabajo anterior (Secane, 1991) un conjunto de reacciones complejas para las que incluso un químico orgánico experto no encontraría fácil respuesta predictiva. La primera de ellas supone el tratamiento básico del hidroxiñorbornenó A (Fig. 14). Al enfrentarlo a esta reacción, el sistema propuso una serie de roturas heterolíticas conducentes a intermedios predichos de primer nivel. Tres advertencias previas son aquí necesarias. En primer lugar, las cargas indicadas no han de tomarse en sentido literal. Representan tan sólo la polarización calculada para el enlace y, por tanto, la dirección de la heterolisis que ha de producirse. En segundo lugar, en cada nivel el orden de posibilidades de izquierda a derecha no es arbitrario. El sistem las ordena en secuencia de probabilidad decreciente como resultado de las funciones de reactividad calculada. Finalmente, los valores entre paréntesis, que también se nos ofrecen, corresponden a las entalpias de reacción calculadas. Nótese, además, que no todas las estructuras que aparecen en un nivel pasan al siguiente. No son propuestas válidas y son ya descartadas. A través de las funciones de reactividad, el sistema calculó para el hidroxiñorbornenó cuatro posibles roturas de enlace de acuerdo con factores termoquímicos. A partir del alcóxido, en presencia de la base, se da el siguiente paso por fragmentación de un sólo enlace. El paso a molécula neutra, por reconstrucción de enlaces lleva, como posible producto, al cetociclopenteno B. El proceso se repite de nuevo hacia el nivel siguiente, que Contiene ya combinaciones de tres enlaces. La reconstrucción de enlace en uno de estos intermedios conduce a E, isómero de B. Ambos procesos de reacción son evaluados favorablemente por el sistema, en tanto que suponen entalpia negativa (-2.5 kcal/mol), más favorable que las otras alternativas. Junto con estos, el sistema sugiere la fragmentación que lleva a G, en principio plausible pero que se descarta porque los requerimientos de simetría orbital se oponen a ella. El tercer precursosr del tercer nivel, C, puede conducir a PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA I ©\ [I G Q O H® 231 / 0\ OGH® /Q / o o O (-2.5) (20.3) D E F 0 o (49.5) © 0 M (11.7) Figura 14 O6 H® O (10.1) 232 CARLOS SEDANE PRADO dos posibles productos por reconstrucción de enlaces: los compuestos E y F, acompañado de acetona. Pero la evaluación termoquímica descarta estas posibilidades a consecuencia de su entalpia desfavorable. Sin embargo, el tratamiento de las posibles evoluciones de C lleva, además, a un posible intermedio del nivel siguiente, H. La evolución que para él se predice conduce a ciclopentadieno y acetona. ¿Qué ocurre realmente en la práctica?. Cuando el hidroxinorborneno A se trata con hidruro potásico en HMPT, el cetociclopenteno B, con el 10%, y su isómero D, con el 45%, son precisamente los productos aislados (Snowden, 1985) (Fig. 15). Más aún, con ligeras variaciones porcentuales, estos productos se mantienen cuando otro grupo alquilo ocupa el lugar del metilo. La predicción, pues, no sólo es acertada sino también de considerable generable generalidad. 45%(R=CH 3 ) rTY" L / O D Y o 62% (R=Ph-CH2) Figura 15 La última vía, sin embargo, parece fracasar. Pues bien, cuando se aplicó el proceso a un norborneno con un grupo bencilo, se aisló acetofenona con el 233 PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA I 62% de rendimiento. La tercera predicción viene también confirmada por el experimento. Una consideración general permitirá ver en todo su alcance lo que esta capacidad predictiva supone. El hidroxinorborneno A contiene en su molécula 22 enlaces, 18 de los cuales son constitucionalmente no equivalentes. Hay, por tanto, 36 heterolisis de enlace posibles. La aplicación de los generadores formales de reacción conducirán a más de 11.000 posibilidades, pero los criterios de evaluación redujeron ese número intratable a sólo unas cuantas posibilidades químicamente viables. El sistema sugirió las más probables y estuvo en lo cierto. 9. Aplicación al planteamiento sintético Una última molécula nos servirá para ilustrar este aspecto (Fig. 16): el manejo de la interconversion de varias moléculas y su vertiente de planificación sintética. Se trata de un ejemplo del ámbito heterocíclico (A). OH AH (41.3) (37.8) Figura 16 En el esquema se han suprimido ya las especies intermedias y tan sólo se incluyen los productos o precursores propuestos por el sistema, indicando en 234 CARLOS SEGANE PRADO los círculos el orden de prioridad asignado a cada proceso tras la generación y evaluación de reacciones. Adicionalmente, la situación de cada molécula en el esquema se corresponde con un orden vertical de entalpia creciente. La entrada del sistema a este ciclo de reacciones comienza por eL furano A. La reacción propuesta por las funciones de reactividad es la que conduce a B. Pero la evaluación termoquímica revela que esta reacción está entalpicamente desfavorecida (+17.4 kcal/mol). La segunda reacción en orden de preferencia lleva al dihidrofurano C. Para comparar estos procesos, se pidió al sistema que examinara la posible evolución de estas estructuras por él propuestas. Al aplicarlo a B, el sistema predijo que la reacción más favorecida era la reversión al furano inicial, pero la segunda prioridad corresponde al proceso que lleva a su isómero C. De este modo, cabe esperar que la secuencia desde A sea la conversión en C, con B como intermedio. Por otra parte, el proceso propuesto como más favorable para C es la formación de la ciclopentenona E, una reacción que viene confirmada por la evaluación entálpica (-16.5 kcal/mol). El segundo proceso en orden de prioridad lleva, por apertura del dihidrofurano C, a un sistema poliénico (D), por lo que esta molécula fue también introducida como estructura a evaluar. Las dos reacciones sugeridas para ella llevan a la formación de uno o dos ciclos de cuatro eslabones (F y G). Un químico orgánico objetaría a estos procesos la tensión de anillo. Esto hizo también el sistema EROS y de modo cuantitativo, descartando estos productos a consecuencia de su elevada entalpia de formación. La combinación de criterios de evaluación deduce que la reacción preferida de D es la ciclación a un anillo pentagonal, la ciclopentenona E. La conclusión, por tanto, para el proceso global que empieza en A es la secuencia: A—» C—> E. ¿Corresponde esta predicción a la química real de este hidroxialquilfurano A?. Sí, (Fiancatela' et al., 1978) y resulta precisamente un proceso que ha tenido ya aplicación en la síntesis de prostaglandinas, perfumes y otros productos para la creación de anillos ciclopentánicos a partir de furanos (Dohgane et al., 1984). Es este esquema, por último, un buen caso para examinar el aspecto retrosintético del sistema EROS. Cuando las funciones de reactividad se aplican a E, considerado como objetivo sintético, el sistema predice que E se transformará en C o D. Ambos procesos se descartarían por sus entalpias positivas. Ahora bien, si estamos realizando un análisis retrosintético, estamos hablando de procesos inversos a los que realmente vamos a emplear luego en el laboratorio. Por tanto, las retroreacciones entalpicamente interesantes son ahora precisamente las de entalpia positiva. Los aspectos electrónicos, naturalmente, mantienen su paralelismo con la reacción directa. C y D son, por tanto, adecuados precursores para la síntesis de la ciclopentenona E. El sistema EROS los ha encontrado, una vez más, sin conocer las reacciones orgánicas. Ha prediche un análisis retrosintético a través de las reacciones que han de producirse. Puede, para terminar, indicarse que en toda la discusión se han elegido moléculas y procesos de notable complejidad, incluyendo ciclaciones o transposiciones, tipos de reacción con frecuencia difíciles de predecir. Desde PLANTEAMIENTO NO INTUITIVO DE LA SÍNTESIS ORGANICA II 235 luego, EROS funciona perfectamente bien en la predicción de reacciones más sencillas: adición, sustitución, condensaciones y, en definitiva, todo el comportamiento de los grupos funcionales. Y, además, con predicciones cuantitativas desde el punto de vista energético y electrónico y estimación de la reactividad relativa de los distintos centros de una molécula. BIBLIOGRAFÍA [1] ALLEN, T. L, (19S9): /. Chem. Phys., 31, 1039; J. Am. Chem. Soc., 88, 2938. [2] BART, J. C. Y GARAGNANI, E., (i977), Z. NATURFORSCH.: 32b, 455,465,678. [3] BENSON, S. W., (1976): "Thermochemical Kinetics", 2a ed., Wiley , New York. [4] CHAPMAN, N. B. Y SHORTER, J., (1978): "Correlation Analysis in Chemistry: Recent Advances", Plenum Press, New York. [5] DOHGANE, I., YAMACHIKA, H. Y (Japan), 896. MINAI, M., (19S4): J.Synth. Org. Chem. [6] DUGUNDI, I., UGI, I., (1973): Topics Curr. Chem., 39, 19. [7] EGGER, K. W. Y COCKS, A. T., (1973): Helv. Chim. Acta, 56, 1516. [8] GASTEIGER, J., (1978): Còmput, ehem., 2,85. [9] GASTEIGER, J., (1979): Tetrahedron, 35, 1419. [10] GASTEIGER, J. y DAMMER, O., (1978): Tetrahedron, 34, 2939. [11] GASTEIGER, J. y HUTCHINGS, M. G., (1984): J. Chem. Soc. Perkin H, 559; 1983, Tetrahedron Lett., 24, 2541. [12] GASTEIGER, J. y HUTCHINGS, M. G., CHRISTOPH, B., GANN, L., KILLER, CH, Low, P., MARSILI, M., SALLER, H. Y YUKI, K., (1987): Topics Curr. Chem., 137, 21. [13] HENDRICKSON, J. B. Y BRAUN-KELLER, E., (i98i): Tetrahedron, 37 (Sup. ï), 359. [14] KOCA, J. et. al., 1989: "Synthon Model of Organic Chemistry and Synthesis Design", Springer— Velag, New York. [15] GASTEIGER, J. Y MARSILI, M., (1980): Tetrahedron, 36, 3219. [16] GASTEIGER, J. Y MARSILI, M., (i98i): Org. Magn. Reson., is, 353. [17] GASTEIGER, J. Y SALLER, H., (i985): Angew. chem. int. Ed., 24,687. [18] GUILLEN, M. D. Y GASTEIGER, J., (1983): Tetrahedron,) 39,1331. [19] HIZEN, J., WHITEHEAD, M. A. Y JAFFE, H. H., (1963): /. Am. chem. soc., 85, 148. [20] MCMILLAN, D. F. Y GOLDEN, D. M., (1982): Ann. Rev. Phys. chem., 33, 493. [21] MULLIKEN, R. S., (1955): /. Chem. Phys., 23, 1833. [22] PlANCATELLI, G., SCETTRI, A., DAVID, G., D'AURIA, M., (1978): Tetrahedron, 34, 2775. 236 CARLOS SEGANE PRADO [23] SEGANE, C., (1989>: Aldrichlmlca Acta, 22, 41. [24] SEGANE, C.: .Rev. Real Acad. Ciencias. [25] SNOWDEN, R. L., (1985): Helv. Chim. Acta., 66, 1031. [26] SUCKLING, C. J., SUCKLING, K. E. Y SUCKLING, C. W., (1978): "Chemistry through Models", Cambridge University Press, Cambridge. [27] WOODWARD, R. B.,(1978): Congreso 75 Aniversario de la R.S.E.Q., Madrid.