Lección inaugural 2007 9/1/07 13:36 Página 1 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS Lección inaugural 2007 9/1/07 13:36 Página 3 REAL ACADEMIA DE INGENIERÍA SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS DISCURSO DEL ACADÉMICO EXCMO. SR. D. PERE BRUNET CROSA LEÍDO EN LA SESIÓN INAUGURAL DEL AÑO ACADÉMICO EL DÍA 23 DE ENERO DE 2007 MADRID MMVII Lección inaugural 2007 9/1/07 13:36 Página 4 Editado por la Real Academia de Ingeniería © 2007, Real Academia de Ingeniería © 2007 del texto, Pere Brunet Crosa ISBN: 84-95662-48-5 Depósito legal: M- Impreso en España Lección inaugural 2007 9/1/07 13:36 Página 5 LECCIÓN INAUGURAL DEL AÑO ACADÉMICO 2007 Lección inaugural 2007 9/1/07 13:36 Página 7 Excmo. Sr. Presidente de la Real Academia de Ingeniería Dignísimas Autoridades Compañeras y Compañeros Académicos Señoras y Señores Queridos amigos 1 . I n tr o d u c c i ó n La capacidad de representación humana siempre ha ido más lejos que la mera copia o transposición de una realidad física a una simbólica. El mismo acto de representar constituye una herramienta profundamente potente de comprensión de la realidad, tanto para aquél que la genera como para quien la percibe. La historia de nuestro interés por las representaciones muestra diferentes niveles en esta comprensión de las formas y del espacio. A través del dibujo, la pintura o la escultura, el hombre ha plasmado y representado los elementos de su entorno desde los tiempos más remotos. Según John Berger1, el dibujo simplemente declara y narra como en una suerte de pretérito histórico, con lo que adquiere una dimensión temporal (Figura 1). En contraposición, y continuando con la misma cita, la pintura trata de seducir desde lo visible, trata de introducirnos en la escena. El dibujo es monocromo y diagramático, mientras que en muchos casos y hasta el siglo XIX, tanto la pintura realista como la escultura son medios para la representación de las formas, del entorno espacial y de la luz (Figura 2), actuando como crónicas insustituibles que nos transmiten elementos de la época en que fueron creadas. Figura 1. Grabados egipcios sobre piedra en el templo de Edfu, dedicado al dios Horus (del 237 al 180 a. C.). 1 Figura 2. Pintura realista holandesa del siglo XVII. VerMeer, la lección de música (1662-1665). Londres, Buckingham Palace. John Berger, “Siempre Bienvenidos”, Huerga & Hierro editores, 2004. Colección “La Rama Dorada” núm. 29 , pág. 239. Lección inaugural 2007 8 9/1/07 13:36 Página 8 PERE BRUNET CROSA Hasta el advenimiento de la fotografía y del cine, la representación y comprensión de las formas sólo pudo basarse en las artes plásticas y en el dibujo técnico. A partir de finales del siglo XIX y fundamentalmente durante el siglo XX, las representaciones fotográficas en emulsiones fotosensibles, primero en blanco y negro sobre placas de vidrio y posteriormente en color y sobre películas flexibles significaron un salto cualitativo en relación a sus predecesoras (el dibujo y la pintura). Este salto se plasmó en un espectacular incremento de la producción de documentos gráficos, en el aumento de la calidad de la información y en la posibilidad, que apareció luego con el cine y el vídeo, de representar el comportamiento dinámico de los objetos. En este sentido,Walter Benjamín2 nos hace observar que la posibilidad de su reproductibilidad técnica, tanto en la fotografía como el cine, modificó la estética tradicional y cambió la función del arte, sobre todo durante el siglo XX. La aparición de los computadores a mitad del siglo XX significó un nuevo salto cualitativo en la historia de las representaciones. Las representaciones digitales, simples estructuraciones de secuencias de bits, aparecieron inicialmente asociadas a la necesidad de realizar simples operaciones aritméticas con los enteros. El ordenador ENIAC, presentado en público en 1946 y considerado el primer ordenador de la historia (Sales, 1980) disponía de una memoria con capacidad únicamente para veinte números de diez cifras, a pesar de su peso de treinta toneladas. El BINAC (1949) fue ya el primer computador completamente binario con un sistema de programación simbólica que utilizaba el concepto de von Newmann de programa almacenado en su memoria (von Newmann, 1945). Sin embargo, el IBM 1620, de segunda generación y utilizado en las Escuelas de Ingenieros de Barcelona y Madrid en la década de los 60 (primer ordenador con el que pude trabajar) todavía disponía de una memoria de ferritas organizada en veinte mil posiciones de cuatro bits que almacenaban dígitos en base 10 en representación BCD. De la representación binaria de los números enteros se pasó a la representación en coma flotante de un subconjunto finito de los reales. De forma casi inmediata, el ordenador dejó de ser únicamente una herramienta para el cómputo y los informáticos de nuestra generación asistimos y participamos en el descubrimiento del nuevo universo de las reWalter Benjamín, “Sobre la Fotografía”, Pre-Textos 2004, p.108: “En un primer momento se malgastó mucha agudeza en decidir si la fotografía era o no un arte, sin haberse planteado previamente si la invención de la fotografía no había cambiado el carácter global del arte; y los teóricos del cine pronto trasladaron a su terreno este precipitado planteamiento” … “La época de la reproductibilidad técnica desligó al arte de su fundamento cultual, extinguiendo para siempre el brillo de su autonomía. Ello trajo consigo un cambio en la función del arte que cayó fuera del campo de visión del siglo XIX.Y este cambio incluso se le ha escapado durante largo tiempo al siglo XX, que es el que ha vivido el desarrollo del cine”. 2 Lección inaugural 2007 9/1/07 13:36 Página 9 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 9 presentaciones digitales. Los progresos en este descubrimiento nos permitirían la representación de los caracteres para el procesado de textos, la representación digital de las imágenes para su procesado y manipulación, la representación del sonido y de la música, del vídeo o de tantos otros elementos del mundo que nos rodea. La representación digital de nuestro entorno requiere no obstante la utilización de elementos cualitativamente más complejos que las imágenes y vídeos digitales. La representación no ambigua de las formas de los objetos que nos rodean para su posterior comprensión debe basarse necesariamente en el conocimiento de su estructura geométrica. Citando a Robert Osserman3, la imaginación y el lenguaje matemático nos proporcionan la visión que nos permite contemplar la exquisita estructura que se esconde bajo lo superficial: la poesía del universo, en el que las ramas y frutos del árbol geométrico merecen ser contemplados como un admirable producto de la imaginación humana.Vemos, como diría Richard Feynman4, que las matemáticas (y la geometría) nos permiten sentir realmente la belleza, la profunda belleza de la naturaleza. En este contexto, los conceptos e ideas que desarrollaremos a continuación son producto de las investigaciones de numerosos informáticos y geómetras en esta joven disciplina a lo largo de estos últimos cuarenta años, incluyendo también el resultado de más de veinticinco años de trabajo de nuestro grupo en el campo de la representación y procesado digital de las formas, de su geometría, de sus atributos y de su comportamiento. Sin embargo, y como ingenieros, no podemos quedarnos en la sola comprensión de la estructura geométrica de nuestro entorno. Debemos aportar soluciones y diseñar artilugios para resolver problemas reales. Presentemos, a título de ejemplo, dos problemas prácticos aparentemente no relacionados pero de gran actualidad: la necesidad de disponer de sistemas eficientes para el entrenamiento y planificación en medicina y cirugía y la conveniencia de disponer de nuevas herramientas interactivas para el estudio y presentación del patrimonio cultural con metodologías radicalmente distintas a las utilizadas en los actuales museos. En ambos casos, y desde un punto de vista computacional, existe ya un problema inicial común. Debemos crear puentes para salvar 3 Robert Osserman, “La poesía del universo”, Grijalbo, Crítica, 1977, págs. 11, 65, 69. Richard Feynman, “El carácter de la ley física”, Antoni Bosch Editor, colección conjeturas, 1980; traducción de A. Bosch, pág. 45: “A aquellos que no conocen las matemáticas les resulta difícil sentir realmente la belleza, la profunda belleza de la naturaleza. C.P. Show habló de dos culturas. Creo verdaderamente que estas dos culturas separan a la gente que ha vivido y a la gente que no ha vivido esta experiencia de comprender las matemáticas suficientemente bien como para apreciar la naturaleza al menos una vez.” 4 Lección inaugural 2007 10 9/1/07 13:36 Página 10 PERE BRUNET CROSA Figura 3. Radiografía e imágenes contrastadas de los pies y del tórax de distintos pacientes. Resultados de proyectos conjuntos con Alma IT systems (Alma, 2006). el gran abismo existente entre los datos de partida (las imágenes digitales producidas por los escáneres TAC, MRI o PET o las nubes de puntos que nos suministran los escáneres láser en las aplicaciones de conservación del patrimonio cultural) y los dispositivos finales de visualización e interacción. Dependiendo de las necesidades de la aplicación, la visualización podrá realizarse de diferentes modos: en un sistema inmersivo de realidad virtual, en una pantalla tradicional o incluso en un dispositivo móvil tipo teléfono. Pero además, los usuarios finales nos plantean una gran variedad de problemas a resolver. En el caso de la medicina, por ejemplo, ¿es posible disponer de herramientas para la ayuda en el diagnóstico en medicina que permitan la localización automática o semiautomática de tumores y malformaciones? ¿Podemos crear herramientas de ampliación interactiva que permitan la inspección con efecto lupa o microscopio en tiempo real? ¿Cómo podemos eliminar (recortar) ciertos tejidos visualizando y resaltando otros tejidos de forma selectiva? La Figura 3 muestra, a título de ejemplo, algunos resultados actuales con datos de pacientes reales y puede comprobarse la mejora obtenida con las imágenes actuales en relación a las clásicas de rayos X. Los resultados forman parte de un proyecto de colaboración entre nuestro grupo y el mundo empresarial. En el campo de la cirugía, el requerimiento básico en estos momentos es el de poder disponer de herramientas para la simulación realista de operaciones quirúrgicas de forma no invasiva sobre modelos del propio paciente real, todo ello con carácter de entrenamiento previo a las intervenciones. Por otra parte, en las aplicaciones en el campo del patrimonio cultural, los requerimientos en el fondo no son muy distintos. El interés de los expertos es disponer de herramientas para el archivo, clasificación y ayuda a la conservación. Es preciso tener bases de datos cuyos modelos permitan el máximo nivel de detalle, así como su inspección en tiempo real con efecto Lección inaugural 2007 9/1/07 13:36 Página 11 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 11 Figura 4. Modelo del David de Michelangelo. Vista del modelo completo (56 millones de triángulos), y vista, desde una perspectiva insólita, de la cabeza del modelo digital antes y después del proceso de restauración. Proyecto ISTI-CNR sobre la restauración de la estatua de David, cortesía de Roberto Scopigno. de lupa o microscopio virtual (ampliación interactiva). En las aplicaciones dirigidas al público no experto, las posibilidades son múltiples, y van desde los sistemas de ayuda y soporte en los propios museos (Figura 4) hasta aplicaciones para el estudio e inspección interactiva a través de la red o sobre dispositivos móviles de visualización. En este caso, ¿podemos inspeccionar y tener percepción táctil en los modelos virtuales de las obras de arte? ¿Es posible navegar en espacio y tiempo en los museos virtuales? Todas estas preguntas nos llevan a interesantes problemas geométricos y computacionales, algunos de los cuales analizaremos a continuación. Las soluciones que puede aportar la ingeniería informática a los problemas planteados, provenientes de campos tan distintos, deberán aproximarse a los objetivos sin olvidar los condicionantes y restricciones singulares de cada problema. El objetivo final y el reto, tanto en las aplicaciones en medicina como en las dirigidas al estudio y conservación del patrimonio cultural, es poder explorar y entender modelos geométricos muy complejos empleando computadores comerciales, portátiles o de sobremesa (Figuras 3, 4 ó 5), de forma interactiva y con percepción de presencia. La complejidad del problema proviene, como detallaremos más adelante, de diversos factores. Por una parte, proviene del tamaño del modelo y de la información geométrica necesaria. Pero también proviene de las restricciones del problema, que incluyen la capacidad limitada del computador que llevará a cabo la visualización Lección inaugural 2007 12 9/1/07 13:36 Página 12 PERE BRUNET CROSA Figura 5. Recorte y vista interior del cráneo de un paciente. Sección por una esfera (izquierda) y algoritmo de visualización expresiva de la sección por un cubo (derecha). final así como las limitaciones y características de la percepción humana. La solución óptima requiere el diseño de algoritmos adecuados y eficientes e imperceptibles, es decir, transparentes. Un algoritmo interactivo debe ser eficiente hasta tal punto que el usuario final no tendría que percibirlo. Esta es nuestra paradoja: el resultado final de un buen trabajo en ingeniería de software (y de las múltiples horas y esfuerzo que comporta) debería ser, si ello es posible, que dicho software pase desapercibido, que sea transparente durante la interacción con el sistema. 2 . G e o m e t r ía , a lg o r it m o s y co m p u t a ci ó n : d e l o c o n t in u o a l o d is c r e t o La informática es ciencia y a la vez es tecnología. Directamente relacionada con la matemática y emparentada con la lingüística, la informática es la ciencia que nos permite descubrir las representaciones y algoritmos óptimos para una gran variedad de objetos y entes del mundo que nos rodea. El descubrimiento de la representación más adecuada en cada caso nos adentra en la comprensión de algunas propiedades de los propios objetos reales y nos aporta herramientas (los algoritmos) para poder manipularlos de forma óptima y acorde con su estructura. Como el testigo oidor de Elias Canetti5, debemos estar atentos para comprender las estructuras que se nos revelan. Intentando seguir el ejemplo de Gauss (Gauss, 1827) debemos descubrir propiedades y estructuras intrínsecas en la geometría de nuestros objetos. De hecho, decimos que una determinada representación es óptima 5 Elias Canetti, “El testigo oidor”, Ed. DeBolsillo, 2005 (Traducción de “Der Ohrenzeuge”), pág. 153: El testigo oidor … oye lo que hay que oír … y helo ya en otro lugar, oyendo otra vez; conoce todos los sitios donde hay algo que oír, lo registra bien y no olvida nada”. Lección inaugural 2007 9/1/07 13:36 Página 13 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 13 cuando posibilita que las operaciones que luego realizaremos con ella sean lo más eficientes posible. Nuestro objetivo tiene una formulación aparentemente simple: las representaciones digitales deben encajar a la vez con la estructura del objeto físico que queremos modelar y con las operaciones que desearemos aplicarle. Los programas no son más que formulaciones concretas de algoritmos abstractos que se basan en representaciones y estructuras de datos. Los algoritmos procesan y operan con representaciones (Wirth, 1971); en ellas, la información corresponde a determinadas abstracciones de partes del mundo real. Dejando aparte algunos precedentes del antiguo Egipto y los esquemas babilónicos de los alrededores del año 2000 a. C. para la resolución de ecuaciones cuadráticas de dos variables y algunos problemas de superficie de triángulos, el primer algoritmo conocido de naturaleza iterativa es el llamado algoritmo de Euclides para el cálculo del máximo común divisor de dos números enteros. Desgraciadamente fue imposible demostrar que el algoritmo era correcto, ya que la demostración se basa en el uso de la inducción, y ésta no fue descubierta hasta el siglo XVII. Pero quien expresó por primera vez el concepto de algoritmo de forma explícita fue Abu Jafar Muhammad Ibn Mûsâ Al-Khwârizmî (ver, por ejemplo, Zemanek, 1980).Al-Khwârizmî vivió en Bagdad entre los siglos VIII y IX, hizo aportaciones a la astronomía y a la geografía, y escribió el primer libro de algoritmos matemáticos con métodos simples y sistemáticos para resolver problemas algebraicos. No sólo su nombre dio lugar al término actual algoritmo, sino que la palabra álgebra proviene del título de su libro: Kitâb al-Jabr wa’l-muqâbala. Tenemos que esperar hasta el siglo XIX para poder disfrutar del primer manual de programación de la historia, desarrollado como es sabido por lady Augusta Ada, hija de lord Byron y condesa de Lovelace (Lovelace, 1843), colaboradora de Charles Babbage en el desarrollo y utilización de su máquina analítica. El texto de lady Ada contiene un algoritmo recurrente para el cálculo de los números de Bernouilli y apunta la posibilidad de aplicar la máquina de Babbage a aplicaciones no matemáticas, como por ejemplo la manipulación de notas musicales. Edsger W. Dijkstra (1976) contribuyó de manera decisiva a la consolidación de los fundamentos científicos de la informática al considerar los algoritmos y programas como objetos matemáticos (transformadores de predicados) y estudiar la clasificación de los mismos en base a sus propiedades estructurales. Por lo que respecta al análisis de la complejidad de Lección inaugural 2007 14 9/1/07 13:36 Página 14 PERE BRUNET CROSA los algoritmos en base a los recursos requeridos en tiempo y espacio, los trabajos de Post en 1944 y de Grzegorczyk en 1953 así como los de Hartmanis, Stearns, Rabin, Cobham y Edmonds en 1964 (ver por ejemplo Garey y Johnson, 1979), permitieron clasificar los problemas decidibles en la clase P de los problemas que pueden ser resueltos en tiempo polinómico mediante algoritmos deterministas, y en la clase NP de aquellos problemas que, en tiempo polinómico y con máquinas deterministas, únicamente podemos verificar soluciones concretas. Trabajos posteriores de diversos autores han permitido identificar numerosos problemas tipo pertenecientes a la clase de los NP-completos, mientras que otros investigadores han seguido la línea iniciada por Knuth en 1973 con su memorable obra (Knuth, 1973) que continúa siendo un referente y que establece los fundamentos de la complejidad concreta al comparar la eficiencia de algoritmos alternativos en la solución de un mismo problema. Los algoritmos procesan y trabajan con subconjuntos seleccionados de datos. Los algoritmos son nuestras herramientas, que modifican y moldean las representaciones digitales, los datos, para ofrecer los resultados esperados a los usuarios finales. Estos datos representan una abstracción de la realidad en el sentido de que ignoran aquellas propiedades y características específicas de los objetos reales que son irrelevantes en el contexto del problema que estamos tratando. La abstracción en las representaciones es también por lo tanto una simplificación de la realidad. Históricamente, los primeros algoritmos se concentraban en la solución de problemas algebraicos y por lo tanto solo precisaban de la representación digital de los números, enteros y reales. Una vez más fue lady Ada Augusta (Lovelace, 1843) quien hizo notar que la aplicación de la máquina analítica de Charles Babbage a aplicaciones en el campo de la música requería una representación numérica de las notas musicales. Hace veinticinco años, en 1981, los diseñadores del lenguaje de programación Ada quisieron de este modo rendir homenaje a la condesa de Lovelace. Así como el diseño de algoritmos para la manipulación de notas musicales requiere su adecuada representación digital, el desarrollo de algoritmos para el procesado de la geometría debe sustentarse en representaciones geométricas que han de encajar con los mismos. En este caso sin embargo, la complejidad de las formas a representar se traduce en importantes retos en el proceso de diseño de los algoritmos y estructuras de datos correspondientes. Si analizamos nuestros dos ejemplos iniciales observaremos Lección inaugural 2007 9/1/07 13:36 Página 15 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 15 que, en general, los objetos y sistemas que debemos modelar y representar tanto en medicina como en las aplicaciones de patrimonio cultural deben estar delimitados por superficies cerradas y orientables que deben separar su interior del espacio exterior. Nuestras representaciones abstractas deben modelar objetos libres de errores geométricos tales como grietas, agujeros o auto-intersecciones. La formalización teórica de estos requerimientos condujo a la definición de los modelos de sólidos (Mantyla, 1988) cuyas propiedades fueron concretadas y formalizadas por Requicha (1980). Según la definición de Requicha, los modelos de sólidos representan objetos cerrados, finitos, regulares y con superficie o frontera orientable. Gran parte de los trabajos de nuestro grupo en los últimos años se han centrado en la creación, reparación, operación, representación y visualización interactiva de escenas formadas por modelos de sólidos. Volvamos a algunas de las preguntas que nos planteábamos al inicio. ¿Cómo podemos pasar de los datos que adquirimos mediante escáner láser o TAC a los modelos geométricos que necesitaremos en las aplicaciones de visualización e inspección interactiva?, ¿qué tipo de modelos nos van a permitir la visualización selectiva de tejidos y órganos en las aplicaciones de diagnóstico médico?, ¿qué tipo de modelos nos facilitan el entrenamiento no invasivo sobre el paciente real? Evidentemente, estas preguntas son demasiado ambiguas, y difícilmente podrán conducir por sí solas a la especificación de los algoritmos necesarios para la inspección interactiva de los datos. Es necesario disponer de sistemas que permitan la inspección de los modelos mediante su visualización interactiva sin que aparezcan errores geométricos (grietas, solapes, roturas en el modelo) y que permitan conocer el volumen u otras propiedades integrales del objeto inspeccionado. En términos de representaciones, estas necesidades nos obligan a trabajar con modelos válidos de sólidos. Por otra parte, uno de los elementos básicos en los requerimientos de los usuarios finales es el poder efectuar una inspección interactiva de los modelos. Nuestros sistemas informáticos han de permitir esta interacción, y al conseguirlo se sitúan en un plano esencialmente distinto al de las representaciones clásicas (dibujo, pintura, fotografía e incluso cine y vídeo). En cualquiera de estas representaciones, sea el dibujo o el vídeo, existe una intencionalidad por parte del autor. El autor nos transmite lo que desea, a través de su perspectiva. El encuadre en una fotografía o el guión en una película nos transportan a su perspectiva. Vemos lo que el autor ha decidido que veamos. Lección inaugural 2007 16 9/1/07 13:36 Página 16 PERE BRUNET CROSA Figura 6. Percepción de presencia ante la realidad (izquierda) y a través de representaciones digitales de la misma (derecha). Nuestros sistemas de representación digital de la geometría sitúan por el contrario al usuario final en el centro del escenario, haciendo desaparecer la intencionalidad del autor. El espectador ve lo que desea a través de una perspectiva, la suya, que puede cambiar a su antojo. El usuario, como lector de las representaciones, deberá tener la libertad para poder descubrir detalles, enfoques y puntos de vista inéditos y evidentemente impensados por el autor. El autor pasa a ser transparente, a desaparecer dentro de la obra, que en este caso es el modelo tridimensional. Todo ello se hace patente en el diagrama de la Figura 6. Nuestra realidad exterior contiene multitud de objetos de muy diversas formas y apariencias. Nuestro sistema sensorial nos permite adquirir parte de esta información, y su posterior procesado en el córtex cerebral nos genera la sensación de presencia y posibilita nuestra interacción con el entorno. Nos sentimos presentes en el entorno que nos rodea. La importancia de los sistemas informáticos radica en que las representaciones y los modelos digitales de los objetos que nos rodean pueden ser utilizados como elementos intermedios entre la realidad física y los usuarios finales.Tras crear las representaciones a partir de la realidad mediante el llamado proceso de captación (Figura 6), podremos utilizar estas representaciones digitales (modelos tridimensionales de sólidos) para generar sensación de presencia en un entorno virtual a través de los llamados sistemas de interacción inmersiva. El usuario final debería poder inspeccionar interactivamente los objetos de su entorno virtual con la misma perspectiva, libertad de acción y calidad perceptiva con las que antes inspeccionaba los objetos reales de su entorno. Siguiendo con el análisis de las representaciones digitales, volvamos a nuestros dos problemas y a las preguntas que nos planteábamos. Nues- Lección inaugural 2007 9/1/07 13:36 Página 17 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 17 tra primera pregunta nos conduce inevitablemente al llamado “problema del modelado” (Lastra, 2006). ¿Cómo podemos procesar la información de entrada (puntos generados por un escáner láser, o conjuntos de imágenes) y generar los modelos válidos de sólidos que deseamos en nuestro caso? Nos encontramos ante un macro problema actualmente abierto, apasionante y polifacético, que incluye problemas tan variados como el de la reconstrucción de los modelos, el de su reparación, el de la segmentación o el de la optimización de las características topológicas. Hablaremos de algunos de ellos en los próximos párrafos. Pensemos en primer lugar cómo podemos representar los modelos de sólidos. Desde los trabajos de Requicha en 1980, una buena parte de los algoritmos geométricos de primera generación se basaban en representaciones continuas de fronteras, en las que las diversas partes (caras o, en nuestra terminología, pedazos) de la superficie del objeto se representaban en forma de superficies paramétricas o algebraicas. Estas representaciones heredaban el concepto matemático / geométrico de la precisión infinita de las funciones reales continuas. Pero el mundo que nos rodea, incluso las leyes de la física moderna, nos hablan más de lo discreto que de lo continuo.Y en nuestro caso, debemos tener además en cuenta las condiciones de contorno. En el núcleo de nuestras representaciones geométricas tenemos información numérica (valores enteros y reales) que acabaremos codificando de forma discreta en los octetos de la memoria de nuestro ordenador. Por otra parte, las visualizaciones que generaremos con los modelos digitales no deberían ser más precisas que el sistema físico de visualización (limitado por su resolución en píxeles), que nuestro sistema de recepción óptica (limitado por la resolución de los conos y bastones en nuestra retina) o que nuestro sistema perceptivo. En este contexto, nuestra contribución al problema del modelado ha consistido en gran parte en investigar algoritmos basados en representaciones discretas de los sólidos (Brunet y Navazo, 1990). En este caso, los modelos geométricos se basan en información numérica discreta (valores enteros) localizada a su vez en un conjunto de posiciones discretas del espacio, que debe adaptarse dinámicamente a la resolución (píxeles) del sistema físico de visualización para garantizar que continuamos generando visualizaciones gráficas de la más alta calidad y con la mayor eficiencia posible. Una de las propiedades interesantes de los modelos geométricos discretos consiste en que el error geométrico de representación está acotado y se mantiene acotado durante el procesado de la geometría, mientras que en los modelos tradicionales, la representación de los valores numéricos reales en un núme- Lección inaugural 2007 18 9/1/07 13:36 Página 18 PERE BRUNET CROSA Figura 7. Zonas sin información en el proceso de captación de modelos 3d. Proyecto ViHAP 3d, www.vihap3d.org. ro finito de octetos genera errores acumulativos que en muchos casos llegan a generar resultados geométricamente inválidos, tal como observaron Hoffmann y Karasick (Hoffmann, 1988) en un test tan simple como el de la recurrencia O(k+1) = Intersección (O(k), Ga(C) ) donde O(1)=C y Ga(C) es un giro aleatorio del cubo inicial C. Si estudiamos con más detalle el problema de la reconstrucción (y de la reparación) de modelos, observaremos que se trata de un problema mal especificado. La información de partida, conjuntos de puntos en el proceso de adquisición de modelos de edificios u obras de arte con escáner láser o bien imágenes digitales en los sistemas de adquisición de modelos médicos mediante TAC o MRI, es discreta, incompleta e incorpora ruido (Figura 7). Se trata de un problema con datos muestreados, esencialmente e irremediablemente ambiguo como se desprende del teorema de Shanon. El resultado no está unívocamente determinado. Estamos, en otras palabras, ante la imposibilidad de generar geometría continua a partir de información discreta. Las soluciones, necesariamente basadas en la inferencia, son múltiples. El problema de la reconstrucción se basa en la generación del grafo planar de conectividad del modelo geométrico final, que es un problema combinatorio, no tratable con los volúmenes de datos que nos llegan. Además de ello, en muchos casos el propio usuario no conoce el objetivo a alcanzar en cuanto a propiedades geométricas y topológicas del modelo final, y por tanto se desconoce el criterio de optimización. ¿Se desea una superficie con pocas o con muchas componentes conexas? ¿La superficie debe interpolar los datos (puntos) de entrada o solamente aproximarlos? ¿Es mejor obtener una superficie paramétrica a trozos, una superficie implícita o una malla de triángulos? En la mayoría de aplicaciones es imposible partir de una especificación formal de la solución deseada y del problema. Pero incluso en el caso que la Lección inaugural 2007 9/1/07 13:36 Página 19 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 19 Figura 8. Reconstrucción y reparación de modelos geométricos de estatuas mediante modelos volumétricos. Banda discreta, detalle de la misma y modelo final. tuviésemos, la complejidad del subproblema de optimización global asociado a nuestro problema hace que éste sea intratable. Es como buscar agujas en pajares. En la línea de Leif y Hornung (Hornung, 2006), que utilizan algoritmos jerárquicos multi-malla basados en el cálculo de funciones distancia discretas, nuestro grupo ha estando estudiando (Esteve, 2005) algoritmos que trabajan en el espacio discreto y que generan soluciones aproximadas. Nuestro objetivo ha sido el de desarrollar algoritmos subóptimos que en una primera fase generan bandas discretas (conjuntos 6-conectados de micro cubos o “vóxeles”) que aproximan con error acotado a priori y baja complejidad computacional y que se acercan a las soluciones óptimas aceptables para el usuario final. Nuestros algoritmos de generación de bandas discretas con posterior suavizado y optimización de la topología se han utilizado con éxito, entre otras aplicaciones, en el marco de proyectos para la reconstrucción de modelos de obras de arte en el campo de la conservación del patrimonio cultural (Figuras 8 y 9). Figura 9. Reconstrucción, reparación e inspección de modelos geométricos de estatuas mediante modelos volumétricos. Reparación de una columna del conjunto funerario de Arrigo VII, Pisa. Inspección, en el sistema Cave de Realidad Virtual, de una de sus estatuas. Proyecto ViHAP 3d, www.vihap3d.org. Lección inaugural 2007 20 9/1/07 13:36 Página 20 PERE BRUNET CROSA Figura 10. Zonas de indeterminación de la topología en los datos de un cráneo (a). Reconstrucciones del mismo con un mínimo de componentes conexas (b) y con el mínimo de túneles (c). Debemos observar, sin embargo, que una vez obtenida la banda discreta a partir de los datos de partida, es preciso pasar a la segunda fase del algoritmo y obtener la superficie final, cerrada y restringida en el interior de la banda. Puede demostrarse que el problema de la reconstrucción de la superficie final a partir de bandas discretas (ver de nuevo la Figura 8) es nuevamente un problema mal especificado. Dejando aparte los posibles problemas de inconsistencias que aparecen en algunos algoritmos, es fácil observar que la topología de la superficie final no es única. El problema tiene múltiples soluciones con diferentes topologías. En este caso, nuestros trabajos han permitido desarrollar algoritmos (Andújar, 2005) que optimizan estas características topológicas y que por tanto adaptan la forma final de la superficie (Figura 10) a los requerimientos específicos de los usuarios. Es conveniente observar, sin embargo, que el problema de la reconstrucción y reparación de modelos geométricos es un problema todavía abierto que es y será objeto de investigación en los próximos años. 3 . L a g e s t i ó n d e l a co m p l e j i d ad ge o m é t r i ca : s o br e a gu j a s y p a j a r e s En todo caso, la reconstrucción de modelos geométricos es sólo la antesala de los problemas algorítmicos que se derivan de las necesidades de inspección interactiva de los mismos. Los intereses de los médicos (en el diagnóstico clínico) y de los restauradores (en el estudio de las obras de arte) no están muy alejados. Los nuevos sistemas para el diagnóstico no invasivo en medicina deben ofrecer herramientas para la detección y localización (con fiabilidad y eficiencia) de defectos, tumores o malformaciones. Asimismo, y como ya hemos mencionado, es preciso detectar e identificar los defectos, a Lección inaugural 2007 9/1/07 13:36 Página 21 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 21 menudo minúsculos, que requerirán posterior reparación o intervención en las obras de arte. En ambos casos, el interés del usuario final es la inspección interactiva: el usuario desea poder navegar con la máxima flexibilidad, con la libertad de un pájaro que además pudiera ir cambiando de tamaño para entrar e inspeccionar todos los rincones del modelo. Así como el médico podrá detectar, estudiar y comprender las malformaciones patológicas, los visitantes de los museos en un futuro próximo podrán comprender mucho mejor las formas de las obras de arte, percibiéndolas con la vista y con el tacto y observándolas desde perspectivas muchas veces imposibles (véase una vez más la Figura 4). Finalmente, y con la salvedad de la diferencia entre las dos escalas de tiempo, las herramientas de visualización de modelos digitales nos han de permitir, en ambos casos, la inspección espacio-temporal. El médico querría poder saltar en el tiempo, durante el proceso de inspección, examinando diversos estadios en el desarrollo de la enfermedad, de forma similar al visitante de un museo virtual que desearía poder trasladarse temporalmente a las distintas épocas para visualizar y así entender los procesos históricos de construcción y destrucción de un mismo entorno por parte de las sucesivas culturas y civilizaciones. Lo que aparece detrás de todos estos requerimientos de inspección interactiva es la importancia y la necesidad de los algoritmos de búsqueda. La navegación nos obliga a estar constantemente buscando y seleccionando (recortando) información. Hay que buscar la información relevante del modelo que aparece en la zona que estamos observando, con la suficiente calidad visual y en tiempo real. Hay que seleccionarla, recortando el resto para no visualizarlo. En función de los requerimientos de la interacción, es posible que pasemos en escasos segundos de una situación en que estamos analizando un rincón de la escena y visualizando por tanto una fracción ínfima de los datos del modelo a un estado en que el usuario desea ver una perspectiva global y en el que por tanto deberemos seleccionar la práctica totalidad de la información del modelo geométrico. Pero además, esta necesidad de búsqueda interactiva restringida a una región se complementa con la necesidad de la búsqueda asociativa cuando lo que deseamos es la detección y localización automática, sin inspección por parte del usuario, de determinadas características, defectos o malformaciones. No hay nada sorprendente en el hecho de que, detrás de las necesidades de los usuarios y de las aplicaciones, nos encontremos con una especificación del problema que requiere algoritmos de búsqueda. Lo encontramos no sólo en medicina y patrimonio cultural, sino también en Lección inaugural 2007 22 9/1/07 13:36 Página 22 PERE BRUNET CROSA campos tan diversos como pueden ser el procesado de textos, los sistemas de información geográfica, la astronomía o la biología computacional. De hecho, la informática es, en gran parte, ordenación y búsqueda. Pero la búsqueda asociativa, por características, es especialmente problemática. Como diría Knuth6, el ordenador nos supera en muchos aspectos, pero nuestro cerebro le supera en los recuerdos asociativos, como por ejemplo las evocaciones. La búsqueda asociativa es habitualmente parcial (queremos buscar objetos de los que sólo conocemos parcialmente algunas características determinadas) y por tanto mal especificada. Los actuales buscadores están empezando a dar soluciones eficientes para el problema de la búsqueda asociativa, pero sólo en información textual. Uno de los retos actuales en los sistemas de inspección interactiva es la búsqueda asociativa por características geométricas, ya sea para la localización automática de determinadas formaciones anatómicas o para la localización de objetos y obras de arte similares a una obra concreta.Y una vez más el problema aparece ya en la especificación: ¿cuál es la mejor métrica para medir similaridades? ¿qué características debemos comparar para determinar si dos objetos concretos son similares? Aparte de la dificultad intrínseca de los algoritmos de búsqueda, en las aplicaciones que estamos analizando o en otras similares (como podría ser, por ejemplo, la inspección interactiva del territorio) nos enfrentamos a tres dificultades añadidas, directamente asociadas a los datos de entrada, a los elementos de salida y a la máquina procesadora. El tamaño de los datos de entrada es enorme, como veremos a continuación, mientras que los requerimientos de salida son muy estrictos. El sistema debe generar visualizaciones de alta calidad visual (tales que nuestro sistema perceptivo las considere perfectas), con percepción suave de la dinámica y de los movimientos y con adaptación continua en tiempo real a las órdenes de navegación del usuario, todo ello en pantallas y elementos de visualización comerciales.Y la aplicación debe poder funcionar en ordenadores comerciales de gama media/alta y, en resumen, debe ser transparente. Las órdenes indicadas mediante el sistema de interacción (ratón o similar) deben generar los movimientos adecuados en la navegación con total transparencia por parte de los algoritmos intermedios. Este es el reto fundamental en el diseño de algoritmos de procesado geométricos. Es la paradoja de la complejidad al Donald E. Knuth “The Art of Computer Programming”. Second Edition,Volume 3: Sorting and Searching, 1999: “It is interesting to note that the human brain is much better at secondary key retrieval than computers are; in fact, people find it rather easy to recognize faces or melodies from only fragmentary information, while computers have barely been able to do this at all.Therefore it is not unlikely that a completely new approach to machine design will someday be discovered that solves the problem of secondary key retrieval once and for all…” 6 Lección inaugural 2007 9/1/07 13:36 Página 23 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 23 servicio de la transparencia y de la simplicidad de uso, con el objetivo último de resolver grandes problemas en tiempo real y en máquinas de sobremesa.Y la solución pasa por la optimización de los algoritmos geométricos y de sus correspondientes estructuras de datos. Analicemos brevemente la complejidad de los datos en algunas aplicaciones. Aunque el objetivo a corto plazo en las aplicaciones en medicina sea el de trabajar interactivamente con el modelo anatómico del propio paciente, la mayoría de aplicaciones actuales relacionadas con la planificación y simulación utilizan los datos del modelo “Visible Human” (Visible Human, 1986). El modelo original está formado por un total de 1800 imágenes digitales de cortes paralelos, cada una de ellas de una resolución de 512 x 512 píxeles, que representan tanto la clase de tejido como su color. Es fácil deducir que el total de datos del tipo (clase, color) de todo el modelo es del orden de 1,7 x 228. Los cinco octetos que requieren cada uno de estos datos se traducen en un tamaño, para el modelo completo no comprimido, de 2.17 Giga octetos. La dificultad del problema se hace evidente cuando se nos pide poder inspeccionar interactivamente este modelo en ordenadores de sobremesa y generar un mínimo de 25 imágenes por segundo para conseguir una percepción de navegación suave. Pero en todo caso, el problema no es muy distinto y puede llegar a ser mucho más complejo en otras aplicaciones: pensemos en la posibilidad de poder navegar interactivamente por el territorio de nuestro país. Si consideramos por un momento resuelto el problema de adquirir los datos y construir el modelo, podríamos incluso plantearnos si podemos resolver en el mundo virtual de nuestras máquinas la paradoja de la representación a escala 1:1 del mapa de Jorge Luis Borges7. En este caso, plantearnos la representación del territorio con una precisión de un milímetro supondría un volumen de datos del orden de 256, sólo almacenable de forma distribuida y comprimida en decenas de miles de discos de 100 Giga octetos de capacidad. No nos cabe ahora ninguna duda de que este problema es intratable con algoritmos directos. Pero si estructuramos jerárquicamente la información y utilizamos sistemas de compresión asociados a nuestros mecanismos perceptivos podemos llegar a desarrollar algoritmos específicos para la búsqueda, selección y visualización en tiempo real de estos modelos en Jorge Luis Borges, “El hacedor”, Alianza Editorial, 1972: “En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el mapa de una sola Provincia ocupaba toda una Ciudad, y el mapa del imperio, toda una Provincia. Con el tiempo, esos Mapas Desmesurados no satisfacieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el tamaño del Imperio y coincidía puntualmente con él. Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y de los Inviernos. En los desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas”. 7 Lección inaugural 2007 24 9/1/07 13:36 Página 24 PERE BRUNET CROSA Figura 11. Ejemplo de inspección interactiva de modelos geométricos gigantescos. Inspección multinivel del terreno. Visión global y zoom hacia la isla de Hierro. Cortesía de Geo Virtual (Geo Virtual, 2006). Lección inaugural 2007 9/1/07 13:36 Página 25 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 25 simples ordenadores de sobremesa conectados en red. ¡Con todo ello, la paradoja de Borges es ya casi una realidad! La Figura 11 muestra algunos resultados en este último campo de la inspección interactiva del territorio, en el marco de uno de los actuales proyectos Universidad-empresa en que trabaja nuestro grupo. En los problemas de inspección interactiva tenemos que buscar y seleccionar nuestros datos, como agujas en inmensos pajares, un mínimo de 25 veces por segundo y estando a la merced de las órdenes imprevisibles de los usuarios finales, que nos llegarán a través de los sistemas de interacción. Las soluciones algorítmicas son imprescindibles: aunque sabemos que las prestaciones del hardware están aumentando de forma exponencial, el tamaño de los modelos a inspeccionar y los requerimientos por parte de los usuarios finales están creciendo a un ritmo todavía mayor, como hemos visto por ejemplo en el caso de la inspección del territorio. Los algoritmos actuales se basan en las estructuras de datos jerárquicas, los llamados árboles, para establecer los puentes que han de salvar el abismo existente entre el volumen de los modelos y las posibilidades de los aceleradores gráficos. Ya en 1974, Nievergelt (Nievergelt, 1974) estudió las propiedades matemáticas de los árboles binarios de búsqueda, que más adelante dieron lugar, para el caso concreto de los modelos geométricos, a los árboles K-d ( “Kd-trees”, Bentley, 1975) y a los árboles de partición binaria del espacio (árboles BSP, Fuchs, 1980). El estudio de los árboles de partición no binaria dio lugar a la propuesta de árboles cuaternarios y octales (“quadtrees” y “octrees”, Samet, 1994). Es conocido que la estructuración jerárquica de la información en árboles balanceados permite que el tiempo de búsqueda sea logarítmico. Por otra parte, la cantidad adicional de información necesaria para la gestión de la estructura en árbol es baja, y por ejemplo en el caso de los árboles octales puede demostrase que es sólo del orden de un 14 %. En este contexto, en nuestro grupo hemos estado trabajando los últimos veinte años en el estudio de nuevos algoritmos y estructuras de datos jerárquicas para la representación y procesado de grandes modelos geométricos, tratando de entender y descubrir las perspectivas que nos ofrecen tanto su inherente ordenación y estructuración espacial como su complejidad logarítmica. El problema en este caso tiene componentes de búsqueda (véase por ejemplo Andujar, Vázquez y Fairén, 2004), así como de optimización con restricciones. Para cada una de las imágenes que vamos generando deberemos seleccionar y buscar la información gráfica pertinente y luego Lección inaugural 2007 26 9/1/07 13:36 Página 26 PERE BRUNET CROSA visualizarla con la máxima calidad visual posible, teniendo en cuenta que el tiempo total de búsqueda, selección y visualización es limitado y no podrá superar las tres centésimas de segundo si finalmente queremos mantener una frecuencia mínima de 33 imágenes por segundo. La solución debe incluir determinadas heurísticas para la medición de la calidad visual que percibiremos (una referencia básica en este sentido es Funkhouser, 1993) ya que no tendría ningún sentido generar más calidad que la que podemos percibir. Una idea esencial consiste en incluir información complementaria en los niveles intermedios del árbol octal para reducir el tiempo de proceso durante la navegación. Esta información, calculada en tiempo de preproceso, incluye sub-modelos simplificados (Andújar, 2002) y puede incluir información sobre visibilidad y oclusiones. Los árboles octales multiresolución que estamos utilizando en la actualidad están basados en memoria externa y sus algoritmos de recorrido ajustan en tiempo real la profundidad del recorrido en cada subárbol en función del punto de vista y de la importancia visual de la información en los nodos. La utilización de algoritmos perezosos, que explotan la coherencia respecto a la imagen anterior, junto con técnicas de compresión de la información geométrica en los nodos especialmente adaptadas a las capacidades de proceso de las actuales placas gráficas nos ha permitido diseñar sistemas de navegación con prestaciones adecuadas para aplicaciones en medicina, inspección del terreno y patrimonio cultural. Otro campo de gran actualidad y que requiere algoritmos específicos para gestionar la complejidad geométrica es el de la identificación de características. La detección de determinados tipos de características en los modelos tiene interés tanto en los problemas de búsqueda asociativa (por ejemplo, para la localización automática de objetos o de determinadas formaciones anatómicas) como en la inspección de entornos complejos con gran cantidad de objetos. Nuestra contribución reciente se ha centrado en la detección de características tales como zonas planas y aristas. La identificación de las N zonas planas de mayor extensión de un objeto con una tolerancia prefijada tiene aplicación inmediata en la simplificación extrema de objetos de baja importancia visual en entornos muy complejos o bien para el cálculo de signaturas que nos ayudarán a su clasificación. Es fácil observar que el planteo directo de este problema entraña una gran complejidad algorítmica. Nuestra propuesta para reducir la dificultad del problema se ha basado en una formulación discreta del problema y en el uso de diccionarios (Peterson, 1957) accesibles a través de funciones de dispersión o “hash” que permiten diseñar algoritmos de votación con complejidad lineal sobre parame- Lección inaugural 2007 9/1/07 13:36 Página 27 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 27 Figura 12. En a y c, modelos originales con 37 Kpolígonos y 50 Kpolígonos respectivamente. En b, representación simplificada (utilizando únicamente los 14 planos indicados en la primera imagen) del modelo mostrado en a. En d, representación con 97 planos del modelo “Laurana” mostrado en c. trizaciones discretas y jerárquicas de planos (Andújar, 2004). El resultado (Figura 12) nos llega en forma de representaciones extremadamente simplificadas y compactas, especialmente útiles para la visualización de objetos lejanos al observador. En el caso de la detección de aristas, hemos experimentado con éxito los algoritmos basados en visibilidad dentro de una malla discreta. En todo caso, el problema de la identificación de características y signaturas en modelos geométricos es nuevamente un problema actualmente abierto con numerosas líneas de trabajo. 4 . I n t e r ac ci ó n , i n m e r s ió n y p r e s e n c ia Hablábamos antes de las necesidades de inspección libre e interactiva del modelo. Hemos analizado las dificultades asociadas tanto a la propia generación de los modelos geométricos como a su procesado para la navegación e inspección interactiva. Sin embargo, en muchos casos, los requerimientos de los usuarios van más allá de la visualización en pantallas planas.Tanto los sistemas para la formación, entrenamiento y simulación en medicina y cirugía como las aplicaciones para el estudio y comprensión de las formas en patrimonio cultural y muchas otras aplicaciones podrían y deberían aprovechar la capacidad tridimensional de nuestro sistema perceptivo.Tal como mencionábamos antes (ver nuevamente la Figura 6), el usuario final debería poder inspeccionar interactivamente los objetos de su entorno virtual con la misma perspectiva, libertad de acción y calidad perceptiva con las que inspecciona los objetos reales de su entorno. Lección inaugural 2007 28 9/1/07 13:36 Página 28 PERE BRUNET CROSA La tecnología actual está dando una nueva respuesta a estas necesidades: los sistemas inmersivos, también llamados sistemas de realidad virtual. El objetivo en estos nuevos sistemas de inspección de modelos y entornos virtuales es que generen percepción de presencia en el usuario, en base a la utilización de técnicas de inmersión y de interacción transparente. Según John Berger (op. cit.), la pintura trata de introducirnos en la escena pintada. El objetivo de la realidad virtual es análogo, con la única diferencia de que ahora trata de introducirnos en la escena representada digitalmente, para acercarnos de algún modo a la visión de Ivan Sutherland8 cuando ya en 1965 hablaba de programas y sistemas de visualización que pudiesen recrear elementos del país de las maravillas de Alicia. Los sistemas inmersivos de realidad virtual incluyen los componentes ya comentados que han de permitir la navegación e inspección de las escenas, pero los complementan con elementos para la inmersión y para la interacción directa. Los algoritmos optimizados para la construcción e inspección de modelos nos abren el camino hacia el estudio, percepción y comprensión de lo invisible, de lo imposible, de lo lejano o de lo que nos es temporalmente distante, ofreciéndonos la posibilidad de visualizar y entender estructuras microscópicas, entornos y paisajes del pasado o diversas hipótesis en cuanto a la planificación del futuro. Las técnicas inmersivas, por su parte, conectan y dirigen nuestros sentidos (fundamentalmente la vista y algunas veces el tacto) hacia los objetos y personajes del entorno virtual con el fin de introducirnos en la escena, inducirnos su percepción tridimensional, crearnos la sensación de presencia y potenciar nuestra comprensión del entorno. Dado que nuestra percepción de la realidad es tridimensional, los sistemas inmersivos trascienden las actuales representaciones visuales planas y nos ofrecen una percepción también tridimensional de la representación digital del entorno. Pero los sistemas de realidad virtual deben además incluir componentes específicos para la interacción directa o transparente. Este es un aspecto esencial en los nuevos sistemas, que encaja y se complementa con los elementos de inmersión y de navegación interactiva. La historia de los sistemas de interacción y de las interfaces de usuario se han desarrolla8 Ivan E. Sutherland, “The Ultimate Display”, Proceedings of IFIP Congress, pp. 506-508, 1965.: “The ultimate display would, of course, be a room within which the computer can control the existence of matter. A chair displayed in such a room would be good enough to sit in. Handcuffs displayed in such a room would be confining, and a bullet displayed in such room would be fatal. With appropriate programming such a display could literally be the Wonderland into which Alice walked.” Lección inaugural 2007 9/1/07 13:36 Página 29 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 29 do en paralelo a la evolución del hardware, de los algoritmos y de la ingeniería del software. La historia es breve, como todo en la informática. Pero los avances han sido indiscutibles, con dos grandes saltos cualitativos. El primero de ellos, bien presente en nuestra memoria, se produjo durante la década de los ochenta. La investigación en Xerox y luego en Apple nos transportó de la interacción basada en el teclado y en el uso de comandos (sistema MS-DOS, entre otros) a los sistemas de interacción basados en el uso del ratón y en el de las ventanas, iconos y menús. La aparición simultánea de estas interfaces, conocidas por el acrónimo WIMP, junto con los ordenadores personales, supuso el fin de la etapa minoritaria y mágica de la informática y el inicio de su utilización masiva. La interacción dejaba atrás el lenguaje altamente técnico de los sistemas operativos y se acercaba a la intuición humana se alejaba de la máquina para acercarse al usuario final. Todos hemos sido testigos de la importancia y de la trascendencia que, durante estas últimas dos décadas, ha tenido la utilización masiva de los nuevos paradigmas intuitivos de interacción. Pero en estos momentos, con los nuevos paradigmas de la realidad virtual estamos siendo testigos del segundo cambio cualitativo, que nos ha de conducir de los sistemas intuitivos de interacción a los sistemas transparentes con interacción directa. Con este segundo cambio nos adentramos en el camino que empezó con interfaces muy cercanas a las máquinas y que nos irá aproximando a los usuarios finales. En el campo de la realidad virtual hablamos de interacción directa porque el objetivo es la interacción natural de los usuarios con los objetos virtuales que están inspeccionando, en base a los mismos gestos que utilizarían para la inspección del objeto real. La interfaz tiene que ser invisible a los ojos del usuario, tanto ésta como el ordenador deben ser, una vez más, transparentes. Las latencias, los retrasos computacionales entre un determinado gesto del usuario y el efecto final que se produce en la visualización del modelo, son inevitables pero deberán ser muy bajos, del orden de centésimas de segundo, para que sean imperceptibles por nuestro sistema sensorial y no destruyan el efecto de interacción directa con los objetos virtuales. El cambio de filosofía en los paradigmas de interacción es radical. El ratón de nuestras actuales interfaces se convierte en los dispositivos sensores que deberán detectar nuestros gestos, y las órdenes que ahora damos al sistema mediante el ratón o el teclado se transforman en el reconocimiento de nuestros gestos y movimientos por parte del ordenador. El sistema de realidad virtual no espera instrucciones durante la inspección interactiva de los objetos en el entorno virtual. Detecta nuestros movimientos, los interpreta y acto seguido Lección inaugural 2007 30 9/1/07 13:36 Página 30 PERE BRUNET CROSA Figura 13. Sistemas de VR: interacción directa con la escena. pasa a ejecutar en tiempo real las acciones correspondientes a nuestras intenciones. La ingeniería podría definirse, según nos diría Javier Aracil9, como el arte de crear artificios para resolver problemas. En nuestro caso, los sistemas de realidad virtual son artificios heterogéneos que deben integrar el ordenaFigura 14. Interacción en el sistema dor con el software para la simulación inte“Cave” de realidad virtual con interfaces avanzadas de control de la aplicación. ractiva, los efectores para generar las representaciones inmersivas y los sensores necesarios para la interacción directa. Los requerimientos se plantean habitualmente en términos de precisión, calidad inmersiva, bajas latencias, ergonomía, simplicidad y portabilidad de los sistemas. En este contexto, las aportaciones de nuestro grupo se han centrado en el estudio y propuesta de nuevos sistemas de realidad virtual para la interacción e inspección inmersiva, utilizando componentes comerciales de bajo coste. Los sistemas inmersivos basados en ordenadores personales y estéreo pasivo (Figura 13), sean fijos o portátiles (Fairén, 2004), pueden ser de utilidad para aplicaciones en campos tan diversos como el diseño cooperativo de grandes buques, la medicina, el estudio del patrimonio cultural, la inspección inmersiva del territorio, la adaptación de gafas progresivas o el tratamiento de fobias. Lo mismo podemos decir respecto a los nuevos paradigmas para la interacción durante el control de la aplicación en entornos fuertemente inmersivos como el sistema Cave (Figura 14, Andujar, 2006). 9 Javier Aracil, “¿Es la ingeniería meramente ciencia aplicada?”, en “Ingeniería y pensamiento”, Ed. Fundación El Monte, Sevilla, 2006, pág. 146. Lección inaugural 2007 9/1/07 13:36 Página 31 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 31 Figura 15. Búsqueda por características en la planificación no invasiva en medicina: regiones óptimas para una resección parcial del hígado. Proyecto conjunto con el Hospital del Valle de Hebrón (Barcelona). En todo caso, y como ya hemos comentado, la realidad virtual es fundamentalmente un nuevo paradigma de interacción, directo e inmersivo. Como en todo nuevo sistema, como en todo nuevo artificio de la ingeniería, su importancia social se mide en términos de interés, de beneficio y de utilidad para los usuarios y para las aplicaciones finales. Todo ello puede medirse con métodos estadísticos y en base a experimentos con usuarios finales. El objetivo es llegar a conocer el llamado grado de usabilidad del nuevo sistema. Uno de los factores clave que determinan la usabilidad de un sistema de realidad virtual es el grado de presencia que induce en sus usuarios. Volviendo una vez más a la Figura 6, el interés final de la representación digital de las formas y del procesado de su geometría, es el de poder reproducir la sensación de presencia que tenemos cuando nos encontramos frente a los objetos reales. Entendemos que un sistema inmersivo de realidad virtual es usable y genera una adecuada sensación de presencia cuando induce reacciones en los usuarios que son similares a las que experimentarían en la realidad. El profesor Mel Slater, recientemente incorporado a nuestro grupo, ha estado estudiando y midiendo la percepción de presencia en los sistemas de realidad virtual y en los entornos virtuales. Las métricas de presencia se basan en medidas fisiológicas objetivas, tales como los cambios en los ritmos cardiaco y respiratorio y en la conductividad de la piel de los participantes en los experimentos, así como en la opinión posterior de los mismos expresada a través de cuestionarios y tratada estadísticamente. Una de las conclusiones es que los sistemas actuales de realidad virtual ya pueden producir cotas elevadas de presencia, Lección inaugural 2007 32 9/1/07 13:36 Página 32 PERE BRUNET CROSA Figura 16. Presencia en entornos virtuales. Comunicación con avatares en escenas virtuales con audiencias positivas o negativas. Cortesía de Mel Slater. como podemos ver en la Figura 16 (Sanchez-Vives y Slater, 2005), en la que aparecen dos grupos formados por personajes virtuales o avatares, manifiestamente no realistas pero con comportamientos caricaturizados a partir de situaciones reales. Los resultados del experimento, consistente en que los participantes deben impartir una breve charla a la audiencia virtual, muestra un elevado grado de presencia tanto si los avatares mantienen una actitud positiva como si su actitud es pasiva o negativa: Los participantes que han impartido su charla a la audiencia (a) hacen comentarios a la salida tales como “me he sentido bien porque nadie me interrumpía”, mientras que los comentarios de los participantes que han dado su charla al grupo (b) expresan que no les han podido ignorar, que han perdido el hilo del pensamiento o que han quedado bloqueados. Una vez más, vemos la importancia que tiene el poder adaptar las representaciones visuales a los mecanismos perceptivos humanos. Del mismo modo que percibimos sofisticadas policromías en nuestras pantallas de ordenador cuando en realidad sólo estamos presentando imágenes formadas con los tres colores fundamentales, podemos llegar a cotas elevadas de presencia en entornos que tengan una calidad visual perceptivamente adecuada, aunque objetivamente su calidad visual sea deficiente. En todo caso, no hay que olvidar que todavía estamos en los albores del proceso de consolidación de las técnicas de interacción inmersiva y de los sistemas de realidad virtual. Estamos en condiciones de definir y diseñar la arquitectura de los nuevos sistemas, podemos construir y analizar prototipos, todo ello mientras vamos andando el camino que nos ha de conducir a la construcción de sistemas usables. El problema actual en los sistemas de realidad virtual no es tanto la capacidad del hardware o del software, sino las prestaciones de los dispositivos de interacción. Desearíamos poder disponer de sensores más precisos y con menor latencia, así Lección inaugural 2007 9/1/07 13:36 Página 33 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 33 como de sistemas menos invasivos y más ergonómicos para la inmersión visual y táctil. Necesitamos profundizar mucho más en el conocimiento de nuestros mecanismos perceptivos para maximizar la sensación de presencia, evitando la excesiva calidad visual en aquellos aspectos o detalles que no van a ser percibidos. Pero, en todo caso, hay que reconocer que los sistemas actuales generan un nivel de presencia que ya es adecuado para su uso con éxito en múltiples campos de aplicación. 5. Epílogo El largo proceso desde la captación y construcción de los modelos hasta su procesado y visualización interactiva y hasta su manipulación con técnicas inmersivas de interacción directa tiene un claro objetivo: el de poder ofrecer herramientas intuitivas para comprender, percibir y entender mejor los objetos que nos son inaccesibles (en el espacio o en el tiempo) a través de la interacción con sus representaciones digitales. Se trata en muchos casos de problemas aparentemente sencillos pero que en realidad esconden una gran dificultad técnica. El objetivo es encontrar las representaciones y los algoritmos geométricos adecuados al problema planteado en cada caso, optimizando su eficiencia en el marco de las restricciones impuestas por los datos de entrada, las máquinas a utilizar, los sistemas de visualización o el sistema perceptivo de los usuarios finales. En este contexto, nuestras técnicas de ingeniería tienen como objetivo final la construcción de artificios imperceptibles que posibiliten la interacción directa con los objetos y la percepción de presencia en la escena virtual. La mayoría de problemas siguen abiertos, y las soluciones actuales son aproximaciones subóptimas. Debemos mejorar las prestaciones de los algoritmos de reconstrucción y reparación de modelos. Debemos diseñar nuevos y mejores algoritmos para la búsqueda asociativa basada en la forma de los objetos, y aumentar la eficiencia de los algoritmos para la inspección en tiempo real de escenas gigantes, todo ello en el marco de un hardware en constante evolución y de un universo de necesidades que los usuarios nos mantienen en continua expansión. Debemos mejorar las prestaciones de los dispositivos sensores o de los efectores de fuerza en los sistemas de realidad virtual, incrementando a su vez su portabilidad y sus propiedades ergonómicas. Los retos son numerosos y complejos, pero contamos con el vigor de la juventud de nuestra disciplina. Lección inaugural 2007 34 9/1/07 13:36 Página 34 PERE BRUNET CROSA Aparte de las ya mencionadas, ¿qué podemos decir en cuanto a las posibles aplicaciones futuras de estas herramientas que nos permiten comprender, percibir y entender mejor los objetos que nos son inaccesibles a través de la interacción con sus representaciones digitales? Como en los demás campos de la ingeniería, la intencionalidad y la responsabilidad final del uso de los artificios nos corresponde a los receptores de la tecnología. Nuestra intención está en la línea de la Declaración de Barcelona10, cuando afirma que se trata de alcanzar una sociedad más justa basada en el respeto por la naturaleza y los derechos humanos, que demanda una economía más justa con más solidaridad hacia culturas diferentes y generaciones futuras. Los sistemas de inspección interactiva e inmersiva nos pueden ayudar a pensar y a actuar con responsabilidad, como hombres cultos, para crear en vez de destruir, para conservar en vez de hipotecar. Así como los sistemas de simulación y entrenamiento en medicina basados en modelos digitales del paciente nos aportan soluciones más humanas, mínimamente invasivas y de mínimo riesgo para el propio paciente, las aplicaciones de la inmersión presencial son ilimitadas. La presencia es un camino hacia la tolerancia, hacia la comprensión de las diversidades lingüísticas, culturales y sociales (que constituyen el “genio” de Europa, citando a George Steiner11 ). Las técnicas de realidad virtual se están aplicando con éxito como sistemas de ayuda en la resolución de conflictos y en los procesos de negociación, ya que permiten la presencia virtual en el entorno de “la otra parte”, y la presencia en general conduce al entendimiento y a la empatía.Tanto en el estudio del patrimonio cultural (el pasado), en el entrenamiento para la resolución de conflictos (presente) como en la visualización de posibles escenarios futuros, los modelos y representaciones digitales nos permiten estar presentes en una multiplicidad de momentos históricos o temporales dentro de un mismo espacio físico. La presencia multitemporal nos permite contemplar y participar en distintos escenarios, pudiendo incluso detenernos en ellos. Con ello, nos ayuda a comprender las situaciones y a empatizar con sus protagonistas, evitando a su vez que nos aniquilemos los unos a los otros y que sólo encontremos la paz perpetua en la amplia tumba que oculta todos los horrores de la violencia y de sus causantes, según nos diría Immanuel Kant12. 10 Declaración de Barcelona, “Internacional Conference on Engineering Education in Sustainable Development”, EESD’04, 29 de octubre de 2004, http://congress.cimne.upc.es/eesd2004/frontal/Declaration.asp 11 12 George Steiner, “La Idea de Europa”, Arcadia, 2005, p. 40. Immanuel Kant, “Sobre la Paz Perpetua”,Tecnos-Anaya, 2003, p. 25. Lección inaugural 2007 9/1/07 13:36 Página 35 SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 35 6 . A g r ad e c i m i e n t o s El autor quiere destacar la contribución de todos los miembros integrantes de su grupo de investigación, y en concreto de sus colegas y colaboradores I. Navazo, A.Vinacua, M. Slater, C. Andujar, M. Fairén y P.P.Vázquez en los trabajos que han dado lugar a la preparación de este escrito. 7 . R e f e r e n c ia s Aho, A.V., Hopcroft, J.E. y Ullmann, J.D. (1983),“Data Structures and Algorithms”, Addison-Wesley. Alma (2006), Alma IT Systems, www.alma3d.com Andujar, C., Brunet, P. y Ayala, D. (2002),“Topology-Reducing Surface Simplification Using a Discrete Solid Representation”, ACM Transactions on Graphics,Vol. 21 (2), pp 88-105. Andujar, C., Brunet, P., Chica, A., Navazo, I., Rossignac, J. y Vinacua, A. (2004),“Computing Maximal Tiles and Application to Impostor-Based Simplification”, Computer Graphics Forum, Vol. 23 (3), pp. 401-410. Andujar, C., Brunet, P., Chica,A., Navazo, I., Rossignac, J. y Vinacua,A. (2005),“Optimizing the Topological and Combinatorial Complexity of Isosurfaces”, Computer-Aided Design,Vol. 37 (8), pp. 847-857. Andujar ,C., Fairen, M. y Argelaguet, F. (2006),“A cost-effective approach for developing applicationcontrol GUIs on virtual environments”, Proc. of the IEEE 3d User Interfaces 2006, pp. 42-52. Andujar, C.,Vázquez, P.P. y Fairén, M. (2004),“Way-Finder: Guided Tours Through Complex Walkthrough Models”, Computer Graphics Forum,Vol. 23 (3), pp. 499-508. Bentley, J. L. (1975),“Multidimensional binary search trees used for associative retrieval”, Communications of the ACM,Vol. 18 (9), pp. 509–517. Brunet, P. y Navazo, I. (1990),“Solid Representation and Operation using Extended Octrees”, ACM Transactions on Graphics,Vol. 9 (2), pp. 170-197. Dijkstra, E.W. (1976),“A Discipline of Programming”, Prentice-Hall. Esteve, J., Brunet, P. y Vinacua,A. (2005),“Approximation of a Variable Density Cloud of Points by Shrinking a Discrete Membrane”, Computer Graphics Forum,Vol. 24 (4), pp. 791-808. Fairén, M. y Brunet, P. (2004),“Mini-VR:A Portable Virtual Reality System”, Computers and Graphics, Vol. 28, pp. 289-296. Fuchs, H., Kedem, Z.M. y Taylor, B.F. (1980) “On Visible Surface Generation by A Priori Tree Structures,” Computer Graphics, Siggraph’1980, Vol. 14 (3), pp. 124-133. Funkhouser,T.A. y Sequin, C. H. (1993),“Adaptive Display Algorithm for Interactive Frame Rates during Visualization of Complex Virtual Environments”, In Proc. of SIGGRAPH’93, pp. 247-254. Computer Graphics Proceedings,Annual Conference Series. Garey, M.R. y Johnson, D.S. (1979), “Computers and Intractability. A Guide to the Theory of NPCompletenes”, Freeman Ed., San Francisco. Lección inaugural 2007 36 9/1/07 13:36 Página 36 PERE BRUNET CROSA Gauss, C.F. (1827), “Disquisitiones Generales Circa Superficies Curvas”, en Dombrowski, P. (1979), 150 Years Alter Gauss’s “Disquisitiones Generales Circa Superficies Curvas”, Astérisque 62, Societé Mathématique de France, París, 1979. GeoVirtual (2006), Geo Show 3d, www.geovirtual.com Hoffmann, C.M., Hopcroft, J.E. y Karasick, M.S., (1988), “Towards implementing robust geometric computations”, Annual Symposium on Computational Geometry, Proceedings of the 4th Annual Symposium on Computational Geometry, ACM, Urbana-Champaign, Illinois, pp. 106-117. Hornung, A. y Kobbelt, L. (2006),“Robust Reconstruction of Watertight 3D Models from Non-uniformly Sampled Point Clouds Without Normal Information”, EG Symposium on Geometry Processing’06. Knuth, D.E. (1973), “The Art of Computer Programming Vol. III: Sorting and Searching”, AddisonWesley. Lastra, A. (2006), “Bringing the Real to Virtual Reality”, Proc. of SIACG’06, Iberoamerican Symposium in Computer Graphics, Santiago de Compostela, July 6th 2006. Lovelace, Augusta Ada (1843),“Sketch of the Analytical Engine Invented by Charles Babbage by L.F. Menabrea of Turin, Officer of the Military Engineers, with the Notes Upon the Memoir of the Translator”, reproducido en “Charles Babbage and his Calculating Engines. Selected Writings by Charles Babbage and Others”, Morrison P. and Morrison E. Eds., Dover, New York, 1961. Mantyla, M. (1988),“An Introduction to Solid Modeling”, Computer Science Press, Rockville MD. Nievergelt, J. (1974),“Binary Search Trees and File Organization”,ACM Computer Surveys Vol. 6 (3), pp. 195-207. Peterson,W.W. (1957),“Addressing for Random Access Storage”, IBM Journal on Research and Development,Vol. 1 (2). Requicha, A. (1980), “Representations for Rigid Solids:Theory, Methods and Systems”, ACM Computing Surveys Vol. 12 (4), pp. 437-463. Sales, A. (1980),“La primera generación en los USA: del ENIAC al transistor”, Novática,Vol. 34, pp. 39-46.También, del mismo autor y en el mismo volumen,“La prehistoria de la informática: antecedentes históricos del ENIAC”, Novática.Vol. 34, pp. 16-23. Samet, H. (1994), “The Design and Analysis of Spatial Data Structures”, Addison-Wesley series in Computer Science. Sanchez-Vives, MV. and Slater, M. (2005) “From Presence to Consciousness Through Virtual Reality”, Nature Reviews Neuroscience,Vol. 6 (4), 2005, pp. 332-339. ViHAP 3d (2005),“Virtual Heritage: High-Quality 3D Acquisition and Presentation”, EU Projekt IST2001-32641, www.vihap3d.org Visible Human (1986),“The Visible Human Project”, Nacional Library of Medicine, USA, 1986. Wirth, N. (1971),“Program Development by Stepwise Refinement”, Communications of the ACM Vol. 14 (4), pp. 221-227. Zemanek, H. (1980), “Dixit Algorithmi”, en , “Algorithms in Modern Mathematics and Computer Science”, A.P. Ershov and D. Knuth Eds., Lecture Notes in Computer Science 122, Springer-Verlag 1980, pp. 1-81.