Lección inaugural 2007 - Real Academia de Ingeniería

Anuncio
Lección inaugural 2007
9/1/07
13:36
Página 1
SOBRE AGUJAS Y PAJARES:
LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS
Lección inaugural 2007
9/1/07
13:36
Página 3
REAL ACADEMIA DE INGENIERÍA
SOBRE AGUJAS Y PAJARES:
LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS
DISCURSO DEL ACADÉMICO
EXCMO. SR. D. PERE BRUNET CROSA
LEÍDO EN LA SESIÓN INAUGURAL DEL AÑO ACADÉMICO
EL DÍA 23 DE ENERO DE 2007
MADRID MMVII
Lección inaugural 2007
9/1/07
13:36
Página 4
Editado por la Real Academia de Ingeniería
© 2007, Real Academia de Ingeniería
© 2007 del texto, Pere Brunet Crosa
ISBN: 84-95662-48-5
Depósito legal: M-
Impreso en España
Lección inaugural 2007
9/1/07
13:36
Página 5
LECCIÓN INAUGURAL
DEL AÑO ACADÉMICO 2007
Lección inaugural 2007
9/1/07
13:36
Página 7
Excmo. Sr. Presidente de la Real Academia de Ingeniería
Dignísimas Autoridades
Compañeras y Compañeros Académicos
Señoras y Señores
Queridos amigos
1 . I n tr o d u c c i ó n
La capacidad de representación humana siempre ha ido más lejos que la
mera copia o transposición de una realidad física a una simbólica. El mismo acto de representar constituye una herramienta profundamente potente de comprensión de la realidad, tanto para aquél que la genera como para quien la percibe. La historia de nuestro interés por las
representaciones muestra diferentes niveles en esta comprensión de las
formas y del espacio. A través del dibujo, la pintura o la escultura, el hombre ha plasmado y representado los elementos de su entorno desde los
tiempos más remotos. Según John Berger1, el dibujo simplemente declara
y narra como en una suerte de pretérito histórico, con lo que adquiere
una dimensión temporal (Figura 1). En contraposición, y continuando con
la misma cita, la pintura trata de seducir desde lo visible, trata de introducirnos en la escena. El dibujo es monocromo y diagramático, mientras
que en muchos casos y hasta el siglo XIX, tanto la pintura realista como la
escultura son medios para la representación de las formas, del entorno
espacial y de la luz (Figura 2), actuando como crónicas insustituibles que
nos transmiten elementos de la época en que fueron creadas.
Figura 1. Grabados egipcios sobre piedra en el templo de
Edfu, dedicado al dios Horus (del 237 al 180 a. C.).
1
Figura 2. Pintura realista holandesa del siglo XVII.
VerMeer, la lección de música (1662-1665). Londres,
Buckingham Palace.
John Berger, “Siempre Bienvenidos”, Huerga & Hierro editores, 2004. Colección “La Rama Dorada” núm. 29 , pág. 239.
Lección inaugural 2007
8
9/1/07
13:36
Página 8
PERE BRUNET CROSA
Hasta el advenimiento de la fotografía y del cine, la representación y comprensión de las formas sólo pudo basarse en las artes plásticas y en el dibujo técnico. A partir de finales del siglo XIX y fundamentalmente durante
el siglo XX, las representaciones fotográficas en emulsiones fotosensibles, primero en blanco y negro sobre placas de vidrio y posteriormente en color y
sobre películas flexibles significaron un salto cualitativo en relación a sus predecesoras (el dibujo y la pintura). Este salto se plasmó en un espectacular incremento de la producción de documentos gráficos, en el aumento de la calidad de la información y en la posibilidad, que apareció luego con el cine y el
vídeo, de representar el comportamiento dinámico de los objetos. En este
sentido,Walter Benjamín2 nos hace observar que la posibilidad de su reproductibilidad técnica, tanto en la fotografía como el cine, modificó la estética
tradicional y cambió la función del arte, sobre todo durante el siglo XX.
La aparición de los computadores a mitad del siglo XX significó un nuevo salto cualitativo en la historia de las representaciones. Las representaciones digitales, simples estructuraciones de secuencias de bits, aparecieron inicialmente
asociadas a la necesidad de realizar simples operaciones aritméticas con los
enteros. El ordenador ENIAC, presentado en público en 1946 y considerado
el primer ordenador de la historia (Sales, 1980) disponía de una memoria
con capacidad únicamente para veinte números de diez cifras, a pesar de su
peso de treinta toneladas. El BINAC (1949) fue ya el primer computador
completamente binario con un sistema de programación simbólica que utilizaba el concepto de von Newmann de programa almacenado en su memoria (von Newmann, 1945). Sin embargo, el IBM 1620, de segunda generación
y utilizado en las Escuelas de Ingenieros de Barcelona y Madrid en la década
de los 60 (primer ordenador con el que pude trabajar) todavía disponía de
una memoria de ferritas organizada en veinte mil posiciones de cuatro bits
que almacenaban dígitos en base 10 en representación BCD.
De la representación binaria de los números enteros se pasó a la representación en coma flotante de un subconjunto finito de los reales. De
forma casi inmediata, el ordenador dejó de ser únicamente una herramienta para el cómputo y los informáticos de nuestra generación asistimos y participamos en el descubrimiento del nuevo universo de las reWalter Benjamín, “Sobre la Fotografía”, Pre-Textos 2004, p.108: “En un primer momento se malgastó mucha agudeza en
decidir si la fotografía era o no un arte, sin haberse planteado previamente si la invención de la fotografía no había cambiado
el carácter global del arte; y los teóricos del cine pronto trasladaron a su terreno este precipitado planteamiento” … “La
época de la reproductibilidad técnica desligó al arte de su fundamento cultual, extinguiendo para siempre el brillo de su autonomía. Ello trajo consigo un cambio en la función del arte que cayó fuera del campo de visión del siglo XIX.Y este cambio
incluso se le ha escapado durante largo tiempo al siglo XX, que es el que ha vivido el desarrollo del cine”.
2
Lección inaugural 2007
9/1/07
13:36
Página 9
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 9
presentaciones digitales. Los progresos en este descubrimiento nos permitirían la representación de los caracteres para el procesado de textos,
la representación digital de las imágenes para su procesado y manipulación, la representación del sonido y de la música, del vídeo o de tantos
otros elementos del mundo que nos rodea.
La representación digital de nuestro entorno requiere no obstante la utilización de elementos cualitativamente más complejos que las imágenes y vídeos digitales. La representación no ambigua de las formas de los objetos que
nos rodean para su posterior comprensión debe basarse necesariamente en
el conocimiento de su estructura geométrica. Citando a Robert Osserman3,
la imaginación y el lenguaje matemático nos proporcionan la visión que nos
permite contemplar la exquisita estructura que se esconde bajo lo superficial: la poesía del universo, en el que las ramas y frutos del árbol geométrico
merecen ser contemplados como un admirable producto de la imaginación
humana.Vemos, como diría Richard Feynman4, que las matemáticas (y la geometría) nos permiten sentir realmente la belleza, la profunda belleza de la naturaleza. En este contexto, los conceptos e ideas que desarrollaremos a continuación son producto de las investigaciones de numerosos informáticos y
geómetras en esta joven disciplina a lo largo de estos últimos cuarenta años,
incluyendo también el resultado de más de veinticinco años de trabajo de
nuestro grupo en el campo de la representación y procesado digital de las
formas, de su geometría, de sus atributos y de su comportamiento.
Sin embargo, y como ingenieros, no podemos quedarnos en la sola comprensión de la estructura geométrica de nuestro entorno. Debemos aportar soluciones y diseñar artilugios para resolver problemas reales. Presentemos, a título de ejemplo, dos problemas prácticos aparentemente no relacionados pero
de gran actualidad: la necesidad de disponer de sistemas eficientes para el entrenamiento y planificación en medicina y cirugía y la conveniencia de disponer de nuevas herramientas interactivas para el estudio y presentación del patrimonio cultural con metodologías radicalmente distintas a las utilizadas en
los actuales museos. En ambos casos, y desde un punto de vista computacional, existe ya un problema inicial común. Debemos crear puentes para salvar
3
Robert Osserman, “La poesía del universo”, Grijalbo, Crítica, 1977, págs. 11, 65, 69.
Richard Feynman, “El carácter de la ley física”, Antoni Bosch Editor, colección conjeturas, 1980; traducción de A.
Bosch, pág. 45: “A aquellos que no conocen las matemáticas les resulta difícil sentir realmente la belleza, la profunda
belleza de la naturaleza. C.P. Show habló de dos culturas. Creo verdaderamente que estas dos culturas separan a la
gente que ha vivido y a la gente que no ha vivido esta experiencia de comprender las matemáticas suficientemente
bien como para apreciar la naturaleza al menos una vez.”
4
Lección inaugural 2007
10
9/1/07
13:36
Página 10
PERE BRUNET CROSA
Figura 3. Radiografía e imágenes contrastadas de los pies y del tórax de distintos pacientes. Resultados de proyectos
conjuntos con Alma IT systems (Alma, 2006).
el gran abismo existente entre los datos de partida (las imágenes digitales
producidas por los escáneres TAC, MRI o PET o las nubes de puntos que nos
suministran los escáneres láser en las aplicaciones de conservación del patrimonio cultural) y los dispositivos finales de visualización e interacción. Dependiendo de las necesidades de la aplicación, la visualización podrá realizarse de
diferentes modos: en un sistema inmersivo de realidad virtual, en una pantalla
tradicional o incluso en un dispositivo móvil tipo teléfono. Pero además, los
usuarios finales nos plantean una gran variedad de problemas a resolver. En el
caso de la medicina, por ejemplo, ¿es posible disponer de herramientas para la
ayuda en el diagnóstico en medicina que permitan la localización automática o
semiautomática de tumores y malformaciones? ¿Podemos crear herramientas
de ampliación interactiva que permitan la inspección con efecto lupa o microscopio en tiempo real? ¿Cómo podemos eliminar (recortar) ciertos tejidos
visualizando y resaltando otros tejidos de forma selectiva? La Figura 3 muestra,
a título de ejemplo, algunos resultados actuales con datos de pacientes reales
y puede comprobarse la mejora obtenida con las imágenes actuales en relación a las clásicas de rayos X. Los resultados forman parte de un proyecto de
colaboración entre nuestro grupo y el mundo empresarial. En el campo de la
cirugía, el requerimiento básico en estos momentos es el de poder disponer
de herramientas para la simulación realista de operaciones quirúrgicas de forma no invasiva sobre modelos del propio paciente real, todo ello con carácter
de entrenamiento previo a las intervenciones.
Por otra parte, en las aplicaciones en el campo del patrimonio cultural, los
requerimientos en el fondo no son muy distintos. El interés de los expertos es disponer de herramientas para el archivo, clasificación y ayuda a la
conservación. Es preciso tener bases de datos cuyos modelos permitan el
máximo nivel de detalle, así como su inspección en tiempo real con efecto
Lección inaugural 2007
9/1/07
13:36
Página 11
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 11
Figura 4. Modelo del David de Michelangelo. Vista del modelo completo (56 millones de triángulos), y vista, desde
una perspectiva insólita, de la cabeza del modelo digital antes y después del proceso de restauración.
Proyecto ISTI-CNR sobre la restauración de la estatua de David, cortesía de Roberto Scopigno.
de lupa o microscopio virtual (ampliación interactiva). En las aplicaciones
dirigidas al público no experto, las posibilidades son múltiples, y van desde
los sistemas de ayuda y soporte en los propios museos (Figura 4) hasta
aplicaciones para el estudio e inspección interactiva a través de la red o sobre dispositivos móviles de visualización. En este caso, ¿podemos inspeccionar y tener percepción táctil en los modelos virtuales de las obras de arte?
¿Es posible navegar en espacio y tiempo en los museos virtuales? Todas estas preguntas nos llevan a interesantes problemas geométricos y computacionales, algunos de los cuales analizaremos a continuación.
Las soluciones que puede aportar la ingeniería informática a los problemas
planteados, provenientes de campos tan distintos, deberán aproximarse a los
objetivos sin olvidar los condicionantes y restricciones singulares de cada
problema. El objetivo final y el reto, tanto en las aplicaciones en medicina como en las dirigidas al estudio y conservación del patrimonio cultural, es poder explorar y entender modelos geométricos muy complejos empleando
computadores comerciales, portátiles o de sobremesa (Figuras 3, 4 ó 5), de
forma interactiva y con percepción de presencia. La complejidad del problema proviene, como detallaremos más adelante, de diversos factores. Por una
parte, proviene del tamaño del modelo y de la información geométrica necesaria. Pero también proviene de las restricciones del problema, que incluyen la capacidad limitada del computador que llevará a cabo la visualización
Lección inaugural 2007
12
9/1/07
13:36
Página 12
PERE BRUNET CROSA
Figura 5. Recorte y vista interior del cráneo de un paciente. Sección por una esfera (izquierda) y algoritmo de
visualización expresiva de la sección por un cubo (derecha).
final así como las limitaciones y características de la percepción humana. La
solución óptima requiere el diseño de algoritmos adecuados y eficientes e
imperceptibles, es decir, transparentes. Un algoritmo interactivo debe ser eficiente hasta tal punto que el usuario final no tendría que percibirlo. Esta es
nuestra paradoja: el resultado final de un buen trabajo en ingeniería de software (y de las múltiples horas y esfuerzo que comporta) debería ser, si ello es
posible, que dicho software pase desapercibido, que sea transparente durante
la interacción con el sistema.
2 . G e o m e t r ía , a lg o r it m o s y co m p u t a ci ó n : d e l o c o n t in u o a l o d is c r e t o
La informática es ciencia y a la vez es tecnología. Directamente relacionada
con la matemática y emparentada con la lingüística, la informática es la ciencia que nos permite descubrir las representaciones y algoritmos óptimos
para una gran variedad de objetos y entes del mundo que nos rodea. El
descubrimiento de la representación más adecuada en cada caso nos adentra en la comprensión de algunas propiedades de los propios objetos reales
y nos aporta herramientas (los algoritmos) para poder manipularlos de forma óptima y acorde con su estructura. Como el testigo oidor de Elias Canetti5, debemos estar atentos para comprender las estructuras que se nos
revelan. Intentando seguir el ejemplo de Gauss (Gauss, 1827) debemos descubrir propiedades y estructuras intrínsecas en la geometría de nuestros
objetos. De hecho, decimos que una determinada representación es óptima
5 Elias Canetti, “El testigo oidor”, Ed. DeBolsillo, 2005 (Traducción de “Der Ohrenzeuge”), pág. 153: El testigo oidor …
oye lo que hay que oír … y helo ya en otro lugar, oyendo otra vez; conoce todos los sitios donde hay algo que oír, lo
registra bien y no olvida nada”.
Lección inaugural 2007
9/1/07
13:36
Página 13
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 13
cuando posibilita que las operaciones que luego realizaremos con ella sean
lo más eficientes posible. Nuestro objetivo tiene una formulación aparentemente simple: las representaciones digitales deben encajar a la vez con la estructura del objeto físico que queremos modelar y con las operaciones que
desearemos aplicarle. Los programas no son más que formulaciones concretas de algoritmos abstractos que se basan en representaciones y estructuras de datos. Los algoritmos procesan y operan con representaciones
(Wirth, 1971); en ellas, la información corresponde a determinadas abstracciones de partes del mundo real.
Dejando aparte algunos precedentes del antiguo Egipto y los esquemas babilónicos de los alrededores del año 2000 a. C. para la resolución de ecuaciones cuadráticas de dos variables y algunos problemas de superficie de
triángulos, el primer algoritmo conocido de naturaleza iterativa es el llamado
algoritmo de Euclides para el cálculo del máximo común divisor de dos números enteros. Desgraciadamente fue imposible demostrar que el algoritmo
era correcto, ya que la demostración se basa en el uso de la inducción, y ésta
no fue descubierta hasta el siglo XVII. Pero quien expresó por primera vez el
concepto de algoritmo de forma explícita fue Abu Jafar Muhammad Ibn
Mûsâ Al-Khwârizmî (ver, por ejemplo, Zemanek, 1980).Al-Khwârizmî vivió en
Bagdad entre los siglos VIII y IX, hizo aportaciones a la astronomía y a la geografía, y escribió el primer libro de algoritmos matemáticos con métodos
simples y sistemáticos para resolver problemas algebraicos. No sólo su nombre dio lugar al término actual algoritmo, sino que la palabra álgebra proviene del título de su libro: Kitâb al-Jabr wa’l-muqâbala.
Tenemos que esperar hasta el siglo XIX para poder disfrutar del primer
manual de programación de la historia, desarrollado como es sabido por
lady Augusta Ada, hija de lord Byron y condesa de Lovelace (Lovelace,
1843), colaboradora de Charles Babbage en el desarrollo y utilización de
su máquina analítica. El texto de lady Ada contiene un algoritmo recurrente para el cálculo de los números de Bernouilli y apunta la posibilidad
de aplicar la máquina de Babbage a aplicaciones no matemáticas, como
por ejemplo la manipulación de notas musicales.
Edsger W. Dijkstra (1976) contribuyó de manera decisiva a la consolidación de los fundamentos científicos de la informática al considerar los algoritmos y programas como objetos matemáticos (transformadores de
predicados) y estudiar la clasificación de los mismos en base a sus propiedades estructurales. Por lo que respecta al análisis de la complejidad de
Lección inaugural 2007
14
9/1/07
13:36
Página 14
PERE BRUNET CROSA
los algoritmos en base a los recursos requeridos en tiempo y espacio, los
trabajos de Post en 1944 y de Grzegorczyk en 1953 así como los de
Hartmanis, Stearns, Rabin, Cobham y Edmonds en 1964 (ver por ejemplo
Garey y Johnson, 1979), permitieron clasificar los problemas decidibles en
la clase P de los problemas que pueden ser resueltos en tiempo polinómico mediante algoritmos deterministas, y en la clase NP de aquellos problemas que, en tiempo polinómico y con máquinas deterministas, únicamente podemos verificar soluciones concretas. Trabajos posteriores de
diversos autores han permitido identificar numerosos problemas tipo pertenecientes a la clase de los NP-completos, mientras que otros investigadores han seguido la línea iniciada por Knuth en 1973 con su memorable
obra (Knuth, 1973) que continúa siendo un referente y que establece los
fundamentos de la complejidad concreta al comparar la eficiencia de algoritmos alternativos en la solución de un mismo problema.
Los algoritmos procesan y trabajan con subconjuntos seleccionados de
datos. Los algoritmos son nuestras herramientas, que modifican y moldean
las representaciones digitales, los datos, para ofrecer los resultados esperados a los usuarios finales. Estos datos representan una abstracción de la
realidad en el sentido de que ignoran aquellas propiedades y características específicas de los objetos reales que son irrelevantes en el contexto
del problema que estamos tratando. La abstracción en las representaciones es también por lo tanto una simplificación de la realidad.
Históricamente, los primeros algoritmos se concentraban en la solución
de problemas algebraicos y por lo tanto solo precisaban de la representación digital de los números, enteros y reales. Una vez más fue lady Ada
Augusta (Lovelace, 1843) quien hizo notar que la aplicación de la máquina analítica de Charles Babbage a aplicaciones en el campo de la música
requería una representación numérica de las notas musicales. Hace veinticinco años, en 1981, los diseñadores del lenguaje de programación Ada
quisieron de este modo rendir homenaje a la condesa de Lovelace.
Así como el diseño de algoritmos para la manipulación de notas musicales
requiere su adecuada representación digital, el desarrollo de algoritmos para el procesado de la geometría debe sustentarse en representaciones geométricas que han de encajar con los mismos. En este caso sin embargo, la
complejidad de las formas a representar se traduce en importantes retos
en el proceso de diseño de los algoritmos y estructuras de datos correspondientes. Si analizamos nuestros dos ejemplos iniciales observaremos
Lección inaugural 2007
9/1/07
13:36
Página 15
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 15
que, en general, los objetos y sistemas que debemos modelar y representar
tanto en medicina como en las aplicaciones de patrimonio cultural deben
estar delimitados por superficies cerradas y orientables que deben separar
su interior del espacio exterior. Nuestras representaciones abstractas deben
modelar objetos libres de errores geométricos tales como grietas, agujeros
o auto-intersecciones. La formalización teórica de estos requerimientos
condujo a la definición de los modelos de sólidos (Mantyla, 1988) cuyas
propiedades fueron concretadas y formalizadas por Requicha (1980). Según
la definición de Requicha, los modelos de sólidos representan objetos cerrados, finitos, regulares y con superficie o frontera orientable. Gran parte de
los trabajos de nuestro grupo en los últimos años se han centrado en la
creación, reparación, operación, representación y visualización interactiva de
escenas formadas por modelos de sólidos.
Volvamos a algunas de las preguntas que nos planteábamos al inicio. ¿Cómo podemos pasar de los datos que adquirimos mediante escáner láser
o TAC a los modelos geométricos que necesitaremos en las aplicaciones
de visualización e inspección interactiva?, ¿qué tipo de modelos nos van a
permitir la visualización selectiva de tejidos y órganos en las aplicaciones
de diagnóstico médico?, ¿qué tipo de modelos nos facilitan el entrenamiento no invasivo sobre el paciente real?
Evidentemente, estas preguntas son demasiado ambiguas, y difícilmente podrán conducir por sí solas a la especificación de los algoritmos necesarios
para la inspección interactiva de los datos. Es necesario disponer de sistemas que permitan la inspección de los modelos mediante su visualización
interactiva sin que aparezcan errores geométricos (grietas, solapes, roturas
en el modelo) y que permitan conocer el volumen u otras propiedades integrales del objeto inspeccionado. En términos de representaciones, estas
necesidades nos obligan a trabajar con modelos válidos de sólidos.
Por otra parte, uno de los elementos básicos en los requerimientos de los
usuarios finales es el poder efectuar una inspección interactiva de los modelos. Nuestros sistemas informáticos han de permitir esta interacción, y al conseguirlo se sitúan en un plano esencialmente distinto al de las representaciones clásicas (dibujo, pintura, fotografía e incluso cine y vídeo). En cualquiera
de estas representaciones, sea el dibujo o el vídeo, existe una intencionalidad
por parte del autor. El autor nos transmite lo que desea, a través de su perspectiva. El encuadre en una fotografía o el guión en una película nos transportan a su perspectiva. Vemos lo que el autor ha decidido que veamos.
Lección inaugural 2007
16
9/1/07
13:36
Página 16
PERE BRUNET CROSA
Figura 6. Percepción de presencia ante la realidad (izquierda) y a través de representaciones digitales de la misma (derecha).
Nuestros sistemas de representación digital de la geometría sitúan por el
contrario al usuario final en el centro del escenario, haciendo desaparecer la
intencionalidad del autor. El espectador ve lo que desea a través de una perspectiva, la suya, que puede cambiar a su antojo. El usuario, como lector de las
representaciones, deberá tener la libertad para poder descubrir detalles, enfoques y puntos de vista inéditos y evidentemente impensados por el autor.
El autor pasa a ser transparente, a desaparecer dentro de la obra, que en este caso es el modelo tridimensional.
Todo ello se hace patente en el diagrama de la Figura 6. Nuestra realidad
exterior contiene multitud de objetos de muy diversas formas y apariencias.
Nuestro sistema sensorial nos permite adquirir parte de esta información, y
su posterior procesado en el córtex cerebral nos genera la sensación de
presencia y posibilita nuestra interacción con el entorno. Nos sentimos presentes en el entorno que nos rodea. La importancia de los sistemas informáticos radica en que las representaciones y los modelos digitales de los
objetos que nos rodean pueden ser utilizados como elementos intermedios
entre la realidad física y los usuarios finales.Tras crear las representaciones a
partir de la realidad mediante el llamado proceso de captación (Figura 6),
podremos utilizar estas representaciones digitales (modelos tridimensionales de sólidos) para generar sensación de presencia en un entorno virtual a
través de los llamados sistemas de interacción inmersiva. El usuario final debería poder inspeccionar interactivamente los objetos de su entorno virtual
con la misma perspectiva, libertad de acción y calidad perceptiva con las
que antes inspeccionaba los objetos reales de su entorno.
Siguiendo con el análisis de las representaciones digitales, volvamos a
nuestros dos problemas y a las preguntas que nos planteábamos. Nues-
Lección inaugural 2007
9/1/07
13:36
Página 17
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 17
tra primera pregunta nos conduce inevitablemente al llamado “problema
del modelado” (Lastra, 2006). ¿Cómo podemos procesar la información
de entrada (puntos generados por un escáner láser, o conjuntos de imágenes) y generar los modelos válidos de sólidos que deseamos en nuestro caso? Nos encontramos ante un macro problema actualmente abierto, apasionante y polifacético, que incluye problemas tan variados como
el de la reconstrucción de los modelos, el de su reparación, el de la segmentación o el de la optimización de las características topológicas. Hablaremos de algunos de ellos en los próximos párrafos.
Pensemos en primer lugar cómo podemos representar los modelos de sólidos. Desde los trabajos de Requicha en 1980, una buena parte de los algoritmos geométricos de primera generación se basaban en representaciones
continuas de fronteras, en las que las diversas partes (caras o, en nuestra terminología, pedazos) de la superficie del objeto se representaban en forma
de superficies paramétricas o algebraicas. Estas representaciones heredaban
el concepto matemático / geométrico de la precisión infinita de las funciones
reales continuas. Pero el mundo que nos rodea, incluso las leyes de la física
moderna, nos hablan más de lo discreto que de lo continuo.Y en nuestro caso, debemos tener además en cuenta las condiciones de contorno. En el núcleo de nuestras representaciones geométricas tenemos información numérica (valores enteros y reales) que acabaremos codificando de forma discreta
en los octetos de la memoria de nuestro ordenador. Por otra parte, las visualizaciones que generaremos con los modelos digitales no deberían ser más
precisas que el sistema físico de visualización (limitado por su resolución en
píxeles), que nuestro sistema de recepción óptica (limitado por la resolución
de los conos y bastones en nuestra retina) o que nuestro sistema perceptivo.
En este contexto, nuestra contribución al problema del modelado ha consistido en gran parte en investigar algoritmos basados en representaciones
discretas de los sólidos (Brunet y Navazo, 1990). En este caso, los modelos
geométricos se basan en información numérica discreta (valores enteros)
localizada a su vez en un conjunto de posiciones discretas del espacio, que
debe adaptarse dinámicamente a la resolución (píxeles) del sistema físico de
visualización para garantizar que continuamos generando visualizaciones
gráficas de la más alta calidad y con la mayor eficiencia posible. Una de las
propiedades interesantes de los modelos geométricos discretos consiste en
que el error geométrico de representación está acotado y se mantiene acotado durante el procesado de la geometría, mientras que en los modelos
tradicionales, la representación de los valores numéricos reales en un núme-
Lección inaugural 2007
18
9/1/07
13:36
Página 18
PERE BRUNET CROSA
Figura 7. Zonas sin información en el proceso de captación de modelos 3d. Proyecto ViHAP 3d, www.vihap3d.org.
ro finito de octetos genera errores acumulativos que en muchos casos llegan a generar resultados geométricamente inválidos, tal como observaron
Hoffmann y Karasick (Hoffmann, 1988) en un test tan simple como el de la
recurrencia O(k+1) = Intersección (O(k), Ga(C) ) donde O(1)=C y Ga(C)
es un giro aleatorio del cubo inicial C.
Si estudiamos con más detalle el problema de la reconstrucción (y de la reparación) de modelos, observaremos que se trata de un problema mal especificado. La información de partida, conjuntos de puntos en el proceso de adquisición de modelos de edificios u obras de arte con escáner láser o bien
imágenes digitales en los sistemas de adquisición de modelos médicos mediante TAC o MRI, es discreta, incompleta e incorpora ruido (Figura 7). Se
trata de un problema con datos muestreados, esencialmente e irremediablemente ambiguo como se desprende del teorema de Shanon. El resultado no
está unívocamente determinado. Estamos, en otras palabras, ante la imposibilidad de generar geometría continua a partir de información discreta. Las
soluciones, necesariamente basadas en la inferencia, son múltiples. El problema de la reconstrucción se basa en la generación del grafo planar de conectividad del modelo geométrico final, que es un problema combinatorio, no
tratable con los volúmenes de datos que nos llegan. Además de ello, en muchos casos el propio usuario no conoce el objetivo a alcanzar en cuanto a
propiedades geométricas y topológicas del modelo final, y por tanto se desconoce el criterio de optimización. ¿Se desea una superficie con pocas o con
muchas componentes conexas? ¿La superficie debe interpolar los datos
(puntos) de entrada o solamente aproximarlos? ¿Es mejor obtener una superficie paramétrica a trozos, una superficie implícita o una malla de triángulos? En la mayoría de aplicaciones es imposible partir de una especificación
formal de la solución deseada y del problema. Pero incluso en el caso que la
Lección inaugural 2007
9/1/07
13:36
Página 19
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 19
Figura 8. Reconstrucción y reparación de modelos geométricos de estatuas mediante modelos volumétricos. Banda
discreta, detalle de la misma y modelo final.
tuviésemos, la complejidad del subproblema de optimización global asociado
a nuestro problema hace que éste sea intratable. Es como buscar agujas en
pajares. En la línea de Leif y Hornung (Hornung, 2006), que utilizan algoritmos jerárquicos multi-malla basados en el cálculo de funciones distancia discretas, nuestro grupo ha estando estudiando (Esteve, 2005) algoritmos que
trabajan en el espacio discreto y que generan soluciones aproximadas. Nuestro objetivo ha sido el de desarrollar algoritmos subóptimos que en una primera fase generan bandas discretas (conjuntos 6-conectados de micro cubos o “vóxeles”) que aproximan con error acotado a priori y baja
complejidad computacional y que se acercan a las soluciones óptimas aceptables para el usuario final. Nuestros algoritmos de generación de bandas discretas con posterior suavizado y optimización de la topología se han utilizado
con éxito, entre otras aplicaciones, en el marco de proyectos para la reconstrucción de modelos de obras de arte en el campo de la conservación del
patrimonio cultural (Figuras 8 y 9).
Figura 9. Reconstrucción, reparación e inspección de modelos geométricos de estatuas mediante modelos volumétricos.
Reparación de una columna del conjunto funerario de Arrigo VII, Pisa. Inspección, en el sistema Cave de Realidad
Virtual, de una de sus estatuas. Proyecto ViHAP 3d, www.vihap3d.org.
Lección inaugural 2007
20
9/1/07
13:36
Página 20
PERE BRUNET CROSA
Figura 10. Zonas de indeterminación de la topología en los datos de un cráneo (a). Reconstrucciones del mismo con un
mínimo de componentes conexas (b) y con el mínimo de túneles (c).
Debemos observar, sin embargo, que una vez obtenida la banda discreta a
partir de los datos de partida, es preciso pasar a la segunda fase del algoritmo y obtener la superficie final, cerrada y restringida en el interior de la banda. Puede demostrarse que el problema de la reconstrucción de la superficie final a partir de bandas discretas (ver de nuevo la Figura 8) es
nuevamente un problema mal especificado. Dejando aparte los posibles
problemas de inconsistencias que aparecen en algunos algoritmos, es fácil
observar que la topología de la superficie final no es única. El problema tiene múltiples soluciones con diferentes topologías. En este caso, nuestros trabajos han permitido desarrollar algoritmos (Andújar, 2005) que optimizan
estas características topológicas y que por tanto adaptan la forma final de la
superficie (Figura 10) a los requerimientos específicos de los usuarios. Es
conveniente observar, sin embargo, que el problema de la reconstrucción y
reparación de modelos geométricos es un problema todavía abierto que es
y será objeto de investigación en los próximos años.
3 . L a g e s t i ó n d e l a co m p l e j i d ad ge o m é t r i ca : s o br e a gu j a s y p a j a r e s
En todo caso, la reconstrucción de modelos geométricos es sólo la antesala
de los problemas algorítmicos que se derivan de las necesidades de inspección interactiva de los mismos. Los intereses de los médicos (en el diagnóstico clínico) y de los restauradores (en el estudio de las obras de arte) no
están muy alejados. Los nuevos sistemas para el diagnóstico no invasivo en
medicina deben ofrecer herramientas para la detección y localización (con
fiabilidad y eficiencia) de defectos, tumores o malformaciones. Asimismo, y
como ya hemos mencionado, es preciso detectar e identificar los defectos, a
Lección inaugural 2007
9/1/07
13:36
Página 21
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 21
menudo minúsculos, que requerirán posterior reparación o intervención en
las obras de arte. En ambos casos, el interés del usuario final es la inspección
interactiva: el usuario desea poder navegar con la máxima flexibilidad, con la
libertad de un pájaro que además pudiera ir cambiando de tamaño para
entrar e inspeccionar todos los rincones del modelo. Así como el médico
podrá detectar, estudiar y comprender las malformaciones patológicas, los
visitantes de los museos en un futuro próximo podrán comprender mucho
mejor las formas de las obras de arte, percibiéndolas con la vista y con el
tacto y observándolas desde perspectivas muchas veces imposibles (véase
una vez más la Figura 4). Finalmente, y con la salvedad de la diferencia entre
las dos escalas de tiempo, las herramientas de visualización de modelos digitales nos han de permitir, en ambos casos, la inspección espacio-temporal. El
médico querría poder saltar en el tiempo, durante el proceso de inspección,
examinando diversos estadios en el desarrollo de la enfermedad, de forma
similar al visitante de un museo virtual que desearía poder trasladarse temporalmente a las distintas épocas para visualizar y así entender los procesos
históricos de construcción y destrucción de un mismo entorno por parte
de las sucesivas culturas y civilizaciones.
Lo que aparece detrás de todos estos requerimientos de inspección interactiva es la importancia y la necesidad de los algoritmos de búsqueda. La
navegación nos obliga a estar constantemente buscando y seleccionando
(recortando) información. Hay que buscar la información relevante del modelo que aparece en la zona que estamos observando, con la suficiente calidad visual y en tiempo real. Hay que seleccionarla, recortando el resto para
no visualizarlo. En función de los requerimientos de la interacción, es posible
que pasemos en escasos segundos de una situación en que estamos analizando un rincón de la escena y visualizando por tanto una fracción ínfima de
los datos del modelo a un estado en que el usuario desea ver una perspectiva global y en el que por tanto deberemos seleccionar la práctica totalidad
de la información del modelo geométrico. Pero además, esta necesidad de
búsqueda interactiva restringida a una región se complementa con la necesidad de la búsqueda asociativa cuando lo que deseamos es la detección y
localización automática, sin inspección por parte del usuario, de determinadas características, defectos o malformaciones.
No hay nada sorprendente en el hecho de que, detrás de las necesidades de los usuarios y de las aplicaciones, nos encontremos con una especificación del problema que requiere algoritmos de búsqueda. Lo encontramos no sólo en medicina y patrimonio cultural, sino también en
Lección inaugural 2007
22
9/1/07
13:36
Página 22
PERE BRUNET CROSA
campos tan diversos como pueden ser el procesado de textos, los sistemas de información geográfica, la astronomía o la biología computacional.
De hecho, la informática es, en gran parte, ordenación y búsqueda. Pero
la búsqueda asociativa, por características, es especialmente problemática.
Como diría Knuth6, el ordenador nos supera en muchos aspectos, pero
nuestro cerebro le supera en los recuerdos asociativos, como por ejemplo las evocaciones. La búsqueda asociativa es habitualmente parcial
(queremos buscar objetos de los que sólo conocemos parcialmente algunas características determinadas) y por tanto mal especificada. Los actuales buscadores están empezando a dar soluciones eficientes para el
problema de la búsqueda asociativa, pero sólo en información textual.
Uno de los retos actuales en los sistemas de inspección interactiva es la
búsqueda asociativa por características geométricas, ya sea para la localización automática de determinadas formaciones anatómicas o para la localización de objetos y obras de arte similares a una obra concreta.Y una
vez más el problema aparece ya en la especificación: ¿cuál es la mejor
métrica para medir similaridades? ¿qué características debemos comparar para determinar si dos objetos concretos son similares?
Aparte de la dificultad intrínseca de los algoritmos de búsqueda, en las aplicaciones que estamos analizando o en otras similares (como podría ser,
por ejemplo, la inspección interactiva del territorio) nos enfrentamos a tres
dificultades añadidas, directamente asociadas a los datos de entrada, a los
elementos de salida y a la máquina procesadora. El tamaño de los datos de
entrada es enorme, como veremos a continuación, mientras que los requerimientos de salida son muy estrictos. El sistema debe generar visualizaciones de alta calidad visual (tales que nuestro sistema perceptivo las considere perfectas), con percepción suave de la dinámica y de los movimientos
y con adaptación continua en tiempo real a las órdenes de navegación del
usuario, todo ello en pantallas y elementos de visualización comerciales.Y la
aplicación debe poder funcionar en ordenadores comerciales de gama media/alta y, en resumen, debe ser transparente. Las órdenes indicadas mediante el sistema de interacción (ratón o similar) deben generar los movimientos adecuados en la navegación con total transparencia por parte de
los algoritmos intermedios. Este es el reto fundamental en el diseño de algoritmos de procesado geométricos. Es la paradoja de la complejidad al
Donald E. Knuth “The Art of Computer Programming”. Second Edition,Volume 3: Sorting and Searching, 1999: “It is
interesting to note that the human brain is much better at secondary key retrieval than computers are; in fact, people
find it rather easy to recognize faces or melodies from only fragmentary information, while computers have barely been able to do this at all.Therefore it is not unlikely that a completely new approach to machine design will someday be
discovered that solves the problem of secondary key retrieval once and for all…”
6
Lección inaugural 2007
9/1/07
13:36
Página 23
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 23
servicio de la transparencia y de la simplicidad de uso, con el objetivo último de resolver grandes problemas en tiempo real y en máquinas de sobremesa.Y la solución pasa por la optimización de los algoritmos geométricos y de sus correspondientes estructuras de datos.
Analicemos brevemente la complejidad de los datos en algunas aplicaciones.
Aunque el objetivo a corto plazo en las aplicaciones en medicina sea el de
trabajar interactivamente con el modelo anatómico del propio paciente, la
mayoría de aplicaciones actuales relacionadas con la planificación y simulación
utilizan los datos del modelo “Visible Human” (Visible Human, 1986). El modelo original está formado por un total de 1800 imágenes digitales de cortes
paralelos, cada una de ellas de una resolución de 512 x 512 píxeles, que representan tanto la clase de tejido como su color. Es fácil deducir que el total
de datos del tipo (clase, color) de todo el modelo es del orden de 1,7 x 228.
Los cinco octetos que requieren cada uno de estos datos se traducen en un
tamaño, para el modelo completo no comprimido, de 2.17 Giga octetos. La
dificultad del problema se hace evidente cuando se nos pide poder inspeccionar interactivamente este modelo en ordenadores de sobremesa y generar un mínimo de 25 imágenes por segundo para conseguir una percepción
de navegación suave. Pero en todo caso, el problema no es muy distinto y
puede llegar a ser mucho más complejo en otras aplicaciones: pensemos en
la posibilidad de poder navegar interactivamente por el territorio de nuestro
país. Si consideramos por un momento resuelto el problema de adquirir los
datos y construir el modelo, podríamos incluso plantearnos si podemos resolver en el mundo virtual de nuestras máquinas la paradoja de la representación a escala 1:1 del mapa de Jorge Luis Borges7. En este caso, plantearnos
la representación del territorio con una precisión de un milímetro supondría
un volumen de datos del orden de 256, sólo almacenable de forma distribuida y comprimida en decenas de miles de discos de 100 Giga octetos de capacidad. No nos cabe ahora ninguna duda de que este problema es intratable con algoritmos directos. Pero si estructuramos jerárquicamente la
información y utilizamos sistemas de compresión asociados a nuestros mecanismos perceptivos podemos llegar a desarrollar algoritmos específicos para
la búsqueda, selección y visualización en tiempo real de estos modelos en
Jorge Luis Borges, “El hacedor”, Alianza Editorial, 1972: “En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el mapa de una sola Provincia ocupaba toda una Ciudad, y el mapa del imperio, toda una Provincia. Con el
tiempo, esos Mapas Desmesurados no satisfacieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio,
que tenía el tamaño del Imperio y coincidía puntualmente con él. Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias
del Sol y de los Inviernos. En los desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales
y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas”.
7
Lección inaugural 2007
24
9/1/07
13:36
Página 24
PERE BRUNET CROSA
Figura 11. Ejemplo de inspección interactiva de modelos geométricos gigantescos. Inspección multinivel del terreno.
Visión global y zoom hacia la isla de Hierro. Cortesía de Geo Virtual (Geo Virtual, 2006).
Lección inaugural 2007
9/1/07
13:36
Página 25
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 25
simples ordenadores de sobremesa conectados en red. ¡Con todo ello, la paradoja de Borges es ya casi una realidad! La Figura 11 muestra algunos resultados en este último campo de la inspección interactiva del territorio, en el
marco de uno de los actuales proyectos Universidad-empresa en que trabaja nuestro grupo.
En los problemas de inspección interactiva tenemos que buscar y seleccionar nuestros datos, como agujas en inmensos pajares, un mínimo de 25
veces por segundo y estando a la merced de las órdenes imprevisibles de
los usuarios finales, que nos llegarán a través de los sistemas de interacción. Las soluciones algorítmicas son imprescindibles: aunque sabemos que
las prestaciones del hardware están aumentando de forma exponencial, el
tamaño de los modelos a inspeccionar y los requerimientos por parte de
los usuarios finales están creciendo a un ritmo todavía mayor, como hemos visto por ejemplo en el caso de la inspección del territorio. Los algoritmos actuales se basan en las estructuras de datos jerárquicas, los llamados árboles, para establecer los puentes que han de salvar el abismo
existente entre el volumen de los modelos y las posibilidades de los aceleradores gráficos. Ya en 1974, Nievergelt (Nievergelt, 1974) estudió las
propiedades matemáticas de los árboles binarios de búsqueda, que más
adelante dieron lugar, para el caso concreto de los modelos geométricos,
a los árboles K-d ( “Kd-trees”, Bentley, 1975) y a los árboles de partición
binaria del espacio (árboles BSP, Fuchs, 1980). El estudio de los árboles de
partición no binaria dio lugar a la propuesta de árboles cuaternarios y octales (“quadtrees” y “octrees”, Samet, 1994).
Es conocido que la estructuración jerárquica de la información en árboles
balanceados permite que el tiempo de búsqueda sea logarítmico. Por otra
parte, la cantidad adicional de información necesaria para la gestión de la
estructura en árbol es baja, y por ejemplo en el caso de los árboles octales puede demostrase que es sólo del orden de un 14 %. En este contexto, en nuestro grupo hemos estado trabajando los últimos veinte años en
el estudio de nuevos algoritmos y estructuras de datos jerárquicas para la
representación y procesado de grandes modelos geométricos, tratando
de entender y descubrir las perspectivas que nos ofrecen tanto su inherente ordenación y estructuración espacial como su complejidad logarítmica. El problema en este caso tiene componentes de búsqueda (véase
por ejemplo Andujar, Vázquez y Fairén, 2004), así como de optimización
con restricciones. Para cada una de las imágenes que vamos generando
deberemos seleccionar y buscar la información gráfica pertinente y luego
Lección inaugural 2007
26
9/1/07
13:36
Página 26
PERE BRUNET CROSA
visualizarla con la máxima calidad visual posible, teniendo en cuenta que el
tiempo total de búsqueda, selección y visualización es limitado y no podrá
superar las tres centésimas de segundo si finalmente queremos mantener
una frecuencia mínima de 33 imágenes por segundo. La solución debe incluir determinadas heurísticas para la medición de la calidad visual que
percibiremos (una referencia básica en este sentido es Funkhouser, 1993)
ya que no tendría ningún sentido generar más calidad que la que podemos percibir. Una idea esencial consiste en incluir información complementaria en los niveles intermedios del árbol octal para reducir el tiempo
de proceso durante la navegación. Esta información, calculada en tiempo
de preproceso, incluye sub-modelos simplificados (Andújar, 2002) y puede incluir información sobre visibilidad y oclusiones. Los árboles octales
multiresolución que estamos utilizando en la actualidad están basados en
memoria externa y sus algoritmos de recorrido ajustan en tiempo real la
profundidad del recorrido en cada subárbol en función del punto de vista
y de la importancia visual de la información en los nodos. La utilización de
algoritmos perezosos, que explotan la coherencia respecto a la imagen
anterior, junto con técnicas de compresión de la información geométrica
en los nodos especialmente adaptadas a las capacidades de proceso de
las actuales placas gráficas nos ha permitido diseñar sistemas de navegación con prestaciones adecuadas para aplicaciones en medicina, inspección del terreno y patrimonio cultural.
Otro campo de gran actualidad y que requiere algoritmos específicos para
gestionar la complejidad geométrica es el de la identificación de características. La detección de determinados tipos de características en los modelos
tiene interés tanto en los problemas de búsqueda asociativa (por ejemplo,
para la localización automática de objetos o de determinadas formaciones
anatómicas) como en la inspección de entornos complejos con gran cantidad de objetos. Nuestra contribución reciente se ha centrado en la detección de características tales como zonas planas y aristas. La identificación de
las N zonas planas de mayor extensión de un objeto con una tolerancia
prefijada tiene aplicación inmediata en la simplificación extrema de objetos
de baja importancia visual en entornos muy complejos o bien para el cálculo de signaturas que nos ayudarán a su clasificación. Es fácil observar que el
planteo directo de este problema entraña una gran complejidad algorítmica.
Nuestra propuesta para reducir la dificultad del problema se ha basado en
una formulación discreta del problema y en el uso de diccionarios (Peterson, 1957) accesibles a través de funciones de dispersión o “hash” que permiten diseñar algoritmos de votación con complejidad lineal sobre parame-
Lección inaugural 2007
9/1/07
13:36
Página 27
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 27
Figura 12. En a y c, modelos originales con 37 Kpolígonos y 50 Kpolígonos respectivamente. En b, representación
simplificada (utilizando únicamente los 14 planos indicados en la primera imagen) del modelo mostrado en a. En d,
representación con 97 planos del modelo “Laurana” mostrado en c.
trizaciones discretas y jerárquicas de planos (Andújar, 2004). El resultado (Figura 12) nos llega en forma de representaciones extremadamente simplificadas y compactas, especialmente útiles para la visualización de objetos lejanos al observador. En el caso de la detección de aristas, hemos
experimentado con éxito los algoritmos basados en visibilidad dentro de
una malla discreta. En todo caso, el problema de la identificación de características y signaturas en modelos geométricos es nuevamente un problema
actualmente abierto con numerosas líneas de trabajo.
4 . I n t e r ac ci ó n , i n m e r s ió n y p r e s e n c ia
Hablábamos antes de las necesidades de inspección libre e interactiva
del modelo. Hemos analizado las dificultades asociadas tanto a la propia
generación de los modelos geométricos como a su procesado para la
navegación e inspección interactiva. Sin embargo, en muchos casos, los
requerimientos de los usuarios van más allá de la visualización en pantallas planas.Tanto los sistemas para la formación, entrenamiento y simulación en medicina y cirugía como las aplicaciones para el estudio y comprensión de las formas en patrimonio cultural y muchas otras
aplicaciones podrían y deberían aprovechar la capacidad tridimensional
de nuestro sistema perceptivo.Tal como mencionábamos antes (ver nuevamente la Figura 6), el usuario final debería poder inspeccionar interactivamente los objetos de su entorno virtual con la misma perspectiva, libertad de acción y calidad perceptiva con las que inspecciona los
objetos reales de su entorno.
Lección inaugural 2007
28
9/1/07
13:36
Página 28
PERE BRUNET CROSA
La tecnología actual está dando una nueva respuesta a estas necesidades:
los sistemas inmersivos, también llamados sistemas de realidad virtual. El
objetivo en estos nuevos sistemas de inspección de modelos y entornos
virtuales es que generen percepción de presencia en el usuario, en base a
la utilización de técnicas de inmersión y de interacción transparente. Según John Berger (op. cit.), la pintura trata de introducirnos en la escena
pintada. El objetivo de la realidad virtual es análogo, con la única diferencia
de que ahora trata de introducirnos en la escena representada digitalmente, para acercarnos de algún modo a la visión de Ivan Sutherland8
cuando ya en 1965 hablaba de programas y sistemas de visualización que
pudiesen recrear elementos del país de las maravillas de Alicia.
Los sistemas inmersivos de realidad virtual incluyen los componentes ya
comentados que han de permitir la navegación e inspección de las escenas, pero los complementan con elementos para la inmersión y para la
interacción directa. Los algoritmos optimizados para la construcción e
inspección de modelos nos abren el camino hacia el estudio, percepción
y comprensión de lo invisible, de lo imposible, de lo lejano o de lo que
nos es temporalmente distante, ofreciéndonos la posibilidad de visualizar y entender estructuras microscópicas, entornos y paisajes del pasado
o diversas hipótesis en cuanto a la planificación del futuro. Las técnicas
inmersivas, por su parte, conectan y dirigen nuestros sentidos (fundamentalmente la vista y algunas veces el tacto) hacia los objetos y personajes del entorno virtual con el fin de introducirnos en la escena, inducirnos su percepción tridimensional, crearnos la sensación de presencia
y potenciar nuestra comprensión del entorno. Dado que nuestra percepción de la realidad es tridimensional, los sistemas inmersivos trascienden las actuales representaciones visuales planas y nos ofrecen una
percepción también tridimensional de la representación digital del entorno.
Pero los sistemas de realidad virtual deben además incluir componentes
específicos para la interacción directa o transparente. Este es un aspecto
esencial en los nuevos sistemas, que encaja y se complementa con los
elementos de inmersión y de navegación interactiva. La historia de los
sistemas de interacción y de las interfaces de usuario se han desarrolla8 Ivan E. Sutherland, “The Ultimate Display”, Proceedings of IFIP Congress, pp. 506-508, 1965.: “The ultimate display
would, of course, be a room within which the computer can control the existence of matter. A chair displayed in such
a room would be good enough to sit in. Handcuffs displayed in such a room would be confining, and a bullet displayed
in such room would be fatal. With appropriate programming such a display could literally be the Wonderland into
which Alice walked.”
Lección inaugural 2007
9/1/07
13:36
Página 29
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 29
do en paralelo a la evolución del hardware, de los algoritmos y de la ingeniería del software. La historia es breve, como todo en la informática.
Pero los avances han sido indiscutibles, con dos grandes saltos cualitativos. El primero de ellos, bien presente en nuestra memoria, se produjo
durante la década de los ochenta. La investigación en Xerox y luego en
Apple nos transportó de la interacción basada en el teclado y en el uso
de comandos (sistema MS-DOS, entre otros) a los sistemas de interacción basados en el uso del ratón y en el de las ventanas, iconos y menús.
La aparición simultánea de estas interfaces, conocidas por el acrónimo
WIMP, junto con los ordenadores personales, supuso el fin de la etapa
minoritaria y mágica de la informática y el inicio de su utilización masiva.
La interacción dejaba atrás el lenguaje altamente técnico de los sistemas
operativos y se acercaba a la intuición humana se alejaba de la máquina
para acercarse al usuario final. Todos hemos sido testigos de la importancia y de la trascendencia que, durante estas últimas dos décadas, ha
tenido la utilización masiva de los nuevos paradigmas intuitivos de interacción. Pero en estos momentos, con los nuevos paradigmas de la realidad virtual estamos siendo testigos del segundo cambio cualitativo, que
nos ha de conducir de los sistemas intuitivos de interacción a los sistemas transparentes con interacción directa. Con este segundo cambio
nos adentramos en el camino que empezó con interfaces muy cercanas
a las máquinas y que nos irá aproximando a los usuarios finales. En el
campo de la realidad virtual hablamos de interacción directa porque el
objetivo es la interacción natural de los usuarios con los objetos virtuales que están inspeccionando, en base a los mismos gestos que utilizarían
para la inspección del objeto real. La interfaz tiene que ser invisible a los
ojos del usuario, tanto ésta como el ordenador deben ser, una vez más,
transparentes. Las latencias, los retrasos computacionales entre un determinado gesto del usuario y el efecto final que se produce en la visualización del modelo, son inevitables pero deberán ser muy bajos, del orden de centésimas de segundo, para que sean imperceptibles por
nuestro sistema sensorial y no destruyan el efecto de interacción directa con los objetos virtuales. El cambio de filosofía en los paradigmas de
interacción es radical. El ratón de nuestras actuales interfaces se convierte en los dispositivos sensores que deberán detectar nuestros gestos, y
las órdenes que ahora damos al sistema mediante el ratón o el teclado
se transforman en el reconocimiento de nuestros gestos y movimientos
por parte del ordenador. El sistema de realidad virtual no espera instrucciones durante la inspección interactiva de los objetos en el entorno virtual. Detecta nuestros movimientos, los interpreta y acto seguido
Lección inaugural 2007
30
9/1/07
13:36
Página 30
PERE BRUNET CROSA
Figura 13. Sistemas de VR: interacción directa con la escena.
pasa a ejecutar en tiempo real las acciones
correspondientes a nuestras intenciones.
La ingeniería podría definirse, según nos diría
Javier Aracil9, como el arte de crear artificios
para resolver problemas. En nuestro caso,
los sistemas de realidad virtual son artificios
heterogéneos que deben integrar el ordenaFigura 14. Interacción en el sistema
dor con el software para la simulación inte“Cave” de realidad virtual con interfaces
avanzadas de control de la aplicación.
ractiva, los efectores para generar las representaciones inmersivas y los sensores necesarios para la interacción
directa. Los requerimientos se plantean habitualmente en términos de
precisión, calidad inmersiva, bajas latencias, ergonomía, simplicidad y portabilidad de los sistemas.
En este contexto, las aportaciones de nuestro grupo se han centrado en
el estudio y propuesta de nuevos sistemas de realidad virtual para la interacción e inspección inmersiva, utilizando componentes comerciales de
bajo coste. Los sistemas inmersivos basados en ordenadores personales y
estéreo pasivo (Figura 13), sean fijos o portátiles (Fairén, 2004), pueden
ser de utilidad para aplicaciones en campos tan diversos como el diseño
cooperativo de grandes buques, la medicina, el estudio del patrimonio cultural, la inspección inmersiva del territorio, la adaptación de gafas progresivas o el tratamiento de fobias. Lo mismo podemos decir respecto a los
nuevos paradigmas para la interacción durante el control de la aplicación
en entornos fuertemente inmersivos como el sistema Cave (Figura 14,
Andujar, 2006).
9 Javier Aracil, “¿Es la ingeniería meramente ciencia aplicada?”, en “Ingeniería y pensamiento”, Ed. Fundación El Monte,
Sevilla, 2006, pág. 146.
Lección inaugural 2007
9/1/07
13:36
Página 31
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 31
Figura 15. Búsqueda por características en la planificación no invasiva en medicina: regiones óptimas para una
resección parcial del hígado. Proyecto conjunto con el Hospital del Valle de Hebrón (Barcelona).
En todo caso, y como ya hemos comentado, la realidad virtual es fundamentalmente un nuevo paradigma de interacción, directo e inmersivo.
Como en todo nuevo sistema, como en todo nuevo artificio de la ingeniería, su importancia social se mide en términos de interés, de beneficio
y de utilidad para los usuarios y para las aplicaciones finales. Todo ello
puede medirse con métodos estadísticos y en base a experimentos con
usuarios finales. El objetivo es llegar a conocer el llamado grado de usabilidad del nuevo sistema.
Uno de los factores clave que determinan la usabilidad de un sistema de
realidad virtual es el grado de presencia que induce en sus usuarios. Volviendo una vez más a la Figura 6, el interés final de la representación digital de las formas y del procesado de su geometría, es el de poder reproducir la sensación de presencia que tenemos cuando nos encontramos
frente a los objetos reales. Entendemos que un sistema inmersivo de realidad virtual es usable y genera una adecuada sensación de presencia
cuando induce reacciones en los usuarios que son similares a las que experimentarían en la realidad. El profesor Mel Slater, recientemente incorporado a nuestro grupo, ha estado estudiando y midiendo la percepción
de presencia en los sistemas de realidad virtual y en los entornos virtuales. Las métricas de presencia se basan en medidas fisiológicas objetivas,
tales como los cambios en los ritmos cardiaco y respiratorio y en la conductividad de la piel de los participantes en los experimentos, así como en
la opinión posterior de los mismos expresada a través de cuestionarios y
tratada estadísticamente. Una de las conclusiones es que los sistemas actuales de realidad virtual ya pueden producir cotas elevadas de presencia,
Lección inaugural 2007
32
9/1/07
13:36
Página 32
PERE BRUNET CROSA
Figura 16. Presencia en entornos virtuales. Comunicación con avatares en escenas virtuales con audiencias positivas o
negativas. Cortesía de Mel Slater.
como podemos ver en la Figura 16 (Sanchez-Vives y Slater, 2005), en la que
aparecen dos grupos formados por personajes virtuales o avatares, manifiestamente no realistas pero con comportamientos caricaturizados a partir de
situaciones reales. Los resultados del experimento, consistente en que los
participantes deben impartir una breve charla a la audiencia virtual, muestra
un elevado grado de presencia tanto si los avatares mantienen una actitud
positiva como si su actitud es pasiva o negativa: Los participantes que han impartido su charla a la audiencia (a) hacen comentarios a la salida tales como
“me he sentido bien porque nadie me interrumpía”, mientras que los comentarios de los participantes que han dado su charla al grupo (b) expresan
que no les han podido ignorar, que han perdido el hilo del pensamiento o
que han quedado bloqueados. Una vez más, vemos la importancia que tiene
el poder adaptar las representaciones visuales a los mecanismos perceptivos
humanos. Del mismo modo que percibimos sofisticadas policromías en nuestras pantallas de ordenador cuando en realidad sólo estamos presentando
imágenes formadas con los tres colores fundamentales, podemos llegar a cotas elevadas de presencia en entornos que tengan una calidad visual perceptivamente adecuada, aunque objetivamente su calidad visual sea deficiente.
En todo caso, no hay que olvidar que todavía estamos en los albores del
proceso de consolidación de las técnicas de interacción inmersiva y de
los sistemas de realidad virtual. Estamos en condiciones de definir y diseñar la arquitectura de los nuevos sistemas, podemos construir y analizar
prototipos, todo ello mientras vamos andando el camino que nos ha de
conducir a la construcción de sistemas usables. El problema actual en los
sistemas de realidad virtual no es tanto la capacidad del hardware o del
software, sino las prestaciones de los dispositivos de interacción. Desearíamos poder disponer de sensores más precisos y con menor latencia, así
Lección inaugural 2007
9/1/07
13:36
Página 33
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 33
como de sistemas menos invasivos y más ergonómicos para la inmersión
visual y táctil. Necesitamos profundizar mucho más en el conocimiento
de nuestros mecanismos perceptivos para maximizar la sensación de
presencia, evitando la excesiva calidad visual en aquellos aspectos o detalles que no van a ser percibidos. Pero, en todo caso, hay que reconocer
que los sistemas actuales generan un nivel de presencia que ya es adecuado para su uso con éxito en múltiples campos de aplicación.
5. Epílogo
El largo proceso desde la captación y construcción de los modelos hasta
su procesado y visualización interactiva y hasta su manipulación con técnicas inmersivas de interacción directa tiene un claro objetivo: el de poder ofrecer herramientas intuitivas para comprender, percibir y entender
mejor los objetos que nos son inaccesibles (en el espacio o en el tiempo)
a través de la interacción con sus representaciones digitales.
Se trata en muchos casos de problemas aparentemente sencillos pero que
en realidad esconden una gran dificultad técnica. El objetivo es encontrar las
representaciones y los algoritmos geométricos adecuados al problema planteado en cada caso, optimizando su eficiencia en el marco de las restricciones impuestas por los datos de entrada, las máquinas a utilizar, los sistemas
de visualización o el sistema perceptivo de los usuarios finales. En este contexto, nuestras técnicas de ingeniería tienen como objetivo final la construcción de artificios imperceptibles que posibiliten la interacción directa con los
objetos y la percepción de presencia en la escena virtual.
La mayoría de problemas siguen abiertos, y las soluciones actuales son
aproximaciones subóptimas. Debemos mejorar las prestaciones de los algoritmos de reconstrucción y reparación de modelos. Debemos diseñar
nuevos y mejores algoritmos para la búsqueda asociativa basada en la forma de los objetos, y aumentar la eficiencia de los algoritmos para la inspección en tiempo real de escenas gigantes, todo ello en el marco de un hardware en constante evolución y de un universo de necesidades que los
usuarios nos mantienen en continua expansión. Debemos mejorar las
prestaciones de los dispositivos sensores o de los efectores de fuerza en
los sistemas de realidad virtual, incrementando a su vez su portabilidad y
sus propiedades ergonómicas. Los retos son numerosos y complejos, pero
contamos con el vigor de la juventud de nuestra disciplina.
Lección inaugural 2007
34
9/1/07
13:36
Página 34
PERE BRUNET CROSA
Aparte de las ya mencionadas, ¿qué podemos decir en cuanto a las posibles
aplicaciones futuras de estas herramientas que nos permiten comprender,
percibir y entender mejor los objetos que nos son inaccesibles a través de la
interacción con sus representaciones digitales? Como en los demás campos
de la ingeniería, la intencionalidad y la responsabilidad final del uso de los artificios nos corresponde a los receptores de la tecnología. Nuestra intención
está en la línea de la Declaración de Barcelona10, cuando afirma que se trata
de alcanzar una sociedad más justa basada en el respeto por la naturaleza y
los derechos humanos, que demanda una economía más justa con más solidaridad hacia culturas diferentes y generaciones futuras.
Los sistemas de inspección interactiva e inmersiva nos pueden ayudar a
pensar y a actuar con responsabilidad, como hombres cultos, para crear
en vez de destruir, para conservar en vez de hipotecar. Así como los sistemas de simulación y entrenamiento en medicina basados en modelos
digitales del paciente nos aportan soluciones más humanas, mínimamente invasivas y de mínimo riesgo para el propio paciente, las aplicaciones
de la inmersión presencial son ilimitadas. La presencia es un camino hacia
la tolerancia, hacia la comprensión de las diversidades lingüísticas, culturales y sociales (que constituyen el “genio” de Europa, citando a George
Steiner11 ). Las técnicas de realidad virtual se están aplicando con éxito
como sistemas de ayuda en la resolución de conflictos y en los procesos
de negociación, ya que permiten la presencia virtual en el entorno de “la
otra parte”, y la presencia en general conduce al entendimiento y a la
empatía.Tanto en el estudio del patrimonio cultural (el pasado), en el entrenamiento para la resolución de conflictos (presente) como en la visualización de posibles escenarios futuros, los modelos y representaciones
digitales nos permiten estar presentes en una multiplicidad de momentos
históricos o temporales dentro de un mismo espacio físico. La presencia
multitemporal nos permite contemplar y participar en distintos escenarios, pudiendo incluso detenernos en ellos. Con ello, nos ayuda a comprender las situaciones y a empatizar con sus protagonistas, evitando a su
vez que nos aniquilemos los unos a los otros y que sólo encontremos la
paz perpetua en la amplia tumba que oculta todos los horrores de la violencia y de sus causantes, según nos diría Immanuel Kant12.
10 Declaración de Barcelona, “Internacional Conference on Engineering Education in Sustainable Development”,
EESD’04, 29 de octubre de 2004, http://congress.cimne.upc.es/eesd2004/frontal/Declaration.asp
11
12
George Steiner, “La Idea de Europa”, Arcadia, 2005, p. 40.
Immanuel Kant, “Sobre la Paz Perpetua”,Tecnos-Anaya, 2003, p. 25.
Lección inaugural 2007
9/1/07
13:36
Página 35
SOBRE AGUJAS Y PAJARES: LA REPRESENTACIÓN Y EL PROCESADO DE LAS FORMAS 35
6 . A g r ad e c i m i e n t o s
El autor quiere destacar la contribución de todos los miembros integrantes de su grupo de investigación, y en concreto de sus colegas y colaboradores I. Navazo, A.Vinacua, M. Slater, C. Andujar, M. Fairén y P.P.Vázquez
en los trabajos que han dado lugar a la preparación de este escrito.
7 . R e f e r e n c ia s
Aho, A.V., Hopcroft, J.E. y Ullmann, J.D. (1983),“Data Structures and Algorithms”, Addison-Wesley.
Alma (2006), Alma IT Systems, www.alma3d.com
Andujar, C., Brunet, P. y Ayala, D. (2002),“Topology-Reducing Surface Simplification Using a Discrete
Solid Representation”, ACM Transactions on Graphics,Vol. 21 (2), pp 88-105.
Andujar, C., Brunet, P., Chica, A., Navazo, I., Rossignac, J. y Vinacua, A. (2004),“Computing Maximal Tiles and Application to Impostor-Based Simplification”, Computer Graphics Forum, Vol. 23 (3), pp.
401-410.
Andujar, C., Brunet, P., Chica,A., Navazo, I., Rossignac, J. y Vinacua,A. (2005),“Optimizing the Topological and Combinatorial Complexity of Isosurfaces”, Computer-Aided Design,Vol. 37 (8), pp. 847-857.
Andujar ,C., Fairen, M. y Argelaguet, F. (2006),“A cost-effective approach for developing applicationcontrol GUIs on virtual environments”, Proc. of the IEEE 3d User Interfaces 2006, pp. 42-52.
Andujar, C.,Vázquez, P.P. y Fairén, M. (2004),“Way-Finder: Guided Tours Through Complex Walkthrough Models”, Computer Graphics Forum,Vol. 23 (3), pp. 499-508.
Bentley, J. L. (1975),“Multidimensional binary search trees used for associative retrieval”, Communications of the ACM,Vol. 18 (9), pp. 509–517.
Brunet, P. y Navazo, I. (1990),“Solid Representation and Operation using Extended Octrees”, ACM
Transactions on Graphics,Vol. 9 (2), pp. 170-197.
Dijkstra, E.W. (1976),“A Discipline of Programming”, Prentice-Hall.
Esteve, J., Brunet, P. y Vinacua,A. (2005),“Approximation of a Variable Density Cloud of Points by Shrinking a Discrete Membrane”, Computer Graphics Forum,Vol. 24 (4), pp. 791-808.
Fairén, M. y Brunet, P. (2004),“Mini-VR:A Portable Virtual Reality System”, Computers and Graphics,
Vol. 28, pp. 289-296.
Fuchs, H., Kedem, Z.M. y Taylor, B.F. (1980) “On Visible Surface Generation by A Priori Tree Structures,” Computer Graphics, Siggraph’1980, Vol. 14 (3), pp. 124-133.
Funkhouser,T.A. y Sequin, C. H. (1993),“Adaptive Display Algorithm for Interactive Frame Rates during Visualization of Complex Virtual Environments”, In Proc. of SIGGRAPH’93, pp. 247-254. Computer Graphics Proceedings,Annual Conference Series.
Garey, M.R. y Johnson, D.S. (1979), “Computers and Intractability. A Guide to the Theory of NPCompletenes”, Freeman Ed., San Francisco.
Lección inaugural 2007
36
9/1/07
13:36
Página 36
PERE BRUNET CROSA
Gauss, C.F. (1827), “Disquisitiones Generales Circa Superficies Curvas”, en Dombrowski, P. (1979),
150 Years Alter Gauss’s “Disquisitiones Generales Circa Superficies Curvas”, Astérisque 62, Societé
Mathématique de France, París, 1979.
GeoVirtual (2006), Geo Show 3d, www.geovirtual.com
Hoffmann, C.M., Hopcroft, J.E. y Karasick, M.S., (1988), “Towards implementing robust geometric
computations”, Annual Symposium on Computational Geometry, Proceedings of the 4th Annual
Symposium on Computational Geometry, ACM, Urbana-Champaign, Illinois, pp. 106-117.
Hornung, A. y Kobbelt, L. (2006),“Robust Reconstruction of Watertight 3D Models from Non-uniformly Sampled Point Clouds Without Normal Information”, EG Symposium on Geometry Processing’06.
Knuth, D.E. (1973), “The Art of Computer Programming Vol. III: Sorting and Searching”, AddisonWesley.
Lastra, A. (2006), “Bringing the Real to Virtual Reality”, Proc. of SIACG’06, Iberoamerican Symposium in Computer Graphics, Santiago de Compostela, July 6th 2006.
Lovelace, Augusta Ada (1843),“Sketch of the Analytical Engine Invented by Charles Babbage by L.F.
Menabrea of Turin, Officer of the Military Engineers, with the Notes Upon the Memoir of the Translator”, reproducido en “Charles Babbage and his Calculating Engines. Selected Writings by Charles
Babbage and Others”, Morrison P. and Morrison E. Eds., Dover, New York, 1961.
Mantyla, M. (1988),“An Introduction to Solid Modeling”, Computer Science Press, Rockville MD.
Nievergelt, J. (1974),“Binary Search Trees and File Organization”,ACM Computer Surveys Vol. 6 (3),
pp. 195-207.
Peterson,W.W. (1957),“Addressing for Random Access Storage”, IBM Journal on Research and Development,Vol. 1 (2).
Requicha, A. (1980), “Representations for Rigid Solids:Theory, Methods and Systems”, ACM Computing Surveys Vol. 12 (4), pp. 437-463.
Sales, A. (1980),“La primera generación en los USA: del ENIAC al transistor”, Novática,Vol. 34, pp.
39-46.También, del mismo autor y en el mismo volumen,“La prehistoria de la informática: antecedentes históricos del ENIAC”, Novática.Vol. 34, pp. 16-23.
Samet, H. (1994), “The Design and Analysis of Spatial Data Structures”, Addison-Wesley series in
Computer Science.
Sanchez-Vives, MV. and Slater, M. (2005) “From Presence to Consciousness Through Virtual Reality”,
Nature Reviews Neuroscience,Vol. 6 (4), 2005, pp. 332-339.
ViHAP 3d (2005),“Virtual Heritage: High-Quality 3D Acquisition and Presentation”, EU Projekt IST2001-32641, www.vihap3d.org
Visible Human (1986),“The Visible Human Project”, Nacional Library of Medicine, USA, 1986.
Wirth, N. (1971),“Program Development by Stepwise Refinement”, Communications of the ACM
Vol. 14 (4), pp. 221-227.
Zemanek, H. (1980), “Dixit Algorithmi”, en , “Algorithms in Modern Mathematics and Computer
Science”, A.P. Ershov and D. Knuth Eds., Lecture Notes in Computer Science 122, Springer-Verlag
1980, pp. 1-81.
Descargar