Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización Ramón Hervás1, José Bravo1, Salvador W. Nava2, Gabriel Chavira2 1 Universidad de Castilla-La Mancha, Paseo de la Universidad, 13071 Ciudad Real, España [email protected], [email protected] 2 Universidad autónoma de Tamaulipas, Paseo de la Universidad, 13071 Tampico, Mexico {snava, gchavira}@uat.edu.mx Resumen. La Inteligencia Ambiental es la visión de la Comunidad Europea, a través del ISTAG, que propone que el enfoque tradicional del computador de escritorio se trasforme en múltiples dispositivos en el entorno con los que interactuemos de forma natural. La consciencia del contexto y el análisis de las situaciones cotidianas nos permiten ofrecer interfaces que apoyen las tareas de los usuarios, de manera transparente y personalizada. Un servicio fundamental en los entornos inteligentes es proporcionar información adaptada a los usuarios a través de los dispositivos embebidos en los espacios habituales de los usuarios. Palabras clave: Inteligencia Ambiental; Consciencia de Contexto; Visualización de Información; Interacción Implícita; Adaptabilidad. 1 Introducción El presente trabajo está enfocado a la búsqueda de servicios que faciliten la cotidianeidad a través de una interacción más natural con los ambientes inteligentes. En el paradigma de la Inteligencia Ambiental, las personas quedan inmersas en un entorno digital que es consciente de su presencia, sensible al contexto y adaptable a sus necesidades, hábitos y emociones. Puede entenderse como un paraguas que abarca la Computación Ubicua, integrándose en los objetos del día a día, las Interfaces Naturales que interactúen con los usuarios con enfoques más sencillos y personalizados y, por último, las Comunicaciones Ubicuas, facilitando el trasiego de información entre objetos y de los objetos con las personas, en cualquier lugar y en todo momento. El origen de la Inteligencia Ambiental se puede marcar en las propuestas de Mark Weiser [1] que visualiza la Computación Ubicua como la desaparición del actual computador como una herramienta de todos y para todo. Weiser propuso distribuir la computadora en pequeños dispositivos de funcionalidad reducida y omnipresentes en el entorno que nos rodea. En este sentido, Norman propone “el diseño de aplicaciones que satisfagan la tarea de forma que la herramienta se convierta en 110 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G. parte de la tarea. Las aplicaciones necesitarán comunicarse libremente y sin esfuerzo entre ellas.” [2] Con este enfoque nos podemos acercar a una interacción intuitiva y conseguir que el usuario pueda centrarse plenamente en la tarea a realizar sin preocuparse en absoluto de la herramienta. Únicamente comprendiendo el mundo que las rodea, las aplicaciones pueden ser desarrolladas para facilitar el día a día de las personas. Las acciones de los usuarios pueden ser previstas analizando la situación en la que se encuentran, de una manera similar a nuestra propia forma de comportamiento. Hay que tener en cuenta que la misma pregunta puede tener respuestas distintas según la situación en la que se formulan. Aquí está la principal ventaja de las aplicaciones conscientes de contexto, lo interesante es saber cómo el contexto puede provocar distintas configuraciones y adaptaciones del sistema. Es necesario definir el concepto de contexto y, en nuestro caso, adoptamos la propuesta de Anind K. Dey: Contexto es cualquier información que puede ser caracterizada para definir una situación de una entidad. Una entidad es una persona, lugar u objeto considerado relevante para la interacción entre un usuario y una aplicación, incluyendo al propio usuario y a la aplicación. De acuerdo con esta definición describe una Computación Consciente de Contexto como un sistema que hace uso del contexto para proporcionar información relevante y/o servicios al usuario, donde la relevancia depende de la tarea del usuario. [3] El contexto, tal y como se refleja en su definición, es por naturaleza amplio, complejo y ambiguo. Necesitamos modelos que representen la realidad o, más concretamente, que representen el contexto como fuente de información. En un análisis inicial , hay cinco aspectos importantes a considerar, conocido como la teoría de las cinco W’s: Who, Where, When, What y Why [4], teoría utilizada en múltiples áreas como periodismo y psicología, entre otras. En nuestro caso identificamos el perfil del usuario y su situación, la localización relativa del usuario dentro de un espacio conocido, el momento en el que se encuentra, la tarea que está realizando o quiere realizar y por último y más importante pero complejo, la finalidad u objetivo del usuario. [5] El siguiente apartado de este trabajo analiza nuevos enfoques de interacción entre los usuarios y el entorno inteligente, apostando por la facilidad y la naturalidad para aproximarse a una interacción implícita con los sistemas. Pretendemos contribuir a una mejor comprensión de estos enfoques analizando los esquemas de interacción de los usuarios con un tipo de sistema que entendemos fundamental en Inteligencia Ambiental: Sistemas Pervasivos de Visualización (a partir de este momento se usará su acrónimo en inglés PDS, Pervasive Display Systems), infraestructuras embebidas en el entorno compuestas por múltiples dispositivos públicos de visualización. En los aparatados 3 y 4 se comenta en detalle este tipo de sistemas en general y del servicio ViMos (Visualization Mosaic), como nuestra propuesta de servicio consciente del contexto para visualización de información. Esta experiencia nos ha permitido, en primer lugar identificar los roles de un PDS y, en segundo lugar, analizar que relación hay entre estos roles y la interacción con los usuarios. Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización – 111 2 Hacia una interacción natural Para alcanzar los objetivos de la Inteligencia Ambiental se requieren nuevas formas de interacción. La interacción tradicional necesita de continuas intervenciones del usuario para indicar al sistema cada mínima acción que desea realizar, un enfoque que contradice el hito de la computación invisible. Es importante buscar nuevas formas de interacción más naturales acercándonos lo más posible a una interacción implícita, en la que se hace innecesario el diálogo explícito con el computador. Lo que hasta ahora entendemos con Interacción Persona – Computador en pocos años tendremos que contemplarlo como la interacción Persona – Ambiente Inteligente, que deberá guardar gran semejanza con los esquemas de interacción Persona – Persona [6], la manera más natural de interactuar. Tres conceptos toman un papel fundamental en la interacción entre dos personas (a) El conocimiento compartido, esencial para el entendimiento pero excesivamente amplio y no explícitamente conocido, (b) Los errores en la comunicación y su solución y encauzamiento y, por último, (c) La situación y el contexto. Nos centraremos en este último, para ello, el entorno físico, la situación, el rol de los usuarios, su relación con el resto de usuarios y el entorno, sus objetivos y preferencias deben ser esa rica fuente de información con la que construir sistemas concientes de contexto en los que los modelos actuales de interacción puedan ser transformados. [7] Albrecht Schmidt, en su tesis doctoral, introduce el concepto de Interacción Persona-Computador Implícita (iHCI) definiéndola como la interacción entre un humano con el entorno y con los artefactos ideados para lograr una meta, a través de un proceso de adquisición de entradas implícitas y obtención de salidas implícitas [8]. Las entradas implícitas son acciones y comportamientos de las personas para alcanzar una meta y que no son observados primariamente como una interacción por el computador, pero si capturado e interpretado por el sistema como una entrada. La idea básica es que el sistema pueda percibir la interacción del usuario con el entorno físico, incluso la situación total en que se desarrollan las acciones. Basándose en esta percepción el sistema puede anticipar los objetivos del usuario proporcionándole apoyo para la tarea que está realizando, en forma de salidas integradas en el mismo entorno. La interacción explícita se reduce considerablemente y pasa a un segundo plano. Se trata como una información más del contexto y se integra en él. De esta forma, las aplicaciones basadas en Interacción Implícita pueden proporcionar mejoras de gran interés. Además de las novedosas aplicaciones y servicios, los usuarios estarán más satisfechos al interactuar de forma natural y sin necesidad de un proceso previo de aprendizaje. [9] Además de enfoques como el de la interacción implícita, en un mundo donde multitud de objetos y personas estan conectado con el resto de forma invisible, se están proponiendo otros novedosos estilos de interacción. En el proyecto Digital Aura[10] se introduce el concepto de interacción espontánea como modelo dónde los objetos empiezan a interactuar cuando detectan en su proximidad objetos de su interés. Otro concepto propuesto en este sentido es el de interacción persistente, orientado a la necesidad de sincronizar la actividad del usuario incluso si va cambiando el dispositivo dónde esta trabajando. [11] 112 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G. Una evolución de la interacción implícita es la interacción embebida [12], dónde la tecnología está embebida en artefactos de uso cotidiano que interpretan las acciones para proporcionar funcionalidades añadidas gracias al conocimiento del contexto. 3 Sistemas Pervasivos de Visualización Cuando trabajamos en entornos inteligentes, entre otras infraestructuras, consideramos la necesidad de dispositivos cuya funcionalidad es mostrar información. Principalmente tratamos con pantallas públicas de gran tamaño (en nuestro caso de alrededor de 42 pulgadas) que se distribuyen por los espacios interiores [13]. Es posible distinguir los espacios dónde colocar estos dispositivos analizando la naturaleza de las situaciones que se producen. En [14] se distingue entre espacios de transito (pasillos), espacios sociales (cafetería, tiendas, etc.), espacios abiertos (jardines, terrazas, etc.) o espacios informativos (tablones de noticias). A estos se puede añadir aquellos espacios destinados a reuniones o bien a conferencias. Se trata de espacios no propiamente públicos pero que, en determinadas situaciones pueden cambiar su finalidad. Por ejemplo, una sala de conferencias en un congreso académico o un aula cualquiera de un centro docente tienen una finalidad muy concreta mientras se da una charla o una clase pero en los espacios de tiempo de descanso sus dispositivos de visualización deben adaptarse a situaciones más cercanas a las de los espacios sociales. Por tanto, cada PDS debe utilizar información de su entorno para adaptar su funcionalidad, teniendo en cuenta el espacio en el que se encuentra pero simplemente como una información más para describir cada situación. Un PDS debe cumplir tres características fundamentales [15]. En primer lugar están ideados para espacios públicos, es decir, no se encuentran bajo el control de un único usuario. En segundo lugar su propósito ha de ser múltiple, aceptando aplicaciones con funcionalidades y objetivos diversos. Por último los PDS deben ser capaces de controlar la coordinación entre distintos dispositivos de visualización. 4 Servicio de Visualización e Interacción 4.1 Nuestro servicio de visualización de información (ViMos) Nuestra contribución se basa en aplicar la consciencia de contexto para proporcionar información adaptada a los usuarios a través de los dispositivos del entorno y gracias a la tecnología que permita la identificación como entrada especializada, mediante un proceso transparente al usuario (ViMos). Sin embargo el mundo real es complejo y la propia mente humana requiere procesos cognitivos complejos para entenderlo. En realidad creamos un modelo que oculta la complejidad del mundo real. Los sistemas computacionales necesitan que les proporcionemos modelos que abstraigan el entorno para que puedan comprenderlo (al menos en parte) y actuar en consecuencia. Tal y como hacemos los humanos. Por ello, parte fundamental de este trabajo es una ontología que sirve de modelo de contexto para este tipo de servicios y otros de Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización – 113 naturaleza similar. En [16] se describe en detalle el modelo utilizado como soporte para este servicio de visualización. La generación de mosaicos de información se realiza de forma que se adapte su interfaz a la situación de contexto de cada momento. Sólo de esta forma se puede mejorar el dinamismo, la adaptabilidad y la calidad de los contenidos ofrecidos. Las aplicaciones y escenarios de uso para esta propuesta son múltiples. Como experiencias concretas, se han estudiado varios contextos, para los que se han desarrollado los correspondientes prototipos. ViMos se ha especializado para su aplicación en entornos docentes, como el aula tradicional, el laboratorio de investigación y los congresos académicos, también en otros entornos profesionales como el contexto médico y, por supuesto, en el propio hogar. 4.2 Arquitectura e implementación Disponemos de un modelo del contexto representado por una ontología y que sirve de descripción del mundo real que rodea al sistema. En cada instante se conoce la información, previamente filtrada según la ontología y obtenida del sistema de bases de datos y de los sensores embebidos en el entorno (en principio las antenas y las etiquetas RFID). El módulo de análisis de contexto se encarga de decidir cuando un cambio en el mundo real debe provocar cambios en los dispositivos de visualización. No todos los cambios que se producen en la realidad son significativos para este tipo de sistemas, es el modelo el que determina cuales son importantes y cuales no, es más, un mismo cambio puede ser significativo o no dependiendo de la propia situación. El módulo de Análisis además se encarga de que el sistema de bases de datos mantenga la consistencia de su información respecto a dichos cambios. El Módulo Generador de Mosaicos proporciona la descripción XML del mosaico al Módulo Compositor. Para obtenerla tiene que crear una representación de la situación actual a través del modelo de contexto. Simplemente con esta información el módulo debe ser capaz de obtener una interfaz (en forma de su descripción en XML) en la que se incluya la información adecuada y óptima a las condiciones del entorno. El usuario, sin ninguna intervención más allá de su presencia, obtiene toda la información que le servirá de apoyo a la tarea que vaya a realizar. A partir de la descripción se obtienen los contenidos concretos a mostrar y se genera el mosaico, siguiendo las indicaciones de la descripción del Módulo Generador pero adecuándose a las peculiaridades de los dispositivos del entorno. Los contenidos a mostrar pueden ser de muy distinta naturaleza (imágenes, texto, presentaciones, etc.) pero el sistema debe ser capaz de ofrecer todos los necesarios de forma adecuada. La figura 1 lo muestra con mayor nitidez. 114 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G. Fig. 1. Proceso de generación del Mosaico de Información. 4.3 Roles de Mosaicos e Interacción en ViMos Para los distintos casos de estudio se generan mosaicos muy variados. Incluso para cada caso de estudio son diferentes las estructuras de mosaico posibles. Cuando en un caso de estudio se da con frecuencia una situación con características determinadas, el mosaico ofrecido puede tener una estructura concreta y son los contenidos los que varían. Por ejemplo, en entornos docentes se puede pensar en un tipo de mosaico para las clases teóricas, una situación muy habitual. Precisamente cuando se da un caso así decimos que el mosaico tiene un rol, es decir es un tipo de mosaico para una funcionalidad muy concreta de una situación habitual. Tabla 1. Roles de mosaico. Rol del mosaico Situación Uno o varios usuarios que desean mostrar información preparada previamente para un propósito concreto. Lugar frecuentado por usuarios, Noticias típicamente en salas de descanso, lugares de paso o espacios destinados específicamente a ofrecer información. Grupos de personas con intereses Coordinación de y objetivos comunes, típicamente Grupos inmersos en los mismos proyectos. Presentación Enfoque de Interacción Usuarios interactuando (Aproximado) Interacción implícita + natural Baja (1-2) Interacción implícita Alta (1 – 12) Interacción implícita + natural Media (1-6) + planificación Principalmente distinguimos tres roles de mosaico principales, que se repiten en los distintos contextos a estudio en los que se está trabajando. Se muestra en detalle en la Tabla 1 y a continuación se explican: Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización – 115 a. Presentación. El PDS tiene la función de servir de pantalla para mostrar presentaciones previamente preparadas. El mosaico tiene que disponer de una zona principal y destacada que muestre este contenido y reserva otros espacios menos significativos para añadir otra información relevante a la situación. La interacción se produce en el sentido que la acción del usuario de acercarse a la pantalla es captada y se genera el mosaico con su presentación. Este tipo de rol de mosaico requiere de complementos. En nuestro interés por acercarnos a una interacción más natural el sistema se ha implementado integrando dos sensores de infrarrojos (microcontrolador Basic X24 que transmite a través de Bluetooth). La figura 2 muestra los distintos componentes necesarios para el complemento infrarrojo. El usuario con un barrido de su mano delante de la pantalla indica al sistema que desea avanzar o retroceder en las páginas de su presentación, dependiendo de si realiza un barrido hacia la derecha o hacia la izquierda respectivamente. La funcionalidad de los sensores varía dependiendo, nuevamente, de la situación y de las preferencias de cada usuario. Fig. 2. Sensores de infrarrojos con Bluetooth. Fig. 3. Mosaico para un congreso académico. La figura 3 muestra un mosaico generado para un congreso académico. Los eventos basados en conferencias reúnen a un importante número de personas con necesidades similares y a los que se les puede ofrecer información de gran utilidad para el desarrollo de su trabajo y para su mayor confort durante el evento. Dicha figura es una interfaz generada automáticamente para una conferencia. Durante la presentación de una contribución se reserva la mayor parte al material de la misma pero también se ofrece información de los autores (datos corporativos, forma de contacto, líneas de investigación, etc.) así como la planificación de la sesión y de otras salas paralelas. b. Noticias. Múltiples usuarios en zonas públicas de alto tránsito. La funcionalidad deseada es ofrecer contenidos de interés a todos los usuarios en las proximidades (~ 1 metro) de cada dispositivo de visualización, manteniendo principios de privacidad. Las características de este tipo de mosaicos de información que deben adaptarse al perfil e intereses de múltiples usuarios hacen necesario potenciar la consciencia de contexto a favor de una interacción implícita. 116 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G. Fig. 4. Mosaicos generados para una zona de información de centro docente y de un congreso académico. Nuevamente fijándonos en el contexto de los congresos académicos podemos ofrecer información que ayude a los asistentes. En la sala común se muestra información general del congreso haciendo hincapié en la distribución de los espacios y la forma de llegar a cada lugar, así como avisos concretos y noticias adaptadas a su perfil, siempre guardando la privacidad para las personas cercanas a un dispositivo de visualización. Un mosaico como el de la figura 4 (izquierda) puede ser generado para ofrecer los mencionados servicios. Un enfoque similar se puede aplicar para dispositivos públicos de un centro universitario (derecha) c. Coordinación de grupos: Varios usuarios con intereses comunes y agendas entrelazadas cuyo flujo de información requiere gran dinamismo. El mosaico puede contemplar dos estados. En primer lugar, cuando existen usuarios en la sala, aportando información de interés para apoyar el trabajo, tanto común como individual. Otra situación es en la que uno o varios de estos usuarios se acercan a la pantalla con el fin de mostrar información propia al resto. Este segundo caso puede requerir de una planificación previa. Se facilita una herramienta que, nuevamente se alimenta del contexto, que sirve de apoyo para la preparación de estas reuniones. La Figura 5 (izquierda) muestra un posible mosaico para un grupo de investigación. Proporciona información de localización de los miembros del grupo, un elemento bastante útil cuando se dispone de distintos espacios. La zona principal en este caso se reserva para una agenda grupal que muestra los compromisos y tareas de los miembros, y sirve también para determinar la disponibilidad de cada uno. El resto del mosaico contiene información concreta para este tipo de escenario: muestra las fechas importantes para los próximos congresos, noticias relacionadas, avisos o comentarios de unos miembros a otros y, por último documentos de interés recomendados. Todo ello, nuevamente, dependiente de las condiciones de contexto. Para este entorno concreto se utiliza la propia agenda de cada usuario que servirá para facilitar el trasiego de información entre los miembros del grupo de investigación. (en general, de un grupo de trabajo). En la parte derecha se presenta un mosaico de información para las sesiones clínicas programadas. Cada médico dispone de una aplicación Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización – 117 que le permite planificar la exposición de sus casos. La planificación, esencialmente, consiste en determinar qué informes y pruebas van a ser útiles durante la charla con el resto de médicos. Se muestra un mosaico obtenido para una sesión en la que se va a valorar y diagnosticar un caso de rotura de cadera, habiéndose producido ciertas complicaciones, principalmente una trombosis. Fig. 5. Mosaico generado para coordinar un grupo de investigación y mosaico generado para apoyar una sesión clínica. 5 Conclusiones y trabajo futuro. Este artículo pretende ofrecer un análisis de nuevos enfoques de interacción necesarios para alcanzar los objetivos marcados para ambientes inteligentes. Partimos de la experiencia con prototipos para diversos contextos y situaciones. Al ofrecer servicios conscientes de contexto de visualización de información observamos características comunes y, a partir de ellas, identificamos roles en los Sistemas Pervasivos de Visualización. El análisis de los roles y de la interacción según estos, favorece el proceso de generación automática de las interfaces de nuestro servicio de visualización. Estas aportaciones nos acercan a una desaparición de la interacción (disappearing interaction) en el mismo sentido en que los entornos inteligentes buscan una desaparición psicológica de los computadores (disappearing computer) Agradecimientos El trabajo aquí presentado está financiado por el proyecto SERVIDOR (PIB-05-034) de la Junta de Comunidades de Castilla-La Mancha y con el proyecto CICYC del Ministerio de Ciencia y Tecnología denominado MOSAIC LEARNING (TSI200508225-C07-07). 118 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G. Referencias 1. Weiser, M., The computer of the twenty-first century. Scientific American, 1991. September: p. 94-104. 2. Norman, D.A., The Invisible Computer. 1998, Cambridge: MIT Press. 3. Dey, A.K., Understanding and Using Context. Personal and Ubiquitous Computing, 2001. 5(1): p. 4-7. 4. Brooks, K. The Context Quintet: narrative elements applied to Context Awareness. in Humn Computer Interaction. 2003. Crete (Greece). 5. Bravo, J., et al., Visualization Services in a Conference Context: An approach by RFID Technology. Journal of Universal Computer Science, 2006. 12(3): p. 270-283. 6. Reeves, B. and Nass, C., The Media Equation, C.U. Press, Editor. 1996: Cambridge. 7. Schmidt, A., Ubiquitous Computing - Computing in Context, in Computing Department. 2002, Lancaster University. p. 294. 8. Schmidt, A., Implicit Human Computer Interaction Through Context. Personal Technologies, 2000. 4(2&3): p. 191-199. 9. Kawsar, F., Fujinami, K., and Nakajima, T. Augmenting Everyday Life with Sentient Artefacts. in Smart Objects & Ambient Intelligence (sOc-EUSAI). 2005. Grenoble (France). 10.Ferscha, A., et al. Digital Aura. in Advances in Pervasive Computing in Pervasive 2004. 2004. 11.Abowd, G. and Mynatt, E.D., Charting past, present and future research in ubiquitous computing. HCI in the new millennium, 2000. 7(1): p. 29-58. 12.Schmidt, A., Kranz, M., and Holleis, P. Interacting with the Ubiquitous Computing Towards Embedding Interaction. in Smart Objects & Ambient Intelligence (sOc-EuSAI 2005). 2005. Grenoble (France). 13.Bravo, J., Hervás, R., and Chavira, G., Ubiquitous Computing at classroom: An approach through identification process. Journal of Universal Computer Science, 2005. 11(9): p. 1494-1504. 14.Mitchell, K. and Race, N.J.P. Oi! Capturing User Attention Within Pervasive Display Environments. in Workshop on Pervasive Display Infrastructures, Interfaces and Applications (at the Pervasive 2006). 2006. Dublin (Ireland). 15.José, R. Beyond Application-Led Research in Pervasive Display Systems. in Workshop on Pervasive Display Infrastructures, Interfaces and Applications (at the Pervasive 2006). 2006. Dublin (Ireland). 16.Hervás, R., et al. Servicios de Visualización de Información Conscientes del Contexto: Modelo Semi-Formal y Escenarios. in Conferencia Ibérica de Sistemas y Tecnologías de la Información. 2006. Esposende (Portugal).