Interacción Natural en Ambientes Inteligentes a través de

Anuncio
Interacción Natural en Ambientes Inteligentes a través
de Roles en Mosaicos de Visualización
Ramón Hervás1, José Bravo1, Salvador W. Nava2, Gabriel Chavira2
1
Universidad de Castilla-La Mancha, Paseo de la Universidad,
13071 Ciudad Real, España
[email protected], [email protected]
2
Universidad autónoma de Tamaulipas, Paseo de la Universidad,
13071 Tampico, Mexico
{snava, gchavira}@uat.edu.mx
Resumen. La Inteligencia Ambiental es la visión de la Comunidad Europea, a
través del ISTAG, que propone que el enfoque tradicional del computador de
escritorio se trasforme en múltiples dispositivos en el entorno con los que
interactuemos de forma natural. La consciencia del contexto y el análisis de las
situaciones cotidianas nos permiten ofrecer interfaces que apoyen las tareas de
los usuarios, de manera transparente y personalizada. Un servicio fundamental
en los entornos inteligentes es proporcionar información adaptada a los usuarios
a través de los dispositivos embebidos en los espacios habituales de los
usuarios.
Palabras clave: Inteligencia Ambiental; Consciencia de Contexto;
Visualización de Información; Interacción Implícita; Adaptabilidad.
1 Introducción
El presente trabajo está enfocado a la búsqueda de servicios que faciliten la
cotidianeidad a través de una interacción más natural con los ambientes inteligentes.
En el paradigma de la Inteligencia Ambiental, las personas quedan inmersas en un
entorno digital que es consciente de su presencia, sensible al contexto y adaptable a
sus necesidades, hábitos y emociones. Puede entenderse como un paraguas que abarca
la Computación Ubicua, integrándose en los objetos del día a día, las Interfaces
Naturales que interactúen con los usuarios con enfoques más sencillos y
personalizados y, por último, las Comunicaciones Ubicuas, facilitando el trasiego de
información entre objetos y de los objetos con las personas, en cualquier lugar y en
todo momento.
El origen de la Inteligencia Ambiental se puede marcar en las propuestas de Mark
Weiser [1] que visualiza la Computación Ubicua como la desaparición del actual
computador como una herramienta de todos y para todo. Weiser propuso distribuir la
computadora en pequeños dispositivos de funcionalidad reducida y omnipresentes en
el entorno que nos rodea. En este sentido, Norman propone “el diseño de
aplicaciones que satisfagan la tarea de forma que la herramienta se convierta en
110 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G.
parte de la tarea. Las aplicaciones necesitarán comunicarse libremente y sin esfuerzo
entre ellas.” [2] Con este enfoque nos podemos acercar a una interacción intuitiva y
conseguir que el usuario pueda centrarse plenamente en la tarea a realizar sin
preocuparse en absoluto de la herramienta.
Únicamente comprendiendo el mundo que las rodea, las aplicaciones pueden ser
desarrolladas para facilitar el día a día de las personas. Las acciones de los usuarios
pueden ser previstas analizando la situación en la que se encuentran, de una manera
similar a nuestra propia forma de comportamiento. Hay que tener en cuenta que la
misma pregunta puede tener respuestas distintas según la situación en la que se
formulan. Aquí está la principal ventaja de las aplicaciones conscientes de contexto,
lo interesante es saber cómo el contexto puede provocar distintas configuraciones y
adaptaciones del sistema.
Es necesario definir el concepto de contexto y, en nuestro caso, adoptamos la
propuesta de Anind K. Dey: Contexto es cualquier información que puede ser
caracterizada para definir una situación de una entidad. Una entidad es una persona,
lugar u objeto considerado relevante para la interacción entre un usuario y una
aplicación, incluyendo al propio usuario y a la aplicación. De acuerdo con esta
definición describe una Computación Consciente de Contexto como un sistema que
hace uso del contexto para proporcionar información relevante y/o servicios al
usuario, donde la relevancia depende de la tarea del usuario. [3]
El contexto, tal y como se refleja en su definición, es por naturaleza amplio,
complejo y ambiguo. Necesitamos modelos que representen la realidad o, más
concretamente, que representen el contexto como fuente de información. En un
análisis inicial , hay cinco aspectos importantes a considerar, conocido como la teoría
de las cinco W’s: Who, Where, When, What y Why [4], teoría utilizada en múltiples
áreas como periodismo y psicología, entre otras. En nuestro caso identificamos el
perfil del usuario y su situación, la localización relativa del usuario dentro de un
espacio conocido, el momento en el que se encuentra, la tarea que está realizando o
quiere realizar y por último y más importante pero complejo, la finalidad u objetivo
del usuario. [5]
El siguiente apartado de este trabajo analiza nuevos enfoques de interacción entre
los usuarios y el entorno inteligente, apostando por la facilidad y la naturalidad para
aproximarse a una interacción implícita con los sistemas. Pretendemos contribuir a
una mejor comprensión de estos enfoques analizando los esquemas de interacción de
los usuarios con un tipo de sistema que entendemos fundamental en Inteligencia
Ambiental: Sistemas Pervasivos de Visualización (a partir de este momento se usará
su acrónimo en inglés PDS, Pervasive Display Systems), infraestructuras embebidas
en el entorno compuestas por múltiples dispositivos públicos de visualización. En los
aparatados 3 y 4 se comenta en detalle este tipo de sistemas en general y del servicio
ViMos (Visualization Mosaic), como nuestra propuesta de servicio consciente del
contexto para visualización de información. Esta experiencia nos ha permitido, en
primer lugar identificar los roles de un PDS y, en segundo lugar, analizar que relación
hay entre estos roles y la interacción con los usuarios.
Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización – 111
2 Hacia una interacción natural
Para alcanzar los objetivos de la Inteligencia Ambiental se requieren nuevas formas
de interacción. La interacción tradicional necesita de continuas intervenciones del
usuario para indicar al sistema cada mínima acción que desea realizar, un enfoque que
contradice el hito de la computación invisible. Es importante buscar nuevas formas de
interacción más naturales acercándonos lo más posible a una interacción implícita, en
la que se hace innecesario el diálogo explícito con el computador.
Lo que hasta ahora entendemos con Interacción Persona – Computador en pocos
años tendremos que contemplarlo como la interacción Persona – Ambiente
Inteligente, que deberá guardar gran semejanza con los esquemas de interacción
Persona – Persona [6], la manera más natural de interactuar. Tres conceptos toman un
papel fundamental en la interacción entre dos personas (a) El conocimiento
compartido, esencial para el entendimiento pero excesivamente amplio y no
explícitamente conocido, (b) Los errores en la comunicación y su solución y
encauzamiento y, por último, (c) La situación y el contexto. Nos centraremos en este
último, para ello, el entorno físico, la situación, el rol de los usuarios, su relación con
el resto de usuarios y el entorno, sus objetivos y preferencias deben ser esa rica fuente
de información con la que construir sistemas concientes de contexto en los que los
modelos actuales de interacción puedan ser transformados. [7]
Albrecht Schmidt, en su tesis doctoral, introduce el concepto de Interacción
Persona-Computador Implícita (iHCI) definiéndola como la interacción entre un
humano con el entorno y con los artefactos ideados para lograr una meta, a través de
un proceso de adquisición de entradas implícitas y obtención de salidas implícitas
[8]. Las entradas implícitas son acciones y comportamientos de las personas para
alcanzar una meta y que no son observados primariamente como una interacción por
el computador, pero si capturado e interpretado por el sistema como una entrada. La
idea básica es que el sistema pueda percibir la interacción del usuario con el entorno
físico, incluso la situación total en que se desarrollan las acciones. Basándose en esta
percepción el sistema puede anticipar los objetivos del usuario proporcionándole
apoyo para la tarea que está realizando, en forma de salidas integradas en el mismo
entorno. La interacción explícita se reduce considerablemente y pasa a un segundo
plano. Se trata como una información más del contexto y se integra en él. De esta
forma, las aplicaciones basadas en Interacción Implícita pueden proporcionar mejoras
de gran interés. Además de las novedosas aplicaciones y servicios, los usuarios
estarán más satisfechos al interactuar de forma natural y sin necesidad de un proceso
previo de aprendizaje. [9]
Además de enfoques como el de la interacción implícita, en un mundo donde
multitud de objetos y personas estan conectado con el resto de forma invisible, se
están proponiendo otros novedosos estilos de interacción. En el proyecto Digital
Aura[10] se introduce el concepto de interacción espontánea como modelo dónde los
objetos empiezan a interactuar cuando detectan en su proximidad objetos de su
interés. Otro concepto propuesto en este sentido es el de interacción persistente,
orientado a la necesidad de sincronizar la actividad del usuario incluso si va
cambiando el dispositivo dónde esta trabajando. [11]
112 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G.
Una evolución de la interacción implícita es la interacción embebida [12], dónde
la tecnología está embebida en artefactos de uso cotidiano que interpretan las acciones
para proporcionar funcionalidades añadidas gracias al conocimiento del contexto.
3 Sistemas Pervasivos de Visualización
Cuando trabajamos en entornos inteligentes, entre otras infraestructuras,
consideramos la necesidad de dispositivos cuya funcionalidad es mostrar información.
Principalmente tratamos con pantallas públicas de gran tamaño (en nuestro caso de
alrededor de 42 pulgadas) que se distribuyen por los espacios interiores [13]. Es
posible distinguir los espacios dónde colocar estos dispositivos analizando la
naturaleza de las situaciones que se producen. En [14] se distingue entre espacios de
transito (pasillos), espacios sociales (cafetería, tiendas, etc.), espacios abiertos
(jardines, terrazas, etc.) o espacios informativos (tablones de noticias). A estos se
puede añadir aquellos espacios destinados a reuniones o bien a conferencias. Se trata
de espacios no propiamente públicos pero que, en determinadas situaciones pueden
cambiar su finalidad. Por ejemplo, una sala de conferencias en un congreso
académico o un aula cualquiera de un centro docente tienen una finalidad muy
concreta mientras se da una charla o una clase pero en los espacios de tiempo de
descanso sus dispositivos de visualización deben adaptarse a situaciones más cercanas
a las de los espacios sociales. Por tanto, cada PDS debe utilizar información de su
entorno para adaptar su funcionalidad, teniendo en cuenta el espacio en el que se
encuentra pero simplemente como una información más para describir cada situación.
Un PDS debe cumplir tres características fundamentales [15]. En primer lugar
están ideados para espacios públicos, es decir, no se encuentran bajo el control de un
único usuario. En segundo lugar su propósito ha de ser múltiple, aceptando
aplicaciones con funcionalidades y objetivos diversos. Por último los PDS deben ser
capaces de controlar la coordinación entre distintos dispositivos de visualización.
4 Servicio de Visualización e Interacción
4.1 Nuestro servicio de visualización de información (ViMos)
Nuestra contribución se basa en aplicar la consciencia de contexto para proporcionar
información adaptada a los usuarios a través de los dispositivos del entorno y gracias
a la tecnología que permita la identificación como entrada especializada, mediante un
proceso transparente al usuario (ViMos). Sin embargo el mundo real es complejo y la
propia mente humana requiere procesos cognitivos complejos para entenderlo. En
realidad creamos un modelo que oculta la complejidad del mundo real. Los sistemas
computacionales necesitan que les proporcionemos modelos que abstraigan el entorno
para que puedan comprenderlo (al menos en parte) y actuar en consecuencia. Tal y
como hacemos los humanos. Por ello, parte fundamental de este trabajo es una
ontología que sirve de modelo de contexto para este tipo de servicios y otros de
Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización – 113
naturaleza similar. En [16] se describe en detalle el modelo utilizado como soporte
para este servicio de visualización.
La generación de mosaicos de información se realiza de forma que se adapte su
interfaz a la situación de contexto de cada momento. Sólo de esta forma se puede
mejorar el dinamismo, la adaptabilidad y la calidad de los contenidos ofrecidos. Las
aplicaciones y escenarios de uso para esta propuesta son múltiples. Como
experiencias concretas, se han estudiado varios contextos, para los que se han
desarrollado los correspondientes prototipos. ViMos se ha especializado para su
aplicación en entornos docentes, como el aula tradicional, el laboratorio de
investigación y los congresos académicos, también en otros entornos profesionales
como el contexto médico y, por supuesto, en el propio hogar.
4.2 Arquitectura e implementación
Disponemos de un modelo del contexto representado por una ontología y que sirve de
descripción del mundo real que rodea al sistema. En cada instante se conoce la
información, previamente filtrada según la ontología y obtenida del sistema de bases
de datos y de los sensores embebidos en el entorno (en principio las antenas y las
etiquetas RFID). El módulo de análisis de contexto se encarga de decidir cuando un
cambio en el mundo real debe provocar cambios en los dispositivos de visualización.
No todos los cambios que se producen en la realidad son significativos para este tipo
de sistemas, es el modelo el que determina cuales son importantes y cuales no, es
más, un mismo cambio puede ser significativo o no dependiendo de la propia
situación. El módulo de Análisis además se encarga de que el sistema de bases de
datos mantenga la consistencia de su información respecto a dichos cambios.
El Módulo Generador de Mosaicos proporciona la descripción XML del mosaico
al Módulo Compositor. Para obtenerla tiene que crear una representación de la
situación actual a través del modelo de contexto. Simplemente con esta información el
módulo debe ser capaz de obtener una interfaz (en forma de su descripción en XML)
en la que se incluya la información adecuada y óptima a las condiciones del entorno.
El usuario, sin ninguna intervención más allá de su presencia, obtiene toda la
información que le servirá de apoyo a la tarea que vaya a realizar.
A partir de la descripción se obtienen los contenidos concretos a mostrar y se
genera el mosaico, siguiendo las indicaciones de la descripción del Módulo
Generador pero adecuándose a las peculiaridades de los dispositivos del entorno. Los
contenidos a mostrar pueden ser de muy distinta naturaleza (imágenes, texto,
presentaciones, etc.) pero el sistema debe ser capaz de ofrecer todos los necesarios de
forma adecuada. La figura 1 lo muestra con mayor nitidez.
114 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G.
Fig. 1. Proceso de generación del Mosaico de Información.
4.3 Roles de Mosaicos e Interacción en ViMos
Para los distintos casos de estudio se generan mosaicos muy variados. Incluso para
cada caso de estudio son diferentes las estructuras de mosaico posibles. Cuando en un
caso de estudio se da con frecuencia una situación con características determinadas, el
mosaico ofrecido puede tener una estructura concreta y son los contenidos los que
varían. Por ejemplo, en entornos docentes se puede pensar en un tipo de mosaico para
las clases teóricas, una situación muy habitual. Precisamente cuando se da un caso así
decimos que el mosaico tiene un rol, es decir es un tipo de mosaico para una
funcionalidad muy concreta de una situación habitual.
Tabla 1. Roles de mosaico.
Rol del mosaico Situación
Uno o varios usuarios que
desean mostrar información
preparada previamente para un
propósito concreto.
Lugar frecuentado por usuarios,
Noticias
típicamente en salas de descanso,
lugares de paso o espacios
destinados específicamente a
ofrecer información.
Grupos de personas con intereses
Coordinación de y objetivos comunes, típicamente
Grupos
inmersos
en
los
mismos
proyectos.
Presentación
Enfoque de
Interacción
Usuarios
interactuando
(Aproximado)
Interacción
implícita + natural
Baja (1-2)
Interacción
implícita
Alta (1 – 12)
Interacción
implícita + natural Media (1-6)
+ planificación
Principalmente distinguimos tres roles de mosaico principales, que se repiten en los
distintos contextos a estudio en los que se está trabajando. Se muestra en detalle en la
Tabla 1 y a continuación se explican:
Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización – 115
a.
Presentación. El PDS tiene la función de servir de pantalla para mostrar
presentaciones previamente preparadas. El mosaico tiene que disponer de una
zona principal y destacada que muestre este contenido y reserva otros espacios
menos significativos para añadir otra información relevante a la situación. La
interacción se produce en el sentido que la acción del usuario de acercarse a la
pantalla es captada y se genera el mosaico con su presentación. Este tipo de rol de
mosaico requiere de complementos. En nuestro interés por acercarnos a una
interacción más natural el sistema se ha implementado integrando dos sensores
de infrarrojos (microcontrolador Basic X24 que transmite a través de Bluetooth).
La figura 2 muestra los distintos componentes necesarios para el complemento
infrarrojo. El usuario con un barrido de su mano delante de la pantalla indica al
sistema que desea avanzar o retroceder en las páginas de su presentación,
dependiendo de si realiza un barrido hacia la derecha o hacia la izquierda
respectivamente. La funcionalidad de los sensores varía dependiendo,
nuevamente, de la situación y de las preferencias de cada usuario.
Fig. 2. Sensores de infrarrojos con Bluetooth.
Fig. 3. Mosaico para un congreso académico.
La figura 3 muestra un mosaico generado para un congreso académico. Los
eventos basados en conferencias reúnen a un importante número de personas con
necesidades similares y a los que se les puede ofrecer información de gran utilidad
para el desarrollo de su trabajo y para su mayor confort durante el evento. Dicha
figura es una interfaz generada automáticamente para una conferencia. Durante la
presentación de una contribución se reserva la mayor parte al material de la misma
pero también se ofrece información de los autores (datos corporativos, forma de
contacto, líneas de investigación, etc.) así como la planificación de la sesión y de
otras salas paralelas.
b.
Noticias. Múltiples usuarios en zonas públicas de alto tránsito. La funcionalidad
deseada es ofrecer contenidos de interés a todos los usuarios en las proximidades
(~ 1 metro) de cada dispositivo de visualización, manteniendo principios de
privacidad. Las características de este tipo de mosaicos de información que deben
adaptarse al perfil e intereses de múltiples usuarios hacen necesario potenciar la
consciencia de contexto a favor de una interacción implícita.
116 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G.
Fig. 4. Mosaicos generados para una zona de información de centro docente y de un congreso
académico.
Nuevamente fijándonos en el contexto de los congresos académicos podemos
ofrecer información que ayude a los asistentes. En la sala común se muestra
información general del congreso haciendo hincapié en la distribución de los
espacios y la forma de llegar a cada lugar, así como avisos concretos y noticias
adaptadas a su perfil, siempre guardando la privacidad para las personas
cercanas a un dispositivo de visualización. Un mosaico como el de la figura 4
(izquierda) puede ser generado para ofrecer los mencionados servicios. Un
enfoque similar se puede aplicar para dispositivos públicos de un centro
universitario (derecha)
c.
Coordinación de grupos: Varios usuarios con intereses comunes y agendas
entrelazadas cuyo flujo de información requiere gran dinamismo. El mosaico
puede contemplar dos estados. En primer lugar, cuando existen usuarios en la
sala, aportando información de interés para apoyar el trabajo, tanto común como
individual. Otra situación es en la que uno o varios de estos usuarios se acercan a
la pantalla con el fin de mostrar información propia al resto. Este segundo caso
puede requerir de una planificación previa. Se facilita una herramienta que,
nuevamente se alimenta del contexto, que sirve de apoyo para la preparación de
estas reuniones. La Figura 5 (izquierda) muestra un posible mosaico para un
grupo de investigación. Proporciona información de localización de los miembros
del grupo, un elemento bastante útil cuando se dispone de distintos espacios. La
zona principal en este caso se reserva para una agenda grupal que muestra los
compromisos y tareas de los miembros, y sirve también para determinar la
disponibilidad de cada uno. El resto del mosaico contiene información concreta
para este tipo de escenario: muestra las fechas importantes para los próximos
congresos, noticias relacionadas, avisos o comentarios de unos miembros a otros
y, por último documentos de interés recomendados. Todo ello, nuevamente,
dependiente de las condiciones de contexto. Para este entorno concreto se utiliza
la propia agenda de cada usuario que servirá para facilitar el trasiego de
información entre los miembros del grupo de investigación. (en general, de un
grupo de trabajo). En la parte derecha se presenta un mosaico de información
para las sesiones clínicas programadas. Cada médico dispone de una aplicación
Interacción Natural en Ambientes Inteligentes a través de Roles en Mosaicos de Visualización – 117
que le permite planificar la exposición de sus casos. La planificación,
esencialmente, consiste en determinar qué informes y pruebas van a ser útiles
durante la charla con el resto de médicos. Se muestra un mosaico obtenido para
una sesión en la que se va a valorar y diagnosticar un caso de rotura de cadera,
habiéndose producido ciertas complicaciones, principalmente una trombosis.
Fig. 5. Mosaico generado para coordinar un grupo de investigación y mosaico generado para
apoyar una sesión clínica.
5 Conclusiones y trabajo futuro.
Este artículo pretende ofrecer un análisis de nuevos enfoques de interacción
necesarios para alcanzar los objetivos marcados para ambientes inteligentes. Partimos
de la experiencia con prototipos para diversos contextos y situaciones. Al ofrecer
servicios conscientes de contexto de visualización de información observamos
características comunes y, a partir de ellas, identificamos roles en los Sistemas
Pervasivos de Visualización. El análisis de los roles y de la interacción según estos,
favorece el proceso de generación automática de las interfaces de nuestro servicio de
visualización. Estas aportaciones nos acercan a una desaparición de la interacción
(disappearing interaction) en el mismo sentido en que los entornos inteligentes
buscan una desaparición psicológica de los computadores (disappearing computer)
Agradecimientos
El trabajo aquí presentado está financiado por el proyecto SERVIDOR (PIB-05-034)
de la Junta de Comunidades de Castilla-La Mancha y con el proyecto CICYC del
Ministerio de Ciencia y Tecnología denominado MOSAIC LEARNING (TSI200508225-C07-07).
118 – Hervás, R., Bravo, R., Nava, S.W., Chavira, G.
Referencias
1. Weiser, M., The computer of the twenty-first century. Scientific American, 1991.
September: p. 94-104.
2. Norman, D.A., The Invisible Computer. 1998, Cambridge: MIT Press.
3. Dey, A.K., Understanding and Using Context. Personal and Ubiquitous Computing, 2001.
5(1): p. 4-7.
4. Brooks, K. The Context Quintet: narrative elements applied to Context Awareness. in Humn
Computer Interaction. 2003. Crete (Greece).
5. Bravo, J., et al., Visualization Services in a Conference Context: An approach by RFID
Technology. Journal of Universal Computer Science, 2006. 12(3): p. 270-283.
6. Reeves, B. and Nass, C., The Media Equation, C.U. Press, Editor. 1996: Cambridge.
7. Schmidt, A., Ubiquitous Computing - Computing in Context, in Computing Department.
2002, Lancaster University. p. 294.
8. Schmidt, A., Implicit Human Computer Interaction Through Context. Personal
Technologies, 2000. 4(2&3): p. 191-199.
9. Kawsar, F., Fujinami, K., and Nakajima, T. Augmenting Everyday Life with Sentient
Artefacts. in Smart Objects & Ambient Intelligence (sOc-EUSAI). 2005. Grenoble (France).
10.Ferscha, A., et al. Digital Aura. in Advances in Pervasive Computing in Pervasive 2004.
2004.
11.Abowd, G. and Mynatt, E.D., Charting past, present and future research in ubiquitous
computing. HCI in the new millennium, 2000. 7(1): p. 29-58.
12.Schmidt, A., Kranz, M., and Holleis, P. Interacting with the Ubiquitous Computing Towards Embedding Interaction. in Smart Objects & Ambient Intelligence (sOc-EuSAI
2005). 2005. Grenoble (France).
13.Bravo, J., Hervás, R., and Chavira, G., Ubiquitous Computing at classroom: An approach
through identification process. Journal of Universal Computer Science, 2005. 11(9): p.
1494-1504.
14.Mitchell, K. and Race, N.J.P. Oi! Capturing User Attention Within Pervasive Display
Environments. in Workshop on Pervasive Display Infrastructures, Interfaces and
Applications (at the Pervasive 2006). 2006. Dublin (Ireland).
15.José, R. Beyond Application-Led Research in Pervasive Display Systems. in Workshop on
Pervasive Display Infrastructures, Interfaces and Applications (at the Pervasive 2006). 2006.
Dublin (Ireland).
16.Hervás, R., et al. Servicios de Visualización de Información Conscientes del Contexto:
Modelo Semi-Formal y Escenarios. in Conferencia Ibérica de Sistemas y Tecnologías de la
Información. 2006. Esposende (Portugal).
Descargar