Una informática más amable.

Anuncio
Docum31
Una informática más amable.
Las tecnologías de E/S natural hacen que su ordenador trabaje para usted y no a la inversa
Estamos en el mes de abril de 2.010. Usted acaba de comprar el mejor ordenador personal de Big Apple. Abre la
caja y comienza a montarlo, pero para sorpresa suya no ve un teclado, solamente un bloc y un lápiz especiales
que se asemejan a los del portafolios de un ejecutivo. La caja también contiene ropa: un traje, un par de guantes y
una cinta de cabeza. No ve ningún monitor, sólo un casco y anteojos. ¿Qué significa esto?.
Lo que está a punto de experimentar es su primera prueba de informática natural: hacer que los ordenadores
interactúen con los usuarios de forma similar a la humana. La informática natural enfatiza un modo de
comunicación sensorial con los seres humanos, en lugar de la lógica cognitiva de mandatos que utilizan los
dispositivos actuales.
La informática natural trata intrínsecamente con la percepción sensorial humana. Las redes neuronales, o los
sistemas de procesamiento modelados a partir del cerebro humano, son particularmente buenos para las tareas
sensoriales de bajo nivel que son difíciles de realizar para los ordenadores digitales.
La entrada natural incluye tecnologías como reconocimiento del habla y de la escritura manual e interpretación
de los gestos. La salida natural incluye habla, gestos y movimientos significativos semejantes a los humanos, así
como entornos de realidad virtual.
Oir hablar.
Una de las funciones de la E/S natural es la conversión de texto en habla con sonido natural. Tal vez ya conozca
aplicaciones con tecnología de salida de voz en el correo con voz automatizada, información telefónica o los
sistemas bancarios vía telefónica. Y quizás haya oído salida de música digitalizada (por ejemplo, música de
fondo) en dispositivos como contestadores automáticos y sistemas de correo oral.
La mayoría de sistemas disponibles de conversión de texto a habla con sonido natural utilizan registros de voz
humana digitalizados y editados combinados con controles de tono, entonación y velocidad para generar
oraciones fluidas. Los fonemas individuales o las combinaciones de fonemas se registran y se editan para
utilizarlos a medida que se necesitan.
El habla de sonido natural no es fácil de conseguir, dado que la entonación de una palabra depende ampliamente
del contexto y significado de lo que se dice. El inglés posee muchas palabras que suenan igual pero que tienen
significados diferentes (por ejemplo, las palabras red (rojo) y read (leído) suenan igual) según el contexto.
Leer la escritura.
Mientras observamos el lápiz y el bloc del sistema Big Apple, se nos ocurre que las personas no sólo hablan
entre ellas, sino que también escriben notas. El reconocimiento de escritura manual es otra forma clave de
entrada natural.
La utilización de un teclado es una habilidad que muchas personas no llegan a adquirir. Pero a la mayoría de
niños se les enseña a escribir. En consecuencia, un ordenador que reconozca la escritura es más natural que otro
que exija teclear los mandatos.
En general, existen dos métodos mediante los cuales un sistema puede reconocer la escritura manual. Un método
es el reconocimiento dinámico, proceso en el que el sistema anota secuencias de trazos y utiliza esta información
para identificar los caracteres.
Por ejemplo, un sistema distinguiría una E mayúscula de una B mayúscula en parte por el orden en que se
realizan los trazos de los caracteres. Alternativamente, se puede utilizar reconocimiento estático, técnica en que
el sistema solamente recibe la imagen del carácter acabado.
El reconocimiento estático puede conllevar más dificultad que el reconocimiento dinámico, dado que se dispone
de menos información para identificar la letra que se ha escrito. El orden de los trazos a menudo proporciona
claves sobre el principio y el final de cada carácter, claves que se pierden en la imagen estática del carácter final.
Este problema, denominado segmentación de los caracteres, probablemente es el reto más significativo al que se
enfrenta la construcción de un sistema de reconocimiento de la escritura manual.
Lenguaje corporal.
Entre las otras formas obvias de entrada natural se encuentran los dispositivos de retroalimentación biológica que
tratan con los movimientos de la mano y el cuerpo. Estas entradas pueden procesarse ya sea a través de una
conexión directa entre el sujeto y el ordenador, ya sea mediante la observación e interpretación de los
movimientos del sujeto por parte del ordenador. En la actualidad el primer tipo de entrada es el más corriente,
pero algunos sistemas también pueden utilizar visión inteligente de ordenador.
En un traje corporal o un guante, el sujeto viste literalmente la interfaz. Sensores conectados al tejido del guante
miden los movimientos angulares de los dedos, manos, brazos piernas u otras partes del cuerpo.
Leer el pensamiento.
En 2.010 el sistema Big Apple incluirá una cinta para la cabeza, que proporciona otra forma más de entrada
natural: puede leerle los pensamientos. Se coloca la cinta (o casquete, según el diseño) de forma que el ordenador
puede monitorizar las ondas cerebrales y hacer lo que quiere decir, no lo que dice que haga.
Docum31
En los Laboratorios Nippon Telegraph & Telephone de Japón y en la Universidad de Stanford de Estados
Unidos ya se han construido controladores telepáticos prototipo. Los dispositivos que los usuarios se colocan en
la cabeza pueden ser tan simples como una cinta o tan complejos como un casco de licra. Los sensores
conectados al dispositivo detectan las ondas cerebrales del usuario, del mismo modo como lo hace un
electroencefalograma En general, los controladores telepáticos trasmitieron escasamente una docena de señales
hacia una red neuronal para su interpretación.
Las redes neuronales aprenden mientras un usuario se concentra en palabras de mandatos específicos, y los
pensamientos generan variaciones características de ondas cerebrales. Los investigadores tan solo están
comenzando a descubrir cómo los pensamientos afectan a las variaciones de las ondas cerebrales. Una o más
redes neuronales interpretan las señales y las traducen a mandatos de control. En un sistema prototipo, se pidió a
un usuario que se concentrase en las palabras izquierda, derecha, arriba y abajo. La red neuronal aprendió a
interpretar las características de las ondas cerebrales para cada palabra, y las asoció con los mandatos de control
apropiados para una palanca de mando. Resultado final: la palanca se movió como respuesta directa al
pensamiento del usuario.
Antes de que esta tecnología llegue a ser parte de cualquier producto comercial, deben superarse varios
problemas: asegurar la correcta posición de los sensores en la cabeza, reducir el tiempo de respuesta del sistema
y evitar la necesidad de entrenar al sistema para cada usuario. Asimismo, no está claro cuán fuertemente debe
concentrarse el usuario en una palabra para proporcionar una señal adecuada para que el sistema la detecte
fiablemente.
El mundo que conocemos.
Los últimos elementos de su nuevo ordenador Big Apple son el casco y los anteojos, con su pantalla
tridimensional envolvente. Tales dispositivos proporcionan lo último en E/S natural -un entorno de realidad
virtual o RV (una RV es un dominio generado artificialmente donde se puede experimentar e interactuar con un
mundo tridimensional completo).
Algunas de las primeras RV impresionantes fueron los simuladores de vuelo utilizados para entrenar pilotos.
Mediante esta tecnología, los pilotos pueden experimentar despegues y aterrizajes, disfrutar de vuelos en calma y
enfrentarse a emergencias. A través de la práctica prenden a manejar aeroplanos diestramente en todo tipo de
situaciones.
Un buen sistema de RV utiliza alguna o la mayoría de las tecnologías que hemos comentado, pero añade al
menos una más: salida gráfica de ordenador realista, a menudo tridimensional -salida natural si lo prefiere- para
hacer que la experiencia aparezca y se sienta como correcta y completa. La RV también puede incluir la
utilización de guantes de datos y trajes corporales, procesamiento de lenguaje natural y generación de sonidos.
Algunos sistemas, como Autodesk, realizan interfaces entre una bicicleta estática y el sistema, de forma que
parece que el usuario pedalee a través de un mundo virtual.
El hecho de que la RV utilice esta combinación de tecnologías que están emergiendo hace que ciertos factores
sean más importantes, por ejemplo, la cuestión clave de la velocidad de respuesta. Este término hace referencia a
la velocidad a la que el sistema puede recibir e interpretar la entrada - ya sean gestos, escritura manual, habla o
pensamientos - y reaccionar a dicha entrada mediante la generación de la salida adecuada.
Otra cuestión que todavía tiene que resolverse es la que hace referencia a la navegación y la manipulación de
objetos virtuales. El sistema debe poseer un conocimiento previo detallado acerca de cómo se comportan los
objetos de acuerdo con las limitaciones del mundo virtual que habitan. Si, por ejemplo, se intenta caminar a
través de una pared sólida o dentro de un espacio vacío, el sistema RV debe proporcionar la retroalimentación
apropiada para informar de que tales movimientos no son aceptables, a menos, por supuesto, que la RV sea un
mundo fantástico con paredes a través de las cuales sí se puede pasar.
Si el usuario alcanza un objeto, la pantalla visual no sólo debe mostrarle que lo coge, sino también proporcionar
cierta retroalimentación de resistencia (mediante el guante) que le haga sentir el peso del objeto en la mano. La
tecnología actual todavía está perfeccionando la forma de solucionar esto, pero los fabricantes se esfuerzan y se
está llevando a cabo una investigación activa para proporcionar al usuario sofisticado mecanismos de
retroalimentación.
Las tecnologías del mundo virtual que se han ejemplificado en el ordenador Big Apple son bastante reales hoy en
día. VLP (Redwood City Estados Unidos) acaba de sacar su sistema RV Microcosm al mercado. Microcosm
incluye un ultimísimo Macintosh Quadra, software de autor tridimensional, casco con anteojos para audición y
visión en tres dimensiones y un guante para controlar el sistema. Mediante Microcosm, puede recorrer mundos y
estructuras generadas por ordenador e incluso agarrar los objetos que encuentre en ellos.
La E/S natural abarca tecnologías que van desde el aquí y ahora hasta el futuro celestial. Una cosa es cierta:
cuando compre este Big Apple unos pocos años más adelante, hallará que la interacción con el mismo será muy
diferente de la interacción con los ordenadores actuales. Es posible que más que utilizar su sistema, lo
experimente.
Descargar