El potencial maravilloso de la tecnología `Sexto Sentido`

Anuncio
El potencial maravilloso de la tecnología ‘Sexto Sentido’
Crecimos interactuando con los objetos físicos que nos rodean. Hay una cantidad
enorme de ellos que utilizamos a diario. A diferencia de la mayoría de nuestros
aparatos computacionales, estos objetos son mucho más divertidos de usar. Cuando
hablamos de objetos, hay otra cosa que viene ligada a ese objeto, nuestros gestos:
como manipulamos estos objetos, como los usamos en nuestra vida diaria. Usamos
gestos no sólo para interactuar con estos objetos, sino también para interactuar
entre nosotros. Un gesto de “¡Namasté!”, tal vez, para indicar el respeto a alguien, o
tal vez – en la India no necesito explicarle a un niño que esto significa “cuatro” en el
cricket. Lo trae consigo como parte de su aprendizaje diario.
Por lo tanto me interesa, desde un comienzo el como nuestro conocimiento de los
objetos cotidianos, y de como los usamos, puede traspasarse a nuestra interacciones
con el mundo digital. En vez de usar un teclado o Mouse, ¿por qué no puedo usar mi
computador de la misma forma en que interactúo en el mundo físico?
Así que empecé a explorar esto hace unos ocho años, y literalmente empezó con el
mouse en mi escritorio. En vez de usarlo para mi computador lo abrí. La mayoría
de ustedes recordarán que en esos días los mouse venían con una bolita en su
interior, y que había dos rodillos que guiaban al computador para que supiera
donde se movía la bolita, y por consiguiente donde se movía el mouse. Y me
interesaban estos rodillos, y quería más, por lo que le pedí prestado un mouse a un
amigo – que nunca le devolví – y ahora tenía cuatro rodillos. Lo interesante que hice
fue sacarle los rodillos a los Mouse y ponerlos en línea. Tenía unos hilos y poleas, y
unos resortes. Lo que obtuve fue, básicamente, una interfaz de gestos que actúa
como un aparato sensor de movimientos por sólo dos dólares. Así que ahora,
cualquier movimiento que realizo en el mundo físico se replica en el mundo digital,
usando este pequeño aparato que construí hace unos ocho años, en el 2000.
Como estaba interesado en integrar estos dos mundos, pensé en las notas pegajosas.
Pensé, “¿Por qué no puedo conectar la interfaz normal de una de estas notas con una
digital?” Un mensaje escrito en una nota para mi madre puede aparecerle como un
SMS, o tal vez un recordatorio de una reunión automáticamente se sincroniza con mi
calendario digital –una lista de cosas por hacer que se sincroniza automáticamente
contigo. Pero también puedes realizar búsquedas en el mundo digital, o tal vez
puedes realizar una consulta, diciendo, “¿Cuál es la dirección del Dr. Smith?” y este
pequeños sistema lo imprimiría - por lo que actúa como un sistema de inputs y
outputs de papel, sólo hecho de papel.
En otra exploración, pensé en diseñar un lápiz que puede dibujar en tres
dimensiones. Así que implanté la idea que puede ayudar a diseñadores y
arquitectos no sólo pensar en tres dimensiones, sino que pueden dibujar de este
modo, lo cual es más intuitivo de usar.
Luego pensé, “¿Por qué no hacer un Google Map, pero en el mundo físico?” En vez
de escribir una palabra clave para encontrar algo, pongo mis objetos sobre él. Si
pongo un pase para abordar mi avión, me dirá cual es la puerta de embarque. Una
taza de café me mostrará donde puedo conseguir más café, o donde puedo botar la
taza desechable.
Estos fueron algunas de las exploraciones iniciales que realicé, porque el objetivo
era integrar estos dos mundos ‘sin costuras’. Entre todos los experimentos había
una cosa en común: estaba tratando de traer una parte del mundo físico al mundo
digital. Estaba tomando alguna parte de los objetos, o algo de lo intuitivo de la vida
real, y trayéndolo al mundo digital, porque el objetivo era hacer más intuitivas
nuestras interfaces computacionales.
Pero luego caí en cuenta que a los humanos no nos interesa realmente la
computación. Lo que realmente nos interesa es la información. Queremos saber
sobre las cosas. Queremos saber sobre cosas dinámicas, que se mueven.
Así que pensé, hace como un año –a comienzos del año pasado- empecé a pensar,
“¿Por qué no puedo hacer esto a la inversa?” “¿Qué pasa si tomo mi mundo digital y
pinto el mundo físico con mi información digital?” Porque los pixeles en estos
momentos están confinados en estos aparatos rectangulares que caben en nuestros
bolsillos. ¿Por qué no eliminar este confinamiento y llevarlos a mi mundo de objetos
cotidianos, de tal modo de no tener que aprender un nuevo lenguaje para
interactuar con esos pixeles?
Entonces, para realizar este sueño, pensé en ponerme un proyector grande en la
cabeza. ¿No es por ésto que los llaman proyectores head-mounted? Lo interpreté
muy literalmente, y tomé mi casco de ciclismo, le hice un pequeño corte y quedó
muy bien montado. Así que ahora lo que puedo hacer es incorporarle información
digital al mundo que me rodea.
Pero más tarde me di cuenta de que quería interactuar con los pixeles digitales
también. Así que agregué un pequeña cámara que actúa como un ojo digital.
Después diseñamos una versión mucho mejor, orientado al consumidor, que
muchos de ustedes conocen como el aparato del Sexto Sentido.
Lo más interesante de esta tecnología es que uno puede acarrear su mundo digital
consigo donde quiera que vaya. Puedes empezar a usar cualquiera superficie,
cualquier muro a tu alrededor, como un interfaz. La cámara está siguiendo tus
gestos. Lo que estás haciendo con las manos es un gesto que entiende. Y, en
realidad, si te fijas, hay unos marcadores de colores que usamos en la versión inicial.
Puedes empezar a pintar en cualquier pared. Pares al lado de un muro, y empiezas a
pintar en él. Pero no estamos siguiendo sólo uno de los dedos acá. Te estamos
dando la libertad de usar ambas manos en su totalidad, de tal mod que puedes
usarlas para acercar o alejar un mapa pinchándolo. Lo que está haciendo la cámara
en realidad – al traer a todas la imágenes- está haciendo el (no claro)
reconocimiento, y también el reconocimiento de colores, por lo cual hay muchos
pequeños algoritmos que se llevan a cabo en su interior. Es decir, técnicamente es
un poco complejo, pero da un output que en algún sentido es más intuitive de usar.
Pero lo que más me entusiasma es que puedes llevarla al exterior. En vez de sacar
tu cámara del bolsillo, simplemente hace el gesto de sacar una foto, y la saca por ti.
(Aplauso)
¡Gracias!
Y más tarde puedo encontrarme con una pared, en cualquier lugar, y empezar a
revisar mis fotos, o tal vez, “Bueno, me gustaría modificar esta foto un poco y
enviársela a un amigo en un correo electrónico” O sea, estamos buscando una época
en la cual la computación de hecho se fundirá con el mundo físico. Y, claro, si no hay
una superficie, puedes usar la palma de tu mano para operaciones simples. Acá
pueden ver como disco un número telefónico con sólo usar mi mano. La cámara no
sólo es capaz de entender los movimientos de tu mano, pero, lo que es interesante,
es que también es capaz de entender qué objetos tienes en la mano.
Lo que estamos haciendo acá en realidad – por ejemplo, en este caso, la portada se
compara con miles, o tal vez millones de libros en línea, para corroborar qué libro
es. Una vez que tiene la información, encuentra reseñas del libro, o tal vez el New
York Times tiene una reseña con audio, de tal modo que puedes escuchar una
reseña respecto del libro físico. (“famosa charla en la Universidad de Harvard”)
Esta fue la visita de Obama a MIT. (“… y especialmente qusiera agradecer a dos
destacados … de MIT…”) Y yo estaba mirando el video en vivo de esta charla, afuera,
en un periódico. Tu periódico te mostrará la información del tiempo en vivo, en vez
sea corregida cada tanto – en realidad tienes que usar tu computador para hacer
eso, ¿no es cierto?
(Aplauso)
Cuando estoy regresando, puedo usar mi tarjeta de embarque para ver si mi vuelo
tiene atraso, porque en ese minuto no tengo ganas de abrir mi iPhone, y usar una
aplicación para ello. Creo que esta tecnología no sólo cambiará la forma en que -- Sí
(risas) Cambiará la forma en la cual interactuamos con las personas también, no
sólo el mundo físico. La parte divertida es que puedo ir en el metro de Boston,
jugando un juego de Pong en el piso, ¿cierto? (risas) Y creo que la imaginación es el
único límite respecto de lo que puedes pensar cuando esta tecnología se funde con la
vida real.
Pero muchos de ustedes comenta que nuestro trabajo no se refiere sólo a objetos
físicos. También realizamos operaciones contables, y editamos textos y todas esas
cosas. ¿Qué pasa con aquello? Y muchos de ustedes están mu entusiasmados con la
próxima generación de computadores ‘tablet’ que aparecerán en el mercado. Así
que en vez de esperar eso, hice mi propia versión usando sólo un pedazo de papel.
Lo que hice fue remover la cámara – Todas las cámaras Webcams tienen un
micrófono incorporado. Yo removí la cámara de ahí y luego lo pinché -- es decir hice
un clip con el micrófono -- y se lo puse a un pedazo de papel cualquiera que uno
encuentra por ahí. Ahora el sonido del tacto ocurre exactamente cuando toco el
papel, pero la cámara en realidad está siguiendo el movimiento de mis dedos.
Pueden, claro está, ver películas de esta forma (“Buenas Tardes. Mi nombre es
Russell…”) (“…y soy en explorador de tierras vírgenes en Tri 54.”)
Y pueden jugar sus juegos favoritos, claro. (Motor de automóvil) Acá la cámara de
hecho entiende como estás sujetando el papel para jugar a las carrera de auto.
(Aplauso)
Muchos deben haber pensado ya, Está bien, puedo navegar, claro. Sí. Pueden
navegar al sito que quieran, y realizar todo tipo de operaciones computacionales en
una hoja de papel, donde necesiten hacerlo. Por lo tanto, me interesó ver que
podíamos agregarle en forma más dinámica. Cuando vuelvo a mi computador puedo
trasladar con un gesto la información a mi escritorio virtual, para poder usa mi
computador principal.
(Aplauso)
¿Y por qué sólo computadores? Podemos jugar sólo con papeles. El mundo del
papel es muy interesante para jugar. Aquí estoy tomando parte de un documento, y
poniendo acá una segunda parte tomado de otro lugar – y de hecho estoy
modificando la información que tengo allá. Sí. Y digo, “Está bien, esto se ve bien,
imprimámos esa cosa.” De modo que ahora tenemos una impresión de la cosa, y
ahora – el workflow es mucho más intuitivo, como se hacía hace veinte años, antes
que ir cambiándonos entre estos dos mundos.
Como un último pensamiento, creo que el integrar la información al mundo de los
objetos cotidianos no sólo ayudará a eliminar la brech digital, la brecha entre estos
dos mundos, sino que también nos ayudará, de cierta forma, a mantener nuestra
humanidad, a estar más conectado con nustro mundo físico. Y nos ayudará, en
realidad, a no ser máquinas sentadas delante de otras máquinas.
Eso es todo. Muchas gracias.
(Aplauso)
Gracias
(Aplauso)
Chris Anderson: Entonces, Prnav, en primer lugar, eres un genio. Esto es realmente
increíble. ¿Qué estás haciendo con esto? ¿Se está pensando en una compañía? ¿O es
investigación permanente, o qué?
Pranav Mistry: Hay muchas compañías – de hecho compañias que patrocinan
MediaLab – interesadas en llevar esto adelante de una forma u otra. Compañías
como las telefónicas quieren llevarlo en una dirección distinta que las ONG en la
India que se preguntan, “¿Por qué sólo un ‘Sexto Sentido’? Debiéramos tener un
‘Quinto Sentido’ para personas que han perdido el habla. Esta tecnología podría
usarse para que puedan hablar de otra forma, tal vez con un sistema de parlantes.”
CA: ¿Cuáles son tus planes? ¿Te quedarás en MIT o harás algo con esto?
PM: Estoy tratando de que esto esté al alcance de más personas, de tal forma que
puedan desarrollar sus propio aparato de ‘Sexto Sentido’ porque el hardware no es
tan difícil de fabricar, o tan difícil apropiarse de él. Entregaremos todo el software
de código abierto para ello, tal vez a comienzos del próximo mes.
CA: Eso es increíble. ¡Wow!
(Aplauso)
CA: ¿Volverás a la India con esto en algún momento?
PM: Sí, sí, claro.
CA: ¿Cuáles son tus planes? ¿MIT? ¿India? ¿Cómo dividirás tu tiempo hacia
adelante?
PM: Hay mucha energía acá. Mucho aprendizaje. Todo este trabajo que han visto
tiene que ver con mi aprendizaje en la India. Y ahora, si miramos el asunto en
términos de costos, este sistema te costará 300 dólares comparado con los 20.000
dólares de una mesa de superficie o cualquier cosa por el estilo. Incluso los gestos
de mouse de dos dólares, en esos tiempos costarían uno 5,000 dólares. Así que de
hecho se los mostramos al Presidente Abdul Karam, en una conferencia de la época,
y dijo, “Está bien, debiéramos usar esto en el Centro de Investigación Atómica
Bhabha, para algunas vistas de aquello.” Por lo tanto estóy muy entusiasmado con la
forma en que podemos traerle esta tecnología a las masas, antes de que quede
simplemente en el ambiente de laboratorio.
(Aplauso)
CA: Sobre la base de las personas que hemos visto en TED, tengo que decir que
realmente debes ser entre los tres mejores inventores del mundo actual. Es un
honor tenerte en TED. Muchas gracias. Fue fantástico.
(Aplauso)
Descargar