BIG DATA 2 el tamaño importa

Anuncio
BIG DATA 2
Cuando el tamaño definitivamente importa
Por Esteban Magnani
1
Una diferencia determinante entre nuestra vida virtual y la material es que la primera
puede pasarse fácilmente a una base de datos. Pero cuando esta información se
lleva a cierta escala también puede usarse para prever el comportamiento de la
sociedad, controlar a las personas o vender productos.
A esta enorme cantidad de material en permanente movimiento se la llama big data y
sabe más sobre nosotros que la madre que nos parió.
¿Qué es lo que determina el éxito de una banda de rock? La respuesta podría llevar
entrevistas enteras de grandes productores cazatalentos que explican cómo funciona
su intuición. Es que cuando la cantidad de variables que intervienen en un fenómeno
es demasiado grande, sólo cierta capacidad inexplicable puede dar algún tipo de
respuesta. Pero algo está cambiando: los ríos de terabytes que circulan por la red, el
aumento brutal en la capacidad de recolección y procesamiento de datos, sumados a
programadores cada vez más entrenados en este campo, ahora hacen posible obtener
algunas respuestas de una realidad hasta hace poco inconmensurable. De eso se
trata big data: de grandes cantidades de información cargada por millones y millones
de personas a través de las redes sociales, al usar sus tarjetas de crédito, sus
celulares o realizar cualquier otra actividad digital. El espionaje masivo de los servicios
de inteligencia de los EE.UU. es sólo un ejemplo del poder de los datos que hace unos
años habrían resultado inmanejables. Cuando se habla de big data suele pensarse en
enormes cantidades de información, tan grandes que no pueden funcionar en una sola
computadora sino que requiere “clusters” (racimos-fragmentos)
es decir, redes de
computadoras funcionando simultáneamente. A este requisito conocido y que le da el
nombre hay que sumarle la velocidad, porque las redes sociales no descansan y es
necesario recopilar, por ejemplo, los millones de tweets, que se lanzan a cada
segundo, además de interpretarlos. Y por último se debe tener en cuenta la necesidad
de estructurar esa información en bases de datos para así poder darle sentido .
Cantidad, velocidad y estructura, más capacidad tecnológica y el software adecuado,
permiten encontrar las respuestas que se estaban buscando. La herramienta es muy
poderosa y ya se usa en las áreas más disímiles. Una de ellas es la política. En
EE.UU. no sólo es optativo votar, sino que quien quiera hacerlo primero debe realizar
los trámites necesarios y cumplir con los requisitos exigidos –varían según los
diferentes estados–. Esto en parte explica los bajos niveles de participación en las
elecciones de este país y las estrategias de campaña de los candidatos. Para atraer
nuevos votantes el equipo de Barack Obama clasificó a los usuarios de las redes
sociales de acuerdo con las posiciones políticas de sus amigos. Así los especialistas
reconocieron a 3,5 millones de potenciales votantes a Obama no empadronados y luego
se dedicaron a conocer sus intereses específicos sistematizando las publicaciones que
hacían en las redes sociales. Ese perfil permitió dirigirles sólo aquellas propuestas del
candidato que podían persuadirlos: leyes de género para las feministas, propuestas
verdes para los ecologistas, etcétera. El nivel de precisión de esta campaña fue muy
superior al de afiches con candidatos sonrientes que no pueden decir nada por el
riesgo de espantar a quien piense distinto. Finalmente el equipo de Obama logró que al
menos un millón de personas a las que apuntaron se registrara para votar . Obama ganó
por menos de cinco millones de votos en todo el país, y en estados como Florida,
clave para la victoria, la diferencia con su oponente fue de menos de setenta mil. La
misma lógica puede aplicarse para diseccionar otros campos y encontrar las variables
que expliquen fenómenos complejos, siempre y cuando existan los datos. Lo que
antes requería focus groups y hordas de estudiantes munidos de encuestas trajinando
las calles, ahora requiere un puñado de programadores desmontando la información
que proveen las redes sociales. Google, por ejemplo, utiliza esta capacidad para, en la
“intimidad” de nuestro correo electrónico, colocar publicidad que se corresponde con el
tema del e-mail “privado” que estamos por mandar a un amigo. El sistema funciona
interpretando nuestros correos en tiempo real y permite a las empresas facturar en
publicidad cuando usamos sus servicios. La información es poder y en el caso de
Google, Facebook o Twitter, entre otros, simplemente toman lo que sus usuarios les
brindan gentilmente para hacer con ella cosas por demás novedosas. Otro ejemplo:
Google presentó recientemente una herramienta para prever éxitos de taquilla . Según
pudieron establecer estadísticamente, cada persona consulta la película que le
interesa unas trece veces en internet antes de ir a verla. O sea que si el buscador
encuentra cierto número de visitas a trailers, críticas y demás puede estimar la futura
recaudación del film. Es como si tuviera una especie de bola de cristal digital capaz de
adivinar el futuro. PERSPECTIVAS ATEMORIZANTES Por supuesto que estos
ejemplos más o menos ingenuos tienen una contracara bastante más oscura. No hace
falta insistir en las recientes revelaciones sobre el control que EE.UU. hace sobre las
llamadas y el uso de internet de ciudadanos de todo el mundo. Ese país se encuentra
en un lugar privilegiado porque la columna vertebral global de las telecomunicaciones
2
pasa por allí. La distopía orwelliana 1984, con el Gran Hermano vigilando a través de
su ojo omnisciente a cada uno de los ciudadanos, resulta ingenua al lado de la
capacidad de empresas y Estados para generar bases de datos que prevean
comportamientos gracias a la fuerza de las estadísticas. Ya no es ciencia ficción la
posibilidad de cruzar los videos tomados por las cámaras de seguridad con sistemas de
reconocimiento facial para identificar el recorrido y las actividades de cualquier
individuo. Las perspectivas resultan atemorizantes. El futuro no tan lejano lo es. Pero
también big data tiene, aunque bastante más pequeño, su costado luminoso: la
cantidad de información disponible en la red permite a las organizaciones desnudar
vínculos de poder o formas más sutiles de corrupción. Es que los poderosos siempre
tuvieron herramientas para someter y controlar, pero lo novedoso de nuestra era digital
es lo contrario: que herramientas similares quedan más cerca para quienes intentan
balancear ese poder. Un ejemplo es la tarea que viene haciéndose desde el
periodismo de datos, donde confluyen programadores con la capacidad técnica y
periodistas con el criterio necesario para encontrar historias en la maraña de
información
que
ofrece
internet.
Con
esa
lógica,
una
organización
como
ProPublica.org recogió de la web datos que luego cruzan para saber cuánto pagan los
laboratorios a cada médico o quiénes financian las fundaciones que, a su vez, donan
para las campañas de los distintos candidatos políticos de los EE.UU. La información
estaba en la web, escondida dentro de cientos de declaraciones obligatorias que nadie
podía revisar individualmente. Gracias al esfuerzo de periodistas y programadores se
pudo recoger la parte relevante en bases de datos que hicieran visible lo que estaba
oculto. Quien tenga una base de datos suficientemente amplia y capacidad para
procesarla de forma adecuada podrá saber más sobre la sociedad que lo que nunca
se supo. Hasta qué punto se la usará para liberarla o para dirigirla es algo que aún
falta determinar, pero lo más probable es que la tensión entre ambas posibilidades
continúe su ya largo recorrido histórico.
*http://www.estebanmagnani.com.ar/wpcontent/uploads/2013/09/bigdata.pdf
3
Descargar