HASTA LA MÁQUINA SE HA DADO CUENTA...
Esta extensión revela lo que la inteligencia artificial de Facebook piensa que está pasando en tus fotos
Una nueva extensión para los navegadores Chrome y Firefox nos permite ver cómo ha descrito la inteligencia artificial de Facebook nuestras imágenes.
Publicidad
Desde abril del año pasado, las personas invidentes que usan Facebook lo tienen un poco más fácil. La red social por excelencia comenzó entonces a aplicar los algoritmos de visión por ordenador que llevaba años perfeccionando para algo de los más práctico: analizar cada imagen que se comparte y asignarle etiquetas para describir lo que se ve.
Imagina: las fotos de los manjares que un compañero de trabajo está degustando en un restaurante con estrella Michelín, las estupendas y larguísimas vacaciones que un primo lejano está disfrutando en el Caribe, los fines de semana frenéticos que no has podido pasar con tus amigos porque estabas trabajando… Si todas esas imágenes nos dan envidia (y hasta nos deprimen) es porque entendemos lo que está ocurriendo en ellas.
Puede decirse que la información visual se ha vuelto totalmente imprescindible para disfrutar de Facebook, así que Zuckerberg y compañía decidieron que las máquinas, cada vez más certeras a la hora de entender lo que sucede en una foto, se convirtieran en los ojos de los usuarios ciegos dentro de la red social. Por eso cada imagen lleva unas cuantas palabras asociadas que pretenden definir, con más o menos precisión, lo que se muestra.
Sin embargo, hasta ahora no era fácil saber lo que las máquinas de Facebook pensaban. Para descubrirlo, tenías que revisar el código o activar un lector de pantalla como el que utilizan las personas invidentes. Por suerte, una nueva extensión para los navegadores Chrome y Firefox nos permite ver, de forma sencilla, cómo ha descrito la inteligencia artificial nuestras fotos.
En su versión original, la extensión funciona sólo con Facebook en inglés, pero el desarrollador Álvaro Sarasúa la ha adaptado para que también describa las imágenes de la red social en España. Para que se active sólo tienes que descargar la extensión de Github e instalarla siguiendo unas sencillas instrucciones. Después, toda foto que te encuentres en la red social tendrá un recuadro sobreimpreso con las etiquetas.
“La extensión en sí es muy sencilla”, admite su creador, Adam Geitgey, que dice haber tardado poco más de una hora en desarrollarla. “Simplemente te permite ver lo que ve Facebook”, que no es precisamente poco: “Cuando se lanzó en abril, podían detectar cien palabras clave, pero este tipo de sistema crece a medida que recibe más datos”, explica. “Dentro de un año o dos podrá detectar miles de cosas diferentes. Mis pruebas revelan que ya han superado ampliamente las cien palabras”.
Esa rápida evolución se debe al uso de potentes redes neuronales y avanzadas técnicas de aprendizaje automático (‘machine learning’) que permiten a la máquina entrenarse por sí sola poco a poco a base de observar ejemplos. Cuantos más datos se pongan a disposición del algoritmo (y Facebook, como Google, tiene una inmensa cantidad), más rápido será capaz de aprender.
Una tecnología en desarrollo
En lo que respecta a la visión por ordenador (cómo las máquinas son capaces de averiguar lo que aparece en una imagen analizándola píxel a píxel), la inteligencia artificial aún está muy verde. Podría parecer lo contrario echándole un rápido vistazo a las descripciones de tus fotos en Facebook con la herramienta de Geitgey, pero los propios ingenieros de la red social reconocen que falta mucho por hacer.
En un reciente artículo, uno de los expertos de la compañía, Piotr Dollar, afirmaba que solo “estamos empezando a rascar la superficie”. Si bien las máquinas ya son capaces de distinguir a una persona de un perro, lo cierto es que aún se pierde en los detalles. ¿Se trata de un hombre o una mujer? ¿Es alto o bajito? ¿Está contento o triste? ¿Qué está haciendo con el perro? ¿Están jugando? A todas estas preguntas todavía les cuesta responder, pero seguramente lo conseguirán pronto.
Los gigantes de la tecnología están especialmente interesados en desarrollar estas técnicas de visión por ordenador porque sus aplicaciones son casi infinitas. En primer lugar, las obvias: accesibilidad o mejorar la búsqueda de imágenes (algo que interesa mucho a Google), por poner dos ejemplos. Después llegará el vídeo, un territorio en el que Twitter ya ha hecho grandes progresos: si las máquinas saben lo que está pasando en un directo (por ejemplo, un Facebook Live), les será más fácil recomendar a cada usuario los ‘clips’ más acordes a sus preferencias.
Por último, la gran promesa del reconocimiento de imágenes y de este tipo de algoritmos es la realidad aumentada. Snapchat está especialmente interesada en esta parte, pero también Dollar se mostraba entusiasmado con las posibilidades que ofrece esta tecnología. “Entender no sólo lo que hay en la imagen, sino también dónde está, es crítico”, aseguraba, y se servía del popular 'Pokémon Go' para ilustrarlo. Ahora mismo, los monstruos virtuales flotan en mitad de la escena que captura la cámara del móvil. “Imagina que la criatura pudiera interactuar con el entorno, esconderse detrás de los objetos o saltar encima de ellos”, sugería el investigador.
A todo esto llegaremos gracias a las mismas técnicas de aprendizaje que hoy hacen posible que tus fotos de Facebook, desde los recuerdos preciados hasta el más estúpido de los memes, vayan acompañadas de una descripción automática que nos revela lo que ven los algoritmos.
“Por un lado, esto es realmente magnífico”, concluye Geitgey, “pero creo que muchos usuarios de internet no son conscientes de la cantidad de información que ahora se extrae de forma rutinaria de sus fotos”. Su extensión también invita a pensar eso: ¿qué estoy contando a los robots de Facebook sobre mi vida al subir una foto? Ya no solo la ven tus amigos. Ahora las máquinas también observan.
Publicidad