TecnoXplora » CienciaXplora » Divulgación

LARRY PAGE Y SERGEY BRIN LA LIARON PARDA...

Las matemáticas de Google

¿Qué sería de nosotros si, de pronto, dejara de funcionar Google? Estoy segura de que a alguno se le ha encogido el ombligo al pensarlo.

 Ilustración de Raquel Garcia Ulldemollins

Ilustración de Raquel Garcia Ulldemollins CienciaXplora

Publicidad

La mayoría aceptamos que el famoso buscador ha supuesto una auténtica revolución en nuestro trabajo y en nuestra vida personal, incluso nos condiciona más de lo que muchas veces podamos pensar, puesto que los resultados que ofrece a nuestras búsquedas hace que escojamos ese restaurante o aquel otro hotel, que veamos determinada película o escuchemos una música y no otra. Pero ¿cuántos saben que el éxito de esta plataforma radica en el buen uso de sus creadores de herramientas matemáticas?

Es posible que cuando Larry Page estudiaba Álgebra Lineal, Teoría de Grafos y Probabilidad -entre otras cosas- en la Universidad Estatal de Michigan no fuera consciente de que iba a liarla parda usando lo que estaba aprendiendo en clase. Posiblemente, tampoco Sergey Brin, estudiando para ser matemático a más de 800 kilómetros de Page, se lo oliera. Pero lo hicieron: la liaron, y vaya si la liaron.

Hace unos meses un compañero me contaba que un exalumno de nuestra escuela de Informática se quejaba de que, después de varios años trabajando como informático, aún no sabía para qué le había servido estudiar Álgebra Lineal en la universidad. Mi compañero le respondió brillantemente: “Se ve que los creadores de Google sí lo supieron y ahora se dedican, principalmente, a contar dinero mientras tú picas código”. Creo que ese fue el final de la conversación. Mi compañero había sido bastante convincente.

Efectivamente. A todos nos parece ya natural escribir unas palabras en Google y encontrar una infinidad de resultados. Ya nos hemos acostumbrado a que casi nunca pasamos de la primera página de Google porque entre las primeras entradas que nos citan encontramos lo que buscamos.

Pero no deja de parecer casi mágico que si uno teclea en el buscador “trabajo Rocío” porque está desempleado a pesar de vivir en la famosa aldea onubense, las primeras entradas son ofertas de trabajo en la aldea y, posiblemente, alguna declaración de nuestra ministra de Trabajo. Sin embargo es difícil encontrar “A mis obligaciones”, el poema de Neruda. Se ve que Google entiende que esas palabras de búsqueda son más propias de alguien que quiere escapar de las listas del paro que de un aficionado a la poesía. Y tiene razón, pero... ¿cómo lo hace?

Lo primero que hace Google es indexar todas las páginas de internet (¡algunas varias veces al día!) y con ello construye un grafo dirigido. Los elementos de dicho grafo son, por una parte, cada una de las páginas web del mundo (serían los vértices del grafo) y, por otra, los enlaces entre dichas páginas webs (serían las flechas que van de una página a otra, si la primera enlaza a la segunda).

 Ejemplo de grafo dirigido, los círculos representarían páginas, y las flechas los enlaces entre ella

Con esa información, Google le asigna un número a cada página de internet, el llamado PageRank.

El PageRank de una página trata de medir la probabilidad de que alguien que esté tonteando por internet acabe visitando esa página en concreto. Antes, con un lenguaje más playero, se venía a decir que trata de medir la probabilidad de que un surfista ocasional llegue, navegando, a dicha página.

Resulta evidente que si una página concreta es enlazada por muchas otras páginas, su PageRank debe ser alto, porque se entiende que si mucha gente la enlaza debe contener información relevante y es fácil que acabemos visitándola. Pero eso no es todo, también se entiende que si te enlazan pocas webs pero son muy potentes en la Red, tu PageRank debe ser también alto y, por lo tanto, debería aparecer entre las primeras opciones mostradas por Google.

Con estas dos ideas en la cabeza (y otras más relacionadas con procesos probabilísticos), el algoritmo del PageRank construye, para representar la escena de páginas y enlaces, lo que en matemáticas se conoce como una matriz (son números, señor ministro, no vaya querer también legislar sobre ellas).

width=

Pues bien, básicamente, realizando operaciones algebraicas sobre esa matriz, se asigna un número a cada página que le servirá para optar a un buen puesto en la ordenación de páginas mostradas por Google... o no.

Si tienen curiosidad por conocer con detalle el algoritmo como lo presentaron sus autores, pueden verlo aquí. Y si tienen ganar de jugar un rato, aquí tienen una calculadora de PageRank para hacer pruebas y, de paso, entender mejor el algoritmo.

Termino con una cuña publicitaria para mis estudiantes de Informática: nunca se sabe en qué clase de matemáticas estará escondido el secreto de vuestro éxito. Y si llegáis como Larry y Sergey a Forbes, no os olvidéis de mí, que yo fui vuestra profesora. Bueno, eso me gustaría que lo recordaseis en cualquier caso.

Publicidad