LA GENIALIDAD DE GOOGLE


Aún recuerdo, cuando comenzó a entrar internet en nuestras vidas, cómo buscaba información a través del buscador de Yahoo. Llegó Google y, aunque me suele costar cambiar de hábitos, no tardé en cambiar de buscador. La diferencia era abrumadora. Y desde entonces, ni siquiera se lo qué pasó con el buscador de Yahoo, ni con el de AltaVista, otro que por aquellos años intentaba hacer lo imposible.

Pero quien consiguió hacer lo que parecía imposible fue Google o, mejor dicho, Larry Page y Sergey Brin, dos brillantes ingenieros informáticos, que a partir de una genial idea desarrollaron una magnífica herramienta. Conseguir los mejores resultados en las búsquedas de información entre millones de páginas web a una velocidad asombrosa no es lo más genial que hicieron. Aunque fue novedoso, revolucionario y una herramienta absolutamente práctica.

Lo más genial de Google es haber conseguido realizar una tarea tan titánica utilizando matemáticas no muy complicadas. Darse cuenta de la posibilidad del uso de algunos conceptos y disciplinas de las matemáticas para relacionar entre sí todas las páginas web existentes, ordenarlas de mayor a menor importancia y ofrecerlo como resultado de la búsqueda, es la mayor genialidad de este par de emprendedores.

No tuvieron que desarrollar nuevas teorías, nuevos conceptos, nada demasiado complicado. Teoría de grafos, matrices (álgebra lineal básica), resolución de sistemas de ecuaciones, diagonalización y análisis espectral de matrices, algo de probabilidad y ya está. Bueno, y la convicción de que podían conseguir con esas herramientas matemáticas aquello que ellos deseaban tener y ofrecer al mundo.

Fue Larry Page quien comenzó con esta idea y la eligió para su tesis doctoral en la Universidad de Standford donde ya se encontraba Sergey Brin. Unidos por el objetivo de crear un nuevo buscador en internet alquilaron un garaje, pidieron dinero y se embarcaron en una aventura tecnológica que los llevaría a crear el sistema de búsqueda PageRank. Rechazados por Yahoo decidieron crear su propia empresa, Google, que en poco tiempo se convirtió en un gigante de internet y los lanzó al selecto grupo de las personas más ricas del mundo.

PageRank da un salto cualitativo fundamental respecto a los buscadores que existían previamente en los que se podía ir de página en página, pero sin tener en cuenta la importancia o relevancia de cada una de ellas (tardaban, además, bastante en darte un resultado). No se tenía en cuenta que unas webs tuvieran más referencias que otras o que algunas de ellas se hubieran convertido en las más relevantes. Ese fue el reto que Larry se propuso alcanzar.

Quiso crear un buscador que tuviera en cuenta la relevancia del sitio web y que, por lo tanto, fuera un sistema de organización jerárquica que mostrara antes las páginas que más enlaces entrantes tenían. Para ello contó con la ayuda de las grandes habilidades matemáticas de Sergey que pronto se entusiasmó con la idea.
Simulación del grafo de internet

Analizar la estructura de enlaces entre las páginas de internet, es decir, considerar internet como un gigantesco gráfico en el que todas las páginas están conectadas entre sí fue el punto de partida de Google. A partir de ahí había que clasificar todas las páginas en función del número de webs que apuntasen hacia ellas. Cuantos más enlaces entrantes, más popular la consideraría el algoritmo y más alto su puesto en el ranking del buscador. Esto es lo que consiguieron que hiciera PageRank.

¿Y cómo lo hicieron? Pues con matemáticas. Primero, utilizando la teoría de grafos, es decir, considerando cada página web como un nodo y dibujando las relaciones entre ellas, flechas que parten de ellas y flechas que entran en ellas. Para poder trabajar con esta información hay que transformarla en una matriz, esa tabla ordenada de números con tantas filas y columnas como nodos tenga el grafo. Los números que aparecen en la matriz indican la probabilidad que hay de que estando en una página concreta lleguemos a otra.

Ejemplo de grafo con 4 nodos

Pero PageRank va más allá e intenta modelizar las tendencias de los usuarios. Para ello modifica los números de la matriz asignando mayor probabilidad (se cree que es del 85%) a seguir los enlaces de la página en la que se está. Se consigue así una estimación de las probabilidades que combinan la estructura propia de internet y los gustos personales de los usuarios.



Ejemplo de matriz resultante del grafo anterior

El último paso consiste en hallar la importancia o relevancia de cada página, que se consigue haciendo un sencillo cálculo a partir de la matriz anteriormente obtenida. La resolución de un sistema de ecuaciones de primer grado dará como resultado un valor que va de 0 a 1 para cada nodo, es decir, para cada página web. Cuanto mayor sea el valor, mayor importancia en la red y más alto se encontrará en los resultados de la búsqueda.

Ejemplo de resultado de búsqueda con 4 nodos

Por supuesto, también cuentan con herramientas o cálculos secretos (como pasa con la receta de Coca Cola) y ahora incorporan nuevos algoritmos que permiten tener en cuenta las visitas anteriores, es decir, consiguen realizar una búsqueda personalizada.

Google, nombre inspirado en la palabra googol que hace referencia a un número tan enorme como 10100, realiza estas operaciones entre millones y millones de páginas web. Con solo escribir una palabra o frase y un click, (casi) todo lo que está en la red sobre el tema aparece ordenado de mayor a menor importancia en un tiempo insignificante. Conseguido con unas matemáticas no demasiado complicadas. Sin duda, una genialidad.

Comentarios

Publicar un comentario

Entradas populares de este blog

JUGANDO CON EL AZÚCAR

¿FE CIEGA EN LA TECNOLOGÍA?

HISTORIA DE LA CIENCIA EN AMÉRICA LATINA