LA GENIALIDAD DE GOOGLE
Aún recuerdo, cuando comenzó a entrar internet en nuestras vidas, cómo buscaba información a través del buscador de
Yahoo. Llegó Google y, aunque me suele costar cambiar de hábitos, no tardé en cambiar de
buscador. La diferencia era abrumadora. Y desde entonces, ni siquiera se lo qué pasó con el buscador de
Yahoo, ni con el de AltaVista, otro que por aquellos años intentaba hacer lo
imposible.
Pero quien consiguió hacer lo que parecía imposible fue Google
o, mejor dicho, Larry Page y Sergey Brin, dos brillantes ingenieros informáticos, que a partir de
una genial idea desarrollaron una magnífica herramienta. Conseguir los mejores
resultados en las búsquedas de información entre millones de páginas web a una velocidad asombrosa no es lo más genial que hicieron.
Aunque fue novedoso, revolucionario y una herramienta absolutamente práctica.
Lo más genial de Google es haber conseguido
realizar una tarea tan titánica utilizando matemáticas no muy complicadas. Darse cuenta de la posibilidad del uso de algunos
conceptos y disciplinas de las matemáticas para relacionar entre sí todas las páginas web existentes,
ordenarlas de mayor a menor importancia y ofrecerlo como resultado de la búsqueda, es la mayor
genialidad de este par de emprendedores.
No tuvieron que desarrollar nuevas teorías, nuevos conceptos,
nada demasiado complicado. Teoría de grafos, matrices (álgebra lineal básica), resolución de sistemas de ecuaciones, diagonalización y análisis espectral de
matrices, algo de probabilidad y ya está. Bueno, y la convicción de que podían conseguir con esas
herramientas matemáticas aquello que ellos deseaban tener y ofrecer al mundo.
Fue Larry Page quien comenzó con esta idea y la
eligió para su tesis doctoral en la Universidad de Standford donde ya se
encontraba Sergey Brin. Unidos por el objetivo de crear un nuevo buscador en
internet alquilaron un garaje, pidieron dinero y se embarcaron en una aventura
tecnológica que los llevaría a crear el sistema de búsqueda PageRank. Rechazados por Yahoo decidieron crear su propia
empresa, Google, que en poco tiempo se convirtió en un gigante de
internet y los lanzó al selecto grupo de las personas más ricas del mundo.
PageRank da un salto cualitativo fundamental
respecto a los buscadores que existían previamente en los que se podía ir de página en página, pero sin tener en
cuenta la importancia o relevancia de cada una de ellas (tardaban, además, bastante en darte un
resultado). No se tenía en cuenta que unas webs tuvieran más referencias que otras
o que algunas de ellas se hubieran convertido en las más relevantes. Ese fue
el reto que Larry se propuso alcanzar.
Quiso crear un buscador que tuviera en cuenta
la relevancia del sitio web y que, por lo tanto, fuera un sistema de organización jerárquica que mostrara
antes las páginas que más enlaces entrantes tenían. Para ello contó con la ayuda de las grandes habilidades matemáticas de Sergey que
pronto se entusiasmó con la idea.
Simulación del grafo de internet
Analizar la estructura de enlaces entre las páginas de internet, es
decir, considerar internet como un gigantesco gráfico en el que todas
las páginas están conectadas entre sí fue el punto de partida de Google. A partir de ahí había que clasificar todas
las páginas en función del número de webs que apuntasen hacia ellas. Cuantos más enlaces entrantes, más popular la consideraría el algoritmo y más alto su puesto en el
ranking del buscador. Esto es lo que consiguieron que hiciera PageRank.
¿Y cómo lo hicieron? Pues con matemáticas. Primero, utilizando la teoría de grafos, es decir,
considerando cada página web como un nodo y dibujando las relaciones entre ellas, flechas
que parten de ellas y flechas que entran en ellas. Para poder trabajar con esta
información hay que transformarla en una matriz, esa tabla ordenada de números con tantas filas
y columnas como nodos tenga el grafo. Los números que aparecen en
la matriz indican la probabilidad que hay de que estando en una página concreta lleguemos
a otra.
Ejemplo de grafo con 4 nodos
Pero PageRank va más allá e intenta modelizar
las tendencias de los usuarios. Para ello modifica los números de la matriz
asignando mayor probabilidad (se cree que es del 85%) a seguir los enlaces de
la página en la que
se está. Se consigue así una estimación de las probabilidades que combinan la estructura propia de internet y
los gustos personales de los usuarios.
Ejemplo de matriz resultante del grafo anterior
El último paso consiste en hallar la importancia
o relevancia de cada página, que se consigue haciendo un sencillo cálculo a partir de la
matriz anteriormente obtenida. La resolución de un sistema de
ecuaciones de primer grado dará como resultado un valor que va de 0 a 1 para cada nodo, es decir, para
cada página web. Cuanto mayor sea el valor, mayor importancia en la red y más alto se encontrará en los resultados de
la búsqueda.
Ejemplo de resultado de búsqueda con 4 nodos
Por supuesto, también cuentan con
herramientas o cálculos secretos (como pasa con la receta de Coca Cola) y ahora
incorporan nuevos algoritmos que permiten tener en cuenta las visitas
anteriores, es decir, consiguen realizar una búsqueda “personalizada”.
Google, nombre inspirado en la palabra googol
que hace referencia a un número tan enorme como 10100,
realiza estas operaciones entre millones y millones de páginas web. Con solo
escribir una palabra o frase y un click, (casi) todo lo que está en la red
sobre el tema aparece ordenado de mayor a menor importancia en un tiempo
insignificante. Conseguido con unas matemáticas no demasiado complicadas. Sin
duda, una genialidad.
Muy bien, Onintze :)
ResponderEliminar