Blogs, matemáticas y el teorema de la cola larga

publicado 19/08/2006, Última modificación 08/12/2021

Hoy vamos a estudiar matemáticas. Más exactamente, las matemáticas de esta página: BloGalaxia.com : Directorio y Buscador de Blogs Latinos - Ranking.

Como sabrán, BloGalaxia es un sitio que le lleva la pista a cantidad de blogs alrededor del mundo -- aunque cabe recalcar que no es ni una gota de agua al lado de, por ejemplo, Technorati. En la página enlazada, podrán ver una lista de blogs populares, desde el top 1 hacia abajo, junto con el número de visitas en un espacio X de tiempo (que para el efecto no interesa). Ahora, dibujado en un gráfico de barras, veamos cómo se distribuyen:

Dibujada en un gráfico, la distribución de visitas en los blogs listados en BloGalaxia
Dibujada en un gráfico, la distribución de visitas en los blogs listados en BloGalaxia

Fíjense en el primer lugar (más a la izquierda). ¿Se dan cuenta de la diferencia con respecto del segundo? ¿Y de la diferencia del segundo con respecto del tercero? Y así sucesivamente.

¿A qué les recuerda? ¿Se acuerdan de sus clases de estadística? Pues es la distribución Zipf. Esto fue descubierto por algunas personas, pero mi análisis favorito es el de Jakob Nielsen, y es popularmente conocido como "la cola larga", porque el gráfico tiene una cola, ehm, pues, ¡larga!.

Nota: los gráficos en Nielsen tienen una curva más o menos plana porque el eje Y está en escala logarítimica/exponencial.

El teorema de la cola larga (así se llama) dice que: En cualquier sistema de elecciones libres, dada una cantidad X de elecciones y N de votantes, los votos se distribuirán de acuerdo a una distribución Z. Dicho en español, 1/x (1 sobre X). Okey, eso no fue español. Pero básicamente, el primer escaño recibirá más o menos el doble de "votos" que el segundo, y así sucesivamente (esto es una sobresimplificación, y seguro vendrá el Ing. Maldonado a cortarme la cabeza por decir esto, pero bueh... algún día tenía que pasar, ¿no?).

Esto aplica a las páginas Web. Esto aplica a los blogs. Esto aplica a la distribución de visitantes entre páginas específicas de sus blogs. Esto aplica para la circulación de periódicos. Esto aplica a las elecciones. Esto aplica a la distribución de amigos en la vida real.

Esto explica por qué los países con un sistema político bipartisano no pueden salir de él. Esto explica matemáticamente por qué los países como el nuestro no pueden salir del relajo político en el que estamos (básicamente porque quien está en la posición 2, 3 o 4 no tiene esperanzas de llegar a la posición 1 -- ¡miren el gráfico, no miente!).

Hay otras cosas que se pueden derivar de aquí. Sólo listaré unas cuantas por el momento:

  • Esperar crecimiento continuo en un portal es soñar: eventualmente se llega a un escaño de la distribución Zipf. Generalmente el primer escaño lo ocupa un servicio extremadamente popular que explotó, o un servicio que siempre fue líder.
  • ¿Recuerdan la famosa ley de Pareto? ¿La ley del 80%/20%? Responde a una curva de Zipf también. El 20% de los sitios (opciones) se llevan el 80% de los visitantes (votos).

A tí, lector, te convido a que hagas un grafiquito en Excel, y veas cuáles páginas de tu sitio son más populares, y cuáles no, y cómo se ve el gráfico de páginas versus popularidad. Descubrirás cosas fantásticas.