ykmeans, ¿broma, ironía o triste realidad?

Estar suscrito a las actualizaciones de CRAN le permite a uno estar al tanto de las novedades de R de otra manera. De vez en cuando uno encuentra pequeños paquetes que le solucionan un problema puntual. Mucho más frecuentemente, la verdad, uno se topa con aplicaciones muy específicas en áreas que le resultan remotas.

Pero uno no espera nunca tropiezar con paquetes que no sabe si clasificar como una broma, una ironía bromas o como algo mucho peor: la constatación de una triste realidad. Es el caso de ykmeans.

kmeans, el algoritmo rey de lo insupervisado, el univiro del clústering, el motor del PROC FASTCLUS, el recurso primero, último y único de quien debería dedicarse a otra cosa,… ¡admitiendo una variable objetivo!

Sí, casi parece una broma. Pero mirando la implementación de la cosa, comienzo a sospechar que Yohei Sato, su autor, es un consultor que está hasta donde les alcanzan las cosas a los consultores de llegar a casa a las mil después de correr una y otra vez kmeans con semillas y subconjuntos de datos distintos hasta que el supervisor de lo insupervisadísimo les da el visto bueno a unos centroides tan azarosos como los mil que los precedieron.

Así que Yohei, casi seguro, se dijo: metamos esa variable de interés en la cosa, añadamos algún tipo de criterio más o menos afortunado para ordenar los resultados, corramos mil iteraciones en paralelo y, mientras los ventiladores del portátil disipan a matacaballo el calor de los isietes, pidámonos un sushi para llevar en la oficina y fumémonos un Sakura en el pasillo mientras llamamos a la parienta para avisarle de que hoy tampoco podremos ver Juego de Tronos.