¿La correlación "del siglo XXI"?
Bajo el título Detecting Novel Associations in Large Data Sets se ha publicado recientemente en Science un coeficiente alternativo a la correlación de toda la vida para cuantificar la relación funcional entre dos variables.
El artículo (que no he podido leer: si alguien me pudiera pasar el pdf…) ha tenido cierto impacto, al menos momentáneo, en la red. Puede leerse un resumen en esta entrada u otro bastante más cauto en la de A. Gelman. Existe información adicional (e incluso código en R) en esta página.
Las dos ideas motivadoras de este método son:
- Generalidad: poder detectar cualquier tipo de relación funcional entre dos variables, no únicamente relaciones lineales (como el coeficiente de correlación).
- Homegeneidad: el estadístico debería ser similar cuando se comparen configuraciones con una relación funcional distinta paro un nivel de ruido análogo (véase la figura adjunta).
En muchos contextos, el análisis de un conjunto de datos comienza por el estudio de una matriz de correlaciones entre variables tal como
que resalta la relaciones de dependencia lineal entre conjuntos amplios de variables. Con el aporte de este nuevo artículo, tal vez podrían identificarse otro tipo de relaciones funcionales igualmente interesantes. Con tiempo, le echo un vistazo.