No uses el test de Wilcoxon, nos dice Gelman

2015-7-20 (Última modificación: 2025-4-6)

Andrew Gelman nos invita a no usar más el test de Wilcoxon.

El test de Wilcoxon reemplaza las observaciones obtenidas por sus rangos y construye un estadístico basado en estos últimos. Eso implica descartar información pero puede ayudar a ganar robustez en situaciones en que los datos se desvíen de la normalidad.

¿Qué sugiere Gelman? Que si realmente estamos dispuestos a descartar información, en lugar de reemplazar las observaciones originales por sus rangos, usemos z-scores —los cuantiles de la normal estándar correspondientes a los cuantiles muestrales—, y usemos la teoría normal (en su doble acepción).

De nuevo, según Gelman, la popularidad del test de Wilcoxon se debe a razones históricas. Es otra consecuencia del hecho de que la estadística se conformase antes de que se popularizasen los ordenadores. Calcular los rangos es una operación mucho más sencilla que obtener cuantiles de la normal estándar si hay que hacerla a mano y consultando tablas en el apéndice de un libro.

Mi comentario: Supongo que algún día habrá que poner orden en el edificio de la estadística e ir enterrando recetas viejunas. Hoy en día se puede operar a partir de principios generales y dejar los detalles a los ordenadores. No es casualidad que esté publicando entradas sobre stan recientemente: basta con especificar el modelo probabilístico y lanzar una simulación. Sin embargo, soy consciente de que los recetarios son más fáciles de enseñar y sobre todo, examinar. Morirán despaciosísimamente.