Cómo exprimir la prueba de Kolmogorov-Smirnov y unos cuantos asuntos más
Suponía que era de conocimiento universal. Pero si John D. Cook siente la necesidad de recordarnos que las probabilidades pequeñas se suman pero las grandes no, será por algo.
Lo raro es que no ocurra nunca nada altamente improbable, edición número 6210.
En los extremos, la varianza importa más que la media. (Se refiere a dos poblaciones con medias y varianzas distintas. Si una observación es extrema, es casi seguro que viene de la población con mayor varianza que la de mayor media, para casi todas las definiciones razonables y compatibles de razonables de mayor y extremo).
Un ETF promete 3x la rentabilidad de cierta acción. La acción sube un 100%. El ETF hace lo que promete —es decir, cada día tiene rendimientos del triple que su subyacente— pero baja en el mismo periodo un 82% (véase la noticia). Es una paradoja que ya se trató aquí previamente.
El afán por aplicar métodos casi cabalísticos para identificar fraude electoral parece estar llegando demasiado lejos. Aquí se habla del caso en el que alguien sugiere fraude porque… las cinco grandes cifras publicadas acerca de unas elecciones en Irán son divisibles por tres.
La prueba de Kolmogorov-Smirnov (de dos muestras) permite, como la de Student, comparar dos muestras. Está basado en el estadístico $D$, que es el máximo de dos subestadísticos $D_+$ y $D_-$. Aquí se discute cómo se pueden utilizar $D_+$ y $D_-$ y su interpretación para exprimir la cantidad de información que proporciona la prueba.