Un par de paradojas de la teoría de la probabilidad y algunos asuntos más

Comienzo la entrada de hoy con un enlace al muy denso Interpretations of probability, en la Enciclopedia de Filosofía de Stanford que, admito, no será del interés de la mayoría.

Podría llegar a decirse —aunque no me atreveré a tanto— que en toda disciplina intelectual tiene que haber paradojas porque de otra manera, sería indistinguible del uso sistemático del sentido común. Así que hoy traigo a colación este análisis de un caso particular de la paradoja de Berkson (que se añade a las ocasiones en las que ya me he referido a ella) y este otro sobre la de Lindley. La primera tiene que ver con la correlación que aparece entre dos variables aleatorias independientes cuando de repente observamos información concomitante; la segunda, con los test de hipótesis (asunto del que, por fortuna, me he mantenido alejado durante largo tiempo).

Acerca de este último asunto y de los p-valores trae Gelman un par de entradas interesantes, Understanding p-values: Different interpretations can be thought of not as different “philosophies” but as different forms of averaging y 4 different meanings of p-value (and how my thinking has changed). La última de las interpretaciones de los p-valores del segundo artículo es:

Un p-valor es el resultado de unas operaciones aplicadas a unos datos que recibe por convención la etiqueta de p-valor.

Finalmente, dos apuntes adicionales. El primero, sobre la construcción del llamado ruido azul, que puede entenderse como muestreos de una variante de la distribución uniforme más uniforme de lo que realmente es. En efecto, la representación de muestra de una distribución uniforme bidimensional es una especie de gris, pero un gris que no se percibe como uniforme. Si se le añade además algún tipo de dispersión aparecen necesariamente zonas con un gris más claro y otras con uno más oscuro:

Ruido blando difuminado

El ruido azul permite obtener distribuciones uniformes más uniformes y los viejos del blog lo habrán relacionado con las sucesiones de Sobol y lo que llamé probabilidades hirsutas y pocholas.

El segundo, una discusión sobre los odds para representar y comunicar probabilidades que, sin negarle interés, omite dos cuestiones importantes:

  • Que es un sistema primitivo y obsoleto de pensar en las probabilidades de eventos.
  • Pero que, desafortunadamente, el papel fundamental de la regresión logística ha ayudado a perpetuar.