Probabilidad

Dos mapas de distribuciones de probabilidad

Si hace unos días enlazamos desde estas páginas a un cuadro sinóptico que contextualizaba los algoritmos de minería de datos, hoy aprovechamos para divulgar la noticia de otra que relaciona las distribuciones de probabilidad más habituales y sus interdependencias.

El lector es libre de plantearse (e incluso responderse) estas preguntas: partiendo de la distribución normal que ocupa el centro del diagrama,

  • ¿qué propiedades distinguen a las que quedan por encima de ella de las que quedan por debajo?
  • ¿se observa algún tipo de patrón en la forma de las distribuciones conforme nos desviamos en alguna de las direcciones NE, SE, SO o NO?

A quienes busquen una tabla más completa (aunque sustancialmente más prolija) tal vez les satisfaga la que encuentren en este artículo de L. Leemis y J. McQueston (reproducido también en esta chuleta).

¿Por qué la otra cola siempre se mueve más aprisa?

Me pasó mi buen amigo Raúl (que tiene un blog más friqui que el mío) un vídeo con un título tan promisorio y mendaz como el de esta entrada:

Se ve con gusto, pero no cuenta toda la historia. Al menos, uno espera averiguar por qué todas las demás colas parecen moverse más aprisa que la de uno, pero, realmente, sólo explica por qué es poco probable que la propia sea la más rápida. ¡Y no es lo mismo!

¿Una caída demasiado drástica de la varianza?

El otro día me pidieron modelar (estadísticamente, no con plastilina) nosequé fenómeno. Digo nosequé porque me lo describieron alegóricamente. No sé si la respuesta que di redundará en beneficio o perjuicio de la humanidad. Pero no quiero hablar de eso sino del problema en sí y de unas cuestiones sobre la varianza asintótica a las que me referiré después. El problema se resume en:

  • De una población se conocía una proporción p aunque con cierto grado de incertidumbre más o menos cuantificable.
  • Posteriormente se obtenía información adicional sobre la proporción estudiando una pequeña muestra de la población.

Vamos, que la cosa apestaba a bayesiana. Como la probabilidad de éxito dado un valor p para la proporción es precisamente p (y 1-p, por lo tanto, la de fracaso), la de obtener m éxitos en n intentos es

La Wikipedia te necesita

Hoy, procrastinando, me he dado un paseo por la Wikipedia en español. Y me he deprimido viendo el lamentable estado en que se encuentran la mayor parte de las páginas de las categorías a las que concierne esta bitácora como, por ejemplo, las de

Quiero invitar a los lectores de este blog (a los que, por serlo, se les presupone un mínimo de interés y formación) a que participen en ese proyecto común que es la Wikipedia (y, en particular, la Wikipedia en español) para no tener que volver a sonrojarnos al comparar nuestras páginas con las correspondientes de otros idiomas.

Abundando en lo de nuestra ineptitud para estimar la probabilidad condicionada

Antes de seguir leyendo, trate de responder a la siguiente pregunta:

Una familia tiene dos hijos (acá usamos el masculino en forma genérica: pudieran ser de cualquier sexo). Uno de ellos es niño. ¿Cuál es la probabilidad de que el otro sea también niño?

Si su respuesta es 0.5 va a tener que seguir leyendo el resto del artículo. Pero tampoco se deprima: parece que nuestro cerebro está maleado para caer en tal error y así lo parece refrendar una microencuesta que elaboro interpelando a incautos.

Un vídeo algo viejo sobre estadísticas, expectativas y mentiras

Hace poco me hicieron llegar el vídeo de una conferencia pronunciada en el seno del TED.

TED es una ONG dedicada a la difusión de ideas… que merecen difusión. Organiza conferencias anuales en California y Oxford y, según su página, reta a los pensadores más fascinantes a dar la charla de sus vidas en 18 minutos. No ha de sorprender pues que también haya acogido Hans Rosling para que vuelva a sorprendernos con la potencia de su afamado GapMinder.