Gosset

Una entrada para desocupados que buscan causas que libren al mundo de todo neomal

Esta es una entrada que dedico a un sector de la sociedad que, generalmente, tengo muy desantendido: gente con mucho tiempo libre pero con infinitas ganas de librar al mundo de esos pésimos males que ni siquiera era consciente que tenía.

Resulta que en The elimination of Spurious Correlation due to position in Time or Space de “Student” (en realidad, Gosset, que es el que inventó el test que no lleva su nombre), principia así:

Diferencia de medias a la bayesiana con salsa de stan

El habitual problema de la diferencia de medias suele formularse de la siguiente manera: hay observaciones $latex y_{1i}$ e $latex y_{2i}$ donde

$$ y_{ji} \sim N(\mu_j, \sigma)$$

e interesa saber si $latex \mu_1 = \mu_2$. Obviamente, se desconoce $latex \sigma$. De cómo resolvió Gosset el problema están los libros de estadística llenos. En R,

set.seed(1234)
N1 <- 50
N2 <- 50
mu1 <- 1
mu2 <- -0.5
sig1 <- 1
sig2 <- 1
 
y1 <- rnorm(N1, mu1, sig1)
y2 <- rnorm(N2, mu2, sig2)
 
t.test(y1, y2)
# Welch Two Sample t-test
#
# data:  y1 and y2
# t = 4.7059, df = 95.633, p-value = 8.522e-06
# alternative hypothesis: true difference in means is not equal to 0
# 95 percent confidence interval:
#   0.5246427 1.2901923
# sample estimates:
#   mean of x  mean of y
# 0.5469470 -0.3604705

En rstan,