No sé si visteis el vídeo que colgué el otro día. Trataba el problema de determinar si dos poblaciones
beer <- c(27, 20, 21, 26, 27, 31, 24,
21, 20, 19, 23, 24,
18, 19, 24, 29, 18, 20, 17,
31, 20, 25, 28, 21, 27)
water <- c(21, 22, 15, 12, 21, 16, 19,
15, 22, 24, 19, 23, 13,
22, 20, 24, 18, 20)
tienen o no la misma media. Más concretamente, si la población beer
tiene una media superior a la de water
como en efecto sucede:
mean(beer)
#[1] 23.2
mean(water)
#[1] 19.22222
¿Pero es esta diferencia significativa?
Muchos plantearían un t-test:
t.test(beer, water, alternative = "greater")
# Welch Two Sample t-test
#
# data: beer and water
# t = 3.3086, df = 39.271, p-value = 0.001007
# alternative hypothesis: true difference in means is greater than 0
# 95 percent confidence interval:
# 1.952483 Inf
# sample estimates:
# mean of x mean of y
# 23.20000 19.22222
Pero en el vídeo se propone una alternativa basada en remuestreos: