Sobre el problema de las martingalas: ¿cuántos sabíais la respuesta?

Pues no se sabe bien. Además, habrá quién pudiéndola haber averiguado, prefirió dejarse llevar por la intuición y errar. Pero volvamos a los hechos. Dado

En un país hipotético, las familias tienen críos hasta que nace el primer varón. En un año, en promedio, nacen:
— Carlos Gil Bellosta (@gilbellosta) December 10, 2017

la pregunta urgente es: ¿cuántos podrían haber conocido la respuesta? Suponiendo que el conocimiento de la respuesta es algo binarizable (¿lo es?), la distribución del número de respuestas correctas sería $pN + X$, donde $N$ es el número total de respuestas, $p$ es la proporción de quienes sabe la respuesta y $X \sim B(N - pN, 1/3)$, suponiendo siempre que $pN$ es entero.

En realidad, el número de aciertos, así considerado, es una mezcla de dos binomiales, una con probabilidad de acierto del 100% y otra del 33.3%. Así que

library(rstan)

N <- 782
correctas <- round(N * 0.38)


standat <- list(N = N, correctas = correctas)

stanmodelcode <- '
data {
  int N;
  int correctas;
}

parameters {
  real<lower = 0, upper = 1> p;
}

model {
  real prob;
  real accum;

  // priori
  p ~ beta(1, 1);

  accum = 0;

  for(i in 0:correctas){
    prob  =  binomial_lpmf(i | N, p) +
      binomial_lpmf((correctas - i) | (N - i), 0.3333);
    accum = accum + exp(prob);
  }

  target += log(accum);
}
'
fit <- stan(model_code = stanmodelcode,
            data = standat,
            #init = rep(list(list(p = 0)), 4),
            iter=12000, warmup=2000,
            chains=2, thin=10)

res <- as.data.frame(fit)
hist(res$p, freq = FALSE, col = "gray",
     main = "distribución de p",
     xlab = "", ylab = "")

para obtener el vergonzante

De todos modos, debo añadir que durante las primeras horas de la encuesta, el porcentaje de aciertos llegó a estar en el entorno del 50%. Después fue retuiteado y el porcentaje descendió lastimosamente. Quiere eso decir cosas muy buenas de quienes me siguen en Twitter. Al menos, en términos relativos.