¿Qué nos jugamos?

Imagine que le proponen participar reiteradamente en un juego de azar. Dispone de una cantidad de dinero inicial, $latex a$ euros, y puede apostar en un juego en el que o gana con probabilidad $latex p$ $latex b$ veces la apuesta o la pierde enteramente. Puede repetir el juego cuantas veces quiera  y apostar el porcentaje que desee de su dinero.

¿Cuánto se apostaría? ¿Qué porcentaje de su capital inicial se jugaría?

Suponga que decide apostar siempre un porcentaje fijo, $latex x$ del dinero del que disponga en cada momento. Tras la primera jugada, tendría $latex a + b a x = a(1+bx)$ de ganar y le quedarían $latex a (1-x)$ de perder. Puede seguir jugando y en cada partida su capital se multiplicaría por $latex 1+bx$ o por $latex 1-x$ según su suerte. Al cabo de $latex n$ partidas, de haber ganado $latex w$ de ellas, su capital inicial se habría multiplicado por

$$ (1+bx)^w (1-x)^{n-w}. $$

La pregunta es: ¿qué proporción $latex x$ de su capital maximizaría su beneficio? Tomando el logaritmo de la expresión anterior se puede definir la función

$$ f(x) = w \log(1+bx) + (n-w) \log (1-x) $$

de cuya derivada (qué tiempos) igualada a cero,

$$ f^\prime (x) = \frac{bw}{(1+bx)} - \frac{n-w}{1-x} = 0 $$

se puede despejar

$$ x = \frac{wb - (n - w)}{nb}, $$

que sería la proporción óptima. Nótese que uno querría fijar $latex x$ de antemano, pero éste sólo se conoce después de participar en el juego y contar el número de éxitos. No obstante,

$$x=\frac{wb-(n-w)}{nb}=\frac{bw/n-(1-w/n)}{b}$$

y el cociente $latex \frac{w}{n}$ tiende a $latex p$, la probabilidad de éxito, conforme crece $latex n$. En el límite, la proporción óptima sería pues

$$ x = \frac{bp-(1-p)}{b} $$,

valor conocido como apuesta de Kelly. El criterio de Kelly en contextos similares al que planteo en esta entrada sugiere realizar apuestas de tal cuantía. Y una búsqueda en Google del término parece indicar que es conocido de los aficionados a los juegos de azar y también —alguien tal vez aquí quiera hacer un comentario obvio— entre los profesionales de las finanzas —se dice que lo utiliza incluso Warren Buffet—y otros. Fue de hecho en un foro de quants que entré en conocimiento con este problema.

Tomando la esperanza de $latex f(x)$ —que consiste en reemplazar $latex w$ por $latex np$— y repitiendo el proceso indicado más arriba, puede probarse que la apuesta de Kelly maximiza la esperanza del logaritmo del resultado del juego para cada $latex n$. También, dado que la distribución subyacente es binomial, y dado que la mediana de dicha distribución es, redondeando, $latex np$, también se demuestra que la apuesta de Kelly maximiza la mediana de las ganancias (en cualquier escala, logarítmica o no). Pese a estas felices circunstancias, el uso de este criterio no está exento de caveats:

  • Es raro que un inversor quiera maximizar la esperanza del logaritmo
  • De hecho, de acuerdo con el CAPM, un inversor debe considerar dos parámetros simultáneamente: rentabilidad (típicamente, la media de las ganancias) y riesgo (o su varianza o alguna otra medida más robusta de la dispersión). Sin embargo, el criterio de Kelly no tiene en cuenta éste último.

En efecto, en la deducción que hemos hecho más arriba de la apuesta óptima, hemos supuesto conocida la historia de resultados del juego (se ganaba $latex w$ de las $latex n$ veces), pero $latex w$ es una variable aleatoria con distribución binomial y no en todos los casos la proporción de éxitos va a ser $latex p$: típicamente, será mayor o menor. Pero de obtener $latex i$ éxitos por debajo de lo esperado, el resultado final sufre un recorte de $latex (1-x)^i$ que puede resultar muy sustancial si $latex x $ es cercano a 1.

El problema puede tratarse analíticamente y es fácil analizar completamente el beneficio que puede generar un juego al cabo de un número dado de iteraciones fijados $latex p$ y $latex b$. El siguiente gráfico muestra los deciles del beneficio tras 100 iteraciones de un juego con $latex p=0.8$ y $latex b=4$.

Kelly criterion

Si por el contrario $latex p=0.8$ y $latex b=2,1$ se obtiene esta otra configuración de beneficios:

En los dos gráficos anteriores se aprecia cómo los rangos interdecílicos se estrechan a la izquierda de la apuesta de Kelly y se ensanchan a su derecha. Un inversor cauto preferiría tal vez apostar por debajo del nivel propuesto por el criterio de Kelly para reducir la varianza del resultado de su apuesta. Esta precaución cobra más importancia en las situaciones en que no se conoce $latex p$ con precisión: si se sospecha que su valor verdadero está en un intervalo de cierto tamaño alrededor de un estimador $latex p^\prime$, un inversor cauto apostaría un porcentaje inferior a

$$ \frac{bp^\prime-(1-p^\prime)}{b} $$

para evitar que el valor anterior caiga, tal vez catastróficamente, a la derecha del óptimo

$$ \frac{bp-(1-p)}{b}.$$

Finalmente, y para que mis lectores puedan cacharrear, adjunto el código —un tanto vergonzante— con el que he creado los gráficos de esta entrada:

    game.payoff <- function(f, trials = 100, p = 0.9, b = 0.5, quantile = 0.5){
    	wins  <- qbinom(quantile, trials, p)
    	loses <- trials - wins
    	wins * log(1 + b * f) + loses * log(1 - f)
    }

    my.quantiles <- (1:9) / 10
    my.fraction <-  (1:99) / 100

    tmp <- sapply(my.fraction, function(x)
          sapply(my.quantiles, function(q)
          game.payoff(x, quantile = q)))

    plot(c(1, 99), c(0, max(tmp)), type = "n",
        main = "Resultado según % de apuesta\n (p = 0.9, b = 0.6, Kelly = 70%)",
        xlab = "%", ylab= "log del resultado")
    apply(tmp, 1, function(x) lines(x, type = "l"))

    lines(tmp[5,], type = "l", col = "red")
    abline(v = 70, lty = 2)