Sobre la relación entre la teoría de la relatividad y la regresión logística

Según la teoría de la relatividad, las velocidades (lineales) se suman así:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
v1 <- 100000
v2 <- 100000
velocidad_luz <- 300000

suma_relativista <- function(x,y){
  (x + y) / (1 + x * y / velocidad_luz^2)
}

suma_relativista(v1, v2)
# 180000

Lo que es todavía menos conocido es que esa operación es equivalente a la suma ordinaria de velocidades a través de una transformación de ida y vuelta vía la arcotangente hiperbólica (véase esto). En concreto:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
f1 <- function(x) {
  atanh(x / velocidad_luz)
}

f2 <- function(x) {
  velocidad_luz * tanh(x)
}

f2(f1(v1) + f1(v2))
# 180000

Ahora imaginemos un universo donde la velocidad máxima no es la de la luz, sino que solo están permitidas las velocidades entre 0 y 1:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
p1 <- .9
p2 <- .9

flog1 <- function(x) {
  atanh(2 * x - 1)
}

flog2 <- function(x) {
  (1 + tanh(x)) / 2
}

flog2(flog1(p1) + flog1(p2))
# 0.9878049

Es decir, si combinamos un sujeto que se mueve por si solo a una p = .9 con otro que se mueve con una p = .9, obtenemos una p combinada de .987.

Es lo que ocurre en el modelo logístico (supuesto un término independiente de 0, i.e., una tasa base del 50%). Si un sujeto tiene un valor en una variable X que por sí sola sugiere una probabilidad de evento de .9 y otra con un valor tal que por sí solo sugiere una probabilidad también de .9, el efecto combinado es una probabilidad de .987.