Una recomendación de lectura: "Systemantics"

Estoy leyendo Systemantics, un delicioso y breve libro de John Gall sobre la teoría de los sistemas. Dice de él la Wikipedia:

Discute cómo no diseñar sistemas, basándose en fracasos de ingeniería de sistemas. La idea principal del tratado es que los sistemas grandes y complejos son extremadamente difíciles de diseñar correctamente a pesar de las mejores intenciones, por lo que se debe tener cuidado de diseñar sistemas más pequeños y menos complejos, y hacerlo con funcionalidad incremental basada en un contacto cercano y continuo con las necesidades de los usuarios y las medidas de efectividad.

Una nota sobre la simulación por el método del rechazo

El otro día publiqué un pequeño fragmento de código,

a <- 2.89
b <- 36.81
sample_dist <- function() rbeta(1, a, b)

sample_p <- function(y){
  candidate <- sample_dist()
  my_sample <- runif(1)

  if (y == 1) if (my_sample < candidate) return(candidate)
  if (y == 0) if (my_sample < 1 - candidate) return(candidate)

  sample_p(y)
}

p1 <- replicate(100000, sample_p(1))
p0 <- replicate(100000, sample_p(0))

auc <- mean(p1 > p0)
auc

que había usado antes aquí, para muestrear unas distribuciones relacionadas con el cálculo del AUC en modelos perfectamente calibrados. Lo había escrito meses atrás y supongo que me pasó como a la mayoría de mis lectores: darlo por bueno primero y usarlo después suponía todo un acto de fe (en mí, además).

Unas cuantas notas sobre estadística, teoría y de la decisión y otras cuestiones

Un artículo sobre cómo crear intervalos de predicción conformes en modelos de ML, en particular con modelos basados en XGBoost. Y otro, este, sobre cómo inferir el tamaño muestral a partir de su anchura.

También de John D. Cook, ODE to Fisher’s transform. Aparentemente, para normalizar el coeficiente de correlación se puede aplicar una transformación en la que interviene atanh y cuya derivación exige resolver una ecuación diferencial ordinaria. Por su parte, la ecuación diferencial surge de igualar el desarrollo de la curtosis a cero.

Sobre esos LLMs que a pesar de no tener imaginación y creatividad, se lo inventan todo

Ese tipo de gente que nunca se va a contentar con nada y por culpa de la cual nunca vamos a tener cosas bonitas suele utilizar contra la IA, entre otros, estos dos argumentos:

  1. Que alucina y que se inventa cosas que no existen.
  2. Que carece de creatividad porque se limita a regurgitar un refrito de aquello con lo que ha sido entrenada. O, dicho de otra manera, que se limita a interpolar en lugar de extrapolar, que es aquello en lo que consiste la creatividad y la verdadera inteligencia.

Me pregunto si son conscientes de la fundamental contradicción entre ambos argumentos.

Unas cuantas notas sobre economía (y salarios)

En Archegos y el insider trading en EE.UU. y en Europa: los bancos sabían algo que ellos no sabían y una coda sobre la IA en Derecho, el autor, Jesús Alfaro, discute un tema jurídico con un LLM y concluye:

Por eso, la utilidad de la IA para Ciencias Sociales y Humanidades es mucho menor que para las Ciencias duras (y es más fácil pillar a un estudiante que ha ‘subcontratado’ a la IA su trabajo de fin de grado). La responsabilidad de los juristas académicos es proporcionar a la IA ‘buenos materiales’. Ahora hay una razón más para cuidar lo que los profesores publican. Ya no es completamente inocuo publicar artículos bazofiosos porque, aunque tus colegas no te lean, la IA ’te va a leer’. La protagonista de Sexo, mentiras y cintas de video estaba obsesionada con la basura. Andie McDowell dice a su psiquiatra: “Pienso en la basura. ¿Dónde va? ¿Qué pasa con ella? ¿Qué pasa con toda la basura?”. Ahora ya sabemos dónde va la basura que se publica en internet: a alimentar a la inteligencia artificial.

Unas notas sobre la sorprendente y contumaz persistencia histórica de las regresiones logísticas a trozos

Hace unos días publiqué una pequeña cita de Frank Harrell:

Las relaciones entre las variables casi nunca son lineales […]. Muchos de los que no han estudiado en profundidad los problemas del sesgo y la eficiencia creen que la presencia de relaciones no lineales se remedia tramificando las variables continuas en intervalos. Es lo más desastroso que pudiere hacerse.

Resulta que trabajo ahora en un sector que, un poco como todos, está enredado en lo que Yudkowsky llama un equilibrio inadecuado. De hecho, escribió un libro al respecto cuyo título completo es Equilibrios inadecuados: dónde y cómo las civilizaciones se quedan atrapadas. Estos equilibrios inadecuados adquieren formas distintas en sectores distintos y alguna vez me he ocupado en estas páginas de los que he sufrido en, p.e., la epidemiología.